ژنومیک: به اشتراک‌گذاری داده‌ها نیاز به یک کد رفتاری بین‌المللی دارد.

یک سلول سرطان سینه مهاجر
یک سلول سرطان سینه مهاجر
چاپ‌شده در: مجله Nature به تاریخ ۵ فوریه ۲۰۲۰
نویسندگان: Mark Phillips, Fruzsina Molnár-Gábor, Jan O. Korbel, Adrian Thorogood, Yann Joly, Don Chalmers, David Townend و Bartha M. Knoppers
لینک مقاله اصلی: https://www.nature.com/articles/d41586-020-00082-9

این مقاله توسط ربات ترجمیار و به صورت خودکار ترجمه شده و می‌تواند به صورت محدود دارای اشکالات ترجمه باشد.

بیش از ۸۰۰ ترابایت داده‌های ژنومی، به لطف یک پروژه بین‌المللی مهم برای شناسایی ویژگی‌های ژنتیکی مرتبط با انواع مختلف سرطان، برای محققان در سراسر جهان در دسترس هستند.محققانی که در این تحقیق شرکت داشته‌اند، به تازگی شش مقاله در زمینه طبیعت منتشر کرده‌اند. (۱۶ مقاله دیگر در جاهای دیگر منتشر شده‌اند.)

هر هشت نفر ما درگیر یک تلاش شش‌ساله بودیم.و چهار نفر از ما برای حفاظت از حریم خصوصی هزاران بیمار و داوطلبانی که راضی به استفاده از داده‌های خود در این تحقیق بودند، کمک کردیم. در اینجا، ما به برخی از درس‌های آموخته‌شده برای محققان که مقادیر زیادی از داده‌های ژنومی را به اشتراک می‌گذارند، اشاره می‌کنیم.

محققان ژنومیک در سراسر جهان به طور فزاینده‌ای با مجموعه داده‌های گسترده‌ای که توسط کنسرسیوم‌ها در بسیاری از کشورها جمع‌آوری شده‌اند، سر و کار دارند. بیشتر آن‌ها در مورد این که برای حفاظت از حریم خصوصی مردم چه باید کرد و با قوانین بین‌المللی و ملی حفاظت از اطلاعات، به ویژه با توجه به تغییرات اخیر و مداوم در قانون گذاری، مطابقت ندارند.

کد بین‌المللی رفتار برای داده‌های ژنومی در حال حاضر بسیار مهم است. این فن‌آوری که توسط جامعه ژنومیک ساخته شده‌است، می‌تواند با پیشرفت فن‌آوری و دانش آسان‌تر از آنچه که برای قوانین ملی و بین‌المللی ممکن است، به روز شود.

در میان ابرها

بین سال‌های ۲۰۱۳ تا ۲۰۱۹، ۴۶۸ موسسه از ۳۴ کشور در آسیا، استرالیا، اروپا و آمریکای شمالی ۲،۶۵۸ ژنوم سرطانی را جمع‌آوری کرده‌اند که هر کدام دارای یک توالی غیر سرطانی از یک فرد هستند. این اقدام توسط کنسرسیوم بین‌المللی سرطان (ICGC)رهبری می‌شد.

داده‌های ترکیبی عمدتا به خاطر محاسبات ابری در دسترس محققان قرار گرفتند. این پروژه - تحلیل سرطان ژنوم کامل (PCAWG)- اولین پروژه‌ای است که سعی در جمع‌آوری این همه پروژه‌های فرعی در حوزه‌های قضایی مختلف و در دسترس قرار دادن کل مجموعه داده‌ها در سراسر جهان دارد.

بیشتر داده‌های PCAWG (و ابزارهای تجزیه و تحلیل آن‌ها) از طریق کولابراتواری سرطان ژنوم، یک سرویس ابری ساخته‌شده برای جامعه تحقیقات ژنومی، در دسترس قرار گرفتند. اما داده‌ها برای اولین بار در مراکز کامپیوتری با عملکرد بالا و ابره‌ای موسسات علمی در آلمان، بریتانیا، ایالات‌متحده، کانادا، اسپانیا، ژاپن و کره‌جنوبی پردازش شدند. برخی نیز با استفاده از ابرهای تجاری (خدمات شبکه آمازون، مایکروسافت آزور و هفت بریج) پردازش شدند.

از زمانی که PCAWG آغاز شد، چندین پروژه ژنومیک بین‌المللی دیگر به سمت ابر گرایش پیدا کردند که شامل اطلس سلول انسانی، یک پروژه بین‌المللی برای ایجاد یک نقشه مرجع از تمام سلول‌های انسانی، و ابر علم باز اروپا، که برای محققان و متخصصان علوم، فن‌آوری، علوم انسانی و اجتماعی است.

ذخیره‌سازی در ابرها
خدمات ابری توانمند‌ی تجزیه و تحلیل ژنومی در مقیاس بزرگ را دگرگون کرده است. به طور همزمان، هر تیم تحقیقاتی که می‌خواهد مجموعه داده‌های جمع‌آوری‌شده توسط یک کنسرسیوم را تجزیه و تحلیل کند، ابتدا باید از اخلاق تحقیق هر شریک پروژه یا دفتر انطباق دسترسی به داده‌ها مجوز بگیرد. سپس باید داده‌ها را از هر پروژه فرعی روی اینترنت دانلود کند یا - به احتمال زیاد - درایوهای سخت حاوی اطلاعات ارسالی توسط پست داشته باشد. در مورد تجزیه و تحلیل پان‌سرطان ژنوم کامل، که شامل ۸۰۰ ترابایت داده‌های خام است، محققان قادر به ذخیره ماه‌ها و هزاران دلار، با دسترسی فوری به داده‌هایی که نیاز داشتند، و آزمایش با ابزارهای تحلیلی توسعه‌یافته توسط جامعه بودند. آن‌ها همچنین می‌توانند اجازه دسترسی به بیشتر داده‌ها را از یک مکان به دست آورند - دفتر تطبیق دسترسی به داده‌های کنسرسیوم جهانی سرطان.

این روند احتمالا ادامه خواهد یافت. خدمات ابری ارزان‌تر و سریع‌تر در دسترس قرار می‌گیرند، و محققان به طور فزاینده‌ای از مزایای به اشتراک گذاری مقادیر بسیار بیشتری از داده‌های ژنومی با همکاران بین‌المللی استفاده می‌کنند (به «داده‌های باز» مراجعه کنید).

داده‌های باز
در طول سه دهه گذشته، ژنتیک در سراسر جهان اطلاعات بیشتر و بیشتری را به اشتراک گذاشته‌است. سال گذشته، بیش از ۸۳،۰۰۰ محقق از ۱۴۶ کشور، ۶.۷ پتابایت اطلاعات DNA (عمدتا انسانی)را از موسسه بیوانفورماتیک زیستی مولکولی اروپا دانلود کردند. این میزبان بسیاری از مجموعه داده‌های بیولوژیکی است و آن‌ها را در سراسر جهان در دسترس قرار می‌دهد. این مقدار معادل ۲۳۰ میلیارد ژنوم کامل انسان است.
چنین به اشتراک گذاری داده‌های ژنومی تنها با در دسترس قرار گرفتن داده‌های بیشتر افزایش می‌یابد. تا سال ۲۰۲۵، بیش از ۶۰ میلیون بیمار در سراسر جهان انتظار می‌رود که ژنوم یا مناطق کد کننده پروتیین خود را به عنوان بخشی از مراقبت روتین سلامت تعیین توالی کرده باشند - که به طور بالقوه منبعی قوی برای محققان فراهم می‌کند.

با این حال، خدمات ابر با توجه به حفاظت از داده‌های شرکت کنندگان چالش‌های جدیدی را ایجاد می‌کند - به ویژه با توجه به اینکه دولت‌های ملی، اجرای قانون و شرکت‌های خصوصی به طور فزاینده‌ای علاقه خود را به دسترسی به آن‌ها نشان می‌دهند. برای مثال، مقامات مرزی کانادا تصمیم گرفته‌اند که کدام کشور مهاجران را براساس نتایج تست دی ان ای خدمات ژنومی مصرف کنندگان اخراج کنند.

تداوم طولانی‌مدت

سازمان‌هایی مانند آزمایشگاه ژنوم سرطان تنها تا زمانی می‌توانند دوام بیاورند که بودجه آن‌ها تامین شود. حتی در مورد آمازون و دیگر شرکت‌های فن‌آوری بزرگ، قطع خدمات ناشی از مشکلات فنی، تغییر در شرایط خدمات شرکت یا حتی بسته شدن ناگهانی شرکت می‌تواند مانع از دسترسی محققان به داده‌ها در هر زمان شود. همچنین، اغلب مشخص نیست که محققان با استفاده از خدمات ابری تا چه حد می‌توانند اطمینان حاصل کنند که اطلاعات آن‌ها برای اشخاص ثالث، مانند کسانی که نظارت سو استفاده گرانه در سطح دولت را انجام می‌دهند، افشا نمی‌شود. همچنین روشن نیست که چه اقداماتی باید برای حفاظت از داده‌ها در برابر چنین موارد محرمانه انجام شود.

در مورد PCAWG، دفتر تطبیق دسترسی به داده ICGC به حفاظت در برابر برخی از این مسائل کمک کرده‌است. هر کسی که بخواهد از داده‌های PCAWG استفاده کند با کمیته دسترسی به اطلاعات پروژه قرارداد می‌بندد؛ برای مثال، آن‌ها باید تایید کنند که زمانی که اطلاعات این افراد از اطلاعات شخصی آن‌ها پاک شود، دیگر سعی نخواهند کرد بیماران یا داوطلبان را شناسایی کنند. گفته می‌شود که هیچ گونه نقض حریم خصوصی اهداکننده رخ نداده است.

اما حتی زمانی که محققان از یک کمیته دسترسی به داده مرتبط درخواست داده می‌کنند (مانند مورد PCAWG و جاه‌ای دیگر)، مسائل متعددی حل‌نشده باقی می‌مانند. به عنوان مثال مشخص نیست که قبل از اینکه محققان به داده‌های حساس ژنومی دسترسی پیدا کنند، چه بررسی‌هایی باید قبل از اینکه داده‌های ژنومی به صورت بین‌المللی به اشتراک گذاشته شوند، انجام شود. حتی افراد درگیر در PCAWG به دلیل محدودیت‌های انتقال داده‌ها در سراسر مرزها نمی‌توانند یک ابر بین‌المللی واقعی ایجاد کنند (در این مورد، توسط قانون گذاران اروپایی ایجاد شد که نگران اطلاعات ژنومی از اروپایی‌ها در ایالات‌متحده بودند).

بخش آمریکایی این پروژه (اطلس ژنوم سرطانی؛ TCGA)، که یک سوم نمونه‌های PCAWG را تشکیل می‌داد، از طریق ابر داده حفاظت شده دانشگاه شیکاگو در دسترس محققان قرار گرفت. محققانی که می‌خواستند این داده‌ها را به دست آورند باید از یک توافقنامه دسترسی تبعیت می‌کردند که تا حد زیادی با آنچه توسط دفتر تطبیق دسترسی به داده‌های ICGC ارایه شده‌بود، سازگار بود. با این حال، در نهایت، TCGA از لحاظ مفهومی از بقیه پروژه جدا شد، زیرا محققان مجبور به پیروی از یک روش دسترسی متفاوت و ترکیب این دو مجموعه داده بودند.

رک‌های سرور در یک مرکز در برلین.
رک‌های سرور در یک مرکز در برلین.

رفتار قانونی

محققان ژنومیک فورا به قوانین به اشتراک گذاری داده‌ها نیاز دارند که در سراسر حوزه قضایی هماهنگ باشند.

یک قانون رفتاری بین‌المللی می‌تواند به بازرسان کمک کند تا بر برخی از موانع کنونی و همچنین موانع دیگری که ممکن است با تکامل قانون حفاظت از داده‌ها ایجاد شوند، غلبه کنند.

چنین کدی می‌تواند مراحلی را که محققان باید برای پیروی از مقررات حفاظت از داده‌های عمومی اتحادیه اروپا (GDPR)، اجرا در سال ۲۰۱۸، و قانون قابلیت انتقال بیمه بهداشت و درمان آمریکا و قانون پاسخگویی، در میان قوانین دیگر، اتخاذ کنند، مشخص کند. در واقع GDPR به صراحت توسعه کده‌ای حفاظت از داده خاص بخش را در ماده ۴۰ خود تشویق می‌کند. و ژوئن گذشته، هیات حفاظت از داده‌های اروپا (یک نهاد مستقل که وظیفه صدور راهنمایی در GDPR و تشویق ترسیم کده‌ای رفتاری را بر عهده دارد)، دستورالعمل‌هایی را در مورد ارائه، تایید و نظارت بر چنین کدهایی برای پردازش داده‌ها صادر کرد. همچنین قول راهنمایی بیشتر در مورد استفاده از کدها به عنوان راهی بالقوه برای تسهیل انتقال داده‌ها در سراسر مرزها را داد.

یک زیرساخت تحقیقاتی بیوبانک اروپایی، معروف به BBMRI - ERIC، در سال ۲۰۱۷ اعلام کرد که یک قانون رفتار در مورد داده‌های مرتبط با سلامت در سراسر اتحادیه اروپا تدوین خواهد کرد تا به کمیسیون اروپا تسلیم شود. پس از تکمیل، و در صورت تصویب، چنین کد اروپایی می‌تواند سودمند باشد. در همین حال، ما از جامعه تحقیقاتی ژنومیک می‌خواهیم تا ایجاد یک کد بین‌المللی رفتار را اولویت‌بندی کنند که نشان می‌دهد چگونه تعهدات اخلاقی و قانونی موجود می‌تواند در ارتباط با ابره‌ای ژنومی بین‌المللی برآورده شود.

حداقل پنج جنبه باید در نظر گرفته شود:

هویت: با وجود مشکلات مربوط به شناسایی، که در آن داده‌های بهداشتی از هر گونه اطلاعاتی که بتواند برای شناسایی شرکت کنندگان استفاده شود (مانند نام، شماره امنیت اجتماعی، آدرس)، به عنوان روشی برای حفاظت از حریم خصوصی افراد در تحقیقات یاد شده‌است. با این حال، به دلیل اصطلاحات متناقض و شکاف در درک، محققان به ندرت می‌دانند که چه استانداردی را باید رعایت کنند تا داده‌های آن‌ها به درستی منتشر شده یا "نام مستعار" شود (که در آن یک کد افراد را قادر به شناسایی مجدد می‌کند). به‌علاوه، اجرای قوانین در عمل دشوار است زیرا اغلب مشخص نیست که چگونه محرمانه ماندن اطلاعات رخ می‌دهد، یا کدام سازمان یا محقق مسئول بوده‌است.

قوانین حفاظت از داده‌ها، مانند GDPR یا قانون حریم خصوصی مصرف‌کننده کالیفرنیا، همواره نیازمند قابلیت شناسایی داده‌ها هستند تا براساس مورد به مورد تحلیل شوند، تا حدی به این دلیل که ابزارهای تکنولوژیکی قادر به شناسایی به طور مداوم در حال تغییر هستند. با وجود اینکه تعیین قوانین سخت و سریع از قبل دشوار است، یک کد می‌تواند راهنمایی در مورد چگونگی ارزیابی زمانی که ذخیره‌سازی ژنومی (و اطلاعات سلامت به طور گسترده‌تر)در مخازن دسترسی آزاد منطقی است، ارایه دهد. این امر ممکن است شامل بررسی این موضوع باشد که آیا مجموعه‌ای از انواع ژنومیک، جسمی هستند یا در ژرم لاین وجود دارند و بنابراین به ارث رسیده‌اند. (محققان نشان داده‌اند که شناسایی یک فرد تنها با استفاده از چند متغیر ژرم لاین ممکن است؛ تاکنون هیچ‌کس نتوانسته است کسی را براساس انواع تومورهای بدنی شناسایی کند.)

رضایت کامل: GDPR صراحتا استثنایی را برای "رضایت خاص" به رسمیت می‌شناسد، به این معنی که رضایت مردم برای استفاده در یک پروژه تحقیقاتی خاص داده می‌شود. این برای این است که اجازه دهیم داده‌های شرکت کنندگان برای حوزه‌های خاصی از تحقیقات علمی، با حفظ استانداردهای اخلاقی شناخته‌شده، مورد استفاده قرار گیرند. راهنمایی در مورد آنچه که محققان باید انجام دهند تا الزامات برای رضایت گسترده را برآورده سازند، مورد نیاز است. علاوه بر این، آن‌ها چگونه باید بیماران و داوطلبان را در مورد نحوه استفاده نهایی از اطلاعات خود آگاه کنند؟

بازگشت یافته‌های فردی، قابلیت حمل و نقل و دسترسی: چگونگی حفاظت از حق شرکت کنندگان برای انتقال داده‌هایشان - با دادن داده‌های خود به آن‌ها در فرمت قابل خواندن توسط ماشین، به جای فرمت PDF چاپی - باید روشن شود. این کد همچنین می‌تواند تعیین کند که چه مراحلی برای ارتباط مسیولانه داده‌های بهداشتی با بیمار یا داوطلب لازم است. آیا به افرادی که در مورد شناسایی انواع ژنومی بدخیم یا با اهمیت ناشناخته مطلع هستند، به عنوان مثال، مشاوره ژنتیک پیشنهاد می‌شود؟

عقب‌نشینی: محققان نیاز به راهنمایی دارند در مورد این که چگونه می‌توانند حق شرکت کنندگان برای کناره‌گیری از تحقیق را داشته باشند. GDPR نیازمند آن است که اطلاعات افراد به آن‌ها سپرده شود و اسناد اشخاص ثالث که این اطلاعات را برای آن‌ها فاش کرده‌اند را نگهداری کند و هنگامی که رضایت لغو می‌شود، باید اشخاص ثالث را مطلع سازند. با این حال، همه نوع سوال باقی می‌ماند، مانند اینکه آیا تجزیه و تحلیل داده‌های جمع‌آوری‌شده باید با داده‌های حذف‌شده شرکت کنندگان بازبینی شود، و غیره.

افشای اشتباه: یک کد رفتاری می‌تواند راهنمایی در مورد چگونگی مقابله با درخواست‌های دولت برای داده‌های شخصی، از جمله این که آن‌ها چه حمایت‌های قانونی می‌توانند درخواست دهند، به محققان بدهد. به عنوان مثال در ایالات‌متحده گواهی‌های محرمانه بودن موسسه ملی سلامت برای محافظت از محققان در برابر چنین درخواست‌هایی طراحی شده‌اند.

گام‌های بعدی

دستاوردهای PCAWG در رابطه با به اشتراک گذاری و مدیریت داده‌های ژنومی، به خوبی برای توسعه یک کد بین‌المللی که محققان در همه جا می‌توانند به آن اشاره کنند، پیش‌بینی می‌شود.

کنسرسیوم تحقیقات ژنتیک، نهادهای سرمایه‌گذاری دولتی و خصوصی، و کسانی که بر روی کده‌ای منطقه‌ای موجود کار می‌کنند (مانند آنچه در اروپا است)ممکن است فرآیند ساخت آن را آغاز کنند. اولین گام، برگزاری جلسه‌ای برای تعیین موضوعاتی است که این کد به آن می‌پردازد، بهترین راه برای مشورت با شرکت کنندگان تحقیق در مورد نیازهایشان و فرآیند تصمیم‌گیری است که به متن اجازه می‌دهد به موقع نهایی شود.

اگر محققان ژنومیک در عوض در تاریکی در مورد چگونگی رسیدگی درست به حفاظت و به اشتراک گذاری داده باقی بمانند، آن‌ها یا می‌توانند بسیار محتاط باشند و در به اشتراک گذاری تا جایی که رضایت اجازه می‌دهد شکست بخورند، یا نمی‌توانند برای شرکت کنندگان حمایت مناسب فراهم کنند. به عبارت دیگر، عدم قطعیت نظارتی بیشتر خطرات از بین بردن تجزیه و تحلیل ژنومی جدید و تضعیف ایمان مردم به همکاری علمی برای خیر عمومی را به همراه دارد.

این مقاله توسط ربات ترجمیار و به صورت خودکار ترجمه شده و می‌تواند به صورت محدود دارای اشکالات ترجمه باشد.