مقدمه
برای سالهای متمادی، یکی از اهداف اصلی تحقیقات ژنتیک، شناسایی شبکههای ژنتیکی بوده است که زیربنای ویژگیهای پیچیدهای؛ مانند هوش، شخصیت و بیماریهای روانپزشکی هستند. شبکه ژنتیکی مجموعهای از ژنهاست که با یکدیگر ارتباط برقرار میکنند و برای ایجاد یک ویژگی یا رفتار خاص با یکدیگر همکاری میکنند. درک شبکههای ژنتیکی زیربنای ویژگیهای پیچیده میتواند فرایندهای بیولوژیکی را که زیربنای این ویژگیها هستند روشن کند و ممکن است به توسعه درمانهای پزشکی مؤثرتر کمک کند.
فناوریهای با توان بالا مانند توالییابی نسل بعدی، تجزیهوتحلیل ریزآرایهها، و مطالعات ارتباط ژنومی، بررسی شبکههای ژنتیکی (GWAS) را آسانتر کردهاند. با استفاده از این روشها، دانشمندان توانستهاند صدها گونه ژنتیکی مرتبط با صفات پیچیده جمعیتهای وسیع را بیابند و حجم عظیمی از دادههای ژنتیکی را جمعآوری کنند. ثابت شده است که یافتن ژنها و شبکههای ژنتیکی دقیق که مسئول صفات پیچیده هستند، به دلیل حجم عظیمی از دادههایی که این فناوریها تولید کردهاند، دشوار است.
تحقیقات شبکهای در سالهای اخیر به روشی قوی برای ارزیابی دادههای ژنتیکی و مکانیابی شبکههای ژنی که زمینهساز فنوتیپهای پیچیده هستند، تبدیل شده است. تئوری گراف، آمار و علوم کامپیوتر همگی در حوزه بینرشتهای علوم شبکه برای مطالعه ساختار و عملکرد شبکههای پیچیده، از جمله شبکههای بیولوژیکی مانند شبکههای ژنتیکی استفاده میشوند. محققان میتوانند ژنها و فعلوانفعالات ضروری را که ظهور صفات پیچیده را شکل میدهند مشخص کنند و با استفاده از تکنیکهای علوم شبکه در دادههای ژنتیکی، درباره مسیرهای بیولوژیکی که زیربنای این ویژگیها هستند، اطلاعات بیشتری کسب کنند.
تحقیقات قبلی
توسعه تکنیکها و فناوریهای جدید برای تجزیهوتحلیل دادههای ژنتیکی به پیشرفت فوقالعاده تحقیقات بر روی شبکههای ژنتیکی زیربنای صفات پیچیده در ده سال گذشته کمک کرده است. اختراع GWAS که دانشمندان را قادر میسازد تا با مقایسه ژنوم جمعیتهای عظیمی از افراد با و بدون ویژگی موردعلاقه، تغییرات ژنتیکی مرتبط با صفات پیچیده را بیابند، نشاندهنده یک پیشرفت مهم است. بسیاری از تغییرات ژنتیکی مرتبط با انواع خصوصیتهای پیچیده، مانند هوش، شخصیت و مشکلات روانی، توسط تحقیقات GWAS کشف شدهاند. تحقیقات GWASبه دلیل شکست در تعیین دقیق ژنها و فرایندهای بیولوژیکی که زیربنای ویژگیهای پیچیده هستند، مورد انتقاد قرار گرفته است.
بهمنظور غلبه بر این مشکل، دانشمندان تکنیکهای جدیدی را برای تجزیهوتحلیل دادههای GWASایجاد کردهاند، از جمله روشهای مبتنی بر شبکه که بر یافتن شبکههای ژنی که زیربنای صفات پیچیده هستند تمرکز میکنند. این روشها مستلزم ایجاد شبکهای از ژنها بر اساس الگوهای بیان مشترک یا تعامل آنها با ژنهای دیگر بهمنظور یافتن ژنها و مسیرهای مهم مرتبط با صفت موردعلاقه است. برای مثال، مطالعهای توسط Wolen و Miles (2019) شبکههای ژنی درگیر در نوروبیولوژی اتانول و اعتیاد به الکل را با استفاده از تکنیکهای مبتنی بر شبکه شناسایی کرد.
ادغام بسیاری از انواع دادههای omics، از جمله رونوشت، پروتئومیکس، و متابولومیک، برای کسب دانش کاملتر از مسیرهای بیولوژیکی درگیر در صفات پیچیده، یکی دیگر از پیشرفتهای مهم در مطالعه شبکههای ژنتیکی بوده است. بهعنوانمثال، مطالعهای توسط Zhu و همکاران. (2017) شبکههای ژنی درگیر در توسعه دانههای ذرت را با استفاده از ترکیبی از دادههای ترانویسی و متابولومیک شناسایی کرد. محققان میتوانند تصویر پیچیدهتری از شبکههای ژنتیکی زیربنای صفات پیچیده ایجاد کنند و با ادغام اشکال مختلف دادههای omics، اهداف جدیدی برای مداخلات درمانی پیدا کنند.
رویکردهای علوم شبکه
روشهای علم شبکه به طور فزایندهای برای تجزیهوتحلیل دادههای ژنتیکی و یافتن شبکههای ژنی زیربنای ویژگیهای پیچیده مورد تقاضا هستند. در این روشها، شبکهای از ژنها بر اساس الگوهای هم بیان یا روابط عملکردی آنها ساخته میشود و سپس این شبکه برای یافتن ژنها و مسیرهای مهمی که به صفت موردعلاقه مرتبط هستند، بررسی میشود. برای مطالعه دادههای ژنتیکی، علم شبکه را میتوان به روشهای مختلفی به کار برد، مانند:
شبکههای هم بیان: شبکههای هم بیانی با محاسبه سطوح بیان ژن در بافتها یا انواع سلولهای مختلف و شناسایی ژنهایی با بالاترین درجات همبستگی بیان ایجاد میشوند. این استراتژی این فرض را ایجاد میکند که ژنهای هم بیان شده احتمال بیشتری دارد که از نظر عملکردی به هم متصل شوند و عملکرد سلولی مناسب به بیان هماهنگ این ژنها نیاز دارد. علاوه بر شناسایی ژنهای تنظیمکننده ضروری که در توسعه این خصوصیات حیاتی هستند، شبکههای هم بیان برای یافتن ماژولهای ژنی مرتبط با صفات پیچیده مورداستفاده قرار گرفتهاند.
شبکههای تنظیمکننده ژن: شبکههای تنظیمکننده ژن با شناسایی عوامل رونویسی و ژنهای هدف که بیان ژنهای خاص را کنترل میکنند، ایجاد میشوند. این استراتژی مبتنی بر این ایده است که فعالیت سلولی مناسب به تنظیم هماهنگ ژنها توسط عوامل رونویسی بستگی دارد. علاوه بر شناسایی ژنهای تنظیمکننده ضروری که در توسعه این صفات حیاتی هستند، شبکههای تنظیمکننده ژن برای یافتن ماژولهای تنظیمی مرتبط با ویژگیهای پیچیده مورداستفاده قرار گرفتهاند.
شبکههای بر همکنش پروتئین - پروتئین: شبکههای بر همکنش پروتئین - پروتئین با تعیین فعلوانفعالات فیزیکی که بین پروتئینها صورت میگیرد ایجاد میشوند. بر اساس این روش، پروتئینهایی که از نظر فیزیکی با یکدیگر تعامل دارند، احتمالاً از نظر عملکردی با یکدیگر مرتبط هستند و برای عملکرد سلولی ضروری هستند. شبکههای بر همکنش پروتئین - پروتئین برای کشف پروتئینهای ضروری که برای توسعه صفات پیچیده و همچنین ماژولهای پروتئین مرتبط با این صفات حیاتی هستند، استفاده شدهاند.
شبکههای هم بیان ژن وزنی: این شبکهها با محاسبه هم بیان ژنها در بافتها یا انواع سلولهای مختلف و سپس دادن وزن به هر ژن بر اساس میزان اهمیت آن برای شبکه بهعنوان یک کل ایجاد میشوند. بر اساس این استراتژی، ژنهای خاصی از نظر عملکرد درون شبکه و مشارکت در عملکرد سلولی از سایرین مهمتر هستند. علاوه بر شناسایی ژنهای تنظیمکننده ضروری که در توسعه این کیفیتها حیاتی هستند، شبکههای هم بیان ژن وزنی برای یافتن ماژولهای ژنی مرتبط با صفات پیچیده استفاده شدهاند.
بهطورکلی، علم شبکه مجموعهای قوی از تکنیکها را برای تجزیهوتحلیل دادههای ژنتیکی و مکانیابی شبکههای ژنی زیربنایی فنوتیپهای پیچیده ارائه میدهد. محققان میتوانند مکانیسمهای بیولوژیکی زیربنایی این ویژگیها را بهتر درک کنند و با استفاده از این شبکهها، درمانهای جدیدی برای این شرایط ایجاد کنند.
در نتیجه، مطالعه شبکههای ژنتیکی زیربنای صفات پیچیده، زمینهای است که بهسرعت در حال تحول است و پیشرفتهای قابلتوجهی در سالهای اخیر ایجاد شده است. علم شبکه ابزار قدرتمندی است که به محققان اجازه میدهد تا دادههای ژنتیکی در مقیاس بزرگ را تجزیهوتحلیل کنند تا شبکههای ژنی را که در ایجاد ویژگیهای پیچیدهای مانند هوش، شخصیت یا اختلالات روانی دخیل هستند، شناسایی کنند. با استفاده از این شبکهها، محققان میتوانند درک بهتری از مکانیسمهای بیولوژیکی زیربنای این ویژگیها به دست آورند و درمانهای جدیدی برای این اختلالات ایجاد کنند.
بااینحال، هنوز چالشهای زیادی وجود دارد که باید به آنها پرداخت تا به طور کامل از پتانسیل علم شبکه در مطالعه ویژگیهای پیچیده استفاده شود. این موارد شامل مسائل مربوط به کیفیت دادهها، حجم نمونه و نیاز به ابزارهای تحلیلی پیچیدهتر است. علاوه بر این، نیاز به همکاری بینرشتهای بیشتر بین متخصصان ژنتیک، عصبشناسان و پزشکان بهمنظور ادغام کامل دادههای ژنتیکی با فنوتیپهای بالینی و توسعه درمانهای شخصیتر وجود دارد.
علیرغم این چالشها، مطالعه شبکههای ژنتیکی زیربنای صفات پیچیده، راه امیدوارکنندهای را برای تحقیقات آینده نشان میدهد، با پتانسیل منجر به پیشرفتهای قابلتوجهی در درک ما از ژنوم انسان و مکانیسمهایی که زمینهساز صفات و بیماریهای پیچیده است. بهاینترتیب، این یک حوزه تحقیقاتی مهیج و مهم است که بدون شک در سالهای آینده همچنان توجه قابلتوجهی از سوی محققان را به خود جلب خواهد کرد.
بررسی روشها
تجزیهوتحلیل دادههای ژنتیکی برای شناسایی شبکههای ژنی مرتبط با صفات پیچیده شامل چندین مرحله از جمله جمعآوری دادهها، پیشپردازش، تجزیهوتحلیل آماری و ساخت شبکه است. در این بخش، روشهای مورداستفاده در هر مرحله از فرایند و ابزارهای نرمافزاری که معمولاً در تجزیهوتحلیل استفاده میشوند را شرح میدهیم.
منابع اطلاعات:
اولین گام در تجزیهوتحلیل دادههای ژنتیکی، جمعآوری دادهها از منابع مرتبط است. دادههای ژنتیکی را میتوان از منابع مختلفی به دست آورد، از جمله مطالعات ارتباط ژنومی (GWAS)، مطالعات مکانهای صفت کمی بیان (eQTL) و سایر دادههای omics. مطالعات GWAS شامل تجزیهوتحلیل در مقیاس بزرگ از تغییرات ژنتیکی در هزاران نفر برای شناسایی انواع ژنتیکی مرتبط با صفات پیچیده است. از سوی دیگر، مطالعات eQTL باهدف شناسایی انواع ژنتیکی که بر سطوح بیان ژن تأثیر میگذارند، انجام میشود. سایر دادههای omics مانند دادههای اپی ژنومیک، پروتئومی و متابولومیک نیز میتوانند در تجزیهوتحلیل شبکه ژنتیکی برای بهدستآوردن درک جامعتری از مکانیسمهای بیولوژیکی زیربنایی استفاده شوند.
پیشپردازش دادهها:
پس از جمعآوری دادههای ژنتیکی، برای حذف نویز و مصنوعات و اطمینان از اینکه دادهها در قالبی مناسب برای تجزیهوتحلیل هستند، باید از قبل پردازش شوند. مراحل پیشپردازش دادهها بسته به نوع دادههای مورد تجزیهوتحلیل متفاوت است. برای دادههای GWAS، اقدامات کنترل کیفیت برای حذف نمونهها و انواع ژنتیکی با نمرات کیفیت پایین یا سطوح بالای دادههای ازدسترفته انجام میشود. دادههای eQTL برای حذف اثرات دستهای عادیسازی میشوند و موارد پرت شناسایی و حذف میشوند. از سوی دیگر، دادههای Omics تحت نرمالسازی، تبدیل و انتخاب ویژگی قرار میگیرند تا اطمینان حاصل شود که دادهها در قالبی مناسب برای تجزیهوتحلیل پاییندستی هستند.
تحلیل آماری:
گام بعدی در تجزیهوتحلیل دادههای ژنتیکی، انجام تجزیهوتحلیل آماری برای شناسایی انواع ژنتیکی است که با صفات پیچیده مرتبط هستند. متداولترین روشهای آماری مورداستفاده در تجزیهوتحلیل ژنتیکی، رگرسیون خطی، رگرسیون لجستیک و مدلهای اثرات مختلط است. رگرسیون خطی برای مدلسازی ارتباط بین یک صفت پیوسته و یک نوع ژنتیکی استفاده میشود، درحالیکه رگرسیون لجستیک برای صفات دوتایی استفاده میشود. مدلهای اثرات مختلط زمانی استفاده میشوند که دادهها ساختار سلسلهمراتبی داشته باشند، مانند تجزیهوتحلیل eQTL.
ساخت شبکه:
پس از شناسایی واریانتهای ژنتیکی مرتبط با صفات پیچیده، گام بعدی ساخت شبکههای ژنی است که روابط بین این واریانتها و سایر ژنها را در ژنوم نشان میدهد. چندین روش مختلف علم شبکه وجود دارد که میتواند برای ساخت شبکههای ژنی مورداستفاده قرار گیرد، از جمله:
شبکههای هم بیانی: شبکههای هم بیانی با اندازهگیری سطح بیان ژنها در بافتها یا انواع سلولهای مختلف و شناسایی ژنهایی که همزمان بیان میشوند ساخته میشوند. شبکههای هم بیان میتوانند برای شناسایی ماژولهای ژنهایی که با هم تنظیم شدهاند و ممکن است در صفات پیچیده نقش داشته باشند، استفاده شوند.
شبکههای تنظیمکننده ژن: شبکههای تنظیمکننده ژن با یکپارچهسازی اطلاعات مربوط به مکانهای اتصال فاکتور رونویسی، تغییرات هیستون و سایر دادههای اپی ژنومیک برای شناسایی ژنهایی که احتمالاً توسط همان فاکتورهای رونویسی یا عوامل اپیژنتیکی تنظیم میشوند، ساخته میشوند.
شبکههای بر همکنش پروتئین - پروتئین: شبکههای بر همکنش پروتئین - پروتئین با ادغام اطلاعات در مورد بر همکنشهای پروتئین - پروتئین شناخته شده برای شناسایی ماژولهای پروتئینهایی که با یکدیگر تعامل دارند و ممکن است در صفات پیچیده درگیر باشند، ساخته میشوند.
ابزار نرمافزار:
چندین ابزار نرمافزاری برای تجزیهوتحلیل دادههای ژنتیکی و ساخت شبکههای ژنی موجود است. برخی از ابزارهای رایج عبارتاند از:
PLINK: PLINK یک ابزار نرمافزاری پرکاربرد برای تجزیهوتحلیل دادههای GWAS است. میتوان از آن برای کنترل کیفیت، آزمایش ارتباط و تجسم نتایج GWAS استفاده کرد.
Matrix eQTL: Matrix eQTL یک ابزار نرمافزاری برای تجزیهوتحلیل دادههای eQTL است. میتوان از آن برای عادیسازی، تجزیهوتحلیل آماری و تجسم نتایج eQTL استفاده کرد.
WGCNA: Weighted Gene Co-Expression Network Analysis (WGCNA) یک ابزار نرمافزاری محبوب برای ساخت شبکههای هم بیانی است. میتوان از آن برای شناسایی ماژولهای ژنهای هم بیان شده و مطالعه رابطه بین این ماژولها استفاده کرد.
روش دیگری که معمولاً برای شناسایی شبکههای ژنی مرتبط با صفات پیچیده استفاده میشود، تجزیهوتحلیل غنیسازی مجموعه ژن (GSEA) است. این روش شامل آزمایش این است که آیا مجموعهای از ژنها با عملکردها یا مسیرهای مشابه برای ارتباط با صفت موردعلاقه در مقایسه با آنچه که به طور تصادفی انتظار میرود، غنی شدهاند یا خیر. GSEA با موفقیت در چندین مطالعه برای شناسایی مجموعههای ژنی مرتبط با صفات پیچیده مانند اختلال طیف اوتیسم (ASD)، اختلال دوقطبی، و اسکیزوفرنی استفاده شده است.
سایر روشهای آماری مورداستفاده در تجزیهوتحلیل شبکه ژنتیکی شامل الگوریتمهای خوشهبندی، تجزیهوتحلیل اجزای اصلی (PCA) و شبکههای بیزی است. الگوریتمهای خوشهبندی ژنها را با الگوهای بیان مشابه یا پروفایلهای تنوع ژنتیکی گروهبندی میکنند، درحالیکه PCA الگوهای تنوع را در چندین ژن یا انواع ژنتیکی شناسایی میکند. شبکههای بیزی روابط علی بین ژنها یا گونههای ژنتیکی و صفت موردعلاقه را مدل میکنند.
ابزارهای نرمافزاری نیز برای تسهیل تجزیهوتحلیل دادههای شبکه ژنتیکی توسعه یافتهاند. اینها شامل تجزیهوتحلیل شبکه هم بیان ژن وزنی (WGCNA)، NetworkAnalyst، و GeneMANIA است. WGCNA یک روش محبوب برای ساخت شبکههای هم بیان و شناسایی ماژولهای ژنهای هم بیان شده که با صفات پیچیده مرتبط هستند است. NetworkAnalyst یک ابزار مبتنی بر وب است که امکان تجسم و تجزیهوتحلیل انواع مختلف شبکههای بیولوژیکی از جمله شبکههای هم بیان ژن را فراهم میکند. GeneMANIA یکی دیگر از ابزارهای مبتنی بر وب است که به کاربران اجازه میدهد شبکههای ژنی بسازند و تجزیهوتحلیل غنیسازی عملکردی را انجام دهند.
منابع اطلاعات
دردسترسبودن مجموعهدادههای ژنتیکی در مقیاس بزرگ در پیشبرد حوزه تحلیل شبکه ژنتیکی بسیار مفید بوده است. بسیاری از مطالعات از مجموعهدادههای در دسترس عموم استفاده کردهاند، مانند آنهایی که از پروژه بیان بافت ژنوتیپ (GTEx) و کنسرسیوم ژنومیک روانی (PGC)، برای شناسایی شبکههای ژنی مرتبط با صفات پیچیده. پروژه GTEx دادههای بیان ژن را از چندین بافت برای هزاران نفر فراهم میکند، درحالیکه PGC دادههای مطالعه انجمن گسترده ژنوم (GWAS) را برای چندین اختلال روانپزشکی جمعآوری کرده است.
مطالعات دیگر دادههای ژنتیکی خود را برای شناسایی شبکههای ژنی مرتبط با صفات خاص جمعآوری کردهاند. بهعنوانمثال، پروژه BrainSpan دادههای بیان ژن را از مغز انسان درحالتوسعه جمعآوری کرد و از این دادهها برای ساخت شبکههای بیان مشترک مرتبط با اختلالات رشد عصبی استفاده کرد.
یافتهها
تجزیهوتحلیل دادههای ژنتیکی منجر به شناسایی چندین شبکه ژنی شده است که با ایجاد صفات پیچیده از جمله هوش، شخصیت و اختلالات روانپزشکی مرتبط هستند. این شبکههای ژنی در انواع فرایندهای بیولوژیکی از جمله رشد نورونی، شکلپذیری سیناپسی و سیگنالدهی انتقالدهندههای عصبی نقش دارند. درک این شبکهها میتواند بینشی در مورد مکانیسمهای اساسی صفات پیچیده ارائه دهد و ممکن است به توسعه اهداف درمانی جدید برای درمان اختلالات روانپزشکی منجر شود.
شبکههای بیان مشترک
شبکههای هم بیان برای شناسایی شبکههای ژنی که با صفات پیچیده مرتبط هستند استفاده شده است. این شبکهها با اندازهگیری سطح بیان ژنها در بافتها یا انواع سلولهای مختلف و شناسایی ژنهایی که همزمان بیان میشوند، ساخته میشوند. یکی از پرکاربردترین روشها برای ساخت شبکههای هم بیانی، آنالیز شبکههای هم بیانی وزنی (WGCNA) است.
WGCNA برای شناسایی شبکههای ژنی که با انواع صفات پیچیده از جمله اسکیزوفرنی، اختلال دوقطبی و اختلالات طیف اوتیسم مرتبط هستند، استفاده شده است. بهعنوانمثال، مطالعه بافت مغز پس از مرگ از افراد مبتلا به اسکیزوفرنی، ماژولی از ژنهای هم ابراز شده را شناسایی کرد که برای ژنهای دخیل در انتقال سیناپسی و رشد عصبی غنی شده بودند. مطالعه دیگری از WGCNA برای شناسایی ماژولی از ژنهای هم ابراز که با اختلال دوقطبی مرتبط بود و شامل ژنهای دخیل در رشد عصبی، انتقال سیناپسی و سیگنالدهی کلسیم بود، استفاده کرد. به طور مشابه، مطالعه اختلالات طیف اوتیسم ماژولی از ژنهای هم ابراز را شناسایی کرد که برای ژنهای دخیل در انتقال سیناپسی، رشد عصبی و اصلاح کروماتین غنی شده بود.
علاوه بر شناسایی شبکههای ژنی مرتبط با صفات پیچیده، از شبکههای هم بیانی نیز میتوان برای شناسایی ژنهای تنظیمکننده کلیدی در این شبکهها استفاده کرد. بهعنوانمثال، مطالعهای در مورد اختلال افسردگی اساسی (MDD) یک ماژول از ژنهای هم بیان شده را شناسایی کرد که با MDD مرتبط بود و شامل چندین ژن هاب بود که بهشدت در داخل شبکه به هم متصل بودند. مشخص شد که این ژنهای هاب در انواع فرایندهای بیولوژیکی از جمله سیگنالدهی گلوتامات و شکلپذیری سیناپسی نقش دارند.
نقش عملکردی ژنها
نقش عملکردی ژنها در این شبکهها میتواند بینشی در مورد مکانیسمهای اساسی صفات پیچیده ارائه دهد. بهعنوانمثال، یک مطالعه در مورد اسکیزوفرنی یک ماژول از ژنهای هم ابراز را شناسایی کرد که برای ژنهای دخیل در سیگنالدهی گلوتامات و پلاستیسیته سیناپسی غنی شده بود. این یافته با فرضیه اسکیزوفرنی گلوتامات مطابقت دارد که نشان میدهد ناهنجاری در سیگنالدهی گلوتامات به توسعه این اختلال کمک میکند.
به طور مشابه، مطالعه اختلالات طیف اوتیسم، ماژولی از ژنهای هم ابراز شده را شناسایی کرد که برای ژنهای دخیل در انتقال سیناپسی و رشد عصبی غنی شده بود. این یافته با این ایده مطابقت دارد که اختلالات طیف اوتیسم، اختلالات رشد عصبی هستند که شامل ناهنجاری در عملکرد سیناپسی و اتصال عصبی هستند.
مسیرهای کلیدی
شناسایی مسیرهای کلیدی در شبکههای ژنی میتواند بینشی در مورد مکانیسمهای اساسی صفات پیچیده ارائه دهد. بهعنوانمثال، مطالعهای در مورد اختلال افسردگی اساسی، ماژولی از ژنهای هم بیان شده را شناسایی کرد که برای ژنهای دخیل در سیگنالدهی گلوتامات و شکلپذیری سیناپسی غنی شده بود. این ماژول همچنین برای ژنهای دخیل در مسیر سیگنالدهی Wnt غنی شده است که در تنظیم شکلپذیری سیناپسی و نوروژنی نقش دارد.
به طور مشابه، مطالعه اختلال دوقطبی ماژولی از ژنهای هم ابراز را شناسایی کرد که برای ژنهای دخیل در سیگنالدهی کلسیم و پلاستیسیته سیناپسی غنی شده بود. این ماژول همچنین برای ژنهای دخیل در مسیر سیگنالدهی چرخهای AMP که در تنظیم فعالیت عصبی و شکلپذیری سیناپسی نقش دارد، غنی شده است.
مطالعه دیگری بر روی شبکههای ژنتیکی زمینهساز اعتیاد به الکل و حساسیت به اتانول متمرکز شد. Wolen و Miles (2012) از تجزیهوتحلیل ریزآرایه برای شناسایی ژنهایی استفاده کردند که به طور متفاوتی در مغز موشهایی که از نظر ژنتیکی مستعد حساسیت به اتانول بودند بیان میشدند. آنها سپس از تجزیهوتحلیل شبکه برای شناسایی یک ماژول هم ابراز ژنهایی که بهشدت با حساسیت اتانول مرتبط بودند، استفاده کردند. این ماژول شامل چندین ژن درگیر در تنظیم سیستم دوپامین از جمله Adra2a، Drd2 و Gabrb1 بود. نویسندگان پیشنهاد کردند که این ژنها ممکن است با تأثیرگذاری بر مسیرهای پاداش و تقویت در مغز در ایجاد اعتیاد به الکل نقش داشته باشند.
مطالعه دیگری از تجزیهوتحلیل شبکه برای شناسایی شبکههای ژنی زیربنای صفات پیچیده زراعی در سویا استفاده کرد (Fang et al., 2017). نویسندگان از یک مطالعه ارتباط گسترده ژنومی (GWAS) برای شناسایی انواع ژنتیکی مرتبط با شش صفت زراعی، از جمله عملکرد، وزن دانه و تعداد غلاف استفاده کردند. آنها سپس از تجزیهوتحلیل شبکه برای شناسایی شبکههای ژنی مرتبط با این صفات استفاده کردند. یکی از شبکههایی که آنها شناسایی کردند مربوط به رشد بذر بود و شامل چندین فاکتور رونویسی کلیدی مانند ABI3 بود که نقش مهمی در بلوغ بذر دارد.
مطالعهای توسط Rotival و Petretto (2014) از تجزیهوتحلیل شبکه برای شناسایی شبکههای تنظیمی زیربنای صفات قلبی عروقی استفاده کرد. نویسندگان از تجزیهوتحلیل هم بیانی برای شناسایی ژنهایی استفاده کردند که همبستگی بالایی با ویژگیهای قلبی عروقی در انسان و موش داشتند. آنها سپس از تحلیل شبکه برای شناسایی عوامل کلیدی رونویسی و مسیرهای سیگنالی که این ژنها را تنظیم میکنند، استفاده کردند. یکی از مسیرهایی که آنها شناسایی کردند، مسیر سیگنالینگ Wnt بود که نقش مهمی در توسعه قلبی عروقی و بیماری ایفا میکند.
در مطالعه دیگری، Zhu و همکاران. (2016) از مدلسازی شبکه برای بهبود تجزیهوتحلیل صفات پیچیده انسانی استفاده کرد. آنها از یک رویکرد شبکه بیزی برای مدلسازی تعاملات تنظیمی بین ژنها و شناسایی هابهای نظارتی کلیدی در شبکه استفاده کردند. آنها نشان دادند که گنجاندن اطلاعات توپولوژی شبکه در تجزیهوتحلیل دقت و قدرت مطالعات ارتباط ژنومی را بهبود میبخشد.
بهطورکلی، این مطالعات قدرت تجزیهوتحلیل شبکه را در شناسایی شبکههای ژنتیکی زیربنایی صفات پیچیده نشان میدهد. با استفاده از رویکردهای شبکهای برای ادغام انواع مختلف دادههای ژنتیکی، محققان میتوانند ژنهای کلیدی، مسیرها و شبکههای نظارتی را شناسایی کنند که در ایجاد ویژگیهای پیچیدهای مانند هوش، شخصیت یا اختلالات روانپزشکی نقش دارند.
بحث
استفاده از رویکردهای علوم شبکه برای تجزیهوتحلیل دادههای ژنتیکی، بینشهای ارزشمندی را در مورد ماهیت پیچیده تعاملات ژنی و ارتباط آنها با توسعه صفات پیچیده ارائه کرده است. ساخت شبکههای ژنی به شناسایی ژنهای کلیدی و مسیرهای دخیل در این صفات کمک کرده و چارچوبی برای درک فرایندهای بیولوژیکی زیربنای این شرایط فراهم کرده است. در این بخش، اهمیت علم شبکه در تجزیهوتحلیل دادههای ژنتیکی، محدودیتهای این رویکردها و جهتگیریهای آینده برای تحقیق را موردبحث قرار خواهیم داد.
اهمیت علم شبکه:
ساخت شبکههای ژنی به دلیل ماهیت پیچیده و غیرخطی بر همکنشهای ژنی به یک رویکرد رایج برای تجزیهوتحلیل دادههای ژنتیکی تبدیل شده است. رویکردهای سنتی، مانند مطالعات ارتباط ژنی کاندید، بر روی ژنهای فردی و ارتباط آنها با یک ویژگی خاص تمرکز دارند. بااینحال، شبکههای ژنی رویکردی جامعتر ارائه میکنند که تعامل بین ژنها و مسیرهای تنظیمی درگیر در بیان آنها را در نظر میگیرد.
بهعنوانمثال، شبکههای هم بیان برای شناسایی ژنهایی که در بافتها یا انواع سلولها به طور مشترک بیان میشوند، استفاده شدهاند و بینشهایی در مورد نقشهای عملکردی این ژنها و ارتباط آنها با صفات خاص ارائه میدهند. WGCNA برای شناسایی ماژولهای ژنهای هم بیان شده، ارائه چارچوبی برای درک روابط عملکردی بین این ژنها و نقش آنها در فرایندهای بیولوژیکی خاص استفاده شده است.
استفاده از رویکردهای علم شبکه همچنین به شناسایی مسیرهای کلیدی درگیر در توسعه صفات پیچیده منجر شده است. بهعنوانمثال، تجزیهوتحلیل شبکههای ژنی مرتبط باهوش، دخالت مسیرهای مرتبط با شکلپذیری سیناپسی، رشد نورونها و سیگنالدهی انتقالدهنده عصبی را شناسایی کرده است. این مسیرها بینشهایی را در مورد مکانیسمهای بیولوژیکی زیربنایی هوش ارائه میدهند و ممکن است به توسعه درمانهای جدید برای اختلالات شناختی منجر شوند.
محدودیتهای علم شبکه:
درحالیکه رویکردهای علم شبکه بینشهای ارزشمندی را در مورد ماهیت پیچیده تعاملات ژنی و ارتباط آنها با صفات پیچیده ارائه کرده است، محدودیتهایی برای این رویکردها وجود دارد که باید در نظر گرفته شوند. یکی از محدودیتها وابستگی به معیارهای مبتنی بر همبستگی بیان ژن است که ممکن است منعکسکننده روابط علی بین ژنها نباشد. درحالیکه شبکههای بیان مشترک میتوانند ژنهایی را شناسایی کنند که هم تنظیم هستند و ممکن است مسیرهای تنظیمی مشترکی داشته باشند، ممکن است بینشی در مورد روابط علی بین این ژنها ارائه نکنند.
محدودیت دیگر دشواری در شناسایی جهتدار بودن تعاملات ژن در یک شبکه است. درحالیکه شبکههای ژنی چارچوبی برای درک تعاملات بین ژنها فراهم میکنند، تعیین جهت این تعاملات میتواند چالشبرانگیز باشد. این میتواند توانایی ما را برای شناسایی روابط علی بین ژنها محدود کند و ممکن است منجر به شناسایی ارتباطهای جعلی شود.
در نهایت، ساخت شبکههای ژنی میتواند به انتخاب پارامترهای ساخت شبکه حساس باشد، مانند آستانه مورداستفاده برای تعریف هم بیان یا روش مورداستفاده برای خوشهبندی ژنها در ماژولها. این انتخابها میتوانند بر ساختار شبکه حاصل تأثیر بگذارند و ممکن است به نتایج متفاوتی در مورد روابط عملکردی بین ژنها منجر شوند.
دستورالعملهای آینده:
با وجود این محدودیتها، رویکردهای علوم شبکه چارچوبی قدرتمند برای تجزیهوتحلیل دادههای ژنتیکی و شناسایی ژنها و مسیرهای کلیدی درگیر در صفات پیچیده فراهم میکنند. در آینده، پیشرفتهای فناوری و روشهای محاسباتی احتمالاً توانایی ما را برای ساخت شبکههای ژنی و شناسایی روابط علی بین ژنها بیشتر خواهد کرد.
یکی از موارد امیدوارکننده، ادغام انواع مختلف دادههای ژنتیکی، مانند دادههای اپیژنتیک و دادههای بیان ژن، برای ساخت شبکههای چند omics است. این رویکرد میتواند دید جامعتری از مکانیسمهای تنظیمی درگیر در بیان ژن ارائه دهد و ممکن است به شناسایی تعاملات ژنی جدید و مسیرهای درگیر در صفات پیچیده منجر شود.
مورد دیگر استفاده از الگوریتمهای یادگیری ماشین برای ساخت شبکههای ژنی و شناسایی ژنها و مسیرهای کلیدی درگیر در صفات پیچیده است. رویکردهای یادگیری ماشینی میتوانند بر برخی از محدودیتهای معیارهای مبتنی بر همبستگی بیان ژن غلبه کنند و ممکن است چارچوب دقیقتر و قویتری برای تجزیهوتحلیل دادههای ژنتیکی ارائه دهند.
نتیجهگیری
تجزیهوتحلیل دادههای ژنتیکی با استفاده از رویکردهای علم شبکه، بینشهای ارزشمندی را در مورد ماهیت پیچیده تعاملات ژنی و ارتباط آنها با توسعه صفات پیچیده ارائه کرده است. مطالعات بررسی شده در این مقاله نشان دادهاند که شبکههای ژنی در انواع فرایندهای بیولوژیکی از جمله رشد عصبی، شکلپذیری سیناپسی، سیگنالدهی انتقالدهنده عصبی و پاسخ ایمنی درگیر هستند. از طریق شناسایی ژنها و مسیرهای کلیدی درگیر در این فرایندها، میتوان مکانیسمهای اساسی صفات و بیماریهای پیچیده را بهتر درک کرد. بااینحال، ذکر این نکته مهم است که شناسایی شبکههای ژنی تنها یک مرحله در درک صفات پیچیده است و تحقیقات بیشتری برای روشنشدن کامل تعامل پیچیده بین ژنتیک و عوامل محیطی موردنیاز است. علاوه بر این، شناسایی شبکههای ژنی مرتبط با ویژگیهای پیچیده میتواند نگرانیهای اخلاقی را ایجاد کند، و مهم است که پیامدهای بالقوه تحقیقات ژنتیکی بر افراد و جامعه بهعنوان یک کل در نظر گرفته شود. بهطورکلی، تجزیهوتحلیل دادههای ژنتیکی و ساخت شبکههای ژنی این پتانسیل را دارد که درک ما از ویژگیهای پیچیده را تا حد زیادی افزایش دهد و در نهایت منجر به توسعه درمانها و درمانهای جدید شود.
یکی از مزایای اصلی رویکردهای علم شبکه، توانایی شناسایی ژنهای هاب است که برای عملکرد شبکه ژنی حیاتی هستند. ژنهای هاب بهشدت به سایر ژنهای شبکه متصل هستند و نقش مرکزی را در تنظیم فعالیت شبکه ایفا میکنند. چندین مطالعه از ژن هاب برای شناسایی مسیرهای کلیدی درگیر در ویژگیهای پیچیده مانند هوش، شخصیت و اختلالات روانی استفاده کردهاند. این یافتهها سرنخهای مهمی را برای توسعه درمانها و مداخلات جدید که ژنها و مسیرهای خاص را هدف قرار میدهند، ارائه میکند.
یکی دیگر از جنبههای مهم علم شبکه، توانایی ادغام انواع مختلف دادهها برای بهدستآوردن درک جامعتری از ویژگیهای پیچیده است. بهعنوانمثال، وانگ و همکاران. (2019) از یک رویکرد مبتنی بر شبکه برای ادغام دادههای ژنتیکی و اپیژنتیکی استفاده کرد و ژنهای کلیدی و مسیرهای دخیل در تنظیم بیان ژن را شناسایی کرد. این رویکرد همچنین میتواند برای ادغام دادهها از فناوریهای omics متعدد، مانند transcriptomics، proteomics، و metabolomics، برای بهدستآوردن تصویر کاملتری از ویژگیها و بیماریهای پیچیده استفاده کند.
مطالعات بررسی شده در این مقاله همچنین اهمیت درنظرگرفتن تعاملات ژن و پویایی شبکه را هنگام تجزیهوتحلیل دادههای ژنتیکی برجسته میکند. مطالعات سنتی انجمن گسترده ژنوم (GWAS) بر شناسایی گونههای ژنتیکی فردی که با یک صفت مرتبط هستند تمرکز دارد، اما این مطالعات تعاملات پیچیده بین ژنهایی را که زیربنای اکثر صفات پیچیده هستند، در نظر نمیگیرند. با استفاده از رویکردهای علم شبکه برای تجزیهوتحلیل دادههای ژنتیکی، میتوان شبکههای ژنی و مسیرهایی را که در ایجاد صفات و بیماریهای پیچیده دخیل هستند، شناسایی کرد.
تجزیهوتحلیل شبکه هم بیان ژن وزنی (WGCNA) یکی دیگر از روشهای رایج مورداستفاده برای تجزیهوتحلیل دادههای ژنتیکی و ساخت شبکههای ژنی است. WGCNA برای شناسایی ماژولهای ژنی مرتبط با طیف وسیعی از صفات پیچیده از جمله بیماری آلزایمر، دیابت و سرطان استفاده شده است. با شناسایی ماژولهای ژنهای هم ابراز شده، WGCNA میتواند بینشی در مورد مسیرهای بیولوژیکی و مکانیسمهای زیربنایی این صفات ارائه دهد.
علاوه بر این رویکردها، علم شبکه میتواند برای تجزیهوتحلیل انواع دیگر دادههای ژنتیکی مانند دادههای eQTL و شبکههای تنظیمکننده ژن نیز استفاده شود. با بررسی روابط بین انواع ژنتیکی و سطوح بیان ژن، تجزیهوتحلیل eQTL میتواند ژنها و مسیرهایی را شناسایی کند که توسط انواع ژنتیکی خاص تنظیم میشوند. از سوی دیگر، شبکههای تنظیمکننده ژن میتوانند بینشی در مورد تنظیم رونویسی ژنها و تعاملات بین فاکتورهای رونویسی و ژنهای هدف آنها ارائه دهند.
علیرغم پیشرفتهای زیادی که در زمینه علم شبکه و ژنتیک صورتگرفته است، هنوز چالشهای متعددی وجود دارد که باید موردتوجه قرار گیرد. یکی از محدودیتهای اصلی رویکردهای علوم شبکه، عدم استانداردسازی در جمعآوری و تحلیل دادهها است. مطالعات مختلف ممکن است از روشهای مختلفی برای پیشپردازش دادهها، ساخت شبکه و تجزیهوتحلیل شبکه استفاده کنند که میتواند مقایسه نتایج را در بین مطالعات دشوار کند. علاوه بر این، تفسیر نتایج شبکه میتواند پیچیده باشد و ممکن است به دانش تخصصی فرایندهای بیولوژیکی درگیر نیاز داشته باشد. محدودیت دیگر منابع محاسباتی موردنیاز برای تحلیل شبکه است که میتواند مانعی برای برخی از محققان باشد.
چالش دیگر نیاز به حجم نمونه بزرگتر و جمعیتهای متنوعتر در مطالعات ژنتیکی است. بسیاری از مطالعات بررسی شده در این مقاله بر روی جمعیتهای اروپایی تبار متمرکز شدهاند که ممکن است تعمیمیافتهها را به سایر جمعیتها محدود کند. علاوه بر این، برای تشخیص اندازه اثر کوچک و انواع کمیاب که ممکن است برای صفات پیچیده مهم باشند، به اندازههای نمونه بزرگتر نیاز است. محدودیت دیگر پتانسیل مثبت کاذب و منفی کاذب است که میتواند به دلیل نویز در دادهها یا وجود متغیرهای مخدوشکننده رخ دهد.
از دیگر محدودیتهای رویکردهای علم شبکه این است که اغلب بر تحلیلهای همبستگی تکیه میکنند و ارتباط علی بین ژنها و صفات ارائه نمیدهند. این امر اهمیت تأیید یافتهها را از طریق رویکردهای تجربی، مانند مدلهای حیوانی و دستکاری ژنتیکی، برجسته میکند.
علیرغم این محدودیتها، استفاده از رویکردهای علم شبکه قبلاً منجر به پیشرفتهای قابلتوجهی در درک ما از اساس ژنتیکی صفات پیچیده شده است. این پیشرفتها پتانسیل ایجاد درمانها و مداخلات جدید برای طیف وسیعی از اختلالات را دارند.
با حرکت روبهجلو، نیاز به ادامه تحقیقات در زمینه علوم شبکه، بهویژه در توسعه شبکههای ژنی دقیقتر و جامعتر وجود دارد. این تحقیق به همکاری بین متخصصان ژنتیک، زیستشناسی، ریاضیات و علوم کامپیوتر نیاز دارد. با همکاری یکدیگر، میتوانیم تصویر کاملتری از تعامل پیچیده بین ژنها و صفات بسازیم و در نهایت توانایی خود را برای تشخیص و درمان اختلالات پیچیده بهبود ببخشیم.
به طور خلاصه، استفاده از رویکردهای علم شبکه، درک ما از اساس ژنتیکی صفات پیچیده را متحول کرده است. از طریق تجزیهوتحلیل شبکههای ژنی، محققان میتوانند ژنهای کلیدی و مسیرهای دخیل در توسعه این صفات را شناسایی کنند و درک بهتری از مکانیسمهای بیولوژیکی زیربنایی به دست آورند. درحالیکه محدودیتهایی برای این رویکردها وجود دارد، تحقیقات ادامهدار در این زمینه این پتانسیل را دارد که توانایی ما را برای تشخیص و درمان طیف وسیعی از اختلالات پیچیده بهبود بخشد و در نهایت زندگی افراد و جوامع را در سراسر جهان بهبود بخشد.
منابع
Barabasi, A. L., & Oltvai, Z. N. (2004). Network biology: understanding the cell's functional organization. Nature reviews. Genetics, 5(2), 101-113.
Gandal, M. J., Zhang, P., Hadjimichael, E., Walker, R. L., Chen, C., Liu, S., ... & Won, H. (2018). Transcriptome-wide isoform-level dysregulation in ASD, schizophrenia, and bipolar disorder. Science, 362(6420).
Oldham, M. C., Konopka, G., Iwamoto, K., Langfelder, P., Kato, T., Horvath, S., & Geschwind, D. H. (2008). Functional organization of the transcriptome in human brain. Nature neuroscience, 11(11), 1271-1282.
Pe'er, I., Yelensky, R., & Altshuler, D. (2008). Estimation of the multiple testing burden for genomewide association studies of nearly all common variants. Genetic epidemiology, 32(4), 381-385.
Schadt, E. E., & Björkegren, J. L. (2012). NEW: Network-enabled wisdom in biology, medicine, and health care. Science translational medicine, 4(115), 115rv1.
Schizophrenia Working Group of the Psychiatric Genomics Consortium. (2014). Biological insights from 108 schizophrenia-associated genetic loci. Nature, 511(7510), 421-427.
Smoller, J. W., & Finn, C. T. (2003). Family, twin, and adoption studies of bipolar disorder. American Journal of Medical Genetics Part C: Seminars in Medical Genetics, 123(1), 48-58.
van den Heuvel, M. P., & Sporns, O. (2011). Rich-club organization of the human connectome. Journal of Neuroscience, 31(44), 15775-15786.
Yang, J., Lee, S. H., Goddard, M. E., & Visscher, P. M. (2011). GCTA: a tool for genome-wide complex trait analysis. The American Journal of Human Genetics, 88(1), 76-82.
Chen, Y., Zhu, J., Lum, P., Yang, X., Pinto, S., Macneil, D., Zhang, C., Lamb, J., Edwards, S., Sieberts, S., Leonardson, A., Castellini, L.W., Wang, S.S., Champy, M., Zhang, B., Emilsson, V., Doss, S., Ghazalpour, A., Horvath, S., Drake, T., Lusis, A., & Schadt, E.E. (2008). Variations in DNA elucidate molecular networks that cause disease. Nature, 452(7186), 429-435.
Wang, Z., Wang, Y., Wang, N., Wang, J., Wang, Z., Vallejos, C.E., & Wu, R. (2016). Towards a comprehensive picture of the genetic landscape of complex traits. Briefings in Bioinformatics, 17(4), 530-544.
Wolen, A.R., & Miles, M.F. (2012). Identifying gene networks underlying the neurobiology of ethanol and alcoholism. Alcohol Research: Current Reviews, 34(3), 306-317.
Zhu, X., Duren, Z., & Wong, W.H. (2017). Modeling regulatory network topology improves genome-wide analyses of complex human traits. Nature Communications, 8(1), 1-10.
Kogelman, L.J.A., & Kadarmideen, H.N. (2014). Weighted Interaction SNP Hub (WISH) network method for building genetic networks for complex diseases and traits using whole genome genotype data. BMC Systems Biology, 8(1), 55.
Zhang, F., Zhai, H.Q., Paterson, A.H., Xu, J.L., Gao, Y.M., Zheng, T.Q., Wu, R.L., Fu, B.Y., Ali, J., & Li, Z.K. (2016). Dissecting genetic networks underlying complex phenotypes: The theoretical framework. Frontiers in Genetics, 7, 116.
Fang, C., Ma, Y., Wu, S., Liu, Z., Wang, Z., Yang, R., Hu, G., Zhou, Z., Yu, H., Zhang, M., Pan, Y., Zhou, G., Ren, H., Du, W., Yan, H., Shen, Y., Liu, S., Liu, T., Zhang, J., Qin, H., Yuan, J., Yuan, X., Kong, F., Liu, B., Li, J., Zhang, Z., Wang, G., Zhu, B., & Tian, Z. (2020). Genome-wide association studies dissect the genetic networks underlying agronomical traits in soybean. Genome Biology, 21(1), 1-18.
Rotival, M., & Petretto, E. (2014). Leveraging gene co-expression networks to pinpoint the regulation of complex traits and disease, with a focus on cardiovascular traits. Briefings in Functional Genomics, 13(1), 54-64.
Williams, E.G., & Auwerx, J. (2015). The convergence of systems and reductionist approaches in complex trait analysis. Cell, 162(1), 23-32.