تفسیر توالی های ژنتیکی با ابزارهای مبتنی بر هوش مصنوعی



هزینه تعیین توالی ژنوم به سرعت در حال کاهش است. به قدری سریع که در چند سال اخیر، تعادل در ژنومیک تغییر کرده است: در حالی که برای مدت طولانی محدودیت سخت افزار و هزینه واقعی توالی یابی، قیمت یک ژنوم توالی شده را بالا می برد، امروزه شاهد کاهش این هزینه ها هستیم.

توالی یابی ژنوم پتانسیل رفع بیماری های نادر تشخیص داده نشده را دارد. با این حال، آزمایش‌های مدرن ژنومی به تشخیص برای هر بیمار منجر نمی‌شود. بسیاری از بیماران تحت یک فرایند تشخیصی قرار می گیرند که با چالش بررسی صدها نوع DNA برای ارزیابی پیامدهای آنها برای بیماری طولانی شده است. برای غلبه بر گلوگاه تفسیری، آزمایشگاه‌های بالینی به نوآوری سریع فناوری نیاز دارند. مرز بعدی در آزمایش ژنومی در راه حل هایی نهفته است که از هوش مصنوعی (AI) برای بهبود فرآیندهای موجود استفاده می کنند.

استارتاپ بیوانفورماتیک آلمانی Nostos Genomics هدف خود را بهبود تفسیر ژنتیکی موجود در آزمایش‌های توالی بالینی با کمک هوش مصنوعی معرفی کرده است. استارتاپ AION یک پلت فرم مبتنی بر هوش مصنوعی برای تفسیر انواع بیماری های نادر است که توسط Nostos Genomics توسعه یافته است. AION از تحلیلگران برای تشخیص سریع‌تر بیماری‌های نادر با استفاده از یک مدل یادگیری ماشینی که روی میلیون‌ها نقطه داده ژنتیکی با کیفیت بالا آموزش داده شده، پشتیبانی می‌کند. این شرکت اعلام کرده است که با Genomenon برای ادغام موتور جستجوی ژنومیک Genomenon Mastermind در پلتفرم تفسیری خود همکاری می کند. هنگامی که در مورد موارد پروژه 100000 ژنوم اعمال شد، AION نوع عامل بیماری را با حساسیت 91.5 درصد شناسایی کرد، در صورت ارائه اطلاعات والدین به 93.1 درصد و در بیماران اطفال به 94 درصد افزایش یافت. AION آزمایشگاه‌های بالینی و خدمات آزمایش ژنتیک را برای ارائه تفسیرهای دقیق، به‌موقع و قابل تکرار برای بیماران بیماری‌های نادر توانمند می‌سازد.

سوالاتی که امروزه با آن مواجه هستیم را در سه سوال می توان خلاصه کرد:

موانع فعلی برای تفسیر دقیق انواع چیست؟

نقش هوش مصنوعی در مقیاس بندی تفسیر انواع چیست؟

چگونه AION تست ژنومی را برای بیماری های نادر مدرن می کند؟


پلتفرم AION می‌خواهد به کاربران نهایی در آزمایشگاه‌های مولکولی کمک کند تا "تنگنا" درک شده در تفسیر نتایج توالی‌یابی کل اگزوم و کل ژنوم، به‌ویژه برای بیماری‌های ژنتیکی نادر را کاهش دهند.

نوستوس با رویکرد "جعبه سفید" خود را از رقبایانی مانند Emedgene و Fabric Genomics متمایز می کند که در آن کاربران می توانند عواملی را که منجر به طبقه بندی یک نوع بیماری شده است، مشاهده کنند. این شرکت همچنین سعی می‌کند از طریق الگوریتم‌های اختصاصی خود که انواع را در مناطق کدکننده پروتئین ژنوم تفسیر می‌کند، به منظور طبقه‌بندی استفاده نماید.این بدان معناست که هر پرونده بیمار ارسال شده و پردازش شده تحت یک تجزیه و تحلیل جامع از همه گونه‌های ژنتیکی شناسایی‌شده قرار می‌گیرد تا محتمل‌ترین گونه‌های ایجادکننده بیماری که با ویژگی‌های بالینی بیمار مطابقت دارند شناسایی شود.

بر اساس وایت پیپری که گردش کار Aion را توصیف می کند، این فناوری ابتدا فایل نوع بیمار را با یک مسیر داخلی که شامل اطلاعات بیش از 25 پایگاه داده عمومی و اختصاصی (ENSEMBL, Uniprot, HGNC, UCSC, GnomAD, ClinVar, OMIM, Orphanet, Monarch, HPO ) است تعیین می کند.

سپس از فایل VCF خروجی به عنوان ورودی برای الگوریتم یادگیری ماشین خود استفاده می‌کند تا انواع را به عنوان خوش‌خیم یا بیماری‌زا طبقه‌بندی کند، همراه با یک امتیاز اطمینان که این را در نظر می‌گیرد که آیا این گونه در منطقه حفاظت‌شده ژنوم انسان است یا پیش‌بینی می‌شود که باعث ایجاد آن شود.


پیشینه: تحولات اخیر در آزمایش ژنتیک و نیاز به هوش مصنوعی

بیماری های ژنتیکی توسط جهش ها یا انواع مختلف در ژنوم انسان ایجاد می شوند. یک متخصص ژنتیک باید نوع ایجاد کننده (یا بیماری زا) را برای تشخیص بیماری ژنتیکی پیدا کند. ژنوم انسان از حدود 3 میلیارد جفت باز تشکیل شده است و این گونه های ایجاد کننده را می توان در هر بخشی از ژنوم انسان یافت. برای مدت طولانی، تعیین توالی ژنوم ها فرآیندی پرهزینه بود: اولین پیش نویس ژنوم انسانی به عنوان بخشی از پروژه ژنوم انسانی 300 میلیون دلار هزینه داشت.

در سال 2006، هزینه تعیین توالی ژنوم انسان بین 20 تا 25 میلیون دلار تخمین زده شد، اگرچه این یک هزینه فرضی محاسبه شده بود. خوشبختانه، هزینه توالی‌یابی ژنوم از زمان پیش‌نویس 150 میلیون دلاری ژنوم انسان در سال 2003 به طور پیوسته کاهش یافته است - با آخرین قیمت در سال 2022 با قیمت 200 دلار. اما این کاهش قیمت چه معنی ای دارد؟ در واقع کاهش شدید هزینه ها منجر به رشد قوی بازار توالی نسل بعدی (NGS) شده است، با رشد مرکب سالانه تخمینی بیش از 18 درصد بین سال های 2022 و 2030. به عبارت دیگر، آزمایشات ژنتیکی به طور گسترده در دسترس است.

این پیشرفت ها به این معنی است که محرک هزینه توالی یابی ژنتیکی دیگر خود توالی یابی نیست. تجزیه و تحلیل همه این داده ها به طور فزاینده ای به گلوگاهی برای آزمایشگاه ها تبدیل می شود. توالی‌یابی یک ژنوم یا اگزوم فهرست طولانی‌ای از واریانت‌ها را ایجاد می‌کند که باید توسط متخصص تفسیر شوند، زیرا بسیاری از این گونه‌ها خوش‌خیم هستند (مضر نیستند). بنابراین، به زبان ساده، تولید داده‌ها هر سال ارزان‌تر می‌شود، در حالی که تفسیر این داده‌ها - یافتن نوع بیماری‌زا - هنوز هم به همان اندازه کار و هزینه‌بر است.

اینجاست که نسل جدیدی از نرم‌افزار مبتنی بر هوش مصنوعی وارد می‌شود و از کسانی که داده‌ها را تفسیر می‌کنند، در سرعت بخشیدن به فرآیند تجزیه و تحلیل ژنوم‌ها یا اگزوم‌های توالی‌شده پشتیبانی می‌کند. به عنوان مثال، از طریق برنامه های غربالگری نوزادان، از آنجایی که کشورهای بیشتری آزمایش ژنتیک را در مقیاس بزرگ معرفی می کنند، ابزارهای مبتنی بر هوش مصنوعی که بر تنگنای تفسیر فعلی تمرکز می کنند، مورد نیاز است.

اعتبار سنجی بالینی ابزارهای تفسیر متغیر مبتنی بر هوش مصنوعی: مطالعه AION

پلتفرم AION یکی از این پلتفرم‌ها است: یک پلتفرم تفسیری برای بیماری‌های نادر که توسط الگوریتم‌های یادگیری ماشین پشتیبانی می‌شود. قبل از فرو رفتن در مطالعه اعتبار سنجی آن - اجازه دهید به سرعت به نحوه عملکرد آن بپردازیم. هدف آن حمایت از دانشمندان مختلف در این فرآیند تفسیر است که در حال حاضر گلوگاه بازار توالی در حال رشد است.

پلتفرم AION شامل دو جزء اصلی است: اولاً، تمام جهش‌ها یا واریانت‌ها به دو دسته بیماری‌زا یا خوش‌خیم طبقه‌بندی می‌شوند - اما تأثیر سببی کمتر از 1٪ از همه جهش‌ها شناخته شده است. تعداد بیشتری از انواع به اصطلاح VUS نامیده می شود: انواع با اهمیت نامشخص (variants of uncertain significance). این الگوریتم با برون یابی دانش بر اساس مجموعه داده های عمومی و آخرین تحقیقات، با شناسایی انواع بالقوه بیماری زا، از طبقه بندی پشتیبانی می کند.

ثانیاً، الگوریتم دوم این گونه‌های بالقوه مضر را با علائمی که بیمار تجربه می‌کند مطابقت می‌دهد تا مرتبط‌ترین گونه‌ها را برای متخصص انسانی رتبه‌بندی کند. این ویژگی بسیار جالب است، به یاد داشته باشید که اکثریت قریب به اتفاق انواع VUS هستند، که جهتی را برای تحقیقات بالینی بیشتر توسط متخصص انسانی فراهم می کند.

برای تایید عملکرد بالینی پلت فرم AION ما داده های بیماران بیماری نادر پروژه ژنومیکس انگلستان 100000 ژنوم را تجزیه و تحلیل کردیم. تیم ژنومیک محاسباتی Nostos Genomics موارد بیماری نادری را از پروژه 100000 ژنوم در AION اجرا کرد و عملکرد آن را تجزیه و تحلیل کرد. در اینجا، هدف یافتن تشخیص‌های جدید نبود، بلکه اندازه‌گیری نحوه عملکرد ابزار بر اساس موارد تشخیص داده شده قبلی بود، تا ببینیم یک ابزار مبتنی بر هوش مصنوعی در مقایسه با یک متخصص انسانی چگونه عمل می‌کند.

نتایج قابل توجه است: AION انواع بیماریزای ایجاد کننده را در بیش از 91 درصد موارد و بیش از 93 درصد در صورت در دسترس بودن اطلاعات والدین شناسایی کرد. این بدان معناست که در بیش از 9 مورد از 10 مورد، واریانت مسبب در رتبه بندی انواع اولویت بندی شده در سنین و قومیت ها یافت شده است. تفسیر نوع خودکار مبتنی بر هوش مصنوعی عملکرد بالینی قابل مقایسه با یک متخصص انسانی را ارائه می دهد. این می‌تواند از تجزیه و تحلیل آزمایش‌های ژنتیکی بالینی پشتیبانی کند، که ممکن است زمان و هزینه‌های مرتبط با این فرآیند مهم را به دلیل تنگنای تفسیری که قبلاً توضیح داده شد، کاهش دهد.


پتانسیل آینده برای هوش مصنوعی در ژنتیک

در پاراگراف های قبلی، ضرورت ابزارهای پشتیبانی تصمیم مبتنی بر هوش مصنوعی را با رشد سریع صنعت توالی یابی و اعتبارسنجی عملکرد آنها پوشش دادیم. پذیرش بیشتر این ابزارها می تواند منجر به در دسترس بودن گسترده تر آزمایش ژنتیکی در سطح جهانی شود. کاهش هزینه های توالی می تواند در را برای بازارهای جهانی مراقبت های بهداشتی برای سرمایه گذاری در تشخیص بیماری های نادر باز کند.