سارا طالب پور
دانشگاه شهید بهشتی تهران
Sara.talebpour@gmail.com
شیوع ویروس کرونا و تبدیل آن به همه گیری باعث شد تا همگان به سراغ مطالعه این ویروس و پیدا کردن راه حلی برای جلوگیری آن بپردازند. پروتئاز Mpro یکی از اصلی ترین پروتئاز ویروس کرونا است که در ویروس سارس هم وجود دارد. از آنجا که بین ویروس کرونا و سارس شباهت زیادی در ساختار آمینو اسیدهایشان وجود دارد، در این پژوهش با بررسی توپولوژیکی شبکه پروتئین پروتئاز اصلی این دو ویروس شباهت های آن ها بررسی شده و به اثبات رسیده است. همچنین از منظر میزان خطا پذیری بررسی شده و نشان داده شده در بعضی از پارامترها ویروس کرونا چه مقدار در انتقال اطلاعات از مسیرهای موجود نسبت به ویروس سارس بیشتر استفاده کرده است.
کلمات کلیدی:شبکه پیچیده، شبکه پروتئین ویروس کرونا، پروتئازMpro
از دسامبر سال ۲۰۱۹ که ویروس کرونا از کشور چین شروع به گسترش پیدا کرد، در عرض سه ماه تبدیل به همه گیری شد. وسعت همه گیري و سرعت انتقال بیماري باعث شد تا پژوهشگران رشته هاي مختلف از پزشکي گرفته تا علوم کامپیوتر دست به دست يکديگر دهند تا بتوانند براي پیش بیني نحوه ي گسترش و جلوگیري از انتشار آن چاره اي بینديشند. دربین اين علوم حوزه شبکه هاي پیچیده پويا و هوش مصنوعي نقش پررنگي را در کنار علم پزشکي ايفاء مي کند. در حوزه علوم کامپیوتر، مي توان با استفاده از علم شبکه و ترکیب مفاهیم آن براي مدلسازي و شبیه سازي تحلیل هايي ارائه داد. يکي از پرکاربردترين موارد استفاده از علوم کامپیوتر، استفاده از مفاهیم علم شبکه ي پويا و پیاده سازي آنها با استفاده از ابزارهاي کامپیوتري است. از اين ابزارها مي توان براي جمع آوري داده ها، مدلسازي، شبیه سازي ها يا رهگیري افراد جامعه استفاده کرد. این مطالعه در حوزه تحلیل سیستم های پیچیده که مرتبط با مسائل دنیای واقعی است قرار دارد. سیستم های این حوزه طیف وسیعی از مقیاس ها از سطح مولکولی تا سطح اجتماعی را پوشش می دهند. در مورد ویروس کرونا اکثر تلاش ها در دسته اول یعنی تحلیل گسترش و شیوع اپیدمی می باشد. دسته دوم مقالاتی اند که به سطح ساختار مولکولی توجه کرده اند. از این رو در این پژوهش سعی شده است به دسته دوم پرداخته شود. ویروس کرونا هم جنس ویروس سارس که یک بیماری تنفسی که در سال ۲۰۰۳ شناخته شده است. ویروس کرونای جدید بالای 80 درصد ژنوم ویروس سارس را به خود اختصاص داده است. با وجود این شباهت و وجود ویروس سارس از ۲۰ سال پیش، هیچ داروی تایید شده برای کرونا وجود ندارد و این جامعه علمی را برای جستجوی داروی ضد ویروس ترغیب می کند. یک هدف دارویی جذاب برای ویروس کرونای جدید پروتئاز ویروسی آن است. که به عنوان پروتئاز اصلی کرونا شناخته می شود که یک آنزیم کلیدی این ویروس است. پروتئاز اصلی ویروس کرونا جدید نشان دهنده یکی از مهمترین اهداف برای اقدامات داروی ضد ویروس است. جلوگیری از فعالیت این آنزیم از تکثیر ویروس جلوگیری می کند. شبکه ای که در این پژوهش مورد بررسی قرار میگیرد شبکه پروتئاز اصلی ویروس کرونا است که نود های شبکه برابر با آمینو اسیدها و یالهای بینشان نشان دهنده فاصله تعامل بین آمینو اسیدها می باشد.
اولین سوالی که در اینجا مطرح میشود این است که آیا چنین شباهتی در ساختار توپولوژیکی در سطح پروتئین هم وجود دارد یا خیر. همچنین پیدا کردن دلیل تفاوت بیولوژیکی میان این دو ویروس در ساختار شبکه مورد بررسی قرار خواهد گرفت و از طرف دیگر سنجش میزان تحمل پذیری این شبکه یکی از کارهای این پژوهش است.
این مطالعه در حوزه تحلیل سیستم های پیچیده که مرتبط با مسائل دنیای واقعی است قرار دارد. سیستم های این حوزه طیف وسیعی از مقیاس ها از سطح مولکولی تا سطح اجتماعی را پوشش می دهند. در مورد ویروس کرونا اکثر تلاش ها در دسته اول یعنی تحلیل گسترش و شیوع اپیدمی می باشد. در مقاله[1] ارتباط میان کشورها در شیوع بیماری مورد بررسی قرار گرفته است بر اساس همبستگی میان ۱۲۲ کشور شبکه پیچیده ای را به وجود آوردند و به تحلیل ویژگی اتصالات بین شبکه ها پرداختند علاوه بر این به طور تجربی عوامل موثر بر اتصال شبکه را با استفاده از داده های کلان اقتصادی و اجتماعی کشور های مختلف بررسی قرار دادند و متوجه شدند که شبکه جهانی همهگیری ویروس کرونا دارای برخی ویژگی های شبکه پیچیده مثل طول مسیر کوتاه، خوشه بندی بالا و ساختار جامعه ای خوب است. علاوه بر این، تراکم جمعیت، شرایط اقتصادی، تجارت، مخارج دولتی و کیفیت درمان پزشکی عوامل مهمی از کلان اقتصادی و اجتماعی هستند که بر گسترش ویروس کرونا در کشورهای مختلف تأثیر میگذارند.
در مقاله[2] مدل شبکه اجتماعی برای ویروس کرونا ساخته شده است که یک مدل اپیدمیولوژی SIR از گراف ارتباطات فرد به فرد است. SIR استاندارد افراد مبتلا در کل جمعیت را نشان می دهد. این شبکه نشان دهنده: 1- مردم بیشتر با اعضای شبکههای اجتماعی خود ارتباط برقرار می کنند. 2- سیاست های بهداشتی و اقتصادی میتوانند به طور متفاوت به میزان انتقال ویروس از طریق شبکه های اجتماعی شخص تاثیر بگذارند. مدل پیشنهادی NSIR امکان ارزیابی از طریق شبیه سازی را برای:1- سیاست های اقتصادی و بهداشتی برای همه یا زیرمجموعه جمعیت فراهم می کند. مانند قرنطینه، فاصلهگذاری، آزمایش و ارزیابی ارتباطات. 2- پاسخ های رفتاری و تحمیل یا لغو سیاست ها در زمان خاص و شرایط ویژه را فراهم می کند. تست و ردیابی تماس در مدل شبکه موثرتر است. اگر سیاست ها زود برداشته شوند، سیاستهای فاصلهگذاری عمدتاً با هزینههای اقتصادی مرتبط، اوج عفونت را به آینده منتقل میکنند.
در مقاله[3] مطالعات شیوع اخیر سعی بر تخمین تعداد مبتلایان کووید-۱۹ بدونعلامت کرده اند. فهم اثرات این نوع عفونت ها اهمیت ویژه ای در پیشگیری از موج دوم دارد. هدف از این مطالعه مدلسازی تعاملات و اثرمتقابل در جمعیت به واسطه ی یک شبکه ی پیچیده است؛ و همچنین قصد بر تشریح میزان اثربخشی معیارها و روشهای کنترل محلی در رابطه با بازشدن مدارس ایتالیا در سپتامبر دارد. مزیت استفاده از از این مدل در این است که میان کیسهای با علامت و بیعلامت تفاوت قائل میشود به صورتی که تعاملات این دو گروه به صورت جداگانه ثبت میشود و اجازه میدهد به صورت جداگانه برروی کیسهای بیعلامت مطالعه کنیم. سپس این مدل توسط شبکه ی پیچیده ی واتس-استروگاتز به نسخه ای غیرهمگن ساختارمند تعمیم داده میشود که این شبکه ی پیچیده بسیار برای مدلسازی های تعاملات جمعی و اجتماعی مورد استفاده قرار میگیرد.نهایتاً، پاسخ اين سؤال که درصورتيکه بیماري همه گیري وارد شبکه شود تا چه میزان بیماري گسترش مييابد؟ و چگونه سیاستهايي مانند منع ترددهاي جادهاي يا هوايي مانع انتشار همگاني ويروس در شبکه ميشود؟
در مقاله[4] نشان داده شده انتشار ویروس ها اساساً از طریق تعامل و تماس بین افراد اتفاق می افتد که ارتباط نزدیکی با شبکه روابط بین افراد دارد. بر اساس بررسی های ۱۲۱۸ مورد ویروس کرونا در ۸ منطقه چین در این مقاله از روشهای تجزیه و تحلیل متن، تجزیه و تحلیل شبکه اجتماعی و نمایش برای ایجاد شبکه تماس بین افراد برای همه گیری استفاده شده است. با استفاده از ویژگی های جمعیت شناختی و شاخص های شبکه ویژگی ساختاری این شبکه را مورد تجزیه و تحلیل قرار دادند و دریافتند که ۶۵ درصد از موارد توسط یک رابطه قوی به فرد آلوده و تقریباً ۴۰ درصد موارد دارای اعضای خانواده مبتلا به طور همزمان هستند. اتصال کلی شبکه کم است اما برخی عفونت های خوشه ای وجود دارد. از نظر توزیع درجه، درجات اکثر موارد بین ۰ و ۲ متمرکز است که نسبتاً کم است و تنها تعداد کمی از آنها دارای مقدار درجه بالاتری هستند. توزیع درجه نیز با توزیع قانون توان مطابقت دارد که نشان میدهد یک شبکه بدون مقیاس است. تنها ۱۷ مورد با درجه بالاتر از ۱۰ وجود دارد و این عفونت های خوشه ای معمولاً در انتقال محلی ایجاد می شوند. اولین مفهوم این تحقیق این است که گسترش کرونا با ساختار اجتماعی ارتباط نزدیکی دارد و مفهوم دوم تایید این است که تجزیه و تحلیل متن میتواند به سرعت مسیر گسترش را در آغاز یک اپیدمی تجسم کند.
مقاله[5] روشی برای شناسایی پخش کننده های ویروس کرونا با استفاده از تحلیل رابطه بین ویژگیهای اجتماعی-فرهنگی و اقتصادی با تعداد سرایتها و مرگومیرهای ناشی از ویروس کرونا در کشورهای مختلف ارائه کرده است. برای این کار ، اطلاعات هر کشور را با استفاده از رویکرد شبکه های پیچیده، به خصوص با تحلیل کشورهای پخش کننده بر اساس مجموعه جداکننده در شبکه های مالتی پلکس 5 لایه، تجزیه و تحلیل کرده است. نتایج نشان می دهد که یک طبقه بندی از کشورها بر اساس مقادیر عددی آنها در اقتصاد اجتماعی، جمعیت، تولید ناخالص داخلی (GDP)، سلامت و ارتباطات هوایی به دست اورده است، شیوع کننده ها کشورهایی هستند که دارای مقادیر بالا،متوسط یا پایین در ویژگی های مختلف دارند.
مقاله[6] نقش افراد بدون علامت در همه گیري کرونا را ازطريق شبکه هاي پیچیده پويا بررسي کرده است. این مقاله مدل پیشنهادي خود که از مدل شناخته شدهي SEIR وام گرفته است و آن را SAIR نامیده است. آنها بهجاي واژه Recover که در اکثر مدلها استفاده ميشود از واژه Remove استفاده کردند چراکه تمايزي میان کساني که بهبود مييابند و فوت ميکنند قائل نشدند. مزيت استفاده از اين مدل در اين است که بین موارد بدون علامت و علامت دار کرونا تفاوت قائل ميشود. در اين مدل تعاملات با افراد بدون علامت و با علامت با افراد آلوده بهطور جداگانه ثبت ميشود و اين امر بررسي اثر بیماران بدون علامت را ممکن ميکند. اين پژوهش يک پیام مهم داشت: تعداد بیماران بدون علامت بهوضوح در دادههاي رسمي دستکم گرفته ميشود و ناديده گرفتن نقش اين افراد ميتوانند ثبات سیستم را به هم زده و موج ديگري را از شیوع بیماري را باعث شود.
دسته دوم مقالاتی اند که به سطح ساختار مولکولی توجه کردهاند. در مقاله[7] نشان داده شده است که پروتئاز اصلی ویروس کرونا از نظر توپولوژیکی بسیار شبیه به ویروس سارس است، با در نظر گرفتن اینکه هر دو پروتئاز فقط در ۱۲ آمینو اسید متفاوت هستند، این شباهت تعجب آور نیست. با این حال این مقاله یک خاصیت توپولوژیکی در ویروس کرونا پیدا کرده است که ۱۹۰۰ درصد از ویروس سارس بیشتر است، این ویژگی نشان دهنده ظرفیت انتقال پروتئاز جدید در تعاملات دوربرد است. در مقاله[8] با توجه به مشابهت ساختار ویروس کرونا و سارس، دلیل عدم عملکرد مشابه این دو ویروس را همان تعداد کمی تفاوت که در چند آمینو اسید دارند دانست. از آنجا که ساختار شبکه پروتئاز اصلی این دو ویروس مشابه است در این مقاله به بررسی ساختار شبکه پروتئاز اصلی در وضعیت های متصل به آپو و مهار کننده با استفاده از شبکه ساختار پروتئین پرداخته است. تجزیه و تحلیل شبکه ساختار پروتئین پروتئاز اصلی ویروس کرونا و سارس تغییرات محلی کوچک اما قابل توجه را در نزدیکی عامل فعال نشان میدهند که در کل ساختار توزیع می شود. همچنین جفت نمونه های بحرانی در شبکه را با استفاده از اندازه گیری سه مدل مختلف مرکزیت پیدا کردهاند که این یافته ها می تواند در جهت پیدا کردن دارو موثر باشد.
همانند شکل 1 شبکه PRN به وسیله اطلاعاتی که از پایگاه داده پروتئینها برای پروتئاز ویروس کرونا و سارس داده شده، ساخته شده است. نودها در این شبکه نشان دهنده کربن آلفا هر آمینو اسید می باشد. rc به عنوان شعاع قطع، نشان دهنده حد پایین برای جدا کردن دو نود می باشد. فاصله rij بین دو نود i و j از اندازه گیری فاصله کربن آلفا در آمینو اسیدها i و j به دست می آید. سپس اگر فاصله دو نود در مقایسه با rc کمتر یا مساوی باشد، دو نود با هم ارتباط برقرار کرده و در شبکه PRN به هم متصل بوده و یال دارند. ماتریس همسایگی شبکه با استفاده از تابع زیر به دست میآید[7].
که در این رابطه H(x) نشاندهنده تابع پله میباشد. در این مقاله حد فاصله را هفت آنگستروم در نظر گرفته اند زیرا در آزمایشاتی که این پارامتر کمتر یا بیشتر از این مقدار بود شبکه بسیار اسپارس یا بسیار چگال شده بود.
پارامتر های شبکه[7]
دسته اول پارامترها از اطلاعاتی که وابسته به ساختار محلی در اطراف هر نود است، به دست میآید مثل درجه هر نود که شامل تعداد ارتباطاتی است که هر نود دارد. پارامترهای این دسته شامل: چگالی، ناهمگونی درجات، ضریب خوشه بندی، میزان ماژولاریتی، assortativity و میانگین طول مسیر است. از انجا که با این پارامترها آشنایی بیشتری وجود دارد، از توضیح بیشتر صرف نظر شده است.
دسته دوم مربوط به پارامتر هایی است که نشان می دهند انتقال اطلاعات نه تنها از طریق مسیر کوتاه بلکه از طریق تمام مسیرهای در دسترس که بین دو نود وجود دارد صورت میگیرد. برای این پارامترها از واژه قدم به جای مسیر استفاده میشود. تعداد قدم ها به طول k بین دو نود i و j در شبکه را با نشان Aij(k) میدهند. پارامترهای دسته دوم به شمارش همه قدم ها به تمامی طول ها پرداخته، با این تفاوت که به مسیرهای کوتاه وزن بیشتری نسبت به مسیر های بلند می دهند این پارامتر از تابع ماتریس زیر به دست می آید:
این فرمول برای هر قدم به طور کامل مجازات !!k را در نظر میگیرد که برای قدم های طولانی این مجازات بسیار زیاد میشود و تاثیر این قدم ها ناچیز می شود. از قطر اصلی این ماتریس میانگین گرفته شده و با نام subgraph centrality شناخته می شود.
پارامتر بعدی میانگین درایه های غیر قطر اصلی ماتریس است که با نام communicability شناخته میشود، که نشان میدهد هر جفت نود چه مقدار میتواند از طریق همه مسیرهای موجود ارتباط برقرار کنند (البته با وزن بیشتر به مسیرهای کوتاه).
دسته سوم مربوط به پارامتر هایی است که به قدم ها با طول بلندتر جریمه کمتری اعمال می کنند. در دسته قبلی جریمه بسیار زیادی برای مسیرها با طول بلند در نظر گرفته و تاکید زیادی روی مسیرهای کوتاه دارد، از این رو برای بررسی بیشتر قدم های بلند از تابع ماتریس زیر استفاده شده است:
این پارامتر مسیر ها به طول k را !!k جریمه میکند[9].
تاثیر اصلی این جریمه با !!k به جای !k این است که مسیر های بلند مقدار کمتری جریمه می شوند و تاثیر بیشتری میگذارند. سپس همانند قسمت قبلی از قطر اصلی این ماتریس میانگین گرفته شده و با نام LR-subgraph centrality شناخته می شود.
پارامتر بعدی میانگین درایه های غیر قطر اصلی ماتریس است که با نام LR-communicability شناخته میشود.
به عنوان مثال برای نشان دادن تفاوت پارامترهای گفته شده، به دو شبکه کوچک شکل دو توجه بفرمائید. یکی از ویژگیهای شبکه پروتئینی ویروسها وجود حلقه ها و حفره هاست. شکل (a) 2 شامل دو حفره با 6 نوداست و شکل (b) 2 شامل دو حفره با ۵ و ۷ نوداست.
در جدول یک مقادیر پارامترهای گفته شده نشان داده شده است. همان طور که مشاهده می شود کمتر از 0.5درصد و کمتر از 0.1 درصد در دو شبکه تفاوت دارد. این اتفاق نتیجه جریمه سنگین برای مسیرها با طول بلند است که به سختی تمایزی بین حفره ها به طول های 5، 6 و 7 قائل میشود. اما دو پارامتر بعدی که جریمه !!k دارند، می توانند به خوبی تفاوت بین حفره ها قائل شوند و تفاوت نزدیک به ۵ درصد برای <Zii> و 2.4 درصد برای<Zij> به وجود آورند.
برای این پژوهش ابتدا تمامی پارامترهای گفته شده در قسمت قبل و پارامترها برای ارزیابی در این بخش پیاده سازی و در لینک زیر قابل مشاهده است.
https://colab.research.google.com/drive/1jPFeGXvrN5YbjDqZPFWqTQrDk8-xbfgT?usp=sharing
هدف اصلی این بخش تجزیه و تحلیل چند معیار شبکه Mpro از ویروس کرونا و مقایسه آنها با پروتئاز ویروس سارس می باشد. توالی اسید آمینه هر دو پروتئاز 96 درصد شباهت دارند. یعنی فقط 12 آمینو اسید در هر دو پروتئاز از مجموع 303 امینواسید متفاوت است. این اسیدهای آمینه به ترتیب در موقعیت های 33، 44، 63، 84، 86، 92، 132، 178، 200، 265، 283 و 284 قرار دارند[7]. برای مقایسه ویژگیهای توپولوژیکی پروتئازهای اصلی ویروس کرونا و سارس، در اینجا یک مرحله جلوتر میرویم و چندین ساختار پروتئاز اصلی ویروس کرونا و سارس را با یکدیگر مقایسه میکنیم. به این منظور برای ویروس سارس از بانک داده 2H2Z[11]، [10]2BX4 و برای ویروس کرونا از 6M03[12]، [12]6M2Q استفاده شده است. پارامترهای معرفی شده در قسمت قبل را بر روی این دادهها اعمال کرده و نتایج را در جدول 2 قابل مشاهده است.
در این جدول میتوان مشاهده کرد که بسیاری از ویژگیهای توپولوژیکی دسته اول PRNهای هر دو پروتئاز بسیار مشابه هستند و تفاوتهای نسبی کمی دارند. ابتدا به توضیح اجمالی پارامترهای این دسته می پردازیم. پارامتر چگالی مقداری بین صفر و یک دارد که حد پایین آن نشان دهنده شبکه های بدون یال است و حد بالای آن نشان دهنده گراف کامل است، برای این شبکه چگالی بسیار کم است و نشان دهنده این است که تعداد یال ها نسبت به تعداد نود کم است و این شبکهها اسپارس هستند. پارامتر ناهمگونی درجات در واقع یک مجموع از چگونگی اتصال همه جفت نود ها در شبکه است، این پارامتر نشان دهنده این است که درجات به چه صورت در بین نود ها توزیع شده اند که برای مثال در شبکه منظم که همه نود ها درجه برابر دارند، این پارامتر برابر صفر است اما در شبکه با توزیع درجه نرمال شبکه بیشترین ناهمگونی را دارد که در این شبکه ها همانطور که در جدول قابل مشاهده است، ناهمگونی درجات زیاد نیست و اکثر و درجات در یک بازه کوچکی هستند.
پارامتر بعدی ضریب خوشه بندی است که مقداری بین صفر و یک است. حد پایین آن نشان دهنده این است که هیچ نودی در تشکیل مثلث شرکت نکرده است و حد بالای آن مشارکت تمامی نودها در همه مثلث های ممکن در شبکه را نشان می دهد که در این شبکه یک مقدار نسبتاً بالا برای این پارامتر وجود دارد، این مقدار نشان از مثلث ها یا حلقه ها در شبکه است که همانطور که در قسمت قبل گفته شد ساختار شبکه های پروتئینی دارای حلقه و حفره است.
پارامتر ماژولاریتی اگر مقداری نزدیک به صفر داشته باشد، به معنی این است که دسته بندی به صورت موثر انجام نشده و به صورت رندوم دسته بندی شده است و مقداری نزدیک به یک به معنی دسته بندی درست و متفاوت با دسته بندی تصادفی است که در این ازمایش این گونه بوده است. پارامتر assortativity مرتبط با درجه است که برای مقادیر مثبت به معنی این است که نودها با درجه بالا به نودها به درجه بالا متصل میشوند و برای مقادیر منفی نودها با درجه بالا به نودها با درجه پایین متصل هستند که در این شبکه ها مثبت هستند. پارامتر میانگین طول مسیر در واقع میانگین کوتاه ترین مسیر بین همه ی جفت نودهاست، از این پارامتر برای اندازگیری "دنیای کوچک" بودن شبکه استفاده میشود. از ان جا که در تمامی شبکه ها مقداری نردیک به 6 دارد می توان به این شبکه ها ویژگی دنیای کوچک را تخصیص داد.
سپس تحلیل را با مقایسه معیارهای توپولوژیکی دسته دوم ادامه می دهیم. در میانگین مرکزیت زیرگراف یا <SC> حدود 10٪ و میانگین ارتباط بین جفت گره ها یا <Gpq> حدود 15٪ تفاوت وجود دارد. در هر دو مورد، شاخص ها برای پروتئاز ویروس کرونا به طور قابل توجهی بزرگتر از ویروس سارس است. همانطور که قبلا توضیح دادیم، این پارامتر هر گونه ارتباطی را که بین دو امینواسید را که با مسیری غیر از کوتاه ترین فاصله در پروتئین از هم جدا شده اند، به شدت جریمه می کند. بنابراین، آنها را می توان به عنوان شاخص هایی در نظر گرفت که مسیر کوتاه تر را نسبت به معیارهای نوع سوم در نظر گرفته است توجیه می کنند.
پارامترهای <Zii>و <Zij>، افزایش چشمگیری در ویروس کرونا نسبت به ویروس سارس نشان می دهد. در این حالت، افزایش این شاخص ها برای هر دو پارامتر <Zii>و <Zij> حدود 800 درصد است. به طور خلاصه، این بدان معنی است که پروتئاز ویروس کرونا حدود 10 برابر ظرفیت انتقال یال ها بین جفت گره ها نسبت به پروتئاز ویروس سارس دارد. این معادل این است که بگوییم پروتئاز ویروس کرونا از نظر توپولوژیکی در انتقال "اطلاعات" در میان اسیدهای آمینه آن بسیار کارآمدتر از پروتئاز ویروس سارس است.
در شکل زیر توزیع درجه این 4 شبکه قابل مشاهده است. همانطور که می بینید، تقریبا در تمامی شبکه ها درجه ها به صورت نرمال توزیع شده اند و شبکه ساختاری رندم دارد. تفاوت زیادی در توزیع شبکه این دو ویروس مختلف وجود ندارد که از ساختار مشابه این دو ویروس می توان به این نتیجه رسید.
پارامتر بعدی که پیاده سازی شده است توزیع فاصله هاست. در شکل زیر توزیع فاصله های هر جفت نود در این 4 شبکه قابل مشاهده است. همانطور که می بینید، تقریبا در تمامی شبکه ها فاصله ها تقریبا به صورت نرمال توزیع شده اند و قابل مشاهده است که میانگین تقریبا برابر با 6 یا همان میانگین طول مسیر در جدول بالا است. تفاوتی در توزیع فاصله شبکه این دو ویروس مختلف وجود ندارد و تقریبا همگی با هم برابر شده اند.
برای بررسی میزان تحمل پذیری خطای این شبکهها به بررسی میزان نزدیکی و بینیت هر نود در این شبکهها پرداخته می شود. برای مثال اگر شبکه نود هایی با نزدیکی و یا بینیت بسیار بالا داشته باشد تحمل کمتر در برابر خطاها و حمله ها دارد. شکل های زیر نمودار های میزان نزدیکی و بینیت برای تمامی نود ها در شبکه است. هر خط میانگین نزدیکی و بینیت هر نود در شبکه های مختلف آن دسته است.
در شکل مربوط به نزدیکی تقریباً برای هر دو ویروس نتایج برابر شده است و نمیتوان گفت کدام تحمل پذیری بالایی دارد.اما در شکل مربوط به بینیت میبینیم هر دو نمودار قلههای به عنوان مرکزیت دارد و در جاهایی برای ویروس سارس بیشتر شده که نشان دهنده این است که سارس در بعضی از نقاط تحمل پذیری کمتری را دارد و راحتتر میتوان به آن حمله کرد.
در ادامه این پژوهش، می توان از منظر همگنی و ناهمگنی شبکه های پروتئاز ویروس کرونا و سارس را مورد بررسی قرار داد. بعد از بدست آوردن نتایج، سعی به پیدا کردن دلایل تفاوت های بیولوژیکی آنها از دید شبکه پرداخته شود.
در این پژوهش برخی از خواص توپولوژیکی پروتئاز اصلی ویروس کرونا مورد تجزیه و تحلیل قرار گرفت. در این روش کربن الفا از هر اسید آمینه توسط یک گره از شبکه نمایش داده می شود و اگر فاصله کربن آلفا مربوطه بیش از 7 انگستروم نباشد، دو گره به هم متصل میشوند. از این پژوهش دریافتیم که تفاوت بین بسیاری از خواص توپولوژیکی PRN هر دو پروتئاز، کمتر از 5٪ است. اگر معیارهای LR را از تجزیه و تحلیل حذف کنیم، اکثر اقدامات توپولوژیکی تنها یک تغییر کوچک بین دو پروتئاز را نشان می دهد. در این شرایط، پارامتر توپولوژیکی وجود دارد که بیش از 10 برابر از یک پروتئاز به پروتئاز دیگر تغییر می کند. این پارامترها LR-subgraph centrality و ارتباط LR- communicability است. افزایش 10 برابری این پارامترها برای پروتئاز ویروس کرونا نسبت به ویروس سارس به این معنی است که تغییرات ساختاری که هر دو پروتئاز را متمایز می کند، افزایش زیادی در کارایی ویروس کرونا در انتقال اطلاعات در بین آمینو اسیدهای پروتئین با استفاده از تمام مسیرهای اتصال موجود و امکان انتقال از راه دور ایجاد کرده است. برای روشن تر شدن معنای این حساسیت، از یک مثال ساده استفاده می کنیم.
تجزیه و تحلیل PRN آسان تر از مطالعه کل ساختار پروتئین است. از این نظر، PRN یک مدل ساده شده از ساختار سه بعدی پروتئین را نشان می دهد. به طور معمول، چنین سادهسازی در پیچیدگی نمایش سیستمها باعث از دست رفتن اطلاعات ساختاری میشود که توسط سیستم جهانی نشان داده میشود. با این حال، در این مورد، نشان داده شد که استفاده از یک نمایش شبکهای از پروتئینها، الگوهای پنهانی را در ساختار آنها نشان میدهد. برای تشخیص چنین عوامل ساختاری مهمی، لازم است که مسیر های طولانی میان آمینو اسیدهای پروتئازها را در نظر گرفته شود، که مهمترین ویژگی های خود را از نظر حساسیت نسبت به تغییرات ساختاری کوچک ناشی از اغتشاشات محلی یا جهانی در سیستم آشکار می کنند. پارامترهای LR در اینجا تفاوت های اصلی بین پروتئازهای ویروس کرونا و سارس و همچنین مهم ترین اسیدهای آمینه برای تعامل با مهارکننده ها را نشان می دهد که ممکن است گزینه های درمانی علیه کرونا باشند.
[1]- Zhu, S., Kou, M., Lai, F., Feng, Q. & Du, G. The connectedness of the coronavirus disease pandemic in the world: A study based on complex network analysis. Front. Phys. 8, 642 (2021).
[2]-A. Karaivanov, “A social network model of COVID-19,” PLoS One 15, e0240878 (2020).
[3]- Zanin, Massimiliano, and David Papo. "Assessing functional propagation patterns in COVID-19." Chaos, Solitons & Fractals 138 (2020).
[4]- Yang, Zhangbo, et al. "Complex Contact Network of Patients at the Beginning of an Epidemic Outbreak: An Analysis Based on 1218 COVID-19 Cases in China." International Journal of Environmental Research and Public Health 19.2 (2022).
[5]- Montes-Orozco, Edwin, Roman-Anselmo Mora-Gutiérrez, Sergio-Gerardo De-Los-Cobos-Silva, Eric-Alfredo Rincón-García, Gilberto-Sinuhe Torres-Cockrell, Jorge Juárez-Gómez, Bibiana Obregón-Quintana, Pedro Lara-Velázquez, and Miguel-ángel Gutierrez-Andrade. "Identification of COVID-19 spreaders using multiplex networks approach." Ieee Access 8 (2020): 122874-122883.
[6]- Stella, Leonardo, Alejandro Pinel Martínez, Dario Bauso, and Patrizio Colaneri. "The role of asymptomatic individuals in the Covid-19 pandemic via complex networks." arXiv preprint arXiv:2009.03649 (2020).
[7]- Estrada, E. Topological analysis of SARS-CoV-2 main protease. Chaos 30, 061102 (2020).
[8]- Lata, S. & Akif, M. Comparative Protein Structure Network Analysis on 3CLpro from SARS-CoV-1 and SARS-CoV-2. Proteins: Structure, Function, and Bioinformatics (2021).
[9]- Estrada and G. Silver, “Accounting for the role of long walks on networks via a new matrix function,” J. Math. Anal. Appl. 449, 1581–1600 (2017).
[10]- J.Tan, K. H. Verschueren, K. Anand, J. Shen,M. Yang, Y. Xu, Z. Rao, J. Bigalke, B.Heisen, J. R.Mesters, and K. Chen, “pH-dependent conformational flexibility of the SARS-CoV main proteinase (Mpro) dimer: Molecular dynamics simulations and multiple X-ray structure analyses,” J. Mol. Biol. 354, 25–40 (2005).
[11]- X. Xue, H. Yang,W. Shen, Q. Zhao, J. Li, K. Yang, C. Chen, Y. Jin, M. Bartlam, and Z. Rao, “Production of authentic SARS-CoV Mpro with enhanced activity: Application as a novel tag-cleavage endopeptidase for protein overproduction,” J. Mol. Biol. 366, 965–975 (2007).
[12]- B. Zhang, Y. Zhao, Z. Jin, X. Liu, H. Yang, and Z. Rao, “The crystal structure of COVID-19 main protease in apo form” (published online, 2020).