درست ۱۰ روز پیش گوگل از یکی از جدیدترین و به عقیده ی من انقلابی ترین دست آورد هاش در حوزه ی هوش مصنوعی به نام جمنای (Gemini) پرده برداری کرد. یک مدل زبانی بزرگ (Large Language Model) یا LLM که تفاوتش با رقبای دیگهی خودش مثل GPT-4 اینه که علاوه برا متن میتونه با تصویر، صدا و ویدیو با کاربر ارتباط برقرار کنه. اینجا میتونید در مورد قابلیت های جمنای بیشتر ببینید و بخونید. اما این معرفی گوگل بهانه ای شد تا تصمیم بگیرم در اینجا کمی در مورد مدل های زبانی بزرگ بنویسم.
زبان مهمترین ابزار ارتباطی ما انسان هاست و تکامل بشر وقتی روند نمایی به خودش گرفت که به کمک ابزار زبان تونستن با همدیگه ارتباط برقرار کنن. احساسات و تفکراتشون رو انتقال بدن و حتی اون رو به صورت نوشته و متن به باقی افراد و به نسل های بعد منتقل کنن. این روند تا مدت زیادی به یک شکل و با یک سرعت ادامه پیدا کرد تا اینکه سر و کله ی کامپیوتر ها پیدا شد و برای ارتباط با اونها باید از روش هایی مثل تایپ کردن استفاده میکردید. در رایانه ای که ۵۰ سال پیش داشتید هر اشتباهی در املاء کلمات باعث میشد تا کامپیوتر با شما ارتباط برقرار نکنه و حرف شما رو متوجه نشه. بعد ها و تا چند سال پیش کامپیوتر ها میتونستن تا حد زیادی خطا های مارو متوجه بشن و حتی وقتی دقیقا به اون چیزی که میخواستیم اشاره نکردیم باز هم اونها کار رو به درستی انجام میدادن . این ارتباط عمدتا یکطرفه هم تا مدت زیادی راه ارتباط ما با کامپیوتر ها بود تا اینکه مدل های بزرگ زبانی با این مقاله از گوگل که در اون یکی از مدل های اون رو برای اولین بار توضیح میده مورد توجه قرار گرفت. اما بعد ها زمانی این موضوع به این اندازه مورد توجه عام قرار گرفت که مردم تونستن قابلیت های Chat-GPT رو از نزدیک لمس کنن و تصور کنن که چقدر این ایده میتونه بزرگ،دقیق و شگفت آور باشه. Chat-GPT که بر مبنای مدل های Transformers ساخته شده میتونست به سوال های ساده تا پیچیده پاسخ بده، متن هارو به درستی و با دقت ترجمه کنه،صحبت های قبلی رو به خاطر بسپره، شعر بگه و بسیار از قابلیت های دیگه. بعد از اون شرکت های دیگه مثل فیسبوک و گوگل و مایکروسافت هم LLM های خودشون رو توسعه دادن و اون هارو ارائه کردن.
مدل های زبانی بزرگ هر روز به عنوان ویترینی از هوش مصنوعی برای عامه ی مردم، اونها رو هیجان زده میکنن و به کسایی که در این زمینه کار و تحصیل میکنن یادآوری میکنن که دیگه قرار نیست زمستونی برای هوش مصنوعی درکار باشه و آینده ی هوش مصنوعی درخشانه.
اما اگر بخوایم به طور کاملا ساده شده LLM هارو توضیح بدیم باید بگیم که اونها در واقع مدل هایی هستن که با ساختار های متفاوتی که دارن بر روی یک پایگاه داده ی بسیار عظیم آموزش داده میشن و یادمیگیرن که چطور متن رو بفهمن و اون رو بسازن. البته که توضیح دادن LLM ها کار این پست نیست و میتونید اینجا (برای افراد حرفه ای)، اینجا (برای افراد مبتدی) بیشتر در موردش مطالعه کنید و یادبگیرید.
اما از اونجایی که اینجا همه چیز رنگ و بوی پزشکی داره، در مورد استفاده های این تکنولوژی در علم پزشکی و سلامت صحبت میکنیم.
شکل بالا که از این مقاله گرفته شده به خوبی یک دید کلی از LLM در پزشکی رو ارائه میکنه. در ابتدا باید بدونیم که حداقل فعلا ترجیح براینه که از LLM های اختصاصی در حوزه ی پزشکی استفاده بشه، چراکه اونها نیاز به نظارت بیشتری دارن تا از بی ضرر بودن اونها مطمئن باشیم و هم مطمئن باشیم که با اطلاعات درستی آموزش دیده تا سایر اطلاعات نادرست به تصمیم گیری اونها جهت نده. اما حوزه هایی که LLM میتونه در اونها به پزشکی کمک کنه تقریبا همه ی جنبه های اون رو شامل میشه که در پایین به چنتا از اونها رو دقیقتر توضیح میدم؛
مراقبت از بیمار علاوه بر تصمیمات و استدلال بالینی پزشک به ارتباط موثر با بیمار بستگی داره و زبان اساسا پایه ی این ارتباطه. وقتی پزشک یا کادر درمان بربالای سر مریض حاضر میشه از احوالات اون میپرسه و مریض با زبان به اون پاسخ میده. LLM ها با دانشی که از زبان دارن میتونن اون اطلاعات رو از گفتار به متن تبدیل کنن، دسته بندی کنن، قسمت های مهم اون که باید بهش بیشتر دقت کرد رو بولد کنن و یا حتی برای ارتباط موثر با پزشکی با یک زبان دیگه اون رو با دقت بالایی ترجمه کنن.
ابعاد و حجم علم و مقالاتی که در حوزه ی پزشکی وجود داره به شکل شگفت آوری زیاده و درک و دسترسی به همه ی ابعاد اون برای همه ی کارکنان سلامت غیر ممکنه. اما LLM ها این امکان رو دارن تا این اطلاعات رو به درستی خلاصه و دسته بندی کنن و برای هر گروهی از کارکنان سلامت قسمتی رو که بیشتر به اون نیاز دارن رو ارائه کنن. در این صورت دقت دانسته ها در همه ی افراد افزایش پیدا میکنه و دسترسی به اطلاعاتی که دسته بندی مناسب تری دارن راحتتر از قبل میشه.
اگر همین الان از Chat-GPT بخواید که برای شما مقاله ای در مورد تاثیر LLM ها در دینای پزشکی بنویسه شاید به موضوعاتی اشاره کنه که من نتونستم در زمان محدودتری که دارم در مورد اونها مطالعه کنم. این قدرت LLM ها وقتی به کمک سلامت میاد که بتونه روش ها و مسیرهای جدیدی رو از کنار هم گذاشتن مسیرهای قبلی ایجاد کنه که هرکدوم میتونن دروازه ی جدیدی در نگاه ما به یک بیماری یا یک دارو باشن. همچنین قدرت LLM ها در برنامه نویسی هم باعث شده تا بشه اونها رو در تکنولوژي های سلامت دیجیتال و هوش مصنوعی در سلامت استفاده کرد و محصولات جدیدی رو سریعتر و دقیقتر ساخت.
البته مثل همیشه باید درنظر داشت که برای به کارگیری LLM ها در حوزه ی پزشکی به مسائل اخلاقی و کمبود های اونها هم توجه کرد چراکه دیتای نادرست و یا مدل اشتباه میتونه باعث سوگیری بشه و یا اطلاعات غلط رو به کاربر ارائه کنه. حتی با توجه به اینکه هنوز بسیاری از LLM ها با پایگاه داده های قدیمی آموزش داده میشن و اطلاعات جدیدتر رو نمیدونن، همواره این ریسک وجود داره که در تصمیم گیری اشتباه کنن.