تا به حال در مورد الگوریتم BERT شنیدهاید؟
همین ابتدای امر میخواهم با یک مثال کار اصلی این الگوریتم را برای شما باز کنم. مدتی است شعری از حافظ ذهن مرا به خود درگیر کرده است. از تمام شعر تنها چند عبارت و مضمون در ذهنم است؛ غلام، تعلقات و رهایی. مضمون اصلی شعر هم رهایی انسان از تعلقات دنیوی است. حالا تصمیم گرفتم هرچه از شعر در ذهنم مانده را گوگل کنم تا بلکه به شعر اصلی برسم. پس عبارت زیر را در سرچباکس گوگل وارد کردم:
شعر غلام بندهی کسی هستم که از تعلقات جهان آزاد است چیست؟
گوگل خیلی باید باهوش باشد که از عبارتهای نامفهومی که در بالا نوشتهام منظور مرا بفهمد. حالا چه باور کنید و چه باور نکنید گوگل عزیز منظور مرا فهمید و در هزاران صفحهی وب گشت و گشت تا شعر را پیدا کرد. به عکس پایین نگاه کنید.
اولین لینکی که به من نشان داده تفسیر شعر است و در لینک دوم سراغ گنجور و شمارهی غزل رفته است. حالا حتما میپرسید گوگل چطور این کار را انجام داد؟ در بخش بعدی جوابش را پیدا خواهیم کرد.
این الگوریتم به موتور جستجوی گوگل کمک میکند تا با درک مفهومی از عبارات و جملات دست به جستجوی وب بزند. ملاک اصلی در این الگوریتم گفتار محاوره است. BERT از یک تکنیک یادگیری عمیق یا deep-learning برای پردازش اطلاعات استفاده میکنم. با این روش الگوریتم برت قدرت تحلیل و تفسیر و در نهایت درک محتوا را پیدا میکند. به نظر میرسد معرفی این الگوریتم گام بلندی در جهان افزایش و بهبود کیفیت عملکرد گوگل باشد. برت به دنیال افزایش کارایی و اعتبار در سرچ صوتی در گوگل است و تاکنون قدمهای موثری هم در این زمینه برداشته است.
الگوریتم برت ابتدا تنها به زبان انگلیسی مسلط بود اما یواش یواش تواناییهای زبانی خود را ارتقا داد و حالا به بیش از 70 زبان مختلف دنیا تسلط نسبی دارد. گرچه به صورت دقیقتر باید بگویم از بیش از 70 زبان در دنیا پشتیبانی میکند.
گوگل برای افزایش کیفیت در نتایج جستجو و به تبع افزایش رضایتمندی در کاربران خود الگوریتمهای مختلفی را معرفی و ارائه میکند. همچنین به صورت مداوم نسخههای بهروز شده از این الگوریتمها به صورت منظم طراحی میشوند. پیشتر به پنگوئن عزیز اما خشمگین پرداختم. بحث در مورد الگوریتمهای گوگل تمامی ندارد. به همین دلیل به سیاق قبل منابع مطالعاتی بیشتری را هم معرفی میکنم:
الگوریتمهای گوگل چه بود و چه شد؟
منابع انگلیسی:
ویکی پدیا (BERT (language model
سایت تو واردز دیتا ساینس State of the art language model for NLP