Ehsan Rajabi
Ehsan Rajabi
خواندن ۳ دقیقه·۵ سال پیش

Google با درک متن زبان 10 درصد از نتایج جستجوی خود را بهبود بخشید

این تغییر کمک خواهد کرد گوگل هدف کامل یک جستار را درک کند. پیش از این، الگوریتم های این شرکت توجه کمتر به کلمات خاص، مانند حروف اضافه داشتند.

جستجوگر گوگل در حال به روز رسانی است و وعده داده که به وسیله آن کیفیت نتایج جستجو افزایش پیدا خواهد کرد.

این بهبود کمک خواهد کرد گوگل جستارهایی(queries) که حاوی زبان محاوره، و استفاده از حروف اضافه مانند "for" و "to" است را درک کند، که به طور قابل توجهی می تواند معنای یک جمله را تغییر دهد. همچنین به گوگل کمک خواهد کرد که قصد پشت جستار هایی با گرامر نادرست را استنباط کند.

این پیشرفت تنها 10 درصد از جستجوی در ایالات متحده با زبان انگلیسی را تحت تأثیر خود قرار می دهد. با این وجود ، Pandu Nayak معاون رئیس گوگل آن را "بزرگترین جهش رو به جلو در پنج سال گذشته" برای محبوب ترین موتور جستجوی جهان نامید.

وی در مقاله ای در وبلاگ جمعه نوشت: "با جدیدترین پیشرفت های تیم تحقیقاتی ما در زمینه دانش فهم زبان- که با یادگیری ماشین امکان پذیر شده است - ما در حال پیشرفت چشمگیر در نحوه درک جستارها هستیم."

در گذشته، گوگل در رمز گشایی از معنای کامل برخی عبارتها دچار سردرگمی می شد. به عنوان مثال"2019 brazil traveler to usa need a visa." شما هرگز به این صورت با یک انسان دیگر صحبت نمی کنید. اما مردم میتوانند در پایان وارد کردن جستار خود در گوگل به این طریق با تاکید بر کلمات کلیدی خواص امیدوار باشند که الگوریتمهای شرکت درک خواهند کرد.

متاسفانه ، این رویکرد همیشه مؤثر نیست. Nayak میگوید: "کلمه 'to' ارتباط آن با کلمات دیگر در جستار برای درک معنی از اهمیت ویژه ای برخوردار است". آن عبارت مربوط به یک برزیلی است که قصد دارد به ایالات متحده سفر کند، و نه چیز دیگر. پیش از این ، الگوریتم های ما اهمیت این ارتباط را درک نمی کردند ، و ما نتایج مربوط به شهروندان آمریکایی را که به برزیل سفر می کردند بازمی گرداندیم.

مثال دیگر "can you get medicine for someone pharmacy"(منظور اینکه آیا میتوان به جای شخص دیگری نسخه را گرفت) . کاربر در تلاش است تا بفهمد آیا شما می توانید نسخه ای را که برای شخص دیگری است مانند اعضای خانواده پر کنید(منظور از پر کردن نسخه عمل اندازه گیری دارو و قرار دادن دوز مناسب در بطری است که در داروخانه انجام میشود). اما در گذشته گوگل از عبارت "برای شخصی" غافل می شد و فقط با پر کردن یک نسخه پزشکی نتیجه عمومی را برمی گرداند.

بنابراین ، برای رفع مشکل، این شرکت یک مدل محاسبات پردازش زبان جدید به نام BERT را در خود گنجانده است ، که برای درک دقیق متن در مورد جملات طراحی شده است. Nayak میگوید که این کار را با پردازش کلمات نسبت به همه کلمات دیگر در یک جمله انجام می دهد ، "به جای یک به یک پشت سر هم".

در نتیجه ، موتور جستجوی Google باید در درک تفاوت های ظریف در مورد جستجوی شما هوشمندانه عمل کند. به عنوان مثال ، اگر "parking on a hill with no curb" را تایپ کنید ، موتور جستجو اکنون کلمات "no curb"("بدون محدودیت") را در اولویت قرار می دهد. ضمنا ، در جستجوی "math practice books for adults"("کتاب های تمرین ریاضی برای بزرگسالان") ، Google متوجه خواهد شد که کلمه "adult"("بزرگسال") بسیار حیاتی است و از بازگشت نتایج جستجوی مربوط به "young adults."("بزرگسالان جوان") خودداری می کند.

طبق گفته های Nayak، تکنولوژی BERT همچنین در زمینه جستجوی بهینه زبانهای دیگر از جمله کره ای ، هندی و پرتغالی کاربرد دارد. ولی هنوز هم انتظار نداشته باشید که بی عیب و نقص باشد.

او میگوید " حتی با BERT، ما همیشه درست برداشت نمی کنیم. اگر شما جستجو کنید 'what state is south of Nebraska,' (کدام ایالت جنوب نبراسکا است) بهترین حدس BERT جامعه ای است به نام 'South Nebraska'. او همچنین اضافه کرد: "درک زبان همچنان یک چالش است و همین حقیقت برای ادامه جستجو به ما انگیزه می بخشد."

منبع


googleBERTپردازش زبان
باید توی مغز، طرز فکر ریخت نه اطلاعات، اطلاعات در گوگل هست. یک برنامه نویس و دانشجوی ارشد هوش مصنوعی
شاید از این پست‌ها خوشتان بیاید