گوگل اعلام کرد که پسیج رنکینگ (passage ranking ) می تونه روی ۷٪ از کوئری های جستجو شده تاثیر گذار باشه . (زهی خیال باطل ) چرا؟ اگر یادتون باشه در سال ۲۰۱۹ الگوریتم BERT معرفی شد که به گفته گوگل قرار بود حدود ۱۰ درصد از کوئری ها رو در زبان انگلیسی تحت تاثیر قرار بده ، ولی الان تقریبا روی ۹۹٪ کوئری ها اثر گذاشته حتی در زبان فارسی !!!!
پس متوجه میشیم که احتمالا تغییرات بزرگی در راهه ، مخصوصا برای سئوکارهای ایرانی که میخان پروژه های دلاری بگیرن و بعدها برای بقیه دوستان ، وقتی که زبان فارسی هم پشتیبانی بشه.
اسم الگوریتم BERT اومد و فکر می کردیم که بزرگترین الگوریتمه و بعد ازین احتمالا به این زودیا اتفاق خاصی نخواهد افتاد ولی خب باز گوگل مارو غافل گیر کرد و در سال ۲۰۲۰ و الان در ۲۰۲۱ با core update ها به ما یاداوری می کنه که رییس کیه :)
یکم راجع به BERT بخوانیم :
طبق الگوریتم های قبلی که کلی مطلب برای مطالعه راجع بهشون هست ، موتور جستجو متوجه می شد که کانسپت اصلی و محتوای یک صفحه راجع به چه موضوع (کلمه کلیدی !!!) هستش، بعد شروع می کرد به رنک دادن و رتبه بندی اونها. تا اینجا رو که قطعا هر SEO کاری می دونه . در پسیج رنکینگ موتور جستجو متوجه میشه که هر پاراگراف (قطعه محتوا) داره راجع به چه موضوعی صحبت می کنه و چه اطلاعاتی به خواننده ارائه می شه. چرا این تصمیم گرفته شده ؟ ۲ تا دلیل اصلی می تونه داشته باشه (اگه بعد از خوندن این مطلب دلیل دیگری پیدا کردید ، اطلاع بدین تا اضافه کنم.)
۱- در مطلب های بلند ممکنه کاربر نتونه جواب سوالشو کامل پیدا کنه و در اصطلاح چیزی که دنبالشه لای خرواری از نوشته گم بشه.
۲- یک سری از intent های کاربران ممکنه بسیار جزئی باشه و کاربر دقیقا دنبال یه سوال به خصوص باشه ، اینطوری موتور جستجو هم می تونه جواب دقیق تری بهش پیشنهاد بده و سایت هایی که دقیق تر جواب سوال کاربر رو دادند رو در رتبه بالاتر نشون بده.
خیر
گوگل با استفاده از الگوریتم های هوش مصنوعی (AI) یا دقیق تر بخوام بگم با استفاده از الگوریتم پردازش زبان طبیعی (NLP) داره درک خودش رو در محتواها عمیق تر می کنه و نهایتا به این سمت میریم که دیگه کاربر قرار نباشه روی لینک شما کلیک بکنه و همه چی رو توی صفحه خودش نشون بده . (در فاز اول اگر intent کاربر informational باشه.) نمونه ی زیر می تونه کمک کنه به درک این مسئله:
گوگل در ابتدا عنوان کرد که اسم این آپدیتی که ارائه کردند passage indexing هستش ، بعدها عنوان شد که ربطی به indexing نداره و اسمشو گذاشتن passage Ranking که به نظر منطقی تره.
گوگل به صورت رسمی اعلام کرده که passage index یا همین الگوریتمی که داریم راجع بهش صحبت می کنیم، جایگزین page indexing نخواهد شد و تنها می خاد که هر بخش از محتوا رو بهتر بفهمه (تضمینی نیست کلا ! شاید جایگزین کنه :| ) پس
در کل اگه بخوام شفاف بگم ، هیچ کاری نیست که بکنیم .... ولی یه سری نکات خدمتتون می گم که احتمالا از خیلیا شنیدید ولی خب ...
خب اگر تصویر بالا رو یکبار دیگه نگاه کنید متوجه میشیم که عه !! چقدر شبیه featured snippet ها هست
خب این تنها یک نمایشی از جوابی هستش که گوگل به کوئری می ده ، طبق میزان قرابت معنایی و مفهومی که کاربر جستجو کرده و با featured snippet ها متفاوته. حتی ممکنه که موضوع اصلی صفحه مقداری با کوئری متفاوت باشه ولی توی اون پاراگراف نگارنده محتوا ، یک اسپین آف زده باشه و این کارش باعث شده باشه که شما به جواب سوالتون در این محتوا برسید.
یک سوال جالبی که مطرح میشه اینه که ایا این نتیجه جواب در خود صفحه گوگل برای جستجوی صوتی (voice search ) هستن ؟ جوابی که دادند از نظر من منطقی نیست ولی خب چیزی که گفتند رو می گم.
فرمایش کردند که featured snippet ها برای جستجوی صوتی هستند و passage ranking برای کاربردهای دیگره که اصلا identifier متفاوتی هست.
ولی من می گم که قطعا برای جستجوی صوتی هست و بهینه سازی خواهد شد.
یک نکته ی جالب راجع به گوگل این بوده که هیچوقت دقیق نمی گه الگوریتم ها چطور کار می کنند و تنها چندتا نکته برای بهینه سازی طبق این الگوریتم ها ارائه می کنه. کلیت اینه که کرالرها صفحه رو ایندکس می کنند و گوگل الان متوجه میشه که هر پاراگراف یا قطعه محتوا راجع به چه چیزی و چه جزئیاتی داره صحبت می کنه. پس انتظار داریم محتواهای طولانی که محتوا رو به بخش های کوچک تر تقسیم بندی کردند واطلاعات مفیدی ارائه کردند ، ترافیک بیشتری دریافت کنند و تجربه دلپذیری از این الگوریتم داشته باشند.
به نظر میرسه که passage indexing یک مرحله پا رو از RankBrain پیش تر گذاشته تا محتوا رو بتونه بهتر درک کنه. اسم RankBrain اومد و راجع بهش می خونیم :
نمی خام زیاد راجع به یادگیری ماشین صحبت کنم ولی خب در رنک برین یه سری سیگنال از هر وبسایت دریافت می شد که بهش می گفتن ranking parameter و یک شبکه عصبی (سیستم خبره یا همون موتور جستجو) تصمیم میگرفت که کدوم سایت برای این کوئری مناسب تره. یعنی کوئری دریافت می شد، به بخش های مختلف شکسته می شد + intent شما می شد و نتایج رو برای شما نشون می داد. در این اپدیت مفهوم string به entity تغییر کرد یعنی دیگه واژه ها اهمیت نداشتن و اشیاع + intent کاربر مهم تر بودند.
شما جستجو می کردی "خرید پیتزا" براتون از روی نقشه لیست رستوران ها رو میاورد در ذیل اون سایت هایی که خدمات سفارش پیتزا ارائه می کردند و ....
این صفحه یک demo از اینکه چطور گوگل پاراگراف (نوشته) ها رو آنالیز می کنه داره. جمله زیر رو در نظر بگیرید:
Google, headquartered in Mountain View (1600 Amphitheatre Pkwy, Mountain View, CA 940430), unveiled the new Android phone for $799 at the Consumer Electronic Show. Sundar Pichai said in his keynote that users love their new Android phones.
جمله یا پاراگراف به زیر مفاهیمی که در NLP مورد استفاده قرار میگیره شکسته میشه مثل:
(اشیا)Entities
Sentiment(احساسات)
Syntax(نوشتار)
Categories(دسته بندی)
مشاهده می کنید که تونسته درک کنه هر عبارت به چه شیئی اشاره داره
در این بخش الگوریتم سعی می کنه که بفهمه پاراگراف گفته شده جنبه مثبت بیشتری داره یا جنبه منفی ، همونطوری که از پاراگراف مشخصه این بنده خدا گفته که ملت گوشی های اندروید رو دوست دارن و امتیاز نوشته 0.5 شده و در ناحیه سبز قرار داره
الگوریتم داره تلاش می کنه که بفهمه هر بخش جمله در گراف جمله سازی چه نقشی داره و چقدر در معنای عبارت تغییر ایجاد می کنه
مثال خرید بلیط هواپیما از تهران به مشهد :) پس قبلا هم این رو دیده بودید ولی ممکنه نمی دونستید از کجاس.
همونطوری که واضحه داره می گه این پاراگراف راجع به چه حوزه ای داره صحبت می کنه که واضحا راجع به موبایل و اشیائ بی سیم هستش
در این مطلب سعی شد ریز و درشت الگوریتم و تئوری های مدنظر گفته بشه . اگر دوستش داشتید به اشتراک بذارید. نظراتتون رو می خونم و سعی می کنم جواب بدم.در مورد NLP در یه نوشته توضیحات تکمیلی رو میدم. ممنونم از همراهیتون