علیرضا شیراوند
علیرضا شیراوند
خواندن ۶ دقیقه·۴ سال پیش

پسیج رنکینگ (passage ranking) - بازگشایی رمز و رازهای گوگل

الگوریتم پسیج رنکینگ (passage ranking) - پسیج ایندکس (passage indexing)
الگوریتم پسیج رنکینگ (passage ranking) - پسیج ایندکس (passage indexing)


گوگل اعلام کرد که پسیج رنکینگ (passage ranking ) می تونه روی ۷٪ از کوئری های جستجو شده تاثیر گذار باشه . (زهی خیال باطل ) چرا؟ اگر یادتون باشه در سال ۲۰۱۹ الگوریتم BERT معرفی شد که به گفته گوگل قرار بود حدود ۱۰ درصد از کوئری ها رو در زبان انگلیسی تحت تاثیر قرار بده ، ولی الان تقریبا روی ۹۹٪ کوئری ها اثر گذاشته حتی در زبان فارسی !!!!

پس متوجه میشیم که احتمالا تغییرات بزرگی در راهه ، مخصوصا برای سئوکارهای ایرانی که میخان پروژه های دلاری بگیرن و بعدها برای بقیه دوستان ، وقتی که زبان فارسی هم پشتیبانی بشه.

اسم الگوریتم BERT اومد و فکر می کردیم که بزرگترین الگوریتمه و بعد ازین احتمالا به این زودیا اتفاق خاصی نخواهد افتاد ولی خب باز گوگل مارو غافل گیر کرد و در سال ۲۰۲۰ و الان در ۲۰۲۱ با core update ها به ما یاداوری می کنه که رییس کیه :)
یکم راجع به BERT بخوانیم :

https://www.searchenginejournal.com/bert-explained-what-you-need-to-know-about-googles-new-algorithm/337247/




الگوریتم پسیج رنکینگ چیست؟

طبق الگوریتم های قبلی که کلی مطلب برای مطالعه راجع بهشون هست ، موتور جستجو متوجه می شد که کانسپت اصلی و محتوای یک صفحه راجع به چه موضوع (کلمه کلیدی !!!) هستش، بعد شروع می کرد به رنک دادن و رتبه بندی اونها. تا اینجا رو که قطعا هر SEO کاری می دونه . در پسیج رنکینگ موتور جستجو متوجه میشه که هر پاراگراف (قطعه محتوا) داره راجع به چه موضوعی صحبت می کنه و چه اطلاعاتی به خواننده ارائه می شه. چرا این تصمیم گرفته شده ؟ ۲ تا دلیل اصلی می تونه داشته باشه (اگه بعد از خوندن این مطلب دلیل دیگری پیدا کردید ، اطلاع بدین تا اضافه کنم.)

۱- در مطلب های بلند ممکنه کاربر نتونه جواب سوالشو کامل پیدا کنه و در اصطلاح چیزی که دنبالشه لای خرواری از نوشته گم بشه.

۲- یک سری از intent های کاربران ممکنه بسیار جزئی باشه و کاربر دقیقا دنبال یه سوال به خصوص باشه ، اینطوری موتور جستجو هم می تونه جواب دقیق تری بهش پیشنهاد بده و سایت هایی که دقیق تر جواب سوال کاربر رو دادند رو در رتبه بالاتر نشون بده.

الان ممکنه سوال پیش بیاد که آیا به ایندکس مرتبطه این مسئله ؟‌

خیر

چون اسپایدرمن رو دوست دارم :)
چون اسپایدرمن رو دوست دارم :)

گوگل با استفاده از الگوریتم های هوش مصنوعی (AI) یا دقیق تر بخوام بگم با استفاده از الگوریتم پردازش زبان طبیعی (NLP) داره درک خودش رو در محتواها عمیق تر می کنه و نهایتا به این سمت میریم که دیگه کاربر قرار نباشه روی لینک شما کلیک بکنه و همه چی رو توی صفحه خودش نشون بده . (در فاز اول اگر intent کاربر informational باشه.) نمونه ی زیر می تونه کمک کنه به درک این مسئله:

سمت راست After سمت چپ Before :) حال کردید چقدر اطلاعات دادم
سمت راست After سمت چپ Before :) حال کردید چقدر اطلاعات دادم

گوگل در ابتدا عنوان کرد که اسم این آپدیتی که ارائه کردند passage indexing هستش ، بعدها عنوان شد که ربطی به indexing نداره و اسمشو گذاشتن passage Ranking که به نظر منطقی تره.

تولیدکنندگان محتوا سئوکار ها باید چکار کنند؟

گوگل به صورت رسمی اعلام کرده که passage index یا همین الگوریتمی که داریم راجع بهش صحبت می کنیم، جایگزین page indexing نخواهد شد و تنها می خاد که هر بخش از محتوا رو بهتر بفهمه (تضمینی نیست کلا ! شاید جایگزین کنه :| ) پس

در کل اگه بخوام شفاف بگم ، هیچ کاری نیست که بکنیم .... ولی یه سری نکات خدمتتون می گم که احتمالا از خیلیا شنیدید ولی خب ...

  • ۱- اگر دارید راجع به مسئله ای صحبت می کنید لطفا دقیق و شفاف مسئله رو موشکافی کنین و برای تولید محتوا وقت بذارین ، اینطوری نباشه که خب skyscraper بنویسیم و آخرشم سرو ته مقاله بلاگیتون مشخص نباشه
  • ۲- ساختار سایتتون رو طبق best practice های گفته شده بهینه سازی کنید

خب اگر تصویر بالا رو یکبار دیگه نگاه کنید متوجه میشیم که عه !! چقدر شبیه featured snippet ها هست

فیچر اسنیپت در مقابل passage ranking :


خب این تنها یک نمایشی از جوابی هستش که گوگل به کوئری می ده ، طبق میزان قرابت معنایی و مفهومی که کاربر جستجو کرده و با featured snippet ها متفاوته. حتی ممکنه که موضوع اصلی صفحه مقداری با کوئری متفاوت باشه ولی توی اون پاراگراف نگارنده محتوا ، یک اسپین آف زده باشه و این کارش باعث شده باشه که شما به جواب سوالتون در این محتوا برسید.

یک سوال جالبی که مطرح میشه اینه که ایا این نتیجه جواب در خود صفحه گوگل برای جستجوی صوتی (voice search ) هستن ؟ جوابی که دادند از نظر من منطقی نیست ولی خب چیزی که گفتند رو می گم.

فرمایش کردند که featured snippet ها برای جستجوی صوتی هستند و passage ranking برای کاربردهای دیگره که اصلا identifier متفاوتی هست.

https://twitter.com/dannysullivan/status/1319000322698694656?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1319000322698694656%7Ctwgr%5E%7Ctwcon%5Es1_c10&ref_url=https%3A%2F%2Fwww.stanventures.com%2Fblog%2Fpassage-indexing-algorithm%2F

ولی من می گم که قطعا برای جستجوی صوتی هست و بهینه سازی خواهد شد.

پسیج رنکینگ چطور کار می کنه؟

یک نکته ی جالب راجع به گوگل این بوده که هیچوقت دقیق نمی گه الگوریتم ها چطور کار می کنند و تنها چندتا نکته برای بهینه سازی طبق این الگوریتم ها ارائه می کنه. کلیت اینه که کرالرها صفحه رو ایندکس می کنند و گوگل الان متوجه میشه که هر پاراگراف یا قطعه محتوا راجع به چه چیزی و چه جزئیاتی داره صحبت می کنه. پس انتظار داریم محتواهای طولانی که محتوا رو به بخش های کوچک تر تقسیم بندی کردند واطلاعات مفیدی ارائه کردند ، ترافیک بیشتری دریافت کنند و تجربه دلپذیری از این الگوریتم داشته باشند.

به نظر میرسه که passage indexing یک مرحله پا رو از RankBrain پیش تر گذاشته تا محتوا رو بتونه بهتر درک کنه. اسم RankBrain اومد و راجع بهش می خونیم :

https://moz.com/learn/seo/google-rankbrain

نمی خام زیاد راجع به یادگیری ماشین صحبت کنم ولی خب در رنک برین یه سری سیگنال از هر وبسایت دریافت می شد که بهش می گفتن ranking parameter و یک شبکه عصبی (سیستم خبره یا همون موتور جستجو) تصمیم میگرفت که کدوم سایت برای این کوئری مناسب تره. یعنی کوئری دریافت می شد، به بخش های مختلف شکسته می شد + intent شما می شد و نتایج رو برای شما نشون می داد. در این اپدیت مفهوم string به entity تغییر کرد یعنی دیگه واژه ها اهمیت نداشتن و اشیاع + intent کاربر مهم تر بودند.

شما جستجو می کردی "خرید پیتزا" براتون از روی نقشه لیست رستوران ها رو میاورد در ذیل اون سایت هایی که خدمات سفارش پیتزا ارائه می کردند و ....

الان چه اتفاقی افتاده ؟ یکم باید راجع به NLP توضیح بدم :

https://cloud.google.com/natural-language

این صفحه یک demo از اینکه چطور گوگل پاراگراف (نوشته) ها رو آنالیز می کنه داره. جمله زیر رو در نظر بگیرید:

Google, headquartered in Mountain View (1600 Amphitheatre Pkwy, Mountain View, CA 940430), unveiled the new Android phone for $799 at the Consumer Electronic Show. Sundar Pichai said in his keynote that users love their new Android phones.

جمله یا پاراگراف به زیر مفاهیمی که در NLP مورد استفاده قرار میگیره شکسته میشه مثل:
(اشیا)Entities

Sentiment(احساسات)

Syntax(نوشتار)

Categories(دسته بندی)

در بخش اشیا

مشاهده می کنید که تونسته درک کنه هر عبارت به چه شیئی اشاره داره

در بخش احساسات

در این بخش الگوریتم سعی می کنه که بفهمه پاراگراف گفته شده جنبه مثبت بیشتری داره یا جنبه منفی ، همونطوری که از پاراگراف مشخصه این بنده خدا گفته که ملت گوشی های اندروید رو دوست دارن و امتیاز نوشته 0.5 شده و در ناحیه سبز قرار داره

در بخش syntax

الگوریتم داره تلاش می کنه که بفهمه هر بخش جمله در گراف جمله سازی چه نقشی داره و چقدر در معنای عبارت تغییر ایجاد می کنه

مثال خرید بلیط هواپیما از تهران به مشهد :) پس قبلا هم این رو دیده بودید ولی ممکنه نمی دونستید از کجاس.

کتگوری:

همونطوری که واضحه داره می گه این پاراگراف راجع به چه حوزه ای داره صحبت می کنه که واضحا راجع به موبایل و اشیائ بی سیم هستش


جمع بندی :


در این مطلب سعی شد ریز و درشت الگوریتم و تئوری های مدنظر گفته بشه . اگر دوستش داشتید به اشتراک بذارید. نظراتتون رو می خونم و سعی می کنم جواب بدم.در مورد NLP در یه نوشته توضیحات تکمیلی رو میدم. ممنونم از همراهیتون











سئوseogooglenlp
توسعه دهنده frontend و SEO manager
شاید از این پست‌ها خوشتان بیاید