رسول کیوان پور | Rasool Kayvanpour
رسول کیوان پور | Rasool Kayvanpour
خواندن ۱۱ دقیقه·۵ ماه پیش

۱۲ برداشت از اسناد لو رفته الگوریتم رتبه‌بندی گوگل در سال ۲۰۲۴

12 برداشت از اسناد لو رفته گوگل
12 برداشت از اسناد لو رفته گوگل

اخیرا بیشتر از ۲۵۰۰ صفحه از مستندات مربوط به الگوریتم سرچ گوگل بصورت ناخواسته و در Github فاش شدند. یک متخصص سئو به نام عرفان عظیمی (Erfan Azimi) این اسناد را در تاریخ 5 می 2024 (16 اردیبشهت 1403) پیدا و بصورت ناشناس برای رند فیشکین (Rand Fishkin) مدیرعامل و هم‌بنیان‌گذار SparkToro ایمیل کرد.

مستندات فاش شده مربوط به Content Warehouse API است که احتمالا یکی از بخش‌های مرکزی سیستم رتبه‌بندی گوگل است. مستندات شامل 2596 ماژول و 14014 اتریبیوت یا فاکتور رتبه‌بندی است که برای اولین بار، اطلاعات ارزشمندی درباره معیارهای گوگل برای رتبه‌بندی وبسایت‌ها در نتایج جستجو را در اختیار متخصصین سئو و وبمسترها قرار می‌دهد.

خود گوگل صحت این اسناد را در تاریخ 29 می 2024 (9 خرداد 1403) تایید کرده هرچند سخنگوی گوگل (David Thompson) ادعا کرده اطلاعات قدیمی و ناقص هستند.

در این مطلب قرار است به زبان ساده و صریح، در مورد این اسناد لو رفته و مهم‌ترین اطلاعاتی که برای وبسمترها دارد، صحبت کنیم. پس تا انتهای مقاله با من همراه باشید.

اهمیت اطلاعات لو رفته‌ی الگوریتم سرچ گوگل

این نشت اطلاعات، با اختلاف بزرگترین اتفاقی است که در رابطه با سرچ گوگل افتاده و موارد مهمی را در اختیار متخصصین قرار می‌دهد:

  • تایید برخی دانسته‌ها و روش‌های قبلی: از جمله اهمیت محتوای باکیفیت، تاثیر بک‌لینک‌های معتبر و بهینه‌سازی برای UX بهتر.
  • فاکتورهای رتبه‌بندی جدید: از جمله siteAuthority، استفاده از دیتای مرورگر Chrome و استفاده از دیتای کلیک‌ها (Navboost) که قبل از این جزو فرضیه‌ها و افسانه‌های سئو محسوب می‌شدند.
  • ترسیم رودمپ برای فعالیت‌های سئو: با تاکید بر اهمیت متریک‌های مرتبط با تعامل کاربر (User Engagement)، تازگی محتوا (Content Freshness) و محتوای تولید شده توسط نویسنده متخصص (شاخص E-E-A-T در سئو).

12 برداشت اصلی از اسناد لو رفته گوگل

ابتدا باید به این نکته توجه کرد این مستندات تنها وجود این فاکتورها را نشان می‌دهد، نه وزن هر فاکتور و نحوه تاثیر آن. همچنین برخی فاکتورهای رتبه‌بندی ممکن است در مرحله آزمایش بوده، تنها در پروژه‌های داخلی گوگل استفاده شده و یا قدیمی و خارج از رده باشد. در ادامه برداشت‌های اصلی از این اسناد را با هم بررسی می‌کنیم.

برداشت اول- گوگل هیچ‌وقت راست نمی‌گوید!

برداشت اول و ناراحت‌کننده‌ترین برداشت از اطلاعات لو رفته: گوگل هیچ‌وقت راست نمی‌گوید! در واقع می‌توان گفت تمامی پاسخ‎هایی که توسط افراد مختلف در گوگل و در شبکه‌های اجتماعی مختلف بیان می‌شوند (از جمله توییت‌های جان مولر) قابل اعتماد نیستند و با احتمال 50/50 می‌توانند درست باشند!

از جمله مواردی که گوگل در مورد آن‌ها دروغ گفته:

  • کم‌ارزش بودن بک‌لینک‌ها
  • اهمیت نداشتن اعتبار دامنه (Site Authority)
  • نبود بک‌لینک‌های سمی (Toxic Backlinks)
  • نبود سندباکس (The Sandbox)

✅ چه باید کرد؟

بهترین کاری که می‌توان در شرایط فعلی کرد، استفاده از اطلاعات مختلف و اعتماد به تست و تجربیات بجای حدس و گمان است. از جمله اطلاعاتی که می‌توان در این مسیر استفاده کرد، همین اطلاعات لو رفته بعلاوه بررسی استراتژی‌های موفق رقیبان است.

برداشت دوم- کلیک‌ها کارسازند!

اسناد لو رفته نشان می‌دهد گوگل کلیک‌ها را دنبال و از آن به عنوان یک فاکتور رتبه‌بندی استفاده می‌کند. این کار از طریق یک ویژگی داخلی در الگوریتم سرچ به نام Navboost انجام می‌شود. Navboost یکی از مهمترین فاکتورهای رتبه‌بندی است و 84 بار در مستندات لو رفته به آن اشاره شده است.

اشاره به Navboost در اسناد لو رفته گوگل
اشاره به Navboost در اسناد لو رفته گوگل

گوگل با استفاده از ویژگی Navboost تعاملات کاربر را دنبال و به عنوانی سیگنالی برای رتبه‌بندی صفحات وب استفاده می‌کند. از جمله پارامترهای مرتبط با کلیک که دنبال می‌شوند badClicks و goodClicks و lastLongestClicks (آخرین نتیجه جستجویی که کاربر بیشترین زمان را در آن صفحه مانده). تاثیر کلیک در رتبه‌بندی صفحات پیشتر بارها توسط افراد مختلف در گوگل انکار شده بود. از جمله در متن زیر که توسط Gary Illyes یکی از تحلیلگران تیم جستجوی گوگل در پاسخ به یک کاربر نوشته شده:

پاسخ گری ایلیز و انکار تاثیر اطلاعات تعامل کاربر از جمله CTR و زمان ماندگاری در رتبه‌بندی
پاسخ گری ایلیز و انکار تاثیر اطلاعات تعامل کاربر از جمله CTR و زمان ماندگاری در رتبه‌بندی

علاوه بر اشاره در مستندات، Pandu Nayak مدیر ارشد بخش جستجوی گوگل در دادگاه "آنتی تراست" وزارت دادگستری آمریکا علیه گوگل که در سال 2023 برگزار شد، 54 بار به Navboost اشاره کرده است (منبع: Search Engine Land).

✅ چه باید کرد؟

  • توجه به استراتژی‌های CRO و بهینه‌سازی نرخ تبدیل برای افزایش کلیک‌های ارگانیک
  • استفاده بهینه از لینک‌سازی داخلی برای افزایش تعامل کاربران در سایت: چراکه نه تنها کلیک‌های ارگانیک، بلکه گوگل تمامی تعاملات کاربر داخل سایت را بررسی می‌کند و لینک‌سازی داخلی باعث افزایش تعامل و ماندگاری کاربر در سایت (از جمله افزایش click و time on page و pageview) می‌شود.

برداشت سوم- اهمیت بالای بک‌لینک‌ها (Backlink)

بک‌لینک‌ها یکی از فاکتورهای مهم در رتبه‌بندی صفحات هستند. تنوع (Diversity)، ارتباط (Relevance) و کیفیت (Quality) بک‌لینک‌ها مواردی هستند که در لینک‌سازی خارجی باید بدان توجه کرد.

همچنین در مستندات به PageRank هم اشاره شده که نشان می‌دهد هنوز هم جزوی از الگوریتم‌ بوده و در رتبه‌بندی اثرگذار است. برای صفحات جدید، PageRank صفحه اصلی سایت در نظر گرفته می‌شود؛ تا زمانی‌که صفحه بتواند PageRank خودش را بگیرد.

✅ چه باید کرد؟

  • بک‌لینک‌های باکیفیت بالا و مرتبط بسازید.
  • از پیلار-کلاسترینگ محتوا و محتوای بنیادی (Cornerstone) غافل نشوید تا احتمال لینک دادن به شما توسط کاربران افزایش یابد.

برداشت چهارم- محتوا هنوز پادشاه است!

اهمیت محتوای باکیفیت بر کسی پوشیده نیست، اما به 2 فاکتور به طور خاص در اسناد اشاره شده:

  • تازگی محتوا (Content Freshness)

گوگل به تازگی محتوا اهمیت می‌دهد و محتوای آپدیت شده و با اطلاعات به‌روز رتبه بالاتری در نتایج جستجو می‌گیرد. گوگل از روش‌های مختلفی برای ارزیابی تاریخ محتوا استفاده می‌کند از جمله تاریخ‌های تخمینی (bylineDate)، تاریخ URL یا (syntacticDate) و تاریخ ‌های داخل محتوا (semanticDate).

اشاره به تازگی محتوا (Content Freshness) در مستندات لو رفته گوگل
اشاره به تازگی محتوا (Content Freshness) در مستندات لو رفته گوگل
  • شاخص E-E-A-T

شاخص E-A-T از سال 2018 و نسخه بروزشده آن یعنی E-E-A-T از سال 2022 وارد فاکتورهای رتبه‌بندی شدند. E-E-A-T مخفف چهار واژه «تجربه، تخصص، اعتبار و اعتماد» است. بر اساس اطلاعات لو رفته، گوگل تاکید ویژه‌ای روی تجربه (Experience)، متخصص بودن (Expertise) و اعتبار (Authoritativeness) نویسنده دارد.

✅ چه باید کرد؟

  • بهینه‌سازی محتوا: منظور از بهینه‌سازی محتوا، رعایت تمامی اصول و قواعد سئوی On-page با در نظر گرفتن نیاز کاربر است، از جمله هدف جستجوی کاربر (Search intent) و لینک‌سازی داخلی.
  • آپدیت محتوا: بهتر است محتوای صفحات به صورت منظم آپدیت شود. همچنین موقع آپدیت تمامی تاریخ‌های مرتبط با تازگی محتوا نیز باید تغییر کند (از جمله در کدهای اسکیما و سایت‌مپ)
  • توجه به شاخص E-E-A-T: نویسنده محتوا برای گوگل بسیار مهم است. در نتیجه باید به سئوی نویسنده (Author SEO) توجه ویژه‌ای کرد و از نویسنده‌های متخصص با اعتبار بالا و ارجاعات متعدد در سطح وب استفاده کرد.

برداشت پنجم- اطلاعات مرورگر کروم، نقش مهمی در رتبه‌بندی دارد!

علیرغم انکار قبلی، گوگل از دیتای رفتار کاربران در مرورگر کروم برای بررسی تجربه جستجو (Search Experience) و رتبه‌بندی صفحات استفاده می‌کند. این کار توسط ماژول ChromeInTotal انجام می‌شود. در واقع مبدا ترافیک ورودی، رفتار کاربران داخل سایت و مقصد بعدی کاربر پس از خروج از سایت می‌تواند در رتبه‌بندی صفحات تاثیر داشته باشد. بدین معنی که اگر کاربر بلافاصله از سایت خارج شده، وارد صفحه دیگری در نتایج جستجو شده و زمان بیشتری را در آن صفحه بگذراند، احتمالا آن صفحه نسبت به صفحه سایت شما رتبه بالاتری خواهد داشت.

اشاره به دیتای مرورگر کروم به عنوان فاکتور رتبه‌بندی در اسناد لو رفته گوگل
اشاره به دیتای مرورگر کروم به عنوان فاکتور رتبه‌بندی در اسناد لو رفته گوگل

✅ چه باید کرد؟

رفتار کاربر داخل سایت، نحوه تعامل کاربر در صفحات سایت و نحوه خروج کاربر را با استفاده از ابزارهایی مثل Hotjar یا Microsoft Clarity بررسی و تحلیل کنید. بر اساس این دیتا می‌توان فهمید کاربر داخل سایت ما به دنبال چه می‌گردد تا پاسخ متناسب را برای کاربر فراهم کرده و درصد خروج سریع کاربران از سایت را کمتر کرد. همچنین باید تجربه کاربری (UX) بهتری را در سایت ایجاد کرد؛ از طریق بهینه‌سازی عملکرد، سرعت، خوانایی و غیره.

برداشت ششم- مراقب تنزل رتبه باشید!

برخی عوامل ممکن است باعث افت رتبه و تنزل الگوریتمی (Algorithmic Demotions) شوند، از جمله:

  • Anchor Mismatch: انکر تکست با لینک مقصد همخوانی نداشته باشد. این اهمیت مرتبط بودن انکرتکست با محتوای سایت مقصد را نشان می‌دهد.
  • SERP demotion: نارضایتی کاربر از یک نتیجه جستجو در SERP
  • دامنه‌های دارای کیووردهای Exact Match (دامنه‌هایی که نام آن‌ها دقیقا با کوئری‌های غیر برند یا Non-branded یکی است، مثل mens-luxury-watches.com)
  • Nav demotion: صفحاتی که نویگیشن خوبی ندارند یا مشکلات ‌UX دارند.
  • Product review demotion: محصولاتی که نظرات و بررسی‌های خوبی نگرفته یا اصلا نظر نگرفته‌اند.
  • Location demotion: صفحاتی که محلی (Local) نیستند و جهانی (Global or super global) هستند.

برداشت هفتم- کت تن ارزیاب‌های گوگل است!

تاثیر ارزیاب‌های گوگل (Quality Raters) در رتبه‌بندی نتایج جستجو
تاثیر ارزیاب‌های گوگل (Quality Raters) در رتبه‌بندی نتایج جستجو

تاثیر Quality raterهای گوگل که وظیفه ارزیابی نتایج جستجو را برعهده دارند، دست کم گرفته شده! آن‌ها موظف‌اند بر اساس دستورالعملی که گوگل در اختیارشان می‌گذارد (Search Quality Evaluator Guidelines 2024)، نتایج جستجو را بررسی و کیفیت محتوای صفحات را امتیازدهی کنند. نظرات آن‌ها به گوگل کمک می‌کند به طور پیوسته نتایج جستجو را بهینه کند.

به عنوان مثال ارزیاب‌ها می‌توانند برخی صفحات را به عنوان Golden Document تشخیص دهند که نسبت به ارزیابی الگوریتمی (automatically labeled annotations) وزن بالاتری داشته و باعث می‌شود صفحه رتبه بالایی در نتایج جستجو بگیرد.

✅ چه باید کرد؟

محتوایی تولید کنید که از نظر Quality raterها کیفیت بالایی داشته باشد. یکی از شاخص‌هایی که حتما باید به آن توجه کنید، شاخص E-E-A-T است. برای آشنایی کامل با معیارهای بررسی کیفیت محتوا می‌توانید دستورالعمل گوگل را مطالعه کنید.

برداشت هشتم- اعتبار سایت مهم است!

برای مدت طولانی، گوگل وجود پارامتری برای بررسی اعتبار سایت یا دامنه مثل Domain Authority یا Site Authority را انکار می‌کرد، برای مثال در توییت زیر توسط Gary Illyes:

توییت گری ایلیز و انکار وجود از Domain authority (سال 2016)
توییت گری ایلیز و انکار وجود از Domain authority (سال 2016)

درحالیکه در اسناد به طور صریح به یک پارامتر به نام siteAuthority اشاره شده که امتیازی برای رتبه‌بندی سایت‌هاست.

اشاره به siteAuthority در مستندات لو رفته گوگل
اشاره به siteAuthority در مستندات لو رفته گوگل

✅ چه باید کرد؟

نحوه محاسبه دقیق siteAuthority مشخص نیست اما مشخصا موارد زیر بر آن تاثیر دارند:

  • برند قوی و برند-منشن‌های زیاد
  • بک‌لینک‌های باکیفیت و مرتبط
  • پیلار-کلاسترینگ محتوا

برداشت نهم- افسانه سندباکس واقعی است!

فرضیه‌ای وجود داشت که سایت‌های جدید مدت زمانی را وارد Sandbox می‌شوند تا گوگل از اسپم نبودن و معتبر بودن آن‌ها مطمئن شود و این حضور در سندباکس باعث محدودیت‌هایی برای این سایت‌ها می‌شود. البته این فرضیه بارها توسط تیم گوگل رد شده بود (برای مثال تصویر توییت جان مولر John Mueller در سال ۲۰۱۹):

توییت جان مولر و انکار وجود سندباکس (سال 2019)
توییت جان مولر و انکار وجود سندباکس (سال 2019)

علیرغم اینکه گوگل بارها سندباکس را انکار کرده بود، در مستندات به hostAge و sandbox اشاره شده که برای اعمال محدودیت برای سایت‌های جدید به کار می‌‎رود تا زمانی که معتبر بودن آن‌ها مشخص شود.

اشاره به hostAge در اسناد لو رفته گوگل (که مهر تاییدی بر وجود Sandbox است)
اشاره به hostAge در اسناد لو رفته گوگل (که مهر تاییدی بر وجود Sandbox است)

✅ چه باید کرد؟

سایت‌های جدید توسط Sandbox مانیتور و محدود می‌شوند. برای خروج زودتر از سندباکس و رفع محدودیت‌ها، موارد زیر بهتر است انجام شود:

  • افزایش امتیاز شاخص E-E-A-T
  • تولید محتوای با کیفیت و کاربرپسند
  • استفاده از کانال‌هایی غیر از سرچ ارگانیک برای جذب ترافیک به سایت (از جمله شبکه‌های اجتماعی، ایمیل، پوش نوتیفیکیشن وب و اپلیکیشن)

بیشتر بخوانید: بهینه‌سازی اپ استور چیست؟

برداشت دهم- تایتل صفحه مهم است!

گوگل از ویژگی به نام titlematchScore استفاده می‌کند که نشان‌دهنده میزان مرتبط بودن تایتل صفحه یا SEO title به کوئری کاربر است. همچنین فاکتوری در مورد طول تایتل و تعداد کاراکترهای آن در مستندات وجود ندارد و تایتل‌های با کاراکترهای بالا، نکته منفی از نظر گوگل محسوب نمی‌شود!

✅ چه باید کرد؟

از تایتل مرتبط و به دردبخور برای کاربر در صفحات استفاده کنید. بهتر است کلمات کلیدی در ابتدای تایتل استفاده شود تا هرچه بیشتر به کوئری مرتبط شود.

بعلاوه طول تایتل هرچه بیشتر باشد (حتی بیشتر از 50-60 کاراکتر) محدودیتی ایجاد نمی‌کند و ممکن است باعث گرفتن رتبه بالاتر شود، هرچند احتمالا CTR را کاهش می‌دهد.

برداشت یازدهم- گوگل برای مواقع حساس وایت‌لیست دارد!

برخی سایت‌های معتبر که محتوای مرتبط با کرونا (COVID) و انتخابات (Election) تولید می‌کنند، وارد Whitelist گوگل می‌شوند. این سایت‌ها با فاکتورهای isElectionAuthority و isCovidLocalAuthority مشخص می‌شوند و گوگل با وایت‌لیست کردن آن‌ها، کمک می‌کند رتبه بالاتری بگیرند تا محتوا از منابع درست به دست مخاطب برسد.

وجود وایت‌لیست گوگل برای محتواهای مرتبط با کووید و انتخابات
وجود وایت‌لیست گوگل برای محتواهای مرتبط با کووید و انتخابات

✅ چه باید کرد؟

اگر در حوزه‌های حساس و YMYL فعالیت می‌کنید (موضوعاتی که به طور مستقیم یا غیر مستقیم می‌توانند روی سلامت، وضعیت مالی و امنیت افراد و یا رفاه و سلامت جامعه اثر داشته باشند مثل محتوای مربوط به نحوه سرمایه‌گذاری، توصیه‌های پزشکی و …) حتما محتوای قابل اطمینان، دقیق و درست منتشر کنید.

برداشت دوازدهم- سایت‌ها و بلاگ‌های شخصی، مشمول یاری سبز یا دچار سنگ‌اندازی می‌شوند!

به یک فاکتور به نام smallPersonalSite در اسناد اشاره شده؛ البته توضیح بیشتری در مورد آن داده نشده است. احتمالا اگر یک سایت یا بلاگ شخصی توسط این ویژگی شناسایی شود، مشمول یاری سبز و رشد انفجاری یا سنگ‌اندازی و تنزل الگوریتمی خواهد شد.

✅ چه باید کرد؟

اگر سایت یا بلاگ شخصی دارید، با رعایت اصول سئو شروع به تولید محتوای باکیفیت کنید. در کنار توجه به قوانین سئو، توجه به نیاز کاربر و تولید محتوای باکیفیت، دعا کنید که بخاطر نشان شدن توسط smallPersonalSite اذیت نشوید!

اگر سوال یا ابهامی در مورد مطالب گفته شده دارید، این زیر کامنت کنید👇

منابع:

  1. https://aioseo.com/google-search-algorithm-leak/
  2. https://ipullrank.com/google-algo-leak
  3. https://sparktoro.com/blog/an-anonymous-source-shared-thousands-of-leaked-google-search-api-documents-with-me-everyone-in-seo-should-see-them/
  4. https://searchengineland.com/google-search-document-leak-ranking-442617
  5. https://sheknowsseo.co/google-search-algorithm-leak/
  6. https://www.theverge.com/2024/5/29/24167407/google-search-algorithm-documents-leak-confirmation
  7. https://searchengineland.com/google-responds-to-leak-documentation-lacks-context-442705
  8. https://searchengineland.com/google-search-antirust-trial-hearing-updates-431977
  9. https://developers.google.com/search/blog/2023/11/search-quality-rater-guidelines-update

اگر از این محتوا خوشتون اومد، لطفا و حتما صفحه من در ویرگول رو دنبال کنید. مرسی :)

سئوسئو سایتدیجیتال مارکتینگمارکتینگبازاریابی دیجیتال
دیجیتال مارکتر و متخصص سئو | مشاور دیجیتال مارکتینگ (Kayvanpour.ir)
شاید از این پست‌ها خوشتان بیاید