اخیرا بیشتر از ۲۵۰۰ صفحه از مستندات مربوط به الگوریتم سرچ گوگل بصورت ناخواسته و در Github فاش شدند. یک متخصص سئو به نام عرفان عظیمی (Erfan Azimi) این اسناد را در تاریخ 5 می 2024 (16 اردیبشهت 1403) پیدا و بصورت ناشناس برای رند فیشکین (Rand Fishkin) مدیرعامل و همبنیانگذار SparkToro ایمیل کرد.
مستندات فاش شده مربوط به Content Warehouse API است که احتمالا یکی از بخشهای مرکزی سیستم رتبهبندی گوگل است. مستندات شامل 2596 ماژول و 14014 اتریبیوت یا فاکتور رتبهبندی است که برای اولین بار، اطلاعات ارزشمندی درباره معیارهای گوگل برای رتبهبندی وبسایتها در نتایج جستجو را در اختیار متخصصین سئو و وبمسترها قرار میدهد.
خود گوگل صحت این اسناد را در تاریخ 29 می 2024 (9 خرداد 1403) تایید کرده هرچند سخنگوی گوگل (David Thompson) ادعا کرده اطلاعات قدیمی و ناقص هستند.
در این مطلب قرار است به زبان ساده و صریح، در مورد این اسناد لو رفته و مهمترین اطلاعاتی که برای وبسمترها دارد، صحبت کنیم. پس تا انتهای مقاله با من همراه باشید.
این نشت اطلاعات، با اختلاف بزرگترین اتفاقی است که در رابطه با سرچ گوگل افتاده و موارد مهمی را در اختیار متخصصین قرار میدهد:
ابتدا باید به این نکته توجه کرد این مستندات تنها وجود این فاکتورها را نشان میدهد، نه وزن هر فاکتور و نحوه تاثیر آن. همچنین برخی فاکتورهای رتبهبندی ممکن است در مرحله آزمایش بوده، تنها در پروژههای داخلی گوگل استفاده شده و یا قدیمی و خارج از رده باشد. در ادامه برداشتهای اصلی از این اسناد را با هم بررسی میکنیم.
برداشت اول و ناراحتکنندهترین برداشت از اطلاعات لو رفته: گوگل هیچوقت راست نمیگوید! در واقع میتوان گفت تمامی پاسخهایی که توسط افراد مختلف در گوگل و در شبکههای اجتماعی مختلف بیان میشوند (از جمله توییتهای جان مولر) قابل اعتماد نیستند و با احتمال 50/50 میتوانند درست باشند!
از جمله مواردی که گوگل در مورد آنها دروغ گفته:
✅ چه باید کرد؟
بهترین کاری که میتوان در شرایط فعلی کرد، استفاده از اطلاعات مختلف و اعتماد به تست و تجربیات بجای حدس و گمان است. از جمله اطلاعاتی که میتوان در این مسیر استفاده کرد، همین اطلاعات لو رفته بعلاوه بررسی استراتژیهای موفق رقیبان است.
اسناد لو رفته نشان میدهد گوگل کلیکها را دنبال و از آن به عنوان یک فاکتور رتبهبندی استفاده میکند. این کار از طریق یک ویژگی داخلی در الگوریتم سرچ به نام Navboost انجام میشود. Navboost یکی از مهمترین فاکتورهای رتبهبندی است و 84 بار در مستندات لو رفته به آن اشاره شده است.
گوگل با استفاده از ویژگی Navboost تعاملات کاربر را دنبال و به عنوانی سیگنالی برای رتبهبندی صفحات وب استفاده میکند. از جمله پارامترهای مرتبط با کلیک که دنبال میشوند badClicks و goodClicks و lastLongestClicks (آخرین نتیجه جستجویی که کاربر بیشترین زمان را در آن صفحه مانده). تاثیر کلیک در رتبهبندی صفحات پیشتر بارها توسط افراد مختلف در گوگل انکار شده بود. از جمله در متن زیر که توسط Gary Illyes یکی از تحلیلگران تیم جستجوی گوگل در پاسخ به یک کاربر نوشته شده:
علاوه بر اشاره در مستندات، Pandu Nayak مدیر ارشد بخش جستجوی گوگل در دادگاه "آنتی تراست" وزارت دادگستری آمریکا علیه گوگل که در سال 2023 برگزار شد، 54 بار به Navboost اشاره کرده است (منبع: Search Engine Land).
✅ چه باید کرد؟
بکلینکها یکی از فاکتورهای مهم در رتبهبندی صفحات هستند. تنوع (Diversity)، ارتباط (Relevance) و کیفیت (Quality) بکلینکها مواردی هستند که در لینکسازی خارجی باید بدان توجه کرد.
همچنین در مستندات به PageRank هم اشاره شده که نشان میدهد هنوز هم جزوی از الگوریتم بوده و در رتبهبندی اثرگذار است. برای صفحات جدید، PageRank صفحه اصلی سایت در نظر گرفته میشود؛ تا زمانیکه صفحه بتواند PageRank خودش را بگیرد.
✅ چه باید کرد؟
اهمیت محتوای باکیفیت بر کسی پوشیده نیست، اما به 2 فاکتور به طور خاص در اسناد اشاره شده:
گوگل به تازگی محتوا اهمیت میدهد و محتوای آپدیت شده و با اطلاعات بهروز رتبه بالاتری در نتایج جستجو میگیرد. گوگل از روشهای مختلفی برای ارزیابی تاریخ محتوا استفاده میکند از جمله تاریخهای تخمینی (bylineDate)، تاریخ URL یا (syntacticDate) و تاریخ های داخل محتوا (semanticDate).
شاخص E-A-T از سال 2018 و نسخه بروزشده آن یعنی E-E-A-T از سال 2022 وارد فاکتورهای رتبهبندی شدند. E-E-A-T مخفف چهار واژه «تجربه، تخصص، اعتبار و اعتماد» است. بر اساس اطلاعات لو رفته، گوگل تاکید ویژهای روی تجربه (Experience)، متخصص بودن (Expertise) و اعتبار (Authoritativeness) نویسنده دارد.
✅ چه باید کرد؟
علیرغم انکار قبلی، گوگل از دیتای رفتار کاربران در مرورگر کروم برای بررسی تجربه جستجو (Search Experience) و رتبهبندی صفحات استفاده میکند. این کار توسط ماژول ChromeInTotal انجام میشود. در واقع مبدا ترافیک ورودی، رفتار کاربران داخل سایت و مقصد بعدی کاربر پس از خروج از سایت میتواند در رتبهبندی صفحات تاثیر داشته باشد. بدین معنی که اگر کاربر بلافاصله از سایت خارج شده، وارد صفحه دیگری در نتایج جستجو شده و زمان بیشتری را در آن صفحه بگذراند، احتمالا آن صفحه نسبت به صفحه سایت شما رتبه بالاتری خواهد داشت.
✅ چه باید کرد؟
رفتار کاربر داخل سایت، نحوه تعامل کاربر در صفحات سایت و نحوه خروج کاربر را با استفاده از ابزارهایی مثل Hotjar یا Microsoft Clarity بررسی و تحلیل کنید. بر اساس این دیتا میتوان فهمید کاربر داخل سایت ما به دنبال چه میگردد تا پاسخ متناسب را برای کاربر فراهم کرده و درصد خروج سریع کاربران از سایت را کمتر کرد. همچنین باید تجربه کاربری (UX) بهتری را در سایت ایجاد کرد؛ از طریق بهینهسازی عملکرد، سرعت، خوانایی و غیره.
برخی عوامل ممکن است باعث افت رتبه و تنزل الگوریتمی (Algorithmic Demotions) شوند، از جمله:
تاثیر Quality raterهای گوگل که وظیفه ارزیابی نتایج جستجو را برعهده دارند، دست کم گرفته شده! آنها موظفاند بر اساس دستورالعملی که گوگل در اختیارشان میگذارد (Search Quality Evaluator Guidelines 2024)، نتایج جستجو را بررسی و کیفیت محتوای صفحات را امتیازدهی کنند. نظرات آنها به گوگل کمک میکند به طور پیوسته نتایج جستجو را بهینه کند.
به عنوان مثال ارزیابها میتوانند برخی صفحات را به عنوان Golden Document تشخیص دهند که نسبت به ارزیابی الگوریتمی (automatically labeled annotations) وزن بالاتری داشته و باعث میشود صفحه رتبه بالایی در نتایج جستجو بگیرد.
✅ چه باید کرد؟
محتوایی تولید کنید که از نظر Quality raterها کیفیت بالایی داشته باشد. یکی از شاخصهایی که حتما باید به آن توجه کنید، شاخص E-E-A-T است. برای آشنایی کامل با معیارهای بررسی کیفیت محتوا میتوانید دستورالعمل گوگل را مطالعه کنید.
برای مدت طولانی، گوگل وجود پارامتری برای بررسی اعتبار سایت یا دامنه مثل Domain Authority یا Site Authority را انکار میکرد، برای مثال در توییت زیر توسط Gary Illyes:
درحالیکه در اسناد به طور صریح به یک پارامتر به نام siteAuthority اشاره شده که امتیازی برای رتبهبندی سایتهاست.
✅ چه باید کرد؟
نحوه محاسبه دقیق siteAuthority مشخص نیست اما مشخصا موارد زیر بر آن تاثیر دارند:
فرضیهای وجود داشت که سایتهای جدید مدت زمانی را وارد Sandbox میشوند تا گوگل از اسپم نبودن و معتبر بودن آنها مطمئن شود و این حضور در سندباکس باعث محدودیتهایی برای این سایتها میشود. البته این فرضیه بارها توسط تیم گوگل رد شده بود (برای مثال تصویر توییت جان مولر John Mueller در سال ۲۰۱۹):
علیرغم اینکه گوگل بارها سندباکس را انکار کرده بود، در مستندات به hostAge و sandbox اشاره شده که برای اعمال محدودیت برای سایتهای جدید به کار میرود تا زمانی که معتبر بودن آنها مشخص شود.
✅ چه باید کرد؟
سایتهای جدید توسط Sandbox مانیتور و محدود میشوند. برای خروج زودتر از سندباکس و رفع محدودیتها، موارد زیر بهتر است انجام شود:
بیشتر بخوانید: بهینهسازی اپ استور چیست؟
گوگل از ویژگی به نام titlematchScore استفاده میکند که نشاندهنده میزان مرتبط بودن تایتل صفحه یا SEO title به کوئری کاربر است. همچنین فاکتوری در مورد طول تایتل و تعداد کاراکترهای آن در مستندات وجود ندارد و تایتلهای با کاراکترهای بالا، نکته منفی از نظر گوگل محسوب نمیشود!
✅ چه باید کرد؟
از تایتل مرتبط و به دردبخور برای کاربر در صفحات استفاده کنید. بهتر است کلمات کلیدی در ابتدای تایتل استفاده شود تا هرچه بیشتر به کوئری مرتبط شود.
بعلاوه طول تایتل هرچه بیشتر باشد (حتی بیشتر از 50-60 کاراکتر) محدودیتی ایجاد نمیکند و ممکن است باعث گرفتن رتبه بالاتر شود، هرچند احتمالا CTR را کاهش میدهد.
برخی سایتهای معتبر که محتوای مرتبط با کرونا (COVID) و انتخابات (Election) تولید میکنند، وارد Whitelist گوگل میشوند. این سایتها با فاکتورهای isElectionAuthority و isCovidLocalAuthority مشخص میشوند و گوگل با وایتلیست کردن آنها، کمک میکند رتبه بالاتری بگیرند تا محتوا از منابع درست به دست مخاطب برسد.
✅ چه باید کرد؟
اگر در حوزههای حساس و YMYL فعالیت میکنید (موضوعاتی که به طور مستقیم یا غیر مستقیم میتوانند روی سلامت، وضعیت مالی و امنیت افراد و یا رفاه و سلامت جامعه اثر داشته باشند مثل محتوای مربوط به نحوه سرمایهگذاری، توصیههای پزشکی و …) حتما محتوای قابل اطمینان، دقیق و درست منتشر کنید.
به یک فاکتور به نام smallPersonalSite در اسناد اشاره شده؛ البته توضیح بیشتری در مورد آن داده نشده است. احتمالا اگر یک سایت یا بلاگ شخصی توسط این ویژگی شناسایی شود، مشمول یاری سبز و رشد انفجاری یا سنگاندازی و تنزل الگوریتمی خواهد شد.
✅ چه باید کرد؟
اگر سایت یا بلاگ شخصی دارید، با رعایت اصول سئو شروع به تولید محتوای باکیفیت کنید. در کنار توجه به قوانین سئو، توجه به نیاز کاربر و تولید محتوای باکیفیت، دعا کنید که بخاطر نشان شدن توسط smallPersonalSite اذیت نشوید!
اگر سوال یا ابهامی در مورد مطالب گفته شده دارید، این زیر کامنت کنید👇
منابع:
اگر از این محتوا خوشتون اومد، لطفا و حتما صفحه من در ویرگول رو دنبال کنید. مرسی :)