
در ادبیات فنی گوگل، هر سیگنال رتبهبندی باید بتواند «رفتار واقعی کاربر» را بهزبان عددی ترجمه کند. پتنت US9031929B1 دقیقاً با همین رویکرد، مفهومی بهنام Site Quality Score را معرفی میکند؛ امتیازی که از نسبت میان دو دسته کوئری ساخته میگردد: جستجوهایی که مستقیماً به یک سایت ارجاع میدهند و جستجوهایی که آن سایت در آنها بهعنوان نتیجهای مرتبط انتخاب میشود. محور ما در این مقاله، توضیح شفاف همین نسبت، منطق تعدیل آن برای کاهش نویز و نحوهی تعریف «سایت» در سطوح دامنه، زیردامنه یا زیرشاخه است.
در ادامه، میبینید این امتیاز چگونه بهعنوان یک «ترم» وارد مدل رتبهبندی میشود و چرا پارامترهایی مانند آستانه (T)، کندسازی رشد مخرج (n) و افزوده پایه (B) برای پایدارسازی محاسبه ضروریاند. هدف، ارائهی تفسیری منسجم و کاملاً متکی بر متن پتنت است تا بتوانید منطق پشت Site Quality Score را (از تعریف و فرمول تا اثر سایتواید آن) بهصورت عملی و دقیق دنبال کنید.
پتنت US9031929B1 یک ایدهی روشن را رسمی میکند: گوگل میتواند برای یک سایت، امتیاز کیفیت کلی محاسبه کند و آن را بهعنوان یک ترم به مدل رتبهبندی صفحات همان سایت وارد کند. وقتی میگوییم «سایت»، این مفهوم هم میتواند در سطح یک دامنه باشد، هم یک زیردامنه و حتی یک پوشهی مشخص داخل دامنه. بنابراین گوگل مجاز است کیفیت را در مقیاسهای مختلف تعریف کند و سپس همان سطح را مبنای اعمال سیگنال قرار دهد. نکتهی کلیدی این است که Site Quality Score بر تجربه و رفتار کاربران در مواجهه با نتایج جستجو تکیه میکند؛ یعنی همان جایی که جستجو به انتخاب ختم میشود و انتخاب به سیگنال تبدیل میگردد.
در این دیدگاه، کیفیت سایت فقط با شمارش خام نمایش نتایج یا حضور در نتایج سنجیده نمیشود. محور ارزیابی، نسبت بین دو گروه کوئری است: دستهای که مستقیماً به سایت ارجاع میدهند و دستهای که سایت برایشان مرتبط تشخیص داده شده و کاربر یکی از نتایج آن سایت را انتخاب کرده است. به زبان ساده، این امتیاز عقبنشینی میکند تا ببیند چند بار مردم نام شما را میجویند و چند بار هم در جستجوهای مرتبط، واقعاً شما را انتخاب میکنند. از نگاه پتنت، همین نسبت، صورت فشردهای از اعتماد و ارتباط است.
متغیر S شمار کوئریهایی است که به سایت ارجاع میدهند. این همان الگوی جستجوهایی میباشد که کاربر در آن مستقیماً بهدنبال یک سایت یا برند میگردد؛ نمونهی ملموسش وارد کردن نام ویکیپدیا در کادر جستجو است. وقتی چنین کوئریهایی زیاد باشند، معنایش این است که آگاهی و تمایل برای رسیدن به همان مقصد مشخص وجود دارد. این خود نوعی رأی اعتماد است که از بیرون میآید و گوگل آن را میبیند.
متغیر U شمار کوئریهایی است که سایت برای آنها مرتبط بوده و کاربر یکی از نتایج آن سایت را انتخاب کرده است. مرتبط بودن در اینجا یعنی سایت برای آن عبارت در نتایج دیده شده و علاوه بر دیده شدن، حداقل یک «انتخاب کاربر» روی یکی از نتایج آن سایت اتفاق افتاده است. پتنت عمداً «انتخاب» را معیار گذاشته تا از تورم مصنوعی عدد بر اثر صرفاً نمایش نتایج جلوگیری کند. به این ترتیب، U نشان میدهد که سایت در میدان واقعی رقابت، در برابر گزینههای دیگر، چقدر توانسته انتخاب شود. بنابراین U نشانهای از ارتباط محتوایی و پاسخگویی عملی به نیت جستجو است.
فرمول پایه ساده است: Site Quality Score برابر است با S تقسیم بر U. هرچه سهمِ کوئریهای ارجاعی نسبت به کوئریهای مرتبطِ انتخابشده بیشتر باشد، امتیاز بالاتر میرود. این نسبت بهصورت مستقیم از رفتار کاربران برمیآید و با فرضِ برابر بودنِ دیگر شرایط، سایتی که افراد بیشتری مستقیماً بهدنبالش میگردند و در عین حال در جستجوهای مرتبط نیز انتخابش میکنند، در مقایسه با سایتی که چنین الگوی رفتاری را ندارد، امتیاز بالاتری میگیرد.
اگر این نسبت را روی یک محور زمانی ببینیم، رشد S ــ یعنی رشد جستجوهای مستقیم برای سایت ــ معمولاً بازتابی از آگاهی و اعتماد کاربر است. از طرف دیگر، اندازهی U که بر پایهی انتخاب واقعی در نتایج است، انعکاسی از کیفیت پاسخدهی محتوا به نیازهای جستجو و همچنین جذابیت نتیجه برای کلیک است. در ترکیب این دو، اگر S با سرعتی معقولتر از U رشد کند، نسبت بهبود مییابد؛ اگر U خیلی بزرگ شود ولی S ثابت بماند، نسبت کاهش پیدا میکند. بنابراین این نسبت بهصورت ذاتی میان آگاهی از برند و عملکرد واقعی در نتایج تعادل برقرار میکند.
دادههای جستجو یکدست و بینویز نیستند. یک سایت کوچک ممکن است چند جستجوی مستقیم پراکنده داشته باشد که اگر خام وارد نسبت شوند، تصویری غیرواقعی از کیفیت بدهند. یا در طرف مقابل، یک سایت بسیار پرترافیک ممکن است با موجی از کوئریهای مرتبط روبهرو شود و مخرج نسبت به شکل نامتناسبی بزرگ شود. برای کنترل این ناهمگنیها، پتنت چند شیوهی تعدیل پیشنهاد میکند تا نسبت S به U پایداری بیشتری پیدا کند.
اولین ایده، تعریف یک آستانه برای صورت است. به این معنا که بخشی از S که کمتر از یک حد مشخص میباشد از محاسبه کنار گذاشته شود یا بهتر بگوییم اثرش صفر گردد. با اینکار، چند جستجوی مستقیم خیلی کمتعداد که ممکن است تصادفی یا ناپایدار باشند، نسبت را باد نمیکنند. آستانهی T میتواند مقادیر کوچکی مثل ۲، ۳، ۵ یا بزرگتر مثل ۱۰ و ۲۰ داشته باشد. انتخاب این مقدار به زمینه و حساسیت نسبت بستگی دارد. هرچه T بزرگتر باشد، سیستم محافظهکارتر میشود و سختتر اجازه میدهد صورت نسبت از حالت صفر خارج شود.
ایدهی دوم، کند کردن رشد مخرج است. وقتی تعداد کوئریهای مرتبط خیلی زیاد میشود، اگر همان مقدار را بدون تغییر در مخرج بنشانیم، نسبت ممکن است به صورتی غیرمنطقی کوچک گردد و اثر صورت دیده نشود. برای همین پتنت پیشنهاد میکند مخرج به توان n برسد؛ عددی بین صفر و یک. نتیجه این است که وقتی U خیلی بزرگ است، بهجای رشد خطی، رشدش آرامتر میشود و نسبت فرصت پیدا میکند بر رفتارهای معنادار در صورت تأکید کند. مقدار n میتواند ۰٫۵ یا ۰٫۶ یا ۰٫۷ باشد و بسته به بافت و نویز داده قابل تنظیم است. این دمپینگ در واقع ترم یا مؤلفه اطمینانی است تا یک انفجار مقیاس در مخرج، سیگنال را خفه نکند.
ایدهی سوم، افزودن یک بایاس پایه به مخرج میباشد. وقتی داده کم است، نسبتها بهشدت نوسان میکنند. برای جلوگیری از این جهشهای ناگهانی، در مخرج یک مقدار ثابت مثبت افزوده میشود. اندازهی این بایاس میتواند ۱ یا ۲ یا بزرگتر باشد. نقش آن این است که در شروع کار و حجم دادههای پایین، نسبت از «صفر و یک پریدن»های ناگهانی در امان بماند. از منظر تفسیر، این بایاس یک لنگر است تا نسبت در مراحل اولیه، رفتاری عصبی نشان ندهد.
در کنار این سه ایده، پتنت اشاره میکند که ممکن است یک حد پایین برای صورت نیز در نظر گرفته شود تا حتی پس از کم کردن آستانه، مقدار صورت منفی نشود و حداقل به صفر برسد. این همان پارامتر L است. با اینکار، از نظر محاسباتی نسبت در محدودههای مجاز نگه داشته میشود و امکان بههمریختگی عددی کاهش مییابد.
نکتهی مهم این است که هیچکدام از این پارامترها جهانی و ثابت تعریف نشدهاند. پتنت صراحت دارد که مقادیر براساس تجربه و با توجه به کیفیت داده در کاربرد مشخص تعیین میشوند. این سیاست اجازه میدهد سیستم در حوزههای مختلف جستجو، برای زبانها، صنایع و مقیاسهای گوناگون، رفتاری همساز با واقعیت داده از خود نشان دهد.
برای اینکه یک کوئری در شمار U بنشیند، کافی نیست که نتیجهی سایت صرفاً دیده شود. باید یک «انتخاب» رخ دهد. این انتخاب در تفسیر قابلپذیرش پتنت همان کلیک است، اما میتواند با آستانههایی مثل حداقل مدت کلیک یا مشابه آن تعریف شود تا کلیکهای غلطانداز و آنی اثر نگذارند. مفهوم انتخاب از این نظر مهم است که هم کیفیت ارائهی نتیجه در خود موتور جستجو و هم کیفیت مقصد پس از کلیک را به شکلی تلویحی لحاظ میکند. اگر کاربر بارها در نتایج سایت را ببیند اما آن را انتخاب نکند، کوئریهای مربوطه به سادگی در U نقش ندارند و نسبت بالا نمیرود.
این تأکید بر انتخاب باعث میشود مدل از دام نمایش زیاد بیفایده عبور کند و به رفتار معنادار بچسبد. از دید تحلیل سئو، این یادآور آن است که کیفیت ارائهی نتیجه و جذابیت آن برای انتخاب، از خود نمایش جداست. بنابراین مدل با همین شرط ساده، از شمارش خام نمایشها به سمت دادههای رفتاری معتبرتر حرکت میکند.
پتنت اجازه میدهد که «سایت» را در چند سطح تعریف کنیم. دامنه سطحی است که بیشترین آشنایی را با آن داریم. زیردامنهها نیز در عمل نقش سایتهای جداگانه را بازی میکنند و طبیعی است که کیفیتشان جداگانه ارزیابی شود. گاهی هم یک زیرشاخهی ساختارمند، مثلاً example.com/docs، هویت محتوایی مستقل دارد. وقتی سیستم «سایت» را در این سطح تعریف کند، Site Quality Score همانجا محاسبه میگردد و همانجا هم به رتبهبندی تزریق میشود.
این انعطاف چند پیامد روشن دارد. اگر یک زیردامنهی تخصصی دارید که کاربران بهطور مستقیم آن را میجویند و در کوئریهای مرتبط هم آن را زیاد انتخاب میکنند، این واحد میتواند Site Quality Score اختصاصی خود را داشته باشد؛ بدون آنکه کیفیت یک بخش ضعیفتر در جای دیگری، آن را رقیق کند. عکسش هم برقرار است. اگر یک بخش زیرشاخهای کیفیت رفتاری نسبتاً پایینتری دارد، مدل میتواند آن را جداگانه ارزیابی کند و اثر نامطلوبش را محدودتر نگه دارد. در مجموع این طراحی به سیستم کمک مینماید تا کیفیت را نزدیک به جایی که تولید میشود بسنجد و همانجا اثر دهد.
در چارچوب پتنت، Site Quality Score بهعنوان یک ترم وارد مدل رتبهبندی میشود. به عبارت دیگر، صفحات متعلق به همان سایت، علاوه بر سیگنالهای معمولی که دارند، وزن یا بایاسی از جنس کیفیت سایت دریافت میکنند. نتیجهی چنین چیزی این است که تغییر در Site Quality Score میتواند روی طیف گستردهای از صفحات تأثیر بگذارد. اگر این امتیاز بالا باشد، صفحات سایت بهطور کلی در وضع بهتری قرار میگیرند؛ اگر پایین باشد، برعکس.
وقتی اثر در سطح سایت اعمال میشود، طبعاً موضوع پایداری طرح اهمیت پیدا میکند. به همین دلیل است که پتنت روی تعدیلکنندههای نسبت تأکید میکند. سیگنالی که قرار است هزاران صفحه را به بالا یا پایین سوق دهد، باید در برابر نویز مقاوم باشد. اضافه کردن آستانه، دمپینگ (کندسازی رشد مخرج) و بایاس پایه (جزء ثابت پایه) دقیقاً برای همین است که سیگنال، قابلاتکا و قابلدفاع شود.
اگر در همان چارچوب پتنت بمانیم، خوانش عملی این است که رفتار کاربران در دو جبهه، امتیاز کیفیت را شکل میدهد. از یکسو جستجوهایی که مستقیماً نام سایت را میبرند و به آن میرسند. از سوی دیگر جستجوهایی که سایت در آنها بهعنوان پاسخ مرتبط ظاهر میشود و انتخاب میگیرد. رشد بخش اول نشانهی زنده بودن نام و اعتماد قبلی کاربران است و رشد بخش دوم نشانهی پاسخگویی واقعی در میدان رقابت. نسبت S به U میخواهد این دو را نسبی کند تا سیگنال همزمان نسبت به آگاهی و نسبت به عملکرد حساس باشد.
همین نگاه در توضیح تعدیلکنندهها نیز صادق است. اگر چند جستجوی مستقیم پراکنده اتفاق بیفتد، آستانه اجازه نمیدهد نسبت به «اشتباه مثبت» آلوده شود. اگر حجم کوئریهای مرتبط خیلی بزرگ باشد، دمپینگ رشد مخرج اجازه نمیدهد سیگنال خفه شود. اگر داده کم باشد، بایاس پایه مانع از جهشهای تصادفی میشود و همهی اینها با مقادیر تجربی و بسته به زمینهی داده قابل تنظیم هستند.
فرض کنید در یک بازهی زمانی، برای یک زیردامنهی مشخص، ۴۰ کوئری ارجاعی ثبت شده و ۲۰۰ کوئری مرتبط با انتخاب کاربر وجود دارد. نسبت پایه ۴۰ تقسیم بر ۲۰۰ یعنی ۰٫۲ است. حالا اگر T را ۵ بگیریم، صورت پس از آستانه ۳۵ میشود و نسبت ۰٫۱۷۵. اگر در طرف مقابل U را با n برابر ۰٫۷ تعدیل کنیم، مخرج بهصورت ۲۰۰ به توان ۰٫۷ حدوداً ۳۰ میشود و نسبت به ۳۵ تقسیم بر ۳۰ یعنی حدود ۱٫۱۶ تغییر میکند. این نشان میدهد که وقتی موج بزرگی از کوئریهای مرتبط داریم، اعمال دمپینگ میتواند فرصت دهد صورت دیده شود.
اگر هم دادهها خیلی کم باشند، فرض کنیم S برابر ۳ و U برابر ۴ است، با افزودن بایاس B برابر ۱۰ در مخرج، نسبت از ۳ تقسیم بر ۴ به ۳ تقسیم بر ۱۴ تبدیل میشود و ناگهان به ۰٫۲۱ کاهش پیدا میکند. این همان پایداری مورد نظر پتنت است تا در دادههای کم، نسبت بیش از حد بزرگ جلوه نکند.
این مثالهای ساده فقط برای شهود هستند و ارزششان در نشان دادن جهت اثر پارامترهاست. خود پتنت هیچ مقدار جهانی برای T یا n یا B تجویز نمیکند و تأکیدش روی تنظیم تجربی مطابق با کاربرد است.
اگر محاسبه را از سطح دامنه به زیردامنه ببریم، ترکیب S و U تغییر میکند. در یک دامنهی بزرگ، جستجوهای ارجاعی شاید به نام کل دامنه انجام شوند و در سطح زیردامنهها پراکندگی داشته باشند. برعکس، یک زیردامنهی تخصصی میتواند حجم قابلتوجهی از جستجوهای ارجاعی خاص خود را داشته باشد. در این حالت، Site Quality Score در سطح زیردامنه تصویری دقیقتر از کیفیت همان واحد میدهد. اگر سیستم تصمیم بگیرد یک زیرشاخهی مشخص را بهعنوان «سایت» تعریف کند، ترکیب S و U باز هم عوض میشود و تمرکز از کل دامنه روی همان مسیر خاص میرود. به این ترتیب، ارزیابی میتواند هم تفکیکپذیر باشد و هم منصفانهتر.
در عمل، اگر یک پوشهی مستندات یا یک بخش آموزشی دارید که کاربران نامش را جداگانه جستجو میکنند و در جستجوهای مرتبط هم زیاد انتخاب میشود، پیادهسازی محاسبه در سطح همان پوشه، تصویر واقعیتری میدهد و اثرش هم در رتبهبندی همان بخش اعمال میشود. این ویژگی به مهندسی کیفیت در مقیاسهای مختلف کمک میکند.
اگر «نمایش» را بهتنهایی حساب کنیم، سایتی که در نتایج زیاد ظاهر میشود، ممکن است با تورم مصنوعی بهعنوان یک سایت بهظاهر موفق دیده شود. در حالی که موفقیت در عمل با «انتخاب کاربر» سنجیده میگردد. شرط انتخاب باعث میشود فقط جایی که کاربر دست به انتخاب زده وارد محاسبهی U شود. این انتخاب همان برخورد واقعی کاربر با صفحهی نتایج است. کاربری که در یک عبارت عمومی روی نتیجهی شما کلیک میکند، در برابر چندین گزینهی دیگر، شما را برگزیده است. بنابراین وقتی این انتخاب تکرار میشود، سیگنال معناداری نسبت به ارتباط محتوا و کیفیت ارائه شکل میگیرد.
این شرط همچنین فاصلهای امن از بازیهای نمایشی ایجاد میکند. اگر در نتایج زیاد دیده شوید اما انتخاب نشوید، U رشد نمیکند و نسبت دستنخوردنی میماند. در نتیجه Site Quality Score متناسب با رفتار واقعی کاربر حرکت میکند.
وقتی یک سیگنال قرار است بهصورت سایتواید اثر بگذارد، باید نسبت به تغییرات کوچک، واکنشهای کنترلشده داشته باشد. به همین دلیل است که پتنت سه اهرم پایداری را کنار نسبت گذاشته است. آستانه اجازه میدهد صورت نسبت با قدمی مطمئن از صفر جدا شود. دمپینگ یا کندسازی رشد مخرج، اثر موجهای بزرگ کوئری مرتبط را متعادل میکند. بایاس پایه نیز نسبت را در زمانی که داده کم است، آرام نگه میدارد. ترکیب این سه، نسبت را مهار میکند تا وقتی به مدل رتبهبندی تزریق میشود، اثرش با منطق آماری و شواهد تجربی دادهها سازگار بماند.
وقتی این ترم به مدل رتبهبندی وارد میشود، صفحات همان «سایت» در معرض یک تغییر همسو قرار میگیرند. اگر Site Quality Score بهبود یابد، صفحات در عبارات مرتبط مختلف کمی وزن بهتری میگیرند. اگر بدتر شود، عکس آن اتفاق میافتد. این رفتار هم به کاربر نهایی معنی میدهد و هم به سازندهی محتوا؛ چون آنچه در سطح تجربهی کاربر در بیرون رخ میدهد، در سطح وزندهی درون مدل بازتاب مییابد.

همهی آنچه در این نوشته آمده، بر همان تعاریف و مثالهای خود پتنت تکیه دارد. در این محدوده، میتوان فهمید که Site Quality Score دنبال چه نسبتی است، چرا به «انتخاب» بهجای «نمایش» اهمیت میدهد، چطور پارامترهای تعدیل از رفتار سیگنال محافظت میکنند و چگونه میتوان سطح «سایت» را تعریف کرد. هیچ کجای این متن ادعا نشده که مقدار دقیق پارامترها چیست، یا اینکه خارج از چارچوب نسبت تعریفشده در پتنت، سیگنال دیگری دخیل است. چنین ادعاهایی از محدودهی متن بیرون میرود و در اینجا جایی ندارد.
اگر بخواهیم جمعبندی را در همان قاب نگه داریم، باید بگوییم Site Quality Score یک نسبت رفتاری است میان ارجاع مستقیم به سایت و انتخابهای واقعی در کوئریهای مرتبط. این نسبت در برابر نویز با «آستانه»، «کندسازی رشد مخرج» و «جزء ثابت پایه» محافظت میشود. «سایت» در سطوح مختلف قابل تعریف است و سیگنال در همان سطح به مدلِ رتبهبندی تزریق میگردد. این تمام چیزی است که در این چارچوب لازم است بدانیم و کافی است تا بفهمیم چرا افزایش جستجوی مستقیم برای سایت همراه با انتخابهای بیشتر در عبارات مرتبط، در نهایت به امتیاز کیفیت بالاتر و بهبود موقعیت نتایج همان سایت منجر میشود.
تهیه شده توسط تیم تخصصی سئو سید احسان خسروی (مدیر، متخصص و مشاور استراتژیک سئو)