وقتی ویدئو Google office hours منتشر شده در 16 شهریور رو دیدم چندتا از موضوعهاش برام خیلی جالب بود مثل چرا دیتا فیلتر شده بیشتر از دیتا Overall هست یا اینکه آیا استفاده از Infinite scrolling مشکلی نداره؟
تصمیم گرفتم در موردشون کمی تحقیق کنم و در قالب دو مقاله منتشرش کنم. در این مقاله خیلی خلاصه سعی میکنم فهم خودم رو به زبان ساده بنویسم، البته یکسری لینک برای هم تاپیک هم قرار دادم تا علاقه داشتید بیشتر تحقیق کنید دستتون باز باشه.
چرا میزان ارقام(کلیک، ایمپرشن و…) در زمانی که از فیلتر سرچ کنسول استفاده میشه از ارقام دیتا Overall بیشتر است؟
کی فکرش رو میکنه که دیتا کلی نمایش داده شده در سرچ کنسول مقدار کمتر از وقتی باشه که یک فیلتر اعمال میکنی! اگر با سایتهای بزرگ سروکله بزنی خیلی واضح تر این مشکل رو مشاهده میکنی اما تو سایتهای کوچیک هم قابل مشاهده است.
عکس پایین برای یک وبسایت تستی و تقاوتش شاید زیاد نباشه اما فرق بین Impression و Click رو دقت کنید.
چطور ممکنه با وجود اینکه یک فیلتر اعمال شده سرچ کنسول به ما نشون بده که Click و Imperssion این صفحه بیشتر از کل وبسایت هستش؟
طبق اطلاعات ذکر شده در ویدئو این اتفاق به بدلیل استفاده گوگل از Bloom filter هستش، حالا Bloom filter چی هست؟ برای اینکه بتونیم تو یک جمله توضیحش بدم از رفیق شفیق Chatgpt کمک گرفتم:
فکر کنید یک جعبه بزرگ از اطلاعات دارید و نمیخواید تک تک اطلاعات رو نگاه کنید چون خیلی ازتون زمان میگیره ولی میخواید ببینید آیا یک اطلاعات خاص در جعبه وجود داره یا نه؟ برای اینکه با سرعت اینکار رو انجام دهید باید از Bloom filter استفاده کنید.
Bloom filter برای اینکه سرعتش رو ببره بالا اطلاعات رو هش میکنه و هرچقد دیتاست بزرگتر باشه احتمال اینکه دقت در نمایش کمتر بشه بیشتر میشه و وقتی ما فیلتر اعمال میکنیم چون دیتاست رو کوچکتر میکنیم دقت اطلاعات بالا میره.
لینک 1: مقاله Search Engine Journal در رابط با این سکشن
لینک 2: مقاله تخصصی در مورد Bloom filter
لینک 3: سکشن ویدئو Google Office Hours در رابط با این قسمت
در این ویدئو ذکر شد که گوگلبات روی دکمهها کلیک نمیکنه و طبق داکیومنتهای گوگل، خزنده گوگل تنها لینکهایی رو فالو میکنه که در تگ a قرار گرفتهاند (منبع)، پس خیال اینکه گوگل الان باهوش شده و.. رو بریزید دور و حتما آدرس صفحاتی که برای شما ارزش دارند رو در تگ a قرار دهید.
لینک 1 : مقاله Search Engine Journal در رابط با این سکشن
لینک 2: سکشن ویدئو Google Office Hours در رابط با این قسمت
این سوالی بود که چند باری خود من بهش فکر کرده بودم که ارزش محتوایی به احتمال زیاد کاربر نمیخونه چیه؟! برداشت من از صحبتی که شد این هست که ارزش داره، اما سعی کنید از محتوا Auto generated دوری کنید و محتوای یونیک و ارزشمند برای کاربراتون بنویسید.
لینک 1: سکشن ویدئو Google Office Hours در رابط با این قسمت
این سوال رو یک دوست ایرانی پرسیده که در وبسایتش لینکهای 404ای بوده که از فایلها جاوا اسکریپت و JSON پیدا شده و خواسته بود بدونه آیا لازمه بهش اهمیت بدیم؟ جوابی که داده شد این بود که هم میتونیم ازشون چشمپوشی کنیم هم در Http header المنت noindex قرار بدیم.
تجربهای که من داشتم این بود که در یک وبسایت به یک سابدامین که برای ریکوئستهای خدمات بود خزنده گوگل در ابتدا روزانه 100 ریکوئست ارسال میکرد و قابل چشمپوشی بود اما بعدش به روزانه 800 ریکوئست رسید و از نظر فنی تشخیص داده شد که روی سرعت اون سرویس تاثیر میذاره پس به جای اینکه بیایم از Noindex هم استفاده کنیم، در Robots.txt اون سابدامین Disallow کردیم.
لینک 1: سکشن ویدئو Google Office Hours در رابط با این قسمت
پاسخ جان مولر به این سوال استفاده از دو روش هست که عبارتاند از: 1. استفاده از Iframe که از طریق Robots.txt کرال کردنش Disallow شده.
2. لود کردن اون قسمت با جاوا اسکریپتی که اون هم از طریق Robots.txt کرال کردنش Disallow شده.
لینک 1: سکشن ویدئو Google Office Hours در رابط با این قسمت
گری در جواب این سوال ذکر میکنه که در صورتی که به ازای هر سکشنی که لود میشه Url هم به صورت داینامیک عوض بشه و اون لینکها قابل دسترسی باشند استفاده از Infinite scroll هیچ مشکلی نداره.
تجربه کاربری که Infinite scroll برای کاربر ایجاد میکنه رو نادیده نمیشه گرفت، از جهت دیگر هرکدام از Itemهای نمایش داده شده در صفحه لیست باید برای کرالر گوگل در دسترس باشند تا به اونها در Serp رتبه بده پس باید اول بدونیم گوگل چطوری این صفحات رو کرال میکنه و بهترین کارهایی که میتونیم بکنیم تا وبسایتمون هم تجربه کاربری خوبی داشته باشه هم از نظر دسترسی توسط کرالر گوگل اوکی باشه چیه؟
لینک 1: سکشن ویدئو Google Office Hours در رابط با این قسمت
لینک 2: داکیومنت گوگل در مورد نکتههای Infinite scrolling
طبق گفته مارتین اسپلیت کرالر گوگل اول Html وبسایت رو بررسی میکنه بعدش در بررسیهای بعدی به جاوا اسکریپت میرسه! هرکدوم از ما که با وبسایتها SPA سروکله زده باشیم و Live test url گرفته باشیم یا از اپراتور کش گوگل استفاده کرده باشیم، متوجه شدیم که گوگل این صفحات رو رندر میکنه و صفحه رو نسبتا کامل نمایش میده، اما مسئله اینجاست کی؟ چقدر طول میکشه و آیا این مسئله دسترسی گوگل به صفحات مارو سخت نمیکنه؟ واقعیت این هست که میکنه و برای برطرف کردن این مشکل باید بریم سمت SSR (مخفف server side rendering).
پس اگر ما SSR نداشته باشیم کرالر گوگل در اولین کرال به جز از محصولاتی که به صورت Html در آن صفحه هستند رو ببینه (اگر همونها هم با جاوا اسکریپت لود بشند که هیچی).
لینک 3: داکیومنت گوگل در رابط با کرال جاوا اسکریپت
طبق گفته جان مولر کرالر گوگل میاد و صفحه رو مثلا با ارتفاع 5000 پیکسل چک میکنه، حالا اگر صفحه SSR باشه در کل اون ارتفاع Itemها لود میشن و قابل بررسی توسط کرالر هستند.
حالا اگر SSR نداشته باشی چی؟ خب اینجا همون نکتهای که اشاره شد رو در نظر بگیر به ازای هر لود شدن به صورت داینامیک Url عوض میشه و اونوقت از طریق سایت مپ یا Paginationای که پایین صفحه گذاشته شده است صفحات دیگر رو میبینه و کرال میکنه.
نکته آخر هم این هست که بله بهتره شما برای مثال تا ۱۰۰ محصول رو قرار بدید بعدش Pagination داشته باشید، البته این تجربه شخصی من هستش.
لینک4: مقاله Search Engine Journal در رابط با این سکشن
نکته: این وبسایت در داکیومنتهای گوگل قرار گرفته است و توسط جان مولر برای فهم بهترین روش پیادهسازی Infinite scrolling تهیه شده است. (لینک وبسایت)
با اینکه سوال عجیبی بود حتی برای جان مولر، پاسخش این بود که چون ما از Mobile first indexing استفاده میکنیم و لینکها در همینجا دیسکاور میشن پس تاثیر خاصی نداره.
لینک 1: سکشن ویدئو Google Office Hours در رابط با این قسمت
برای اینکه خیلی طولانی نشه در 2 پارت منتشرش میکنم، امیدوارم لذت برده باشید.