ویرگول
ورودثبت نام
احسان خسروی / استراتژیست و مشاور سئو (Off-page)
احسان خسروی / استراتژیست و مشاور سئو (Off-page)🤝 @triboon_net SEO Solutions Partner 🛠مشاور و متخصص سئو خبرگزاری‌های موفق؛ اقتصادآفرین، افق‌اقتصادی و... 🏅طراح و مجری کمپین‌های آف‌پیج
احسان خسروی / استراتژیست و مشاور سئو (Off-page)
احسان خسروی / استراتژیست و مشاور سئو (Off-page)
خواندن ۱۰ دقیقه·۵ ماه پیش

حذف میلیون‌ها صفحه از ایندکس گوگل در اردیبهشت ۱۴۰۴؛ تحلیل حرفه‌ای برای متخصصان سئو

ماجرا در اواخر اردیبهشت ۱۴۰۴ (۲۶–۲۹ می ۲۰۲۵) رخ داد؛ درباره صفحات کم‌کیفیت و کم‌ورودی صحبت می‌شد؛ گوگل هیچ‌ وقت رسماً تأیید نکرد و نیز یادآوری این اصل که ایندکس‌شدن به‌ معنای نمایش‌گرفتن در نتایج نیست و تصمیم نهایی با الگوریتم‌های سروینگ است. برای جزئیات خام و نمونه‌ها، گزارش مرجع را ببینید.

روایت دقیق ماجرا و شواهد زمانی

طبق گزارش‌ها، نقطه اوج حذف‌ها همزمان با ۲۷ می ۲۰۲۵ در نمودارهای «Page indexing» سرچ کنسول دیده شد؛ جایی که وضعیت‌هایی از جنس «Crawled – currently not indexed / Crawled & not indexed» به‌ صورت جمعی بالا رفت. این الگو در دامنه‌های مختلف تکرار شد و نشان داد با یک تغییر رفتاری در سیاست‌های ایندکس طرفیم، نه یک خطای موردی.
همزمان، تحلیل‌های مستقل از پروژه‌های مختلف سئو نشان دادند که از اواخر می ۲۰۲۵ گوگل در مجموع «کمتر» ایندکس می‌کند و نوع صفحات حذف‌شده الگو دارد؛ موضوعی که با اسکرین‌شات‌ها و آنالیزهای میدانی نیز پشتیبانی شد.

در مجموع می‌توان گفت با یک «نوسان طبیعی اعلام‌نشده اما گسترده» روبه‌رو بودیم که در بازه کوتاهی تعداد قابل توجهی از URLها را از حالت «قابل‌نمایش» خارج کرد؛ بدون آن‌که گوگل در کانال‌های رسمی آن را به‌عنوان آپدیتی مستقل تأیید کند.

چارچوب مفهومی: تفاوت «کشف، خزش، ایندکس» با «نمایش (Serving)»

برای تحلیل حرفه‌ای این رخداد، باید زنجیره فنی گوگل را به‌ صورت Discovery → Crawling → Indexing → Serving تفکیک کنیم:

  • Crawling: دریافت و پردازش خام محتوا توسط خزنده‌ها.

  • Indexing: تحلیل و ذخیره اطلاعات صفحه در ایندکس (پایگاه داده جستجو).

  • Serving/Ranking: لحظه تصمیم‌گیری درباره اینکه کدام صفحه برای کدام کوئری به کدام کاربر نمایش داده شود. گوگل صراحتاً می‌گوید ایندکس‌بودن «به‌ خودی خود» تضمین نمایش نیست و همهٔ صفحات پردازش‌شده نیز الزاماً ایندکس نمی‌شوند.

از سوی دیگر، در Search Console نیز شما وضعیت‌هایی را می‌بینید که نشان می‌دهند صفحه دیده شده/خزیده شده اما فعلاً ایندکس نشده (Crawled – currently not indexed و Discovered – currently not indexed). این‌ها به‌خودی‌خود خطا نیستند، بلکه تصمیم‌های الگوریتمی یا محدودیت‌های بودجهٔ خزش و اولویت هستند.

نکته کلیدی عملی:

این همان چیزی است که در توضیح اولیه تأکید شد: ایندکس‌شدن سریع است، اما «نمایش» کاملاً در گرو تصمیم الگوریتم‌های سروینگ و رقابت کیفی است؛ بنابراین «Indexed» در کنسول، مساوی «Impressions/Clicks» نیست. برای همین ممکن است صفحه‌ای مدتی ایندکس باشد اما در نتایج ظاهر نشود یا بعداً از ایندکس خارج شود. مارتین اسپلیت (از تیم جستجوی گوگل) نیز بارها بر امکان «ایندکس هست ولی نمایش نمی‌گیرد» به‌خاطر رابطه کیفیت/ربط و رقابت نتایج تأکید کرده است.

سناریوهای محتمل وقوع حذف‌های اردیبهشت

۱. آپدیت خاموش مرتبط با ایندکس (تأییدنشده)

الگوی زمانی و هم‌گرایی گزارش‌ها نشان می‌دهد یک تغییر سیستماتیک بی‌اعلام در سیاست‌های ایندکس‌گذاری رخ داده است؛ چیزی شبیه هرس ایندکس (Index Pruning) که استاندارد پذیرش و نگهداری صفحات در ایندکس را سخت‌گیرانه‌تر کرده. این «به‌روزرسانی خاموش» از سوی گوگل تأیید نشد، اما اثر آن در داده‌های میدانی و گزارش‌های عمومی کاملاً دیده شد.

۲. پاکسازی کیفی (Quality-Based Cleanup)

تحلیل‌های بیرونی روی نمونه‌سایت‌های متعدد نشان داد که صفحات سطحی، کم‌عمق، تکراری/پارافریزشده و فاقد ارزش افزوده بیشترین ریسک حذف را داشتند. نمونه‌های واقعی از حوزه‌های سفر، غذا، حقوقی و… نشان می‌داد موضوع کلمات زیاد یا کم نیست؛ عمق معنا و اصالت تعیین‌کننده است.

۳. بازتنظیم بودجه خزش/ظرفیت ایندکس

در سایت‌های بسیار بزرگ (ده‌ها تا صدها هزار URL) این احتمال مطرح است که برای جلوگیری از تورم ایندکس، درصد اندکی از صفحات (به‌ویژه URLهای مشابه، موقتی یا کم‌ورودی) شایستگی ماندن در ایندکس را داشته باشند. این فرضیه با الگوی تأثیر نامتقارن روی پورتال‌های بزرگ هم‌خوان است.

۴. فرضیه هم‌سویی با SGE

عده‌ای از متخصصان حدس زدند که حرکت گوگل به سمت پاسخ‌های مولدی (SGE) باعث می‌شود صفحات حاوی دانسته‌های بدیهی/تکراری کمتر ارزش «نگهداری» داشته باشند. این تنها فرضیه است و از سوی گوگل تأیید نشده، اما با الگوهای حذف‌شده‌ها بی‌ارتباط هم نیست.

آنچه از سمت گوگل گفته شد (و نشد)

بیانیه رسمی منتشر نشد. نزدیکترین واکنش عمومی، پاسخ‌های کوتاه جان مولر (تحلیلگر ارشد گوگل) در اوایل ژوئن بود. او با اشاره به نمونه‌هایی که برایش ارسال شد گفت مشکل فنی خاصی نمی‌بیند و سیستم‌ها دائماً در حال تغییرند؛ همه محتواها ایندکس نمی‌شوند و آن‌چه ایندکس می‌شود هم ممکن است در گذر زمان تغییر کند. این موضع، ماجرا را در چارچوب «رفتار عادی سیستم‌ها» تبیین می‌کند، نه یک باگ.

الگوهای میدانی مشاهده‌شده

  1. تأثیر نامتناسب روی سایت‌های بزرگ: دامنه‌های زیر حدود ۱۰k URL تغییر محسوسی ندیدند، اما پورتال‌های بزرگ (۵۰k+ URL) افت تعداد صفحات ایندکس‌شده را تجربه کردند.

  2. جهش نرخ خزش پیش از حذف‌ها: در انتهای آوریل ۲۰۲۵ (اوایل اردیبهشت) افزایش چشمگیر خزش روی دامنه‌های آسیب‌دیده دیده شد؛ شبیه «بازخزش سراسری» برای ارزیابی مجدد. چند هفته بعد، حذف‌ها آغاز شد.

  3. کفایت‌ نداشتن سیگنال‌های لینک داخلی برای نجات صفحه ضعیف: حتی URLهایی با ده‌ها لینک داخلی، اگر کیفیت/اصالت کافی نداشتند، حذف شدند.

  4. تعریف عملیِ «کم‌عمق/کم‌ارزش»: در یک نمونه دایرکتوری، صفحات با ۱–۲ آیتم از ایندکس بیرون رفتند، درحالی‌که صفحات با ۴+ آیتم حفظ شدند؛ نشانه‌ای از آستانه حداقلی «مفید بودن».

  5. برداشت کلی: هرس عمدی ایندکس. آن‌چه ماند، صفحاتی بود که از ارزش واضح یا حداقل آستانهٔ مفید بودن عبور می‌کردند.

ایندکس
ایندکس

تشخیص حرفه‌ای: از کنسول تا تحلیل علت

خواندن صحیح Page Indexing Report

  • Crawled – currently not indexed: صفحه خزیده شده اما فعلاً به ایندکس راه نیافته؛ ممکن است بعداً ایندکس شود یا هرگز نشود. اقدام شتاب‌زده لازم نیست؛ علت‌یابی مهم‌تر است.

  • Discovered – currently not indexed: شناخته شده اما هنوز خزیده نشده (معمولاً به‌خاطر مدیریت بار/ظرفیت).

چرا «Indexed» می‌بینم ولی «نمایش» ندارم؟

در پاسخ به این سوال باید گفت که چون Serving مرحله جداگانه‌ای است اگر صفحات رقیب مرتبط‌تر، پرتعامل‌تر یا با اعتبار بالاتر باشند، صفحه شما حتی در حالت Indexed نیز Impression نمی‌گیرد. این منطق را گوگل/اسپلیت صریحاً توضیح داده‌اند.

چک‌لیست تشخیصی مرحله‌ به‌ مرحله

  1. بازخوانی ترند زمانی در GSC: شکستگی‌ها و اوج‌های ناگهانی در «Excluded/Not Indexed» را همزمان با بازه اواخر اردیبهشت ببینید.

  2. تقسیم بر پایه نوع صفحه: کدام قالب‌ها/کلاس‌های URL بیشترین حذف را دارند؟ (لیست/نتایج، صفحه سوالات ساده، پست‌های پارافریز و…)

  3. URL Inspection برای نمونه‌های مرزی: تفاوت «گزارش کلی» و «بازرسی URL» را درنظر بگیرید؛ دومی تازه‌تر است و گاهی تأخیر گزارش صفحه‌آرایی را جبران می‌کند.

  4. بررسی کیفیت محتوای همان صفحات: آیا دیدگاه متمایز/تجربه دست‌اول ارائه می‌کنند؟ یا صرفاً بازنویسی‌اند؟ الگوی حذف‌ها اغلب این مرز را نشان می‌دهد.

  5. بودجه خزش و الگوی شباهت URLها: پارامترها، صفحات موقتی، تکراری‌های نزدیک و… را گروه‌بندی کنید (الگوهای کلاسیک «index bloat»).

راهبرد احیا (Recovery) بر پایه همان شواهد

۱. بازمهندسی محتوا بر اساس «عمق و اصالت»

  • بازنویسی عمیق: به هر صفحه حذف‌شده یک وظیفه اطلاعاتی مشخص بدهید و آن را با شواهد، مثال عملی، داده، تصویر اصیل و نتیجه‌گیری قابل استفاده غنی کنید.

  • منابع و استناد: حداقل دو منبع معتبر بیرونی برای هر ادعای حساس.

  • افزودن تجربه دست‌اول: بخش‌هایی مثل «یادداشت‌های میدانی»، «چک‌لیست کاربردی» یا «مطالعه موردی» به ارزش افزوده تبدیل می‌شوند (همان چیزی که در روایت کیفیتی روی آن دست گذاشته شد).

۲. اصالت محتوا به جای تراشیدن مجدد کلمات

اگر ده‌ها نتیجه شبیه همین صفحه شما وجود دارد، نقطه تمایز را تعریف و اجرا کنید: داده بومی/به‌روز، مقایسه واقعی محصول/خدمت، مصاحبه تخصصی یا آزمایش کوچک.

۳. ارتقای معیارهای E-E-A-T برای محتوای صفحه

برای بهبود E-E-A-T صفحه می‌توان از موارد زیر استفاده کرد:

  • نام و بیو نویسنده + تخصص

  • شفاف‌سازی روش تولید محتوا (منابع/روش گردآوری)

  • لینک‌دهی معتبر و پرهیز از ادعاهای بی‌پشتوانه

نکته: E-E-A-T «نشان کیفیت درک‌شده» است، نه تضمین ایندکس. اما «مرز عبور» از آستانه مفید بودن را ساده‌تر می‌کند؛ همان آستانه‌ای که در حذف‌های اخیر به‌وضوح دیده شد.

۴. معماری ایندکس و مدیریت «تورم»

  • ادغام (Merge) یا ۳۰۱ برای صفحات بسیار نزدیک به هم.

  • نقشه سایت تمیز و به‌روز؛ اگرچه نبودنش الزاماً علت «Crawled – currently not indexed» نیست، اما برای اولویت‌بندی مفید است.

  • حذف ایمن صفحات بی‌هدف: در مواردی که ارزش افزوده قابل ایجاد نیست، اجازه دهید خارج از ایندکس بمانند و بودجه خزش را آزاد کنند.

۵. لینک‌سازی داخلی هدفمند

لینک داخلی فقط وقتی مفید است که به صفحه‌ای حقیقتاً ارزشمند اشاره کند؛ صرف تزریق لینک، صفحه کم‌کیفیت را نجات نمی‌دهد؛ این نکته در رخداد اخیر برجسته شد.

«ایندکس سریع» در برابر «نمایش»: چرا این تمایز حیاتی است؟

  • بسیاری از سایت‌ها خیلی زود ایندکس می‌شوند، اما نمایش تابع رقابت و ارتباط است.

  • اگر صفحه‌ای مدت‌ها ورودی نگرفته، در بازنگری‌های دوره‌ای ممکن است از ایندکس خارج شود؛ به‌خصوص وقتی صفحات دیگر بهتر عمل می‌کنند یا ارزش افزوده صفحه مورد بحث پایین است. این منطق در توضیحات نمایندگان گوگل نیز مشاهده شده است.

صورت‌بندی عملی تشخیص و اقدام برای تیم‌های بزرگ

اسکن وضعیت‌ها در GSC

Pages → Why pages aren’t indexed را استخراج و Pivot کنید تا الگو بسازید: کدام فولدرها/الگوهای URL ضربه خورده‌اند؟ چه زمانی؟

ماتریس «ارزش/کوشش» برای تصمیم‌گیری

  • ادغام (وقتی چند URL یک هدف را پوشش می‌دهند).

  • بازنویسی عمیق (وقتی تقاضای جستجویی روشن وجود دارد اما صفحه شما از لحاظ عمق کم می‌آورد).

  • حذف/Noindex (وقتی هدف یکتا/ارزش پایدار ندارد).

بازخزش هدفمند (در صورت ارتقا)

پس از ارتقای واقعی محتوا، درخواستی برای Crawl/Index از طریق URL Inspection بدهید؛ اما به‌ صورت محدود و هوشمند، نه انبوه و بی‌هدف.

سناریوهای پرتکرار و پاسخ‌های استاندارد

سناریو A — Crawled – currently not indexed انبوه

  • علت‌های محتمل: کیفیت پایین، شباهت زیاد، نبود تقاضای واضح، یا صرفاً اولویت پایین در بودجه ایندکس

  • اقدام: ارتقای محسوس کیفیت/اصالت + ادغام نزدیک‌ها + بازنویسی هدف‌دار + سپس درخواست بازخزش.

سناریو B — Indexed در بازرسی URL ولی Impression تقریباً صفر

  • توضیح: مسئله Serving/Ranking است، نه ایندکس. باید رقابت‌پذیری را بهبود دهید (رضایت جستجو، عمق، نشانه‌های اعتبار).

سناریو C — spike در «Excluded» همزمان با بازه اردیبهشت

توضیح محتمل: برخورد با همان بازتنظیم الگوریتمی؛ تمرکز بر بهبودهای کیفی و کوچک‌سازی ایندکس برای عبور از آستانه‌ها.

چارچوب «عمق مؤثر» برای صفحات مرزی

برای تشخیص اینکه یک صفحه «ارزش نگهداری در ایندکس» دارد، این پرسش‌ها را در نسخه بازنویسی‌شده پاسخ دهید:

  1. هدف جستجو دقیقاً چیست و صفحه چه «وظیفه اطلاعاتی» را کامل انجام می‌دهد؟

  2. چه چیزی این صفحه را از ۱۰ نتیجه مشابه متمایز می‌کند؟ (داده اختصاصی، روش، تجربه دست‌اول، مثال اجرایی، مقایسه واقعی.)

  3. اثبات کیفیت کجاست؟ (منابع معتبر، روش ارزیابی، خروجی قابل استفاده برای کاربر.)

  4. آیا صفحه به درد «همین حالا» می‌خورد؟ اگر موقتی/منقضی است، برنامه عمر محتوا را مشخص کنید.

  5. در ارتباط با معماری لینک داخلی، آیا از صفحات قدرتمند و مرتبط به این صفحه «هدایت معنی‌دار» دارید؛ نه صرفاً لینک‌پرانی؟

برنامه عملیاتی ۹۰/۶۰/۳۰ روزه برای بازگشت پایدار

روزهای ۱–۳۰ (Stabilize & Map):

  • استخراج کامل «Excluded/Not indexed» و خوشه‌بندی بر اساس نوع URL.

  • تعریف KPIهای بازیابی: «نرخ بازگشت به ایندکس»، «Impressions بازگشتی»، «سهم کلیک صفحات احیاشده».

  • انتخاب ۲۰٪ صفحات با بیشترین پتانسیل و شروع بازنویسی عمیق آن‌ها.

روزهای ۳۱–۶۰ (Deep Rebuild):

  • اجرای ادغام‌ها و ۳۰۱ها؛ پاکسازی ورم ایندکس.

  • انتشار نسخه‌های ارتقایافته؛ درخواست بازخزش محدود و مانیتورینگ.

  • اصلاح معماری لینک داخلی برای هدایت «سیگنال موضوعی» به صفحات کلیدی.

روزهای ۶۱–۹۰ (Scale & Prove):

  • تعمیم الگوهای موفق به سایر خوشه‌ها.

  • گزارش‌گیری هفتگی از نرخ بازگشت به ایندکس و روند Impressions.

  • مستندسازی استانداردهای «عمق مؤثر» برای تولیدات بعدی تا از بازگشت مشکل جلوگیری شود.

پاسخ به چند سوء برداشت رایج

  • «اگر ایندکس شدم پس چرا دیده نمی‌شوم؟»
    چون نمایش تابع رقابت و ارتباط است؛ Indexed شرط لازم است، نه کافی.

  • «پس مشکل فقط با لینک‌سازی داخلی حل می‌شود؟»
    خیر؛ در الگوی اخیر، کیفیت/اصالت محتوا پیش‌نیاز است و لینک داخلی بدون محتوا‌ی واقعاً مفید اثر چندانی نداشت.

  • «گوگل همه‌ چیز را حذف کرد چون باگ بود؟»
    شواهد و اظهارنظرها آن را رفتار عادی سیستم‌ها توصیف کردند، نه یک باگ گسترده نیازمند اصلاح فوری.

چک‌لیست اجرایی فشرده برای تیم‌ها سئو

  • تعیین خوشه‌های محتوایی با بیشترین حذف

  • نرمال‌سازی آدرس‌ها و ادغام نزدیک‌ها

  • بازنویسی عمیق و افزودن تمایز واقعی

  • شفاف‌سازی نویسنده/منابع (E-E-A-T)

  • بازطراحی لینک داخلیِ معنابنیاد

  • نقشه سایت تمیز و به‌روز

  • درخواست بازخزش محدود پس از ارتقا

  • مانیتورینگ هفتگی «بازگشت به ایندکس» و «Impression»

آنچه «نیست» و نباید انتظارش را داشت

  • انتظار رفع یک‌شبه با Fetch as Google یا «درخواست ایندکس انبوه»

  • امید به حل مسئله صرفاً با افزایش تعداد کلمات

  • جایگزین‌کردن اصالت با پارافریز

  • چسبیدن به سیگنال‌های سطحی (مثل لینک داخلی بدون ارتقای محتوا)

نتیجه عملی برای متخصص سئو

۱) رخداد اواخر اردیبهشت ۱۴۰۴ را به‌عنوان یک بازتنظیم استانداردهای نگهداری در ایندکس ببینید؛ نه صرفاً «نوسان رتبه».

۲) مدیریت ایندکس را یک رشته مستقل در سبد SEO بدانید: چه چیزی باید ایندکس بماند و چرا.

۳) اصالت و عمق را معیار اول کنید و بدانید که حتی لینک داخلی یا سیگنال‌های کلاسیک بدون محتوای واقعاً مفید «آستانه» را رد نمی‌کند.

۴) در گزارش‌دهی به ذی‌نفعان، تفاوت ایندکس و سروینگ را شفاف توضیح دهید و KPIهای بازگشت به ایندکس و Impressions بازیافتی را مبنای ارزیابی قرار دهید.

۵) برای چرخه‌های بعدی گوگل آماده باشید: هرس دوره‌ای ایندکس و بازخزش‌های سراسری بخش طبیعی حیات جستجو هستند.

تهیه شده توسط تیم تخصصی سئو سید احسان خسروی

ایندکسگوگلسئومتخصص سئو
۲
۰
احسان خسروی / استراتژیست و مشاور سئو (Off-page)
احسان خسروی / استراتژیست و مشاور سئو (Off-page)
🤝 @triboon_net SEO Solutions Partner 🛠مشاور و متخصص سئو خبرگزاری‌های موفق؛ اقتصادآفرین، افق‌اقتصادی و... 🏅طراح و مجری کمپین‌های آف‌پیج
شاید از این پست‌ها خوشتان بیاید