digital marketing
digital marketing
خواندن ۲۱ دقیقه·۵ سال پیش

کرال شده ولی هنوز ایندکس نشده: خطای قسمت کاوریج در سرچ کنسول

گزارش نمایه پوشش Google کاملاً خارق العاده است زیرا به SEO می دهد اطلاعاتی واضح تر درباره تصمیمات خزنده و نمایه سازی گوگل ارائه می دهد. از زمان رها شدن آن ، ما تقریباً هر روز در Go Fish Digital برای تشخیص مشکلات فنی در مقیاس مشتریان خود استفاده می کنیم.


در این گزارش ، "وضعیت" مختلفی وجود دارد که اطلاعاتی در مورد نحوه استفاده گوگل با محتوای سایت خود در اختیار وب مسترها می گذارد. در حالی که بسیاری از وضعیت ها زمینه های تصمیم گیری در مورد خزیدن و نمایه سازی Google را فراهم می کنند ، هنوز ناشناخته مانده است: "خزنده - در حال حاضر ایندکس نشده".


از زمان مشاهده وضعیت "خزنده - در حال حاضر فهرست نشده" گزارش شده است ، ما از چندین صاحب سایت شنیده ایم که درباره معنای آن سؤال می کنند. یکی از مزایای کار در آژانس این است که بتوانیم جلوی داده های زیادی را بدست آوریم ، و از آنجا که ما این پیام را در چندین حساب مشاهده کرده ایم ، شروع کرده ایم به روندهای URL های گزارش شده توجه کنیم.


تعریف Google

بیایید با تعریف رسمی شروع کنیم. طبق مستندات رسمی Google ، این وضعیت به این معنی است: "این صفحه توسط Google خزیده شده است ، اما ایندکس نشده است. ممکن است در آینده ایندکس شود. دیگر نیازی به ارسال مجدد این URL برای خزیدن نیست. "


بنابراین ، اساساً آنچه می دانیم این است که:


Google قادر به دسترسی به صفحه است

Google زمان خزیدن صفحه را به خود اختصاص داد

بعد از خزیدن ، Google تصمیم گرفت آن را در این فهرست قرار ندهد

کلید فهم این وضعیت ، فکر کردن به دلایلی است که گوگل "آگاهانه" در برابر فهرست بندی تصمیم می گیرد. ما می دانیم که Google مشکل پیدا کردن صفحه را ندارد ، اما به دلایلی احساس می کند کاربران از یافتن آن سود نمی برند.


این می تواند بسیار ناامید کننده باشد ، زیرا ممکن است نمی دانید چرا محتوای شما ایندکس نمی شود. در زیر برخی از متداول ترین دلایلی که تیم ما دیده است را توضیح می دهم تا دلیل این وضعیت اسرارآمیز روی وب سایت شما تأثیر بگذارد.


1. مثبت کاذب

اولویت: کم

اولین قدم ما این است که همیشه چندین چک URL از نشانه های پرچم دار در بخش "Crawled - در حال حاضر فهرست بندی نشده" را برای فهرست بندی انجام دهیم. پیدا کردن URL هایی که گزارش می شوند به عنوان حذف شده غیر معمول نیست ، اما به نظر می رسد که در فهرست Google قرار دارند.

کرال شده ولی هنوز ایندکس نشده: خطای قسمت کاوریج در سرچ کنسول

به عنوان مثال ، اینجا URL وجود دارد که در این گزارش برای وب سایت ما در حال پرچم گذاری است: https://gofishdigital.com/meetup/


با این حال ، هنگام استفاده از یک اپراتور جستجوی سایت ، می توانیم ببینیم که URL در واقع در فهرست Google قرار دارد. شما می توانید این کار را با پیوست کردن متن "سایت:" قبل از URL انجام دهید.



اگر URL هایی را تحت این وضعیت مشاهده می کنید ، توصیه می کنم با استفاده از اپراتور جستجوی سایت ، تعیین کنید که URL ایندکس شده است یا خیر ، شروع کنید. بعضی اوقات ، اینها به نظر می رسد مثبت نادرست است.


راه حل: هیچ کاری نکنید! شما خوب هستید.

2. URL های خوراک RSS

اولویت: کم

این یکی از متداول ترین نمونه هایی است که می بینیم. اگر سایت شما از یک فید RSS استفاده می کند ، ممکن است URL هایی را پیدا کنید که در گزارش "خزنده - در حال حاضر فهرست نشده" در Google نمایش داده می شوند. بسیاری از این URL ها رشته "/ فید /" را به انتهای آن وصل می کنند. آنها می توانند در این گزارش مانند این ظاهر شوند:



Google این URL های خوراک RSS را که از صفحه اصلی مرتبط است پیدا می کند. آنها غالباً با استفاده از یک عنصر "rel = alternate" مرتبط می شوند. افزونه های وردپرس مانند Yoast می توانند به صورت خودکار این URL ها را تولید کنند.


راه حل: هیچ کاری نکنید! شما خوب هستید.

احتمالاً Google به صورت دلخواه انتخاب کرده است که این URL ها را فهرست نکند و به دلایل خوبی. اگر به URL فید RSS بروید ، یک سند XML مانند پرونده زیر را مشاهده خواهید کرد:


گزارش نماینده Google در زمینه کاملاً متناسب با قانون مجاز است به سئو بپردازد و اطلاعات لازم را به شما بدهد. از زمان رها ارزیابی این ، ما دسترسی هر روز در Go Fish Digital برای تشخیص سطح فنی در مقیاس سنجش خود شما می توانید استفاده کنید.


در این گزارش ، "وضعیت" ممکن است در اختیار شما قرار گیرد و اطلاعات خود را در اختیار شما قرار دهد و با استفاده از سایت خود در اختیار وب سایت مسترها می باشد. در ارائه این نظرسنجی ، موقعیتی را در اختیار شما قرار می دهیم ، می توانید Google را ببینید ، می توانید با مراجعه به سایت خود بخواهید: "خزنده - در حال حاضر این دیدگاه حذف نشده است".


از زمان مشاهده وضعیت "خزنده - در حال حاضر ثبت نام" گزارش شده است ، ما از طرف صاحب سایت شنیده ایم که درباره توضیحات این سؤال میشین. با استفاده از مزایای کار در آژانس ، می توانید آدرس قبلی خود را بدست آورید ، و همچنین می توانید با مراجعه به آدرس اینترنتی خود ، آدرس خود را مشاهده کنید.


Google را تعیین کنید

بیایید با تعریف لیست شروع. Google مستندات را گوگل ، این وضعیت را به این کاربر اختصاص داده است: "این صفحه توسط گوگل خزیده شده است ، این ویکسکس شده را مجاز نیست.

کرال شده ولی هنوز ایندکس نشده: خطای قسمت کاوریج در سرچ کنسول

این قانون می تواند به صورت دقیق


Google قادر به دسترسی به صفحه است

Google زمان خزیدن صفحه را به خود اختصاص داد

بعد از خزیدن ، Google تصمیم گرفت که آن را در این لیست نظر ندهد

کلید فهم این وضعیت ، فکر کردن به دلایلی است که گوگل "آگاهانه" در حد تعیین شده می دهد. ما می دانیم که گوگل می تواند صفحه شخصی داشته باشد ، اما به دلخواه شما می رسد و می تواند از این فرصت استفاده کند.


این می تواند بسیار بهتر ناامید آور باشد ، این امکان را دارد که شما آن را دوست نداشته باشید چرا که می توانید آن را حذف کنید. در زیر این توضیحات از متداول تر دلایلی که تیم ما می تواند برای شما توضیح دهد دهم تا بتوانید این وضعیت را تصدیق کنید


1. مثبت کاذب

اولویت: کم

آدرس سایت "Crawled - در حال حاضر با ذکر نام" در مورد لیست بندی انجام دهم. اگر آدرس اینترنتی خود را مشاهده می کنید ، می توانید به عنوان مقاله حذف شده ، آن را حذف کنید.


به عنوان مثال ، URL خود را در دسترس داشته باشید و در این گزارش وب سایت ما را در حال حاضر مشاهده کنید: https://gofishdigital.com/meetup/


با استفاده از این آدرس ، می توانید از آدرس اینترنتی خود استفاده کنید ، می توانید آدرس اینترنتی خود را پیدا کنید. شما می توانید این کار را با پیوست کردن متن "سایت:" قبل از URL انجام دهید.



اگر آدرس اینترنتی خود را در اختیار شما قرار داده است ، می توانید با استفاده از اپراتور به سایت خود بپردازید ، آدرس اینترنتی خود را مشاهده کنید یا به صورت خیر ، شروع کنید. با توجه به این موارد ، اینها به نظر می رسند که دارای شخصیتی نادرست است.


راه حل: هیچ کاری ندارید! شما بهتر است

2. URL های خوراک RSS

اولویت: کم

این اطلاعات از متداول است به طور مثال می توانیم بین آنها قرار بگیریم. اگر در سایت خود از یک فید RSS استفاده می کنید ، می توانید آدرس اینترنتی خود را در اختیار داشته باشید و در صورت نمایش "خزنده - در حال حاضر مشاهده شده" در Google نمایش داده می شوید. با استفاده از این URL ها حاشیه "/ فید /" را به انتهای این میز میفرستید. این امکان را برای شما فراهم آورده است:



گوگل این URL های خوراک RSS را که در صفحه اصلی وجود دارد ، می توان در سایت خود قرار داد. این روش غالباً با استفاده از یک عنصر "rel = alternate" مرتبط می شود. افزونه های وردپرساختی Yoast می توان به آدرس خودکار خود این نشانی اینترنتی را ارائه داد.


راه حل: هیچ کاری ندارید! شما بهتر است

به راحتی Google به صورت دلخواه انتخاب کرده است که در این URL نمایش داده شده است و می گوید: اگر به آدرس اینترنتی فید RSS بروید ، یک سند XML تهیه کرده اید ، تحت عنوان دیدگاه کرد:


5. 301 تغییر مسیر

اولویت: متوسط

یک نمونه جالب که ما در زیر این وضعیت مشاهده کردیم ، URL های مقصد صفحات هدایت شده است. اغلب ، خواهیم دید که Google در حال خزیدن URL مقصد است اما آن را در این فهرست درج نمی کند. با این حال ، با نگاهی به SERP ، متوجه می شویم که گوگل URL را هدایت می کند. از آنجا که URL هدایت شونده نمایه شده است ، URL مقصد به گزارش "Crawled - در حال حاضر فهرست نشده" منتقل می شود.



مسئله اینجاست که ممکن است Google هنوز این تغییر مسیر را تشخیص ندهد. در نتیجه ، URL مقصد را "کپی" می بیند زیرا هنوز URL را هدایت می کند.


راه حل: یک نقشه سایت موقت.xml ایجاد کنید.

اگر این اتفاق در تعداد زیادی آدرس اینترنتی رخ داده است ، ارزش دارد تا برای ارسال سیگنالهای تلفیقی قوی تر به Google قدمی بردارید. این مسئله می تواند نشان دهد که Google به موقع تغییر مسیرهای شما را تشخیص نمی دهد و منجر به سیگنال های محتوای تلفیقی نشده می شود.


یک گزینه ممکن است تنظیم "نقشه موقت" باشد. این یک نقشه سایت است که می توانید برای تسریع در خزیدن این URL های هدایت شونده ایجاد کنید. این استراتژی است که جان مولر قبلاً توصیه کرده است.


برای ایجاد یکی ، باید تغییر مسیرهایی را که در گذشته ایجاد کرده اید مهندس معکوس کنید:


صادر کردن همه URL ها از گزارش "خزنده - در حال حاضر فهرست نشده".

آنها را در اکسل با تغییر مسیرهایی که قبلاً تنظیم شده اند ، مطابقت دهید.

همه تغییر مسیرهایی که URL مقصد را در سطل "Crawled - در حال حاضر فهرست نشده" پیدا کنید.

با استفاده از Screaming Frog یک sitemap.xml ساکن از این URL ها ایجاد کنید.

نقشه سایت را بارگذاری کنید و گزارش "خزنده - در حال حاضر فهرست نشده" را در کنسول جستجو مشاهده کنید.

هدف در اینجا این است که گوگل بتواند URL های موجود در نقشه موقت.xml را بیشتر از آنچه که در غیر این صورت بود ، خز کند. این امر منجر به ادغام سریعتر این تغییر مسیرها می شود.

کرال شده ولی هنوز ایندکس نشده: خطای قسمت کاوریج در سرچ کنسول

6. محتوای نازک

اولویت: متوسط

بعضی اوقات می بینیم URL های موجود در این گزارش که از نظر محتوا بسیار نازک هستند. این صفحات ممکن است دارای تمامی عناصر فنی به درستی تنظیم شده باشد و حتی ممکن است به درستی با آنها ارتباط برقرار کند ، اما وقتی Google در این URL ها اجرا می شود ، محتوای واقعی بسیار کمی در صفحه وجود دارد. در زیر مثالی از صفحه دسته بندی محصولات که در آن متن منحصر به فرد بسیار کمی وجود دارد:



این صفحه لیست محصولات با عنوان "خزنده - در حال حاضر فهرست نشده" پرچم گذاری شده است. این ممکن است به دلیل محتوای بسیار نازک در صفحه باشد.


این صفحه احتمالاً بسیار نازک است که گوگل فکر کند مفید است یا محتوای کمی وجود دارد که گوگل آن را نسخه ای از صفحه دیگر تلقی می کند. نتیجه این است که گوگل محتوا را از فهرست حذف می کند.



در اینجا مثال دیگری وجود دارد: گوگل توانست یک صفحه مؤلفه توصیفی را در سایت Go Fish Digital (در شکل بالا) نشان دهد. اگرچه این محتوا برای سایت ما منحصر به فرد است ، احتمالاً Google باور نمی کند که توصیف تک جمله ای باید به عنوان یک صفحه فهرست بندی مجزا باشد.


یک بار دیگر ، Google به دلیل عدم کیفیت ، تصمیم اجرائی را برای حذف صفحه از ایندکس صادر کرده است.


راه حل: محتوای بیشتری اضافه کنید یا سیگنال های نمایه سازی را تنظیم کنید.

مراحل بعدی به ایندکس شدن این صفحات بستگی دارد.


اگر فکر می کنید که قطعاً صفحه باید در این فهرست قرار بگیرد ، محتوای اضافی را اضافه کنید. این به Google کمک می کند تا صفحه را به عنوان تجربه بهتر به کاربران مشاهده کند.


اگر نمایه سازی برای مطالبی که پیدا می کنید ضروری نیست ، سؤال بزرگتر این خواهد بود که آیا شما باید اقدامات اضافی را انجام دهید تا به شدت علامت گذاری شود که نباید این محتوا نمایه شود. گزارش "Crawled —currently not indexed" نشان می دهد که محتوا واجد شرایط برای نمایش در فهرست Google است ، اما Google تصمیم می گیرد که آن را لحاظ نکند.


صفحات کم کیفیت دیگری نیز وجود دارد که Google از این منطق استفاده نمی کند. برای یافتن محتوای ایندکس شده با همان معیارهای مثال بالا می توانید یک جستجوی "سایت" را انجام دهید. اگر متوجه شدید تعداد زیادی از این صفحات در فهرست نمایش داده می شوند ، ممکن است بخواهید ابتکارهای قوی تری را برای اطمینان از حذف این صفحات از ایندکس از قبیل برچسب "noindex" ، خطای 404 یا حذف آنها از صفحه اصلی در نظر بگیرید. ساختار اتصال داخلی به طور کامل.

کرال شده ولی هنوز ایندکس نشده: خطای قسمت کاوریج در سرچ کنسول

7. محتوای تکراری

اولویت: زیاد

هنگام ارزیابی این محرومیت در تعداد زیادی مشتری ، این بالاترین اولویتی است که ما دیده ایم. اگر Google محتوای شما را کپی کند ، ممکن است محتوا را خزنده کند اما انتخاب کند که آن را در فهرست قرار ندهد. این یکی از راه هایی است که گوگل از تکثیر SERP جلوگیری می کند. با حذف محتوای تکراری از فهرست ، Google اطمینان می دهد که کاربران از صفحات منحصر به فرد بیشتری برای تعامل با آنها برخوردار هستند. گاهی اوقات این گزارش این URL ها را با وضعیت "Duplicate" برچسب گذاری می کند ("کپی کردن ، Google اختیاری متفاوت از کاربر را انتخاب کرد"). در هر صورت، همیشه صادق نخواهد بود.


این یک موضوع با اولویت بالا است ، به خصوص در بسیاری از سایت های تجارت الکترونیکی. صفحات کلیدی مانند صفحات توضیحات محصول اغلب توضیحات محصول مشابه یا مشابه بسیاری از نتایج دیگر در وب را شامل می شوند. اگر Google این موارد را خیلی به سایر صفحات داخلی یا خارجی تشخیص دهد ، ممکن است همه آنها را از این فهرست خارج کند.


راه حل: عناصر منحصر به فرد را به محتوای تکراری اضافه کنید.

اگر فکر می کنید این وضعیت در مورد سایت شما صدق می کند ، چگونه می توانید برای آن آزمایش کنید:


یک متن از متن تکراری بالقوه را بگیرید و آن را در Google جایگذاری کنید.

در URL SERP ، رشته زیر را تا انتها اضافه کنید: "& num = 100". این 100 نتیجه برتر را به شما نشان می دهد.

از عملکرد "یافتن" مرورگر خود استفاده کنید تا ببینید نتیجه شما در 100 نتیجه برتر ظاهر می شود یا خیر. اگر اینگونه نباشد ، ممکن است نتیجه شما از فهرست خارج شود.

به URL SERP برگردید و رشته آخر را به انتهای آن اضافه کنید: "& filter = 0". این باید نتیجه فیلتر نشده Google شما را نشان دهد (با تشکر ، پاتریک استوکس ، برای نکته).

برای جستجوی آدرس اینترنتی خود از عملکرد "Find" استفاده کنید. اگر اکنون می بینید که صفحه شما در حال ظاهر شدن است ، این نشانگر خوبی است که محتوای شما از فهرست خارج می شود.

این روند را برای چند آدرس اینترنتی با محتوای تکراری یا بسیار مشابه که در گزارش "Crawled - در حال حاضر فهرست بندی نشده" مشاهده می کنید ، تکرار کنید.


اگر به طور مداوم مشاهده می کنید که URL های شما از فهرست بهتر فیلتر نمی شوند ، باید برای منحصر به فرد تر کردن مطالب خود قدم بردارید.


در حالی که هیچ استانداردی برای رسیدن به این هدف وجود ندارد ، در اینجا چند گزینه وجود دارد:


بازنویسی مطالب برای منحصر به فرد تر شدن در صفحات دارای اولویت بالا.

برای تزریق خودکار محتوای منحصر به فرد بر روی صفحه ، از خصوصیات دینامیکی استفاده کنید.

مقادیر زیادی از محتوای غیرضروری دیگ بخار را حذف کنید. صفحات با متن بیشتر از متن منحصر به فرد ممکن است به عنوان تکراری در حال خواندن باشند.

اگر سایت شما به محتوای تولید شده توسط کاربر وابسته است ، به همکاران مطلع کنید که کلیه محتوای ارائه شده باید بی نظیر باشد. این ممکن است به جلوگیری از مواردی منجر شود که مشارکت کنندگان از همان محتوا در چندین صفحه یا دامنه استفاده می کنند.

8- محتوای شخصی

اولویت: زیاد

مواردی وجود دارد که خزندگان گوگل به محتوا دسترسی پیدا می کنند که نباید به آنها دسترسی داشته باشند. اگر Google در حال یافتن محیط های توسعه یافته است ، می تواند آن URL ها را در این گزارش درج کند. ما حتی نمونه هایی از Google را مشاهده کرده ایم که می تواند زیر دامنه یک مشتری خاص را برای بلیط های JIRA تنظیم کند. این باعث خزیدن انفجاری سایت شد ، که بر URL هایی تمرکز می کرد که دیگر نباید برای فهرست بندی در نظر گرفته شوند.


مسئله اینجاست که خزیدن سایت Google متمرکز نشده است ، و این وقت را صرف خزیدن (و ایندکس کردن بالقوه) آدرس های اینترنتی می کند که منظور از جستجوگرها نیست. این می تواند نتایج گسترده ای برای بودجه خزیدن سایت داشته باشد.


راه حل: ابتکارات خزنده و نمایه سازی خود را تنظیم کنید.

این راه حل کاملاً به شرایط و دسترسی Google وابسته است. به طور معمول ، اولین کاری که می خواهید انجام دهید این است که چگونه Google قادر به کشف این URL های خصوصی است ، خصوصاً اگر از طریق ساختار پیوند داخلی شما باشد.


یک صفحه خزیدن را از صفحه اصلی زیر دامنه اصلی خود شروع کنید و ببینید که آیا subdomains نامطلوب از طریق یک خزیدن استاندارد قادر به دسترسی به Screaming Frog هستند. اگر چنین است ، به راحتی می توان گفت که Googlebot ممکن است مسیرهای مشابه را پیدا کند. می خواهید هرگونه پیوند داخلی به این محتوا را حذف کنید تا دسترسی Google را قطع کنید.

کرال شده ولی هنوز ایندکس نشده: خطای قسمت کاوریج در سرچ کنسول

مرحله بعدی بررسی وضعیت نمایه سازی URL هاست که باید از این امر جدا شوند. آیا گوگل به اندازه کافی همه آنها را از فهرست در امان نگه می دارد ، یا برخی در این فهرست گرفتار شده اند؟ اگر Google مقدار زیادی از این محتوا را فهرست بندی نکرده است ، ممکن است در نظر داشته باشید که پرونده robots.txt خود را تنظیم کنید تا فوراً خزیدن را مسدود کند. در غیر این صورت ، برچسب های "noindex" ، ضمائم ، و صفحات محافظت شده با رمز عبور همه در جدول هستند.


مطالعه موردی: مطالب تولید شده توسط کاربر را کپی کنید

برای مثال در دنیای واقعی ، این مثالی است که ما در سایت مشتری توضیح داده ایم. این مشتری شبیه به یک سایت تجارت الکترونیکی است زیرا بسیاری از مطالب آنها از صفحات توضیحات محصول تشکیل شده است. با این حال ، این صفحات توضیحات محصول ، همه محتوای تولید شده توسط کاربر هستند.


در اصل ، اشخاص ثالث مجاز به ایجاد لیست در این سایت هستند. با این حال ، اشخاص ثالث اغلب توضیحات بسیار کوتاهی را به صفحات خود اضافه می کردند و در نتیجه محتوای نازک ایجاد می شد. مسئله ای که اغلب اتفاق می افتد این بود که این صفحات توضیحات محصول ایجاد شده توسط کاربر در حال سست شدن بودند

نتیجه

امیدوارم ، این به بازاریابان جستجو کمک کند تا وضعیت مرموز "Crawled - که در حال حاضر نمایه نشده نیست" در گزارش Index Coverage را درک کنند. البته ، به احتمال زیاد دلایل بسیاری دیگر وجود دارد که گوگل می تواند URL های اینچنینی را دسته بندی کند ، اما این رایج ترین مواردی است که تا به امروز با مشتریان خود دیده ایم.

کرال شده ولی هنوز ایندکس نشده: خطای قسمت کاوریج در سرچ کنسول

به طور کلی ، گزارش Index Coverage یکی از ابزارهای قدرتمند در کنسول جستجو است. من بازاریابان جستجو را به شدت تشویق می کنم تا با داده ها و گزارش ها آشنا شوند ، زیرا ما به طور معمول رفتار خزنده و نمایه سازی ناپایدار ، بخصوص در سایت های بزرگتر را می یابیم. اگر نمونه های دیگری از URL ها را در گزارش "خزنده - در حال حاضر فهرست نشده" مشاهده کرده اید ، در نظرات به من اطلاع دهید!

خطاهای سرچ کنسولخطاهای کاوریج سرچ کنسولسرچ کنسول ارور برای صفحات
بهترین دوره های سئو و دیجیتال مارکتینگ و بازاریابی اینترنتی در ایران و جهان
شاید از این پست‌ها خوشتان بیاید