جلوگیری از تولید محتوای تکراری در سایت

محتوای تکراری تنها به معنی کپی کردن محتوا از سایت های دیگر نیست. گاهی اوقات کدنویسی یک سایت موجب تولید صفحاتی میشود که از نظر محتوا کاملا یکسان هستند ولی با آدرس های متفاوتی در دسترس هستند. این اتفاق در طراحی سایت اجتناب ناپذیر است ولی میتوان تکراری بودن این صفحات را به گوگل اطلاع داد تا محتوای یکسان را با آدرس های تکراری ایندکس نکند.

ممکن است این اتفاق به ظاهر ساده برسد و فکر کنیم که چه اشکالی دارد گوگل صفحات مختلفی را با محتوای یکسان ایندکس کند ولی باید بدانیم که وجود چندین صفحه با محتوای یکسان موجب میشود که گوگل قدرت تشخیص صفحه اصلی از میان آنها را نداشته و عملا جایگاه همه آنها در نتایج جستجو کاهش پیدا کند. برای درک بهتر تاثیر محتوای تکراری پیشنهاد میکنم مقاله جریمه سایت به دلیل محتوای تکراری را مطالعه کنید.

من به تازگی با سایت ویرگول آشنا شدم و در بررسی اولیه متوجه شدم که با انتشار هر پست در این سایت گوگل ۲ یا ۳ آدرس مختلف از آن را ایندکس میکند که نیازی به آن نیست. عملا هر نوشته جدید سه آدرس برای گوگل ایجاد میکند.

نمایش آدرس های ایندکس شده توسط گوگل برای یک نوشته جدید از ویرگول
نمایش آدرس های ایندکس شده توسط گوگل برای یک نوشته جدید از ویرگول

چطور جلوی محتوای تکراری را بگیریم؟

بهترین راه حل برای سایت ویرگول استفاده از تگ canonical در head صفحات خود است. این تگ به گوگل اعلام میکند که صفحه در حال نمایش عملا نسخه ای دیگر از یک صفحه با آدرس تعریف شده است. با این کار آدرس های متفاوت بعنوان صفحات مجزا ایندکس نمیشود. پس در قدم اول باید در هر نوشته جدید یک تگ canonical قرار داده شود تا مانع ایندکس شدن آدرس های داینامیک بعنوان صفحات جدید شود.

<link rel="canonical" href="http://urlofpage" />

همچنین صفحه جدیدی برای نمایش لایک های هر پست ایجاد میشود که ارزش محتوایی ندارد و ایندکس آن توسط گوگل اهمیتی نخواهد داشت. در نتیجه پیشنهاد میشود در این صفحات که با عبارت like/ تمام میشوند از تگ noindex استفاده شود. این تگ به گوگل اطلاع میدهد که اجازه ایندکس کردن این آدرس را ندارد.

<meta name="robots" content="noindex">



امیدوارم که این نکات برای شما مفید بوده باشد.

@virgool