داریوش دیانت
داریوش دیانت
خواندن ۹ دقیقه·۷ سال پیش

بررسی دقت عملکرد 12 ابزار اختصاصی تخمین بازدید وبسایت؛ الکسا، سیمیلار وب، کامپیت و مابقی


سرویس هایی هستند که ادعا می کنند بازدید وب سایت ها را از حدود 15 سال پیش می توانسته‌اند پیش بینی کنند، اما من مدت ها ست که به دقت آن ها مشکوک بوده ام (بازدید سایت هایی که به آن‌ها دسترسی داشتم را چک می کردم و بعضی پیش بینی ها واقعا ضعیف بود). در سال 2012، پروژه‌ای ترتیب دادم تا صحت اعداد به دست آمده از این ابزارها را تست کنم که ناکارآمدی آنها را نشان می‌داد.
Mark Collier (از Project Open Algorithm) هم در سال 2013 بررسی هایی روی این تست ها انجام داد که نتایج آن هم ناامید کننده بود. این‌طور که به نظر می‌رسد در سال های اخیر سرویس هایی نظیر Alexa، Compete، Quantcast و مابقی، عملکرد خوبی در تخمین بازدید وبسایت ها از خود به جای نمی گذارند.

اما الآن چطور؟ سرویس های جدیدی مانند SimilarWeb و SEMRush، توسط فعالان حوزه بازاریابی با هدف تحصیل داده هایی بهتر شروع به کار کرده اند. Compete هم ظاهرا سرویس خودش را بهبود داده است. من تصور می کنم وقتش رسیده که دوباره داده ها را به جریان بندازیم تا نمره عملکردشان را این‌بار در سال 2015 ببینیم.


چند ماه قبل، از IMEC Labs project درخواست کردم تا داده های تعدادی از وبسایت های مختلف داوطلب را در اختیارم بگذارند. نهایتا داده های بازدید (بازدیدهای منحصر به فردشان از دسامبر 2014 تا مارس 2015) از 143 وبسایت، در رنج بازدید ماهانه کمتر از 100 تا بیشتر از 25 میلیون به دست آمد.

متاسفانه با توجه به قولم مبنی بر رعایت حریم خصوصی‌شان، اسم خود وبسایت ها را نمی توانم با شما به اشتراک بگذارم. اما به هر حال، در مجموع دادهای بسیار خوبی به دست آمده است. بیایید نگاهی به معیارهای مورد اندازه‎گیری‌مان بیاندازیم، سپس دیدگاه و نظراتم را برای هر کدام بیان خواهم کرد:


12 معیار برای پیش بینی بازدید وب ( به ترتیب کیفیت داده ها/دقت)

1- ا SimlarWeb ا – بازدید ماهانه:

  • میانگین معیار/بازدید واقعی: 406.37%
  • درصد داده های بین 70-130% بازدید واقعی: 22%
  • همبستگی اسپیرمن با بازدید واقعی: 0.827
  • خطای استاندارد: 0.0504
  • داده های پوشش داده شده: 87.41%

2- ا Compete.com ا – کل بازدید‌های ماهانه:

  • میانگین معیار/بازدید واقعی: 115.52%
  • درصد داده های بین 70-130% بازدید واقعی: 8.52%
  • همبستگی اسپیرمن با بازدید واقعی: 0.843
  • خطای استاندارد: 0.0837
  • داده های پوشش داده شده: 31.47%

3- ا SEMRush ا – بازدیدهای جستجوی ماهانه:

  • میانگین معیار/بازدید واقعی: 28.84%
  • درصد داده های بین 70-130% بازدید واقعی: 1.21%
  • همبستگی اسپیرمن با بازدید واقعی: 0.696
  • خطای استاندارد: 0.0668
  • داده های پوشش داده شده: 88.11%

4- ا Quantcast ا – بازدیدهای ماهانه :

  • میانگین معیار/بازدید واقعی: 53.41%
  • درصد داده های بین 70-130% بازدید واقعی: 3.75%
  • همبستگی اسپیرمن با بازدید واقعی: 0.906
  • خطای استاندارد: 0.097
  • داده های پوشش داده شده: 13.99%

5- ا SimilarWeb ا – رتبه جهانی:

  • همبستگی اسپیرمن با بازدید واقعی: 0.839
  • خطای استاندارد: 0.0435
  • داده های پوشش داده شده: 97.2%

6- ا Alexa ا – رتبه الکسا:

  • همبستگی اسپیرمن با بازدید واقعی: 0.702
  • خطای استاندارد: 0.0607
  • داده های پوشش داده شده: 100%

7- ا Moz ا – اعتبار دامنه:

  • همبستگی اسپیرمن با بازدید واقعی: 0.702
  • خطای استاندارد: 0.0601
  • داده های پوشش داده شده: 100%

8- ا Facebook ا – لایک ها:

  • همبستگی اسپیرمن با بازدید واقعی: 0.677
  • خطای استاندارد: 0.0661
  • داده های پوشش داده شده: 83.22%

9- ا Google AdWords ا – جستجو‌های ماهانه برای اسم برند:

  • همبستگی اسپیرمن با بازدید واقعی: 0.673
  • خطای استاندارد: 0.068
  • داده های پوشش داده شده: 84.62%

10- ا Moz ا – دامین های ریشه ای مرتبط:

  • همبستگی اسپیرمن با بازدید واقعی: 0.594
  • خطای استاندارد: 0.0687
  • داده های پوشش داده شده: 100%

11- ا Twitter ا – فالوورها:

  • همبستگی اسپیرمن با بازدید واقعی: 0.594
  • خطای استاندارد: 0.0687
  • داده های پوشش داده شده: 100%

12- ا SEMRush ا – تبلیغات:

  • همبستگی اسپیرمن با بازدید واقعی: 0.355
  • خطای استاندارد: 0.1561
  • داده های پوشش داده شده: 88.81%

* از آنجا که اندازه نمونه‎ داده‌های‌مان کوچک است و با معیارها و راه های اندازه‌گیری دقت مختلفی سر و کار داریم، این ترتیب ذکر شده بر اساس تجربه شخصی‎ام از ارزش ها‌ی مورد نظر در دقت، پوشش و توزیع داده های جمع آوری شده است.

درک معیار هایی که اینجا ذکر شدند، مهم است. بازدید ماهانه Compete, Quantcast و SimilarWeb و بازدیدهای جستجوی ماهانه SEMRush همگی می توانند مستقیما با بازدید واقعی مقایسه شوند، به همین دلیل این چهار ابزار، معیار‌های اندازه‌گیری بیشتری برایشان آورده شده است. مابقی می توانند تنها با بازدید هایی که بر اساس معیار همبستگی به دست می آیند مقایسه شوند (مثلا؛ برای اعتبار دامنه Moz یا تعداد فالوورهای تیوییتر، راهی برای محسابه درصد داده های بین 70-130% بازدید واقعی نیست، چون معیار ها داده های مشابهی را نمی توانند نشان دهند.)

اما معنی ضریب همبستگی (معیاری که در همه ابزارها قابل قیاس هست) در این مطلب چیست؟ ضریب همبستگی به این صورت نیست که به راحتی مثل درصد زمانی که Compete یا Quantcast یا لایک های فیسبوک که برای سنجش بازدید وبسایت، کاملا دقیق هستند، عمل کند. در عوض، مقدار همبستگی به ما درجه‌ای نسبی از افزایش و کاهش های بازدید می رساند؛ از آنجایی که میزان بازدید احتمال افزایش/کاهش دارد، متعاقبا افزایش/کاهش بازدید در اعدادِ معیار مورد استفاده مشاهده خواهد شد. به عنوان مثال، احتمال دارد Compete، بازدید وبسایت شما را دو برابر آنچه که آمارهای خودتان می گوید، نشان دهد. اما اگر شما نصف بازدید خود را از دست بدهید، معیار سنجش بازدید Compete محتمل تر است که کاهش مربوطه را نمایان کند تا Twitter Followers. به همین ترتیب اگر وبسایت A را با وبسایت B مقایسه می کنید، Compete معمولا دقیقتر از از مابقی ابزار، برای نشان دادن این که بازدید A یا B بیشتر است، عمل می کند.


در زیر لیستی از راه هایی که برای نمایش دقت نسبی، مد نظر گرفته شده آمده است:

  • میانگین معیار/ بازدید واقعی – این عدد به ما می گوید، به طور میانگین، بازدید تخمینی در مقایسه با بازدید واقعی چه فرقی دارد. این عدد نشان می دهد، SimilarWeb بسیار خوشبین به نظر می رسد، به صورتی که در نمونه ما بازدید را تقریبا 400% بازدید واقعی گزارش می دهد. Compete از آن طرف، با تقریب 115% خیلی بهتر عمل می کند. ولی میانگین ها همه چیز نیستند و در واقع، Compete با مجوعه داده‌های بالا و پایین زیادی که داشت این نتیجه را داد تا این که واقعا عدد‌به‌عدد و اغلب نزدیک به واقعیت باشد.
  • درصد داده های بین 70-130% بازدید واقعی – این معیار به ما می گوید که چه درصدی از بازدید تخمینی یک ابزار، در بازه 70 تا 130 درصد داده های واقعی قرار می گیرد. این معیار جایی هست که SimilarWeb بهترین عملکرد را داشت، با ارائه یک تخمین نسبتا دقیق از بازدید که برای نزدیک به 25% از وبسایت های نمونه اینگونه بود. Compete با 8.5%، Quantcast با 3.75% و SEMRush با 1.21% بی‌استفاده به نظر می رسند. با وجود این که SimilarWeb تخمین بازدید ش اغلب بالاتر بوده، قدرتشان در قرار گرفتن در این بازه خیلی بهتر از رقبا بود که باعث می شود برایم در این بخش برگزیده باشد.

  • همبستگی اسپیرمن با بازدید واقعی - اسپیرمن به ما این قابلیت را می دهد تا بدانیم پس از افزایش/کاهش بازدید واقعی، معیار مرتبط ما چه مقدار افزایش/کاهش دارد. Quantcast, Compete و SimilarWeb همگی در این بخش عملکرد خوبی داشتند با همبستگی های بالای 0.8(بیشینه: 1).
    * در آمار، ضریب همبستگی رتبه‌ای اسپیرمن که با حرف یونانی ρ نشان داده می‌شود آماره‌ای ناپارامتری برای سنجش ضریب همبستگی بین دو متغیر تصادفی است.

  • خطای استاندارد – این معیار خطای استاندارد در مقادیر همبستگی را می رساند، که به رساندن حس واریانس کمک خوبی می کند.
    * خطای استاندارد(SE)، انحراف معیار یک توزیع نمونه‌برداری آماری است که برای تخمین انحراف معیار بدست آمده از تعدادی نمونه کاربرد دارد.

  • داده های پوشش داده شده – میزان پوشش از آن جهت مهم است که نشان می دهد که هر سرویس، داده های واقعی چه تعداد از سایت های نمونه ما را در بر داشته است. Moz، Alexa، SimilarWeb و SEMRush همگی بالای 85% وبسایت‌ها را پوشش داده بودند، در حالی که Compete وQunatcast با پوشش کمتر از 35% عملکرد مناسبی نشان ندادند.

بر اساس این داده ها ( که البته با توجه به کوچک بودن نمونه کامل نیستند و 5 تا 10 برابر این نمونه ترجیح داده می شود. با این وجود بسیاری از داده های آماری آورده شده، احتمال یا مقدار تغییرشان خیلی کم است.) تقریب خیلی دقیقی از بازدید کلی نمی توان به دست آورد، با این وجود پیشنهاد من استفاده همزمان از SimilarWeb, Compete و Quantcast هست تا حس بهتری از بازدید نسبی وبسایت ها برایتان به دست بیاید. برای مثال، اگر بخواهید بفهمید که بازدید وبسایت X چقدر است، از SimilarWeb استفاده کنید. اگر می خواهید بازدید دو وبسایت X و Y را مقایسه کنید، ترکیبی از Compete و SimilarWeb بهترین حس از مقدار نسبی بازدید ‌شان را به شما خواهند داد.

در مجموع هیچ کدام از این سرویس ها من را خیلی تحت تاثیر قرار ندادند. هنوز جای پیشرفت خیلی زیادی دارند و در بازه سه ساله از 2012 تا 2015 متاسفانه پیشرفت چشمگیری در این زمینه نداشته اند. مشخصا من از تعداد کثیر بازاریاب های زبر و زرنگ، سرمایه گذاران و تاجرانی که هنوز هم به آمار Alexa اتکا می کنند، شگفت زده می شوم. Moz با این که حتی بازدید وبسایت را هم تخمین نمی زند، مقدار همبستگی مشابهی با Alexa ارائه می دهد که کاملا نشان می دهد Alexa در این رقابت عقب مانده است.

در پایان – آوردن SEMRush دراین مقایسه منصفانه به نظر نمی رسد، از آنجایی که آن‌ها به طور مشخص بازدیدهای از طریق جستجو را ارائه می دهند و ما قصد نداریم نوع داده های آن ها را مورد نقد قرار دهیم. به هر حال از آنجایی که ما در مورد پتانسیل بالقوه SEMRush در این زمینه کنجکاو بودیم و می خواستیم عملکرد آن ها را در قیاس با اعتبار دامنه ای که Moz ارائه می دهد و اعداد Facebook/Twitter بسنجیم، که شاید عده ای به آن علاقه مند باشند.



پ.ن: سرویس Compete از ابتدای سال 2017 بسته شد، در واقع شرکتLondon market research company آن ها را خریداری کرد.

پ.ن2: این مطلب در ژوئن 2015، در این لینک توسط Rand Fishkin نگاشته شده است.

پ.ن3: سری مطلبی با عنوان "سیمیلار وب در مقابل الکسا" نیز قبلا به فارسی ترجمه شده است که در این لینک قابل مشاهده هست.

پ.ن4: همچنین مقایسه های خوبی از الکسا و سیمیلار وب در این لینک و این لینک2 آمده است.

بازدیدسئوالکسابررسی
علاقه‌مند جدی به سینما و فوتبال، نیمه-جدی به جامعه شناسی و تکنولوژی، سطحی به هنر.
شاید از این پست‌ها خوشتان بیاید