خواندن ۲۲ دقیقه·۵ سال پیش

طراحی بهترِ سامانه‌های ارزیابیِ آنلاین

ارزیابی‌های آنلاین دارند شیوه‌های انتخاب محصول و خدماتِ مشتریان را متحول می‌کنند: برای برنامه‌ریزیِ تعطیلات‌مان از TripAdvisor کمک می‌گیریم، برای پیداکردنِ پزشک به Zocdoc رجوع می‌کنیم، و برای یافتنِ رستوران‌های جدید سراغ Yelp می‌رویم. سامانه‌های ارزیابی نقشی مرکزی در بازارگاه‌های آنلاینی مثل آمازون و Airbnb ایفا می‌کنند. در نگاهی کلّی‌تر، سازمان‌های روزافزونی—از مرکز مراقبت‌های پزشکیِ استنفورد (Stanford Health Care) گرفته تا نُه‌تا از 10 خرده‌فروشِ برترِ آمریکا—اکنون به سامانه‌های ارزیابی‌ای مجهزند که کاربران را با کالاهای جدیدشان آشنا می‌کنند.

سامانه‌های ارزیابی، چنانچه به‌درستی مدیریت شوند، چه برای خریدکنندگان و چه برای فروشندگان ارزش‌آفرین خواهند بود. سامانه‌های قابل‌اعتماد می‌توانند خیالِ مصرف‌کنندگان را هنگام خرید محصولاتِ نسبتاً ناآشنا، مثلاً یک کتاب جدید یا غذاخوردن در یکی از رستوران‌های منطقه، راحت کنند. برای مثال، پژوهشی که مایکل لوکا (Michael Luca)—یکی از نویسندگانِ این نوشتار—انجام داد مشخص کرد که امتیازهای بالاتر در Yelp به فروش بیشتر می‌انجامد. این سازوکار برای کسب‌وکارهای مستقلی که هنوز برای خودشان اعتبارِ گسترده‌ای دست‌وپا نکرده‌اند مؤثرتر عمل می‌کند. ارزیابی‌ها همچنین چرخه‌ی بازخوردی تولید می‌کنند که اطلاعات ارزشمندی در اختیار عرضه‌کنندگان قرار می‌دهد: مثلاً، امتیازها به اوبِر (Uber) کمک می‌کند که رانندگانِ بد را از سرویسش حذف کند و راهنمایی‌ست برای تولیدکنندگانِ محصولاتِ مصرفی جهت ارتقای آنچه عرضه می‌کنند.

اما در مقابلِ سامانه‌های ارزیابیِ شکوفا سامانه‌هایی نیز هستند که بی‌ثمرند: نه ارزیابی‌کنندگان را جذب می‌کنند و نه کاربرانی دیگر را. برخی هم هستند که ارزیابی‌های انبوهی انباشت می‌کنند اما به‌علّت شیوه‌ی ناکارآمدِ اطلاعات‌دهی‌شان قادر به جلب اعتماد مشتریان نیستند. مثلاً، اگر همه‌ی ارزیابی‌های داخل یک پلتفرم مثبت باشد، ممکن است مردم فکر کنند که همه‌ی اقلامش باکیفیت‌اند—یا ممکن است فکر کنند که آن سامانه نمی‌تواند در تشخیص اقلامِ خوب از بد کمکی به آن‌ها کند. ارزیابی‌ها می‌توانند گمراه‌کننده باشند اگر که تصویر ناقصی از تجربه‌ی کاربران را بازنمایی کنند. ارزیابی‌های جعلی می‌توانند وبال گردنِ پلتفرم‌هایی شوند که در تکاپوی جلب اعتماد کاربران‌اند. مایکل لوکا و جورجیوس سرواس (Georgios Zervas) طی پژوهشی دریافتند که تجارت‌ها مخصوصاً زمانی دست‌به‌دامنِ ارزیابی‌های ساختگی می‌شوند که اعتبارشان رو به افول نهاده باشد یا درگیر رقابت شدیدی باشند.

بالابردن ارزش ریویوهای یک پلتفرم به بهبود دائمی شیوه‌های امتیازگیری بستگی دارد

ناکامیِ تعداد بالایی از سامانه‌های ارزیابی، به یک فرضِ شایع برمی‌گردد: این‌که ساختنِ چنین سامانه‌هایی یک‌جور چالش فنی است تا مدیریتی. رهبرانِ تجاری غالباً پول زیادی پای فناوریِ پشتِ این سامانه‌ها می‌ریزند اما از مدیریتِ فعالانه‌ی محتوا غافل می‌مانند و، به این طریق، به مشکل برمی‌خورند. عملکرد ضعیف در انتخاب‌های مربوط به طراحیِ سامانه‌ها می‌تواند عواقب ناگواری به‌دنبال داشته باشد: اگر میزبانان در Airbnb راهی برای اعتباراندوزی (که عمدتاً به ارزیابی‌ها وابسته است) نداشتند، به همین راحتی نمی‌توانستند اعتماد مسافران را جلب کنند؛ یا اگر آمازون به سامانه‌ی ارزیابی مجهز نبود، خریدکنندگان قادر نبودند کالاهای موردنیازشان را به این راحتی‌ها پیدا کنند. هیانجین کیم (Hyunjin Kim) و مایک به مطالعه‌ی انتخاب‌های طراحانه‌ای (design choices) پرداخته‌اند که برخی پلتفرم‌های آنلاین را به موفقیت می‌رساند و برخی دیگر را با شکست مواجه می‌کند و با Yelp و شرکت‌های دیگری برای کمک در این زمینه همکاری کرده‌اند (کیم از کارآموزان پژوهش اقتصادیِ شرکتِ Yelp است). همچنین، جف دوناکر (Geoff Donaker)، که بیش از دو دهه مدیریت ارشد عملیاتیِ Yelp را برعهده دارد، کمک کرد تا سامانه‌ی ارزیابیِ این شرکت به یکی از منابع برجسته‌ی اطلاعاتیِ جهانی برای خدمات محلی تبدیل شود.

ارزیابی‌های سراسرمثبت در پلتفرم‌ها کمکی به تشخیص اقلام مرغوب و نامرغوب نمی‌کنند.

در سال‌های اخیر، مجموعه‌ی روزافزونی از پژوهش‌ها به کندوکاو انتخاب‌های طراحانه‌ای پرداخته‌اند که می‌توانند به ساخت سامانه‌های ارزیابی و اعتباراندوزیِ مؤثرتری بینجامند. در این نوشتار، بر مبنای پژوهش‌ها، آموزش‌ها، و همکاری‌هایمان با شرکت‌های گوناگون، چارچوب‌هایی برای مدیریت سامانه‌های ارزیابی ارائه می‌دهیم و مشکلاتی را که ممکن است رخ نمایند روشن‌تر می‌کنیم و نیز انگیزه‌ها و انتخاب‌های طراحانه‌ای برای اجتناب از تله‌های رایج معرفی می‌کنیم. هر یک از این معضلات را زیر ذره‌بین می‌گذاریم و طریقه‌ی برخورد با آن‌ها را توضیح می‌دهیم.

ارزیابی‌های ناکافی

وقتی Yelp کارش را شروع کرد، ذاتاً پلتفرمِ جدیدی بود—مثل یک‌جور شهر ارواح، با ارزیابی‌کنندگان و دنبال‌کنندگانِ انگشت‌شمار. سامانه‌های ارزیابیِ زیادی با کمبود ارزیابی مواجه می‌شوند، به‌ویژه در ابتدای کارشان. اگرچه بیشترِ افراد موقع خرید ارزیابی‌ها را می‌خوانند تا آگاهانه‌تر عمل کنند، درصد بسیار کمی از آن‌ها خودشان در پلتفرم‌هایی که استفاده می‌کنند ارزیابی می‌نویسند. این مشکل، با توجه به اثرات شبکه‌ایِ قویِ ارزیابی‌ها، وخیم‌تر می‌گردد: جذب ارزیابی‌نویسان در پلتفرمی که دنبال‌کنندگانِ اندکی دارند و جذب دنبال‌کنندگان در پلتفرمی که ارزیابی‌نویسانِ اندکی دارد بسیار دشوار است.

سه رویکرد پیش می‌نهیم که می‌تواند تعداد ارزیابی‌ها را به مقدار لازم برساند: تأمین ارزیابیِ سیستم، انگیزه‌بخشی، و جمع‌بستنِ ارزیابی‌های محصولاتِ مشابه. ترکیبِ مناسبِ این رویکردها بستگی دارد به عواملی همچون این‌که آن سامانه در کجای مسیر رشد قرار دارد، چه تعداد محصولات مجزایی خواهد داشت، و این‌که خودِ سامانه برای چه اهدافی راه‌اندازی شده است.

تأمین ارزیابی (seeding)

پلتفرم‌های نوپا می‌توانند ارزیابی‌نویس استخدام کنند یا از ارزیابی‌های موجود در پلتفرم‌های دیگر بهره بگیرند (با بستنِ قرارداد شراکت و استنادِ مناسب). شرکت Yelp، برای آفریدنِ ارزشِ کافی‌ای که کاربرانِ یک شهرِ جدید را به‌سمت پلتفرم بکشاند تا ارزیابی‌های خودشان را بنویسند، «نیروی» پاره‌وقتی استخدام کرد که به‌مدت چند ماه عکس و ارزیابی‌های مختلف تهیه کنند تا این‌که پلتفرم کم‌کم جا بیفتد. شراکت با پلتفرم‌هایی که به‌طور تخصصی در حوزه‌ی ارزیابی فعالیت می‌کنند نیز می‌تواند برای برخی شرکت‌ها ارزش‌آفرین باشد—هم برای کسب و کارهایی که می‌خواهند اکوسیستمِ ارزیابیِ خودشان را راه بیندازند و هم برای آنهایی که می‌خواهند ارزیابی‌ها را به‌نمایش بگذارند اما نمی‌خواهند خودشان برایش پلتفرم بسازند. شرکت‌هایی مثل آمازون و مایکروسافت از ارزیابی‌های داخل Yelp و پلتفرم‌های دیگر برای جذب کاربر استفاده می‌کند.

رویکرد تأمین ارزیابی خصوصاً می‌تواند در مراحلِ آغازینِ پلتفرم‌هایی که در پی رشد اکوسیستمِ ارزیابیِ خودشان‌اند مفید عمل کند، چون نیاز به برندی جاافتاده برای انگیزه‌بخشی به فعالیت را حذف می‌کند. اما داشتنِ طیف وسیعی از محصولات یا خدمات می‌تواند هزینه‌ی این کار را بالا ببرد و ارزیابی‌هایی که می‌گیرید ممکن است با ارزیابی‌های کاربران داخلی تفاوت پیدا کند؛ به همین خاطر، شاید برای برخی پلتفرم‌ها—بسته به اهداف‌شان—بهتر باشد که هرچه سریع‌تر از این مرحله گذر کنند.

انگیزه‌بخشی

انگیزه‌دادن به کاربرانِ پلتفرم‌تان برای ارزیابی‌نویسی و امتیازدهی می‌تواند بسیار سودمند باشد و همچنین برایشان احساس تعلق ایجاد کند. این انگیزه می‌تواند مالی باشد: سال 2014، Airbnb به‌ازای ارزیابی‌نویسی یک کوپن 25 دلاری در نظر گرفت و با افزایش 6.4 درصدیِ نرخِ ارزیابی‌ها مواجه شد. اما انگیزه‌های غیرمالی—مثل هدایای غیرنقدی یا نمادهای رتبه‌بندی—نیز می‌توانند برای ارزیابی‌نویسی انگیزه‌بخش باشند، به‌ویژه اگر که برندتان جاافتاده باشد. کاربران در برنامه‌ی راهنمای محلیِ گوگل هر بار که در پلتفرم مشارکتی می‌کنند (مثل نوشتن ارزیابی، گذاشتن عکس، اصلاح محتوا، یا پاسخ‌دادن به سؤالات)، امتیاز می‌گیرند، که سپس می‌توانند در ازای امتیازهایشان جایزه بگیرند: از دسترسیِ زودهنگام به محصولاتِ جدیدِ گوگل گرفته تا افزایش رایگانِ 1 ترابایتیِ گنجایشِ گوگل‌درایو. «نیروی سرآمدِ» (elite squad) پُرفعالیت و کاردرست از ارزیابی‌نویسان Yelp، علاوه بر دریافت عناوینِ متمایزکننده در پلتفرم و مزایای جانبیِ دیگر، به مهمانی‌ها و دورهمی‌های خصوصی نیز دعوت می‌شوند.

انگیزه‌دهیِ مالی، درصورتی‌که محصولاتِ متنوعی داشته باشید، می‌تواند برایتان چالش‌هایی بیافریند. اما نگرانیِ مهم‌تر باید این باشد که اگر انگیزه‌بخشی‌ها، چه مالی چه غیرمالی، به‌درستی طراحی نشده باشند، می‌توانند عملکردِ معکوس داشته باشند و باعث شوند کاربرانِ زیادی به نوشتنِ ارزیابی‌های عجولانه و بی‌دقت روی آورند که برای مشریانِ دیگر فایده‌ای ندارد.

جمع‌بستن ارزیابی‌ها

با بازبینیِ بخشِ ارزیابی، می‌توانید یک دیدگاه را به چند محصول بسط دهید. مثلاً در Yelp، آرایشگرانی که در یک سالن زیبایی کار می‌کنند ذیل یک مدخلِ سالنِ واحد مورد ارزیابی قرار می‌گیرند. این روش باعث می‌شود که Yelp بتواند ارزیابی‌های بسیار بیشتری برای هر کسب‌وکاری فراهم کند، چون ارزیابیِ هرکدام از آرایشگرهای مجزا در برگه‌ی کسب‌وکارِ مربوطه به‌نمایش درمی‌آید. علاوه بر آن، از آن‌جایی که آرایشگرهای این سالن‌ها زودبه‌زود عوض می‌شوند، محبوبیتِ سالن دست‌کم به‌اندازه‌ی خودِ آرایشگر برای مشتریانِ احتمالی اهمیت دارد. به همین ترتیب، پلتفرم‌های ارزیابی‌کننده نیز ممکن است بتوانند برای تولید ارزیابی‌های سودمندتر، از کاربران‌شان بخواهند که فروشندگان را ارزیابی‌کنند—مثل ای‌بِی (eBay)—تا این‌که به‌طور مجزا برای یک محصول ارزیابی بنویسند.

اگر از همان ابتدا تصمیم بگیرید که می‌خواهید از این روش استفاده کنید—و اگر بله، چگونه—می‌تواند برایتان بسیار مفید واقع شود، زیرا مشخص می‌کند که هدف پلتفرم دقیقاً چیست. (قرار است جایی باشد که مردم درباره‌ی آرایشگرها اطلاعات کسب کنند یا درباره‌ی سالن‌های زیبایی؟) جمع‌بستن ارزیابی‌ها وقتی روش جذاب‌تری می‌شود که گستره‌ی محصولات‌تان افزایش می‌یابد، چون اقلامِ بیشتری برای جمع‌بستنِ مؤثر خواهید داشت.

هرچند، یکی از خطرهای این رویکرد این است که جمع‌بستنِ محصولات برای دریافتِ ارزیابی‌های بیشتر ممکن است باعث شود که مشتریان‌تان نتوانند به اطلاعاتِ موردنیازشان به یک محصول خاص دسترسی یابند. مثلاً باید این نکته را در نظر بگیرید که آیا رفتن نزد این یا آن آرایشگر در یک سالنِ زیباییِ واحد تفاوت چشم‌گیری را رقم می‌زند یا نه؛ همچنین ببینید که آیا ارزیابیِ یک آرایشگر موضوعیتی برای مشتریان احتمالی خواهد داشت یا خیر.

آمازون در جمع‌بستنِ ارزیابی‌های کتاب‌فروشی‌اش فرمت کتابی را که کاربر می‌خواهد بخرد دخیل می‌کند. ارزیابی‌های مربوط به نسخه‌های متنیِ کتابِ واحد (گالینگور، شمیزی، و کیندل) کنار هم به‌نمایش درمی‌آیند، اما ارزیابی‌های کتاب‌های صوتی جداگانه‌اند و جزو برند Audible قرار می‌گیرند. جمع‌بستن ارزیابی‌های کتاب‌های صوتی و چاپی برای کاربری که می‌خواهد درباره‌ی محتوای کتاب اطلاعات کسب کند مفید خواهد بود، اما چون کیفیت تولید کتاب صوتی و اطلاعاتِ مربوط به روایت‌گر نزد خریدارانِ کتاب‌های صوتی جزو عواملِ مهم محسوب می‌شوند، احتمالاً جدانگه‌داشتنِ این ارزیابی‌ها سودمندتر است.

هر یک از این راهبردها می‌توانند در برطرف‌کردنِ مشکل کمبود ارزیابی‌ها کمک‌تان کنند تا درنتیجه‌ی پیوستنِ خوانندگانِ بیشتر به پلتفرم و سودبردن‌شان، بخش تولید محتوا به حالتی خودبسنده دربیاید. هرچند، پلتفرم‌ها باید نه‌تنها چشم‌شان به تعداد ارزیابی‌ها دوخته باشد بلکه باید میزان اطلاع‌دهی‌شان را نیز در نظر داشته باشند، که ممکن است تحت‌تأثیرِ سوگیریِ گزینشی و تخطی‌گری قرار گیرند.

سوگیریِ ادراک گزینشی

آیا تابه‌حال ارزیابیِ آنلاین نوشته‌اید؟ اگر بله، چه چیزی باعث شد تصمیم بگیرید که برای آن موردِ خاص ارزیابی بنویسید؟ پژوهش‌ها نشان داده که دیدگاه‌گذاشتنِ کاربران به کیفیت تجربه‌شان وابسته است. در برخی وبسایت‌ها، احتمال دارد مشتریان وقتی ارزیابی بنویسند که تجربه‌شان خوب بوده باشد و در برخی دیگر وقتی که تجربه‌شان خیلی خوب یا خیلی بد بوده باشد. در هر مورد، امتیازدهیِ کاربران می‌تواند گرفتار سوگیریِ ادراک گزینشی شود: ممکن است طیف کامل تجربیات کاربرانِ آن محصول را به‌درستی بازنمایی نکند. مثلاً، اگر فقط افرادِ راضی نظر بگذارند، امتیازها به‌طور ساختگی بالا خواهند رفت. سوگیریِ ادراک گزینشی در کسب‌وکارهایی که فقط مشتریانِ خرسند را به نظرگذاشتن ترغیب می‌کنند می‌تواند شدیدتر باشد.

ای‌بِی در سال 2011 با معضل ادراک گزینشی مواجه شد: درواقع متوجه شد که امتیاز فروشندگانش به‌طرز مشکوکی بالاست. بیشترِ فروشندگان بالای 99 درصد امتیاز مثبت داشتند. این شرکت از اقتصاددانانی به‌نام کریس نوسکو (Chris Nosko) و استیون تادلیس (Steven Tadelis) کمک گرفت و دریافت کاربرانی که تجربه‌ی رضایت‌بخشی داشتند خیلی بیشتر از بقیه در گذاشتن ارزیابی شرکت می‌کردند: از 44 میلیون معامله‌ای که در وبسایت صورت گرفته بود، فقط 0.39 درصد ارزیابی یا امتیاز منفی دریافت کرده بودند، اما تعداد کسانی که «تیکت شکایت» باز کرده بودند ]کاری که برای کاربر زمان‌برتر و انرژی‌برتر است[ بالای دوبرابر بیشتر بود (1 درصد) و نیز بالای هفت‌برابر بیشتر از کاربران (3 درصد) هم پیام‌هایی به فروشندگان ارسال کرده بودند که از نارضایتی‌شان خبر می‌داد. این نشان داد که ارزیابی‌-نوشتن یا -ننوشتنِ خریدکنندگان، در مقایسه با امتیاز فروشندگان، بهتر شکایت‌های آتی را پیش‌بینی می‌کرد و درنتیجه نشانه‌ی قابل‌اعتمادتری برای کیفیت‌سنجیِ محصولاتِ ارائه‌شده‌ی فروشندگان بود.

برخی وبسایت‌ها فقط وقتی ارزیابی دریافت می‌کنند که تجربه‌ی کاربران‌شان خیلی خوب یا خیلی بد بوده باشد.

ای‌بِی برآورد کرد که می‌تواند تجربه‌ی خریداران و درنتیجه خودِ فروش‌ها را با تصحیح سوگیریِ گزینشیِ امتیازدهی‌ها و متمایزکردنِ بهترِ فروشندگانِ مرغوب ارتقا بخشد. در این راستا، درصدِ کُلِ امتیازهای مثبتی را که صرفاً از معاملات به‌دست آمده بود (و نه درصدِ کلّیِ امتیازهای مثبت) را مبنای امتیازِ نمایش‌داده‌شده‌ی فروشندگان قرار داد. این اقدام میانه‌ی امتیازهای فروشندگان را به 67 درصد تغییر داد و باعث توزیعِ چشم‌گیر امتیازها در بین آن‌ها شد—و مشتریان احتمالی‌ای که با امتیازهای جدید روبه‌رو می‌شدند، در مقایسه با گروهِ کنترل، بیشتر احتمال داشت که به وبسایت برگردند و دوباره خرید کنند.

با رصدکردنِ امتیازها در پلتفرم‌تان به چنین شکلی، می‌توانید ببینید که آیا امتیازها تحریف شده‌اند یا نه، اوضاع چه‌قدر بد است، و این‌که آیا داده‌های بیشتر می‌توانند در حل این مشکل کمک‌تان کنند یا خیر. همه‌ی سامانه‌های ارزیابی را می‌توان به‌گونه‌ای طراحی کرد که از سوگیری‌های احتمالیِ دست‌اندرکارش کاسته شود. در کُلِ فرایند ارزیابی—از درخواستِ آغازین تا پیام‌هایی که کاربران با نوشتن ارزیابی‌هایشان دریافت می‌کنند—فرصت‌هایی در اختیارمان قرار می‌گیرد که کاربران را به‌سمت رفتارهای کمتر سوگیرانه سوق دهیم. آزمودن انتخاب‌های طراحانه‌ی مختلف می‌تواند کمک‌مان کند که سوگیری‌های ادراک گزینشیِ کاربران یا هر نوع گرایش به نوع خاصی از امتیازدهی را محدودتر کنیم.

نوشتن ارزیابی را الزامی کنید.

یکی از رویکردهای سخت‌گیرانه‌تر این است که کاربران را به نوشتن ارزیابی از خریدِ قبلی‌شان ملزم کنید تا اجازه پیدا کنند خرید بعدی‌شان را انجام دهند. اما با احتیاطِ کامل به این میدان وارد شوید: چراکه ممکن است مشتریان‌تان را از پلتفرم بپرانید یا پلتفرم‌تان را با سیلابی از امتیازدهی‌های پرتی که کاربران به‌طور پیش‌فرض به همه‌ی اقلام می‌دهند روبه‌رو کنید—که امتیازها را مغشوش می‌کند و منجر به پدیدآمدنِ خطایی دیگر در ارزیابی‌ها می‌شود. به همین دلیل، پلتفرم‌ها غالباً سراغ روش‌های دیگری برای کمینه‌کردنِ سوگیریِ ادارک گزینشی می‌روند.

به کاربران امکان ارسال دیدگاه خصوصی بدهید.

دو اقتصاددان به‌نام جان هورتون (John Horton) و جوسف گولدن (Joseph Golden) دریافتند که در وبسایت ارزیابی فریلنسرِ Upwork کارفرمایان، پس از تجربه‌ی بدی که با یک فریلنسر پیش آمده بود، از ارسال ارزیابی‌های عمومی امتناع می‌کردند اما مایل بودند بازخوردهایی بفرستند که فقط مدیران وبسایت Upwork بتوانند ببینند. (کارفرمایانی که به‌طور خصوصی گزارشِ تجربه‌ی کاریِ منفی می‌دادند همچنان در حالت عمومی نزدیک به 20 درصدِ اوقات بالاترین بازخوردِ ممکن را ارسال می‌کردند.) این امکانْ اطلاعاتِ ارزشمندی در اختیار Upwork گذاشت: هم درباره‌ی این‌که چه وقت‌هایی کاربران مایل به ارسال یا عدم ارسال ارزیابی بودند و هم درباره‌ی این‌که کدام فریلنسرها مشکل‌سازند. Upwork می‌توانست از این اطلاعات بهره ببرد تا الگوریتمی را که کارفرمایان و فریلنسرها را به هم وصل می‌کند عوض کند و بازخوردی کلّی از فریلنسرها به‌دست دهد. ارائه‌ی این بازخوردِ کلّی روی استخدام فریلنسرها اثرگذار بود، که از موضوعیت‌داشتنِ این اطلاعاتِ مضاعف خبر می‌دهد.

در طراحی درخواست ارسال ارزیابی دقت به‌خرج دهید.

در یک حالت کلّی‌تر، ارزیابی‌هایی که مردم ارسال می‌کنند به این بستگی دارد که چه‌طور و چه زمانی از آن‌ها درخواست می‌شود که این کار را بکنند. پلتفرم‌ها می‌توانند با طراحیِ مدبرانه‌ی محیطی که کاربران در آن تصمیم به ارزیابی‌نویسی می‌گیرند، از سوگرفتگیِ ارزیابی‌ها بکاهند. این رویکرد، که اغلب معماریِ انتخاب نامیده می‌شود—اصطلاحی که کاس سانستاین (Cass Sunstein) و ریچارد تیلر (Richard Thaler)، نویسندگان کتاب سقلمه: بهبود تصمیمات درباره‌ی تن‌درستی، ثروت، و خوشبختی، جا انداختند—از چگونگیِ درخواستِ ارزیابی از کاربران تا گزینه‌هایی را که به آنان ارائه می‌شود در بر می‌گیرد.

در یکی از آزمایش‌هایی که در Yelp انجام دادیم، پیام‌های درخواست ارزیابی‌مان را برای کاربران تغییر دادیم. برخی کاربران با پیام ساده‌ی «نوبت ارزیابیِ بعدی‌ست» مواجه شدند و از برخی دیگر درخواست شد که به کسب‌وکارهای محلی کمک کنند تا شناخته شوند یا کمک کنند مصرف‌کنندگانِ دیگر هم بتوانند این کسب‌وکارهای محلی را بیابند. متوجه شدیم که گروه دوم معمولاً ارزیابی‌های طولانی‌تری می‌نوشتند.

ارزیابی‌های جعلی و استراتژیک

گاهی فروشندگان (با زیرپاگذاشتنِ اخلاق) خودشان را مصرف‌کننده‌ی واقعی جا می‌زنند و می‌کوشند تا با ارسال ارزیابیِ مثبت برای خودشان یا ارزیابیِ منفی برای رقیبان‌شان، امتیاز خودشان را بالا بکشند. این عمل تحت عنوان ارزیابی‌بافی (astroturfing) شناخته می‌شود. هرچه ابعاد پلتفرم بزرگ‌تر باشد، افرادِ بیشتری دست به این کار خواهند زد.

به‌دلیل مضرات ارزیابی‌بافی برای مصرف‌کنندگان، سیاست‌گذاران و قانون‌گذاران نیز وارد عمل شده‌اند. سال 2013، اریک اشنایدرمن (Eric Schneiderman)، دادسِتانِ وقتِ نیویورک، برای برخورد با این معضل دست‌به‌کار شد—و نتایج پژوهش‌مان را بخشی از انگیزه‌ی این کارش اعلام کرد. اشنایدرمن با 19 وبسایتی که به نوشتنِ ارزیابی‌های جعلی در پلتفرم‌های آنلاین کمک کرده بودند وارد مذاکره شد، ملزم‌شان کرد که از این کار دست بکشند، و جریمه‌ی سنگینی بابت مجموعه‌ای از اتهامات از جمله تبلیغات دروغین و توسل به رویّه‌های تجاریِ فریبنده بپردازند. اما کسب‌وکارها نمی‌توانند صرفاً روی اجرای قانون به‌دستِ دولت تکیه کنند؛ درست مثل مقابله با سرقت، برای مقابله با ارزیابی‌های جعلی نیز آن‌ها می‌باید تدابیر حفاظتیِ خودشان را هم تدارک ببینند. همان‌طور که لوکا و جورجیوس زرواس (Georgios Zervas) در مقاله‌ای اشاره کرده‌اند، برخی شرکت‌ها، مثل Yelp، برای شناسایی شرکت‌هایی که به گذاشتنِ ارزیابی‌های جعلی روی می‌آورند و برخورد با آن‌ها اقدامات بسیار جدّی‌ای انجام می‌دهند.

چالش مشابهی وقتی بروز می‌کند که خریدکنندگان و فروشندگان به همدیگر امتیاز می‌دهند و ارزیابی‌هایشان را طوری ارائه می‌دهند که امتیازهای بالاتری از طرف مقابل دریافت کنند. آخرین باری را که در Airbnb خانه گرفتید در نظر بگیرید. پس از اتمام کار، از شما درخواست شد که ارزیابی‌ای از میزبان‌تان ارسال کنید و از او هم خواستند که ارزیابی‌ای از شما بنویسد. تا سال 2014، اگر شما ارزیابی‌تان را قبل از میزبان‌تان می‌نوشتید، او می‌توانست آن را بخواند و بعد تصمیم بگیرد که چه‌طور ارزیابی‌اش از شما را تنظیم کند. نتیجه؟ احتمالاً در ارسال ارزیابی‌های منفی مردّد می‌شدید.

انتخاب‌های طراحانه‌ و مدیریت محتوای پلتفرم نقش مهمی در کاهش تعداد ارزیابی‌های جعلی و استراتژیک دارند.

برای ارزیابی‌نویسان قانون تعیین کنید.

انتخاب‌های طراحانه از این‌جا شروع می‌شوند که چه کسی می‌تواند ارزیابی بنویسد و ارزیابی‌های چه کسی برجسته خواهد شد. مثلاً، آمازون آیکونی برای ارزیابی‌نویسانی که خریدشان تأیید شده در نظر گرفته است، که به مصرف‌کنندگان کمک می‌کند حواس‌شان به ارزیابی‌های جعلیِ احتمالی باشد. اکسپدیا (Expedia) پا را از این فراتر می‌گذارد و صرفاً به مهمانانی که از طریقش بلیت خریده‌اند اجازه‌ی ارزیابی‌نویسی می‌دهد. پژوهشی از دینا مایزلین (Dina Mayzlin)، یانیو دُوِر (Yaniv Dover)، و جودِس شوالایر (Judith Chevalier) نشان می‌دهد که چنین رویّه‌ای می‌تواند از ارزیابی‌های جعلی بکاهد. در عین حال، قوانین محدودکننده‌ی ارزیابی‌نویسی می‌تواند ابزار نامؤثری از کار درآید که تا حد زیادی از تعداد ارزیابی‌ها و ارزیابی‌نویسان واقعی کم می‌کند. پلتفرم‌ها باید تعیین کنند که آیا کاهش ارزیابی‌های جعلیِ احتمالی به‌قیمتِ دریافت ارزیابی‌های واقعیِ کمتر می‌ارزد یا خیر.

هرقدر هم که سیستم‌تان عالی طراحی شده باشد، به مدیریت محتوا نیاز دارید.

پلتفرم‌ها همچنین می‌توانند تعیین کنند که ارزیابی‌ها چه زمانی می‌توانند ارسال شوند و به‌نمایش درآیند. Airbnb، بعد از این‌که متوجه شد کسانی که ارزیابی نمی‌نویسند به‌طور سیستماتیک تجربه‌ی بدتری از ارزیابی‌نویسان داشته‌اند، قانون «نمایش همزمان» را گذاشت تا از تأثیر ارزیابی‌های مهمانان و میزبانان روی هم جلوگیری کند و امکان بازخورد کامل‌تری را فراهم آورَد. در این پلتفرم، امتیازدهی‌ها تا زمانی که هر دو طرف نظرشان را ارسال نکرده باشند نمایش داده نمی‌شود و مهلتی هم مشخص شده که امکان ارسال ارزیابی به‌پایان می‌رسد. پس از این تغییرات، آندری فرادکین (Andrey Fradkin)، النا گرووال (Elena Grewal)، و دیوید هولتز (David Holtz) طی پژوهشی دریافتند که میانگین امتیازهای مهمانان و میزبانان، هر دو، کاهش یافت اما درصدِ ارزیابی‌نویسی بالا رفت—که نشان می‌دهد ارزیابی‌نویسان وقتی که از مواجهه با مقابله‌به‌مثل در امان بودند از ارسال بازخورد از تجربیات بدشان بیمِ کمتری داشتند.

مدیریت محتوا را فراموش نکنید.

هرقدر هم که سیستم‌تان عالی طراحی شده باشد، ناگزیر به مشکلاتی برخواهید خورد. ممکن است سروکلّه‌ی اسپم‌ها پیدا شود. ممکن است پای افراد خاطی به سیستم‌تان باز شود. ممکن است ارزیابی‌هایی که دو سال پیش موضوعیت داشتند امروز بلااستفاده شوند. و برخی ارزیابی‌ها هم اصولاً از برخی دیگر مفیدترند. مثلاً، می‌توان ارزیابیِ غیرخریداران را حذف کرد اما برخی از ارزیابی‌هایی که باقی خواهند ماند همچنان گمراه‌کننده یا نه‌چندان مطلع‌کننده خواهند بود. با اِعمالِ مدیریت، می‌توان ارزیابی‌های گمراه‌کننده را بر مبنای محتوایشان، و نه صرفاً نویسنده یا تاریخ ارسال‌شان، حذف کرد.

محتوا را می‌توان از سه طریق مدیریت کرد: استخدام کارمند، مجموعه‌ی کاربران، و الگوریتم. کارمندانِ مدیریت‌کننده (که اغلب مدیرانِ مجموعه می‌نامندشان) می‌توانند در طول روز به‌طور فعالانه به استفاده از خدمات، تعاملِ آنلاین با دیگر کاربران، حذف محتوای نامناسب، و ارائه‌ی بازخورد به مدیریت بپردازند. این گزینه از همه پرهزینه‌تر است اما می‌تواند به‌سرعت شما را در جریان نقاط قوت و ضعفِ سیستم‌تان بگذارد و خیال‌تان را آسوده بگذارد که شخصی هست که تمام‌وقت آن‌چه را که روی وبسایت قرار می‌گیرد تحت نظر دارد.

در شیوه‌ی مدیریتیِ مجموعه‌ی کاربران، همه‌ی کاربران می‌توانند محتوای ضعیف را شناسایی کرده و گزارش دهند: از ارزیابی‌های ماشینی گرفته تا اسپم‌ها و دیگر تخطی‌های مشابه. Yelp آیکونِ ساده‌ای تعبیه کرده که کابران می‌توانند از آن برای گزارش ارزیابی‌هایی که در آن به ارزیابی‌نویسِ دیگری توهین شده یا به‌نظر می‌رسد که برای شرکت دیگری نوشته شده است استفاده کنند. آمازون نظر کاربران را درباره‌ی میزان سودمندیِ ارزیابی‌ها می‌پرسد و، طبق آن، تصمیم می‌گیرد که کدام ارزیابی‌ها را بالاتر از بقیه نشان دهد و کدام موارد را حذف کند. اما غالباً درصد کمی از کاربران‌اند که بی‌کیفیتیِ ارزیابی‌ها را گزارش می‌دهند؛ به همین خاطر، توده‌ی مؤثری از کاربرانِ فعال نیاز است تا سیستمِ گزارش‌دهیِ مجموعه جواب دهد.

استفاده از الگوریتم سومین رویکردی‌ست که می‌توان در مدیریت محتوا اتخاذ کرد. نرم‌افزار پیشنهاددهیِ Yelp روزانه، طبق ده‌ها عامل مختلف، ارزیابی‌ها را بررسی می‌کند و موارد برجسته‌تر را با برچست «پیشنهادی» از بقیه جدا می‌کند. در سال 2014، این شرکت اعلام کرد که در هر برهه‌ای از زمان، کمتر از 75 درصدِ ارزیابی‌ها از این برچسب برخوردار بوده‌اند. آمازون، گوگل، و TripAdvisor الگوریتم‌های ارزیابی‌سنجی کار گذاشته‌اند که محتوای توهین‌آمیز را از پلتفرم‌هایشان حذف کند. البته، الگوریتم‌ها می‌توانند از چنین عملکردِ دوگانه‌ای فراتر روند و، درعوض، تعیین کنند که هر ارزیابی چه‌قدر برجسته شود. لوکا با همکاریِ دیِزی دای (Daisy Dai)، جینجر جین (Ginger Jin)، و جانگمین لی (Jungmin Lee) در مقاله‌ای به مشکل جمع‌بندیِ امتیازها اشاره می‌کند و خاطرنشان می‌کند که برجسته‌سازیِ امتیازدهی‌های مختلف می‌تواند به چالش‌های موجود در فرایند ارزیابی‌نویسی پاسخ دهد.

ختم کلام

تجربه‌ی دیگران همیشه منبع اطلاعاتیِ مهمی درباره‌ی کیفیتِ محصولات بوده است. مثلاً، آکادمی پزشکان خانواده‌ی آمریکا (American Academy of Family Physicians) می‌گوید افراد نظر دوستان و فامیل را برای انتخابِ پزشکان و دریافت توصیه‌های مربوطه جویا می‌شوند. پلتفرم‌های ارزیابی این فرایند را سریع‌تر و سازمان‌یافته‌تر کرده‌اند و باعث شده‌اند بهره‌مندی از تجربیاتِ دیگران برای مردم دسترس‌پذیرتر گردد. ارزیابی‌های آنلاین هم برای مشتریان و هم برای پلتفرم‌ها و نیز سیاست‌گذاران سودمند بوده‌اند. برای مثال، ما از داده‌های Yelp برای فهم چگونگیِ تغییرات محلات در دوره‌های اعیانی‌سازی (gentrification) استفاده کردیم تا تأثیری را که بالارفتنِ پایه‌حقوق روی کسب‌وکارها می‌گذارد ببینیم. اما برای این‌که ارزیابی‌ها مفید باشند—مفید برای مصرف‌کنندگان، فروشندگان، و عموم مردم—مدیرانِ سیستم‌های ارزیابی می‌باید نسبت به انتخاب‌های طراحانه‌شان و چگونگیِ بازتابِ حداکثریِ تجربیاتِ کاربران دقت به‌خرج دهند.

ترجمه مقاله Designing Better Online Review Systems از HBR

مترجم: محمد رسول علیزاده

پلتفرم آنلاین

بازار خدمات سنجاق

اینجا مقاله های نوشته‌شده یا دست‌چین شده تیم «بازار خدمات سنجاق» را منتشر می‌کنیم. هر چیزی که به رشد بینش ما نسبت به بازار، کسب و کارهای جدید و مفاهیم و تعاریف تازه نیروی کار می‌انجامد.

شاید از این پست‌ها خوشتان بیاید