مدتیست استراتژی، فناوری و بانکداری را تجربه میکنم. بخشی از نوشتههایم در ویرگول به دلیل مدیریت سازمان، نوآوری و تجربه کارآفرینی است و بخش دیگر از دانش گذشتهام در باب رسانه.
سامانههای توصیهگر نتفلیکس | مقالات تحلیل تلویزیون و صنعت ویدئو | ۳
در مقاله قبلی به ریشههای شکلگیری سامانههای توصیهگر پرداختم. از مسئله انتخاب حداکثری نوشتم و اینکه راه رسیدن به رفاه بیشتر در داشتن انتخابهای بیشتر نیست و داشتن سرویسی با هزاران فیلم و تبلیغ آن نمیتواند برای یک پلتفرم ارزش آفرین باشد. بعد از آن با الهام گرفتن از کتاب «آینده نزدیک» توصیهگری را یکی فناوریهای آینده ساز معرفی کردیم.
این مقاله و مقاله قبلی برگرفته از ارائه ای است که در جمع مدیران پلتفرم «فیلمگردی» با موضوع سیستمهای توصیهگر داشتم و بخشهایی از آن را به طور خلاصه برای استفاده عمومی در ویرگول مینویسم.
سامانه توصیهگر ترجمه عبارات recommendation system یا recommender system است.
انواع سامانههای توصیهگر نتفلیکس
پژوهشها درباره مصرفكنندگان حكايت از آن دارند كه مخاطب نتفليكس ۱۰ تا ۲۰ عنوان را بر روي يك يا دو صفحه مرور ميكند و پس از حدود ۶۰تا ۹۰ثانيه نسبت به اين امر بيعلاقه ميگردد. در اين اثنا يا كاربر محتواي جالبي را پيدا ميكند يا اينكه ريسك ترك خدمات نتفلیکس به ميزان قابل توجهي افزايش مييابد. سيستم توصيه محتوا ميخواهد اطمينان حاصل كند كه هر يك از كاربران بر روي دو صفحه محتواي جالبي را براي تماشا پيدا ميكند و همچنين ميخواهد بداند چرا محتواي مربوطه جالب و جذاب قلمداد ميشود.
نتفلیکس صفحه اصلی خود را که با ورود کاربر به سایت نمایش داده میشود، «کاتالوگ» مینامد و فرمولهای ویژه ای برای به دست آوردن سایز کارامد کاتالوگ ارائه میدهد. سایز کارآمد کاتالوگ تعداد ویدئوهایی است که کاربران در کل کاتالوگ تماشا میکنند.
۱- رتبهگر ویدئوهای سفارشی
معمولاً حدود ۴۰ رديف محتوا در هر صفحه اصلي بسته به قابليتهاي دستگاه مربوطه وجود دارد و هر رديف تا ۷۵ ويدئو را در خود جاي ميدهد. اين ارقام بسته به سختافزارها و تجارب كاربري در هر دستگاه فرق دارند.
این الگوریتم در واقع ویدئوهای هر ردیف را برای کاربر سفارشی سازی میکند. رتبهگر ويدئوهاي سفارشي همچنين زماني بهتر كار ميكند كه سيگنالهاي سفارشيسازي شده را با محبوبيت فيلم تلفيق ميكند.
۲- رتبهگر ویدئوهای تاپآن
هدف از اين الگوريتم پيدا بهترين توصيههاي سفارشي شده براي هر كاربر در كل كاتالوگ؛ اين به معناي تمركز صرف بر روي بالاترين رتبههاست و ممكن است محتوا از دستهبنديهاي گوناگوني انتخاب شود. رتبهگر تاپآن و رتبهگر ويدئوهاي سفارشي از جهاتی شبيه هم هستند و براي مثال فرآيند سفارشيسازي را با محبوبيت تلفيق ميكنند و روندهاي مشاهده را در قالب بازههاي زماني مختلف از روزانه گرفته تا سالانه شناسايي و مدنظر قرار ميدهند.
۳- محتوای باب روز
نتفلیکس همچنين روندهاي موقتي كوتاه مدت از چند دقيقه گرفته تا چند روز به مثابه پيشبينيگرهاي قدرتمند ويدئوهايي میداند كه كاربران تماشا خواهند كرد. بدين ترتيب يك رتبهگر مبتني بر روندها در نتفلیکس فعال است. دو نوع روند هستند كه بخوبي توسط اين رتبهگر شناسايي ميشوند: (1) روندهايي كه هرچند ماه يكبار تكرار ميشوند و هنگام تكرار باز هم تأثير كوتاه مدت دارند، نظير افزايش تماشاي محتواي عاشقانه در روز ولنتاين در آمريكاي شمالي، و (2) رويدادهاي نادر و كوتاه مدت نظير توفان قريبالوقوع در مناطق مسكوني پرجمعيت كه توسط رسانههاي گوناگون پوشش داده ميشود و موجب افزايش علاقهمندي كوتاه مدت به مستندها و فيلمهاي سينمايي درباره هاريكان و ديگر بلاياي طبيعي ميشود.
این رتبهگر در واقع توسط کارشناسان محتوایی نتفلیکس و بر اساس تگهایی که ویدئوها دارند در زمانهای خاص فعال میشود.
۴- ادامه تماشا
با توجه به محتواي اپيزوديك كه در چند نوبت تماشا شدهاند و همچنين اختيار عمل در زمينه تماشاي محتواي غيراپيزوديك، يك الگوريتم رتبهبندي ويدئويي مهم ديگر رتبهگر ادامه تماشا نام دارد كه محتوا را در رديف «ادامه تماشا» مرتب ميسازد.
اكثر رتبهگرهاي نتفلیکس عناوين تماشا نشدهاي كه صرفاً دربارهشان اطلاعات استنباطي دارد را دستهبندي ميكنند.
برعكس، رتبهگر ادامه تماشا زيرمجموعهاي از عناوين بهتازگي تماشا شده را دستهبندي ميكند، آنهم بر مبناي اينكه آيا كاربران قصد ازسرگيري تماشا يا تماشاي مجدد دارند، يا آيا كاربران از تماشاي يك محتوا دست كشيدهاند به اين دليل كه آنقدرها كه انتظار ميرفت جالب نيست.
نتفلیکس از سیگنالهای متفاوتی برای فهمیدن اینکه آیا کاربر همچنان علاقه مند به ادامهی تماشا است استفاده میکند. یکی از اصلیترین این سیگنالها مدت زمان تماشای قبلی کاربر است.
۵- شباهت ویدئوها
الگوريتم شباهت ويدئوها يك الگوريتم غيرسفارشي است كه فهرست رتبهبندي شدهاي از ويدئوها ــ موارد مشابه ــ را براي هر ويدئوي موجود در كاتالوگ محاسبه ميكند .اگرچه رتبهبندي شباهت ويدئوها ماهيت سفارشي ندارد، اما انتخاب اينكه كدام رديف «آنچه شما ديدهايد» در صفحه اصلي گنجانيده ميشود يك فرآيند سفارشي شده است و زيرمجموعه ويدئوهاي «آنچه شما ديدهايد» كه در رديف مربوط به اين ويدئوها ارائه شده از فرآيند سفارشيسازي بهره ميبرد.
* منظور از سفارشي ارائه پيشنهاد منحصر به فرد براي هر كاربر است.
۶- ایجاد صفحه: انتخاب ردیفها و رتبهبندی
ويدئوهايي كه براي هر رديف انتخاب ميشوند برآوردی از بهترين ويدئوهاي قابلعرضه به يك كاربر مشخص را بازتاب ميدهند. اما اكثر كاربران در هر نوبت سلايقشان فرق ميكند و بسياري از حسابهاي كاربري توسط چند نفر از اعضاي خانواده استفاده ميشوند. با ارائه منتخب متنوعي از رديفها، میتوان به كاربران كمك کرد تا ويدئوهايي كه براي زمانهاي ديگر، موقعيتهاي ديگر، يا ديگر اعضاي خانواده مناسب هستند را به آساني رد كنند و محتواي مطلوبنظر خود را فوراً پيدا كنند.
الگوريتم ايجاد صفحه از نهادههاي همه الگوريتمهاي فوقالذكر بهره ميگيرد تا تك تك صفحات توصيه محتوا را ايجاد كند و در اين راستا اهميتي كه هر رديف از محتوا براي كاربر دارد و تنوع صفحه را نيز مدنظر قرار ميدهد.
۷- شواهد و قرائن
الگوريتمهای گفته شده در كنار هم سيستم توصيه محتواي نتفليكس را تشكيل ميدهند. اما الگوريتمهاي ديگري نظير الگوريتمهاي گزينش شواهد نيز موجود هستند كه با همكاري الگوريتمهاي توصيه محتواي تجربه نتفليكس را شكل ميدهند و به كاربران كمك ميكنند كه ببينند آيا ويدئوي مربوطه براي آنها مناسب است يا نه. منظور از شواهد در واقع همه اطلاعاتي است كه بر روي قسمت سمت چپ بالاي صفحه نشان داده میشود از جمله اين موارد: امتياز پيشبينيشدهاي كه در كانون جايزه نتفليكس قرار داشت؛ خلاصه داستان فيلم، ديگر حقايق نظير جايزهها، بازيگران، يا ديگر فرادادهها كه درباره ويدئو نشان داده ميشوند؛
الگوريتمهاي گزينش شواهدمحور همه شواهد و قرائني كه میتوان در ارتباط با هر توصيه به نمايش گذاشت را مورد ارزيابي قرار ميدهند و تعداد معدودي از آنها كه به زعم نتفلیکس براي كاربر مفيد هستند را گزينش ميكنند.
۸- جستجو
سيستم توصيه محتواي نتفلیکس بر روي اكثر صفحات محصول از جمله صفحه اصلي استفاده ميشود و در مجموع فرآيند انتخاب حدود ۸ درصد از ساعات پخش آنلاين در نتفليكس را از خود متأثر ميسازد. ۲۰ درصد باقيمانده به جستجو مربوط ميشود كه الگوريتمهاي مختص خود را داراست. كاربران بطور مرتب ويدئوها، بازيگران، يا ژانرهايي را در كاتالوگ جستجو ميكنند. نتفلیکس از تكنيك بازيابي اطلاعات و تكنيكهاي مربوطه جهت يافتن ويدئوهاي مرتبط و نمايش آنها براي كاربر بهره میگیرد. با اين حال، از آنجا كه كاربران اغلب به دنبال ويدئوها، بازيگران، يا ژانرهايي هستند كه در كاتالوگ موجود نيست يا مفاهيم كلي را جستجو ميكنند، در نتيجه حتي فرآيند جستجو نيز با مقوله توصيه محتوا ارتباط پيدا ميكند. در چنين مواردي، فرآيند جستجو ويدئوهايي را بهعنوان نتايج جايگزين براي يك جستجوي ناموفق توصيه ميكند. ميزان بالاي ناخالصي متون موجود بر روي صفحه تلويزيون حكايت از آن دارد كه تفسير دو يا سه حرف در قالب آنچه نتفلیکس درباره سليقه كاربر میداند نيز حائز اهميت است.
ارزش تجاری سامانههای توصیهگر برای نتفلیکس
سيستم توصيه محتواي نتفلیکس به آن كمك ميكند در بزنگاهها موفق عمل کند: هنگامي كه يكي از كاربران به تماشاي محتوا مينشيند، سیستم كمك میکند که محتواي جالب و جذابي را ظرف چند ثانيه پيدا كند و مانع آن میشود كه وي به خاطر يك سرگرمي جايگزين ديگر از خدمات نتفلیکس چشمپوشي كند.
فرآيند سفارشيسازي كمك ميكند حتي براي محتواي خاصي كه مخاطب ناچيزي دارد و جهت پخش از تلويزيون يا كانالهاي كابلي مقرونبهصرفه نيستند، مخاطب پيدا کند. اين دادهها نشان ميدهند كه سيستم توصيه محتواي در مقايسه با يك سيستم غيرسفارشي به نحو مساويتري محتواي ويدئويي را جهت تماشا عرضه ميكند. جهت بيان دقيقتر اين مسئله، در ادامه يك مقياس سنجشي مشخص ارائه میشود.
سايز كاتالوگ كارآمد (ECS) يك مقياس سنجشي است كه نشان ميدهد نحوه توزيع تماشا در ميان آيتمهاي موجود در كاتالوگ به چه شكل است. اگر بخش اعظم موارد تماشا به تنها يك ويدئو مربوط شود، عدد نزديك به 1 است. اگر همه ويدئوهابه مقدار مساوي تماشا شوند، عدد نزديك به تعداد ويدئوهاي موجود در كاتالوگ خواهد بود.
بدون فرآيند سفارشيسازي، ويدئوهاي يكساني به همه كاربران توصيه میشود. در نمودار سمت چپ، خط سياه در نمودار نشان ميدهد سايز كاتالوگ كارآمد در نبود فرآيند توصيهگر با افزايش تعداد ويدئوها افزايش مييابد. اين فرآيند با پرطرفدارترين ويدئو شروع ميشود و با حركت به سمت راست بر روي محور ايكس، ويدئوي پرطرفدار بعدي افزوده ميشود. خط قرمز در همان نمودار نشان ميدهد سايز كاتالوگ كارآمد نه بهعنوان تابعي از ويدئوهايي كه اضافه میشود، بلكه بهعنوان تابعي از تعداد سامانههاي توصيهگر افزايش مييابد.
خط سياه در واقع سايز كاتالوگ كارآمد است كه بهعنوان تابعي از تعداد پرطرفدارترين ويدئوهاي موجود در كاتالوگ ترسيم شده و از 1 تا N )تعداد ويدئوهاي موجود در كاتالوگ( را بر روي محور ايكس شامل ميشود. خط قرمز به مثابه سايز كاتالوگ كارآمد براي اولين k از ويدئوهاي رتبهبندي شده توسط سامانههاي توصيهگر براي هر كاربر است. در اين حالت سايز كاتالوگ كارآمد در خط قرمز حدود 4 برابر آن در خط سياه است. مقادير در محورهاي ايكس و ايگرگ به دلايل رقابتي نشان داده نشدهاند.
مسئله مهمتر اينكه، سفارشيسازي به نتفلیکس امكان ميدهد تا احتمال موفقيت خود را هنگام توصيه محتوا به ميزان زيادي افرايش دهد. مقياس سنجشي كه اين مسئله را اندازهگيري ميكند «مقياس پذيرش» است. يعني آن بخش از محتواي توصيهشده كه در نهايت پخش ميشود. دو خط موجود در نمودار سمت راست بالا نمايانگر نرخ پذيرش هستند. يكي از آنها تابعي از محبوبيت ويدئو و ديگري تابعي از رتبه ويدئو در زمان استفاده از توصيهگر است. افزايش نرخ پذيرش بهواسطه توصيه محتوا حائز اهميت است. اما مهمتر از همه اينكه، فرآيند توصيه محتوا هنگامي كه به درستي تدوين و استفاده شود به افزايش چشمگير ارتباط با محصول (مثلاً ساعت پخش محتواي آنلاين( و كاهش نرخ لغو اشتراك ميانجامد.
نرخ لغو اشتراك ماهيانه نتفلیکس ۷درصد است به این معنا که ۹۳درصد کاربران هر ماه اشتراک خود را تمدید میکنند. كه دليل آن نه تصميم مشتركان جهت لغو خدمات بلكه عدم پرداخت پول توسط آنها است. نتفلیکس بر اين باور است كه تأثير تلفيقي سفارشيسازي و توصيه محتوا موجب صرفهجويي در هزينه به ميزان سالانه 1 ميليارد دلار ميشود.
امیدوارم این مقاله ارزش کافی را برای خاطب محترم فراهم آورده باشد. اگر فرصتی بود در آينده الگوریتمهای فنیتر سامانههای توصیهگر را بحث خواهم کرد.
امیرحسین خان احمدی
مطلبی دیگر از این انتشارات
گزارشی از چالش استدلال و انتزاع ـ سایت کَگل
مطلبی دیگر از این انتشارات
الگوریتم و فلوچارت به زبان ساده
مطلبی دیگر از این انتشارات
هوش مصنوعی؛ زیبا و در عین حال ترسناک