ترویج دانش برای دانشآموزان و دانشجویان کشور
هم نامهی نانوشته خوانی
سیستمهای پیشنهاددهنده
نویسنده: فائزه لباف
تو زندگی روزمره، ما بارها و بارها، حتی بدون اینکه متوجه بشیم، به موقعیتهای تصمیمگیری وارد میشیم. صبح برای بیرونرفتن چه لباسی بپوشم؟ چه غذایی رو در رستوران انتخاب کنم؟ چه کتابی بخونم یا چه فیلمی ببینم؟
در گذشته ما معمولاً از دوستانمون یا افراد باتجربه میخواستیم که در این تصمیمها کمکمون کنند. این روزها راههای دیگهای هم جلوی روی ما هست. همون طور که کتابدار یا مسئول کتابفروشی میتونه در انتخاب کتاب موردعلاقهمون کمکمون کنه، یه وبسایت فروش کتاب یا یه شبکهی اجتماعی مربوط به کتاب (مثل goodReads) هم میتونه به ما کمک کنه. یا مثلاً ویدیوهایی که YouTube پیشنهاد میده، همگی براساس سرچها و بازدیدهای قبلی ماست که معمولاً هم ما رو خوشحال و راضی میکنند.
سیستمهای پیشنهاددهنده، در مقایسه با راه اول که استفاده از تجربیات دوستانمونه، یک مزیت بزرگ دارن. اون مزیت هم اینه که مثلاً YouTube پیشنهاد خودش رو بر اساس بزرگترین کتابخونهی ویدیویی جهان ارائه میده در حالی که بینش جمعی دوستان ما، تنها بخش کوچکی از اون کتابخونهاس. به این ترتیب میتونیم آهنگهای گروههایی رو کشف کنیم که تا به حال نشنیدیم و احتمالاً دوستانمون هم نشنیده بودند و نمیتونستند به ما پیشنهادشون بدن، ولی اتفاقاً ما خیلی هم از اون پیشنهادها خوشمون میآد. مثل اینه که همه در جهان ناخواسته، از طریق سیستم پیشنهاددهنده، به ما در انتخاب ویدئو یا آهنگی که دوست داریم کمک میکنند.
این سیستمها امروزه خیلی دوروبَر ما دیده میشن. فروشگاههای آنلاین سعی میکنند نیاز ما رو کشف کنند و با پیشنهاددادن محصولات درست، ما رو ترغیب کنند که از اونا خرید کنیم. شبکههای اجتماعی مثل اینستاگرام، پینترست و ... با شناختن سلیقهی ما سعی میکنن تا کاری کنند که ما تجربههای لذتبخشی داشته باشیم. گوگل اطلاعات زیادی از طریق سرویسهای مختلفش از کاربرهاش به دست میاره و از اون اطلاعات برای نشوندادن تبلیغات مرتبط به کاربرها استفاده میکنه. احتمالاً تا به حال برای شما هم پیش اومده باشه که در حال استفاده از این سرویسها تعجب کنید که چطور شما رو به این خوبی میشناسند و چطور میتونن بدون اینکه لب تر کنید، همون چیزی که دوست دارید رو بهتون پیشنهاد بدن.
ولی این سیستمها چطور کار میکنند؟
دو نوع روش کلی برای طراحی یک سیستم پیشنهاددهنده وجود داره؛ روش مبتنی بر تعامل (Collaborative methods) و روش مبتنی بر محتوا (Content-based methods).
مثلاً یه سیستم پیشنهاد فیلم مثل سیستم پیشنهاددهندهی Netflix رو درنظر بگیرید.
در روش مبتنی بر تعامل، سیستم به تعامل بین کاربرها و فیلمهای سایت توجه میکنه؛ مثلاً اینکه هر کاربری چه فیلمهایی رو دیده، چه فیلمهایی رو دوست داشته و ... . سیستم همهی کاربرها و تعاملشون با فیلمهای مختلف رو وارد یه جدول میکنه و بعد بر اساس این تعاملها، کاربرهایی که سلیقهی نزدیک به هم دارند رو پیدا میکنه و حدس میزنه که فیلمی که یکی از اونها دوست داشته، دیگری هم دوست خواهد داشت و اون فیلم رو بهش پیشنهاد میده.
در روش مبتنی بر محتوا، سیستم علاوه بر فیلمها و کاربرها، اطلاعات اضافهای هم دربارهی اونها ذخیره میکنه؛ مثلاً برای کاربر، سن، جنسیت، محل زندگی و ... و برای فیلمها، ژانر، نویسنده و کارگردان، بازیگرها، کشور و سال تولید و ... . حالا سعی میکنه که بر اساس این اطلاعات، ویژگیهایی رو دربیاره که فعالیتهای کاربرها رو توجیه کنه. مثلاً اینکه عموم پسرهای جوان از فیلمهای فلان کارگردان خوششون میاد یا خانمهای میانسال ایرانی از فلان ژانر فیلم بیشتر خوششون میاد.
اگر بتونیم این ویژگیها رو به دست بیاریم، کار ما آسون میشه؛ فقط لازمه که به اطلاعات کاربر نگاه کنیم و بر اساس ویژگیها، فیلم درست رو بهش پیشنهاد بدیم.
هریک از دو روش گفته شده در بالا، مزایا و معایبی داره. (میتونید مزایا و معایب هرکدوم رو بگید؟)
در عمل، معمولاً روشی که استفاده میشه ترکیبی از دو روش کلی بالاست. خیلی از سیستمهای پیشنهاددهنده هم، از روشهای خلاقانهی دیگهای که برای کار خاص خودشون سودمنده، استفاده میکنند. با این حال، همهی سیستمهای پیشنهاددهنده با هر روش و مدلی که پیاده شده باشند، وابسته و نیازمند اطلاعات هستند. اون سیستم پیشنهاددهندهای برندهس که اطلاعات دقیقتر و قاطعانهتری دربارهی کاربرانش به دست بیاره و بتونه کاربرهاش رو بهتر بشناسه تا پیشنهادهای بهتری بهشون بده. امروزه سیستمهای مختلف، روشها و ترفندهای مختلفی (و گاهی عجیبوغریبی) رو برای بهدستآوردن اطلاعات از کاربرهاشون به کار میگیرن. با یکم توجه به اطرافمون، میتونیم این ترفندها رو ببینیم. شما در اطرافتون چی میبینید؟ با انجام چه کارهایی به سیستمها کمک میکنید که شما رو بهتر بشناسن؟
مطلبی دیگر از این انتشارات
پرونده یادگیری ماشین برای نوجوانان، قسمت دوم
مطلبی دیگر از این انتشارات
جزیرۀ اژدهاهای چشمسبز
مطلبی دیگر از این انتشارات
اولین کارگاه دادهکاویِ مدرسهٔ تابستانهٔ علوم کامپیوتر