گزارش اولین سری رویداد Traceway در زمینه هوش مصنوعی و یادگیری ماشین

سری رویدادهای Traceway قرار است فضایی برای انتقال تجربه و شبکه‌سازی توسعه‌دهندگان ارشد کشور باشد. در هر رویداد توسعه‌دهندگان ارشد سازمان‌های ایرانی و بین‌المللی تجربیات خود را با سایر توسعه‌دهندگان به اشتراک خواهند گذاشت و با تشریح تجربیات فنی خود در طراحی و پیاده‌سازی فناوری‌های روز دنیا، مسیر پیش روی سایر سازمان‌ها را در استفاده از هر فناوری روشن‌تر خواهند کرد.

دوره اول:‌ هوش مصنوعی و یادگیری ماشین

دوره اول رویدادهای Traceway چهاردهم آذرماه در دانشگاه صنعتی شریف برگزار شد. تمرکز این دوره بر روی «هوش مصنوعی و یادگیری ماشین» بود و رویداد از سه بخش اصلی تشکیل می‌شد:

  • بخش ۱، ارائه‌های بلند: در این بخش توسعه‌دهندگانی از چهار شرکت دیجی‌کالا، مسیریاب بلد، کافه‌بازار و تپسل، تجربیات خود را در استفاده از «هوش مصنوعی» در محصولات‌شان به تفصیل بیان کردند.
  • بخش ۲، ارائه‌های کوتاه: در این بخش سه شرکت سلام سینما، ویرگول و واکاویک در قالب Ignite (سخنرانی‌های کوتاه ۵ دقیقه‌ای) به معرفی بخش فنی محصول خود پرداختند.
  • بخش ۳، شبکه‌سازی: این بخش برای ایجاد ارتباط بین مهمانان رویداد با یکدیگر، و در ادامه پرسش‌وپاسخ با سخنرانان در قالب یک بازه زمانی ۱ ساعته صورت گرفت.

اگر به دیدن سخنرانی‌های این رویداد علاقه دارید می‌توانید از طریق این لینک در لحظه‌نگار و با استفاده از کد تخفیف virgool_user به ویدئوهای ضبط شده دسترسی داشته باشید.

خلاصه‌ای از ارائه‌های اصلی رویداد

خلاصه ارائه ۱. عباس حسینی از شبکه تبلیغات موبایلی تپسل

عباس حسینی در Trace Way شرح داد که چگونه تپسل با پیش‌بینی رفتار کاربران در مواجهه با هر آگهی، مرتبط‌ترین تبلیغ را به هر کاربر نمایش می‌دهد.

اکوسیستم تبلیغات به این صورت است که همیشه گروهی از تبلیغ‌دهنده‌ها را داریم که می‌خواهند تبلیغ خودشان را نشان دهند و مخاطبان بیشتری را بدست آورند، و از طرفی رسانه‌هایی را داریم که میخواهند از طریق این تبلیغات درآمدزایی داشته باشند. چالش اصلی این است که این دو گروه به صورت یک‌به‌یک نمی‌توانند با هم ارتباط برقرار کنند. DSP یا به عبارتی Demand Side Platformها بسترهایی هستند که به تبلیغ‌دهنده‌ها سرویس می‌دهند و هدفشان این است که با کمترین هزینه و بهترین حالت بتوانند تبلیغ‌دهنده‌ها را به اهدافشان برسانند. از طرفی SSPها یا به عبارتی Supply Side Platformها به نمایش‌دهنده‌ها متصل می‌شوند و سعی می‌کنند با بالاترین قیمت فضای تبلیغاتی را به فروش برسانند.

چالش اصلی که در این کار وجود دارد این است که این پلتفرم‌ها می‌خواهند از تبلیغ‌دهنده کمترین هزینه را بگیرند و به نمایش‌دهنده بیشترین درآمد را بدهند. برای برطرف کردن این مشکل از مکانیزم Exchange استفاده شده است به این ترتیب که داخل Exchange مزایده‌ای برگزار می‌شود که طبق آن مکانیزم تبلیغ به جایگاه‌ها فروخته میشود.

اگر بخواهیم به طور دقیق‌تر بیان کنیم، وقتی یوزر وارد یک صفحه می‌شود و آن صفحه هم یک جایگاه تبلیغاتی دارد، در این لحظه یک درخواست به گوگل ارسال می‌شود. گوگل در این لحظه به DSPهای مختلفی که به آن متصل هستند این خبر را می‌دهد. از طرفی DSPها باید با استفاده از DMPها (Data Management Platform) یکسری مشخصات از کاربر را جمع آوری کنند تا از علایق کاربر باخبر شوند. سپس توسط یک مزایده تبلیغ در جایگاه مشخصی قرار می‌گیرد.

پس از این معرفی اولیه، عباس حسینی درباره موضوعاتی مانند DSP Turnover Rate، مکانیزم‌ها و فرمول‌های یادگیری ماشین و روش‌های Deep و Factorization Machines برای پردازش و مدیریت Requestهای شبکه‌های تبلیغاتی صحبت کرد.

خلاصه ارائه ۲. علی چلمقانی از تیم هوش مصنوعی کافه‌بازار

علی چلمقانی محصول پردازش زبان‌های طبیعی (NLP) کافه‌بازار را تشریح کرد. استفاده‌هایی که از این محصول در «چت دیوار» شده و نتایجی که بعد از آن در پی داشته است.

علی چلمقانی در ابتدا به ساختار تیم‌های کافه بازار در سه محصول اصلی بازار، دیوار و بلد اشاره کرد که هر کدام دارای زیر محصول و دارای تیم‌های جدا هستند.

علی چلمقانی سپس در مورد چت دیوار و زمان انتشار این محصول صحبت کرد و نشان داد که چه‌طور با تحلیل محتوایی متنی چت دیوار و با دسته‌بندی داده‌ها، توانستند میزان موفقیت آگهی‌های دیوار را افزایش دهند. یکی از چالش‌ها در این راستا این بود که آماده کردن دیتاست در حوزه چت کار آسانی نبود و نمی‌توانستند مدلی از داده‌ها به وجود بیاورند تا به Intent Classification چت برسند. برای این کار محتوای چت‌ها را دسته بندی کردند. مثلا چت‌هایی که در مورد تجهیزات فنی ماشین‌ها (مثل بیمه و مدل و...) بود را در یک دسته قرار دادند و همینطور این روش را برای املاک و... امتحان کردند. حتی مزاحمت‌هایی که در دیوار اتفاق می‌افتاد را از طریق دلیل بلاک کردن کاربر متوجه می‌شدند و در واقع همه این کارها را یادگیری ماشین برایشان انجام میداد.

سیستمی که در حال بهبود آن هستند Smart Suggestions است که از طریق یادگیری ماشین قرار است پیش‌بینی کند سوال بعدی که کاربر ممکن است بپرسد چه خواهد بود.

خلاصه ارائه ۳. پیام آراسته از مسیریاب بلد

پیام آراسته در Traceway درباره پیش‌بینی ترافیک مسیریاب بلد صحبت کرد. موضوعی که می‌تواند با کم‌کردن زمان و مسافت سفرها، مهم‌ترین برتری تکنولوژی مسیریاب‌ها محسوب شود.

پیام داستان نحوه‌ی محاسبه‌ی ترافیک در سطح شهر در اپلیکشین بلد را بازگو کرد و گفت که دانستن میزان ترافیک در زندگیمان قطعاً تاثیرگذار خواهد بود. یکی از کاربردهایی که اپلیکیشن بلد دارد این است که با استفاده از ترافیکِ معابرِ مختلف که در اختیار دارد، زمان رسیدن به مقصد شما را تخمین می‌زند و بهترین مسیر را به شما پیشنهاد می‌دهد. ممکن است فکر کنید داده‌هایی که از آن ترافیک را به دست می‌آوریم از طریق دوربین‌های سطح شهر و یا تصاویر ماهواره‌ای هستند که درواقع هر کدام از این‌ روش‌ها مشکلاتی دارند که باعث می‌شود از آنها استفاده نکنیم. در عوض مسیریاب‌ها دقیقاً از داده‌های خود کاربران استفاده می‌کنند؛ وقتی کاربری با استفاده از اپلیکشن بلد مسیر‌یابی می‌کند، سیگنال‌های GPS او به سرورهای بلد فرستاده می‌شود که می‌توانیم از آنها برای محاسبه‌ی ترافیک لحظه‌ای استفاده کنیم.

برای اینکه بتوانیم به درستی این کار را انجام دهیم از تکنولوژی‌های Big Data همچون Spark و Hadoop در کنار سیستم بک‌اند Live Traffic که خودمون develop کردیم، استفاده می‌کنیم و برای بحث حریم خصوصی (Privacy)، زمانی که شما با اطلاعاتتان مثل شماره تماس و یا ایمیل وارد اپلیکیشن می‌شوید یک سری token به صورت تصادفی ایجاد می‌شود که این tokenهای تصادفی به اطلاعات لاگین شما برگشت‌پذیر نیستند.

همچنین پیام، حضار رو با موضوع نویزی که در سیگنال GPS ارسالی کاربران وجود دارد آشنا کرد و گفت با سیستم Map Matchingی که develop کردیم به چه شکلی این نویز رو برطرف می‌کنیم. بعد از برطرف کردن نویز سیگنال GPS، درباره‌ی نحوه‌ی محاسبه‌ی ترافیک لحظه‌ای با استفاده از مفاهیمی چون Recency و Frequency و مفاهیم آماری و همچنین یادگیری ماشین به صورت تخصصی مطالبی بیان شد.

خلاصه ارائه ۴. حامد دهقانی از فروشگاه دیجی‌کالا

حامد دهقانی ماجرای سیستم توصیه‌گر (Recommendation System) دیجی‌کالا را تعریف کرد. سیستمی که تا همین چند هفته پیش از سرویس‌های خارجی استفاده می‌کرد اما حالا با طراحی و پیاده‌سازی کامل آن در دیجی‌کالا، علاوه بر کاهش هزینه، نتایج بهتری هم در تشخیص علاقه‌مندی‌های کاربران داشته است.

دیجی‌کالا در خصوص سیستم توصیه‌گر از داده‌هایی مثل Business Data و User Event Data استفاده می‌کند که در نهایت به Big Data Storage دیجی‌کالا تبدیل می‌شود تا اپلیکشین‌های توصیه‌گر به خوبی کار کنند. این اپلیکیشن‌ها ویژگی‌هایی از جنس Personalize و Non personalize دارند که این سیستم برای پیشنهادها از Related Product، Aslo bought، Top category و... استفاده می‌کند. حامد دهقانی به این اشاره کرد که دیجی‌کالا میتوانست از Third Party Recommendation استفاده کند اما ترجیح داد خودشان با استفاده از یادگیری ماشین سیستمی را طراحی کنند که علاوه بر کاهش هزینه نتایج بهتری نیز داشته باشد.

اگر علاقه دارید تا مشروح این سخنرانی‌ها را دنبال کنید، دیدن ویدئوهای لحظه‌نگار را از دست ندهید.

خلاصه‌ای از ارائه‌های کوتاه

  • هادی راسخ از سلام سینما گفت در سلام سینما از Recommendation System برای پیشنهاد فیلم مطابق سلیقه کاربران استفاده کردیم. برای شروع از سرویس Prediction.io استفاده کردیم ولی یک سری محدودیت‌هایی داریم که در تلاشیم تا با استفاده از الگوریتم‌های دیگر این موارد را برطرف کنیم.
  • آرمان فاطمی از واکاویک، به اهمیت داده‌های بزرگ و کوچک در کسب‌وکار اشاره کرد و سپس به معرفی واکاویک، سرویس پردازش هوشمند متن فارسی که با استفاده از هوش مصنوعی انجام میشود پرداخت. آرمان فاطمی از اهمیت و پیشرفت هوش مصنوعی در کسب‌کارهای مرتبط با منابع انسانی صحبت کرد.
  • علی آجودانیان از ویرگول اشاره کرد به اینکه پیشنهاد پست‌ها را با توجه به فعالیت‌هایی که کاربران نسبت به خواندن مقاله‌های مختلف دارند انجام دادیم و با استفاده از تجزیه متن مطلبی را پیشنهاد میدادیم که با سلیقه کاربر یکسان است و اکنون هم درحال تست سیستمی هستند که این روند را بهبود داده است.

در این گزارش سعی کردیم به طور خلاصه به سخنرانی‌هایی که در رویداد Traceway ارائه شد اشاره کنیم. در صورتی که تمایل به دانستن جزئیات و دیدن کامل سخنرانی ها دارید، می‌توانید با مراجعه به لحظه‌نگار ویدئوی ضبط شده این رویداد را با کد تخفیف virgool_user خریداری نمایید.