کمپانی مادر گوگل، Alphabet، با استفاده از تکنولوژی یادگیری ماشین، قصد دارد فضای کامنتگذاری آنلاین را سالم سازد. در واقع گوگل از طریق الگوریتمهای یادگیری ماشین، سعی دارد فضای کامنتگذاری آنلاین را در مقابل حمله ترولها، موارد توهین آمیز و غیر اخلاقی حفظ نماید. به منظور دستیابی به این هدف، Alphabet، تکنولوژی Jigsaw را در اختیار وب سایتها قرار میدهد تا بتوانند کیفیت فضای کامنتگذاری را برای کاربران خود در سایت ارتقا دهند؛ در نتیجه کاربران، با کامنتهای اهانت آمیز و غیر اخلاقی مواجه نمیشوند و از فضای آنلاین و تعاملات دو طرفه، کنارهگیری نمیکنند. وبسایتهای سرویس گیرنده به منظور دستیابی به نرم افزار Jigsaw، کافی است Perspective را فراخوانی کنند.
در واقع Perspective، یک API است که می تواند به سالم سازی فضای کامنت گذاری و ایجاد گفتوگوهای آنلاین سالم، کمک کند. این API از الگوهای یادگیری ماشین به منظور درک مفاهیم متن نوشتاری استفاده میکند. این روش، کامنتها را به صورت Real-Time بررسی میکند و به کارمندانی که وظیفهی بررسی کامنتها را به عهده دارند، کمک میکند.
سیستمهای کامپیوتری یادگیرنده، با استفاده از یادگیری ماشین، برنامه ریزی میشوند؛ این سیستمها از طریق ورودیهای مکرر، روندها و الگوها را فرا میگیرند؛ با فراگیری هر چه بیشتر این سیستمها، خروجیها نیز قابل اعتمادتر و با کیفیتتر میشوند. Jigsaw، تعدادی نیروی انسانی، به منظور بررسی صدها هزار کامنت - دادههای ورودی سیستمهای یادگیرنده - در اختیار دارد. این افراد، کامنتها را بررسی و برچسب گذاری میکنند. بر اساس این برچسب گذاری، Perspective به هر کامنت، از صفر تا صد یک امتیاز میدهد. میزان غیر اخلاقی بودن هر کامنت بر اساس امتیازی که از طرف API دریافت میکند، مشخص میشود.
این پروژه تحت عنوان ConversationAI است و با همکاری نیویورکتایمز، ویکیپدیا و Jigsaw انجام میشود. هدف این پروژه، افزایش مشارکت کاربران و بهبود کیفیت گفتوگوهای آنلاین میباشد. ConversationAI، به دنبال پاسخ سوالات زیر است:
یکی از چالشهای اصلی در تحقیقات یادگیری ماشین، محدودیت در حجم دادههای با کیفیت بالا، به منظور ارتقا بحثهای آنلاین است. بر این اساس، نیویورکتایمز اعلام کرد که آرشیو کامنتهای خود را به منظور بهبود الگوریتمهای یادگیری ماشین در اختیار Jigsaw گذاشته است.
در حال حاضر کامنتها در نیویورکتایمز به صورت دستی و توسط ۱۴ کارمند بررسی میشوند که روزانه به طور متوسط ۱۱هزار کامنت را بررسی میکنند. بررسی کامنتها توسط نیروی انسانی زمان بر است به همین دلیل نیویورکتایمز تنها برای ۱۰٪ از مقالات خود بخش کامنت را باز گذاشته است!
اگر کامنتهای درون وبسایتها به درستی مدیریت نشوند، فضای گفتوگو به یک فضای منزجرکننده تبدیل میشود که درآن کاربران تمایلی برای مشارکت در گفتوگوها ندارند. در این زمینه مقالات بسیاری منتشر شده است، با وجود همهی این مقالات و اطلاعات، باز شاهد کامنتهای غیر اخلاقی و توهین آمیز در فضای مجازی هستیم که باعث میشوند تمایل افراد برای برقراری ارتباط، شرکت در گفتوگوهای آنلاین و فعالیت در این فضا کم شود. همانطور که گفته شد، بررسی دستی کامنتها زمان بر است، بر همین اساس بسیاری از کسبوکارها یا وبسایتهای خبری، بخش کامنت گذاری را در سایت غیر فعال میکنند. غیرفعال کردن این بخش، کسب و کار را از حالت تعاملی به سمت یک سویه بودن سوق میدهد.
به نقل از کوهن، مدیر Jigsaw، پروژه ConversationAI، در مراحل اولیه است؛ این پروژه با گذشت زمان و دریافت کامنتهای بیشتر که همان دادههای ورودی الگوریتم یادگیری ماشین هستند، از کیفیت مطلوبتر و قابل اطمینانتر برخوردار خواهد شد.
این مقاله در بلاگ نظربین نیز منتشر شده است.