خواندن ۳ دقیقه·۶ سال پیش

چشم‌انداز گوگل در حوزه‌ی یادگیری ماشین

کمپانی مادر گوگل، Alphabet، با استفاده از تکنولوژی یادگیری ماشین، قصد دارد فضای کامنت‌گذاری آنلاین را سالم‌ سازد. در واقع گوگل از طریق الگوریتم‌های یادگیری ماشین، سعی دارد فضای کامنت‌گذاری آنلاین را در مقابل حمله ترول‌ها، موارد توهین آمیز و غیر اخلاقی حفظ نماید. به منظور دستیابی به این هدف، Alphabet، تکنولوژی Jigsaw را در اختیار وب سایت‌ها قرار می‌دهد تا بتوانند کیفیت فضای کامنت‌گذاری را برای کاربران خود در سایت ارتقا دهند؛ در نتیجه کاربران، با کامنت‌های اهانت آمیز و غیر اخلاقی مواجه نمی‌شوند و از فضای آنلاین و تعاملات دو طرفه، کناره‌گیری نمی‌کنند. وب‌سایت‌های سرویس گیرنده به منظور دستیابی به نرم افزار Jigsaw، کافی است Perspective را فراخوانی کنند.

چشم‌انداز گوگل، سالم‌سازی کامنت‌ها

در واقع Perspective، یک API است که می تواند به سالم سازی فضای کامنت گذاری و ایجاد گفت‌و‌گو‌های آنلاین سالم، کمک کند. این API از الگو‌های یادگیری ماشین به منظور درک مفاهیم متن نوشتاری استفاده می‌کند. این روش، کامنت‌‌ها را به صورت Real-Time بررسی می‌کند و به کارمندانی که وظیفه‌ی بررسی کامنت‌‌ها را به عهده دارند، کمک می‌کند.
سیستم‌های کامپیوتری یاد‌گیرنده، با استفاده از یادگیری ماشین، برنامه ریزی می‌شوند؛ این سیستم‌ها از طریق ورودی‌های مکرر، روند‌ها و الگو‌ها را فرا می‌گیرند؛ با فراگیری هر چه بیشتر این سیستم‌ها، خروجی‌ها نیز قابل اعتماد‌تر و با کیفیت‌تر می‌شوند. Jigsaw، تعدادی نیروی انسانی، به منظور بررسی صد‌ها هزار کامنت - داده‌های ورودی سیستم‌های یادگیرنده - در اختیار دارد. این افراد، کامنت‌ها را بررسی و برچسب گذاری می‌کنند. بر اساس این برچسب گذاری، Perspective به هر کامنت، از صفر تا صد یک امتیاز می‌دهد. میزان غیر اخلاقی بودن هر کامنت بر اساس امتیازی که از طرف API دریافت می‌کند، مشخص می‌شود.

پروژه ConversationAI

این پروژه تحت عنوان ConversationAI است و با همکاری نیویورک‌تایمز، ویکی‌پدیا و Jigsaw انجام می‌شود. هدف این پروژه، افزایش مشارکت کاربران و بهبود کیفیت گفت‌و‌گو‌های آنلاین می‌باشد. ConversationAI، به دنبال پاسخ سوالات زیر است:

یادگیری ماشین چگونه می‌تواند به گفت‌و‌گو‌های آنلاین کمک کند؟
چه جنبه‌ها‌یی از یک متن کامنت، برای یادگیری ماشین قابل فهم است؟
ریسک‌ها و چالش‌های استفاده از یادگیری ماشین در گفت‌و‌گو‌های آنلاین چیست؟

یکی از چالش‌های اصلی در تحقیقات یادگیری ماشین، محدودیت در حجم داده‌ها‌ی با کیفیت بالا، به منظور ارتقا بحث‌های آنلاین است. بر این اساس، نیویورک‌تایمز اعلام کرد که آرشیو کامنت‌های خود را به منظور بهبود الگوریتم‌های یادگیری ماشین در اختیار Jigsaw گذاشته است.

در حال حاضر کامنت‌ها در نیویورک‌تایمز به صورت دستی و توسط ۱۴ کارمند بررسی می‌شوند که روزانه به طور متوسط ۱۱‌هزار کامنت را بررسی می‌کنند. بررسی کامنت‌ها توسط نیروی انسانی زمان بر است به همین دلیل نیویورک‌تایمز تنها برای ۱۰٪ از مقالات خود بخش کامنت را باز گذاشته است!

چرا نیویورک‌تایمز به کامنت‌های کاربران خود نیاز دارد!

اگر کامنت‌های درون وب‌سایت‌ها به درستی مدیریت نشوند، فضای گفت‌و‌گو به یک فضای منزجر‌کننده تبدیل می‌شود که درآن کاربران تمایلی برای مشارکت در گفت‌و‌گو‌ها ندارند. در این زمینه مقالات بسیاری منتشر شده است، با وجود همه‌ی این مقالات و اطلاعات، باز شاهد کامنت‌های غیر اخلاقی و توهین آمیز در فضای مجازی هستیم که باعث می‌شوند تمایل افراد برای بر‌قراری ارتباط، شرکت در گفت‌و‌گو‌های آنلاین و فعالیت در این فضا کم شود. همانطور که گفته شد، بررسی دستی کامنت‌ها زمان بر است، بر همین اساس بسیاری از کسب‌و‌کار‌ها یا وب‌سایت‌های خبری، بخش کامنت گذاری را در سایت غیر فعال می‌کنند. غیر‌فعال کردن این بخش، کسب و کار را از حالت تعاملی به سمت یک سویه بودن سوق می‌دهد.

به نقل از کوهن، مدیر Jigsaw، پروژه ConversationAI، در مراحل اولیه است؛ این پروژه با گذشت زمان و دریافت کامنت‌های بیشتر که همان داده‌های ورودی الگوریتم یادگیری ماشین هستند، از کیفیت مطلوب‌تر و قابل اطمینان‌تر برخوردار خواهد شد.

این مقاله در بلاگ نظربین نیز منتشر شده است.

نظربین یادگیری ماشین

نظربین

سامانه هوشمند تحلیل و سالم‌سازی محتوا

شاید از این پست‌ها خوشتان بیاید