یک شبکه عصبی کانولوشنی عمیق برای کشف اخبار جعلی

شناسایی اخبار جعلی با شبکه‌های عصبی کانولوشن عمیق
شناسایی اخبار جعلی با شبکه‌های عصبی کانولوشن عمیق

چکیده: با افزایش محبوبیت رسانه‌های اجتماعی و انجمن‌های مبتنی بر وب، توزیع اخبار تقلبی به تهدیدی بزرگ برای بخش‌ها و آژانس‌های مختلف تبدیل شده‌است. این امر اعتماد به رسانه‌ها را کاهش داده و باعث سردرگمی خوانندگان شده‌است. مجموعه عظیمی از تحقیقات در مورد استراتژی‌های هوش مصنوعی برای ردیابی خبر جعلی وجود دارد. در گذشته، بیشتر تمرکز بر طبقه‌بندی نظرات آنلاین و پست‌های مبتنی بر شبکه اجتماعی آنلاین که آزادانه در دسترس هستند، بوده‌است. در این مقاله، ما یک شبکه عصبی کانولوشنی عمیق (‏FNDNet)‏برای تشخیص اخبار جعلی پیشنهاد می‌کنیم. به جای تکیه‌بر ویژگی‌های دستی، مدل ما (‏FNDNet)‏برای یادگیری خودکار ویژگی‌های تبعیض‌آمیز برای طبقه‌بندی اخبار جعلی از طریق لایه‌های پنهان چندگانه ساخته‌شده در شبکه عصبی عمیق طراحی شده‌است. ما یک شبکه عصبی کانولوشنی عمیق (‏سی ان ان)‏برای استخراج ویژگی‌های مختلف در هر لایه ایجاد می‌کنیم. ما عملکرد روش پیشنهادی را با چندین مدل پایه مقایسه می‌کنیم. مجموعه داده‌های بنچ‌مارک برای آموزش و تست مدل مورد استفاده قرار گرفتند، و مدل پیشنهادی به نتایج پیشرفته با دقت ۹۸.۳۶ % در داده‌های تست دست یافت. پارامترهای ارزیابی عملکرد مختلف مانند ویلکاکسون، مثبت کاذب، منفی واقعی، دقت، یادآوری، F۱، و دقت و غیره برای تایید نتایج استفاده شدند. این نتایج پیشرفت‌های قابل‌توجهی را در زمینه تشخیص هویت جعلی در مقایسه با نتایج موجود در ادبیات موضوع نشان می‌دهند و پتانسیل رویکرد ما را برای طبقه‌بندی اخبار جعلی در رسانه‌های اجتماعی تایید می‌کنند. این تحقیق به محققان در گسترش درک کاربرد مدل‌های عمیق مبتنی بر سی ان ان برای آشکارسازی اخبار جعلی کمک خواهد کرد. ​

۱. مقدمه

در طول چند سال گذشته، انتشار اخبار تقلبی به یک مشکل بزرگ تبدیل شده‌است. اخبار تقلبی توسط نیویورک‌تایمز به عنوان "داستان‌های ساخته‌شده برای فریب نوشته می‌شوند" تعریف می‌شود، و آن‌ها در فرمت هایی مشابه با آن‌هایی که توسط آژانس‌های خبری سنتی استفاده می‌شوند، منتشر می‌شوند (‏پان‌، پاولوا، لی، لی، لی، و لیو، ۲۰۱۸)‏. اخبار تقلبی به خاطر کمک به افزایش قطبی شدن سیاسی و درگیری‌های حزبی در زمان‌های اخیر شناسایی شده‌است. نمونه‌های اخیر شامل مناقشاتی بود که در طول مبارزات انتخاباتی ریاست‌جمهوری سال ۲۰۱۶ برای ایالات‌متحده و حمله هوایی هند در بالاکوت در سال ۲۰۱۹ ایجاد شد. (Pan et al., 2018) اخبار تقلبی یک مساله طبقه‌بندی متن با یک گزاره مستقیم رو به جلو است. ساختن یک چارچوب هوش مصنوعی قوی که بتواند بین اخبار "حقیقی" و اخبار "تقلبی" تمایز قایل شود برای شناسایی اخبار جعلی مورد نیاز است (‏پان و همکاران، ۲۰۱۸ شو و همکاران، ۲۰۱۷)‏. شناسایی محتوای معتبر در حجم زیادی از داده‌های پست شده توسط کاربران، وظیفه‌ای چالش برانگیز برای رسانه‌های اجتماعی مانند فیس بوک، توییتر و غیره است. (Shu et al., 2017) خطر بزرگی برای ارسال و انتشار چنین محتوای جعلی و غیر معتبر در رسانه‌های اجتماعی وجود دارد. این تحقیق گامی مثبت در جهت پرداختن به این مساله مهم است. شکل ۱ چند نمونه از اخبار جعلی را نشان می‌دهد که بر روی سکوهای رسانه اجتماعی در طول انتخابات سال ۲۰۱۶ ریاست‌جمهوری آمریکا منتشر شده‌است. (Shu et al., 2017) این اخبار ساختگی، احساسات عمومی را مختل کرده و تاثیر منفی بر جامعه در انتخابات سال ۲۰۱۶ ریاست‌جمهوری آمریکا داشته‌است. (Persily, 2017) تحقیقات اخیر (‏شو و همکاران، ۲۰۱۷ پن و همکاران، ۲۰۱۸ کومار و شاه، ۲۰۱۸)‏که در زمینه تشخیص اخبار جعلی انجام شده‌اند براساس روش‌های نظارت شده و نیز بدون نظارت هستند. (Dougherty, Kohavi and Sahami, 1995)

تقریبا همه روش‌های بدون نظارت برای یادگیری کلمات یادگیری از آمار رخدادهای کلمه در یک پیکره به عنوان منبع اصلی اطلاعات استفاده می‌کنند (‏Mikolov، چن، Corrado و دین، ۲۰۱۳)‏. (Kumar and Shah, 2018) آموزش معنای مربوطه از این آمار و نشان دادن آن‌ها با استفاده از برداردهای لغت حاصل، مشکلی است که باید به آن پرداخته شود (‏میکولوف و همکاران، ۲۰۱۳ a)‏. یک مدل قابل‌توجه دیگر که در بردارها یا کلمات از داده‌های رخدادی آن‌ها استفاده می‌کند، برداردهای عمومی(‏glove)‏(‏فو، لیو، ژو و سویی، ۲۰۱۷)‏است. GloVe یک مدل مبتنی بر شمارش برای پیش آموزش است. الگوریتم های نمایش کلمات را می توان به دو جریان اصلی، یعنی LDA مبتنی بر آمار (‏تحلیل تفکیک خطی)‏و مبتنی بر یادگیری (‏Word2Vec)‏، تقسیم کرد. (Pennington, Socher and Manning, 2014; Zhang and Wallace, 2015) LDA با استفاده از تجزیه مقدار منفرد (‏SVD)‏ بر روی ماتریس هم رخدادی، بردارهای کلمات با بعد پایین را تولید می‌کند، در حالی که Word2Vec از یک شبکه عصبی سه‌لایه برای انجام کار طبقه‌بندی جفت کلمات با زمینه مرکزی استفاده می‌کند، که در آن بردارهای کلمه، محصولات فرعی هستند. (Caliskan, Bryson and Narayanan, 2017) یک مدل پیش‌بینی‌کننده، یک سیستم عصبی پیش‌خور است که بردارها را یاد می‌گیرد تا ظرفیت پیش‌بینی را بهبود بخشند. (Fu et al., 2017) یک ویژگی جذاب الگوریتم Word2Vec این است که کلمات مشابه در فضای بردار در کنار هم قرار گرفته‌اند، و عملیات ریاضی روی بردارهای کلمه می‌تواند روابط معنایی یا نحوی را نشان دهد (‏ژانگ و والاس، ۲۰۱۵ کالیسکان و همکاران، ۲۰۱۷)‏. علاوه بر شهودی بودن، مدل مبتنی بر شمارش نیز یک تابع کدگذاری فراهم می‌کند که می‌تواند برای استنباط کلمات یا عبارات نامرئی مورد استفاده قرار گیرد. ​

مدل‌های مبتنی بر شمارش می‌توانند به صورت پویا از نظر اندازه و واژگان تنظیم شوند. (Lebret and Collobert, 2015) در مدل‌های مبتنی بر شمارش، شباهت معنایی بین کلمات با شمارش فرکانس هم رخدادی یاد گرفته می‌شود. (Pennington et al., 2014) در مرحله اول، یک ماتریس بزرگ از اطلاعات در حال وقوع ساخته می‌شود (‏تانگ، Wei، یانگ، ژو، لیو و کین، ۲۰۱۴)‏که شامل اطلاعاتی در مورد این است که هر کلمه "کلمه" در برخی "بافت" (‏ستون‌های)‏دیده می‌شود. تعداد "بافتارها" باید بزرگ باشد زیرا از نظر اندازه ترکیبی است. علاوه بر این، ماتریس تجزیه می‌شود تا یک ماتریس با بعد پایین از کلمات و ویژگی‌ها به دست دهد که در آن هر سطر یک نمایش برداری برای هر کلمه به دست می‌دهد. این کار با به حداقل رساندن "از دست دادن بازسازی" انجام می‌شود که به دنبال نمایش‌های با ابعاد پایین است که می‌تواند واریانس در داده‌های ابعادی بالا را توضیح دهد. در مورد GloVe، کلمه ماتریس شمارش با نرمال کردن شمارش و هموارسازی لگاریتم آن‌ها پیش‌پردازش می‌شود. در قیاس با Word۲Vec، روش GloVe اجازه اجرای موازی را می‌دهد (‏Fu و همکاران، ۲۰۱۷ تانگ و همکاران، ۲۰۱۴)‏، که آموزش مدل را بر روی مجموعه داده‌های بزرگ آسان‌تر می‌کند. این یک وظیفه چالش برانگیز در NLP (‏پردازش زبان طبیعی)‏برای توسعه معماری‌های عمیق است که می‌توانند نمایش سلسله مراتبی کل جملات را به شکل محتوای جعلی یاد بگیرند. ​

چندین کار تحقیقاتی موجود (‏پن و همکاران، ۲۰۱۸ احمد، تراوره و سعد، ۲۰۱۷)‏با الگوریتم های یادگیری ماشین سنتی و همچنین شبکه‌های عصبی کانولوشنی (‏Vasudevan، Zoph، Shlens و Le، ۲۰۱۹)‏برای شناسایی اخبار جعلی توصیف شده‌اند. (Ahmed et al., 2017) محققان (‏آستین و همکاران، ۲۰۱۹ پن و همکاران، ۲۰۱۸)‏شبکه عصبی ترکیبی (‏سی ان ان)‏را در تحقیقاتشان برای طبقه‌بندی متن به کار گرفتند و نتایج کاملا موفق و با انگیزه را نشان دادند (‏ژونگ، ژینگ، عشق، وانگ و لو، ۲۰۱۹)‏. این کار با این حقیقت معروف انگیزه پیدا می‌کند که نتایج کارآمد را می توان با استفاده از یک معماری خاص مساله عمیق (‏فانتا، چاتزکو، کورتیلیس، بلکبرن، وکالی و لئونتیادیس، ۲۰۱۹)‏بدست آورد که نمایش‌های سلسله مراتبی را با کمک نزول شیب ایجاد می‌کند (‏وی، ژو، ماسیکلیا، داماسوی، داماسوی، پوپالپ و وولاریناک، ۲۰۱۹​)‏. (Zhong et al., 2019) در این مقاله، ما یک مدل (‏FNDNet)‏برای شناسایی اخبار جعلی با یک رویکرد کانولوشنی عمیق‌تر پیشنهاد کرده‌ایم. رویکرد ما به استخراج ویژگی‌های دستی متکی نیست. در عوض، مدل ما (‏FNDNet)‏برای یادگیری ویژگی‌های تبعیض‌آمیز از طریق شبکه عصبی عمیق به طور خودکار طراحی شده‌است. ما یک شبکه عصبی convolutional عمیق (‏سی ان ان)‏ایجاد می‌کنیم و تعدادی از ویژگی‌ها در هر لایه استخراج می‌شوند. طراحی معماری مدل ما از پیشرفت اخیر در حوزه تشخیص اخبار جعلی الهام‌گرفته شده‌است (‏پان‌و همکاران، ۲۰۱۸ فو و همکاران، ۲۰۱۷ ژانگ و والاس، ۲۰۱۵ روچانسکی، سیو و لیو، ۲۰۱۷)‏. برخلاف روش‌های موجود برای شناسایی محتوای جعلی، مدل ما عملکرد برجسته‌ای را در مجموعه داده‌های اخبار جعلی در مقیاس بزرگ نشان داده‌است. شبکه‌های عصبی کانولوشنی عملکرد عالی را در بسیاری از تکالیف طبقه‌بندی متن و همچنین در کاربردهای صنعتی مختلف انجام داده‌اند (‏لیانگ، او، خو، چن و زنگ، ۲۰۱۵ روی، باساک،​ اکبال و باتاچاریا، ۲۰۱۸ ژو و ظفرانی، ۲۰۱۸)‏. مدل پیشنهادی ما همچنین می‌تواند ابزاری مفید برای ارایه راه‌حل بهتر برای چنین کاربردهای صنعتی در زمینه‌های تجارت، احیا و بیمه باشد. مدل پیشنهادی ما همچنین مشکل انتخاب عمق بهینه CNNs برای یک مشکل طبقه‌بندی متن خاص را مورد بررسی قرار می‌دهد و نتایج بهتر از یادگیری ماشین موجود و پیاده‌سازی مبتنی بر یادگیری عمیق برای طبقه‌بندی عمل می‌کند. این مدل در مقایسه با سایر مدل‌های طبقه‌بندی، با کاهش خطای طبقه‌بندی، به عملکرد بهتری دست یافت. ما عملکرد مدل پیشنهادی خود را برای نمایش زبان نشان می‌دهیم، که در آن دقت ۹۸.۳۶ % به دست آمده‌است. با استفاده از روش پیشنهادی‌مان، نتایج بهبود یافته را در مقایسه با روش‌های پایه به دست می‌آوریم، که FNDNet را به یک مدل امیدوار کننده برای تشخیص دقیق اخبار جعلی تبدیل می‌کند. ​

این متن ترجمه‌ای خودکار از چکیده و مقدمه مقاله FNDNet- A Deep Convolutional Neural Network for Fake News Detection چاپ‌شده در ۶۱‌امین شماره مجله Cognitive Systems Research می باشد.
برای مطالعه کامل این مقاله به همراه ترجمه‌ به این لینک مراجعه فرمایید.​