من ربات ترجمیار هستم و خلاصه مقالات علمی رو به صورت خودکار ترجمه میکنم. متن کامل مقالات رو میتونین به صورت ترجمه شده از لینکی که در پایین پست قرار میگیره بخونین
یک شبکه عصبی کانولوشنی عمیق برای کشف اخبار جعلی
چکیده: با افزایش محبوبیت رسانههای اجتماعی و انجمنهای مبتنی بر وب، توزیع اخبار تقلبی به تهدیدی بزرگ برای بخشها و آژانسهای مختلف تبدیل شدهاست. این امر اعتماد به رسانهها را کاهش داده و باعث سردرگمی خوانندگان شدهاست. مجموعه عظیمی از تحقیقات در مورد استراتژیهای هوش مصنوعی برای ردیابی خبر جعلی وجود دارد. در گذشته، بیشتر تمرکز بر طبقهبندی نظرات آنلاین و پستهای مبتنی بر شبکه اجتماعی آنلاین که آزادانه در دسترس هستند، بودهاست. در این مقاله، ما یک شبکه عصبی کانولوشنی عمیق (FNDNet)برای تشخیص اخبار جعلی پیشنهاد میکنیم. به جای تکیهبر ویژگیهای دستی، مدل ما (FNDNet)برای یادگیری خودکار ویژگیهای تبعیضآمیز برای طبقهبندی اخبار جعلی از طریق لایههای پنهان چندگانه ساختهشده در شبکه عصبی عمیق طراحی شدهاست. ما یک شبکه عصبی کانولوشنی عمیق (سی ان ان)برای استخراج ویژگیهای مختلف در هر لایه ایجاد میکنیم. ما عملکرد روش پیشنهادی را با چندین مدل پایه مقایسه میکنیم. مجموعه دادههای بنچمارک برای آموزش و تست مدل مورد استفاده قرار گرفتند، و مدل پیشنهادی به نتایج پیشرفته با دقت ۹۸.۳۶ % در دادههای تست دست یافت. پارامترهای ارزیابی عملکرد مختلف مانند ویلکاکسون، مثبت کاذب، منفی واقعی، دقت، یادآوری، F۱، و دقت و غیره برای تایید نتایج استفاده شدند. این نتایج پیشرفتهای قابلتوجهی را در زمینه تشخیص هویت جعلی در مقایسه با نتایج موجود در ادبیات موضوع نشان میدهند و پتانسیل رویکرد ما را برای طبقهبندی اخبار جعلی در رسانههای اجتماعی تایید میکنند. این تحقیق به محققان در گسترش درک کاربرد مدلهای عمیق مبتنی بر سی ان ان برای آشکارسازی اخبار جعلی کمک خواهد کرد.
۱. مقدمه
در طول چند سال گذشته، انتشار اخبار تقلبی به یک مشکل بزرگ تبدیل شدهاست. اخبار تقلبی توسط نیویورکتایمز به عنوان "داستانهای ساختهشده برای فریب نوشته میشوند" تعریف میشود، و آنها در فرمت هایی مشابه با آنهایی که توسط آژانسهای خبری سنتی استفاده میشوند، منتشر میشوند (پان، پاولوا، لی، لی، لی، و لیو، ۲۰۱۸). اخبار تقلبی به خاطر کمک به افزایش قطبی شدن سیاسی و درگیریهای حزبی در زمانهای اخیر شناسایی شدهاست. نمونههای اخیر شامل مناقشاتی بود که در طول مبارزات انتخاباتی ریاستجمهوری سال ۲۰۱۶ برای ایالاتمتحده و حمله هوایی هند در بالاکوت در سال ۲۰۱۹ ایجاد شد. (Pan et al., 2018) اخبار تقلبی یک مساله طبقهبندی متن با یک گزاره مستقیم رو به جلو است. ساختن یک چارچوب هوش مصنوعی قوی که بتواند بین اخبار "حقیقی" و اخبار "تقلبی" تمایز قایل شود برای شناسایی اخبار جعلی مورد نیاز است (پان و همکاران، ۲۰۱۸ شو و همکاران، ۲۰۱۷). شناسایی محتوای معتبر در حجم زیادی از دادههای پست شده توسط کاربران، وظیفهای چالش برانگیز برای رسانههای اجتماعی مانند فیس بوک، توییتر و غیره است. (Shu et al., 2017) خطر بزرگی برای ارسال و انتشار چنین محتوای جعلی و غیر معتبر در رسانههای اجتماعی وجود دارد. این تحقیق گامی مثبت در جهت پرداختن به این مساله مهم است. شکل ۱ چند نمونه از اخبار جعلی را نشان میدهد که بر روی سکوهای رسانه اجتماعی در طول انتخابات سال ۲۰۱۶ ریاستجمهوری آمریکا منتشر شدهاست. (Shu et al., 2017) این اخبار ساختگی، احساسات عمومی را مختل کرده و تاثیر منفی بر جامعه در انتخابات سال ۲۰۱۶ ریاستجمهوری آمریکا داشتهاست. (Persily, 2017) تحقیقات اخیر (شو و همکاران، ۲۰۱۷ پن و همکاران، ۲۰۱۸ کومار و شاه، ۲۰۱۸)که در زمینه تشخیص اخبار جعلی انجام شدهاند براساس روشهای نظارت شده و نیز بدون نظارت هستند. (Dougherty, Kohavi and Sahami, 1995)
تقریبا همه روشهای بدون نظارت برای یادگیری کلمات یادگیری از آمار رخدادهای کلمه در یک پیکره به عنوان منبع اصلی اطلاعات استفاده میکنند (Mikolov، چن، Corrado و دین، ۲۰۱۳). (Kumar and Shah, 2018) آموزش معنای مربوطه از این آمار و نشان دادن آنها با استفاده از برداردهای لغت حاصل، مشکلی است که باید به آن پرداخته شود (میکولوف و همکاران، ۲۰۱۳ a). یک مدل قابلتوجه دیگر که در بردارها یا کلمات از دادههای رخدادی آنها استفاده میکند، برداردهای عمومی(glove)(فو، لیو، ژو و سویی، ۲۰۱۷)است. GloVe یک مدل مبتنی بر شمارش برای پیش آموزش است. الگوریتم های نمایش کلمات را می توان به دو جریان اصلی، یعنی LDA مبتنی بر آمار (تحلیل تفکیک خطی)و مبتنی بر یادگیری (Word2Vec)، تقسیم کرد. (Pennington, Socher and Manning, 2014; Zhang and Wallace, 2015) LDA با استفاده از تجزیه مقدار منفرد (SVD) بر روی ماتریس هم رخدادی، بردارهای کلمات با بعد پایین را تولید میکند، در حالی که Word2Vec از یک شبکه عصبی سهلایه برای انجام کار طبقهبندی جفت کلمات با زمینه مرکزی استفاده میکند، که در آن بردارهای کلمه، محصولات فرعی هستند. (Caliskan, Bryson and Narayanan, 2017) یک مدل پیشبینیکننده، یک سیستم عصبی پیشخور است که بردارها را یاد میگیرد تا ظرفیت پیشبینی را بهبود بخشند. (Fu et al., 2017) یک ویژگی جذاب الگوریتم Word2Vec این است که کلمات مشابه در فضای بردار در کنار هم قرار گرفتهاند، و عملیات ریاضی روی بردارهای کلمه میتواند روابط معنایی یا نحوی را نشان دهد (ژانگ و والاس، ۲۰۱۵ کالیسکان و همکاران، ۲۰۱۷). علاوه بر شهودی بودن، مدل مبتنی بر شمارش نیز یک تابع کدگذاری فراهم میکند که میتواند برای استنباط کلمات یا عبارات نامرئی مورد استفاده قرار گیرد.
مدلهای مبتنی بر شمارش میتوانند به صورت پویا از نظر اندازه و واژگان تنظیم شوند. (Lebret and Collobert, 2015) در مدلهای مبتنی بر شمارش، شباهت معنایی بین کلمات با شمارش فرکانس هم رخدادی یاد گرفته میشود. (Pennington et al., 2014) در مرحله اول، یک ماتریس بزرگ از اطلاعات در حال وقوع ساخته میشود (تانگ، Wei، یانگ، ژو، لیو و کین، ۲۰۱۴)که شامل اطلاعاتی در مورد این است که هر کلمه "کلمه" در برخی "بافت" (ستونهای)دیده میشود. تعداد "بافتارها" باید بزرگ باشد زیرا از نظر اندازه ترکیبی است. علاوه بر این، ماتریس تجزیه میشود تا یک ماتریس با بعد پایین از کلمات و ویژگیها به دست دهد که در آن هر سطر یک نمایش برداری برای هر کلمه به دست میدهد. این کار با به حداقل رساندن "از دست دادن بازسازی" انجام میشود که به دنبال نمایشهای با ابعاد پایین است که میتواند واریانس در دادههای ابعادی بالا را توضیح دهد. در مورد GloVe، کلمه ماتریس شمارش با نرمال کردن شمارش و هموارسازی لگاریتم آنها پیشپردازش میشود. در قیاس با Word۲Vec، روش GloVe اجازه اجرای موازی را میدهد (Fu و همکاران، ۲۰۱۷ تانگ و همکاران، ۲۰۱۴)، که آموزش مدل را بر روی مجموعه دادههای بزرگ آسانتر میکند. این یک وظیفه چالش برانگیز در NLP (پردازش زبان طبیعی)برای توسعه معماریهای عمیق است که میتوانند نمایش سلسله مراتبی کل جملات را به شکل محتوای جعلی یاد بگیرند.
چندین کار تحقیقاتی موجود (پن و همکاران، ۲۰۱۸ احمد، تراوره و سعد، ۲۰۱۷)با الگوریتم های یادگیری ماشین سنتی و همچنین شبکههای عصبی کانولوشنی (Vasudevan، Zoph، Shlens و Le، ۲۰۱۹)برای شناسایی اخبار جعلی توصیف شدهاند. (Ahmed et al., 2017) محققان (آستین و همکاران، ۲۰۱۹ پن و همکاران، ۲۰۱۸)شبکه عصبی ترکیبی (سی ان ان)را در تحقیقاتشان برای طبقهبندی متن به کار گرفتند و نتایج کاملا موفق و با انگیزه را نشان دادند (ژونگ، ژینگ، عشق، وانگ و لو، ۲۰۱۹). این کار با این حقیقت معروف انگیزه پیدا میکند که نتایج کارآمد را می توان با استفاده از یک معماری خاص مساله عمیق (فانتا، چاتزکو، کورتیلیس، بلکبرن، وکالی و لئونتیادیس، ۲۰۱۹)بدست آورد که نمایشهای سلسله مراتبی را با کمک نزول شیب ایجاد میکند (وی، ژو، ماسیکلیا، داماسوی، داماسوی، پوپالپ و وولاریناک، ۲۰۱۹). (Zhong et al., 2019) در این مقاله، ما یک مدل (FNDNet)برای شناسایی اخبار جعلی با یک رویکرد کانولوشنی عمیقتر پیشنهاد کردهایم. رویکرد ما به استخراج ویژگیهای دستی متکی نیست. در عوض، مدل ما (FNDNet)برای یادگیری ویژگیهای تبعیضآمیز از طریق شبکه عصبی عمیق به طور خودکار طراحی شدهاست. ما یک شبکه عصبی convolutional عمیق (سی ان ان)ایجاد میکنیم و تعدادی از ویژگیها در هر لایه استخراج میشوند. طراحی معماری مدل ما از پیشرفت اخیر در حوزه تشخیص اخبار جعلی الهامگرفته شدهاست (پانو همکاران، ۲۰۱۸ فو و همکاران، ۲۰۱۷ ژانگ و والاس، ۲۰۱۵ روچانسکی، سیو و لیو، ۲۰۱۷). برخلاف روشهای موجود برای شناسایی محتوای جعلی، مدل ما عملکرد برجستهای را در مجموعه دادههای اخبار جعلی در مقیاس بزرگ نشان دادهاست. شبکههای عصبی کانولوشنی عملکرد عالی را در بسیاری از تکالیف طبقهبندی متن و همچنین در کاربردهای صنعتی مختلف انجام دادهاند (لیانگ، او، خو، چن و زنگ، ۲۰۱۵ روی، باساک، اکبال و باتاچاریا، ۲۰۱۸ ژو و ظفرانی، ۲۰۱۸). مدل پیشنهادی ما همچنین میتواند ابزاری مفید برای ارایه راهحل بهتر برای چنین کاربردهای صنعتی در زمینههای تجارت، احیا و بیمه باشد. مدل پیشنهادی ما همچنین مشکل انتخاب عمق بهینه CNNs برای یک مشکل طبقهبندی متن خاص را مورد بررسی قرار میدهد و نتایج بهتر از یادگیری ماشین موجود و پیادهسازی مبتنی بر یادگیری عمیق برای طبقهبندی عمل میکند. این مدل در مقایسه با سایر مدلهای طبقهبندی، با کاهش خطای طبقهبندی، به عملکرد بهتری دست یافت. ما عملکرد مدل پیشنهادی خود را برای نمایش زبان نشان میدهیم، که در آن دقت ۹۸.۳۶ % به دست آمدهاست. با استفاده از روش پیشنهادیمان، نتایج بهبود یافته را در مقایسه با روشهای پایه به دست میآوریم، که FNDNet را به یک مدل امیدوار کننده برای تشخیص دقیق اخبار جعلی تبدیل میکند.
این متن ترجمهای خودکار از چکیده و مقدمه مقاله FNDNet- A Deep Convolutional Neural Network for Fake News Detection چاپشده در ۶۱امین شماره مجله Cognitive Systems Research می باشد.
برای مطالعه کامل این مقاله به همراه ترجمه به این لینک مراجعه فرمایید.
مطلبی دیگر از این انتشارات
برای کاهش کابوس، دانشمندان احساسات را در رویاها دستکاری میکنند
مطلبی دیگر از این انتشارات
چگونه یک Google Featured Snippet را با سایت وردپرس خود پیدا کنید
مطلبی دیگر از این انتشارات
ارزش تکثیرپذیری