دانشجوی کارشناسی ارشد هوش دانشگاه تهران و فعال در هوش مصنوعی،پردازش زبان طبیعی،علوم داده
تحلیل احساسی متون با استفاده از یادگیری انتقالی transfer learning
در این پروژه قصد داریم که بر روی مجوعه دیتاست imdb که شامل نظرات کاربران درباره ی فیلم های مختلف و همچنین لیبل هر نظر که مثبت ومنفی می باشد.تحلیل انجام دهیم.
به این صورت که کامنت های هر فرد را مشاهده کرده و تشخیص دهیم که این این نظر مثبت می باشد.برای این کار راهکار های گوناگونی وجود دارد که راحترین آنها استفاده از تکنیک های آماری نظیر naive base و یا logistic regression می باشد که در آینده ای نزدیک با این دو روش نیز پیاده سازی خواهیم نمود این تسک رو اما در این بخش می خواهیم که پیش بینی قطبیت نظرات را با استفاده از transfer learning انجام دهیم.
ابتدا توضیح مختصری در مورد یادگیزی انتقالی خواهیم داشت.این روش آموزش به این صورت می باشد.
یادگیری انتقالی (Transfer Learning)، یک مسأله یادگیری در علم یادگیری ماشین (Machine Learning) است که به موجب آن، از یک مدل توسعه داده شده قبلی برای انجام وظایف جدید استفاده می شود. این مسأله، رویکردی محبوب در یادگیری ژرف (Deep Learning) است که در آن از مدل های از پیش آموزش یافته (Pre-trained Models) به عنوان نقطه شروع مسائل مبتنی بر بینایی رایانه ای (Computer Vision) و پردازش زبان طبیعی (Natural Language Processing) استفاده می شود.
یادگیری انتقالی نوعی بهینه سازی (Optimization) است که باعث پیشرفت سریع یا بهبود عملکرد در هنگام مدل کردن مسائل دیگر می شود. این روش عموماً در موقعیت هایی کاربرد دارد که داده های اندکی برای مدل سازی پدیده جدید در دسترس وجود دارد. از این رو می توان به سراغ مدل های یادگیری ژرفی که پیش تر بر روی مجموعه داده های عظیم آموزش داده شده اند و با پدیده جدیدِ مورد مطالعه اشتراک مبنایی دارند، رفته و مدل یادگیری انتقالی را بر روی دانش کسب شده از مدل قبلی (در بخش های ابتدایی و مشترک دو پدیده) بنا نهاد.
به طور دقیق تر در این تسک ما از سعی می کنیم از مدل زبانی عظیمی که پیشتر آموزش دیده شده است استفاده کنیم و سعی کنیم که این شبکه را جوری تنظیم کنیم که برای تسک ما که طبقه بندی متون می باشد بهترین خروجی را داشته باشد.
بنابراین ابتدا سعی می کنیم که ویژگی های موثر را ازاین مدل زبانی بدست اورده و سپس با استفاده از آن بر روی جملاتی که در دیتا ست وجود دارد.جوری پیاده سازی کنیم که این جملات به صورت ویژگی های موثرنمایان شوند.سپس این ویژگی ها را در شبکه استفاده کرده و از و به دقت بالاتری دست یابیم.
شما می توانید توضیحات دقیق تر این پروژه را در این لینک مشاهده کنید https://github.com/aliebi/transfer-learning-
پانوشت:ممنون می شوم که اگر مناسب بود و دوست داشتید لایک و فالو کنید پروژه رو تا دوستان دیگه هم بتونند راحتر پیداش کنند.
و من دیتاست مناسبی در فارسی پیدا نکردم اگه شما دیتا ست مناسبی داشتید میتونید بگید باهم رو فارسی هم انجامش بدیم.
خوش و خرم باشید(:
مطلبی دیگر از این انتشارات
فیلمنامهی غیرانسانی
مطلبی دیگر از این انتشارات
ایا روزی هوش مصنوعی مانند ما اگاهی خواهد داشت؟
مطلبی دیگر از این انتشارات
آشنایی مقدماتی با کتابخانه پایتونی Matplotlib