استفاده از فناوری کاوش رسانه‌های اجتماعی برای بهبود دقت پیش‌بینی قیمت سهام

کاوش شبکه‌های اجتماعی برای پیش‌بینی قیمت سهام
کاوش شبکه‌های اجتماعی برای پیش‌بینی قیمت سهام

چکیده: بسیاری از سرمایه گذاران سهام براساس شاخص‌های تراشه مرتبط با قیمت سهام تصمیمات سرمایه‌گذاری می‌گیرند. با این حال، علاوه بر داده‌های کمی، اخبار مالی اغلب تاثیر غیرقابل انکاری بر قیمت سهام دارد. امروزه، همانطور که بررسی‌های جدید به صورت روزانه در رسانه‌های اجتماعی منتشر می‌شوند، ممکن است استفاده از نظرات وب برای بهبود عملکرد پیش‌بینی قیمت سهام ارزشمند باشد. برای این منظور، ما از رگرسیون لجستیک برای نمایش شاخص‌های چیپ و ایجاد یک مدل پیش‌بینی قیمت سهام پایه استفاده می‌کنیم. سپس، ما از تکنولوژی متن کاوی برای کمی کردن داده‌های بدون ساختار از نظرات رسانه‌های اجتماعی در مورد اخبار مرتبط با سهام به امتیازات احساسی استفاده می‌کنیم، که به طور قابل‌توجهی با میزان تغییر قیمت سهام مرتبط است. براساس یافته‌ها که هر چه امتیازات احساسی بالاتر باشد، دقت پیش‌بینی مدل رگرسیون لجیستیک کم‌تر است، ما یک روش پیش‌بینی بهبود یافته را پیشنهاد می‌کنیم که امتیازات احساسی را در مدل رگرسیون لجیستیک ادغام می‌کند. نتایج ما نشان می‌دهد که مدل پیشنهادی می‌تواند دقت پیش‌بینی برای قیمت‌های سهام را بهبود بخشد، و بنابراین می‌تواند مرجع جدیدی برای استراتژی‌های سرمایه‌گذاری برای سرمایه گذاران سهام فراهم کند. ​

کلمات کلیدی: شاخص‌های تراشه، مدل رگرسیون لجستیک، دقت پیش‌بینی، امتیازات احساسی، استخراج متن

مقدمه​​​​​​​​

به منظور اتخاذ بهترین تصمیمات سرمایه‌گذاری، سرمایه گذاران سهام به طور کلی اطلاعات مرتبط را از منابعی مانند رسانه‌های تلویزیونی، روزنامه‌ها، مجلات و اینترنت جمع‌آوری می‌کنند. با این حال، سرمایه گذاران در مواجهه با اطلاعات مختلف، اغلب نمی‌توانند تشخیص دهند که کدام اطلاعات مهم‌تر است. چگونگی ایجاد استراتژی‌های سرمایه‌گذاری با بازدهی بالا با کمک شاخص‌های کمی و ابزارهای پیش‌بینی قیمت سهام به طور واضح موضوع نگرانی سرمایه گذاران است. ​

نوسانات قیمت سهام پویا، غیر خطی، غیر ثابت هستند و نویز زیادی دارند، که پیش‌بینی قیمت سهام را دشوار می‌سازد. پیش‌بینی قیمت سهام یک موضوع تحقیقاتی در حوزه دانشگاهی و مالی بوده‌است. تحقیقات اولیه عمدتا براساس تیوری گام تصادفی (‏RWT)‏و فرضیه بازار کارآمد (‏EMH)‏بوده‌است. RWT استدلال می‌کند که نوسانات قیمت سهام تصادفی هستند و از این رو، مرحله بعدی قیمت سهام به اندازه فردی که در میدان راه می‌رود نامنظم است. EMH پیشنهاد می‌کند که طراحی یک سیستم مبتنی بر هر گونه اطلاعات برای پیش‌بینی تغییرات قیمت سهام غیر ممکن است زیرا تمام اطلاعات قبلا در قیمت سهام موجود منعکس شده‌اند. ​

براساس تحقیقات قبلی EMH، قیمت سهام عمدتا توسط اطلاعات جدید به جای قیمت‌های فعلی و گذشته هدایت می‌شود. از آنجا که اخبار غیرقابل‌پیش‌بینی است، قیمت سهام از مدل گام تصادفی پیروی خواهد کرد و نمی‌تواند از ۵۰ % پیش‌بینی دقت تجاوز کند. (Qian & Rasheed, 2007) با این حال، بسیاری از مطالعات نشان داده‌اند که قیمت سهام تصادفی نیست، اما می‌تواند تا حدودی پیش‌بینی شود. اخبار ممکن است غیرقابل‌پیش‌بینی باشند، اما معیارهای اولیه را می توان از رسانه‌های اجتماعی آنلاین (‏بلاگ ها، تویی‌تر، و غیره)‏برای پیش‌بینی تغییرات در شاخص‌های اقتصادی و تجاری مختلف، و برای کشف رابطه بین اخبار مالی و تغییرات قیمت سهام استخراج کرد (‏شومکر، ژانگ، هوانگ، نقاد چن، ۲۰۱۲)‏.​ ​

فرآیند تصمیم‌گیری سرمایه گذاران هم تحت‌تاثیر عقلانیت و هم احساسات است. بسیاری از تحلیلگران مالی و سرمایه گذاران روی رویکردهای منطقی برای پیش‌بینی قیمت سهام، مانند روش‌های پیش‌بینی یادگیری ماشینی حساب می‌کنند. برای مثال، برخی از یک مدل سری زمانی براساس تیوری مالی برای پیش‌بینی قیمت سهام استفاده می‌کنند. در مقایسه با روش‌های دیگر، یک شبکه عصبی مصنوعی (‏ANN)‏معمولا به عنوان یک ابزار پیش‌بینی قیمت سهام انتخاب می‌شود. با این حال، این روش‌های استفاده از مدل‌های پیش‌بینی یادگیری ماشینی دارای کاستی‌هایی هستند زیرا بازار سهام همیشه تحت‌تاثیر عدم قطعیت سیستم و دیگر عوامل ناشناخته است. به منظور بهبود دقت پیش‌بینی، برخی از محققان پیشنهاد کرده‌اند که علاوه بر استفاده از شاخص‌های مالی برای ساخت مدل‌های پیش‌بینی یادگیری ماشین، عوامل مرتبط دیگری نیز باید در نظر گرفته شوند به عنوان مثال، تسحیح، هسو، و لای (‏۱۹۹۸)‏با استفاده از قیمت سهام مختلط و شاخص‌های فنی برای ساخت یک مدل تجارت هوش مصنوعی از طریق یادگیری ماشین، پیشنهاد دادند. این امر می‌تواند بر محدودیت‌های استفاده از یک روش واحد غلبه کند و می‌تواند به سودآوری پایدار بلند مدت دست یابد. ادیی، آیو، آدبی، و اوتوکیتی (‏۲۰۱۲) ‏استدلال کردند که استفاده از متغیرهای فنی و شاخص‌های اساسی برای ساخت یک مدل پیش‌بینی سهام می‌تواند پیش‌بینی سهام را دقیق‌تر کند. ​

تغییر قیمت سهام براساس تصمیمات بسیاری از سرمایه گذاران تعیین می‌شود. برای اخبار مشابه، هر سرمایه‌گذار ممکن است تفسیر متفاوتی داشته باشد که به نوبه خود منجر به تصمیمات مختلف سرمایه‌گذاری می‌شود. (Mittermayer, 2004) با محبوبیت اینترنت، بسیاری از سرمایه گذاران نظرات خود را در مورد سهام نگرانی در مورد سرمایه‌گذاری در رسانه‌های اجتماعی مرتبط منتشر می‌کنند، که در آن آن‌ها همچنین دیدگاه‌های دیگران برای در نظر گرفتن به عنوان یک مرجع سرمایه‌گذاری را می‌بینند (‏رکنتین، خیابان، اسکات سرینیواسان، ۲۰۱۳)‏. اخیرا، محققان بیشتری به ترکیب واکنش‌های عوامل احساسی شبکه اجتماعی به اخبار مرتبط با بازار سهام در مدل‌های پیش‌بینی توجه کرده‌اند. ​

هدف این مطالعه ایجاد یک مدل پیش‌بینی سهام با دقت بالا برای کمک به سرمایه گذاران سهام در تصمیم‌گیری سرمایه‌گذاری است. از آنجا که هم شاخص‌های مبتنی بر مالی و هم نظرات سرمایه گذاران در رسانه‌های اجتماعی، مرجع ارزشمندی برای سرمایه گذاران دارند، این مطالعه هر دو جنبه را در ساخت یک ابزار پیش‌بینی قیمت سهام در نظر می‌گیرد. ​

این متن ترجمه‌ای خودکار از چکیده و مقدمه مقاله Using social media mining technology to improve stock price forecast accuracy چاپ‌شده در شماره ۳۹ مجله Journal of FORECASTING می باشد.
برای مطالعه کامل این مقاله به همراه ترجمه‌ به این لینک مراجعه فرمایید.​