این روشها از قدیمیترین و پرکاربردترین روشهای تحلیل پیشبینی کننده هستند. آنها بر اساس اصول آماری و ریاضی بنا شدهاند و برای بسیاری از مسائل پیش بینی قابل استفاده هستند.
مثالی ساده برای درک بهتر:
فرض کنید میخواهیم فروش یک محصول جدید را پیشبینی کنیم. با استفاده از رگرسیون خطی میتوانیم رابطه بین قیمت محصول، هزینههای تبلیغات و میزان فروش را پیدا کنیم. سپس با استفاده از این رابطه، میتوانیم پیشبینی کنیم که اگر قیمت محصول را کاهش دهیم و هزینههای تبلیغات را افزایش دهیم، میزان فروش چقدر خواهد بود.
به زبان سادهتر: روشهای آماری کلاسیک مثل ابزارهایی هستند که به ما کمک میکنند تا از روی دادههای گذشته، الگوهایی پیدا کنیم و با استفاده از این الگوها، آینده را پیشبینی کنیم.
در کنار روشهای آماری کلاسیک، یادگیری ماشین نیز ابزارهای قدرتمندی را برای تحلیل پیش بینی کننده در اختیار ما قرار میدهد. این روشها به الگوریتمها اجازه میدهند تا از روی دادهها یاد بگیرند و بدون نیاز به برنامهنویسی صریح، الگوها و روابط پیچیدهای را شناسایی کنند.
درخت تصمیمگیری مثل یک نمودار است که هر شاخه آن نشاندهنده یک تصمیم است. با حرکت در طول شاخهها، به یک برگ میرسیم که پیشبینی نهایی را نشان میدهد. مثلاً، برای پیشبینی اینکه یک مشتری محصولی را میخرد یا نه، میتوانیم یک درخت تصمیمگیری بسازیم که بر اساس ویژگیهایی مثل سن، جنسیت، درآمد و سابقه خرید، تصمیمگیری کند.
جنگل تصادفی مجموعهای از درختان تصمیمگیری است. هر درخت به تنهایی یک پیش بینی انجام میدهد و در نهایت، پیش بینی نهایی با رایگیری بین همه درختان تعیین میشود. این روش باعث میشود که مدل دقیقتر و پایدارتر شود و احتمال خطا کاهش یابد.
شبکههای عصبی مصنوعی الهام گرفته از مغز انسان هستند. آنها از لایههای متعددی از نرونها تشکیل شدهاند که به هم متصل هستند. شبکههای عصبی میتوانند الگوهای بسیار پیچیدهای را در دادهها شناسایی کنند و برای مسائل پیچیدهتر مانند پردازش تصویر و پردازش زبان طبیعی بسیار مناسب هستند.
یادگیری عمیق زیرمجموعهای از یادگیری ماشین است که از شبکههای عصبی بسیار عمیق استفاده میکند. این شبکهها میتوانند ویژگیهای پیچیده و انتزاعی را در دادهها شناسایی کنند و برای مسائل پیچیدهتری مانند تشخیص گفتار، ترجمه ماشینی و خودروهای خودران استفاده میشوند.
روشهای هیبریدی ترکیبی از روشهای مختلف هستند. مثلاً، میتوانیم از یک شبکه عصبی برای استخراج ویژگیهای مهم از دادهها استفاده کنیم و سپس از یک درخت تصمیمگیری برای انجام پیشبینی نهایی استفاده کنیم. این روشها معمولاً دقت بالاتری نسبت به روشهای منفرد دارند.
به زبان سادهتر: روشهای یادگیری ماشین مثل مغزهای مصنوعی هستند که میتوانند از روی دادهها یاد بگیرند و الگوهای پیچیدهای را شناسایی کنند. این روشها برای حل مسائل پیچیدهتر و پیشبینیهای دقیقتر بسیار مفید هستند.
مثالی برای درک بهتر: فرض کنید میخواهیم تشخیص دهیم که یک ایمیل اسپم است یا نه. با استفاده از یک شبکه عصبی میتوانیم ویژگیهای مختلف ایمیل مانند کلمات کلیدی، طول ایمیل، فرستنده و … را تحلیل کنیم و با دقت بالایی تشخیص دهیم که آیا این ایمیل اسپم است یا نه.