پیش بینی آماری چیست؟

یک پیشگویی (prediction یا forecast) عبارتی برای بیان یک رویداد در آینده است. پیشگویی اغلب، اما نه همیشه مبتنی بر تجربه یا دانش است. هیچ تفاوت دقیقی بین این دو اصطلاح هنوز مشخص نشده است. نویسندگان و علوم مختلف تعبیرهای متفاوتی را به این دو واژه نسبت می‌دهند (مقایسه با برایند). اطلاعات دقیق و تضمین‌شده در مورد آینده در بسیاری از موارد غیرممکن است؛ زیرا رویدادهای آینده لزوماً نامشخص هستند؛ اما پیش‌گویی می‌تواند به تهیه برنامه‌هایی در جهت پیشرفت‌های احتمالی کمک کند. هووارد استیونسون (Howard H. Stevenson) می‌نویسد که پیشگویی در تجارت را حداقل در دو واژه می‌توان بیان کرد: مهم و سخت.

پیشگویی یا پیش بینی آماری

پیش بینی آماری بخشی از استنباط آماری است. استنباط پیشگو یک روش خاص برای استنباط آماری است؛ اما پیشگویی را می‌توان به وسیله روش‌های متعددی برای استنباط آماری انجام داد. در واقع یک توصیف از آمار این است که می‌تواند اطلاعات یک نمونه از جمعیت را به کل جمعیت و سایر جمعیت‌های مرتبط تعمیم دهد که لزوماً همان پیشگویی نیست. هنگامی که اطلاعات به مرور زمان منتقل می‌شوند؛ اغلب در نقاط زمانی خاص، این روند به عنوان پیش بینی شناخته می‌شود. پیش بینی معمولاً به سری‌های زمانی نیاز دارد، در حالی که پیش گویی اغلب بر روی داده‌های مقطعی انجام می‌شود.

روش‌های آماری مورد استفاده برای پیش گویی شامل تحلیل رگرسیونی و زیر گروه‌های مختلفش از جمله رگرسیون خطی، مدل‌های خطی تعمیم‌یافته (رگرسیون لوژستیکی یا logistic regression)، رگرسیون پواسونی (Poisson regression)، رگرسیون پروبیت (Probit regression) و غیره است. در پیش بینی می‌توان مدل‌های میانگین متحرک اتورگرسیو (autoregressive moving average) و اتورگرسیون بُرداری (vector autoregression) را استفاده کرد. هنگامی که این روش‌ها و یا روش‌های مرتبط با آن‌ها، ست کلی رگرسیون یا روش‌های یادگیری ماشین (machine learning) مورد استفاده تجاری قرار می‌گیرند به عنوان تحلیل پیشگو شناخته می‌شوند. مدل‌سازی آماری ابزاری قدرتمند برای توسعه و آزمایش تئوری‌ها از طریق توضیحات عِلّی، پیش بینی و توصیف است.

مدل‌سازی پیشگو می‌تواند به عنوان فرایند استفاده از یک مدل آماری یا الگوریتم داده‌کاوی به منظور پیش گویی مشاهدات جدید یا آینده تعریف شود. به خصوص روی پیش گویی‌های غیر تصادفی تمرکز می‌کنم که هدف پیشگویی مقدار خروجی (Y) برای مشاهدات جدید با توجه به مقادیر ورودی آن‌ها (X) است. این تعریف همچنین شامل پیش بینی زمانی است که در آن مشاهدات تا زمان t ( ورودی) برای پیش بینی مقادیر آینده در زمان t + k, k>0 (خروجی) استفاده می‌شود. پیش بینی‌ها شامل پیش بینی‌های نقطه‌ای (point prediction) یا بازه‌ای (interval prediction)، نواحی پیش بینی (prediction regions)، توزیع پیشگو (predictive distributions) یا رتبه‌بندی مشاهدات جدید است. مدل پیشگو به روشی اطلاق می‌شود که فارغ از رویکرد آن پیشبینی‌ها را تولید می‌کند: بیزی (Bayesian) یا فراوانی گرایانه (frequentist)، پارامتری یا غیر پارامتری، الگوریتم داده کاوی یا مدل آماری و غیره.