مرجع تخصصی آمار ایران
پیش بینی آماری چیست؟
یک پیشگویی (prediction یا forecast) عبارتی برای بیان یک رویداد در آینده است. پیشگویی اغلب، اما نه همیشه مبتنی بر تجربه یا دانش است. هیچ تفاوت دقیقی بین این دو اصطلاح هنوز مشخص نشده است. نویسندگان و علوم مختلف تعبیرهای متفاوتی را به این دو واژه نسبت میدهند (مقایسه با برایند). اطلاعات دقیق و تضمینشده در مورد آینده در بسیاری از موارد غیرممکن است؛ زیرا رویدادهای آینده لزوماً نامشخص هستند؛ اما پیشگویی میتواند به تهیه برنامههایی در جهت پیشرفتهای احتمالی کمک کند. هووارد استیونسون (Howard H. Stevenson) مینویسد که پیشگویی در تجارت را حداقل در دو واژه میتوان بیان کرد: مهم و سخت.
پیشگویی یا پیش بینی آماری
پیش بینی آماری بخشی از استنباط آماری است. استنباط پیشگو یک روش خاص برای استنباط آماری است؛ اما پیشگویی را میتوان به وسیله روشهای متعددی برای استنباط آماری انجام داد. در واقع یک توصیف از آمار این است که میتواند اطلاعات یک نمونه از جمعیت را به کل جمعیت و سایر جمعیتهای مرتبط تعمیم دهد که لزوماً همان پیشگویی نیست. هنگامی که اطلاعات به مرور زمان منتقل میشوند؛ اغلب در نقاط زمانی خاص، این روند به عنوان پیش بینی شناخته میشود. پیش بینی معمولاً به سریهای زمانی نیاز دارد، در حالی که پیش گویی اغلب بر روی دادههای مقطعی انجام میشود.
روشهای آماری مورد استفاده برای پیش گویی شامل تحلیل رگرسیونی و زیر گروههای مختلفش از جمله رگرسیون خطی، مدلهای خطی تعمیمیافته (رگرسیون لوژستیکی یا logistic regression)، رگرسیون پواسونی (Poisson regression)، رگرسیون پروبیت (Probit regression) و غیره است. در پیش بینی میتوان مدلهای میانگین متحرک اتورگرسیو (autoregressive moving average) و اتورگرسیون بُرداری (vector autoregression) را استفاده کرد. هنگامی که این روشها و یا روشهای مرتبط با آنها، ست کلی رگرسیون یا روشهای یادگیری ماشین (machine learning) مورد استفاده تجاری قرار میگیرند به عنوان تحلیل پیشگو شناخته میشوند. مدلسازی آماری ابزاری قدرتمند برای توسعه و آزمایش تئوریها از طریق توضیحات عِلّی، پیش بینی و توصیف است.
مدلسازی پیشگو میتواند به عنوان فرایند استفاده از یک مدل آماری یا الگوریتم دادهکاوی به منظور پیش گویی مشاهدات جدید یا آینده تعریف شود. به خصوص روی پیش گوییهای غیر تصادفی تمرکز میکنم که هدف پیشگویی مقدار خروجی (Y) برای مشاهدات جدید با توجه به مقادیر ورودی آنها (X) است. این تعریف همچنین شامل پیش بینی زمانی است که در آن مشاهدات تا زمان t ( ورودی) برای پیش بینی مقادیر آینده در زمان t + k, k>0 (خروجی) استفاده میشود. پیش بینیها شامل پیش بینیهای نقطهای (point prediction) یا بازهای (interval prediction)، نواحی پیش بینی (prediction regions)، توزیع پیشگو (predictive distributions) یا رتبهبندی مشاهدات جدید است. مدل پیشگو به روشی اطلاق میشود که فارغ از رویکرد آن پیشبینیها را تولید میکند: بیزی (Bayesian) یا فراوانی گرایانه (frequentist)، پارامتری یا غیر پارامتری، الگوریتم داده کاوی یا مدل آماری و غیره.
مطلبی دیگر از این انتشارات
بهترین ابزارهای آنالیز آماری
مطلبی دیگر از این انتشارات
چگونه در سال آینده محقق داده (data scientist) بزرگی بشویم؟
مطلبی دیگر از این انتشارات
متغیرهای تصادفی و انواع آن