در مقاله اول درباره اینکه آمار چیست، صحبت کردیم، حالا میخواهیم مفهوم استنباط در آمار را یاد بگیریم، اگر برای اولین بار با این کلمه مواجه میشوید، شاید خیلی مبهم باشه براتون براتون استنباط یعنی چی؟ در زبان انگلیسی این واژه را با Inference بیان میکنند، یعنی فرآیند (process) پی بردن (استنتاج) در مورد هر چیزی، پس به ظور مشخص ما دنبال فرآیندی هستیم که بتوانیم درک درستی از هر چیزی به دست آوریم و این هر چیزی در دنیای آمار شامل دادهها و مشاهدات است، خب فرض کنید شما درمورد تعداد ماهیان قزلآلای دریای خزر میخواهید مطالعه کنید، و یک تخمین(برآورد)، از تعداد ماهیان را به دست آوردید، قطعا بیربطترین جواب ممکن برای این مساله شمارش تعداد ماهیان قرلآلای موجود در این دریا است! پس چاره چیست؟ شما برای جواب به این سوال دست به دامن علم آمار خواهید شد و با ابزارهای موجود در شاخههای مختلف به جواب مساله خواهید رسید، برای حل این مساله شاخههای مختلف آمار از قبیل آمار فضائی(Spatial Statistics)، نمونهگیری(Sampling)، مطالعات کوچک ناحیهای(Small area)، برآوردیابی(Estimation) کمک حال شما خواهد بود و به شما در راستای رسیدن به جواب مساله کمک خواهد کرد! در اصل از دیدگاه آماری کلاسیک شما به دنبال لمس ویژگی قابل اندازهگیری در عین حال مجهول از جامعه آماری ماهیان قزلآلای دریای خزر هستید؛ که این ویژگی را به نام پارامتر میشناسیم.
برای بیان مفهوم این واژه با دو دیدگاه کلاسیک و بیزی مواجه خواهیم بود، کلاسیککاران پارامتر را یک ویژگی معلومالحالی از جامعه میدانند که اصل آن برای ما مجهول است، در دیدگاه بیزی این ویژگی جامعه معلوم الحال نیست! و یک متغیر محسوب میشود. برای به دست آوردن پارامتر دست به دامان شیوههای برآوردیابی برای مشاهده این ویژگی خواهیم بود،در دیدگاه کلاسیک آماری از جمله شیوههای براوردیابی برای برآورد یا تخمین شامل برآودگرهای ماکزیمم درستنمایی(Maximum Likelihood Estimator)، روش گشتاوری (Method of Moment Estimator)، نااریب با کمترین واریانس یکنواخت(Uniformly Minimum Variance Unbiased Estimator) ، کمترین توان دوم خطا (Least Square Error) و ...راه چاره ما خواهند بود؛ و در دیدگاه بیزینها، از روشهای بیزی تشکیل پیشین، پسین، توابع زیان و ... برای استنباط استقاده میشود، فعلا به این آشنایی اکتفا میکنیم و در مقالات بعدی در مورد نحوه انجام برآورد کلاسیک و برآورد بیزی به طور مفصل صحبت میکنیم، پس تا اینجای کار مفهوم پارامتر را به عنوان ویژگی از جامعه که ممکن است، ویژگی معلومالحال مجهول از جامعه یا متغیر باشد، جمعبندی میکنیم، وقتی این مفهوم را دریابیم، اولین چالشی که با آن مواجه خواهیم بود، دقت و کارایی این پارامتر برآورد (تخمین) شده خواهد بود، پس مفاهیمی از قبیل برآودگر، اریبی و نااریبی در زمینه این برآورد چالشهای اصلی ما خواهند بود.
شما برای اندازهگیری هر ویژگی در دنیای ریاضیات همیشه به دنبال جمعبندی و ارائه یک صورت کلی از آن ویژگی هستید، در دنیای آمار نیز شما برای اندازهگیری پارامتر به دنبال ارائه یک صورت کلی از آن هستید، برآوردگرها که پیشتر شیوههای برآورد آنها را معرفی کردیم، ابزار رسیدن ما برای این منظور خواهند بود، از جمله برآوردگرهای معروف در دنیای آمار مجموع، میانگین،مد، میانه واریانس و هر صورتی که شما میتوانید، پارامتر را توسط آن جمعبندی کنید. آماریها آنها را با نام آماره میشناسند. خب الان سوالی که پیش میآید اینه که هر کسی از راه برسد و یک فرمول ارائه دهد، میتواند ویژگیهای جامعه را بیان کند؟ در جواب شما باید بگویم که آماردانان چون اعتقاد راسخی به جمله پیشگیری بهتر از درمان دارند؛ بر روی برآوردگرها یک سری شرطها و قیدهایی در راستای محدودیت آنها برای دستیابی به بهترین حالت ممکن ارائه دادند، این مفاهیم شامل اریبی و ناراریبی برآوردگرها بودند.
خب شما در برآورد هر ویژگی به دنبال سنجش دقت این برآورد، هستید، اریبی در مفهوم میزان انحراف پارامتر برآورد شده شما از برآوردگر ارائه شده شما است؛ اگر دقت این برآودگر به نحوی باشد که میزان انحراف شما برابر صفر باشد در اصلاح میگویند برآوردگر نااریب است! در یادگیری ماشین وقتی چنین حالتی برای ماشین پیش بیاید میگوییم ماشین در حال حفظ کردن است! و این اصلا جلوه جالبی از ماشین در حال یادگیری ما نیست، و تمام چالش ما در این مسیر تفکیک مرز باریک حفظ کردن و یادگیری است؛ شاید براتون جالب باشه آماریها همیشه خودشون رو درگیر یافتن بهترین برآوردگر نااریب خطی روی کاغذ کردن و ساعتها وقت و مطالعه روی این موضوع انجام دادند، شاید هم من در درک این موضوع و چالشهامون ناتوانم :) فقط این نکته رو هم در نظر داشته باشید اریبی علاوه بر استنباط در نمونهگیری و تفسیر و تحلیل هم میتواند، وجود داشته باشد.
جمعبندی
پس در نهایت استنباط آماری را اینگونه جمعبندی میکنیم، شاخهای از آمار که با شناخت مشاهدات و دادهها در راستای برآورد پارامترها است و برای مقایسه کارایی آنها از مفهوم اریبی و ناراریبی بهره میگیرد، تمامی این مطالب مطرح شده، قابل تبدیل به چارچوب و فرمولهای ریاضی است، که میتوانید برای یادگیری آنها از کتابهای استباط آماری و آمار ریاضی از جناب آقایان دکتر پارسیان و بهبودیان بهرمند شوید. در ادامه مطالب ارئه شده به بیان مفهوم ابرپارامتر یا هایپر پارامتر پرداخته میشود.