Hamed Rezaei
Hamed Rezaei
خواندن ۴ دقیقه·۴ سال پیش

استنباط آماری چیست؟

در مقاله اول درباره اینکه آمار چیست، صحبت کردیم، حالا می‌خواهیم مفهوم استنباط در آمار را یاد بگیریم، اگر برای اولین بار با این کلمه مواجه می‌شوید، شاید خیلی مبهم باشه براتون براتون استنباط یعنی چی؟ در زبان انگلیسی این واژه را با Inference بیان می‌کنند، یعنی فرآیند (process) پی بردن (استنتاج) در مورد هر چیزی، پس به ظور مشخص ما دنبال فرآیندی هستیم که بتوانیم درک درستی از هر چیزی به دست آوریم و این هر چیزی در دنیای آمار شامل داده‌ها و مشاهدات است، خب فرض کنید شما درمورد تعداد ماهیان قزل‌آلای دریای خزر می‌خواهید مطالعه کنید، و یک تخمین(برآورد)، از تعداد ماهیان را به دست آوردید، قطعا بی‌ربط‌ترین جواب ممکن برای این مساله شمارش تعداد ماهیان قرل‌آلای موجود در این دریا است! پس چاره چیست؟ شما برای جواب به این سوال دست به دامن علم آمار خواهید شد و با ابزارهای موجود در شاخه‌های مختلف به جواب مساله خواهید رسید، برای حل این مساله شاخه‌های مختلف آمار از قبیل آمار فضائی(Spatial Statistics)، نمونه‌گیری(Sampling)، مطالعات کوچک ناحیه‌ای(Small area)، برآوردیابی(Estimation) کمک حال شما خواهد بود و به شما در راستای رسیدن به جواب مساله کمک خواهد کرد! در اصل از دیدگاه آماری کلاسیک شما به دنبال لمس ویژگی قابل اندازه‌گیری در عین حال مجهول از جامعه آماری ماهیان قزل‌آلای دریای خزر هستید؛ که این ویژگی را به نام پارامتر می‌شناسیم.

پارامتر چیست؟

برای بیان مفهوم این واژه با دو دیدگاه کلاسیک و بیزی مواجه خواهیم بود، کلاسیک‌کاران پارامتر را یک ویژگی معلوم‌الحالی از جامعه می‌دانند که اصل آن برای ما مجهول است، در دیدگاه بیزی این ویژگی جامعه معلوم الحال نیست! و یک متغیر محسوب می‌شود. برای به دست آوردن پارامتر دست به دامان شیوه‌های برآوردیابی برای مشاهده این ویژگی خواهیم بود،در دیدگاه کلاسیک آماری از جمله شیوه‌های براورد‌یابی برای برآورد یا تخمین شامل برآودگرهای ماکزیمم درست‌نمایی(Maximum Likelihood Estimator)، روش گشتاوری (Method of Moment Estimator)، نااریب با کمترین واریانس یکنواخت(Uniformly Minimum Variance Unbiased Estimator) ، کمترین توان دوم خطا (Least Square Error) و ...راه چاره ما خواهند بود؛ و در دیدگاه بیزین‌ها، از روش‌های بیزی تشکیل پیشین، پسین، توابع زیان و ... برای استنباط استقاده می‌شود، فعلا به این آشنایی اکتفا می‌کنیم و در مقالات بعدی در مورد نحوه انجام برآورد کلاسیک و برآورد بیزی به طور مفصل صحبت می‌کنیم، پس تا اینجای کار مفهوم پارامتر را به عنوان ویژگی از جامعه که ممکن است، ویژگی معلوم‌الحال مجهول از جامعه یا متغیر باشد، جمع‌بندی می‌کنیم، وقتی این مفهوم را دریابیم، اولین چالشی که با آن مواجه خواهیم بود، دقت و کارایی این پارامتر برآورد (تخمین) شده خواهد بود، پس مفاهیمی از قبیل برآودگر، اریبی و نااریبی در زمینه این برآورد چالش‌های اصلی ما خواهند بود.

برآودگر چیست؟

شما برای اندازه‌گیری هر ویژگی در دنیای ریاضیات همیشه به دنبال جمع‎بندی و ارائه یک صورت کلی از آن ویژگی هستید، در دنیای آمار نیز شما برای اندازه‌گیری پارامتر به دنبال ارائه یک صورت کلی از آن هستید، برآوردگرها که پیش‌تر شیوه‌های برآورد آنها را معرفی کردیم، ابزار رسیدن ما برای این منظور خواهند بود، از جمله برآوردگر‌های معروف در دنیای آمار مجموع، میانگین،مد، میانه واریانس و هر صورتی که شما می‌توانید، پارامتر را توسط آن جمع‌بندی کنید. آماری‌ها آن‌ها را با نام آماره می‌شناسند. خب الان سوالی که پیش می‌آید اینه که هر کسی از راه برسد و یک فرمول ارائه دهد، می‌تواند ویژگی‌های جامعه را بیان کند؟ در جواب شما باید بگویم که آماردانان چون اعتقاد راسخی به جمله پیش‌گیری بهتر از درمان دارند؛ بر روی برآوردگرها یک سری شرط‌ها و قیدهایی در راستای محدودیت آنها برای دستیابی به بهترین حالت ممکن ارائه دادند، این مفاهیم شامل اریبی و ناراریبی برآوردگرها بودند.

اریبی و نااریبی چیست؟

خب شما در برآورد هر ویژگی به دنبال سنجش دقت این برآورد، هستید، اریبی در مفهوم میزان انحراف پارامتر برآورد شده شما از برآوردگر ارائه شده شما است؛ اگر دقت این برآودگر به نحوی باشد که میزان انحراف شما برابر صفر باشد در اصلاح می‌گویند برآوردگر نااریب است! در یادگیری ماشین وقتی چنین حالتی برای ماشین پیش بیاید می‌گوییم ماشین در حال حفظ کردن است! و این اصلا جلوه جالبی از ماشین در حال یادگیری ما نیست، و تمام چالش ما در این مسیر تفکیک مرز باریک حفظ کردن و یادگیری است؛ شاید براتون جالب باشه آماری‌ها همیشه خودشون رو درگیر یافتن بهترین برآوردگر نااریب خطی روی کاغذ کردن و ساعت‌ها وقت و مطالعه روی این موضوع انجام دادند، شاید هم من در درک این موضوع و چالش‌هامون ناتوانم :) فقط این نکته رو هم در نظر داشته باشید اریبی علاوه بر استنباط در نمونه‌گیری و تفسیر و تحلیل هم می‌تواند، وجود داشته باشد.

جمع‌بندی

پس در نهایت استنباط آماری را این‌گونه جمع‌بندی می‌کنیم، شاخه‌ای از آمار که با شناخت مشاهدات و داده‌ها در راستای برآورد پارامترها است و برای مقایسه کارایی آنها از مفهوم اریبی و ناراریبی بهره می‌گیرد، تمامی این مطالب مطرح شده، قابل تبدیل به چارچوب و فرمول‎های ریاضی است، که می‌توانید برای یادگیری آنها از کتاب‌های استباط آماری و آمار ریاضی از جناب آقایان دکتر پارسیان و بهبودیان بهر‌مند شوید. در ادامه مطالب ارئه شده به بیان مفهوم ابرپارامتر یا هایپر پارامتر پرداخته می‌شود.

ممنون که تا انتها با من همراه بودید :)


آماردیتاساینستحلیلاستنباطدانشجو
ارشد آماراقتصادی| دیتاساینتیست|والیبالیست سابق
شاید از این پست‌ها خوشتان بیاید