خواندن ۲ دقیقه·۷ سال پیش

آماره و پارامتر!

یک جامعه ی آماری به وسیله ی یک تابع توزیع احتمال مدل می شود. هر تابع توزیع دارای پارامترهای مشخصی مثل میانگین و واریانس است که برای هر جامعه اعدادی ثابت و مشخص اند. می توان این پارامترها را به کمک آماره ها یا statistics تخمین زد. به این صورت که با عمل نمونه گیری تخمینی برای آن پارامتر خواهیم داشت. از آنجایی که میزان تخمینی که برای هر پارامتر می زنیم کاملا وابسته به نمونه ی انتخابی خواهد داشت، در واقع ما با یک تابع توزیع برای آماره مواجه خواهیم بود. مثلا در یک جامعه صدهزار عضوی مقدار میانگین عدد ثابت و مشخص 132 است. برای محاسبه ی این عدد باید همه ی 100 هزار عضو جامعه را بررسی کرده و از آن ها میانگین گیری کنیم. در عمل انجام این کار ممکن نیست و عملا عدد 132 برای ما معلوم نخواهد بود. به جای آن سعی می کنیم تا مقدار آن را تخمین بزنیم. مثلا یک نمونه ی 50 عضوی از جامعه را انتخاب کرده و میانگین آن را (مثلا 135) که یک آماره خواهد بود، به عنوان تخمینی از میانگین جامعه در نظر می گیریم. طبیعی است که اگر به جای این نمونه ی 50 عضو نمونه ی 50 عضوی دیگری انتخاب می شد این تخمین عدد دیگری می بود و مثلا به تخمین 134می رسیدیم. پس در عمل آماره ی میانگین 50 عضوی این که بیان کردیم یک عدد ثابت نبوده و بلکه خودش یک متغیر تصادفی با یک تابع توزیع احتمال خواهد بود. از این رو به جای بیان نقطه ی آماره که به point estimation معروف است، عملا به بیان بازه ای آماره که به confidence interval است نیاز خواهیم داشت. در متد دوم میزان اعتماد یا confidence ما به تعلق داشتن پارامتری که با آماره تخمین زده می شود، در یک بازه ی مشخص بیان می شود. دقت کنید که confidence interval تنها برای پارامتر معنا دار است و بیان آن برای آماره کاملا بی معناست.

احتمال

علی

دانشجوی دکتری- دانشگاه بازل

شاید از این پست‌ها خوشتان بیاید

علی