ایردا - IRDA
ایردا - IRDA
خواندن ۱۱ دقیقه·۴ سال پیش

آزمون‌های پارامتری

اگر با علم آمار آشنایی داشته باشید، باید بدانید که استنباط آماری در یک نمونه‌ی تصادفی با یک یا چند پارامتر مجهول، معمولاً با معلوم بودن نوع توزیع احتمال یک متغیر تصادفی، صورت می‌گیرد. به عنوان مثال فرض کنید که نمونه‌ای تصادفی از نمرات دانشجویان کلاس درس ریاضی داشته باشیم و نمره یک دانشجو، متغیری تصادفی با توزیع نرمال باشد. می‌خواهیم میانه‌ی این متغیر (یعنی پارامتری که نمرات ۵۰ درصد از دانشجویان، کمتر از آن است) را برآورد کنیم. چون در توزیع نرمال، میانگین و میانه با هم برابر هستند، در نتیجه میانگین نمونه‌ی تصادفی، هم میانگین و هم میانه را برآورد می‌کند. بنابراین در این مسئله، برآوردیابی را با دانستن نوع توزیع جامعه، انجام داده‌ایم. از اینرو این شاخه از علم آمار را «آمار پارامتری» گوییم.

تصور کنید در حال اجرای آزمایشی هستید که می‌خواهید دو گروه را با هم مقایسه کنید و تفاوت بین آنها را تعیین کنید. مثلاً می‌خواهید بدانید:

  • آیا مردم یک کشور از افراد کشور دیگر بلندتر هستند؟
  • آیا مغز یک فرد هنگام تماشای فیلم‌های شاد بیشتر از فیلم‌های غمگین فعال است؟

این مقایسه‌ها را می‌توان با انجام تجزیه و تحلیل آماری مختلف، مانند آزمون Z و آزمون T انجام داد. از

آزمون‌های Z و T در آزمون فرض مربوط به میانگین یک یا دو جامعه‌ی مستقل استفاده می‌شود. با استفاده از یک بلاک کد سریع، تولید نتایج از این تست‌ها آسان است اما در این وبلاگ، در مورد ریاضیات و مفروضات پشت هر یک از این آزمون‌ها بحث خواهیم کرد. همچنین فرض می‌کنیم شما اصول اجرای آزمون فرض آماری را درک کرده‌اید.

آزمون Z :

وقتی می‌خواهیم آزمون کنیم که نمونه‌ای از جمعیت مشخصی آمده است، از آزمون Z استفاده می‌شود. به عبارت دیگر، می‌خواهیم آزمون کنیم که آیا نمونه با آنچه از جمعیت معینی انتظار داریم متفاوت است یا خیر.

مفروضات آزمون Z :

برای اجرای آزمون Z ابتدا به یک نمونه نیاز داریم. در آزمون Z ، نمونه ما به طور کلی بزرگ است (حجم نمونه باید بزرگتر یا مساوی با ۳۰ باشد). ما همچنین باید اطمینان حاصل کنیم که نمونه ما به طور تصادفی انتخاب شده و روند انتخاب نمونه، مستقل است. مورد دیگری که باید به آن توجه داشت و در آزمون Z شرط اساسی محسوب می‌شود، معلوم بودن واریانس جامعه است. اگر این شرط برقرار نباشد، از آزمون T استفاده خواهیم کرد.

انواع آزمون Z :

  • آزمون Z تک نمونه‌ای: آزمون و استنباط در مورد میانگین یک جامعه.
  • آزمون Z برای نمونه‌هایی از دو جامعه‌ی مستقل: آزمون و استنباط در مورد میانگین دو جامعه مستقل.

آزمون Z تک نمونه‌ای:

پس از اطمینان حاصل کردن از تحقق مفروضات فوق در مسئله، می¬توانیم آزمون Z را اجرا کنیم. برای شروع، آماره Z را محاسبه می‌کنیم. آماره Z استاندارد‌سازی میانگین نمونه شما نسبت به توزیع نرمال استاندارد است. برای یادآوری، یک توزیع نرمال استاندارد دارای میانگین صفر و واریانس واحد است. فرمول محاسبه آماره Z به صورت زیر است:

پس از داشتن آماره‌ی Z ، برای محاسبه‌ی p-value به جدول Z نگاه می‌کنیم. در این جداول، اندازه‌ی مساحت زیر منحنی نرمال استاندارد، محاسبه شده است. برای آشنایی بیشتر با p-value و نحوه محاسبه آن، پیشنهاد می‌شود مطالب مربوط به آن را که در همین وبلاگ تهیه شده، مشاهده کنید. برای یافتن p-value، باید فرض مقابل را در نظر بگیریم. اگر فرضیه مقابل شما بیان می‌کند:

  • میانگین نمونه بیشتر از میانگین جمعیت است: احتمالی را که با استفاده از جدول نرمال استاندارد به دست آورده‌اید، از ۱ کم کنید تا p-value به دست آید.
  • میانگین نمونه کمتر از میانگین جمعیت است: از احتمالی که با استفاده از جدول نرمال استاندارد به دست آورده‌اید، به عنوان p-value استفاده کنید.
  • میانگین نمونه با میانگین جمعیت برابر نیست: هر کدام از احتمال‌های بالا که کمتر بود را انتخاب کرده و سپس در دو ضرب کنید تا p-value به دست آید.

اگر مقدار p-value شما از مقدار آلفای شما کمتر باشد، در این صورت می‌توانید فرض صفر را رد کرده و بیان کنید که اختلاف آماری وجود دارد. در غیر این صورت، شما نمی‌توانید فرض صفر را رد کرده و بگویید که نمونه با جمعیت متفاوت است. اگر مقدار آلفا یا خطای نوع اول مشخص نباشد، به صورت قراردادی از مقدار ۰/۰۵ برای آلفا استفاده می‌کنیم.

آزمون Z برای نمونه‌هایی از دو جامعه‌ی مستقل:

برای آزمون در مورد میانگین دو جامعه‌ی مستقل، با فرض نرمال بودن مشاهدات و مشخص بودن واریانس دو جامعه، می‌توان از آماره‌ Z با توزیع نرمال استاندارد استفاده کرد. در چنین حالتی برای آزمون فرض دو طرفه‌ی

آماره آزمون به صورت،

تعریف می‌شود.

فرض کنید دانشجویی می‌خواهد بفهمد کدام یک از اساتید زیست شناسی یا اساتید زبان انگلیسی الگوهای رفتاری (memes) بیشتری می‌دانند. این دانشجو یک مسابقه الگوی رفتاری می‌نویسد و آن را در ساعت‌های اداری بر روی ۱۴ استاد بی‌خبر زیست شناسی و ۱۸ استاد بی‌خبر زبان انگلیسی پیاده‌سازی می‌کند.

اساتید زیست شناسی نمرات زیر را کسب می‌کنند:

و همچنین اساتید زبان انگلیسی نمرات زیر را کسب می‌کنند:

فرض کنید مشاهدات دارای توزیع نرمال و به ترتیب دارای واریانس معلوم ۳ برای گروه ۱ (اساتید زیست‌شناسی) و واریانس ۲ برای گروه ۲ (اساتید زبان انگلیسی) باشند. می‌خواهیم آزمون کنیم که بین نمرات اساتید زیست‌شناسی و نمرات اساتید زبان انگلیسی تفاوت معناداری وجود دارد یا خیر. بنابراین آزمون فرض زیر را برای اساتید زیست شناسی به عنوان گروه یک و اساتید زبان انگلیسی به عنوان گروه دو در نظر بگیرید:

برای اجرای آزمون در نرم افزار R به صورت زیر عمل می‌کنیم:

با توجه به خروجی نرم افزار، مقدار آماره‌ی آزمون Z برابر با 3756/0- به دست آمد. برای محاسبه‌ی p-value از جدول توزیع نرمال استاندارد استفاده می‌کنیم. بنابراین داریم:

همچنین اگر به جدول توزیع نرمال استاندارد دسترسی ندارید، می‌توان برای محاسبه‌ی p-value از نرم افزار R به صورت زیر کمک گرفت:

بنابراین با توجه به خروجی نرم افزار p-value برای این آزمون برابر با ۰/۷۱ بوده و چون بیشتر از سطح معناداری ۰/۰۵ است، فرض صفر را قبول می‌کنیم. به عبارت دیگر تفاوت معناداری بین میانگین نمرات اساتید زیست شناسی و اساتید زبان انگلیسی وجود ندارد.

آزمون T چیست؟

آزمون T یک نوع آمار استنباطی است که برای مطالعه اختلاف آماری موجود بین دو گروه و یا دو متغیر وابسته در یک گروه مورد استفاده قرار می‌گیرد.

آزمون T در اصل بر پایه‌ی توزیع T شکل می‌گیرد. این توزیع در سال ۱۹۰۸ توسط و.س.گوست (W.S. Gossett, 1876-1937) با نام مستعار «استیودنت» گسترش یافت. گوست، زندگی حرفه‌ای خود را صرف تأسیس شرکت آبجوسازی گینس، ابتدا در دوبلین و سپس در لندن کرد. علاقه‌ی او به آمار، ریشه در مسایلی داشت که به کنترل کیفیت مواد تشکیل دهنده‌ی آبجو مربوط می‌شد. او در تدوین و تنظیم روش‌های آماری و طرح‌های آزمایشی، سهم بسزایی داشت. اگرچه نامبرده به عنوان ریاضیدانی برجسته مورد توجه قرار نگرفت، اما به علت قابلیت مورد ملاحظه و استنباط شهودی که در حل مسائل آماری داشت، از او به عنوان فارادی آمار نام برده‌اند.

انواع آزمون T-Student :

متناسب با فرضیات مسئله، انواع مختلفی از آزمون‌های آماری وجود دارد. بنابراین فرضیاتی که باید هنگام تصمیم گیری درباره نوع آزمون به آنها توجه کنید، عبارت‌اند از:

  • زوجی یا مستقل بودن مشاهدات: آیا داده‌های هر دو گروه از یک آزمودنی حاصل می‌شوند یا خیر.
  • روش استنباط پارامتری یا ناپارامتری: آیا توزیع داده‌ها مشخص است یا خیر.

سه نوع متفاوت از آزمون T وجود دارد:

  • آزمون T تک نمونه‌ای (One Sample T Test): آزمون و استنباط در مورد میانگین یک جامعه.
  • آزمون T برای نمونه‌های از متغیرهای زوجی(Paired Sample T Test) : آزمون و استنباط در مورد میانگین دو متغیر از یک جامعه.
  • آزمون T برای نمونه‌هایی از دو جامعه مستقل (Unpaired Two Sample T Test) : آزمون و استنباط در مورد میانگین دو جامعه مستقل.
  • آزمون T کلاسیک : اگر فرض برابری واریانس‌های دو جامعه برقرار باشد.
  • آزمون T-Welch : اگر واریانس‌های دو جامعه، نابرابر باشند.

همانطور که گفته شد، تفاوت‌هایی که آزمون T را از سایر آزمون‌ها متفاوت می‌سازد، مفروضات مهم مسئله است:

  1. داده‌ها باید از مقیاس پیوسته یا ترتیبی پیروی کنند.
  2. داده‌ها باید به طور تصادفی انتخاب شوند.
  3. داده‌ها باید دارای توزیع نرمال باشند.
  4. داده‌ها باید دارای واریانس ثابت باشند.

آزمون T تک نمونه‌ای (One Sample T Test):

این آزمون، میانگین (μ) جامعه‌ای با توزیع نرمال را با مقدار مشخص شده‌ای، مقایسه می‌کند. بنابراین برای آزمون فرض

آماره آزمون برای آزمون T تک نمونه‌ای به صورت

تعریف می‌شود که این آماره دارای توزیع T با (n-1) درجه‌ی آزادی است.

پس از به دست آوردن مقدار آماره‌ی آزمون، p-value را از طریق جدول آماری T جستجو کنید. در نرم افزار R، تابع t.test این کار را برای ما انجام می‌دهد. اگر p-value از مقدار معناداری از پیش تعیین شده کمتر بود، فرض صفر را رد کنید و فرض مقابل را بپذیرید.

به عنوان مثال، نمونه‌ی تصادفی از پرونده‌های شرکتی نشان می‌دهد که سفارشات برای قطعه‌ی معینی از ماشین‌ها به ترتیب در ۱۰، ۱۲، ۱۹، ۱۴، ۱۵، ۱۸، ۱۱ و ۱۳ روز بایگانی شده است. مدیر شرکت ادعا می‌کند که میانگین زمان بایگانی چنین سفارشاتی ۱۰/۵ روز است. اگر تعداد روزهای بایگانی از توزیع نرمال پیروی کند، آیا در سطح معناداری ۰/۰۱ می‌توان چنین ادعایی را پذیرفت؟

در این مثال با آزمون

مواجه هستیم که در واریانس جامعه نامعلوم است. پس برای انجام آزمون، می‌توان از آزمون T تک نمونه‌ای کمک گرفت. به همین منظور از تابع t.test در نرم افزار R استفاده می‌کنیم:

با توجه به خروجی نرم افزار، p-value بیشتر از سطح معناداری ۰/۰۱ است. پس می توانیم فرض صفر را قبول کنیم و در نتیجه ادعای مدیر شرکت را در مورد میانگین روزهای بایگانی سفارشات، بپذیریم.

آزمون T برای نمونه‌ای از متغیرهای زوجی(Paired Sample T Test)

از این آزمون برای مقایسه میانگین بین دو گروه در یک نمونه استفاده می‌شود. به عبارت دیگر، اگر شما می‌خواهید در مورد میانگین یک گروه از آزمودنی‌ها، قبل و بعد از یک آزمایش یا یک تمرین و... استنباطی انجام دهید، می‌توانید از آزمون T جفتی استفاده کنید. در این حالت، در واقع، برای هر مشاهده دوبار اندازه‌گیری یک متغیر کمی صورت گرفته است.

به عنوان مثال، فرض کنید در آزمایشی، ۲۰ موش در طی ۳ ماه تحت درمان X قرار گرفتند. ما می خواهیم بدانیم که آیا درمان X بر وزن موش‌ها تاثیر دارد یا خیر. برای پاسخ به این سوال، وزن ۲۰ موش قبل و بعد از درمان اندازه‌گیری شده است. بنابراین مشاهدات به صورت ۲۰ مجموعه مقادیر قبل از درمان و ۲۰ مجموعه مقادیر بعد از درمان X، حاصل از دوبار اندازه‌گیری وزن هر موش، جمع‌آوری شده است. در چنین شرایطی، می‌توان از آزمون T زوجی برای مقایسه میانگین وزن قبل و بعد از درمان موش‌ها استفاده کرد.

تجزیه و تحلیل آزمون T زوجی به شرح زیر انجام می‌شود:

  • اختلاف (d) بین هر جفت از مشاهدات را محاسبه کنید.
  • میانگین (m) و انحراف استاندارد (s) مربوط به مشاهدات d را محاسبه کنید.
  • اختلاف میانگین را با صفر مقایسه کنید. اگر تفاوت معنی داری بین دو جفت نمونه وجود داشته باشد، انتظار می‌رود که میانگین d از صفر فاصله داشته باشد.

به این ترتیب برای آزمون فرض،

مقدار آماره‌ی آزمون T زوجی را می‌توان با استفاده از فرمول زیر محاسبه کرد:

که این آماره دارای توزیع T با (n-1) درجه‌ی آزادی است.

تابع R برای محاسبه آزمون T زوجی:

برای اجرای آزمون T نمونه‌های جفتی (x , y) ، می‌توان از تابع t.test در نرم افزار R، به صورت زیر استفاده کرد:

با توجه به مثال گفته شده، از یک مجموعه داده نمونه استفاده خواهیم کرد که شامل وزن ۱۰ موش قبل و بعد از درمان است.

برای مشاهده‌ی داده‌ها از نمودار جعبه‌ای در نرم افزار R استفاده می‌کنیم:

سپس فرضیات آزمون T جفتی، شامل نرمال بودن داده‌ها را بررسی می‌کنیم. به این منظور از آزمون شاپیرو در نرم افزار R استفاده می‌کنیم.

با توجه به خروجی نرم افزار، p-value بیشتر از سطح معناداری ۰/۰۵ است که نشان می‌دهد توزیع اختلافات (d) تفاوت معناداری با توزیع نرمال ندارد. به عبارت دیگر ، ما می‌توانیم فرض نرمال بودن مشاهدات (d) را بپذیریم.

اکنون می‌توانیم با استفاده از تابع t.test، آزمون T جفتی را بر روی مشاهدات پیاده‌سازی کنیم:

با توجه به خروجی نرم افزار، p-value کمتر از سطح معناداری ۰/۰۵ است. پس می‌توانیم فرض صفر را رد کنیم و نتیجه بگیریم که میانگین وزن موش‌ها قبل از درمان با میانگین وزن بعد از درمان، تفاوت معناداری دارد.

آزمون T برای نمونه‌هایی از دو جامعه مستقل (Unpaired Two Sample T Test)

از این آزمون برای مقایسه میانگین دو گروه مستقل استفاده می‌شود. به عنوان مثال، فرض کنید در شرکتی، وزن ۱۰۰ فرد را اندازه‌گیری کرده‌ایم: ۵۰ کارمند خانم (گروه A) و ۵۰ کارمند آقا (گروه B). می‌خواهیم بدانیم که آیا میانگین وزن خانم‌ها با میانگین وزن آقایان تفاوت معناداری دارد یا خیر. در این حالت، دو گروه نمونه مستقل (یا جفت نشده) داریم. بنابراین، می‌توان از آزمون T مستقل برای ارزیابی متفاوت بودن میانگین‌ها استفاده کرد.

برای استفاده از آزمون T مستقل، فرض صفر به صورت

تعریف می‌شود و فرض مقابل را به صورت یکی از حالت زیر

در نظر می‌گیریم. در اینجا فرض کنید، فرض مقابل دو طرفه را در نظر گرفته‌ایم.

آزمون T کلاسیک :

در صورتی که واریانس دو گروه برابر باشد، آماره‌ی آزمون T مستقل برای مقایسه‌ی میانگین دو نمونه (A و B) به صورت زیر تعریف می‌شود:

که در آن S2 واریانس آمیخته برای دو جامعه A و B است که به صورت زیر محاسبه می‌شود:

در این حالت آماره آزمون دارای توزیع T با

درجه‌ی آزادی است.

آزمون T-Welch :

در صورتی که واریانس دو گروه برابر نباشد، برای مقایسه‌ی میانگین دو نمونه (A و B) از آماره‌ی

T-Welch استفاده می‌شود که به صورت زیر تعریف می‌شود:

این آماره نیز دارای توزیع T با درجه آزادی زیر است:

تابع R برای محاسبه آزمون T مستقل:

با توجه به مثال گفته شده، از یک مجموعه داده نمونه استفاده خواهیم کرد که شامل وزن ۹ کارمند خانم و ۹ کارمند آقا در یک شرکت است:

برای مشاهده‌ی داده‌ها از نمودار جعبه‌ای در نرم افزار R استفاده می‌کنیم:

سپس فرضیات آزمون T مستقل، شامل نرمال بودن داده‌ها و برابری واریانس دو جامعه را بررسی می‌کنیم. برای بررسی نرمال بودن مشاهدات از آزمون شاپیرو در نرم افزار R استفاده می‌کنیم.

با توجه به خروجی نرم افزار، p-value بیشتر از سطح معناداری ۰/۰۵ است که نشان می‌دهد توزیع مشاهدات تفاوت معناداری با توزیع نرمال ندارد.

همچنین برای آزمون برابری واریانس‌ها نیز می‌توان از تابع var.test استفاده کرد. این آزمون از آماره‌ی فیشر (F) برای انجام آزمون نسبت واریانس‌ها استفاده می‌کند.

با توجه به خروجی نرم افزار، p-value برای آزمون فیشر، بیشتر از سطح معناداری آلفا یعنی ۰/۰۵ است. در نتیجه، تفاوت معنی‌داری بین واریانس دو مجموعه داده، وجود ندارد. بنابراین، می‌توانیم از آزمون T کلاسیک برای مقایسه میانگین‌های دو نمونه‌ی مستقل استفاده کنیم.

اکنون می‌توانیم با استفاده از تابع t.test، آزمون T جفتی را بر روی مشاهدات پیاده‌سازی کنیم:

با توجه به خروجی نرم افزار، p-value کمتر از سطح معنا داری آلفا یعنی ۰/۰۵ است. پس می‌توان نتیجه گرفت که میانگین وزن کارمندان آقا با میانگین وزن کارمندان خانم، تفاوت معناداری دارد.

به این ترتیب در این مقاله با دو روش کلی از آزمون‌های پارامتری به نام‌های آزمون Z و آزمون T، برای استنباط در مورد میانگین جامعه، آشنا شدیم.

آزمون های پارامتریایردامرجع آمار ایران
مرجع تخصصی آمار ایران
شاید از این پست‌ها خوشتان بیاید