اگر با علم آمار آشنایی داشته باشید، باید بدانید که استنباط آماری در یک نمونهی تصادفی با یک یا چند پارامتر مجهول، معمولاً با معلوم بودن نوع توزیع احتمال یک متغیر تصادفی، صورت میگیرد. به عنوان مثال فرض کنید که نمونهای تصادفی از نمرات دانشجویان کلاس درس ریاضی داشته باشیم و نمره یک دانشجو، متغیری تصادفی با توزیع نرمال باشد. میخواهیم میانهی این متغیر (یعنی پارامتری که نمرات ۵۰ درصد از دانشجویان، کمتر از آن است) را برآورد کنیم. چون در توزیع نرمال، میانگین و میانه با هم برابر هستند، در نتیجه میانگین نمونهی تصادفی، هم میانگین و هم میانه را برآورد میکند. بنابراین در این مسئله، برآوردیابی را با دانستن نوع توزیع جامعه، انجام دادهایم. از اینرو این شاخه از علم آمار را «آمار پارامتری» گوییم.
تصور کنید در حال اجرای آزمایشی هستید که میخواهید دو گروه را با هم مقایسه کنید و تفاوت بین آنها را تعیین کنید. مثلاً میخواهید بدانید:
این مقایسهها را میتوان با انجام تجزیه و تحلیل آماری مختلف، مانند آزمون Z و آزمون T انجام داد. از
آزمونهای Z و T در آزمون فرض مربوط به میانگین یک یا دو جامعهی مستقل استفاده میشود. با استفاده از یک بلاک کد سریع، تولید نتایج از این تستها آسان است اما در این وبلاگ، در مورد ریاضیات و مفروضات پشت هر یک از این آزمونها بحث خواهیم کرد. همچنین فرض میکنیم شما اصول اجرای آزمون فرض آماری را درک کردهاید.
وقتی میخواهیم آزمون کنیم که نمونهای از جمعیت مشخصی آمده است، از آزمون Z استفاده میشود. به عبارت دیگر، میخواهیم آزمون کنیم که آیا نمونه با آنچه از جمعیت معینی انتظار داریم متفاوت است یا خیر.
مفروضات آزمون Z :
برای اجرای آزمون Z ابتدا به یک نمونه نیاز داریم. در آزمون Z ، نمونه ما به طور کلی بزرگ است (حجم نمونه باید بزرگتر یا مساوی با ۳۰ باشد). ما همچنین باید اطمینان حاصل کنیم که نمونه ما به طور تصادفی انتخاب شده و روند انتخاب نمونه، مستقل است. مورد دیگری که باید به آن توجه داشت و در آزمون Z شرط اساسی محسوب میشود، معلوم بودن واریانس جامعه است. اگر این شرط برقرار نباشد، از آزمون T استفاده خواهیم کرد.
انواع آزمون Z :
پس از اطمینان حاصل کردن از تحقق مفروضات فوق در مسئله، می¬توانیم آزمون Z را اجرا کنیم. برای شروع، آماره Z را محاسبه میکنیم. آماره Z استانداردسازی میانگین نمونه شما نسبت به توزیع نرمال استاندارد است. برای یادآوری، یک توزیع نرمال استاندارد دارای میانگین صفر و واریانس واحد است. فرمول محاسبه آماره Z به صورت زیر است:
پس از داشتن آمارهی Z ، برای محاسبهی p-value به جدول Z نگاه میکنیم. در این جداول، اندازهی مساحت زیر منحنی نرمال استاندارد، محاسبه شده است. برای آشنایی بیشتر با p-value و نحوه محاسبه آن، پیشنهاد میشود مطالب مربوط به آن را که در همین وبلاگ تهیه شده، مشاهده کنید. برای یافتن p-value، باید فرض مقابل را در نظر بگیریم. اگر فرضیه مقابل شما بیان میکند:
اگر مقدار p-value شما از مقدار آلفای شما کمتر باشد، در این صورت میتوانید فرض صفر را رد کرده و بیان کنید که اختلاف آماری وجود دارد. در غیر این صورت، شما نمیتوانید فرض صفر را رد کرده و بگویید که نمونه با جمعیت متفاوت است. اگر مقدار آلفا یا خطای نوع اول مشخص نباشد، به صورت قراردادی از مقدار ۰/۰۵ برای آلفا استفاده میکنیم.
برای آزمون در مورد میانگین دو جامعهی مستقل، با فرض نرمال بودن مشاهدات و مشخص بودن واریانس دو جامعه، میتوان از آماره Z با توزیع نرمال استاندارد استفاده کرد. در چنین حالتی برای آزمون فرض دو طرفهی
آماره آزمون به صورت،
تعریف میشود.
فرض کنید دانشجویی میخواهد بفهمد کدام یک از اساتید زیست شناسی یا اساتید زبان انگلیسی الگوهای رفتاری (memes) بیشتری میدانند. این دانشجو یک مسابقه الگوی رفتاری مینویسد و آن را در ساعتهای اداری بر روی ۱۴ استاد بیخبر زیست شناسی و ۱۸ استاد بیخبر زبان انگلیسی پیادهسازی میکند.
اساتید زیست شناسی نمرات زیر را کسب میکنند:
و همچنین اساتید زبان انگلیسی نمرات زیر را کسب میکنند:
فرض کنید مشاهدات دارای توزیع نرمال و به ترتیب دارای واریانس معلوم ۳ برای گروه ۱ (اساتید زیستشناسی) و واریانس ۲ برای گروه ۲ (اساتید زبان انگلیسی) باشند. میخواهیم آزمون کنیم که بین نمرات اساتید زیستشناسی و نمرات اساتید زبان انگلیسی تفاوت معناداری وجود دارد یا خیر. بنابراین آزمون فرض زیر را برای اساتید زیست شناسی به عنوان گروه یک و اساتید زبان انگلیسی به عنوان گروه دو در نظر بگیرید:
برای اجرای آزمون در نرم افزار R به صورت زیر عمل میکنیم:
با توجه به خروجی نرم افزار، مقدار آمارهی آزمون Z برابر با 3756/0- به دست آمد. برای محاسبهی p-value از جدول توزیع نرمال استاندارد استفاده میکنیم. بنابراین داریم:
همچنین اگر به جدول توزیع نرمال استاندارد دسترسی ندارید، میتوان برای محاسبهی p-value از نرم افزار R به صورت زیر کمک گرفت:
بنابراین با توجه به خروجی نرم افزار p-value برای این آزمون برابر با ۰/۷۱ بوده و چون بیشتر از سطح معناداری ۰/۰۵ است، فرض صفر را قبول میکنیم. به عبارت دیگر تفاوت معناداری بین میانگین نمرات اساتید زیست شناسی و اساتید زبان انگلیسی وجود ندارد.
آزمون T یک نوع آمار استنباطی است که برای مطالعه اختلاف آماری موجود بین دو گروه و یا دو متغیر وابسته در یک گروه مورد استفاده قرار میگیرد.
آزمون T در اصل بر پایهی توزیع T شکل میگیرد. این توزیع در سال ۱۹۰۸ توسط و.س.گوست (W.S. Gossett, 1876-1937) با نام مستعار «استیودنت» گسترش یافت. گوست، زندگی حرفهای خود را صرف تأسیس شرکت آبجوسازی گینس، ابتدا در دوبلین و سپس در لندن کرد. علاقهی او به آمار، ریشه در مسایلی داشت که به کنترل کیفیت مواد تشکیل دهندهی آبجو مربوط میشد. او در تدوین و تنظیم روشهای آماری و طرحهای آزمایشی، سهم بسزایی داشت. اگرچه نامبرده به عنوان ریاضیدانی برجسته مورد توجه قرار نگرفت، اما به علت قابلیت مورد ملاحظه و استنباط شهودی که در حل مسائل آماری داشت، از او به عنوان فارادی آمار نام بردهاند.
انواع آزمون T-Student :
متناسب با فرضیات مسئله، انواع مختلفی از آزمونهای آماری وجود دارد. بنابراین فرضیاتی که باید هنگام تصمیم گیری درباره نوع آزمون به آنها توجه کنید، عبارتاند از:
سه نوع متفاوت از آزمون T وجود دارد:
همانطور که گفته شد، تفاوتهایی که آزمون T را از سایر آزمونها متفاوت میسازد، مفروضات مهم مسئله است:
این آزمون، میانگین (μ) جامعهای با توزیع نرمال را با مقدار مشخص شدهای، مقایسه میکند. بنابراین برای آزمون فرض
آماره آزمون برای آزمون T تک نمونهای به صورت
تعریف میشود که این آماره دارای توزیع T با (n-1) درجهی آزادی است.
پس از به دست آوردن مقدار آمارهی آزمون، p-value را از طریق جدول آماری T جستجو کنید. در نرم افزار R، تابع t.test این کار را برای ما انجام میدهد. اگر p-value از مقدار معناداری از پیش تعیین شده کمتر بود، فرض صفر را رد کنید و فرض مقابل را بپذیرید.
به عنوان مثال، نمونهی تصادفی از پروندههای شرکتی نشان میدهد که سفارشات برای قطعهی معینی از ماشینها به ترتیب در ۱۰، ۱۲، ۱۹، ۱۴، ۱۵، ۱۸، ۱۱ و ۱۳ روز بایگانی شده است. مدیر شرکت ادعا میکند که میانگین زمان بایگانی چنین سفارشاتی ۱۰/۵ روز است. اگر تعداد روزهای بایگانی از توزیع نرمال پیروی کند، آیا در سطح معناداری ۰/۰۱ میتوان چنین ادعایی را پذیرفت؟
در این مثال با آزمون
مواجه هستیم که در واریانس جامعه نامعلوم است. پس برای انجام آزمون، میتوان از آزمون T تک نمونهای کمک گرفت. به همین منظور از تابع t.test در نرم افزار R استفاده میکنیم:
با توجه به خروجی نرم افزار، p-value بیشتر از سطح معناداری ۰/۰۱ است. پس می توانیم فرض صفر را قبول کنیم و در نتیجه ادعای مدیر شرکت را در مورد میانگین روزهای بایگانی سفارشات، بپذیریم.
از این آزمون برای مقایسه میانگین بین دو گروه در یک نمونه استفاده میشود. به عبارت دیگر، اگر شما میخواهید در مورد میانگین یک گروه از آزمودنیها، قبل و بعد از یک آزمایش یا یک تمرین و... استنباطی انجام دهید، میتوانید از آزمون T جفتی استفاده کنید. در این حالت، در واقع، برای هر مشاهده دوبار اندازهگیری یک متغیر کمی صورت گرفته است.
به عنوان مثال، فرض کنید در آزمایشی، ۲۰ موش در طی ۳ ماه تحت درمان X قرار گرفتند. ما می خواهیم بدانیم که آیا درمان X بر وزن موشها تاثیر دارد یا خیر. برای پاسخ به این سوال، وزن ۲۰ موش قبل و بعد از درمان اندازهگیری شده است. بنابراین مشاهدات به صورت ۲۰ مجموعه مقادیر قبل از درمان و ۲۰ مجموعه مقادیر بعد از درمان X، حاصل از دوبار اندازهگیری وزن هر موش، جمعآوری شده است. در چنین شرایطی، میتوان از آزمون T زوجی برای مقایسه میانگین وزن قبل و بعد از درمان موشها استفاده کرد.
تجزیه و تحلیل آزمون T زوجی به شرح زیر انجام میشود:
به این ترتیب برای آزمون فرض،
مقدار آمارهی آزمون T زوجی را میتوان با استفاده از فرمول زیر محاسبه کرد:
که این آماره دارای توزیع T با (n-1) درجهی آزادی است.
برای اجرای آزمون T نمونههای جفتی (x , y) ، میتوان از تابع t.test در نرم افزار R، به صورت زیر استفاده کرد:
با توجه به مثال گفته شده، از یک مجموعه داده نمونه استفاده خواهیم کرد که شامل وزن ۱۰ موش قبل و بعد از درمان است.
برای مشاهدهی دادهها از نمودار جعبهای در نرم افزار R استفاده میکنیم:
سپس فرضیات آزمون T جفتی، شامل نرمال بودن دادهها را بررسی میکنیم. به این منظور از آزمون شاپیرو در نرم افزار R استفاده میکنیم.
با توجه به خروجی نرم افزار، p-value بیشتر از سطح معناداری ۰/۰۵ است که نشان میدهد توزیع اختلافات (d) تفاوت معناداری با توزیع نرمال ندارد. به عبارت دیگر ، ما میتوانیم فرض نرمال بودن مشاهدات (d) را بپذیریم.
اکنون میتوانیم با استفاده از تابع t.test، آزمون T جفتی را بر روی مشاهدات پیادهسازی کنیم:
با توجه به خروجی نرم افزار، p-value کمتر از سطح معناداری ۰/۰۵ است. پس میتوانیم فرض صفر را رد کنیم و نتیجه بگیریم که میانگین وزن موشها قبل از درمان با میانگین وزن بعد از درمان، تفاوت معناداری دارد.
از این آزمون برای مقایسه میانگین دو گروه مستقل استفاده میشود. به عنوان مثال، فرض کنید در شرکتی، وزن ۱۰۰ فرد را اندازهگیری کردهایم: ۵۰ کارمند خانم (گروه A) و ۵۰ کارمند آقا (گروه B). میخواهیم بدانیم که آیا میانگین وزن خانمها با میانگین وزن آقایان تفاوت معناداری دارد یا خیر. در این حالت، دو گروه نمونه مستقل (یا جفت نشده) داریم. بنابراین، میتوان از آزمون T مستقل برای ارزیابی متفاوت بودن میانگینها استفاده کرد.
برای استفاده از آزمون T مستقل، فرض صفر به صورت
تعریف میشود و فرض مقابل را به صورت یکی از حالت زیر
در نظر میگیریم. در اینجا فرض کنید، فرض مقابل دو طرفه را در نظر گرفتهایم.
در صورتی که واریانس دو گروه برابر باشد، آمارهی آزمون T مستقل برای مقایسهی میانگین دو نمونه (A و B) به صورت زیر تعریف میشود:
که در آن S2 واریانس آمیخته برای دو جامعه A و B است که به صورت زیر محاسبه میشود:
در این حالت آماره آزمون دارای توزیع T با
درجهی آزادی است.
در صورتی که واریانس دو گروه برابر نباشد، برای مقایسهی میانگین دو نمونه (A و B) از آمارهی
T-Welch استفاده میشود که به صورت زیر تعریف میشود:
این آماره نیز دارای توزیع T با درجه آزادی زیر است:
با توجه به مثال گفته شده، از یک مجموعه داده نمونه استفاده خواهیم کرد که شامل وزن ۹ کارمند خانم و ۹ کارمند آقا در یک شرکت است:
برای مشاهدهی دادهها از نمودار جعبهای در نرم افزار R استفاده میکنیم:
سپس فرضیات آزمون T مستقل، شامل نرمال بودن دادهها و برابری واریانس دو جامعه را بررسی میکنیم. برای بررسی نرمال بودن مشاهدات از آزمون شاپیرو در نرم افزار R استفاده میکنیم.
با توجه به خروجی نرم افزار، p-value بیشتر از سطح معناداری ۰/۰۵ است که نشان میدهد توزیع مشاهدات تفاوت معناداری با توزیع نرمال ندارد.
همچنین برای آزمون برابری واریانسها نیز میتوان از تابع var.test استفاده کرد. این آزمون از آمارهی فیشر (F) برای انجام آزمون نسبت واریانسها استفاده میکند.
با توجه به خروجی نرم افزار، p-value برای آزمون فیشر، بیشتر از سطح معناداری آلفا یعنی ۰/۰۵ است. در نتیجه، تفاوت معنیداری بین واریانس دو مجموعه داده، وجود ندارد. بنابراین، میتوانیم از آزمون T کلاسیک برای مقایسه میانگینهای دو نمونهی مستقل استفاده کنیم.
اکنون میتوانیم با استفاده از تابع t.test، آزمون T جفتی را بر روی مشاهدات پیادهسازی کنیم:
با توجه به خروجی نرم افزار، p-value کمتر از سطح معنا داری آلفا یعنی ۰/۰۵ است. پس میتوان نتیجه گرفت که میانگین وزن کارمندان آقا با میانگین وزن کارمندان خانم، تفاوت معناداری دارد.
به این ترتیب در این مقاله با دو روش کلی از آزمونهای پارامتری به نامهای آزمون Z و آزمون T، برای استنباط در مورد میانگین جامعه، آشنا شدیم.