با ساینس یا زنجیره ای از رد و تایید فرضیات و نظریات به کمک تجربه و تکرار، هر روز سروکار داریم حتی اگر درکش نکنیم یا فراتر از ظرفیتش ازش انتظار داشته باشیم. وقتی اسم تکرار میاد یعنی یکی از پایه های اصلی ساینس دانش آمار است. حالا میخوام توجه تون را به یکسری جملات رایج در مورد برخی مسایل روزمره زندگی جلب کنم. شنیدیم که میگن "این دانشمندها هم خودش حرف خودشون را نقض می کنن و هر روز یه چیز میگن"، "استفاده از مایکرویو یا موبایل به صورت مستمر بیماری زاست یا نیست بالاخره"، "من آخرش نفهمیدم که چایی و قهوه خوبه بخوریم یا نه"، "غذاهای تراریخته سرطان زا هستن یا نیستن" و ....... .
هدف من از نوشتن این مطلب پرداختن به پاسخ این سوالات نیست بلکه با تلخیص و ترجمه دو تا مقاله که لینکش را اینجا و اینجا گذاشتم میخوام توضیح بدم که این اظهارنظر ها فارغ از مسایل ژورنالیستی یا تبلیغاتی اش از کجا نشات میگیره. بله درست حدس زدید آمار یا به عبارت دقیقتر بدفهمیدن مفاهیم آماری. اینکه منشا بدفهمیدن تقصیر کیه خیلی مهم نیست و به نظر من مهمه که یکی از این مفاهیم آماری که منشا تناقضات علمی است را یه بار باهم مرور کنیم (برای اطلاع از پیشنهاد دیگه در مورد تغییر نام "بازه اطمینان" به اصل مقالات رجوع کنید). منظورم مفهوم p-value یا مقدار پی است. مقدار پی یه عدده که خیلی ها ازش انتظار دارن که معیار حق و باطل باشه. به عبارتی دقیقتر با این عدد دانشمندها میگن که نتایج مثبت یا منفی بود، اختلاف وجود داره، یا نداره دارو اثر داشت یا نداشت، آزمایش جواب داد یا نداد، فرضیه رد شد یا نشد، مقاله چاپ بشه یا نشه، محصول به بازار بیاد یا نیاد و ..... اگر این عدد کوچکتر یا بزرگتر از یه حدآستانه قراردادی ۰.۰۵ باشه اصطلاحا میگن؛ از لحاظ آماری معنی دار؛ هست یا نیست. یعنی اگر این عدد از ۰.۰۵ کوچکتر باشه در اکثر مواقع زندگی برای یه محقق شیرین میشه و اگر نباشه ..... .
اما نکته اینجاست که در واقع این حدآستانه یه مقدار کاملا قراردادی با یه تاریخچه مختصر مربوط به کارهای آقای فیشر (یه دانشمند مهم در علم آمار) در معرفی مفهوم این مقدار داره که یه جا تو یه مقاله ای داشته مثال میزده و این عدد را مثال زده و همین طوری نقل قول از ایشون ادامه داشته و هر کی هرجا میخواسته آمار یاد بگیره این عدد را به صورت سنتی یاد گرفته و استفاده کرده. به مدت طولانی این عدد و حدآستانه تبدیل به یک تابو در ساینس شده و منشا خیلی از اظهارنظرهای بعضا متناقض افراد شده. یعنی خیلی از تناقض ها ناشی از نحوه بیان و استفاده از این عدد در متون علمی است. خیلی ها اومدن پیشنهادی برای رفع مشکلات این تابو بدن که بیشتر مربوط به تغییر حدآستانه به اعدادی کوچکتر یا محاسبه اون با روش های پیچیده تر می شه.
اخیرا یه اتفاق نظری بین یه تعداد قابل توجهی از متخصصین آمار شده و برای رفع این مشکل یه پیشنهاد ساده دادن و اون عدم استفاده از عبارت از لحاظ آماری معنی دار است. یعنی کلا مدعی شدن اینکه یه حد آستانه تعریف بکنیم تا یه مفهوم کمی را خیلی ساده کیفی بکنیم اولا هیچ ربطی به آمار نداره ثانیا اصلا این عدد قرار نبوده یه فضای دوقطبی ایجاد بکنه و مفهوم عدم قطعیت در ساینس را نابود بکنه. البته این متخصصین معتقدند که این اصطلاح آنچنان نفوذی در متون علمی کرده که شبیه یه وسیله جراحی جامونده در بدن بیماری که مدتها از زمان عمل جراحی اش گذشته و این شی خارجی کاملا در بافت بدن جا خوش کرده و بیرون کردنش درد داره (یه عمل جراحی دیگه ای لازم داره). تاکید نابجا به این عدد تا اونجا پیش رفته که حتی در خیلی از مواقع به منطق، پس زمینه و طراحی آزمایش یک مطالعه توجهی نمیشه.
خلاصه اینکه هر گزاره علمی را به راحتی قبول یا رد نکنید، به بیان مسئله و روش پاسخ به سوال بیشتر از نتایج به دست آمده توجه کنید و از اعداد فقط برای نزدیک شدن به حقیقت استفاده کنید و از عبارت "از لحاظ آماری معنی دار" یا موارد مشابه آن در متون علمی به هیچ وجه استفاده نکنید.