آینده نمونه گیری تحقیقاتی
بررسی مسیرهای بالقوه که نمونهگیری تحقیقاتی ممکن است در آینده انجام شود, مستلزم توجه به وضعیت فعلی امور و چگونگی رسیدن ما به این نقطه است. با وجود مسایل و مجادلات تصادفی, به نظر منصفانه میرسد که بگوییم نمونهبرداری پیمایشی و نمونهگیری احتمالی به طور خاص, به تغییر دیدگاه ما از جامعه و موضوعات آن کمک کردهاست. شاید حتی مهمتر اینکه, نمونهبرداری چگونگی به دست آوردن اطلاعات از یک جمعیت بزرگ را تغییر دادهاست.
ما گذار را از شمارش کامل به عنوان تنها روش قابل قبولی برای یادگیری در مورد جمعیتی مشاهده کردهایم که استاندارد در اواخر قرن نوزدهم تا " تحقیقات جزئی " و در نهایت به یک نظریه کامل نمونهبرداری تبدیل شدهاست. همچنین از آزمون کروسکال والیس و کروسکال والیس استفاده شدهاست.
این تغییر به بررسی گستره وسیعی از موضوعات در مورد جامعه ما به شیوهای موثر و به موقع امکان پذیر است. یافتههای این بررسیها به طور کلی در حوزههای عمومی، قانونی و فنی پذیرفته شدهاست، اگرچه هنوز بحثهایی در مورد روشهای اجرا وجود دارد. نظرسنجیهای انجامشده از سوی کمیسیون انتخابات، هم افراد شرکتکننده در انتخابات و انتخابات خارج از انتخابات، هم پذیرش عمومی و هم در مورد روشها را نشان میدهند. بررسیهای انتخاباتی بسیار عمومی هستند و صحت آنها به راحتی قضاوت میشود؛ نتایج این نظرسنجیها به شدت گزارش شدهاست و مردم آنها را به عنوان آموزنده تلقی میکنند. با وجود این, روشهای اجرای نظرسنجیهای انتخاباتی اغلب مورد بحث قرار میگیرند. برای مثال, با رواج بیشتر تلفنهای همراه, تعصب بالقوه در برآوردها از بررسیهای تلفنی پیش از انتخابات که تلفنهای همراه را نادیده گرفتند, بسیار مورد بحث قرار گرفت. اگرچه مطالعات و روشهای خاص ممکن است مورد انتقاد قرار گیرند, اما اصول اولیه نمونهگیری به ندرت مورد پرسش قرار میگیرند. با نگاهی به گذشته, پذیرش گسترده نظریه نمونهبرداری پیمایشی به عنوان وسیلهای برای استنباط درباره جمعیتهای بزرگ یک توسعه بسیار عمیق و هیجانانگیز است.
ما با تعریف آنچه که در هنگام صحبت در مورد نمونهگیری در مورد آمارگیری و آینده داریم شروع میکنیم. سه مولفه کلیدی نمونهگیری، انتخاب نمونه، جمعآوری دادهها، و برآورد هستند. ادغام این اجزا یکی از ویژگیهایی است که نمونهبرداری را از سایر قسمتهای تحقیق آماری متمایز میکند.
نویسندگان دیگر در این سالگرد به بحث در مورد موضوعات جمعآوری دادهها، به ویژه مد، طراحی پرسشنامه، و آمارگیری برای برخی از برنامههای مهم بحث میکنند. در نتیجه، ما سعی داریم تمرکز اصلی در این مقاله را بر روی bookends این نوع نمونهگیری دقیق نگه داریم. اما این سه مولفه چنان درهمتنیده اند که هر بحثی در مورد آینده باید شامل جمعآوری دادهها و هزینههای جمعآوری دادهها باشد. برای اهداف این مقاله، به نظر ما نمونهگیری از روش نمونهگیری برای شناسایی مجموعهای از مشاهدات از جمعیت و ایجاد استنباط در مورد جمعیت از این مشاهدات استفاده شدهاست. این تعریف شامل موضوعات مهمی از قبیل پوشش جمعیت، توسعه و ساخت نمونه، روشهای انتخاب نمونه، کنترل یا تجزیه و تحلیل مشاهدات برای برآورد ویژگیهای جمعیت، و تولید تخمینهای دقیق از نمونه مشاهدهشده میباشد. ما بر روی روشها برای بررسی خانوارها و افراد تمرکز میکنیم تا نظرسنجی. مفهوم کلیدی دیگر, آینده است. در آینده نزدیک, میتوان گفت که در طول چند سال آینده, توجه به این امر سادهتر است زیرا در این چارچوب زمانی ممکن است انتظار تغییرات شدیدی از وضعیت فعلی را نداشته باشیم. آینده بلند مدت خیلی بیشتر جالب است. در دامنه بلند, منطقی است که فکر کنیم تغییر پارادایم در نمونهبرداری پیمایشی امکان پذیر است, حتی اگر چنین تغییراتی در طول چند سال گذشته رخ نداده باشد. پیشبینی بلندمدت نیز ممکن است امنتر باشد, زیرا محققان کمتری به یاد خواهند آورد که پیشبینیهای ما شبیه به روند رویدادها نیست. ما هر دو چارچوب زمانی را مورد بحث قرار میدهیم, اما بیشتر گمانهزنیها درباره آینده بلند مدت است.
در بخش بعدی با مرور برخی از جهتهای گذشته و فعلی در نمونهبرداری شروع میکنیم. تغییرات عمده پس از آن که منجر به سقوط شمارش کامل و روشهای دیگر تحقیق جزئی شد و ایجاد یک پارادایم برای نمونهبرداری پیمایشی به ویژه در ارتباط است.
تغییرات دیگر در بررسی مانند حرکت به نمونهبرداری تلفنی در اواسط قرن بیستم نیز آموزنده است. زمینه تغییر نیز مورد بررسی قرار میگیرد. به طور خاص, الزامات برآوردهای به موقع و مقرونبهصرفه محرکهای تغییرات هستند که با روشهای نمونهبرداری تعامل دارند, و فشارهای هزینه امروزه بیشتر مرتبط هستند.
صفحات آنلاین و روشهای دیگر نمونهبرداری که نمونههای احتمال نیستند، و شرایط مورد نیاز برای این روشها برای ارایه جایگزینهای قابلقبول برای نمونهبرداری احتمال مورد ارزیابی قرار میگیرد. در نهایت، ما با برخی از اندیشهها در مورد این که چطور ممکن است آینده توسط عواملی که هیچ یک از ما نمیتوانیم پیشبینی کنیم، شکل میگیرد، نتیجهگیری میکنیم.
پسزمینه
بیست و پنج سال پیش, فرانکل و فرانکل (1987) تاریخچه نمونهگیری پیمایش را در موضوع پنجاهمین سالگرد نشریه افکار عمومی مورد بررسی قرار دادند. مقاله آنها هنوز بسیار مرتبط است, و خوانندگان امروزی که به خطوط گسترده تاریخ نمونهگیری علاقهمند هستند, از مرور آنها لذت خواهند برد. فرانکل و فرانکل(1987) دو مرحله از توسعه را توصیف میکنند: مرحله اول, ایجاد روشهای اساسی نمونهگیری احتمالی پس از مقاله در حال تغییر(neyman 1934) در مقاله با استفاده از روش نمونهگیری تصادفی بود. فاز دوم با نوآوریهای روشهای پایه و توسعه برای تطبیق فنآوریهای جدید مانند نمونهبرداری و کامپیوتری سازی مشخص شد. این دوگانگی هنوز هم اکنون به خوبی به ما خدمت میکند, زیرا بسیاری از تحولات در نمونهبرداری از زمان 1987 به مرحله دوم نوآوریها و فنآوری ادامه یافتهاند. برای مثال, نمونهبرداری مبتنی بر ثبت برای اخذ رای (Green andGerber 2006) و افراد نمونهبرداری بر روی تلفنهای همراه با روشهای نمونهبرداری استاندارد(AAPOR2010) انجام شدهاست. وب نوعی نوآوری تکنولوژیکی دیگر است که به یک شیوه مهم برای انجام بررسیها تبدیل شدهاست و موضوع تحقیقات متمرکز بودهاست.
همانطور که (couper(2000مشاهده شد, هیچ روش پذیرفتهشده نمونهگیری از وب در این زمان ایجاد نشده است - و یک دهه بعد درست است. این مشکل نمونهبرداری میزبان یک میزبان از راهحلهای ممکن مختلف است (baker et al 2010).
نمونهگیری احتمال به صورت توسعهیافته توسط Neyman (۱۹۳۴) و تقریباً تمام متون نمونهبرداری بررسی شده که در پی آن یک چارچوب بسیار خاص برای استنباط به دست آمدهاست. فرض بر این است که یک چارچوب از همه واحدها در جمعیت میتواند ساخته شود، که هر واحد در این فریم یک احتمال مثبت برای انتخاب شدن در نمونه دارد، و این احتمال را میتوان برای هر واحد نمونهبرداری محاسبه کرد.
زمانی که نمونهبرداری شد، خصوصیات تمام واحدها را میتوان به دقت اندازهگیری کرد.
برآوردها با استفاده ازیک توزیع مرجع تمام نمونههای ممکن تولید میشوند که میتواند با استفاده از همان روش انتخاب شود. بسیاری از روشها مانند نمونهبرداری چند مرحلهای و روشهای نمونهبرداری احتمال تفاضلی این چارچوب کلی را ارضا میکنند. عدم پاسخگویی، پوشش ناقص جمعیت، و خطاهای اندازهگیری نمونههایی از مسایل عملی هستند که مفروضات محض نمونهگیری احتمالی را زیر پا میگذارند. روشهای نمونهبرداری دیگر اخیراً پیشنهاد شدهاند و برخی از آنها مستقیماً در چارچوب نمونهگیری احتمالی قرار نمیگیرند. یک نمونه، نمونهگیری از پاسخدهنده است (Heckathorn ۱۹۹۷)، که در درجه اول برای بررسی جمعیت کمیاب یا سخت برای رسیدن به جمعیت مورد استفاده قرار میگیرد. این فرآیند یک فرآیند نمونهبرداری شبکهای یا گلوله برفی است که از اعضای گروه کمیابی درخواست میکند تا به دیگران رجوع کنند.
یک مدل ریاضی برای تجزیه و تحلیل دادهها استفاده میشود.) volz و Heckathorn 2008) نشان میدهند که نمونه مشاهدهشده معادل یک نمونه با احتمال تحت شرایط معین است, اما این شرایط به ندرت در عمل ارضا میشوند. دو روش نمونهگیری نسبتاً جدید دیگر که از شبکهها استفاده میکنند اما با دقت بیشتری در روشهای نمونهبرداری احتمال سنتی مناسب هستند, نمونهگیری تطبیقی (Thompson و Seber 1996) و نمونهگیری غیر مستقیم ( Lavallee 2007) هستند. طرحهای انطباقی معمولاً برای تخمین تعداد انبوه جمعیت انبوه موجود در علوم طبیعی مورد استفاده قرار میگیرند و مکرراً در جمعیتهای انسانی به کار گرفته نشده اند. به عنوان مثال, Thompson, Ramsey, Seber (1992) توضیح میدهند که چگونه نمونهگیری تطبیقی میتواند در بررسیهای trawl میگو مورد استفاده قرار گیرد, زیرا میگو دارای خوشهبندی یا گرایشهای آموزشی است اما پیشبینی آن امکان پذیر نیست که در آن میگو متمرکز شود. با استفاده از برآوردهای چگالی از نمونه اول نمونه, مناطق نمونهبرداری در مرحله دوم در نرخهای متفاوت نمونهبرداری میشوند تا میگو بیشتر تولید شوند. نمونهگیری غیر مستقیم در آمارگیری از خانوارها و افراد مورد استفاده قرار گرفتهاست. نمونهگیری غیر مستقیم با یک نمونه احتمال از افراد یا واحدهایی شروع میشود که جمعیت هدف نیستند. سپس جمعیت هدف را به واحدهای نمونهبرداری پیوند میدهد تا احتمال انتخاب جمعیت هدف محاسبه شود. Kalton) brick ,1995) این رویکرد را در بررسیهای طولی خانوار اعمال کردند تا برای افرادی که پس از موج اول وارد یک خانواده نمونهبرداری شده, وزن بدهند. ما به برخی از این موضوعات در گمانهزنی در مورد آینده نمونهبرداری باز خواهیم گشت.
فرانکل و فرانکل (1987), بحث اساسی در مورد استنباط نمونهگیری نمونهگیری را که جامعه آماری را در اوایل دهه ۱۹۶۰ با هرج و مرج تغییر داد, مورد بحث قرار نداد. همانند هر حوزه علمی جدید در حال توسعه, سوالاتی در مورد تناسب روشهای مورد استفاده برای ایجاد استنتاج از یک نمونه به جمعیت هدف افزایش یافت و به طور گسترده در جامعه آماری مورد بحث قرار گرفت. Godambe (1966) و Royall (1970) نمونههایی از انتقاد از ایده ایجاد استنتاج در مورد جمعیت مبتنی بر احتمال انتخاب واحدهای نمونهگیری (رویکرد مبتنی بر طراحی) هستند. آنها و دیگر محققان از استفاده از مفروضات مدلسازی معمولی مورد استفاده در سایر حوزههای آمار (روشهای مبتنی بر مدل و Bayesian) برای استنباط استفاده کردند. هولت و اسمیت (1979) یک قطعه تفکر انتقادی فراهم میکنند که بیشتر در برخی از این موضوعات گسترش مییابد. آنها بر این مساله تاکید میکنند که نمونهبرداری مبتنی بر طراحی ممکن است با اصل مشروطیت همخوانی نداشته باشد, یک ایده آماری که اساساً بیان میکند که یک نمونه یک نمونه باید بر روی نمونه مشروط باشد نه به نمونههای دیگری که ممکن است انتخاب شدهباشند.
هانسن، Madow و Tepping (۱۹۸۳) از سودمندی رویکرد مبتنی بر طراحی دفاع میکنند و نشان میدهند که خطاهای جزئی در فرضیات یک رویکرد مبتنی بر مدل ممکن است تاثیرات مهمی بر جهت انحراف برآوردهای زمانی که یک نمونه بزرگ انتخاب میشود داشته باشد. در حالی که مسایل اساسی به طور کامل حل نگردیده اند، رویکرد مبتنی بر طراحی همچنان در نمونهگیری به عنوان یک روش غالب باقی ماندهاست.
حتی اگر اکثر تحقیقات بر روش مبتنی بر طراحی متکی باشند، روشهای مبتنی بر مدل به طور معمول در حوزههایی مانند تخمین مساحت کوچک مورد استفاده قرار میگیرند. هنگامی که اندازه نمونه برای یک نمونه احتمال، کافی نیست تا برآوردهای مستقیم قابل اعتمادی را در سطح پایین جغرافیا ایجاد کند، مدلهای ناحیه کوچک برای ارایه این برآوردها توسعهیافته اند (رائو ۲۰۰۳). یک نمونه احتمال در این فرآیند مورد نیاز نیست چون مدلها مبنایی برای استنباط هستند تا احتمالات نمونهگیری واحد. با این وجود، یک نمونه احتمال به طور کلی نقطه شروع برای تخمین مساحت کوچک است.
روشهای مبتنی بر مدل نیز برای خطاهای غیر خطی در نمونههای احتمال مورد نیاز هستند, زیرا نظریه مبتنی بر طراحی, اجرای کامل طرح نمونه و جمعآوری دادهها را فرض میکند. یک مثال, کنترل دادههای مفقود شده از واحدهای نمونهبرداری شده از واحدهای نمونهبرداری شده (لیتل و روبین) است, جایی که ممکن است این دادهها به دلیل عدم قطعیت باشد. روشهای مبتنی بر طراحی و مبتنی بر مدل در این شرایط ترکیب شدهاند; یک نمونه احتمالی انتخاب شدهاست و از روشهای مبتنی بر طراحی برای وزندهی به جمعیت استفاده میشود, اما از روشهای مبتنی بر مدل برای محاسبه خطاهای پوشش, واحد سطح و قلم کالا استفاده میشود.
با وجود اصلاح روشهای مبتنی بر مدل و مبتنی بر طراحی, امروزه مسائل اساسی در یک ظاهر متفاوت مورد بحث قرار میگیرند. بحث کنونی به جای تئوری آماری توسط عمل هدایت میشود و پانلهای آنلاین بیشترین توجه را جلب میکنند. روشی که با بررسیهای اینترنتی بررسی شدهاست, استفاده از روشهای تخمین جایگزین است. امید این است که روشهای تخمین جایگزین ممکن است استنتاج را برای یک جمعیت عمومی مقدور سازد حتی زمانی که سازوکار نمونهگیری به خوبی تعریفنشده باشد. این ایده یک رویکرد مبتنی بر مدل است حتی اگر همیشه اینگونه بیان نشده باشد.
برخی محققان اظهار داشتهاند که دوره نمونهگیری احتمالی به دلیل هزینههای فزاینده جمعآوری دادهها با خسارتهای ناشی از عدم پوشش دهی و عدم پاسخگویی به پایان رسیدهاست. خودداری معمول این است که یک نمونه احتمال با نرخ پاسخ پایین یا نرخ پوشش " بهتر " از یک نمونه غیراحتمالی یا داوطلب نیست. این نگرانی به مبانی نمونهگیری تحقیقی اشاره دارد و باید برای آینده نمونهگیری مورد توجه قرار گیرد - آیا آن آینده ادامه دوره نمونهگیری احتمال یا چند روش دیگر برای جمعآوری دادهها و استنباط است. تلاش ما برای فکر کردن در مورد این که چگونه این مسائل ممکن است در آینده حل شوند با نگاه کردن به عقب آغاز میگردد.
تئوری آماری، هزینه و نمونهبرداری
در بررسی تاریخچه اولیه نمونهگیری پیمایش (۱۸۹۵ - ۹۶)، Bowley (۱۹۲۶)، وNeyman (۱۹۳۴) همواره به عنوان کلید تغییر از وابستگی به شمارش کامل به نمونهگیری توضیح داده میشوند (Kruskal و Mosteller ۱۹۸۰؛ فرانکل و فرانکل، ۱۹۸۷؛ Bellhouse ۲۰۰۰). این تغییر عمیق بود.
به عنوان مثال, دانکن و شلتون (1978) تاثیر تغییرات در فعالیتهای جمعآوری دادههای دولتی را شرح میدهند که در نتیجه تلاشهای این پیشگامان از حدود ۱۹۰۰ تا ۱۹۴۰ به عنوان یک انقلاب رخ داد. این یک تغییر اساسی بزرگ بود.
یکی از جنبههای جالب این تاریخ این است که انقلاب در نمونهبرداری توسط خواستههای دولت و آمار رسمی رانده شد. Kaier (1895 - 96) شخصیت مرکزی بود و موسسه آماری بینالمللی (ISI) به عنوان یک انجمن اصلی برای بحث درباره فضایل نمونههای نماینده خدمت میکرد. دانشگاهیان نیز نقشی ایفا کردند. Bowley (1926) ایدههای اصلی در مورد آرایش تصادفی را ایجاد کرد و Neyman (1934) یک کودتای آماری را فراهم کرد. با این حال, زمانبندی رویدادها بسیار آموزنده است. Kruskalو Mosteller (1980) مشاهده کردند که " تا زمان جلسه ۱۹۲۵ آی اس آی در رم و پس از مرگ Kaiers, نمونهگیری نماینده یک جای شرافتمندانه و شرافتمندانه در میان statisticiansپیدا کرده بود. " این پذیرش نمونه قبل از کمکهای آماری و bowley و Neymanاتفاق افتاد.
همچنین به نظر میرسد که انگیزه برای اتخاذ نمونهگیری به سادگی مقرونبهصرفه نبود، اگرچه هزینه بسیار مهم بود. در تاریخچه تحولات اولیه، به ندرت به هزینه اشاره میشد. این امر با توجه به تحولات نمونهگیری در دهه ۱۹۶۰، هنگامی که صرفهجویی در هزینه مربوط به انجام بررسیهای انجامشده توسط بازاریابان و دیگر گروههای غیر دولتی برای دور کردن از نظرسنجی خانگی رو به رو میباشد.
در این موج از تغییرات، مطالعات دولتی زودتر اتخاذ نشده بودند، حداقل تا حدی به این دلیل که فرضیه نمونهگیری برای نمونهگیری کارآمد از شمارههای تلفن هنوز ایجاد نشده بود. دولت آمریکا تا دهه ۱۹۸۰ به شدت از نمونهگیری تلفنی استفاده نکرد، همچنین پس از تئوری آمار (Waksberg ۱۹۷۸) و روش استاندارد برای بررسیهای تلفنی در بخشهای دیگر ایجاد شد.
در حالی که نمونهبرداری تلفنی یک تغییر پارادایم نبود, مانند مقدمه نمونهگیری تصادفی چند دهه قبل بود, هر دو توسعه نشانههایی از پیشرفت ایدهها و الگوها فراهم میکردند. در هر دو مورد, نظریه آماری در طلایه تغییرات نبود; بلکه نظریه آماری برای حمایت از شیوههای موجود توسعه یافت.
در محیط امروز، هزینه احتمالاً مهمترین عاملی است که جستجو برای روشهای جدید نمونهبرداری را هدایت میکند. و هزینه پایین مجموعه دادهها در وب بسیار مهم است، به خصوص آنهایی که در تحقیقات بازار کار میکنند، به سمت این رویکرد حتی بدون یک نظریه آماری که به طور گستردهای پذیرفته شدهاست تا از آن پشتیبانی کند (بیکر و همکاران ۲۰۱۰). این موضوع از نزدیک به پذیرش نمونهگیری تلفن در دهه ۱۹۶۰ میپردازد. با این حال، نظریه آماری و روش جمعآوری دادهها در نهایت یک بنیان نسبتاً محکم برای نمونهگیری خط تلفن تشکیل دادند. این ترکیب برای یک روش جدید برای موفقیت در طیف گستردهای از کاربردها ضروری است. ازدواج و تئوری ازدواج امروز به عنوان چالشی برای روشهای جدید برای نمونهگیری و یا بررسی به منظور استفاده از هزینه پایین وب باقی میماند.
نقش نوآوریهای جدید در تکنولوژی به عنوان یک محرک از روشهای پیمایشی, مربوط به اینکه فرانکل و فرانکل (1987) در مورد تاثیر تکنولوژی در توسعه نمونهبرداری تحقیق بحث و تبادل نظر کردند. Bellhouse (2000) این اثر متقابل بین نمونهبرداری بررسی و نوآوری تکنولوژیکی را کانون توجه به سوابق نمونهبرداری میکند. سوال کمی وجود دارد که نمونهبرداری از فنآوری و نمونهبرداری در طول سالها با یکدیگر درهمتنیده شدهاند و هر یک از آنها در یک زمان به پیشرفتهای جدید در منطقه دیگر منجر شدهاست. به سختی میتوان تصور کرد که تحولات پشت و جلو در نمونهبرداری و فنآوری در آینده ادامه نخواهد یافت.
تغییر چشمگیر در روشی که افراد به تازگی با آن ارتباط برقرار میکنند، یک پیشرفت فنآوری است که به مقدار زیادی باعث تغییرات بزرگ در تحقیقات نمونهگیری تحقیقی شده است .
یک نمونه، گذار به شبکه های بیسیم یا تلفن همراه در آمریکا است.
جمعیت. حدود ۲۵ درصد از بزرگسالان در سال ۲۰۰۹ در خانههایی بدون تلفن ثابت زندگی میکردند (Blumberg و luke ۲۰۱۰). طی پنج سال گذشته (AAPOR ۲۰۱۰)، همراه با این توسعه، تعداد قابلتوجهی از مقالات در مورد نمونهگیری در تلفن همراه است (AAPOR ۲۰۱۰). در مورد وب بیشتر استفاده می شده است و حتی مقالات و کتابهای بیشتری در مورد استفاده از وب برای بررسی وجود دارد. محققان همچنین شروع به بررسی کاربردهای تحقیق بالقوه برای فرستادن پیامک، تلفنهای هوشمند و شبکههای اجتماعی کردهاند. پیشرفتهای بیشتر در این زمینهها محتمل است. باز هم بیشتر این تکنولوژیها با توجه به هزینه پایین خود به کار میروند، استثنای اصلی که تلفنهای همراه هستند، که گرانتر از تلفن های ثابت برای تحقیق هستند.
مهم است که توجه کنیم که این تغییرات ناشی از تکنولوژی فزاینده هستند و نه تغییر پارادایم. نسبتاً بیخطر است که بگوییم آینده نزدیک به این نوع تحولات ادامه خواهد یافت، اگر چه تغییرات عمدهای در نحوه تفکر ما در مورد ایجاد نتیجه گیری ممکن است ناشی از هیچ یک از این تحولات باشد.
یک جایگزین کمهزینه دیگر استفاده از سوابق اداری است، اگر چه این رویکرد جدید و یا ناشی از تکنولوژی جدید نیست. با وجود وعده آنها، استفاده از سوابق اداری به پتانسیل خود، حداقل نه در برنامههای آمریکا، منجر نشده است. Jabine و Scheuren (۱۹۸۵) شش هدف تعیینشده توسط آمریکا را توصیف میکنند.
دولت برای بهبود استفاده از سوابق اداری در نمونهگیری از یک دوره ۱۰ ساله استفاده میکند. حدود ۲۵ سال بعد، بسیاری از اهداف مشخصشده در آنجا کاملاً تحقق نیافته اند. نمونهبرداری از سوابق اداری در مناطق به غیر از آمار دولت بسیار موفق نبوده است. برای مثال، برآوردهای انتخاباتی استفاده از نمونهگیری از فهرستهای ثبت را مورد بررسی قرار دادهاند، اما این تلاشها با مشکلات جدی مواجه شدهاند. سوابق اداری همیشه مشکلاتی را برای کاربردهای نظرسنجی ناشی از ناقص بودن، عدم به موقع بودن، دادههای ضعیف برای پیدا کردن و تماس با پاسخ دهندگان و نگهداری ناقص اسناد مطرح کردهاست. این شکستها به قدری رایج هستند که هدف بایگانی اجرایی به همان سطح کیفیت مورد نیاز برای اهداف نمونهبرداری نیاز ندارد. برخی از این مشکلات به خوبی در شورای تحقیقات ملی (۲۰۱۰) از پایگاهدادههای ثبت دهندگان دولتی ثبت شدهاند.
این بازبینی مشخص میکند که چرا اسناد اجرایی به اندازه مورد انتظار در یک منطقه خاص مفید نیستند. استفاده آینده از سوابق اداری، در حالی که هنوز امیدوارکننده است، با چالشهای عمدهای مواجه است.
بخش عمدهای از تحقیق حاضر در نظریه نمونهبرداری, به بررسی روشهای برآورد, خطای پوشش و اشکال دیگر دادههای گمشده میپردازد. این رویکرد همچنین میتواند یک جایگزین کمهزینه باشد, زیرا مجموعه دادههای گرانقیمت را با روشهای تحلیلی و یا تنظیمات وزنی جایگزین میکند. برای مثال, تعدیلات با وزنهای پایه (عکس احتمال اوزان انتخاب) برای محاسبه وزن دهی, اساساً انتقال وزن از حالت به پاسخ دهندگان انجام میشود.
سهم اصلی در این حوزه Deville و Sarndal (1992) است, که روشهای تخمین پسا طبقه بندی شده را به یک کلاس از برآوردگر کالیبراسیون که به اصطلاح برآوردگرهای درجهبندی نامیده میشوند, قرار داد.
مقاله آنها دریچه ای را به یک مسیر جدید از تحقیقات باز کرد و برآورد کنندههای کالیبراسیون به سرعت برای رسیدگی به واحدهای پاسخ داده نشده و عدم پوشش دهی شده در فرآیند تحقیقات که مستقیماً توسط نظریه مبتنی بر طراحی کنترل نشده اند، تعمیم داده شدند. روبین (۱۹۷۶) تحقیقات برآورد را با پیشنهاد انتساب چندگانه به عنوان روشی برای تخمین واریانس برای دادههای منتسب فراهم کرد. انتساب تکنیکی است که به طور کلی برای "پر کردن" یا نسبت دادن پاسخ به مواردی که توسط پاسخدهنده تکمیل نمیشوند، استفاده میشود. انتساب برای موارد گمشده چند دهه بودهاست، اما انتساب چندین بار تحقیقات و توجه جدید را برانگیخته است. کار او باعث شد که هزاران مقاله در انواع کاربردها از جمله نمونهبرداری بررسی شود.
کاربرد ایده ترمیم نقایص در جمعآوری دادهها در نمونههای احتمالات با استفاده از تکنیکهای برآورد نیز برای روشهای نمونهبرداری دیگر مورد بررسی قرار گرفتهاست. نظرسنجیهای آنلاین از روشهای برآورد جایگزین، به خصوص تمایل به استفاده از روشهای وزن دهی استفاده کردهاند تا برای انتخاب غیر تصادفی شرکت کنندگان (لی و Valliant ۲۰۰۹؛ Schonlau و همکاران 2007) تلاش کنند.
این حوزهای است که در آن ادامه تحقیقات بدون شک در حال پیشرفت است، و ما در ادامه آن را با جزئیات بیشتر مورد بحث قرار میدهیم.
این نمای کوتاه از گذشته و حال نشان میدهد که هزینه بسیار مهم است، اما در آغاز دوره نمونهگیری احتمال، محرک نوآوری در نمونهبرداری نبود. از آن زمان به بعد، هزینه به عنوان عامل اصلی برای تغییرات در روشهای نمونهگیری ایجاد شدهاست، حتی اگر این تغییرات تا حد زیادی تغییرات افزایشی بودهاند. تیوری آمار به ندرت، اگر تا کنون عامل اصلی تغییر بودهاست.
اما نظریه آماری برای حمایت از تحولات جدید ضروری بودهاست. هنگامی که نظریه آماری برای یک روش نمونهگیری مورد پذیرش گسترده برای این روش نیست، آنگاه روش نمونهگیری احتمالاً در میان رشتهها و کاربردها پذیرفته نمیشود.
قبل از اینکه به آینده بپرید، بهتر است در مورد هزینه فکر کنید چون بسیار تاثیرگذار است. در بسیاری از روشها، افزایش هزینه بررسی که در دهههای اخیر تجربه شدهاست، نشانهای از مشکل اساسی کاهش در مشارکت سنجی است. هم تلفن و هم مصاحبه رو در رو امروزه بسیار ارزانتر از ۲۰ یا ۳۰ سال پیش است اگر افراد نمونهگیری شده تمایل به مشارکت داشته باشند. به عنوان محققان نظرسنجی، ما اغلب نتیجه میگیریم که این نرخ همکاری کاهشیافته فقط تابعی از تغییرات جامعهای است که ما قادر به نفوذ آن نیستیم. اگرچه جامعه بدون شک تغییر کردهاست، محققان تحقیقی دارای ابزارهایی هستند که ممکن است در بهبود کیفیت تحقیق و کاهش هزینهها موثر باشند. ما معتقدیم که تحقیقات آتی که بر روی پاسخدهنده تمرکز دارد به جای تحلیل گر این تحقیق میتواند به تحقق این دو هدف کمک کند. یک روش پاسخگو محور توسط Dillman (۱۹۷۸) پیشنهاد شد. روشهای پاسخ دهنده - محور برای افزایش همکاری با درخواست نظرسنجی تلاش میکنند، در نتیجه نیاز به جمعآوری دادههای پر هزینه و تنظیمات وزن را کاهش میدهد.
ایده اصلی این است که ما باید بررسیهایی را انجام دهیم تا پاسخدهنده منافع مشارکت را به عنوان چیره شدن بر دوش مشارکت درک کند. اگر این امر امکان پذیر باشد، آنگاه هر دو هزینه پایینتر و کیفیت بالاتر را میتوان به دست آورد. تحقیقات بیشتری در این زمینه مورد نیاز است.
به غبار نگاه کردن
این دیدگاه در گذشته و حال دلالت بر مسیرهایی دارد که نمونهگیری ممکن است در آینده به دست آید. در آینده نزدیک, آنچه فرانکل و فرانکل (1987) نامیده میشدند, نوآوریهای روشهای اساسی و اضافی برای تطبیق با فنآوریهای جدید به احتمال زیاد به سرعت شتاب یافته ادامه خواهند داد. به عنوان مثال, یک ناحیه که برای چنین تحولاتی مناسب است, نمونهبرداری از چارچوب چندگانه است. در نمونهگیری چارچوب چندگانه, واحدها از دو یا چند فریم برای افزایش پوشش یا کارایی انتخاب میشوند. به عنوان مثال, در یک نظرسنجی از شرکتها, یک چارچوب ممکن است یک فهرست دسترسی آسان از کسب و کارها باشد که کامل نیستند, و چارچوب دیگر ممکن است نمونهای از مناطق جغرافیایی باشد که در آن شرکتها فهرستشده و سپس نمونهبرداری میشوند. استفاده از این دو چارچوب, پوشش کاملتری را فراهم میکند در حالی که با بهرهگیری از لیست موجود, کارایی خود را به دست میآورد.
نمونهگیری چند چارچوب حتی نوید بیشتری دارد، زیرا روشی برای کاهش هزینهها با استفاده از سوابق اجرایی ارایه میدهد. پیشرفت ها در نظریه آماری همانطور که توسط Lohr (۲۰۰۹) شرح داده شد، نشان میدهد که آمارشناسان به این موضوع علاقهمند هستند.
پژوهشگران آماری به احتمال زیاد به کار بر روی این مساله ادامه میدهند چرا که تعدادی از مسائل فنی حلنشده، به خصوص آنهایی که با دادههای از دست رفته مرتبط هستند به دلیل ناقص بودن سوابق و خطای اندازهگیری وجود دارد.
علاوه بر این, اخیراً یک نظریه چارچوب چندگانه برای بررسیهای تلفن همراه بکار گرفته شدهاست, و این تحقیق برخی کاستیهای اساسی در نظریه نمونهبرداری را آشکار کردهاست که ممکن است در آینده نزدیک مورد توجه قرار گیرد. به عنوان مثال, Brick (2010) نشان میدهد که ترکیب غیرپاسخگو در مرحله طراحی ممکن است منجر به تخصیص بهینه متفاوت نمونه و یک رویکرد وزنی متفاوت شود.
Lohr (forthcoming) توضیح میدهد که چگونه خطای اندازهگیری بر انتخاب برآوردگرهای در آمارگیری چارچوب دوگانه تاثیر میگذارد.
فرضیه نمونهگیری هنوز فرض میکند که پوشش جمعیت در کادر کامل است و پاسخهای دقیق از همه واحدهای نمونهگیری شده بدست میآید, علیرغم این حقیقت که این شرایط بکر هرگز با آنها مواجه نبوده است. تلاشها برای مقابله با این نقصها تقریباً به طور کامل بر نوآوریها در مرحله تخمین استوار است. یک مسیر جدید مهم برای آینده نمونهگیری, بررسی اثرات (و تلاش برای اصلاح) خطای نمونه برداری نشده در طراحی نمونه و اجزای جمعآوری داده به جای برآورد بار تنهایی است. این امر به ایده طراحی واکنشی (گرووز) و (Heeringa 2006) بسط مییابد, که سعی دارد انحراف غیرپاسخگو را در مرحله جمعآوری دادهها با هدف قرار دادن خصوصیات پاسخ دهندگان با نمونه ها, کاهش دهد.
به طور مشابه، اهمیت دادههای کمکی قوی به عنوان یک الزام کلیدی برای کاهش انحراف غیرپاسخگو در سالهای اخیر شناسایی شدهاست.
از آنجا که طراحی نمونه مزایایی نیز دارد, روشهای مختلفی برای ترکیب این دادهها در مرحله نمونهبرداری ممکن است یک مسیر جدید تحقیقاتی باشد.
تغییر این ماهیت در مرحله طراحی نمونه یک تغییر اساسی است که میتواند در آینده نزدیک اتفاق بیفتد.
هزینه جمعآوری داده برای بررسی این که چگونه آنها میتوانند از روشهای ارزانتر جمعآوری دادهها استفاده کنند، ادامه خواهد یافت. یک نظریه آماری که از جمعآوری مشاهدات از وب از یک نمونه nonprobabilityپشتیبانی میکند، یک جز تشکیلدهنده indispensibleاست اگر برای رسیدن به این هدف بسیار مطلوب تلاش کنیم. یک سوال حلنشده این است که آیا این هدف را میتوان در نظریه نمونهبرداری احتمال مبتنی بر طراحی انجام داد. اگر امکان پذیر باشد، احتمالاً نمونهبرداری با بسیاری از کاربردها و extensionsجدید تقویت خواهد شد. اگر نه، دو پیامد واقعبینانه به نظر میرسد: (۱) یک پارادایم جدید را میتوان معرفی کرد که با جایگزین کردن یا تکمیل نمونهگیری احتمالی مبتنی بر طراحی، پذیرفته میشود؛ (۲) جمعآوری دادهها از سوی داوطلبان در وب محدود به رشتههای خاص یا برنامههای کاربردی به دلیل پایه نظری ضعیف میشود.
نمونه های غیراحتمالی(غیر تصادفی)
در حالی که در مورد ماهیت یک نظریه جدید برای جایگزینی نمونهگیری احتمال، کار دشواری است، مرور انتقادی رویکردهایی که برای ایجاد inferences از نمونههای داوطلبانه یا داوطلبانه مورد بررسی قرار گرفتهاند، امکان پذیر است. تجزیه و تحلیل دادههای مشاهداتی، حوزه آماری است که بسیار مرتبط با آنالیز نمونههای وب داوطلبانه است. در حقیقت، بیشتر تحقیقات در مورد نمونههای وب از تکنیکهایی استفاده کردهاند که در اصل برای مطالعات نظری توسعه داده شدهاند، که مهمترین آنها امتیازدهی به امتیازدهی هستند. به همین دلیل، ما با بحث در مورد روشهای امتیازدهی تمایلی شروع میکنیم.
امتیاز دهی تمایلی روشی است که برای تحلیل دادههای مشاهداتی و یا مجموعهای از دادهها براساس نمونهگیری تصادفی انتخاب نشده است (Rosenbaumو Rubin ۱۹۸۳). ایده اصلی مقایسه نتایج گروه "درمان شده" با افراد گروه "درمان نشده" برای ارزیابی اثر علی رفتار زمانی است که واحدها به طور تصادفی به رفتار اختصاص داده نمیشوند. امتیازات تمایلی احتمال شرطی هستند که یک واحد با توجه به مجموعهای از متغیرهای کمکی تحت یک مدل تلقی می شوند. اگر یک پژوهشگر بتواند گروههای درمانشده و درمان نشده را بر روی امتیاز گرایش متعادل کند و مدل درست باشد، آنگاه تاثیر علی درمان را میتوان بی طرفانه برآورد کرد.
درخواست این تکنیک برای نمونههای داوطلبانه واضح است؛ با این حال، تفاوتهای مهمی بین مطالعات مشاهده و تحقیقات وجود دارد. یک تفاوت مهم این است که بیشتر تحقیقات در نظر گرفته میشوند تا میزبان اهداف تحقیقاتی متنوعی باشند، حتی زمانی که یک هدف خاص از قبیل اندازهگیری نرخ بیکاری، طرح تحقیق را هدایت میکند. از سوی دیگر مطالعات مشاهده ایی اغلب برای پاسخ دادن به تعداد کمی از سوالات خاص، با هدف اولیه تعیین تاثیر رفتار انجام میشود.
محقق با استفاده از نمرات تمایلی برای یک مطالعه مشاهداتی کمک به ایجاد مدلی است تا مسیرهایی را شناسایی کند که منجر به انتخاب خودکار در رفتار (یا حذف از رفتار) شوند.
با توجه به این چالش، محقق دادههای مشاهداتی نیاز دارد تا تنها متغیرهای مدل را شناسایی کند که به طور بالقوه مربوط به اثر درمان هستند. در یک محیط بررسی، توسعه یک مدل نمره تمایل به حساب انتخاب برای خود بسیار دشوار است، زیرا حوزه یک ارزیابی واحد یا ارزیابی پیامد نیست.
متغیرهای انتخاب و متغیرهای مرتبط با متغیرهای پیامد چندگانه باید در مدل مناسب برای کاهش گرایش گنجانده شوند.
امتیاز دهی تمایلی برای جبران عدم پاسخگویی و عدم پوشش دهی مورد استفاده قرار گرفت. وقتی که متغیرهای کمکی منطقی در این نوع کاربرد موجود باشند، تمایل به امتیازدهی آنها (یا روش تنظیم عدم پاسخگویی دیگری) به منظور کاهش تعصبات بسیار زیاد نشانداده شدهاست.
این روشها نسبت به انحرافات کوچک تر کمتر موثر هستند. دو دلیل برای ناتوانی در کاهش مداوم انحراف ناشی از عدم پاسخگویی ممکن است خطای استاندارد ویژگی باشد (در درجه اول حذف متغیرهای مهم یا عدم حساب برای رابطه بین متغیرها) و خطای اندازهگیری تصادفی. مشکل استاندارد ویژگی به خوبی از تحلیل رگرسیون مشخص است، که در آن به جز پیشبینیها و یا عدم موفقیت در شمول متقابل بین متغیرها، نشانداده شدهاست. اشتاینر، کوک، و Shadish (۲۰۱۱) در مورد انحرافی که ممکن است ناشی از خطای اندازهگیری تصادفی باشد، بحث میکنند و یافتههای آنها مستقیماً برای نمونههای داوطلب قابلاجرا است. آنها نشان میدهند که خطای اندازهگیری در متغیرهای کمکی پتانسیل ایجاد انحراف اساسی در برآورد اثرات درمانی را دارد حتی اگر ویژگی مدل صحیح باشد. بنابراین امتیازدهی به امتیازدهی و دیگر روشهای برآورد نه تنها باید به درستی مدلها را مشخص کنند، بلکه باید دارای خطای اندازهگیری پایین باشند.
تکنیکهای تنظیم بکار رفته در نمونههای احتمال نیز دارای مزیت اصلی در استفاده از روشهای مشابه در نمونه های غیراحتمالی یا داوطلبانه هستند.
در بررسیهای نمونه، همه واحدهای نمونهگیری شده تابع یک محرک مشابه هستند تا آنها را تشویق به مشارکت در آمارگیری کنند. بنابراین، استاندارد ویژگی یا مدلسازی برای مدل تمایل باید متغیرهای کمکی مربوط به تمایل واحدهای نمونهگیری شده برای شرکت در شرکت را در نظر داشته باشد (از آنجایی که بسیاری از متغیرهای پیامد وجود دارند، تنها مهمترین آنها ممکن است گنجانده شوند).
حتی این کار پیچیده است. به عنوان مثال، ما اغلب روابط و متغیرهای مختلفی را میبینیم که بستگی به دلیل عدم پاسخگویی دارد.
برای مثال, موارد غیرتماسی و غیرتماسی, ممکن است روابط متفاوتی با کمکی داشته باشند, زیرا محرک ممکن است سازگار نباشد. linو Schaeffer (1995) دریافتند که موارد تماس و امتناع از موارد ناشی از انحرافهای ایجاد شده در جهت مخالف هستند و مشکل استاندارد ویژگی را دشوار میسازند.
یکی دیگر از مزایای استفاده از روشهای سازگاری در نمونههای احتمالی این است که عدم پاسخگویی در آمارگیری پدیده بسیار مطالعه شده با یک سطح قابلتوجه از دانش است. Groves و Couper (1998) بسیاری از روابط شناختهشده بین پاسخ و مشخصات تخمین زدهشده را خلاصه میکنند. این اطلاعات میتواند در تنظیم مدلهای وفق پذیری یا تمایل بسیار مفید باشد.
با نمونههای داوطلبانه آنلاین، یکی از پیچیدگیهایی که دارد این است که همه اعضای جمعیت هدف در معرض دعوت به نظرسنجی آنلاین قرار ندارند. برخی از اعضای جمعیت ممکن است در دسترس نباشند چون آنها آنلاین نیستند، در حالی که دیگران ممکن است به دلایل دیگری غیرقابلدسترس باشند (به عنوان مثال، آنها هرگز به صفحات وب نمیروند که نظرسنجی را تبلیغ میکنند یا موانع تکنولوژیکی را برای اجتناب از مواجهه با این نوع دعوت تعیین میکنند). برخی دیگر ممکن است افشا شوند اما به شرکت در انواع دلایل (مشابه مساله عدم پاسخگویی نظرسنجی) علاقهمند نیستند. بسیاری از مدلسازی گرایش در آمارگیری وب تا به امروز تنها بر روی یک جنبه از این عدم انطباق تمرکز کردهاست، مانند آنهایی که آنلاین نیستند. تلاش برای انجام یک ویژگی منطقی برای مجموعهای کامل از مسیرها که ممکن است مهم و همبسته باشند، بسیار دشوار است.
جالب است که نمونهگیری سهمیهبندی تاکنون ذکر نشده است, اگرچه نمونهگیری از سهمیه تنها روشی است که در مقابل انقلاب نمونهبرداری احتمال در نیمه اول قرن بیستم مقاومت کرد. نمونهگیری تصادفی قادر به دست یابی به جای پایی و حفظ این موقعیت بود, چرا که اغلب برآوردهای معقول و کمهزینهتر از نمونهگیری احتمالی بود. این سبک هنوز در بسیاری از کشورها محبوب است. استفان و مککارتی (1958) شواهد تجربی را بررسی کردند و دریافتند که نمونهگیری سهمیه بندی به طور پیوسته پایینتر از نمونههای احتمالی از نظر جهت گیری نیست, اگرچه موقعیتهایی وجود دارد که در آن سهمیه به طور قابلتوجهی افزایش مییابد. امروزه, نمونهگیری سهمیه ایی هنوز در برخی شرایط در ایالاتمتحده مورد استفاده قرار میگیرد, اما بسیاری از آنها, از جمله دولت فدرال, هنگامی که اقدامات مهم ممکن است در نتیجه برآوردهای تحقیق اتخاذ شود, نمونههای سهمیه را قبول نمیکنند. از دست دادن محبوبیت نمونهگیری سهمیه ایی در ایالاتمتحده ممکن است بیشتر تابعی از چند شکست آشکار در نظرسنجیهای انتخاباتی باشد که در آن سهمیه تا حدی مسئول انحرافات و پیشبینیها در پیشبینی برندگان و حاشیههای پیروزی بود. این شکستهای بسیار عمومی, نمونههای بیشتری از آن هستند که در آن روشهای اجرای نظرسنجی موجب نگرانی عمومی در مورد دقت آنها شدهاست.
مهم، اما نه تنها، کاستی نمونهبرداری سهمیه ایی ناشی از انحراف انتخاب پاسخ دهندگان در کلاسهای سهمیه توسط مصاحبه کنندگان است. اگر ما در مورد نمونهگیری سهمیه ایی در رابطه با امتیاز تمایلی امتیاز فکر کنیم، وظیفه آنالیز این است که فرآیند گزینش کنترلشده توسط مصاحبه فردی را مدلسازی کنیم.
این کار، یک فعالیت ساختمان مدل قوی (موردی که نمونه بردارهای سهمیه ایی سعی در اجتناب آن با تعیین گروههای سهمیه یا کلاس در مرحله طراحی دارند) را نشان میدهد.
اگر انتخاب از مصاحبه حذف شود، صرفهجویی در هزینه کم و یا سود نسبی برای نمونهگیری احتمالی وجود دارد.
با توجه به تحقیقات آنلاین،(2007) riversرویکردی متفاوت اتخاذ میکند که شباهتهای بسیاری با نمونهگیری سهمیهبندی دارد اما بیشتر شبیه مطالعات موردی - کنترلی است.
Rivers تطبیق نمونه را پیشنهاد میدهد, که در آن یک نمونه " هدف " از یک لیست یا کادر انتخاب میشود ترجیحاً با استفاده از نمونهگیری احتمالی. برای مثال, یک نمونه هدف ممکن است به طور تصادفی از نمونه اداره سرشماری از قبیل نظرسنجی جامعه آمریکا یا بررسی جمعیت فعلی انتخاب شود. خصوصیات هر واحد نمونه هدف در مقایسه با اعضای پنلهای وب مقایسه شدهاند و نزدیکترین مسابقه در استخر پاسخ دهندگان موجود از صفحه وب مصاحبه شدهاست. پاسخ دهندگان وب اساساً جایگزین برای واحد تطبیق تصادفی نمونهگیری تصادفی هستند. رودخانهها نیازمند مجموعه بزرگی از دادههای کمکی مرتبط برای هر دو هدف و صفحه وب برای بهبود کیفیت (کاهش گرایش) نمونه مصاحبه شده میباشند.
این رویکرد ویژگیهای خوبی دارد و سزاوار مطالعه بیشتر است. مانند نمونهگیری سهمیهبندی، احتمال انتخاب یک پاسخدهنده نمیتواند محاسبه شود. بر خلاف نمونهگیری سهمیه ایی، معیارهای انتخاب واحد تطبیق با جزئیات بیشتر و یا دیگر روشهای ذهنی که اغلب انحرفات را افزایش میدهند مورد توجه قرار نمیگیرند. یک ضعف این تکنیک این است که بسیار وابسته به فرضیات مدلسازی است که نمونه هدف را به اعضای صفحه وب متصل میکند. این همچنین ضعف اصلی در مطالعات موردی کنترل است. اگر متغیرهای خروجی همگن هستند، بنابرای برای آن پیامدها باید قوی باشند. توجه داشته باشید که این شرط برای نمونههای سهمیه ایی بدون انحراف است، اما در این حالت کمکی ممکن است همگنی بیشتری در مقایسه با طبقات سهمیه معمول داشته باشند.
روش دیگر تفکر درمورد رویکرد تطابق rivers این است که روش نمونهگیری کارآمد است. تطبیق پذیری خوب است و باید به برآوردهای نسبتاً دقیق منجر شود. با این حال, نمونه از صفحه وب میتواند برای ایجاد تخمینهای بی طرفانه از جمعیت هدف تنها در صورتی استفاده شود که ویژگیهای پیامد داوطلبان برابر با آن جمعیت هدف مشروط بر (کمکی ها باشند - یک فرض قوی.
این روش به داشتن متغیرهای کمکی قوی برای تشکیل کلاسهای مناسب و درک خوبی از روابط آنها با متغیرهای خروجی مورد نظر بستگی دارد. این روابط برای فعالیت مدلسازی ضروری هستند. این شرایط ممکن است برای پیشبینی انتخابات وجود داشته باشد. تمایل به برآورد ویژگیهای دیگر, به ویژه آنهایی که همانند رفتارهای رایگیری بررسی نشده اند, احتمالاً بزرگتر خواهند بود. استفاده از این رویکرد برای انواع مختلف متغیرهای خروجی نیز بسیار چالش برانگیز است.
آیا هنوز یک نمونه احتمالی است؟
برخی محققان پیشنهاد کردهاند که یک نمونه احتمال با نرخ پاسخ پایین خود یک نمونه داوطلبانه است، و بنابراین هیچ مزیتی نسبت به نمونه غیراحتمالی ندارد. براساس بحثهایی که در بالا ذکر شد، ما ادعا میکنیم که یک نمونه احتمال اجرای خوب با نرخ پاسخ پایین احتمالاً دارای کیفیت بالاتر (انحراف متوسط پایینتر برای طیف وسیعی از برآوردها) نسبت به نمونهای از داوطلبان است.
این پیشنهاد که ممکن است نرخ پاسخ به طور کلی پیچیدهتر از روش نمونهگیری باشد, به راحتی مورد آزمایش قرار نمیگیرد. یافتههای تجربی تنها میتوانند نشان دهند که آیا این امر به طور گسترده انجام میشود یا خیر. اساس این پیشنهاد این است که یک نمونه احتمالی یک پایه یکنواختتری برای ساخت دارد چون همه واحدهای نمونهگیری به طور فعال استفاده میشوند و تشویق میشوند که شرکت کنند. علاوه بر این, انحراف بزرگ عدم پاسخگویی تنها تحت شرایطی است که کمتر در عمل با آن مواجه میشوند تا به طور کلی تشخیص داده شوند. به عنوان مثال, Groves, presserو Dipko (2004) آزمایشهایی را انجام دادند که قصد داشتند انحراف عدم پاسخگویی را القا کنند تا خواص آن مورد مطالعه قرار گیرد. علیرغم تلاشهای آنها برای ایجاد شرایطی که احتمالاً منجر به انحراف عدم پاسخگویی میشدند, انحراف های عدم پاسخگویی بزرگ در بررسیهای استثنا بودند. انحرافات عدم پاسخگویی بسیار بزرگ رخ میدهند, اما نه آن طور که ممکن است فرض کنیم. حتی زمانی که آنها رخ میدهند, تنها یک زیرمجموعه کوچک از تخمینهای این نظرسنجی میتواند تمایلات زیادی داشته باشد.
نمونه های تصادفی آینده
مطالعه تاریخ نمونهگیری نشان میدهد که مسیر تاریخی آسیبپذیر است و اگر شرایط کمی متفاوت باشد، این مسیر میتواند بسیار متفاوت باشد. هر چه بیشتر به گذشته و رویدادهای حال نگاه کنیم، بیشتر در مورد مسیر آینده فکر میکنیم. افسانه بیسبال Yogi Berra مدعی است که "آینده همان چیزی نیست که قبلاً بودهاست".
یکی از دلایل ضعف گذشته، نقش مهمی است که افراد در تعیین مسیر بازی میکنند. شخصیت ها در تصمیمگیری درباره این که کدام ایدهها اتخاذ شدهاند و کدام یک مهم نیستند، حیاتی بودند. همانطور که قبلاً اشاره شد، استدلالهای Kaiersقبل از ISI برای فرم نماینده نمونهگیری بدون نظریه آماری و با نتایج تجربی محدود انجام شد. با این حال او توانست مخاطبان بینالمللی از اهمیت نمونههای نماینده را با ارائه مکرر و متقاعدکننده در مورد موضوع متقاعد کند. Kruskal و Mosteller (۱۹۸۰) توجه دارند که "کار Kaiersدر نمونهبرداری یک نمایش یک نفره بود".
در ایالاتمتحده, اداره آمار یک پذیرندگان اولیه از نمونهگیری احتمالی بود و موریس هانسن بسیاری از ادارات را رهبری کرد. هانسن به شدت به تئوری و عمل نمونهگیری کمک کرد. به نظر میرسید که او هم از این تکنیک خوشش میآید. او طرفدار انتخاب احتمالی در ایالاتمتحده و بینالمللی بود. هر کسی که فرصت کار با موریس را داشت, موافق بود که او رهبر بسیار با استعداد, بسیار قانعکننده و سرسختانه است. بدون شخصیت مانند Kaier و هانسن, تاریخ نمونهبرداری ممکن است بسیار متفاوت باشد. احتمال میرود که آینده نمونهگیری در دستان افرادی باشد که هنوز مشخص نشده اند.
دو عامل دیگر در تاریخ نمونهبرداری مهم بودند و احتمالاً مربوط به آینده آن بودند. یکی ثروت ایدههای علمی در حال گردش در جامعه است, نه لزوماً از نمونهبرداری پیمایشی یا حتی آمار. اوایل قرن بیستم زمان توسعه ایدههای علمی و آماری بود.
Neyman که مقاله ۱۹۳۴ او یک پارادایم جدید را برای نمونهگیری در نظر گرفته بود، تنها دو سهم برای نمونهگیری در نظر گرفته بود. با این حال، او تاثیر زیادی بر نظریه آماری به طور کلی با بسیاری از مشارکتهای دیگر داشت.
در این نوع محیط غنی، رشد و تغییر در روشها محتمل است.
عامل دوم تقاضای جامعه برای اطلاعات است. نمونهگیری تحقیقاتی در بخشی به این دلیل قادر به شکوفایی بود چرا که جامعه قرن بیستم تمایل داشت که بیشتر در مورد طیف گستردهای از موضوعات بداند و منابع را در این تحقیقات قرار دهد.
به دست آوردن مشاهدات از تمام اعضای یک جمعیت بسیار دشوار و پرهزینه است که این نیازها را برآورده کند. اگر نمونهگیری احتمالی ظهور نکرده باشد، ما شک داریم که روش یا روش دیگری برای استنباط از مجموعهای از مشاهدات برای برطرف کردن این نیازها توسعهیافته است.
چیزی که ما در مورد آن مطمئن هستیم این است که آینده نمونهگیری پویا خواهد بود.
جامعه ما پیوسته نیازهای خود را گسترش میدهد و پیشرفت علمی در جامعه فوقالعاده است. نمونهگیری به طور حتم تغییر خواهد کرد و تغییرات ممکن است در محدوده بیشتر از آنچه که در اینجا پیشبینی شدهبود، بزرگتر باشد. در حالی که تغییرات حتمی است، اما ما نسبت به مسیر خاص آینده اطمینان کمتری داریم.
References
AAPOR Cell Phone Task Force Report. 2010. New Considerations for Survey Researchers When
Planning and Conducting RDD Telephone Surveys in the U.S. with Respondents Reached via Cell
Phone Numbers. http://www.aapor.org/AM/Template.cfm?Section¼Cell_Phone_Task_Force&
Template¼/CM/ContentDisplay.cfm&ContentID¼2818.
Baker, Reg, Stephen Blumberg, J. Michael Brick, Mick Couper, Melanie Courtright, J. Michael
Dennis, Don Dillman, et al. 2010. ‘‘Research Synthesis: AAPOR Report on Online Panels.’’ Public
Opinion Quarterly 74:711–81.
886 Brick
Downloaded from https://academic.oup.com/poq/article-abstract/75/5/872/1823136 by guest on 26June 2020
Bellhouse, David. 2000. ‘‘Survey Sampling Theory over the Twentieth Century and Its Relation to
Computing Technology.’’ Survey Methodology 26:11–20.
Blumberg, Stephen, and Julian Luke. 2010. Wireless Substitution: Early Release of Estimates from
the National Health Interview Survey, July–December 2009. Hyattsville, MD: U.S. Centers for
Disease Control and Prevention, National Center for Health Statistics. http://www.cdc.gov/nchs/
data/nhis/earlyrelease/wireless201005.pdf.
Bowley, Arthur. 1926. ‘‘Measurement of the Precision Attained in Sampling.’’ Bulletin of the
International Statistical Institute 22: Supplement to Liv. 1:1–62.
Brick, J. Michael. 2010. ‘‘Allocation in Dual Frame Telephone Surveys with Nonsampling Errors.’’
Paper presented at the Statistical Society of Canada Annual Meeting, Quebec City, Canada.
Couper, Mick. 2000. ‘‘Web Surveys: A Review of Issues and Approaches.’’ Public Opinion Quarterly
64:464–94.
Deville, Jean-Claude, and Carl-Erik Sa¨rndal. 1992. ‘‘Calibration Estimators in Survey Sampling.’’
Journal of the American Statistical Association 87:376–82.
Dillman, Don. 1978.Mail and Telephone Surveys: The TotalDesignMethod.New York:Wiley&Sons.
Duncan, Joseph, and William Shelton. 1978. Revolution in United States Government Statistics,
1926–1976. Washington, DC: U.S. Department of Commerce, Office of Federal Statistical Policy
and Standards.
Frankel, Martin, and Lester Frankel. 1987. ‘‘Fifty Years of Survey Sampling in the United States.’’
Public Opinion Quarterly 51(Part 2):S127–38.
Godambe, Vidyadhar. 1966. ‘‘A New Approach to Sampling fromFinite Populations. II. Distribution-
Free Sufficiency.’’ Journal of the Royal Statistical Society Series B (Methodological) 28:320–28.
Green, Donald, and Alan Gerber. 2006. ‘‘Can Registration-Based Sampling Improve the Accuracy
of Midterm Election Forecasts?’’ Public Opinion Quarterly 70:197–223.
Groves,Robert,andMickCouper.1998.NonresponseinHouseholdInterviewSurveys.NewYork:Wiley.
Groves, Robert, and Steven Heeringa. 2006. ‘‘Responsive Design for Household Surveys: Tools for
Actively Controlling Survey Errors and Costs.’’ Journal of the Royal Statistical Society Series A
169:439–57.
Groves, Robert, Stanley Presser, and Sarah Dipko. 2004. ‘‘The Role of Topic Interest in Survey
Participation Decisions.’’ Public Opinion Quarterly 68:2–31.
Hansen, Morris, William Madow, and Benjamin Tepping. 1983. ‘‘An Evaluation of Model-
Dependent and Probability-Sampling Inferences in Sample Surveys.’’ Journal of the American
Statistical Association 78:776–93.
Heckathorn, Douglas. 1997. ‘‘Respondent-Driven Sampling: A New Approach to the Study of Hidden
Populations.’’ Social Problems 44:174–99.
Holt, D. Tim, and Smith. 1979. ‘‘Post-Stratification.’’ Journal of the Royal Statistical Society Series
A 142:33–46.
Jabine, Thomas, and Fritz Scheuren. 1985. ‘‘Goals for Statistical Uses of Administrative Records:
The Next 10 Years.’’ Journal of Business & Economic Statistics 3:380–91.
Kaier, Anders. 1895–96.‘‘Observations et experiences concernant des de´nombrements representatives.’’
Bulletin of the International Statistical Institute 9:176–83.
Kalton, Graham, and J. Michael Brick. 1995. ‘‘Weighting Schemes for Household Surveys.’’ Survey
Methodology 21(1):33–44.
Keeter, Scott. 2006. ‘‘The Impact of Cell Phone Noncoverage Bias on Polling in the 2004Presidential
Election.’’ Public Opinion Quarterly 70:88–98.
Kruskal, William, and Frederick Mosteller. 1980. ‘‘Representative Sampling IV: The History of the
Concept in Statistics, 1895–1939.’’ International Statistical Review/Revue Internationale de Statistique
48:169–95.
Lavallec´e, Pierre. 2007. Indirect Sampling. New York: Springer.
Lee, Sunghee, and Richard Valliant. 2009. ‘‘Estimation for Volunteer Panel Web Surveys Using
Propensity Score Adjustment and Calibration Adjustment.’’ Sociological Methods & Research
37:319–43.
The Future of Survey Sampling 887
Downloaded from https://academic.oup.com/poq/article-abstract/75/5/872/1823136 by guest on 26June 2020
Lin, I-Fen, and Nora Cate Schaeffer. 1995. ‘‘Using Survey Participants to Estimate the Impact of
Nonparticipation.’’ Public Opinion Quarterly 59:236–58.
Little, Roderick, and Donald Rubin. 2002. Statistical Analysis with Missing Data. 2nd ed. Hoboken,
NJ: John Wiley & Sons.
Lohr, Sharon. 2009. ‘‘Multiple Frame Surveys.’’ In Handbook of Statistics, Vol. 29A, Sample
Surveys: Design, Methods, and Applications, edited by D. Pfefferman and C.R. Rao, 3–8.
Amsterdam: Elsevier/North-Holland.
———. Forthcoming. ‘‘Alternative Survey Sample Designs: Sampling with Multiple Overlapping
Frames.’’ Survey Methodology.
National Research Council. 2010. Improving State Voter Registration Databases: Final Report.
Washington, DC: National Academies Press.
Neyman, Jerzy. 1934. ‘‘On the Two Different Aspects of the Representative Method: The Method of
Stratified Sampling and the Method of Purposive Selection.’’ Journal of the Royal Statistical
Society 97:558–625.
Rao, J. N. K. 2003. Small Area Estimation. New York: Wiley.
Rivers, Douglas. 2007. ‘‘Sample Matching for Web Surveys: Theory and Application.’’ Paper presented
at the 2007 Joint Statistical Meetings, Salt Lake City, UT.
Rosenbaum, Paul, and Donald Rubin. 1983. ‘‘The Central Role of the Propensity Score in Observational
Studies for Causal Effects.’’ Biometrika 70:41–55.
Royall, Richard. 1970. ‘‘On Finite Population Sampling Theory under Certain Linear Regression
Models.’’ Biometrika 57:377–87.
Rubin, Donald. 1976. ‘‘Inference and Missing Data.’’ Biometrika 63:581–92.
Schonlau, Matthias, Arthur van Soest, Arie Kapteyn, and Mick Couper. 2007. ‘‘Are Webographic
or Attitudinal Questions Useful for Adjusting Estimates from Web Surveys Using Propensity
Scoring?’’ Survey Research Methods 1:155–63.
Steiner, Peter, Thomas Cook, and William Shadish. 2011. ‘‘On the Importance of Reliable Covariate
Measurement in Selection Bias Adjustments Using Propensity Scores.’’ Journal of Educational
and Behavioral Statistics 36:213–36.
Stephan, Frederick, and Philip McCarthy. 1958. Sampling Opinions: An Analysis of Survey Procedure.
New York: Wiley.
Thompson, Steven, Fred Ramsey, and George Seber. 1992. ‘‘An Adaptive Procedure for Sampling
Animal Populations.’’ Biometrics 48:1195–99.
Thompson, Steven, and George Seber. 1996. Adaptive Sampling. New York: Wiley.
Van de Kerckhove, Wendy, Jill Montaquila, Priscilla Carver, and J. Michael Brick. 2009. An Evaluation
of Bias in the 2007NationalHouseholds Education Surveys Program: Results from a Special
Data Collection Effort.NCES 2009–029.Washington,DC:U.S. Department of Education, National
Center for Education Statistics. http://www.nces.ed.gov/pubsearch/pubsinfo.asp?pubid¼2009029.
Volz, Erik, and Douglas Heckathorn. 2008. ‘‘Probability-Based Estimation Theory for Respondent-
Driven Sampling.’’ Journal of Official Statistics 24:79–97.
Waksberg, Joseph.