payamsalimian.eng
payamsalimian.eng
خواندن ۴۷ دقیقه·۴ سال پیش

آینده نمونه گیری تحقیقاتی

آینده نمونه گیری تحقیقاتی

بررسی مسیرهای بالقوه که نمونه‌گیری تحقیقاتی ممکن است در آینده انجام شود, مستلزم توجه به وضعیت فعلی امور و چگونگی رسیدن ما به این نقطه است. با وجود مسایل و مجادلات تصادفی, به نظر منصفانه می‌رسد که بگوییم نمونه‌برداری پیمایشی و نمونه‌گیری احتمالی به طور خاص, به تغییر دیدگاه ما از جامعه و موضوعات آن کمک کرده‌است. شاید حتی مهم‌تر اینکه, نمونه‌برداری چگونگی به دست آوردن اطلاعات از یک جمعیت بزرگ را تغییر داده‌است.

ما گذار را از شمارش کامل به عنوان تنها روش قابل قبولی برای یادگیری در مورد جمعیتی مشاهده کرده‌ایم که استاندارد در اواخر قرن نوزدهم تا " تحقیقات جزئی " و در نهایت به یک نظریه کامل نمونه‌برداری تبدیل شده‌است. همچنین از آزمون کروسکال والیس و کروسکال والیس استفاده شده‌است.

این تغییر به بررسی گستره وسیعی از موضوعات در مورد جامعه ما به شیوه‌ای موثر و به موقع امکان پذیر است. یافته‌های این بررسی‌ها به طور کلی در حوزه‌های عمومی، قانونی و فنی پذیرفته شده‌است، اگرچه هنوز بحث‌هایی در مورد روش‌های اجرا وجود دارد. نظرسنجی‌های انجام‌شده از سوی کمیسیون انتخابات، هم افراد شرکت‌کننده در انتخابات و انتخابات خارج از انتخابات، هم پذیرش عمومی و هم در مورد روش‌ها را نشان می‌دهند. بررسی‌های انتخاباتی بسیار عمومی هستند و صحت آن‌ها به راحتی قضاوت می‌شود؛ نتایج این نظرسنجی‌ها به شدت گزارش شده‌است و مردم آن‌ها را به عنوان آموزنده تلقی می‌کنند. با وجود این, روش‌های اجرای نظرسنجی‌های انتخاباتی اغلب مورد بحث قرار می‌گیرند. برای مثال, با رواج بیشتر تلفن‌های همراه, تعصب بالقوه در برآوردها از بررسی‌های تلفنی پیش از انتخابات که تلفن‌های همراه را نادیده گرفتند, بسیار مورد بحث قرار گرفت. اگرچه مطالعات و روش‌های خاص ممکن است مورد انتقاد قرار گیرند, اما اصول اولیه نمونه‌گیری به ندرت مورد پرسش قرار می‌گیرند. با نگاهی به گذشته, پذیرش گسترده نظریه نمونه‌برداری پیمایشی به عنوان وسیله‌ای برای استنباط درباره جمعیت‌های بزرگ یک توسعه بسیار عمیق و هیجان‌انگیز است.

ما با تعریف آنچه که در هنگام صحبت در مورد نمونه‌گیری در مورد آمارگیری و آینده داریم شروع می‌کنیم. سه مولفه کلیدی نمونه‌گیری، انتخاب نمونه، جمع‌آوری داده‌ها، و برآورد هستند. ادغام این اجزا یکی از ویژگی‌هایی است که نمونه‌برداری را از سایر قسمت‌های تحقیق آماری متمایز می‌کند.

نویسندگان دیگر در این سالگرد به بحث در مورد موضوعات جمع‌آوری داده‌ها، به ویژه مد، طراحی پرسشنامه، و آمارگیری برای برخی از برنامه‌های مهم بحث می‌کنند. در نتیجه، ما سعی داریم تمرکز اصلی در این مقاله را بر روی bookends این نوع نمونه‌گیری دقیق نگه داریم. اما این سه مولفه چنان درهم‌تنیده اند که هر بحثی در مورد آینده باید شامل جمع‌آوری داده‌ها و هزینه‌های جمع‌آوری داده‌ها باشد. برای اهداف این مقاله، به نظر ما نمونه‌گیری از روش نمونه‌گیری برای شناسایی مجموعه‌ای از مشاهدات از جمعیت و ایجاد استنباط در مورد جمعیت از این مشاهدات استفاده شده‌است. این تعریف شامل موضوعات مهمی از قبیل پوشش جمعیت، توسعه و ساخت نمونه، روش‌های انتخاب نمونه، کنترل یا تجزیه و تحلیل مشاهدات برای برآورد ویژگی‌های جمعیت، و تولید تخمین‌های دقیق از نمونه مشاهده‌شده می‌باشد. ما بر روی روش‌ها برای بررسی خانوارها و افراد تمرکز می‌کنیم تا نظرسنجی. مفهوم کلیدی دیگر, آینده است. در آینده نزدیک, می‌توان گفت که در طول چند سال آینده, توجه به این امر ساده‌تر است زیرا در این چارچوب زمانی ممکن است انتظار تغییرات شدیدی از وضعیت فعلی را نداشته باشیم. آینده بلند مدت خیلی بیشتر جالب است. در دامنه بلند, منطقی است که فکر کنیم تغییر پارادایم در نمونه‌برداری پیمایشی امکان پذیر است, حتی اگر چنین تغییراتی در طول چند سال گذشته رخ نداده باشد. پیش‌بینی بلندمدت نیز ممکن است امن‌تر باشد, زیرا محققان کمتری به یاد خواهند آورد که پیش‌بینی‌های ما شبیه به روند رویدادها نیست. ما هر دو چارچوب زمانی را مورد بحث قرار می‌دهیم, اما بیشتر گمانه‌زنی‌ها درباره آینده بلند مدت است.

در بخش بعدی با مرور برخی از جهت‌های گذشته و فعلی در نمونه‌برداری شروع می‌کنیم. تغییرات عمده پس از آن که منجر به سقوط شمارش کامل و روش‌های دیگر تحقیق جزئی شد و ایجاد یک پارادایم برای نمونه‌برداری پیمایشی به ویژه در ارتباط است.

تغییرات دیگر در بررسی مانند حرکت به نمونه‌برداری تلفنی در اواسط قرن بیستم نیز آموزنده است. زمینه تغییر نیز مورد بررسی قرار می‌گیرد. به طور خاص, الزامات برآورده‌ای به موقع و مقرون‌به‌صرفه محرک‌های تغییرات هستند که با روش‌های نمونه‌برداری تعامل دارند, و فشارهای هزینه امروزه بیشتر مرتبط هستند.

صفحات آنلاین و روش‌های دیگر نمونه‌برداری که نمونه‌های احتمال نیستند، و شرایط مورد نیاز برای این روش‌ها برای ارایه جایگزین‌های قابل‌قبول برای نمونه‌برداری احتمال مورد ارزیابی قرار می‌گیرد. در نهایت، ما با برخی از اندیشه‌ها در مورد این که چطور ممکن است آینده توسط عواملی که هیچ یک از ما نمی‌توانیم پیش‌بینی کنیم، شکل می‌گیرد، نتیجه‌گیری می‌کنیم.

پس‌زمینه

بیست و پنج سال پیش, فرانکل و فرانکل (1987) تاریخچه نمونه‌گیری پیمایش را در موضوع پنجاهمین سالگرد نشریه افکار عمومی مورد بررسی قرار دادند. مقاله آن‌ها هنوز بسیار مرتبط است, و خوانندگان امروزی که به خطوط گسترده تاریخ نمونه‌گیری علاقه‌مند هستند, از مرور آن‌ها لذت خواهند برد. فرانکل و فرانکل(1987) دو مرحله از توسعه را توصیف می‌کنند: مرحله اول, ایجاد روش‌های اساسی نمونه‌گیری احتمالی پس از مقاله در حال تغییر(neyman 1934) در مقاله با استفاده از روش نمونه‌گیری تصادفی بود. فاز دوم با نوآوری‌های روش‌های پایه و توسعه برای تطبیق فن‌آوری‌های جدید مانند نمونه‌برداری و کامپیوتری سازی مشخص شد. این دوگانگی هنوز هم اکنون به خوبی به ما خدمت می‌کند, زیرا بسیاری از تحولات در نمونه‌برداری از زمان 1987 به مرحله دوم نوآوری‌ها و فن‌آوری ادامه یافته‌اند. برای مثال, نمونه‌برداری مبتنی بر ثبت برای اخذ رای (Green andGerber 2006) و افراد نمونه‌برداری بر روی تلفن‌های همراه با روش‌های نمونه‌برداری استاندارد(AAPOR2010) انجام شده‌است. وب نوعی نوآوری تکنولوژیکی دیگر است که به یک شیوه مهم برای انجام بررسی‌ها تبدیل شده‌است و موضوع تحقیقات متمرکز بوده‌است.

همانطور که (couper(2000مشاهده شد, هیچ روش پذیرفته‌شده نمونه‌گیری از وب در این زمان ایجاد نشده است - و یک دهه بعد درست است. این مشکل نمونه‌برداری میزبان یک میزبان از راه‌حل‌های ممکن مختلف است (baker et al 2010).

نمونه‌گیری احتمال به صورت توسعه‌یافته توسط Neyman (۱۹۳۴) و تقریباً تمام متون نمونه‌برداری بررسی شده که در پی آن یک چارچوب بسیار خاص برای استنباط به دست آمده‌است. فرض بر این است که یک چارچوب از همه واحدها در جمعیت می‌تواند ساخته شود، که هر واحد در این فریم یک احتمال مثبت برای انتخاب شدن در نمونه دارد، و این احتمال را می‌توان برای هر واحد نمونه‌برداری محاسبه کرد.

زمانی که نمونه‌برداری شد، خصوصیات تمام واحدها را می‌توان به دقت اندازه‌گیری کرد.

برآوردها با استفاده ازیک توزیع مرجع تمام نمونه‌های ممکن تولید می‌شوند که می‌تواند با استفاده از همان روش انتخاب شود. بسیاری از روش‌ها مانند نمونه‌برداری چند مرحله‌ای و روش‌های نمونه‌برداری احتمال تفاضلی این چارچوب کلی را ارضا می‌کنند. عدم پاسخگویی، پوشش ناقص جمعیت، و خطاهای اندازه‌گیری نمونه‌هایی از مسایل عملی هستند که مفروضات محض نمونه‌گیری احتمالی را زیر پا می‌گذارند. روش‌های نمونه‌برداری دیگر اخیراً پیشنهاد شده‌اند و برخی از آن‌ها مستقیماً در چارچوب نمونه‌گیری احتمالی قرار نمی‌گیرند. یک نمونه، نمونه‌گیری از پاسخ‌دهنده است (Heckathorn ۱۹۹۷)، که در درجه اول برای بررسی جمعیت کمیاب یا سخت برای رسیدن به جمعیت مورد استفاده قرار می‌گیرد. این فرآیند یک فرآیند نمونه‌برداری شبکه‌ای یا گلوله برفی است که از اعضای گروه کمیابی درخواست می‌کند تا به دیگران رجوع کنند.

یک مدل ریاضی برای تجزیه و تحلیل داده‌ها استفاده می‌شود.) volz و Heckathorn 2008) نشان می‌دهند که نمونه مشاهده‌شده معادل یک نمونه با احتمال تحت شرایط معین است, اما این شرایط به ندرت در عمل ارضا می‌شوند. دو روش نمونه‌گیری نسبتاً جدید دیگر که از شبکه‌ها استفاده می‌کنند اما با دقت بیشتری در روش‌های نمونه‌برداری احتمال سنتی مناسب هستند, نمونه‌گیری تطبیقی (Thompson و Seber 1996) و نمونه‌گیری غیر مستقیم ( Lavallee 2007) هستند. طرح‌های انطباقی معمولاً برای تخمین تعداد انبوه جمعیت انبوه موجود در علوم طبیعی مورد استفاده قرار می‌گیرند و مکرراً در جمعیت‌های انسانی به کار گرفته نشده اند. به عنوان مثال, Thompson, Ramsey, Seber (1992) توضیح می‌دهند که چگونه نمونه‌گیری تطبیقی می‌تواند در بررسی‌های trawl میگو مورد استفاده قرار گیرد, زیرا میگو دارای خوشه‌بندی یا گرایش‌های آموزشی است اما پیش‌بینی آن امکان پذیر نیست که در آن میگو متمرکز شود. با استفاده از برآورده‌ای چگالی از نمونه اول نمونه, مناطق نمونه‌برداری در مرحله دوم در نرخ‌های متفاوت نمونه‌برداری می‌شوند تا میگو بیشتر تولید شوند. نمونه‌گیری غیر مستقیم در آمارگیری از خانوارها و افراد مورد استفاده قرار گرفته‌است. نمونه‌گیری غیر مستقیم با یک نمونه احتمال از افراد یا واحدهایی شروع می‌شود که جمعیت هدف نیستند. سپس جمعیت هدف را به واحدهای نمونه‌برداری پیوند می‌دهد تا احتمال انتخاب جمعیت هدف محاسبه شود. Kalton) brick ,1995) این رویکرد را در بررسی‌های طولی خانوار اعمال کردند تا برای افرادی که پس از موج اول وارد یک خانواده نمونه‌برداری شده, وزن بدهند. ما به برخی از این موضوعات در گمانه‌زنی در مورد آینده نمونه‌برداری باز خواهیم گشت.

فرانکل و فرانکل (1987), بحث اساسی در مورد استنباط نمونه‌گیری نمونه‌گیری را که جامعه آماری را در اوایل دهه ۱۹۶۰ با هرج و مرج تغییر داد, مورد بحث قرار نداد. همانند هر حوزه علمی جدید در حال توسعه, سوالاتی در مورد تناسب روش‌های مورد استفاده برای ایجاد استنتاج از یک نمونه به جمعیت هدف افزایش یافت و به طور گسترده در جامعه آماری مورد بحث قرار گرفت. Godambe (1966) و Royall (1970) نمونه‌هایی از انتقاد از ایده ایجاد استنتاج در مورد جمعیت مبتنی بر احتمال انتخاب واحدهای نمونه‌گیری (رویکرد مبتنی بر طراحی) هستند. آن‌ها و دیگر محققان از استفاده از مفروضات مدل‌سازی معمولی مورد استفاده در سایر حوزه‌های آمار (روش‌های مبتنی بر مدل و Bayesian) برای استنباط استفاده کردند. هولت و اسمیت (1979) یک قطعه تفکر انتقادی فراهم می‌کنند که بیشتر در برخی از این موضوعات گسترش می‌یابد. آن‌ها بر این مساله تاکید می‌کنند که نمونه‌برداری مبتنی بر طراحی ممکن است با اصل مشروطیت همخوانی نداشته باشد, یک ایده آماری که اساساً بیان می‌کند که یک نمونه یک نمونه باید بر روی نمونه مشروط باشد نه به نمونه‌های دیگری که ممکن است انتخاب شده‌باشند.

هانسن، Madow و Tepping (۱۹۸۳) از سودمندی رویکرد مبتنی بر طراحی دفاع می‌کنند و نشان می‌دهند که خطاهای جزئی در فرضیات یک رویکرد مبتنی بر مدل ممکن است تاثیرات مهمی بر جهت انحراف برآورده‌ای زمانی که یک نمونه بزرگ انتخاب می‌شود داشته باشد. در حالی که مسایل اساسی به طور کامل حل نگردیده اند، رویکرد مبتنی بر طراحی همچنان در نمونه‌گیری به عنوان یک روش غالب باقی مانده‌است.

حتی اگر اکثر تحقیقات بر روش مبتنی بر طراحی متکی باشند، روش‌های مبتنی بر مدل به طور معمول در حوزه‌هایی مانند تخمین مساحت کوچک مورد استفاده قرار می‌گیرند. هنگامی که اندازه نمونه برای یک نمونه احتمال، کافی نیست تا برآورده‌ای مستقیم قابل اعتمادی را در سطح پایین جغرافیا ایجاد کند، مدل‌های ناحیه کوچک برای ارایه این برآوردها توسعه‌یافته اند (رائو ۲۰۰۳). یک نمونه احتمال در این فرآیند مورد نیاز نیست چون مدل‌ها مبنایی برای استنباط هستند تا احتمالات نمونه‌گیری واحد. با این وجود، یک نمونه احتمال به طور کلی نقطه شروع برای تخمین مساحت کوچک است.

روش‌های مبتنی بر مدل نیز برای خطاهای غیر خطی در نمونه‌های احتمال مورد نیاز هستند, زیرا نظریه مبتنی بر طراحی, اجرای کامل طرح نمونه و جمع‌آوری داده‌ها را فرض می‌کند. یک مثال, کنترل داده‌های مفقود شده از واحدهای نمونه‌برداری شده از واحدهای نمونه‌برداری شده (لیتل و روبین) است, جایی که ممکن است این داده‌ها به دلیل عدم قطعیت باشد. روش‌های مبتنی بر طراحی و مبتنی بر مدل در این شرایط ترکیب شده‌اند; یک نمونه احتمالی انتخاب شده‌است و از روش‌های مبتنی بر طراحی برای وزن‌دهی به جمعیت استفاده می‌شود, اما از روش‌های مبتنی بر مدل برای محاسبه خطاهای پوشش, واحد سطح و قلم کالا استفاده می‌شود.

با وجود اصلاح روش‌های مبتنی بر مدل و مبتنی بر طراحی, امروزه مسائل اساسی در یک ظاهر متفاوت مورد بحث قرار می‌گیرند. بحث کنونی به جای تئوری آماری توسط عمل هدایت می‌شود و پانل‌های آنلاین بیش‌ترین توجه را جلب می‌کنند. روشی که با بررسی‌های اینترنتی بررسی شده‌است, استفاده از روش‌های تخمین جایگزین است. امید این است که روش‌های تخمین جایگزین ممکن است استنتاج را برای یک جمعیت عمومی مقدور سازد حتی زمانی که سازوکار نمونه‌گیری به خوبی تعریف‌نشده باشد. این ایده یک رویکرد مبتنی بر مدل است حتی اگر همیشه اینگونه بیان نشده باشد.

برخی محققان اظهار داشته‌اند که دوره نمونه‌گیری احتمالی به دلیل هزینه‌های فزاینده جمع‌آوری داده‌ها با خسارت‌های ناشی از عدم پوشش دهی و عدم پاسخگویی به پایان رسیده‌است. خودداری معمول این است که یک نمونه احتمال با نرخ پاسخ پایین یا نرخ پوشش " بهتر " از یک نمونه غیراحتمالی یا داوطلب نیست. این نگرانی به مبانی نمونه‌گیری تحقیقی اشاره دارد و باید برای آینده نمونه‌گیری مورد توجه قرار گیرد - آیا آن آینده ادامه دوره نمونه‌گیری احتمال یا چند روش دیگر برای جمع‌آوری داده‌ها و استنباط است. تلاش ما برای فکر کردن در مورد این که چگونه این مسائل ممکن است در آینده حل شوند با نگاه کردن به عقب آغاز می‌گردد.

تئوری آماری، هزینه و نمونه‌برداری

در بررسی تاریخچه اولیه نمونه‌گیری پیمایش (۱۸۹۵ - ۹۶)، Bowley (۱۹۲۶)، وNeyman (۱۹۳۴) همواره به عنوان کلید تغییر از وابستگی به شمارش کامل به نمونه‌گیری توضیح داده می‌شوند (Kruskal و Mosteller ۱۹۸۰؛ فرانکل و فرانکل، ۱۹۸۷؛ Bellhouse ۲۰۰۰). این تغییر عمیق بود.

به عنوان مثال, دانکن و شلتون (1978) تاثیر تغییرات در فعالیت‌های جمع‌آوری داده‌های دولتی را شرح می‌دهند که در نتیجه تلاش‌های این پیشگامان از حدود ۱۹۰۰ تا ۱۹۴۰ به عنوان یک انقلاب رخ داد. این یک تغییر اساسی بزرگ بود.

یکی از جنبه‌های جالب این تاریخ این است که انقلاب در نمونه‌برداری توسط خواسته‌های دولت و آمار رسمی رانده شد. Kaier (1895 - 96) شخصیت مرکزی بود و موسسه آماری بین‌المللی (ISI) به عنوان یک انجمن اصلی برای بحث درباره فضایل نمونه‌های نماینده خدمت می‌کرد. دانشگاهیان نیز نقشی ایفا کردند. Bowley (1926) ایده‌های اصلی در مورد آرایش تصادفی را ایجاد کرد و Neyman (1934) یک کودتای آماری را فراهم کرد. با این حال, زمانبندی رویدادها بسیار آموزنده است. Kruskalو Mosteller (1980) مشاهده کردند که " تا زمان جلسه ۱۹۲۵ آی اس آی در رم و پس از مرگ Kaiers, نمونه‌گیری نماینده یک جای شرافتمندانه و شرافتمندانه در میان statisticiansپیدا کرده بود. " این پذیرش نمونه قبل از کمک‌های آماری و bowley و Neymanاتفاق افتاد.

همچنین به نظر می‌رسد که انگیزه برای اتخاذ نمونه‌گیری به سادگی مقرون‌به‌صرفه نبود، اگرچه هزینه بسیار مهم بود. در تاریخچه تحولات اولیه، به ندرت به هزینه اشاره می‌شد. این امر با توجه به تحولات نمونه‌گیری در دهه ۱۹۶۰، هنگامی که صرفه‌جویی در هزینه مربوط به انجام بررسی‌های انجام‌شده توسط بازاریابان و دیگر گروه‌های غیر دولتی برای دور کردن از نظرسنجی خانگی رو به رو می‌باشد.

در این موج از تغییرات، مطالعات دولتی زودتر اتخاذ نشده بودند، حداقل تا حدی به این دلیل که فرضیه نمونه‌گیری برای نمونه‌گیری کارآمد از شماره‌های تلفن هنوز ایجاد نشده بود. دولت آمریکا تا دهه ۱۹۸۰ به شدت از نمونه‌گیری تلفنی استفاده نکرد، همچنین پس از تئوری آمار (Waksberg ۱۹۷۸) و روش استاندارد برای بررسی‌های تلفنی در بخش‌های دیگر ایجاد شد.

در حالی که نمونه‌برداری تلفنی یک تغییر پارادایم نبود, مانند مقدمه نمونه‌گیری تصادفی چند دهه قبل بود, هر دو توسعه نشانه‌هایی از پیشرفت ایده‌ها و الگوها فراهم می‌کردند. در هر دو مورد, نظریه آماری در طلایه تغییرات نبود; بلکه نظریه آماری برای حمایت از شیوه‌های موجود توسعه یافت.

در محیط امروز، هزینه احتمالاً مهم‌ترین عاملی است که جستجو برای روش‌های جدید نمونه‌برداری را هدایت می‌کند. و هزینه پایین مجموعه داده‌ها در وب بسیار مهم است، به خصوص آن‌هایی که در تحقیقات بازار کار می‌کنند، به سمت این رویکرد حتی بدون یک نظریه آماری که به طور گسترده‌ای پذیرفته شده‌است تا از آن پشتیبانی کند (بیکر و همکاران ۲۰۱۰). این موضوع از نزدیک به پذیرش نمونه‌گیری تلفن در دهه ۱۹۶۰ می‌پردازد. با این حال، نظریه آماری و روش جمع‌آوری داده‌ها در نهایت یک بنیان نسبتاً محکم برای نمونه‌گیری خط تلفن تشکیل دادند. این ترکیب برای یک روش جدید برای موفقیت در طیف گسترده‌ای از کاربردها ضروری است. ازدواج و تئوری ازدواج امروز به عنوان چالشی برای روش‌های جدید برای نمونه‌گیری و یا بررسی به منظور استفاده از هزینه پایین وب باقی می‌ماند.

نقش نوآوری‌های جدید در تکنولوژی به عنوان یک محرک از روش‌های پیمایشی, مربوط به اینکه فرانکل و فرانکل (1987) در مورد تاثیر تکنولوژی در توسعه نمونه‌برداری تحقیق بحث و تبادل نظر کردند. Bellhouse (2000) این اثر متقابل بین نمونه‌برداری بررسی و نوآوری تکنولوژیکی را کانون توجه به سوابق نمونه‌برداری می‌کند. سوال کمی وجود دارد که نمونه‌برداری از فن‌آوری و نمونه‌برداری در طول سال‌ها با یکدیگر درهم‌تنیده شده‌اند و هر یک از آن‌ها در یک زمان به پیشرفت‌های جدید در منطقه دیگر منجر شده‌است. به سختی می‌توان تصور کرد که تحولات پشت و جلو در نمونه‌برداری و فن‌آوری در آینده ادامه نخواهد یافت.

تغییر چشمگیر در روشی که افراد به تازگی با آن ارتباط برقرار می‌کنند، یک پیشرفت فن‌آوری است که به مقدار زیادی باعث تغییرات بزرگ در تحقیقات نمونه‌گیری تحقیقی شده است .

یک نمونه، گذار به شبکه های بی‌سیم یا تلفن همراه در آمریکا است.

جمعیت. حدود ۲۵ درصد از بزرگسالان در سال ۲۰۰۹ در خانه‌هایی بدون تلفن ثابت زندگی می‌کردند (Blumberg و luke ۲۰۱۰). طی پنج سال گذشته (AAPOR ۲۰۱۰)، همراه با این توسعه، تعداد قابل‌توجهی از مقالات در مورد نمونه‌گیری در تلفن همراه است (AAPOR ۲۰۱۰). در مورد وب بیشتر استفاده می شده است و حتی مقالات و کتاب‌های بیشتری در مورد استفاده از وب برای بررسی وجود دارد. محققان همچنین شروع به بررسی کاربردهای تحقیق بالقوه برای فرستادن پیامک، تلفن‌های هوشمند و شبکه‌های اجتماعی کرده‌اند. پیشرفت‌های بیشتر در این زمینه‌ها محتمل است. باز هم بیشتر این تکنولوژی‌ها با توجه به هزینه پایین خود به کار می‌روند، استثنای اصلی که تلفن‌های همراه هستند، که گران‌تر از تلفن های ثابت برای تحقیق هستند.

مهم است که توجه کنیم که این تغییرات ناشی از تکنولوژی فزاینده هستند و نه تغییر پارادایم. نسبتاً بی‌خطر است که بگوییم آینده نزدیک به این نوع تحولات ادامه خواهد یافت، اگر چه تغییرات عمده‌ای در نحوه تفکر ما در مورد ایجاد نتیجه گیری ممکن است ناشی از هیچ یک از این تحولات باشد.

یک جایگزین کم‌هزینه دیگر استفاده از سوابق اداری است، اگر چه این رویکرد جدید و یا ناشی از تکنولوژی جدید نیست. با وجود وعده آن‌ها، استفاده از سوابق اداری به پتانسیل خود، حداقل نه در برنامه‌های آمریکا، منجر نشده است. Jabine و Scheuren (۱۹۸۵) شش هدف تعیین‌شده توسط آمریکا را توصیف می‌کنند.

دولت برای بهبود استفاده از سوابق اداری در نمونه‌گیری از یک دوره ۱۰ ساله استفاده می‌کند. حدود ۲۵ سال بعد، بسیاری از اهداف مشخص‌شده در آنجا کاملاً تحقق نیافته اند. نمونه‌برداری از سوابق اداری در مناطق به غیر از آمار دولت بسیار موفق نبوده است. برای مثال، برآورده‌ای انتخاباتی استفاده از نمونه‌گیری از فهرست‌های ثبت را مورد بررسی قرار داده‌اند، اما این تلاش‌ها با مشکلات جدی مواجه شده‌اند. سوابق اداری همیشه مشکلاتی را برای کاربردهای نظرسنجی ناشی از ناقص بودن، عدم به موقع بودن، داده‌های ضعیف برای پیدا کردن و تماس با پاسخ دهندگان و نگهداری ناقص اسناد مطرح کرده‌است. این شکست‌ها به قدری رایج هستند که هدف بایگانی اجرایی به همان سطح کیفیت مورد نیاز برای اهداف نمونه‌برداری نیاز ندارد. برخی از این مشکلات به خوبی در شورای تحقیقات ملی (۲۰۱۰) از پایگاه‌داده‌های ثبت دهندگان دولتی ثبت شده‌اند.

این بازبینی مشخص می‌کند که چرا اسناد اجرایی به اندازه مورد انتظار در یک منطقه خاص مفید نیستند. استفاده آینده از سوابق اداری، در حالی که هنوز امیدوارکننده است، با چالش‌های عمده‌ای مواجه است.

بخش عمده‌ای از تحقیق حاضر در نظریه نمونه‌برداری, به بررسی روش‌های برآورد, خطای پوشش و اشکال دیگر داده‌های گم‌شده می‌پردازد. این رویکرد همچنین می‌تواند یک جایگزین کم‌هزینه باشد, زیرا مجموعه داده‌های گران‌قیمت را با روش‌های تحلیلی و یا تنظیمات وزنی جایگزین می‌کند. برای مثال, تعدیلات با وزن‌های پایه (عکس احتمال اوزان انتخاب) برای محاسبه وزن دهی, اساساً انتقال وزن از حالت به پاسخ دهندگان انجام می‌شود.

سهم اصلی در این حوزه Deville و Sarndal (1992) است, که روش‌های تخمین پسا طبقه بندی شده را به یک کلاس از برآوردگر کالیبراسیون که به اصطلاح برآوردگرهای درجه‌بندی نامیده می‌شوند, قرار داد.

مقاله آن‌ها دریچه ای را به یک مسیر جدید از تحقیقات باز کرد و برآورد کننده‌های کالیبراسیون به سرعت برای رسیدگی به واحدهای پاسخ داده نشده و عدم پوشش دهی شده در فرآیند تحقیقات که مستقیماً توسط نظریه مبتنی بر طراحی کنترل نشده اند، تعمیم داده شدند. روبین (۱۹۷۶) تحقیقات برآورد را با پیشنهاد انتساب چندگانه به عنوان روشی برای تخمین واریانس برای داده‌های منتسب فراهم کرد. انتساب تکنیکی است که به طور کلی برای "پر کردن" یا نسبت دادن پاسخ به مواردی که توسط پاسخ‌دهنده تکمیل نمی‌شوند، استفاده می‌شود. انتساب برای موارد گم‌شده چند دهه بوده‌است، اما انتساب چندین بار تحقیقات و توجه جدید را برانگیخته است. کار او باعث شد که هزاران مقاله در انواع کاربردها از جمله نمونه‌برداری بررسی شود.

کاربرد ایده ترمیم نقایص در جمع‌آوری داده‌ها در نمونه‌های احتمالات با استفاده از تکنیک‌های برآورد نیز برای روش‌های نمونه‌برداری دیگر مورد بررسی قرار گرفته‌است. نظرسنجی‌های آنلاین از روش‌های برآورد جایگزین، به خصوص تمایل به استفاده از روش‌های وزن دهی استفاده کرده‌اند تا برای انتخاب غیر تصادفی شرکت کنندگان (لی و Valliant ۲۰۰۹؛ Schonlau و همکاران 2007) تلاش کنند.

این حوزه‌ای است که در آن ادامه تحقیقات بدون شک در حال پیشرفت است، و ما در ادامه آن را با جزئیات بیشتر مورد بحث قرار می‌دهیم.

این نمای کوتاه از گذشته و حال نشان می‌دهد که هزینه بسیار مهم است، اما در آغاز دوره نمونه‌گیری احتمال، محرک نوآوری در نمونه‌برداری نبود. از آن زمان به بعد، هزینه به عنوان عامل اصلی برای تغییرات در روش‌های نمونه‌گیری ایجاد شده‌است، حتی اگر این تغییرات تا حد زیادی تغییرات افزایشی بوده‌اند. تیوری آمار به ندرت، اگر تا کنون عامل اصلی تغییر بوده‌است.

اما نظریه آماری برای حمایت از تحولات جدید ضروری بوده‌است. هنگامی که نظریه آماری برای یک روش نمونه‌گیری مورد پذیرش گسترده برای این روش نیست، آنگاه روش نمونه‌گیری احتمالاً در میان رشته‌ها و کاربردها پذیرفته نمی‌شود.

قبل از اینکه به آینده بپرید، بهتر است در مورد هزینه فکر کنید چون بسیار تاثیرگذار است. در بسیاری از روش‌ها، افزایش هزینه بررسی که در دهه‌های اخیر تجربه شده‌است، نشانه‌ای از مشکل اساسی کاهش در مشارکت سنجی است. هم تلفن و هم مصاحبه رو در رو امروزه بسیار ارزان‌تر از ۲۰ یا ۳۰ سال پیش است اگر افراد نمونه‌گیری شده تمایل به مشارکت داشته باشند. به عنوان محققان نظرسنجی، ما اغلب نتیجه می‌گیریم که این نرخ هم‌کاری کاهش‌یافته فقط تابعی از تغییرات جامعه‌ای است که ما قادر به نفوذ آن نیستیم. اگرچه جامعه بدون شک تغییر کرده‌است، محققان تحقیقی دارای ابزارهایی هستند که ممکن است در بهبود کیفیت تحقیق و کاهش هزینه‌ها موثر باشند. ما معتقدیم که تحقیقات آتی که بر روی پاسخ‌دهنده تمرکز دارد به جای تحلیل گر این تحقیق می‌تواند به تحقق این دو هدف کمک کند. یک روش پاسخگو محور توسط Dillman (۱۹۷۸) پیشنهاد شد. روش‌های پاسخ دهنده - محور برای افزایش هم‌کاری با درخواست نظرسنجی تلاش می‌کنند، در نتیجه نیاز به جمع‌آوری داده‌های پر هزینه و تنظیمات وزن را کاهش می‌دهد.

ایده اصلی این است که ما باید بررسی‌هایی را انجام دهیم تا پاسخ‌دهنده منافع مشارکت را به عنوان چیره شدن بر دوش مشارکت درک کند. اگر این امر امکان پذیر باشد، آنگاه هر دو هزینه پایین‌تر و کیفیت بالاتر را می‌توان به دست آورد. تحقیقات بیشتری در این زمینه مورد نیاز است.

به غبار نگاه کردن

این دیدگاه در گذشته و حال دلالت بر مسیرهایی دارد که نمونه‌گیری ممکن است در آینده به دست آید. در آینده نزدیک, آنچه فرانکل و فرانکل (1987) نامیده می‌شدند, نوآوری‌های روش‌های اساسی و اضافی برای تطبیق با فن‌آوری‌های جدید به احتمال زیاد به سرعت شتاب یافته ادامه خواهند داد. به عنوان مثال, یک ناحیه که برای چنین تحولاتی مناسب است, نمونه‌برداری از چارچوب چندگانه است. در نمونه‌گیری چارچوب چندگانه, واحدها از دو یا چند فریم برای افزایش پوشش یا کارایی انتخاب می‌شوند. به عنوان مثال, در یک نظرسنجی از شرکت‌ها, یک چارچوب ممکن است یک فهرست دسترسی آسان از کسب و کارها باشد که کامل نیستند, و چارچوب دیگر ممکن است نمونه‌ای از مناطق جغرافیایی باشد که در آن شرکت‌ها فهرست‌شده و سپس نمونه‌برداری می‌شوند. استفاده از این دو چارچوب, پوشش کامل‌تری را فراهم می‌کند در حالی که با بهره‌گیری از لیست موجود, کارایی خود را به دست می‌آورد.

نمونه‌گیری چند چارچوب حتی نوید بیشتری دارد، زیرا روشی برای کاهش هزینه‌ها با استفاده از سوابق اجرایی ارایه می‌دهد. پیشرفت ها در نظریه آماری همانطور که توسط Lohr (۲۰۰۹) شرح داده شد، نشان می‌دهد که آمارشناسان به این موضوع علاقه‌مند هستند.

پژوهشگران آماری به احتمال زیاد به کار بر روی این مساله ادامه می‌دهند چرا که تعدادی از مسائل فنی حل‌نشده، به خصوص آن‌هایی که با داده‌های از دست رفته مرتبط هستند به دلیل ناقص بودن سوابق و خطای اندازه‌گیری وجود دارد.

علاوه بر این, اخیراً یک نظریه چارچوب چندگانه برای بررسی‌های تلفن همراه بکار گرفته شده‌است, و این تحقیق برخی کاستی‌های اساسی در نظریه نمونه‌برداری را آشکار کرده‌است که ممکن است در آینده نزدیک مورد توجه قرار گیرد. به عنوان مثال, Brick (2010) نشان می‌دهد که ترکیب غیرپاسخگو در مرحله طراحی ممکن است منجر به تخصیص بهینه متفاوت نمونه و یک رویکرد وزنی متفاوت شود.

Lohr (forthcoming) توضیح می‌دهد که چگونه خطای اندازه‌گیری بر انتخاب برآوردگرهای در آمارگیری چارچوب دوگانه تاثیر می‌گذارد.

فرضیه نمونه‌گیری هنوز فرض می‌کند که پوشش جمعیت در کادر کامل است و پاسخ‌های دقیق از همه واحدهای نمونه‌گیری شده بدست می‌آید, علی‌رغم این حقیقت که این شرایط بکر هرگز با آن‌ها مواجه نبوده است. تلاش‌ها برای مقابله با این نقص‌ها تقریباً به طور کامل بر نوآوری‌ها در مرحله تخمین استوار است. یک مسیر جدید مهم برای آینده نمونه‌گیری, بررسی اثرات (و تلاش برای اصلاح) خطای نمونه برداری نشده در طراحی نمونه و اجزای جمع‌آوری داده به جای برآورد بار تنهایی است. این امر به ایده طراحی واکنشی (گرووز) و (Heeringa 2006) بسط می‌یابد, که سعی دارد انحراف غیرپاسخگو را در مرحله جمع‌آوری داده‌ها با هدف قرار دادن خصوصیات پاسخ دهندگان با نمونه ها, کاهش دهد.

به طور مشابه، اهمیت داده‌های کمکی قوی به عنوان یک الزام کلیدی برای کاهش انحراف غیرپاسخگو در سال‌های اخیر شناسایی شده‌است.

از آنجا که طراحی نمونه مزایایی نیز دارد, روش‌های مختلفی برای ترکیب این داده‌ها در مرحله نمونه‌برداری ممکن است یک مسیر جدید تحقیقاتی باشد.

تغییر این ماهیت در مرحله طراحی نمونه یک تغییر اساسی است که می‌تواند در آینده نزدیک اتفاق بیفتد.

هزینه جمع‌آوری داده برای بررسی این که چگونه آن‌ها می‌توانند از روش‌های ارزان‌تر جمع‌آوری داده‌ها استفاده کنند، ادامه خواهد یافت. یک نظریه آماری که از جمع‌آوری مشاهدات از وب از یک نمونه nonprobabilityپشتیبانی می‌کند، یک جز تشکیل‌دهنده indispensibleاست اگر برای رسیدن به این هدف بسیار مطلوب تلاش کنیم. یک سوال حل‌نشده این است که آیا این هدف را می‌توان در نظریه نمونه‌برداری احتمال مبتنی بر طراحی انجام داد. اگر امکان پذیر باشد، احتمالاً نمونه‌برداری با بسیاری از کاربردها و extensionsجدید تقویت خواهد شد. اگر نه، دو پیامد واقع‌بینانه به نظر می‌رسد: (۱) یک پارادایم جدید را می‌توان معرفی کرد که با جایگزین کردن یا تکمیل نمونه‌گیری احتمالی مبتنی بر طراحی، پذیرفته می‌شود؛ (۲) جمع‌آوری داده‌ها از سوی داوطلبان در وب محدود به رشته‌های خاص یا برنامه‌های کاربردی به دلیل پایه نظری ضعیف می‌شود.

نمونه های غیراحتمالی(غیر تصادفی)

در حالی که در مورد ماهیت یک نظریه جدید برای جایگزینی نمونه‌گیری احتمال، کار دشواری است، مرور انتقادی رویکردهایی که برای ایجاد inferences از نمونه‌های داوطلبانه یا داوطلبانه مورد بررسی قرار گرفته‌اند، امکان پذیر است. تجزیه و تحلیل داده‌های مشاهداتی، حوزه آماری است که بسیار مرتبط با آنالیز نمونه‌های وب داوطلبانه است. در حقیقت، بیشتر تحقیقات در مورد نمونه‌های وب از تکنیک‌هایی استفاده کرده‌اند که در اصل برای مطالعات نظری توسعه داده شده‌اند، که مهم‌ترین آن‌ها امتیازدهی به امتیازدهی هستند. به همین دلیل، ما با بحث در مورد روش‌های امتیازدهی تمایلی شروع می‌کنیم.

امتیاز دهی تمایلی روشی است که برای تحلیل داده‌های مشاهداتی و یا مجموعه‌ای از داده‌ها براساس نمونه‌گیری تصادفی انتخاب نشده است (Rosenbaumو Rubin ۱۹۸۳). ایده اصلی مقایسه نتایج گروه "درمان شده" با افراد گروه "درمان نشده" برای ارزیابی اثر علی رفتار زمانی است که واحدها به طور تصادفی به رفتار اختصاص داده نمی‌شوند. امتیازات تمایلی احتمال شرطی هستند که یک واحد با توجه به مجموعه‌ای از متغیرهای کمکی تحت یک مدل تلقی می شوند. اگر یک پژوهشگر بتواند گروه‌های درمان‌شده و درمان نشده را بر روی امتیاز گرایش متعادل کند و مدل درست باشد، آنگاه تاثیر علی درمان را می‌توان بی طرفانه برآورد کرد.

درخواست این تکنیک برای نمونه‌های داوطلبانه واضح است؛ با این حال، تفاوت‌های مهمی بین مطالعات مشاهده و تحقیقات وجود دارد. یک تفاوت مهم این است که بیشتر تحقیقات در نظر گرفته می‌شوند تا میزبان اهداف تحقیقاتی متنوعی باشند، حتی زمانی که یک هدف خاص از قبیل اندازه‌گیری نرخ بیکاری، طرح تحقیق را هدایت می‌کند. از سوی دیگر مطالعات مشاهده ایی اغلب برای پاسخ دادن به تعداد کمی از سوالات خاص، با هدف اولیه تعیین تاثیر رفتار انجام می‌شود.

محقق با استفاده از نمرات تمایلی برای یک مطالعه مشاهداتی کمک به ایجاد مدلی است تا مسیرهایی را شناسایی کند که منجر به انتخاب خودکار در رفتار (یا حذف از رفتار) شوند.

با توجه به این چالش، محقق داده‌های مشاهداتی نیاز دارد تا تنها متغیرهای مدل را شناسایی کند که به طور بالقوه مربوط به اثر درمان هستند. در یک محیط بررسی، توسعه یک مدل نمره تمایل به حساب انتخاب برای خود بسیار دشوار است، زیرا حوزه یک ارزیابی واحد یا ارزیابی پیامد نیست.

متغیرهای انتخاب و متغیرهای مرتبط با متغیرهای پیامد چندگانه باید در مدل مناسب برای کاهش گرایش گنجانده شوند.

امتیاز دهی تمایلی برای جبران عدم پاسخگویی و عدم پوشش دهی مورد استفاده قرار گرفت. وقتی که متغیرهای کمکی منطقی در این نوع کاربرد موجود باشند، تمایل به امتیازدهی آن‌ها (یا روش تنظیم عدم پاسخگویی دیگری) به منظور کاهش تعصبات بسیار زیاد نشان‌داده شده‌است.

این روش‌ها نسبت به انحرافات کوچک تر کم‌تر موثر هستند. دو دلیل برای ناتوانی در کاهش مداوم انحراف ناشی از عدم پاسخگویی ممکن است خطای استاندارد ویژگی باشد (در درجه اول حذف متغیرهای مهم یا عدم حساب برای رابطه بین متغیرها) و خطای اندازه‌گیری تصادفی. مشکل استاندارد ویژگی به خوبی از تحلیل رگرسیون مشخص است، که در آن به جز پیش‌بینی‌ها و یا عدم موفقیت در شمول متقابل بین متغیرها، نشان‌داده شده‌است. اشتاینر، کوک، و Shadish (۲۰۱۱) در مورد انحرافی که ممکن است ناشی از خطای اندازه‌گیری تصادفی باشد، بحث می‌کنند و یافته‌های آن‌ها مستقیماً برای نمونه‌های داوطلب قابل‌اجرا است. آن‌ها نشان می‌دهند که خطای اندازه‌گیری در متغیرهای کمکی پتانسیل ایجاد انحراف اساسی در برآورد اثرات درمانی را دارد حتی اگر ویژگی مدل صحیح باشد. بنابراین امتیازدهی به امتیازدهی و دیگر روش‌های برآورد نه تنها باید به درستی مدل‌ها را مشخص کنند، بلکه باید دارای خطای اندازه‌گیری پایین باشند.

تکنیک‌های تنظیم بکار رفته در نمونه‌های احتمال نیز دارای مزیت اصلی در استفاده از روش‌های مشابه در نمونه های غیراحتمالی یا داوطلبانه هستند.

در بررسی‌های نمونه، همه واحدهای نمونه‌گیری شده تابع یک محرک مشابه هستند تا آن‌ها را تشویق به مشارکت در آمارگیری کنند. بنابراین، استاندارد ویژگی یا مدلسازی برای مدل تمایل باید متغیرهای کمکی مربوط به تمایل واحدهای نمونه‌گیری شده برای شرکت در شرکت را در نظر داشته باشد (از آنجایی که بسیاری از متغیرهای پیامد وجود دارند، تنها مهم‌ترین آن‌ها ممکن است گنجانده شوند).

حتی این کار پیچیده است. به عنوان مثال، ما اغلب روابط و متغیرهای مختلفی را می‌بینیم که بستگی به دلیل عدم پاسخگویی دارد.

برای مثال, موارد غیرتماسی و غیرتماسی, ممکن است روابط متفاوتی با کمکی داشته باشند, زیرا محرک ممکن است سازگار نباشد. linو Schaeffer (1995) دریافتند که موارد تماس و امتناع از موارد ناشی از انحرافهای ایجاد شده در جهت مخالف هستند و مشکل استاندارد ویژگی را دشوار می‌سازند.

یکی دیگر از مزایای استفاده از روش‌های سازگاری در نمونه‌های احتمالی این است که عدم پاسخگویی در آمارگیری پدیده بسیار مطالعه شده با یک سطح قابل‌توجه از دانش است. Groves و Couper (1998) بسیاری از روابط شناخته‌شده بین پاسخ و مشخصات تخمین زده‌شده را خلاصه می‌کنند. این اطلاعات می‌تواند در تنظیم مدل‌های وفق پذیری یا تمایل بسیار مفید باشد.

با نمونه‌های داوطلبانه آنلاین، یکی از پیچیدگی‌هایی که دارد این است که همه اعضای جمعیت هدف در معرض دعوت به نظرسنجی آنلاین قرار ندارند. برخی از اعضای جمعیت ممکن است در دسترس نباشند چون آن‌ها آنلاین نیستند، در حالی که دیگران ممکن است به دلایل دیگری غیرقابل‌دسترس باشند (به عنوان مثال، آن‌ها هرگز به صفحات وب نمی‌روند که نظرسنجی را تبلیغ می‌کنند یا موانع تکنولوژیکی را برای اجتناب از مواجهه با این نوع دعوت تعیین می‌کنند). برخی دیگر ممکن است افشا شوند اما به شرکت در انواع دلایل (مشابه مساله عدم پاسخگویی نظرسنجی) علاقه‌مند نیستند. بسیاری از مدلسازی گرایش در آمارگیری وب تا به امروز تنها بر روی یک جنبه از این عدم انطباق تمرکز کرده‌است، مانند آن‌هایی که آنلاین نیستند. تلاش برای انجام یک ویژگی منطقی برای مجموعه‌ای کامل از مسیرها که ممکن است مهم و هم‌بسته باشند، بسیار دشوار است.

جالب است که نمونه‌گیری سهمیه‌بندی تاکنون ذکر نشده است, اگرچه نمونه‌گیری از سهمیه تنها روشی است که در مقابل انقلاب نمونه‌برداری احتمال در نیمه اول قرن بیستم مقاومت کرد. نمونه‌گیری تصادفی قادر به دست یابی به جای پایی و حفظ این موقعیت بود, چرا که اغلب برآورده‌ای معقول و کم‌هزینه‌تر از نمونه‌گیری احتمالی بود. این سبک هنوز در بسیاری از کشورها محبوب است. استفان و مک‌کارتی (1958) شواهد تجربی را بررسی کردند و دریافتند که نمونه‌گیری سهمیه بندی به طور پیوسته پایین‌تر از نمونه‌های احتمالی از نظر جهت گیری نیست, اگرچه موقعیت‌هایی وجود دارد که در آن سهمیه به طور قابل‌توجهی افزایش می‌یابد. امروزه, نمونه‌گیری سهمیه ایی هنوز در برخی شرایط در ایالات‌متحده مورد استفاده قرار می‌گیرد, اما بسیاری از آن‌ها, از جمله دولت فدرال, هنگامی که اقدامات مهم ممکن است در نتیجه برآورده‌ای تحقیق اتخاذ شود, نمونه‌های سهمیه را قبول نمی‌کنند. از دست دادن محبوبیت نمونه‌گیری سهمیه ایی در ایالات‌متحده ممکن است بیشتر تابعی از چند شکست آشکار در نظرسنجی‌های انتخاباتی باشد که در آن سهمیه تا حدی مسئول انحرافات و پیش‌بینی‌ها در پیش‌بینی برندگان و حاشیه‌های پیروزی بود. این شکست‌های بسیار عمومی, نمونه‌های بیشتری از آن هستند که در آن روش‌های اجرای نظرسنجی موجب نگرانی عمومی در مورد دقت آن‌ها شده‌است.

مهم، اما نه تنها، کاستی نمونه‌برداری سهمیه ایی ناشی از انحراف انتخاب پاسخ دهندگان در کلاس‌های سهمیه توسط مصاحبه کنندگان است. اگر ما در مورد نمونه‌گیری سهمیه ایی در رابطه با امتیاز تمایلی امتیاز فکر کنیم، وظیفه آنالیز این است که فرآیند گزینش کنترل‌شده توسط مصاحبه فردی را مدل‌سازی کنیم.

این کار، یک فعالیت ساختمان مدل قوی (موردی که نمونه بردارهای سهمیه ایی سعی در اجتناب آن با تعیین گروه‌های سهمیه یا کلاس در مرحله طراحی دارند) را نشان می‌دهد.

اگر انتخاب از مصاحبه حذف شود، صرفه‌جویی در هزینه کم و یا سود نسبی برای نمونه‌گیری احتمالی وجود دارد.

با توجه به تحقیقات آنلاین،(2007) riversرویکردی متفاوت اتخاذ می‌کند که شباهت‌های بسیاری با نمونه‌گیری سهمیه‌بندی دارد اما بیشتر شبیه مطالعات موردی - کنترلی است.

Rivers تطبیق نمونه را پیشنهاد می‌دهد, که در آن یک نمونه " هدف " از یک لیست یا کادر انتخاب می‌شود ترجیحاً با استفاده از نمونه‌گیری احتمالی. برای مثال, یک نمونه هدف ممکن است به طور تصادفی از نمونه اداره سرشماری از قبیل نظرسنجی جامعه آمریکا یا بررسی جمعیت فعلی انتخاب شود. خصوصیات هر واحد نمونه هدف در مقایسه با اعضای پنل‌های وب مقایسه شده‌اند و نزدیک‌ترین مسابقه در استخر پاسخ دهندگان موجود از صفحه وب مصاحبه شده‌است. پاسخ دهندگان وب اساساً جایگزین برای واحد تطبیق تصادفی نمونه‌گیری تصادفی هستند. رودخانه‌ها نیازمند مجموعه بزرگی از داده‌های کمکی مرتبط برای هر دو هدف و صفحه وب برای بهبود کیفیت (کاهش گرایش) نمونه مصاحبه شده می‌باشند.

این رویکرد ویژگی‌های خوبی دارد و سزاوار مطالعه بیشتر است. مانند نمونه‌گیری سهمیه‌بندی، احتمال انتخاب یک پاسخ‌دهنده نمی‌تواند محاسبه شود. بر خلاف نمونه‌گیری سهمیه ایی، معیارهای انتخاب واحد تطبیق با جزئیات بیشتر و یا دیگر روش‌های ذهنی که اغلب انحرفات را افزایش می‌دهند مورد توجه قرار نمی‌گیرند. یک ضعف این تکنیک این است که بسیار وابسته به فرضیات مدلسازی است که نمونه هدف را به اعضای صفحه وب متصل می‌کند. این همچنین ضعف اصلی در مطالعات موردی کنترل است. اگر متغیرهای خروجی همگن هستند، بنابرای برای آن پیامدها باید قوی باشند. توجه داشته باشید که این شرط برای نمونه‌های سهمیه ایی بدون انحراف است، اما در این حالت کمکی ممکن است همگنی بیشتری در مقایسه با طبقات سهمیه معمول داشته باشند.

روش دیگر تفکر درمورد رویکرد تطابق rivers این است که روش نمونه‌گیری کارآمد است. تطبیق پذیری خوب است و باید به برآورده‌ای نسبتاً دقیق منجر شود. با این حال, نمونه از صفحه وب می‌تواند برای ایجاد تخمین‌های بی طرفانه از جمعیت هدف تنها در صورتی استفاده شود که ویژگی‌های پیامد داوطلبان برابر با آن جمعیت هدف مشروط بر (کمکی ها باشند - یک فرض قوی.

این روش به داشتن متغیرهای کمکی قوی برای تشکیل کلاسه‌ای مناسب و درک خوبی از روابط آن‌ها با متغیرهای خروجی مورد نظر بستگی دارد. این روابط برای فعالیت مدل‌سازی ضروری هستند. این شرایط ممکن است برای پیش‌بینی انتخابات وجود داشته باشد. تمایل به برآورد ویژگی‌های دیگر, به ویژه آن‌هایی که همانند رفتارهای رای‌گیری بررسی نشده اند, احتمالاً بزرگ‌تر خواهند بود. استفاده از این رویکرد برای انواع مختلف متغیرهای خروجی نیز بسیار چالش برانگیز است.

آیا هنوز یک نمونه احتمالی است؟

برخی محققان پیشنهاد کرده‌اند که یک نمونه احتمال با نرخ پاسخ پایین خود یک نمونه داوطلبانه است، و بنابراین هیچ مزیتی نسبت به نمونه غیراحتمالی ندارد. براساس بحث‌هایی که در بالا ذکر شد، ما ادعا می‌کنیم که یک نمونه احتمال اجرای خوب با نرخ پاسخ پایین احتمالاً دارای کیفیت بالاتر (انحراف متوسط پایین‌تر برای طیف وسیعی از برآوردها) نسبت به نمونه‌ای از داوطلبان است.

این پیشنهاد که ممکن است نرخ پاسخ به طور کلی پیچیده‌تر از روش نمونه‌گیری باشد, به راحتی مورد آزمایش قرار نمی‌گیرد. یافته‌های تجربی تنها می‌توانند نشان دهند که آیا این امر به طور گسترده انجام می‌شود یا خیر. اساس این پیشنهاد این است که یک نمونه احتمالی یک پایه یکنواخت‌تری برای ساخت دارد چون همه واحدهای نمونه‌گیری به طور فعال استفاده می‌شوند و تشویق می‌شوند که شرکت کنند. علاوه بر این, انحراف بزرگ عدم پاسخگویی تنها تحت شرایطی است که کم‌تر در عمل با آن مواجه می‌شوند تا به طور کلی تشخیص داده شوند. به عنوان مثال, Groves, presserو Dipko (2004) آزمایش‌هایی را انجام دادند که قصد داشتند انحراف عدم پاسخگویی را القا کنند تا خواص آن مورد مطالعه قرار گیرد. علی‌رغم تلاش‌های آن‌ها برای ایجاد شرایطی که احتمالاً منجر به انحراف عدم پاسخگویی می‌شدند, انحراف های عدم پاسخگویی بزرگ در بررسی‌های استثنا بودند. انحرافات عدم پاسخگویی بسیار بزرگ رخ می‌دهند, اما نه آن طور که ممکن است فرض کنیم. حتی زمانی که آن‌ها رخ می‌دهند, تنها یک زیرمجموعه کوچک از تخمین‌های این نظرسنجی می‌تواند تمایلات زیادی داشته باشد.

نمونه های تصادفی آینده

مطالعه تاریخ نمونه‌گیری نشان می‌دهد که مسیر تاریخی آسیب‌پذیر است و اگر شرایط کمی متفاوت باشد، این مسیر می‌تواند بسیار متفاوت باشد. هر چه بیشتر به گذشته و رویدادهای حال نگاه کنیم، بیشتر در مورد مسیر آینده فکر می‌کنیم. افسانه بیسبال Yogi Berra مدعی است که "آینده همان چیزی نیست که قبلاً بوده‌است".

یکی از دلایل ضعف گذشته، نقش مهمی است که افراد در تعیین مسیر بازی می‌کنند. شخصیت ها در تصمیم‌گیری درباره این که کدام ایده‌ها اتخاذ شده‌اند و کدام یک مهم نیستند، حیاتی بودند. همانطور که قبلاً اشاره شد، استدلال‌های Kaiersقبل از ISI برای فرم نماینده نمونه‌گیری بدون نظریه آماری و با نتایج تجربی محدود انجام شد. با این حال او توانست مخاطبان بین‌المللی از اهمیت نمونه‌های نماینده را با ارائه مکرر و متقاعدکننده در مورد موضوع متقاعد کند. Kruskal و Mosteller (۱۹۸۰) توجه دارند که "کار Kaiersدر نمونه‌برداری یک نمایش یک نفره بود".

در ایالات‌متحده, اداره آمار یک پذیرندگان اولیه از نمونه‌گیری احتمالی بود و موریس هانسن بسیاری از ادارات را رهبری کرد. هانسن به شدت به تئوری و عمل نمونه‌گیری کمک کرد. به نظر می‌رسید که او هم از این تکنیک خوشش می‌آید. او طرفدار انتخاب احتمالی در ایالات‌متحده و بین‌المللی بود. هر کسی که فرصت کار با موریس را داشت, موافق بود که او رهبر بسیار با استعداد, بسیار قانع‌کننده و سرسختانه است. بدون شخصیت مانند Kaier و هانسن, تاریخ نمونه‌برداری ممکن است بسیار متفاوت باشد. احتمال می‌رود که آینده نمونه‌گیری در دستان افرادی باشد که هنوز مشخص نشده اند.

دو عامل دیگر در تاریخ نمونه‌برداری مهم بودند و احتمالاً مربوط به آینده آن بودند. یکی ثروت ایده‌های علمی در حال گردش در جامعه است, نه لزوماً از نمونه‌برداری پیمایشی یا حتی آمار. اوایل قرن بیستم زمان توسعه ایده‌های علمی و آماری بود.

Neyman که مقاله ۱۹۳۴ او یک پارادایم جدید را برای نمونه‌گیری در نظر گرفته بود، تنها دو سهم برای نمونه‌گیری در نظر گرفته بود. با این حال، او تاثیر زیادی بر نظریه آماری به طور کلی با بسیاری از مشارکت‌های دیگر داشت.

در این نوع محیط غنی، رشد و تغییر در روش‌ها محتمل است.

عامل دوم تقاضای جامعه برای اطلاعات است. نمونه‌گیری تحقیقاتی در بخشی به این دلیل قادر به شکوفایی بود چرا که جامعه قرن بیستم تمایل داشت که بیشتر در مورد طیف گسترده‌ای از موضوعات بداند و منابع را در این تحقیقات قرار دهد.

به دست آوردن مشاهدات از تمام اعضای یک جمعیت بسیار دشوار و پرهزینه است که این نیازها را برآورده کند. اگر نمونه‌گیری احتمالی ظهور نکرده باشد، ما شک داریم که روش یا روش دیگری برای استنباط از مجموعه‌ای از مشاهدات برای برطرف کردن این نیازها توسعه‌یافته است.

چیزی که ما در مورد آن مطمئن هستیم این است که آینده نمونه‌گیری پویا خواهد بود.

جامعه ما پیوسته نیازهای خود را گسترش می‌دهد و پیشرفت علمی در جامعه فوق‌العاده است. نمونه‌گیری به طور حتم تغییر خواهد کرد و تغییرات ممکن است در محدوده بیشتر از آنچه که در اینجا پیش‌بینی شده‌بود، بزرگ‌تر باشد. در حالی که تغییرات حتمی است، اما ما نسبت به مسیر خاص آینده اطمینان کمتری داریم.

References

AAPOR Cell Phone Task Force Report. 2010. New Considerations for Survey Researchers When

Planning and Conducting RDD Telephone Surveys in the U.S. with Respondents Reached via Cell

Phone Numbers. http://www.aapor.org/AM/Template.cfm?Section¼Cell_Phone_Task_Force&

Template¼/CM/ContentDisplay.cfm&ContentID¼2818.

Baker, Reg, Stephen Blumberg, J. Michael Brick, Mick Couper, Melanie Courtright, J. Michael

Dennis, Don Dillman, et al. 2010. ‘‘Research Synthesis: AAPOR Report on Online Panels.’’ Public

Opinion Quarterly 74:711–81.

886 Brick

Downloaded from https://academic.oup.com/poq/article-abstract/75/5/872/1823136 by guest on 26June 2020

Bellhouse, David. 2000. ‘‘Survey Sampling Theory over the Twentieth Century and Its Relation to

Computing Technology.’’ Survey Methodology 26:11–20.

Blumberg, Stephen, and Julian Luke. 2010. Wireless Substitution: Early Release of Estimates from

the National Health Interview Survey, July–December 2009. Hyattsville, MD: U.S. Centers for

Disease Control and Prevention, National Center for Health Statistics. http://www.cdc.gov/nchs/

data/nhis/earlyrelease/wireless201005.pdf.

Bowley, Arthur. 1926. ‘‘Measurement of the Precision Attained in Sampling.’’ Bulletin of the

International Statistical Institute 22: Supplement to Liv. 1:1–62.

Brick, J. Michael. 2010. ‘‘Allocation in Dual Frame Telephone Surveys with Nonsampling Errors.’’

Paper presented at the Statistical Society of Canada Annual Meeting, Quebec City, Canada.

Couper, Mick. 2000. ‘‘Web Surveys: A Review of Issues and Approaches.’’ Public Opinion Quarterly

64:464–94.

Deville, Jean-Claude, and Carl-Erik Sa¨rndal. 1992. ‘‘Calibration Estimators in Survey Sampling.’’

Journal of the American Statistical Association 87:376–82.

Dillman, Don. 1978.Mail and Telephone Surveys: The TotalDesignMethod.New York:Wiley&Sons.

Duncan, Joseph, and William Shelton. 1978. Revolution in United States Government Statistics,

1926–1976. Washington, DC: U.S. Department of Commerce, Office of Federal Statistical Policy

and Standards.

Frankel, Martin, and Lester Frankel. 1987. ‘‘Fifty Years of Survey Sampling in the United States.’’

Public Opinion Quarterly 51(Part 2):S127–38.

Godambe, Vidyadhar. 1966. ‘‘A New Approach to Sampling fromFinite Populations. II. Distribution-

Free Sufficiency.’’ Journal of the Royal Statistical Society Series B (Methodological) 28:320–28.

Green, Donald, and Alan Gerber. 2006. ‘‘Can Registration-Based Sampling Improve the Accuracy

of Midterm Election Forecasts?’’ Public Opinion Quarterly 70:197–223.

Groves,Robert,andMickCouper.1998.NonresponseinHouseholdInterviewSurveys.NewYork:Wiley.

Groves, Robert, and Steven Heeringa. 2006. ‘‘Responsive Design for Household Surveys: Tools for

Actively Controlling Survey Errors and Costs.’’ Journal of the Royal Statistical Society Series A

169:439–57.

Groves, Robert, Stanley Presser, and Sarah Dipko. 2004. ‘‘The Role of Topic Interest in Survey

Participation Decisions.’’ Public Opinion Quarterly 68:2–31.

Hansen, Morris, William Madow, and Benjamin Tepping. 1983. ‘‘An Evaluation of Model-

Dependent and Probability-Sampling Inferences in Sample Surveys.’’ Journal of the American

Statistical Association 78:776–93.

Heckathorn, Douglas. 1997. ‘‘Respondent-Driven Sampling: A New Approach to the Study of Hidden

Populations.’’ Social Problems 44:174–99.

Holt, D. Tim, and Smith. 1979. ‘‘Post-Stratification.’’ Journal of the Royal Statistical Society Series

A 142:33–46.

Jabine, Thomas, and Fritz Scheuren. 1985. ‘‘Goals for Statistical Uses of Administrative Records:

The Next 10 Years.’’ Journal of Business & Economic Statistics 3:380–91.

Kaier, Anders. 1895–96.‘‘Observations et experiences concernant des de´nombrements representatives.’’

Bulletin of the International Statistical Institute 9:176–83.

Kalton, Graham, and J. Michael Brick. 1995. ‘‘Weighting Schemes for Household Surveys.’’ Survey

Methodology 21(1):33–44.

Keeter, Scott. 2006. ‘‘The Impact of Cell Phone Noncoverage Bias on Polling in the 2004Presidential

Election.’’ Public Opinion Quarterly 70:88–98.

Kruskal, William, and Frederick Mosteller. 1980. ‘‘Representative Sampling IV: The History of the

Concept in Statistics, 1895–1939.’’ International Statistical Review/Revue Internationale de Statistique

48:169–95.

Lavallec´e, Pierre. 2007. Indirect Sampling. New York: Springer.

Lee, Sunghee, and Richard Valliant. 2009. ‘‘Estimation for Volunteer Panel Web Surveys Using

Propensity Score Adjustment and Calibration Adjustment.’’ Sociological Methods & Research

37:319–43.

The Future of Survey Sampling 887

Downloaded from https://academic.oup.com/poq/article-abstract/75/5/872/1823136 by guest on 26June 2020

Lin, I-Fen, and Nora Cate Schaeffer. 1995. ‘‘Using Survey Participants to Estimate the Impact of

Nonparticipation.’’ Public Opinion Quarterly 59:236–58.

Little, Roderick, and Donald Rubin. 2002. Statistical Analysis with Missing Data. 2nd ed. Hoboken,

NJ: John Wiley & Sons.

Lohr, Sharon. 2009. ‘‘Multiple Frame Surveys.’’ In Handbook of Statistics, Vol. 29A, Sample

Surveys: Design, Methods, and Applications, edited by D. Pfefferman and C.R. Rao, 3–8.

Amsterdam: Elsevier/North-Holland.

———. Forthcoming. ‘‘Alternative Survey Sample Designs: Sampling with Multiple Overlapping

Frames.’’ Survey Methodology.

National Research Council. 2010. Improving State Voter Registration Databases: Final Report.

Washington, DC: National Academies Press.

Neyman, Jerzy. 1934. ‘‘On the Two Different Aspects of the Representative Method: The Method of

Stratified Sampling and the Method of Purposive Selection.’’ Journal of the Royal Statistical

Society 97:558–625.

Rao, J. N. K. 2003. Small Area Estimation. New York: Wiley.

Rivers, Douglas. 2007. ‘‘Sample Matching for Web Surveys: Theory and Application.’’ Paper presented

at the 2007 Joint Statistical Meetings, Salt Lake City, UT.

Rosenbaum, Paul, and Donald Rubin. 1983. ‘‘The Central Role of the Propensity Score in Observational

Studies for Causal Effects.’’ Biometrika 70:41–55.

Royall, Richard. 1970. ‘‘On Finite Population Sampling Theory under Certain Linear Regression

Models.’’ Biometrika 57:377–87.

Rubin, Donald. 1976. ‘‘Inference and Missing Data.’’ Biometrika 63:581–92.

Schonlau, Matthias, Arthur van Soest, Arie Kapteyn, and Mick Couper. 2007. ‘‘Are Webographic

or Attitudinal Questions Useful for Adjusting Estimates from Web Surveys Using Propensity

Scoring?’’ Survey Research Methods 1:155–63.

Steiner, Peter, Thomas Cook, and William Shadish. 2011. ‘‘On the Importance of Reliable Covariate

Measurement in Selection Bias Adjustments Using Propensity Scores.’’ Journal of Educational

and Behavioral Statistics 36:213–36.

Stephan, Frederick, and Philip McCarthy. 1958. Sampling Opinions: An Analysis of Survey Procedure.

New York: Wiley.

Thompson, Steven, Fred Ramsey, and George Seber. 1992. ‘‘An Adaptive Procedure for Sampling

Animal Populations.’’ Biometrics 48:1195–99.

Thompson, Steven, and George Seber. 1996. Adaptive Sampling. New York: Wiley.

Van de Kerckhove, Wendy, Jill Montaquila, Priscilla Carver, and J. Michael Brick. 2009. An Evaluation

of Bias in the 2007NationalHouseholds Education Surveys Program: Results from a Special

Data Collection Effort.NCES 2009–029.Washington,DC:U.S. Department of Education, National

Center for Education Statistics. http://www.nces.ed.gov/pubsearch/pubsinfo.asp?pubid¼2009029.

Volz, Erik, and Douglas Heckathorn. 2008. ‘‘Probability-Based Estimation Theory for Respondent-

Driven Sampling.’’ Journal of Official Statistics 24:79–97.

Waksberg, Joseph.

تحقیقات بازاریابیتحقیقاتنمونه گیری
من پیام سلیمیان هستم،مربی توسعه کسب و کار و مهارتهای مدیران، نویسنده بیش از چهار کتاب، به صاحبان کسب وکارهای کوچک کمک می کنم درآمدشان را افزایش دهند و بدون حضور خودشان کارها به بهترین نحو انجام شود.
شاید از این پست‌ها خوشتان بیاید