نمونه برداری

. اهداف

نمونه برداری یک روش برای بدست آوردن تخمین از یک جمعیت با مطالعه، اندازه گیری و یا مصاحبه با زیرمجموعه ای ( یا نمونه ای ) از آن جمعیت است. در این فصل به بحث درباره مفاهیم اولیه نمونه برداری می پردازیم.

نقاط قدرت، ضعف و محدودیت ها

نمونه ای که به خوبی انتخاب شده باشد تخمینی از پارامترهای هدف را در مدت زمان کوتاه و با هزینه ای کمتر از مطالعه، اندازه گیری و یا مصاحبه با کل جمعیت ارائه می دهد ( انجام آمار گیری). غالباً غیر ممکن است که %100 پاسخ بدست آید زیرا بعضی از نهادهایی که قرار است مورد مطالعه، اندازه گیری و مصاحبه قرار گیرند یا موجود نیستند یا پاسخ نمی دهند. یک نمونه گاه دقیق تر از کل است زیرا بدست آوردن اندازه گیری های متعدد به خاطر خستگی و یا ثبت داده های ناهمسو یا غیر دقیق و استفاده از پرسنل کم تجربه منجر به بروز خطا می شود.

پاسخ نمونه که تخمین نامیده می شود هرگز به اندازه ارزش جمعیت مربوطه دقیق نیست ( این تفاوت را خطا می نامند). علاوه براین قبل از انتخاب یک نمونه معتبر آماری، باید مقدار بسیار زیادی اطلاعات درباره جمعیت داشته باشیم.

مفاهیم

نمونه برداری یک روش برای بدست آوردن یک تخمین از یک جمعیت با مطالعه، اندازه گیری و یا مصاحبه با زیرمجموعه ای از جمعیت است. در این فصل درباره مفاهیم اولیه نمونه برداری بحث می کنیم.

چرا نمونه؟

هر سال مجله کانسیومر ریپورتس تست هایی را روی اتومبیل های جدید انجام می دهد و یافته های آنها را برای خوانندگان گزارش می کند. با توجه به میلیون ها اتومبیل ( به طور مجازی) که هر سال از خطوط مونتاژ بیرون می آیند آزمایش کردن کل جمعیت می تواند بسیار زمان بر، پر هزینه و عملاً غیر ممکن باشد بنابراین نتایج آزمایش براساس یک نمونه هستند.

در بسیاری از موارد، آزمایش یک نمونه اساساً دقیق تر از آزمایش کل جمعیت است. واکنش های آزمایشگر و مشاهدات او احتمالاً به خاطر خستگی بین اتومبیل اول و دهم تغییر می کند. آزمایشات متعدد داده های بسیاری را در بر دارند و در ثبت داده ها وقوع خطا اجتناب ناپذیر است. تست های متعدد ممکن است توسط آزمون گیرندگان متعدد انجام شوند و ممکن است مهارت همه آنها در یک حد نباشد. در نهایت شرایط و معیارهای تست تقریبا به مرور زمان تغییر می کنند. مثلاً اگر اتومبیل ها به تعداد کافی به یک مانع برخورد کنند آن مانع در نهایت تغییر شکل می دهد و شرایط تست تغییر می کند.

اگر نمونه به درستی گرفته شود منطقی است که فکر کنیم تخمین نمونه، جمعیت را منعکس می کند. ادامه این فصل درباره بحث در خصوص روند گرفتن یک نمونه خوب است.

اندازه نمونه و خطای نمونه برداری

تفاوت بین تخمین نمونه و ارزش جمعیت واقعی را خطا می نامند. قاعدتاً خطای نمونه با افزایش اندازه نمونه کاهش می یابد. مثلاً اگر فاصله اطمینان 95% باشد یک نمونه متشکل از 1000 رأی دهنده می تواند نتیجه یک انتخاب را با خطای بالاتر از منفی یا مثبت 3% پیش بینی کند. افزایش اندازه نمونه تا 4000 موجب می شود خطا تا منفی یا مثبت 1.5% کاهش یابد اما اندازه نمونه 10000 تایی خطا را تا کمتر از منفی یا مثبت 1 درصد کاهش می دهد.

و یا شامل 63 دانشجو است. (تهیه یک نمونه به صورت کسر دانشجویان غیر ممکن است و با گرد کردن، یک فاصله اطمینان کمی بالاتر از 95% حاصل می شود). با فرض اینکه دانشجویان صادقانه به پرسش ها پاسخ دهند میانگین هزینه هفتگی غذای 63 دانشجوی دانشگاه که به طور تصادفی انتخاب شده اند ارزشی را ارائه می دهد که 2$ میانگین جمعیت با درصد اطمینان 95 است. به عبارت دیگر 95% احتمال دارد که میانگین نمونه 2$ میانگین واقعی باشد. (نکته: یک کارشناس آمار شاید ادعا کند که این جمله آخر به لحاظ فنی صحیح نیست اما در اکثر موارد راه منطفی این است که یک فاصله اطمینان را در نظر بگیریم).

تورش (نمونه برداری غیر تصادفی)

انتخاب اندازه نمونه کافی نیست. مثلاً نمونه ای که از بیرون یک رستوران گران بدست می آید و نمونه ای که از بیرون یک دکه غذا فروشی گرفته می شود قطعاً دو برآورد متفاوت (و به یک اندازه نامعتبر) از هزینه های هفتگی غذای دانشجویان دانشگاه ارائه می دهند زیرا این نمونه ها احتمالاً تورش هستند. نمونه تورشی اساساً به نفع بعضی از اعضای جامعه است. یک مثال دیگر، اگر از یک دفتر تلفن برای انتخاب یک نمونه استفاده کنید افرادی که نامشان در دفتر تلفن نیست، افرادی که به تازگی نامشان در بازار تلفن ثبت شده است و افرادی که تلفن ندارند احتمالاً به طور خود به خود از آن نمونه حذف می شوند.

تورش عدم-پاسخ زمانی رخ می دهد که یک یا چند تن از اعضای گروه منتخب در نمونه نباشند. یک پژوهش که فقط اطلاعات کسانی را در بر دارد که در یک زمان معین در طول روز به تلفن پاسخ می دهند یک زیرمجموعه از جمعیت را در بر نمی گیرد. کنار گذاشتن و یا حذف افرادی که به پرسش های معین پاسخ نمی دهند نیز یکی دیگر از منابع تورشی عدم-پاسخ است. مراقب تورش عدم-پاسخ باشید. قبل از گرفتن نمونه، روند نمونه برداری را مورد مطالعه قرار دهید، زیرمجموعه های جمعیت که ممکن است حذف شوند و یا در مطالعه شرکت نکنند را مشخص کنید و در صورت لزوم روند نمونه برداری را تنظیم کنید.

نمونه برداری تصادفی

یک راه نسبتاً آسان برای اجتناب از تورش شدن این است که نمونه برداری به طور تصادفی انجام شود. یک نمونه در صورتی تصادفی در نظر گرفته می شود که شانس انتخاب شدن برای همه افراد جمعیت یکسان باشد. نمونه های تصادفی، تخمین های بدون سو ارائه می دهند. به طور کلی، یک تخمین بدون سو، حدوداً کمی بالاتر و پایین تر از نصف است.

دو روش پرکاربرد برای انتخاب یک نمونه تصادفی وجود دارد. اگر جمعیت کوچک باشد اعضاء (تکه کاغذی که به هر شخص ارائه می شود) را می توان کاملاً ترکیب کرد و نمونه را به طور مستقیم انتخاب کرد (مانند علائم بینگو یا بلیط بخت آزمایی). برای جمعیت های بزرگتر، برای هر عضو یک شماره مشخص کنید و از تولید کننده شماره تصادفی و یا جدول شماره های تصادفی برای انتخاب نمونه استفاده کنید.

نمونه های تصادفی مانند

در مواردی که انتخاب نمونه تصادفی واقعی غیرممکن است و یا دشوار است هدف این است که تخمین هایی تولید شود که طوری عمل کنند که انگار براساس یک نمونه تصادفی بوده اند. کلید موفقیت در انجام این کار این است که نمونه برداری تقریباً تصادفی برای اجتناب از تورشی انجام شود. به عنوان مثال، فرض کنید یک خواربارفروش یک محموله میوه را بررسی می کند. یک تخمین براساس یک نمونه که از یک جعبه گرفته شده است و یا حتی از بالای چند جعبه نمی تواند به طور دقیق کیفیت همه میوه ها را منعکس کند. به هر حال، اگر خواربارفروش چند جعبه را انتخاب کند و بعد میوه را از بالا، وسط و ته جعبه ها انتخاب کند احتمالاً نمونه تصادفی - مانند خواهد بود.

در یک خط مونتاژ، انتخاب دهمین، صدمین و هزارمین مورد ( به طور کلی هر مورد اِن ام) ممکن است یک روش اثربخش برای انتخاب یک نمونه تصادفی- مانند باشد. یک گزینه این است که هر مورد nth m انتخاب شود که در ان n یک عدد تصادفی است ( مثلاً هر مورد 100 5th ).

وقتی از انسان ها نمونه برداری می کنید از قابلیت پیشگویی اجتناب کنید زیرا این امر غالباً موجب تورش می شود. به عنوان مثال، اگر رئیس هر یک ساعت یکبار در محل کار قدم بزند احتمالاً می بیند که همه دارند سخت کار می کنند. اگر یک رئیس دیگر از جدول شماره های تصادفی برای تعریف کردن زمان بازدید تصادفی از محل کار استفاده کند احتمالاً تصویر دقیق تری از عادات کاری کارکنان بدست می اورد.

نمونه برداری تصادفی لایه ای

با نمونه برداری تصادفی لایه ای، جمعیتی با اندازه N به m زیرگروه تقسیم می شود. هر زیرگروه را یک لایه می نامند و هر عضو جمعیت باید دقیقاً در یک لایه قرار گیرد. به عنوان مثال، تقسیم کردن گروهی از مردم بر حسب جنسیت دو لایه ( زن و مرد) تولید می کند؛ تقسیم کردن گروهی از رأی دهندگان به دمکرات ها و جمهوری خواهان و مستقلان و سوسیالیست ها چهار لایه تولید می کند و مقایسه نتایج در لایه های اول و دوم و سوم مستلزم سه لایه است. نمونه ها به طور تصادفی از درون هر لایه گرفته می شوند.

نمونه برداری تصادفی لایه ای در صورتی مهم است که لایه های مختلف دارای معانی و یا سطوح تغییر پذیری مختلف باشند. به عنوان مثال فرض کنید کارکنان نسبتاً بی تجربه و جدیدی که شیفت سوم کار می کنند در مقیاسه با آنهایی که در دو شیفت دیگر کار می کنند بیشتر مرتکب خطا می شوند. در این موارد، نمونه برداری لایه ای تخمین های دقیق تری نسبت به نمونه برداری تصادفی ساده تولید می کند.

تخصیص تناسبی

یک روش برای توزیع یک نمونه در چند لایه تخصیص تناسبی نامیده می شود. اگر 200 کارمند در سه شیفت کار کنند که 100 نفر از آنها در شیف اول، 60 نفر شیفت دوم و 40 نفر شیفت سوم کار کنند یک توزیع منطقی نمونه می تواند شامل 50% در شیفت اول، 30% در شیفت دوم و 20% در شیفت سوم باشد.

تخصیص بهینه

اگر یک لایه نسبت به سایر لایه ها تغییر پذیری بسیار بیشتری داشته باشد باید به طور تناسبی نمونه های بیشتری را از لایه غیرهمسو گرفت. همچنین، اگر اندازه گیری و یا مصاحبه در یک لایه نسبت به سایر لایه ها پرهزینه تر باشد باید به طور تناسبی تعداد کمتری نمونه از لایه گران گرفت.

Michael S. Broida

دانشگاه میامی

امین بلور یکشنبه 30 آبان 1395 ساعت 19:07

IT managment

IT managment