در چه مواردی جمعیت عمومی. جامعه عمومی و نمونه

توزیع یک متغیر تصادفی شامل تمام اطلاعات مربوط به ویژگی های آماری آن است. چند مقدار از یک متغیر تصادفی را باید بدانید تا بتوانید توزیع آن را بسازید؟ برای این کار باید کاوش کنید جمعیت عمومی.

جمعیت عمومی مجموعه ای از تمام مقادیری است که یک متغیر تصادفی معین می تواند بگیرد.

تعداد واحدهای جمعیت عمومی را حجم آن می گویند ن. این مقدار می تواند متناهی یا بی نهایت باشد. به عنوان مثال، اگر رشد ساکنان یک شهر خاص را مطالعه کنیم، حجم عمومی جمعیت برابر با تعداد ساکنان شهر خواهد بود. اگر هر آزمایش فیزیکی انجام شود، حجم جمعیت عمومی بی نهایت خواهد بود، زیرا تعداد تمام مقادیر ممکن هر پارامتر فیزیکی برابر با بی نهایت است.

مطالعه جمعیت عمومی همیشه ممکن و مناسب نیست. اگر اندازه جمعیت عمومی بی نهایت باشد غیرممکن است. اما حتی با حجم های محدود، یک مطالعه کامل همیشه قابل توجیه نیست، زیرا به زمان و کار زیادی نیاز دارد و معمولاً به دقت مطلق نتایج نیاز نیست. نتایج کمتر دقیق، اما با تلاش و هزینه بسیار کمتر، تنها با مطالعه بخشی از جمعیت عمومی به دست می آید. چنین مطالعاتی انتخابی نامیده می شود.

مطالعات آماری که فقط بر روی بخشی از جامعه انجام می شود نمونه گیری و به بخشی از جامعه مورد مطالعه نمونه می گویند.

شکل 7.2 به صورت نمادین جامعه و نمونه را به عنوان یک مجموعه و زیر مجموعه آن نشان می دهد.

شکل 7.2 جمعیت و نمونه

با کار با زیرمجموعه‌ای از یک جمعیت عمومی معین، که اغلب بخش ناچیزی از آن را تشکیل می‌دهند، نتایجی به دست می‌آوریم که از نظر دقت برای اهداف عملی کاملاً رضایت‌بخش هستند. بررسی بخش بزرگی از جمعیت عمومی فقط دقت را افزایش می دهد، اما در صورتی که از نظر آماری به درستی نمونه برداری شود، ماهیت نتایج تغییر نمی کند.

برای اینکه نمونه منعکس کننده ویژگی های جمعیت عمومی باشد و نتایج قابل اعتماد باشد، باید قابل اعتماد باشد نماینده(نماینده).

در برخی از جمعیت های عمومی، هر بخشی از آنها به دلیل ماهیتشان نماینده هستند. با این حال، در بیشتر موارد باید مراقبت های ویژه ای انجام شود تا اطمینان حاصل شود که نمونه ها نماینده هستند.

یکییکی از دستاوردهای اصلی آمار ریاضی مدرن، توسعه تئوری و عملی روش نمونه‌گیری تصادفی است که نماینده انتخاب داده‌ها را تضمین می‌کند.

مطالعات نمونه در مقایسه با مطالعه کل جمعیت، همیشه دقت خود را از دست می دهند. با این حال، در صورتی که بزرگی خطا مشخص باشد، می توان آن را تطبیق داد. بدیهی است که هرچه حجم نمونه به اندازه جامعه عمومی نزدیک شود، خطا کمتر خواهد بود. از اینجا مشخص می شود که مشکلات استنتاج آماری به ویژه در هنگام کار با نمونه های کوچک اهمیت پیدا می کند. ن ? 10-50).

در نتیجه مطالعه مطالب فصل 2، دانش آموز باید:

دانستن

  • مفاهیم اساسی جمعیت عمومی و نمونه؛
  • روش های تخمین، انواع و ویژگی های برآورد پارامترهای جمعیت عمومی؛
  • روش های اساسی آزمون آماری فرضیه های مربوط به پارامترهای جمعیت های عمومی تک بعدی و چند متغیره.

قادر بودن به

  • برای یافتن برآورد پارامترهای جمعیت های عمومی یک بعدی و چند بعدی از داده های نمونه.
  • تجزیه و تحلیل خواص پارامترها.
  • آزمون فرضیه ها در مورد پارامترها و نوع توزیع جمعیت عمومی.
  • مقایسه پارامترهای چند جمعیت عمومی؛

خود را

  • مهارت های برآورد آماری پارامترهای جمعیت های عمومی یک بعدی و چند بعدی.
  • مهارت در آزمون فرضیه ها در مورد پارامترها و نوع توزیع جمعیت عمومی هنگام انجام تحقیقات اجتماعی-اقتصادی با استفاده از نرم افزارهای تحلیلی.

توزیع جمعیت

روش‌های آماری احتمالی تحلیل داده‌ها حاکی از آن است که الگوهایی که متغیر مورد مطالعه (متغیر تصادفی) مشمول آن است، کاملاً توسط مجموعه شرایط مشاهده آن تعیین می‌شود. از نظر ریاضی، این الگوها توسط قانون توزیع احتمال مربوطه ارائه می شوند. با این حال، هنگام انجام تحقیقات آماری، مفهوم جامعه عمومی راحت تر است.

بنابراین، مفاهیم ریاضی «جمعیت عمومی»، «متغیر تصادفی» و «قانون توزیع احتمال»، مربوط به مجموعه‌ای از شرایط معین، می‌توانند مترادف یکدیگر در معنای خاصی در نظر گرفته شوند.

جمعیت عمومیبه مجموعه ای از مشاهدات قابل تصور که می توان تحت مجموعه ای از شرایط معین انجام داد.

از آنجایی که این تعریف به مشاهدات (یا اشیاء) ممکن ذهنی اشاره دارد، جمعیت عمومی یک مفهوم انتزاعی است و نباید آن را با جمعیت های واقعی موضوع تحقیقات آماری اشتباه گرفت. بنابراین، حتی پس از بررسی همه شرکت‌ها در یک زیربخش، می‌توانیم آنها را به عنوان نمایندگان یک مجموعه احتمالی بزرگتر از شرکت‌ها در نظر بگیریم که می‌توانند در مجموعه‌ای از شرایط فعالیت کنند.

جمعیت عمومی می تواند متناهی یا نامتناهی باشد. نهاییبرای مثال، در بررسی بودجه خانواده، زمانی که نمونه از مجموع خانواده هایی که واقعاً در کشور وجود دارند، جمع آوری می شود. سپس دخل و خرج خانواده های منتخب پایش می شود. بی پایانجمعیت عمومی مشاهده می شود، به عنوان مثال، در تحقیقات علمی، زمانی که ما علاقه مند به میانگین نتیجه تعداد زیادی آزمایش هستیم.

در ساده ترین حالت، جامعه یک متغیر تصادفی یک بعدی است ایکسبا یک تابع توزیع که احتمال آن را تعیین می کند ایکسمقداری کمتر از یک عدد واقعی ثابت خواهد گرفت.

در حالت کلی، جمعیت های عمومی مورد مطالعه قرار می گیرند که شامل چندین ویژگی (معمولا بیش از دو) می شود. مجموعه ویژگی های مورد بررسی با بردار دارای نشان داده می شود کجزء، که هر کدام ویژگی مربوطه را مشخص می کند. برای تحلیل برداری ایکساز روش های آماری چند متغیره استفاده می شود.

بنابراین، موضوع مطالعه در تحلیل چند متغیره یک بردار تصادفی است ایکس،یا یک نقطه تصادفی در فضای اقلیدسی ft بعدی، سیستم بهمتغیرهای تصادفی (یک بعدی)، متغیر تصادفی ft-بعدی

تابع توزیع یک بردار تصادفی یک مقدار غیر منفی قطعی نامیده می شود که با فرمول تعیین می شود

جایی که بردار بعدی اعداد حقیقی ثابت است.

مقدار غیرمنفی قطعی F(X)

تمیز دادن:

  • پیوسته k- متغیرهای تصادفی بعدی که همه اجزای آنها متغیرهای تصادفی پیوسته (یک بعدی) هستند.
  • ک گسسته- متغیرهای تصادفی بعدی که همه اجزای آنها متغیرهای تصادفی گسسته هستند.
  • مخلوط ک-متغیرهای تصادفی بعدی که اجزای آن شامل متغیرهای تصادفی گسسته و پیوسته است.

تابع توزیع F(X)برای پیوسته ک-متغیر تصادفی بعدی طبق تعریف پیوسته است.

چگالی احتمال پیوسته کمتغیر تصادفی بعدی شرط را برآورده می کند

تراکم f (X)دارای خواص زیر است:

ناحیه ای که از بالا توسط نمودار چگالی محدود شده است همیشه برابر با یک است:

از کجا کتعداد کل (تکثر) انتگرال ها نشان داده شده است.

احتمال برخورد به یک نقطه () در هر منطقه جیبرابر است با

از تعریف چگالی چنین بر می آید که اگر چگالی توزیع مشترک دو کمیت را ادغام کنیم. ایکس 1، ایکس 2 یکی در یک زمان، برای مثال، در محدوده های نامحدود، سپس چگالی توزیع احتمال مقدار دیگری را دریافت می کنیم:

به همین ترتیب، ما داریم

چگالی احتمال، توابع توزیع زیرسیستم ها، متغیرهای تصادفی سیستم بهمتغیرهای تصادفی نامیده می شوند خصوصییا توزیع های حاشیه ای .

توزیع های مشروطبردار تصادفی ایکستوزیع زیرسیستم نامیده می شود، اجزای آن مشروط بر اینکه اجزای باقی مانده ثابت باشند. این اجزا با یک اسلش رو به جلو از اجزای غیرقابل جداسازی جدا می شوند.

به عنوان مثال، برای یک متغیر تصادفی پیوسته، فرمول هایی معتبر هستند که چگالی توزیع شرطی یک متغیر تصادفی دوبعدی () را که زیر سیستمی از سیستم () است، تعیین می کند، مشروط بر اینکه سه جزء آخر در آن ثابت باشند. :

زیرسیستم، جزء و اجزای بردار زیرسیستم اضافی ایکستماس گرفت مستقل(به طور تصادفی، احتمالی) اگر برابری

به طور خاص، اجزای بردار ایکستماس گرفت مستقل، اگر

در مورد استقلال، فرمول های مشابه برای محصولات چگالی یا احتمالات توزیع های حاشیه ای و همزمانی توزیع های شرطی با توزیع های حاشیه ای مربوطه معتبر هستند (23).

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm- یک سایت بسیار مفید!

روش نمونه گیری تحقیق روش اصلی آماری است. این طبیعی است، زیرا حجم اشیاء مورد مطالعه معمولاً بی نهایت است (و حتی اگر متناهی باشد، شمارش همه اشیاء بسیار دشوار است، فقط باید به بخشی از آنها، یعنی یک نمونه اکتفا کرد).

جمعیت عمومی و نمونه

مجموعه کلی مجموع تمام عناصر مورد مطالعه در این آزمایش است.

مجموعه نمونه (یا نمونه) مجموعه محدودی از اشیاء است که به طور تصادفی از جمعیت عمومی انتخاب شده اند.

حجم جمعیت (نمونه یا کلی) تعداد اشیاء این مجموعه است.

نمونه ای از جمعیت و جمعیت های نمونه

بیایید بگوییم که استعداد روانشناختی یک فرد برای تقسیم یک بخش معین در رابطه با بخش طلایی در حال بررسی است. از آنجایی که منشأ مفهوم برش طلایی توسط انسان سنجی بدن انسان دیکته می شود، واضح است که در این مورد، جمعیت عمومی هر موجود انسان زایی است که به بلوغ فیزیکی رسیده و نسبت های نهایی را به دست آورده است، یعنی کل جمعیت. بخش بالغ بشریت حجم این مجموعه عملا بی نهایت است.

اگر این استعداد منحصراً در محیط هنری مورد مطالعه قرار گیرد، جمعیت عمومی افرادی هستند که به طور مستقیم با طراحی مرتبط هستند: هنرمندان، معماران، طراحان. از این قبیل افراد نیز زیاد هستند و می توان حدس زد که حجم جمعیت عمومی در این مورد نیز بی نهایت است.

در هر دو مورد، برای مطالعه، ما مجبور هستیم خود را به حجم نمونه معقول محدود کنیم و نمایندگان هر دو مجموعه از دانشجویان تخصص های فنی (به عنوان افرادی دور از دنیای هنری) یا دانشجویان طراحی (به عنوان افرادی که مستقیماً با جهان مرتبط هستند را انتخاب کنیم. از هنر) تصاویر هنری).

نماینده بودن

مشکل اصلی روش نمونه گیری این است که اشیاء انتخاب شده از جامعه عمومی برای مطالعه تا چه اندازه ویژگی های مورد مطالعه جامعه عمومی را نشان می دهند، یعنی سؤال نماینده بودن نمونه.

بنابراین، نمونه ای که به طور دقیق نسبت های کمی جمعیت عمومی را نشان دهد، نماینده (نماینده) نامیده می شود.

البته به سختی می توان گفت که دقیقاً در پس این جمله بندی مبهم چه چیزی پنهان شده است. کاملا دقیق. مسائل مربوط به نمایندگی عموماً بحث برانگیزترین در هر مطالعه تجربی است. نمونه‌های زیادی وجود دارد که قبلاً کلاسیک شده‌اند، زمانی که بازنمایی ناکافی نمونه، آزمایش‌کنندگان را به نتایج پوچ سوق داد.

به عنوان یک قاعده، زمانی که جامعه علمی دیدگاه گروهی از متخصصان معتبر را در مورد صحت مطالعه بپذیرد، مسائل مربوط به نمایندگی با کمک بررسی همتایان حل می شود.

نمونه نمایندگی

بیایید به مثال تقسیم بخش برگردیم. پرسش‌های مربوط به بازنمایی نمونه‌ها در اینجا در قلب مطالعه قرار دارد: در هیچ موردی نباید گروه‌های سوژه‌ها را بر اساس تعلق آنها به محیط هنری اشتباه بگیریم.

توزیع آماری ویژگی مشاهده شده

فرکانس مقدار مشاهده شده

اجازه دهید در نتیجه آزمایش در نمونه حجمی، ویژگی مشاهده شده مقادیر،، ... را به خود بگیرد و مقدار یک بار مشاهده شد، مقدار-زمان ها و غیره یک بار مقدار مشاهده شد. سپس فرکانس مقدار مشاهده شده را عدد می نامند، مقادیر را عدد و غیره می نامند.

فرکانس نسبی مقدار مشاهده شده

فرکانس نسبی مقدار مشاهده شده یک ویژگی، نسبت فرکانس به اندازه نمونه است:

واضح است که مجموع فرکانس های ویژگی مشاهده شده باید حجم نمونه را نشان دهد

و مجموع فرکانس های نسبی باید وحدت را نشان دهد:

از این ملاحظات می توان برای کنترل تنظیم جداول آماری استفاده کرد. اگر برابری ها رعایت نشود، در هنگام ثبت نتایج آزمایش خطایی رخ داده است.

توزیع آماری مقدار مشاهده شده

توزیع آماری ویژگی مشاهده شده مطابقت بین مقادیر مشاهده شده ویژگی و فرکانس های مربوطه (یا فرکانس های نسبی) است.

به عنوان یک قاعده، توزیع آماری به شکل یک جدول دو خطی نوشته می شود که در آن مقادیر مشاهده شده ویژگی در خط اول و فرکانس های مربوطه (یا فرکانس های نسبی) در خط دوم نشان داده شده است. خط:

اگر ویژگی مشاهده شده با یک متغیر تصادفی پیوسته مشخص شود که مقادیر را از بازه می گیرد، توزیع آماری آن با فرکانس های سقوط به فواصل جزئی توصیف می شود:

جمعیت (به انگلیسی - جمعیت) - مجموع تمام اشیاء (واحدها) که دانشمند قصد دارد هنگام مطالعه یک مسئله خاص در مورد آنها نتیجه بگیرد.

جمعیت عمومی شامل تمام اشیایی است که در معرض مطالعه هستند. ترکیب جمعیت عمومی به اهداف مطالعه بستگی دارد. گاهی اوقات جمعیت عمومی کل جمعیت یک منطقه خاص است (به عنوان مثال، زمانی که نگرش رای دهندگان بالقوه نسبت به یک نامزد مورد مطالعه قرار می گیرد)، اغلب معیارهای مختلفی تعیین می شود که هدف مطالعه را تعیین می کند. به عنوان مثال، مردان 30 تا 50 ساله که حداقل یک بار در هفته از یک برند خاص از تیغ استفاده می کنند و درآمد حداقل 100 دلار برای هر عضو خانواده دارند.

نمونهیا چارچوب نمونه- مجموعه ای از موارد (موضوع، اشیا، رویدادها، نمونه ها)، با استفاده از یک روش خاص، انتخاب شده از جمعیت عمومی برای شرکت در مطالعه.

مشخصات نمونه:

· ویژگی های کیفی نمونه - دقیقاً چه کسی را انتخاب می کنیم و از چه روش هایی برای ساخت نمونه استفاده می کنیم.

· ویژگی کمی نمونه این است که چند مورد را انتخاب می کنیم، به عبارت دیگر، حجم نمونه را انتخاب می کنیم.

نیاز به نمونه گیری

· موضوع مطالعه بسیار گسترده است. به عنوان مثال، مصرف کنندگان محصولات یک شرکت جهانی تعداد زیادی از بازارهای پراکنده جغرافیایی هستند.

· نیاز به جمع آوری اطلاعات اولیه وجود دارد.

اندازهی نمونه

اندازهی نمونه- تعداد موارد موجود در نمونه. به دلایل آماری توصیه می شود که تعداد موارد حداقل 30-35 باشد.

نمونه های وابسته و مستقل

هنگام مقایسه دو (یا بیشتر) نمونه، وابستگی آنها یک پارامتر مهم است. اگر بتوان یک جفت هممورفیک (یعنی زمانی که یک مورد از نمونه X مطابق با یک و فقط یک مورد از نمونه Y و بالعکس) برای هر مورد در دو نمونه (و این اساس رابطه برای صفت مهم است) ایجاد کرد. اندازه گیری شده در نمونه ها)، این گونه نمونه ها نامیده می شوند وابسته. نمونه هایی از انتخاب های وابسته:

· جفت دوقلو

· دو اندازه گیری از هر ویژگی قبل و بعد از قرار گرفتن در معرض تجربی،

· زن و شوهر

· و غیره.

اگر چنین رابطه ای بین نمونه ها وجود نداشته باشد، این نمونه ها در نظر گرفته می شوند مستقل، مثلا:

· مردان و زنان،

· روانشناسان و ریاضیدانان

بر این اساس، نمونه‌های وابسته همیشه اندازه یکسانی دارند، در حالی که اندازه نمونه‌های مستقل ممکن است متفاوت باشد.

نمونه ها با استفاده از معیارهای مختلف آماری مقایسه می شوند:

· آزمون تی دانشجویی

· تست ویلکاکسون

· تست U Mann-Whitney

· معیار نشانه ها

· و غیره.

نماینده بودن

نمونه ممکن است نماینده یا غیرنماینده در نظر گرفته شود.

نمونه ای از نمونه غیر نماینده

در آمریکا یکی از مشهورترین نمونه های تاریخی نمونه گیری غیرنماینده را حادثه ای می دانند که در جریان انتخابات ریاست جمهوری سال 1936 رخ داد. Litrery Digest که رویدادهای چندین انتخابات قبلی را با موفقیت پیش‌بینی کرده بود، با ارسال ده میلیون برگه رای آزمایشی برای مشترکین خود و همچنین برای افرادی که از دفترچه تلفن سراسر کشور و افرادی از لیست‌های ثبت نام خودرو انتخاب شده بودند، اشتباه محاسبه کرد. در 25 درصد برگه های برگشتی (نزدیک به 2.5 میلیون) آرا به شرح زیر توزیع شده است:

· 57 درصد آلف لاندون نامزد جمهوری خواه را ترجیح دادند

· 40 درصد، فرانکلین روزولت، رئیس جمهور وقت دموکرات را انتخاب کردند

همانطور که مشخص است روزولت با کسب بیش از 60 درصد آرا در انتخابات واقعی پیروز شد. اشتباه The Litreary Digest این بود: می خواستند نماینده نمونه را افزایش دهند - زیرا می دانستند که اکثر مشترکان خود را جمهوری خواه می دانند - نمونه را با افرادی که از دفترچه تلفن و لیست های ثبت نام انتخاب شده بودند گسترش دادند. با این حال، آنها واقعیت های معاصر را در نظر نگرفتند و در واقع جمهوری خواهان بیشتری را به خدمت گرفتند: در دوران رکود بزرگ، این طبقه متوسط ​​و بالا (یعنی اکثر جمهوری خواهان، نه دموکرات ها) بودند که می توانستند تلفن و ماشین داشته باشند.

انواع پلان برای گروه های ساختمانی از نمونه ها

چندین نوع اصلی پلان ساختمان گروهی وجود دارد:

1. مطالعه با گروه های آزمایش و کنترل که در شرایط مختلف قرار می گیرند.

2. مطالعه با گروه های آزمایش و کنترل با استفاده از راهبرد انتخاب زوجی

3. مطالعه فقط با استفاده از یک گروه - تجربی.

4. یک مطالعه با استفاده از یک طرح ترکیبی (فاکتوری) - همه گروه ها در شرایط مختلف قرار می گیرند.

انواع نمونه

نمونه ها به دو نوع تقسیم می شوند:

· احتمالی

· غیر احتمالی

نمونه های احتمالی

1. نمونه گیری با احتمال ساده:

oنمونه گیری مجدد ساده استفاده از چنین نمونه ای بر این فرض استوار است که هر پاسخ دهنده به یک اندازه در نمونه گنجانده می شود. بر اساس فهرست جمعیت عمومی، کارت هایی با تعداد پاسخ دهندگان تهیه می شود. آنها در یک عرشه قرار می گیرند، مخلوط می شوند، و یک کارت به طور تصادفی از آنها خارج می شود، یک عدد نوشته می شود، سپس برگردانده می شود. علاوه بر این، این روش به اندازه حجم نمونه مورد نیاز ما تکرار می شود. منهای: تکرار واحدهای انتخابی.

روند ساخت یک نمونه تصادفی ساده شامل مراحل زیر است:

1. شما باید لیست کاملی از اعضای جمعیت عمومی دریافت کنید و این لیست را شماره گذاری کنید. چنین فهرستی، به یاد آوری، چارچوب نمونه گیری نامیده می شود.

2. تعیین اندازه نمونه مورد انتظار، یعنی تعداد مورد انتظار پاسخ دهندگان.

3. از جدول اعداد تصادفی به تعداد واحدهای نمونه نیاز داریم اعداد را استخراج کنیم. اگر نمونه باید 100 نفر باشد، 100 عدد تصادفی از جدول گرفته می شود. این اعداد تصادفی را می توان توسط یک برنامه کامپیوتری تولید کرد.

4. از فهرست پایه مشاهداتی را انتخاب کنید که اعداد آنها با اعداد تصادفی نوشته شده مطابقت دارد

· یک نمونه تصادفی ساده مزایای آشکاری دارد. درک این روش بسیار آسان است. نتایج تحقیق را می توان به جامعه مورد مطالعه تعمیم داد. بیشتر رویکردهای استنتاج آماری شامل جمع آوری اطلاعات با استفاده از یک نمونه تصادفی ساده است. با این حال، روش نمونه گیری تصادفی ساده حداقل چهار محدودیت قابل توجه دارد:

1. ایجاد یک چارچوب نمونه‌گیری که امکان یک نمونه تصادفی ساده را فراهم کند، اغلب دشوار است.

2. نتیجه استفاده از یک نمونه تصادفی ساده می تواند یک جمعیت زیاد، یا یک جمعیت پراکنده در یک منطقه جغرافیایی بزرگ باشد که زمان و هزینه جمع آوری داده ها را به میزان قابل توجهی افزایش می دهد.

3. نتایج به کارگیری یک نمونه تصادفی ساده اغلب با دقت کم و خطای استاندارد بزرگتر نسبت به نتایج به کارگیری سایر روش های احتمالی مشخص می شود.

4. در نتیجه اعمال SRS، ممکن است یک نمونه غیرنماینده تشکیل شود. اگرچه نمونه‌های به‌دست‌آمده با انتخاب تصادفی ساده، به‌طور متوسط ​​به‌اندازه کافی جامعه را نشان می‌دهند، اما برخی از آنها به‌شدت نادرست جامعه مورد مطالعه را نشان می‌دهند. احتمال این به خصوص با حجم نمونه کوچک زیاد است.

· نمونه گیری ساده و غیر تکراری روال ساخت نمونه یکسان است، فقط کارت هایی با شماره پاسخ دهندگان به عرشه بازگردانده نمی شوند.

1. نمونه گیری احتمال سیستماتیک این یک نسخه ساده شده از یک نمونه احتمال ساده است. بر اساس فهرست جمعیت عمومی، پاسخ دهندگان در یک بازه زمانی معین (K) انتخاب می شوند. مقدار K به طور تصادفی تعیین می شود. قابل اطمینان ترین نتیجه با یک جمعیت عمومی همگن به دست می آید، در غیر این صورت اندازه گام و برخی الگوهای چرخه ای داخلی نمونه ممکن است مطابقت داشته باشند (اختلاط نمونه). معایب: مانند یک نمونه احتمال ساده.

2. نمونه برداری سریالی (تودرتو). واحدهای نمونه گیری سری های آماری (خانواده، مدرسه، تیم و ...) می باشد. عناصر انتخاب شده در معرض بررسی مستمر قرار می گیرند. انتخاب واحدهای آماری را می توان با توجه به نوع نمونه گیری تصادفی یا سیستماتیک سازماندهی کرد. معایب: امکان همگنی بیشتر از جمعیت عمومی.

3. نمونه منطقه بندی شده در مورد جمعیت ناهمگن، قبل از استفاده از نمونه‌گیری احتمالی با هر تکنیک انتخابی، توصیه می‌شود که جامعه را به بخش‌های همگن تقسیم کنید، به چنین نمونه‌ای، نمونه پهنه‌بندی شده می‌گویند. گروه‌های منطقه‌بندی می‌توانند هم سازندهای طبیعی (مثلاً مناطق شهری) و هم هر ویژگی زیربنایی مطالعه باشند. علامتی که بر اساس آن تقسیم بندی انجام می شود علامت طبقه بندی و پهنه بندی نامیده می شود.

4. انتخاب "راحت" روش نمونه گیری "راحتی" شامل برقراری تماس با واحدهای نمونه گیری "راحت" - با گروهی از دانش آموزان، یک تیم ورزشی، با دوستان و همسایگان است. اگر لازم باشد اطلاعاتی در مورد واکنش افراد به یک مفهوم جدید به دست آوریم، چنین نمونه ای کاملا منطقی است. نمونه گیری "راحتی" اغلب برای آزمایش اولیه پرسشنامه ها استفاده می شود.

نمونه های باورنکردنی

انتخاب در چنین نمونه ای نه بر اساس اصول شانس، بلکه بر اساس معیارهای ذهنی - در دسترس بودن، معمول بودن، نمایندگی برابر و غیره انجام می شود.

1. نمونه گیری سهمیه ای - نمونه گیری به عنوان مدلی ساخته می شود که ساختار جمعیت عمومی را در قالب سهمیه (نسبت) ویژگی های مورد مطالعه بازتولید می کند. تعداد عناصر نمونه با ترکیبی متفاوت از ویژگی های مورد مطالعه به گونه ای تعیین می شود که با سهم (نسبت) آنها در جامعه عمومی مطابقت داشته باشد. بنابراین، مثلاً اگر ما یک جمعیت عمومی 5000 نفری داشته باشیم که از این تعداد 2000 زن و 3000 مرد هستند، در نمونه سهمیه ای 20 زن و 30 مرد یا 200 زن و 300 مرد خواهیم داشت. نمونه های سهمیه ای اغلب بر اساس معیارهای جمعیت شناختی هستند: جنسیت، سن، منطقه، درآمد، تحصیلات و موارد دیگر. معایب: معمولاً چنین نمونه هایی نماینده نیستند، زیرا در نظر گرفتن چندین پارامتر اجتماعی به طور همزمان غیرممکن است. مزایا: مواد به راحتی در دسترس است.

2. روش گلوله برفی. نمونه به صورت زیر ساخته می شود. از هر پاسخ دهنده، با اولین پاسخ، خواسته می شود با دوستان، همکاران، آشنایان خود که مناسب شرایط انتخاب هستند و می توانند در مطالعه شرکت کنند، تماس بگیرد. بنابراین، به استثنای مرحله اول، نمونه با مشارکت خود موضوعات مورد مطالعه تشکیل می شود. این روش اغلب در مواقعی استفاده می‌شود که لازم باشد گروه‌هایی از پاسخ‌دهندگان را پیدا کنید و با آنها مصاحبه کنید (به عنوان مثال، پاسخ‌دهندگان با درآمد بالا، پاسخ‌دهندگان متعلق به همان گروه حرفه‌ای، پاسخ‌دهندگانی که سرگرمی‌ها / علایق مشابهی دارند و غیره). )

3. نمونه برداری خود به خود - نمونه برداری از به اصطلاح "اولین وارد". اغلب در نظرسنجی های تلویزیونی و رادیویی استفاده می شود. اندازه و ترکیب نمونه های خود به خودی از قبل مشخص نیست و تنها با یک پارامتر تعیین می شود - فعالیت پاسخ دهندگان. معایب: نمی توان تعیین کرد که پاسخ دهندگان چه نوع جمعیت عمومی را نمایندگی می کنند و در نتیجه تعیین نماینده بودن غیرممکن است.

4. بررسی مسیر - اغلب اگر واحد مطالعه خانواده باشد استفاده می شود. در نقشه شهرکی که بررسی در آن انجام خواهد شد، تمامی خیابان ها شماره گذاری شده اند. با استفاده از جدول (مولد) اعداد تصادفی، اعداد بزرگ انتخاب می شوند. هر عدد بزرگ از 3 جزء تشکیل شده است: شماره خیابان (2-3 شماره اول)، شماره خانه، شماره آپارتمان. به عنوان مثال، شماره 14832: 14 شماره خیابان روی نقشه، 8 شماره خانه، 32 شماره آپارتمان است.

5. نمونه برداری منطقه ای با انتخاب اشیاء معمولی. اگر پس از منطقه بندی، یک شی معمولی از هر گروه انتخاب شود، به عنوان مثال. جسمی که با توجه به اکثر ویژگی های مورد مطالعه در مطالعه به میانگین نزدیک می شود، چنین نمونه ای با انتخاب اشیاء معمولی منطقه بندی می شود.

استراتژی های گروه سازی

انتخاب گروه‌ها برای شرکت آنها در یک آزمایش روان‌شناختی با استفاده از راهبردهای مختلفی انجام می‌شود که به منظور اطمینان از انطباق حداکثری ممکن با اعتبار داخلی و خارجی مورد نیاز است.

· تصادفی سازی (انتخاب تصادفی)

· انتخاب دوتایی

· انتخاب استراتومتری

· مدل سازی تقریبی

· تعامل با گروه های واقعی

تصادفی سازی، یا انتخاب تصادفی، برای ایجاد نمونه های تصادفی ساده استفاده می شود. استفاده از چنین نمونه ای بر این فرض استوار است که هر یک از اعضای جامعه به طور مساوی در نمونه گنجانده می شوند. به عنوان مثال، برای ایجاد یک نمونه تصادفی از 100 دانشجوی دانشگاه، می توانید مقالاتی را با نام تمام دانشجویان دانشگاه در یک کلاه قرار دهید و سپس 100 تکه کاغذ را از آن خارج کنید - این انتخاب تصادفی خواهد بود (Goodwin J., p. . 147).

انتخاب دوتایی- راهبردی برای ساختن گروه‌های نمونه، که در آن گروه‌هایی از آزمودنی‌ها از آزمودنی‌هایی تشکیل می‌شوند که از نظر پارامترهای جانبی که برای آزمایش مهم هستند، معادل هستند. این استراتژی برای آزمایش‌هایی با استفاده از گروه‌های آزمایش و کنترل با بهترین گزینه - جذب جفت‌های دوقلو (تک و دو تخمکی) مؤثر است، زیرا به شما امکان ایجاد ...

انتخاب استراتومتری - تصادفی سازی با تخصیص طبقات (یا خوشه ها). با این روش نمونه‌گیری، جمعیت عمومی به گروه‌هایی (اقشار) که دارای ویژگی‌های خاصی (جنس، سن، ترجیحات سیاسی، تحصیلات، سطح درآمد و...) هستند، تقسیم می‌شوند و آزمودنی‌هایی با ویژگی‌های مربوطه انتخاب می‌شوند.

مدل سازی تقریبی - تهیه نمونه های محدود و تعمیم نتیجه گیری در مورد این نمونه به جامعه وسیع تری. به عنوان مثال، هنگام شرکت در مطالعه دانشجویان سال دوم دانشگاه، داده های این مطالعه به «افراد 17 تا 21 ساله» تعمیم داده می شود. پذیرش چنین تعمیم هایی بسیار محدود است.

مدل‌سازی تقریبی، شکل‌گیری مدلی است که برای طبقه‌ای از سیستم‌ها (فرایندها) به وضوح تعریف شده، رفتار (یا پدیده‌های مورد نظر) خود را با دقت قابل قبولی توصیف می‌کند.

بخش 2 نمونه و جمعیت

جمعیت عمومی و نمونه

جمعیت

عمومی (شامل تمام واحدهای مشاهده ای است که می توان مطابق با هدف مطالعه به آن نسبت داد.) جمعیت عمومی را می توان نه تنها در صنایع خاص یا مرزهای سرزمینی در نظر گرفت، بلکه به سایر ویژگی ها (جنس، سن) و نیز محدود می شود. ترکیب آنها

بنابراین، بسته به هدف مطالعه و وظایف آن، مرزهای جمعیت عمومی تغییر می کند؛ برای این کار، از ویژگی های اصلی که آن را محدود می کند، استفاده می شود.

نمونه (بخشی از جمعیت عمومی، که باید نماینده جمعیت عمومی باشد و ویژگی های آن را به طور کامل نشان دهد). بر اساس تجزیه و تحلیل جامعه نمونه، می توان تصویر نسبتاً کاملی از الگوهای ذاتی در کل جامعه به دست آورد.

مجموعه نمونه باید معرف باشد، یعنی همه عناصر باید در قسمت انتخاب شده و به همان نسبتی که در جامعه عمومی وجود دارد نشان داده شوند. به عبارت دیگر، مجموعه نمونه باید ویژگی های جمعیت عمومی را منعکس کند، یعنی به درستی آن را نشان دهد. نمایندگی باید هم کمی و هم کیفی باشد.

کمی - بر اساس قانون اعداد بزرگ و به معنای تعداد کافی از عناصر نمونه است که طبق فرمول ها و جداول خاص محاسبه می شود.

کیفی - بر اساس قانون احتمال و به معنای تناسب (یکنواختی) صفاتی است که عناصر نمونه را در رابطه با کلی مشخص می کند.

روش های نمونه گیری:

- نمونه اتفاقی - انتخاب واحدهای مشاهده به صورت تصادفی.

-نمونه برداری مکانیکی - رویکرد حسابی برای انتخاب واحدهای مشاهده نمونه گیری تیپولوژیکی- هنگام تشکیل جمعیت عمومی قبلاً به انواع با آخرین تقسیم می شود. انتخاب واحدهای مشاهده از هر گروه معمولی. در عین حال، تعداد واحدها را می توان متناسب با اندازه یک گروه معمولی و به طور نامتناسب انتخاب کرد. - نمونه برداری سریال (نمونه برداری تودرتو)- با انتخاب واحدهای مشاهده منفرد، بلکه کل گروه‌ها، سری‌ها یا لانه‌ها که شامل واحدهای مشاهده سازمان‌دهی شده به صورت جداگانه است، تشکیل می‌شود.

روش انتخاب چند مرحله ای - با توجه به تعداد مراحل، یک مرحله ای، دو مرحله ای، سه مرحله ای و ... متمایز می شود. روش انتخاب جهت دار- به شما امکان می دهد تأثیر عوامل ناشناخته را هنگام ایجاد تأثیر شناخته شده شناسایی کنید

الگوریتم معیارهای پارامتریک.

آزمون های پارامتریک برای نمونه هایی با توزیع نرمال استفاده می شود. فرمول محاسبه این معیارها شامل پارامترهای نمونه است: میانگین، واریانس و غیره بنابراین به آنها پارامتریک می گویند. نرمال بودن قانون توزیع باید از نظر آماری با استفاده از یکی از آزمون های برازش خوب اثبات شود: آزمون پیرسون، آزمون F فیشر،-معیار کلموگروف و غیره


در برخی موارد، معیارهای پارامتریک قدرتمندتر از معیارهای ناپارامتریک هستند. دومی احتمال خطای نوع دوم - پذیرش یک فرضیه صفر غلط - بیشتر است.


روش های پارامتریک شامل موارد زیر است:

– آزمون تی دانشجویی

- معیار فیشر

- روش های تحلیل یک طرفه

- روشهای تحلیل دو عاملی

ملاک دانشجو


وقت ملاقات.
این معیار به شما امکان می دهد تفاوت در مقادیر میانگین نمونه هایی را که دارای توزیع نرمال هستند ارزیابی کنید.

شرح معیار.

این معیار برای مقایسه مقادیر میانگین دو نمونه به دست آمده قبل و بعد از تأثیر یک عامل خاص قابل استفاده است.

این معیار توسط ویلیام گوست برای ارزیابی کیفیت آبجو در گینس ایجاد شد. در رابطه با تعهدات شرکت به عدم افشای اسرار تجاری (و مدیریت گینس استفاده از دستگاه آماری در کار خود را چنین می دانست)، مقاله گوست با نام مستعار "دانشجو" (دانشجو) در مجله Biometrics منتشر شد.

نمونه های وابسته (مرتبط) و مستقل (غیر مرتبط).

هنگام مقایسه دو (یا بیشتر) نمونه، وابستگی آنها یک پارامتر مهم است. اگه میتونید نصب کنید هم شکلجفت (یعنی زمانی که یک مورد از نمونه X با یک مورد از نمونه Y مطابقت دارد و بالعکس) برای هر مورد در دو نمونه (و این مبنای رابطه برای صفت اندازه گیری شده در نمونه ها مهم است)، چنین نمونه هایی نامیده می شوند وابسته. نمونه هایی از انتخاب های وابسته:

  • جفت دوقلو
  • دو اندازه گیری از هر ویژگی قبل و بعد از قرار گرفتن در معرض تجربی،
  • زن و شوهر
  • و غیره.

اگر چنین رابطه ای بین نمونه ها وجود نداشته باشد، این نمونه ها در نظر گرفته می شوند مستقل، مثلا:

  • مردان و زنان,
  • روانشناسان و ریاضیات.

بر این اساس، نمونه‌های وابسته همیشه اندازه یکسانی دارند، در حالی که اندازه نمونه‌های مستقل ممکن است متفاوت باشد.

آزمون t دو نمونه ای برای نمونه های مستقل


برای دو نمونه نامرتبط (مشاهدات به یک گروه از اشیاء تعلق ندارند)، دو گزینه محاسبه ممکن است:

    • زمانی که واریانس ها مشخص باشد
    • زمانی که واریانس ها ناشناخته اما برابر با یکدیگر هستند.

جایی که

انحراف درجه دوم اینجاو - برآورد واریانس ها


ابتدا تعداد مساوی نمونه را در نظر بگیرید. در این مورد

در مورد نمونه های مساوی ، اصطلاح

در هر دو مورد، تعداد درجات آزادی با استفاده از فرمول ها محاسبه می شود

واضح است که با برابری عددی نمونه ها

ارزش تجربی معیار دانشجو با مقدار بحرانی (طبق جدول 1 پیوست) برای تعداد معینی از درجات آزادی مقایسه می شود.


فرضیه صفر.

بیایید یک مثال را در یک آزمایشگاه محاسبه کنیم.


مثال.

روانشناس زمان واکنش انتخابی پیچیده حسی-حرکتی (بر حسب میلی ثانیه) را در گروه کنترل و آزمایش اندازه گیری کرد. گروه آزمایش (X) شامل 9 ورزشکار واجد شرایط بود. گروه کنترل (Y) شامل 8 نفر بود که به طور فعال در ورزش شرکت نداشتند. روانشناس از این فرضیه حمایت می کند که میانگین سرعت یک واکنش انتخابی پیچیده حسی-حرکتی در ورزشکاران بالاتر از همان مقدار در افرادی است که ورزش نمی کنند.



گروه ها


انحراف از میانگین


مربع های انحراف

ایکس

Y

1

504

580

-22

-58

484

3368

2

560

692

34

54

1156

2916

3

420

700

-106

62

11236

3844

4

600

621

74

-17

5476

289

5

580

640

54

-2

2916

4

6

530

561

4

-77

16

5929

7

490

680

-36

42

1296

1764

8

580

630

54

-8

2916

64

9

470

-

-56

-

3136

-

مجموع

4734

5104

0

0

28632

18174

میانگین

526

638

مقادیر متوسط ​​حسابی X و Y: در گروه کنترل.

سپس

^ تعداد درجات آزادی k=9+8-2=15

با توجه به جدول کاربردی برای تعداد معینی از درجه، ما پیدا می کنیم

ما محور اهمیت را می سازیم






که تفاوت‌هایی که روان‌شناس بین دو گروه آزمایش و کنترل یافت در سطح بیش از 0.1 درصد معنی‌دار است یا به عبارت دیگر میانگین سرعت یک واکنش حسی-حرکتی پیچیده انتخابی در گروه ورزشکاران به‌طور معنی‌داری بیشتر از گروه افراد است. فعالانه در ورزش شرکت نمی کند.

از نظر فرضیه های آماری، این عبارت به این صورت است: فرضیه H0 در مورد شباهت رد می شود و در سطح معنی داری 0.1٪ فرضیه جایگزین H1 پذیرفته می شود - در مورد تفاوت بین گروه های آزمایش و کنترل.

آزمون t دو نمونه ای برای نمونه های وابسته (مرتبط).

نمونه‌های مرتبط به‌عنوان مشاهدات برای یک گروه از اشیاء درک می‌شوند، و همه مشاهدات به‌صورت زوجی با هر شی مورد مطالعه مرتبط هستند و وضعیت آن را قبل و بعد از قرار گرفتن در معرض یک عامل خاص مشخص می‌کنند.

فرضیه ها

: مقدار میانگین در نمونه با صفر تفاوتی ندارد.

: میانگین نمونه با صفر متفاوت است.

1. نرمال بودن قانون توزیع ابتدا برای یکی از معیارهای مناسب بودن بررسی می شود.

2. محاسبه (i=1..n) - تفاوت های زوجی و نتایج اندازه گیری برای من-موضوع قبل و بعد از تاثیر برخی عوامل. ما مقدار را مستقل برای اشیاء مختلف و به طور معمول توزیع می کنیم

3. موارد زیر محاسبه می شوند (ترجیحاً به صورت جدول): مجموع تفاوت های زوجی و پارامترهای کمکی.

4. ارزش تجربی معیار با درجات آزادی طبق فرمول محاسبه می شود

جایی که n حجم نمونه است.

5. ارزش تجربی پیدا کرد معیار دانش آموز با مقدار بحرانی مقایسه می شود(طبق جدول 1 پیوست) برای تعداد معینی از درجه آزادی.
فرضیه صفردر سطح معینی از اهمیتپذیرفته می شود اگر ارزش تجربی.

مقدار بحرانی برای احتمال انتخاب شده و تعداد درجه آزادی داده شده را می توان با استفاده از تابع STUDISP اکسل داخلی پیدا کرد.


مثال.

این روانشناس پیشنهاد کرد که در نتیجه آموزش، زمان حل مسائل معادل (یعنی داشتن الگوریتم حل یکسان) به میزان قابل توجهی کاهش می یابد. برای آزمون فرضیه، هشت نفر زمان حل (بر حسب دقیقه) تکالیف اول و سوم را مقایسه کردند.


راه حل مشکل در جدول ارائه شده است.


شماره موضوع


1 وظیفه


3 وظیفه

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...