فرضیه های صفر و جایگزین فرضیه های آماری و معیارها منطقه پذیرش فرضیه صفر

بررسی آماری آمار

مفهوم فرضیه های آماری

انواع فرضیه ها. خطاهای نوع اول و دوم

فرضیه- این یک فرض در مورد برخی از ویژگی های پدیده های مورد مطالعه است. زیر فرضیه آماریهر گزاره ای را در مورد جمعیت عمومی قابل بررسی آماری ، یعنی بر اساس نتایج مشاهدات در یک نمونه تصادفی ، درک کنید. دو نوع فرضیه آماری را در نظر بگیرید: فرضیه قوانین توزیعجمعیت عمومی و فرضیه ها در مورد پارامترهاتوزیع های شناخته شده

بنابراین ، این فرضیه که زمان صرف شده برای مونتاژ یک واحد ماشین آلات در گروهی از مغازه های ماشین سازی که محصولات با همین نام را تولید می کنند و تقریباً شرایط فنی و اقتصادی تولید مشابهی دارند طبق قانون عادی توزیع می شود ، یک فرضیه در مورد قانون توزیع است. . و این فرضیه که بهره وری کار کارگران در دو تیپ که کار یکسانی را در شرایط یکسان انجام می دهند متفاوت نیست (در حالی که بهره وری کار کارگران در هر تیپ دارای قانون توزیع عادی است) یک فرضیه در مورد پارامترهای توزیع است.

فرضیه مورد آزمایش نامیده می شود خالی،یا پایه ای،و نشان داد ح 0 فرضیه صفر با آن در تضاد است رقابت،یا جایگزین،فرضیه نشان داده شده حیکی به طور معمول فرضیه رقابت ح 1 نفی فرضیه اصلی است ح 0.

یک مثال از یک فرضیه صفر می تواند این باشد: میانگین دو جمعیت عادی توزیع شده مساوی است ، سپس یک فرضیه رقیب ممکن است شامل این فرض باشد که میانگین ها برابر نیستند. این به صورت نمادین به شرح زیر نوشته شده است:

ح 0: م(NS) = م(Y); ح 1: م(NS) م(Y) .

اگر فرضیه صفر (مطرح شده) رد شود ، یک فرضیه رقیب وجود دارد.

فرضیه های ساده و پیچیده را تشخیص دهید. اگر این فرضیه فقط یک فرض داشته باشد ، آن این است - سادهفرضیه. پیچیدهیک فرضیه شامل تعداد محدود یا نامحدود فرضیه های ساده است.

به عنوان مثال ، فرضیه ح 0: پ = پ 0 (احتمال نامعلوم پبرابر با احتمال فرضی است پ 0 ) ساده است و فرضیه ح 0: پ < پ 0 - پیچیده ، شامل بی شمار فرضیه ساده فرم است ح 0: پ = پ من، جایی که پ من- هر عددی ، کمتر پ 0 .

فرضیه آماری ارائه شده می تواند درست یا نادرست باشد ، بنابراین ضروری است بررسیبر اساس نتایج مشاهدات در یک نمونه تصادفی ؛ تأیید انجام می شود آماری مواد و روش ها، بنابراین به آن آمار می گویند.

هنگام آزمایش یک فرضیه آماری ، از یک متغیر تصادفی کاملاً گردآوری شده استفاده می شود که نامیده می شود معیار آماری(یا آمار) نتیجه گیری پذیرفته شده در مورد درستی (یا نادرستی) فرضیه بر اساس مطالعه توزیع این متغیر تصادفی با توجه به داده های نمونه است. بنابراین ، آزمون آماری فرضیه ها ماهیت احتمالی دارد: هنگام پذیرش (رد) یک فرضیه ، همیشه خطر اشتباه وجود دارد. در این حالت ، خطاهای دو نوع ممکن است.

خطای نوع اولاین است که فرضیه صفر رد می شود ، اگرچه در واقع درست است.

خطای نوع دوماین است که فرضیه صفر پذیرفته می شود ، اگرچه در واقعیت فرضیه صحیح است.

در بیشتر موارد ، پیامدهای این خطاها نابرابر است. اینکه کدام بهتر یا بدتر است به فرمول بندی خاص مسئله و محتوای فرضیه صفر بستگی دارد. بیایید چند نمونه را بررسی کنیم. بگذارید فرض کنیم که در یک شرکت کیفیت محصولات با نتایج نمونه گیری قضاوت می شود. اگر میزان نمونه رد شده ها از مقدار از پیش تعیین شده تجاوز نکند پ 0 ، سپس دسته پذیرفته می شود. به عبارت دیگر ، یک فرضیه صفر مطرح می شود: ح 0: پ پ 0 ... اگر هنگام آزمایش این فرضیه ، خطایی از نوع اول انجام شود ، محصولات مناسب را رد می کنیم. در صورت اشتباه از نوع دوم ، نقص به مصرف کننده ارسال می شود. بدیهی است که پیامدهای خطای نوع II می تواند بسیار جدی تر باشد.

مثال دیگری را می توان از حوزه فقه استناد کرد. ما کار قضات را اقدامی برای تأیید فرض بی گناهی متهم در نظر می گیریم. به عنوان فرضیه اصلی قابل آزمون ، فرضیه را در نظر بگیرید ح 0 : متهم بی گناه است سپس یک فرضیه جایگزین ح 1 یک فرضیه است: متهم مجرم است. بدیهی است که دادگاه می تواند هنگام صدور حکم برای متهم اشتباهاتی از نوع اول یا دوم مرتکب شود. اگر اشتباهی از نوع اول مرتکب شود ، به این معنی است که دادگاه بی گناهان را مجازات می کند: متهم زمانی محکوم می شود که در واقع مرتکب جرمی نشده باشد. اگر قضات مرتکب اشتباهی از نوع دوم شوند ، به این معنی است که دادگاه تبرئه کرده است ، در حالی که در واقع متهم مرتکب جرم شده است. بدیهی است که پیامدهای خطای نوع اول برای متهمان بسیار جدی تر خواهد بود ، در حالی که برای جامعه خطرناک ترین عواقب خطای نوع دوم است.

احتمالمرتکب شدن یک اشتباه نوع اولنامیده می شوند سطح اهمیت معیارو نشان می دهد

در بیشتر موارد ، سطح اهمیت معیار 0.01 یا 0.05 در نظر گرفته می شود. اگر ، برای مثال ، سطح اهمیت برابر با 01/0 در نظر گرفته شود ، این بدان معناست که در یک مورد از صد مورد خطای نوع I وجود دارد (یعنی رد فرضیه صفر صحیح).

احتمالمرتکب شدن خطای نوع دوممشخص کن. احتمال
عدم انجام اشتباه از نوع دوم ، یعنی رد فرضیه صفر در صورت نادرست بودن ، نامیده می شود قدرت معیار

معیار آماری.

مناطق بحرانی

فرضیه آماری با استفاده از یک متغیر تصادفی ویژه انتخاب شده ، توزیع دقیق یا تقریبی آن مشخص است (ما آن را نشان می دهیم) به) این متغیر تصادفی نامیده می شود معیار آماری(یا به سادگی معیار).

معیارهای آماری مختلفی در عمل استفاده می شود: U- و Zمعیارها (این متغیرهای تصادفی دارای توزیع نرمال هستند) ؛ افمعیار (یک متغیر تصادفی مطابق قانون فیشر-اسندکور توزیع می شود) ؛ t-معیار (طبق قانون دانشجو) ؛ معیار (طبق قانون "مربع چی") و غیره

مجموعه همه مقادیر ممکن معیار را می توان به دو زیرمجموعه جدا از هم تقسیم کرد: یکی از آنها شامل مقادیر معیاری است که فرضیه صفر برای آن پذیرفته شده است ، و دیگری که برای آن رد شده است.

مجموعه مقادیری که در آن فرضیه صفر رد می شود ، نامیده می شود منطقه بحرانی... ما منطقه بحرانی را با نشان می دهیم W.

مجموعه مقادیری را که برای آن فرضیه صفر پذیرفته شده است ، می نامند حوزه فرضیه(یا محدوده مقادیر قابل قبول معیار) ما این منطقه را به عنوان نشان می دهیم .

برای آزمایش اعتبار فرضیه صفر از داده های نمونه ، محاسبه کنید ارزش معیار مشاهده شده... ما آن را نشان خواهیم داد به obs

اصل اساسی آزمون فرضیه های آماریمی تواند به صورت زیر فرمول بندی شود: اگر مقدار مشاهده شده معیار در ناحیه بحرانی قرار گیرد (به عنوان مثال
) ، سپس فرضیه صفر رد می شود. اگر مقدار مشاهده شده معیار در حوزه پذیرش فرضیه قرار گیرد (به عنوان مثال
) ، بنابراین هیچ دلیلی برای رد فرضیه صفر وجود ندارد.

هنگام ساختن منطقه بحرانی چه اصولی باید رعایت شود W ?

بگذارید فرضیه را فرض کنیم ح 0 در واقع درست است سپس به معیار ضربه بزنید
در منطقه بحرانی ، به دلیل اصل اساسی آزمون فرضیه های آماری ، مستلزم رد فرضیه صحیح است ح 0 ، که به معنی اشتباه از نوع اول است. بنابراین ، احتمال ضربه زدن
به منطقه Wاگر فرضیه درست باشد ح 0 باید برابر با سطح اهمیت معیار باشد ، یعنی

توجه داشته باشید که احتمال خطای نوع اول به اندازه کافی کوچک انتخاب شده است (به عنوان یک قاعده ،
) سپس به معیار ضربه بزنید
به منطقه بحرانی Wاگر فرضیه درست باشد ح 0 می تواند یک رویداد تقریباً غیرممکن تلقی شود. اگر ، با توجه به داده های مشاهده انتخابی ، رویداد
با این وجود اتفاق افتاده است ، پس می توان آن را با فرضیه ناسازگار دانست ح 0 (که در نتیجه رد می شود) ، اما با فرضیه سازگار است ح 1 (که در نتیجه پذیرفته می شود).

اکنون فرض کنید که فرضیه درست است ح 1 ... سپس به معیار ضربه بزنید
در زمینه پذیرش فرضیه مستلزم پذیرش یک فرضیه نادرست است ح 0 ، که به معنی اشتباه از نوع دوم است. از این رو
.

از زمان وقایع
و
متقابلاً متضاد هستند ، سپس احتمال برخورد با معیار
به منطقه بحرانی Wدر صورت فرضیه برابر با قدرت آزمون خواهد بود ح 1 درست است ، یعنی

بدیهی است که ناحیه بحرانی باید به گونه ای انتخاب شود که در یک سطح معنا دار از اهمیت معیار برخوردار باشد
حداکثر بود حداکثر کردن قدرت معیار حداقل احتمال خطای نوع دوم را فراهم می کند.

لازم به ذکر است که هر چقدر هم سطح اهمیت آن کم باشد ، قرار گرفتن معیار در محدوده بحرانی تنها یک رویداد بعید ، اما کاملاً غیرممکن است. بنابراین ، ممکن است در صورت صحیح بودن فرضیه صفر ، ارزش معیار محاسبه شده از داده های نمونه با این وجود در منطقه بحرانی باشد. رد فرضیه در این مورد ح 0 ، ما با احتمال اولین خطا را مرتکب می شویم. هرچه کوچکتر ، احتمال خطای نوع I کمتر است. با این حال ، با کاهش ، ناحیه بحرانی کاهش می یابد ، به این معنی که امکان مشاهده مقدار مشاهده شده در آن کمتر می شود. به obs ، حتی وقتی فرضیه ح 0 غلط است. برای = 0 فرضیه ح 0 صرف نظر از نتایج نمونه ، همیشه پذیرفته می شود. بنابراین ، کاهش مستلزم افزایش احتمال پذیرش یک فرضیه صحیح نادرست است ، یعنی اشتباه در نوع دوم. از این نظر ، خطاهای نوع اول و دوم در حال رقابت هستند.

از آنجا که حذف خطاهای نوع اول و دوم غیرممکن است ، حداقل باید در هر مورد خاص تلاش کرد تا تلفات ناشی از این خطاها به حداقل برسد. البته ، کاهش هر دو خطا به طور همزمان مطلوب است ، اما از آنجا که آنها در حال رقابت هستند ، کاهش احتمال پذیرش یکی از آنها مستلزم افزایش احتمال پذیرش دیگری است. تنها راههمزمان نزول کردنخطر خطاها نهفته است افزایش حجم نمونه.

بسته به نوع فرضیه رقابت ح 1 ساختن مناطق بحرانی یک طرفه (راست و چپ) و دو طرفه.نقاط جدا کننده منطقه بحرانی
از حوزه پذیرش فرضیه نامیده می شوند نقاط بحرانیو نشان می دهد ککرت برای یافتن منطقه بحرانیشما باید نقاط بحرانی را بدانید.

سمت راستناحیه بحرانی را می توان با نابرابری توصیف کرد
به>ککرت pr ، جایی که فرض بر این است که نقطه بحرانی مناسب است ککرت pr> 0 چنین منطقه ای شامل نقاطی است که در سمت راست نقطه بحرانی واقع شده اند. ککرت pr ، یعنی شامل بسیاری از ارزشهای مثبت و به اندازه کافی بزرگ معیار است به.برای پیدا کردن ککرت pr ابتدا سطح اهمیت معیار را تعیین می کند. بعد ، نقطه بحرانی مناسب ککرت pr از شرط پیدا کنید چرا دقیقاً این نیاز ، منطقه بحرانی سمت راست را مشخص می کند؟ از آنجا که احتمال یک رویداد (به>ککرت و غیره ) کوچک است ، بنابراین ، به دلیل اصل عدم امکان عملی رویدادهای غیرمحتمل ، این رویداد ، اگر فرضیه صفر در یک آزمون واحد صادق باشد ، نباید رخ دهد. اگر ، با این وجود ، آمده است ، یعنی مقدار مشاهده شده معیار محاسبه شده از داده های نمونه
بیشتر معلوم شد ککرت pr ، پس این را می توان با این واقعیت توضیح داد که فرضیه صفر با داده های مشاهده موافق نیست و بنابراین باید رد شود. بنابراین الزام
چنین معیارهایی را تعیین می کند که در آن فرضیه صفر رد می شود و آنها منطقه بحرانی سمت راست را تشکیل می دهند.

اگر
در محدوده مقادیر قابل قبول معیار قرار گرفت ، یعنی
< ککرت pr ، پس فرضیه اصلی رد نمی شود ، زیرا با داده های مشاهده سازگار است. توجه داشته باشید که احتمال ضربه زدن به معیار
در محدوده مقادیر قابل قبول اگر فرضیه صفر معتبر باشد ، برابر (1-) و نزدیک به 1 است.

باید به خاطر داشت که ضربه ارزشهای معیار
در محدوده مقادیر قابل قبول اثبات دقیق اعتبار فرضیه صفر نیست. این فقط نشان می دهد که بین فرضیه ارائه شده و نتایج نمونه اختلاف معناداری وجود ندارد. بنابراین ، در چنین مواردی گفته می شود که داده های مشاهده ای با فرضیه صفر موافق است و دلیلی برای رد آن وجود ندارد.

ساخت مناطق حساس دیگر نیز به روشی مشابه انجام می شود.

بنابراین، لطرف یورومنطقه بحرانی با نابرابری توصیف می شود
به<ککرت l کجا ک crit.l<0. Такая область состоит из точек, находящихся по левую сторону от левой критической точки ک crit.l ، یعنی مجموعه ای از مقادیر منفی ، اما به اندازه کافی بزرگ از معیار است. نقطه بحرانی ک crit.l از حالت یافت می شود
(به<ککرت ل)
، یعنی احتمال اینکه معیار مقداری کمتر از کدر صورتی که فرضیه صفر صحیح باشد ، krit.l برابر با سطح اهمیت پذیرفته شده است.

دو طرفهمنطقه بحرانی
با نابرابری های زیر توصیف می شود: ( به< ک crit.l یا به>ککرت pr) ، جایی که فرض بر این است که ک crit.l<0 и ککرت pr> 0 چنین منطقه ای مجموعه ای از مقادیر معیار است که از نظر مقدار مطلق به اندازه کافی بزرگ هستند. نکات مهم از الزامات بدست می آید: مجموع احتمالاتی که معیار ارزش کمتری از آن خواهد داشت ککرت l یا بیشتر ککرت pr ، اگر فرضیه صفر معتبر باشد ، باید معادل سطح پذیرفته شده از اهمیت باشد ، یعنی

(به< ککرت ل )+
(به>ککرت و غیره )= .

اگر توزیع معیار بهبنابراین ، به طور متقارن در مورد مبدا ، نقاط بحرانی به طور متقارن در حدود صفر قرار خواهند گرفت ککرت l = - ککرت pr. سپس منطقه بحرانی دو طرفه متقارن می شود و می توان آن را با نابرابری زیر توصیف کرد: > ککرت دی وی کجا ککرت dv = ککرت pr نکته بحرانی ککرت dv را می توان از حالت پیدا کرد

P (K< -ککرت dv ) = P (K>ککرت dv )= .

تذکر 1.برای هر معیار بهنقاط بحرانی در سطح معینی از اهمیت
را می توان از حالت پیدا کرد
فقط به صورت عددی نتایج عددی ک crit در جداول مربوطه آورده شده است (به عنوان مثال ، ضمائم 4 - 6 در پرونده "پیوست ها" را ببینید).

تذکر 2.اصل آزمایش یک فرضیه آماری که در بالا توضیح داده شد هنوز صحت یا عدم صحت آن را اثبات نمی کند. پذیرش فرضیه ح 0 مقایسه شده با فرضیه جایگزین ح 1 به این معنا نیست که ما از صحت مطلق فرضیه اطمینان داریم ح 0 - فقط یک فرضیه ح 0 با داده های مشاهده ای ما مطابقت دارد ، یعنی یک عبارت نسبتاً قابل قبول است که با تجربه منافات ندارد. ممکن است با افزایش حجم نمونه nفرضیه ح 0 رد می شود

هیپوتزهای آماری

داده های نمونه به دست آمده در آزمایش ها همیشه محدود هستند و ماهیت آنها تا حد زیادی تصادفی است. به همین دلیل است که از آمار ریاضی برای تجزیه و تحلیل چنین داده هایی استفاده می شود ، که این امر امکان تعمیم الگوهای بدست آمده در نمونه و گسترش آنها به کل جمعیت عمومی را ممکن می سازد.

داده های به دست آمده در نتیجه آزمایش بر روی هر نمونه به عنوان پایه ای برای قضاوت در مورد جمعیت عمومی عمل می کند. با این حال ، به دلیل دلایل احتمالی تصادفی ، برآورد پارامترهای جمعیت عمومی ، که بر اساس داده های تجربی (نمونه) انجام می شود ، همیشه با خطا همراه خواهد بود ، بنابراین چنین برآورد هایی باید به عنوان حدسیات در نظر گرفته شوند ، و نه به عنوان اظهارات نهایی چنین مفروضاتی در مورد خواص و پارامترهای جمعیت عمومی نامیده می شود فرضیه های آماری . به گفته G.V. سوخدولسکی: "یک فرضیه آماری معمولاً به عنوان یک فرض رسمی درک می شود که شباهت (یا تفاوت) برخی از ویژگی های پارامتری یا عملکردی تصادفی یا برعکس ، تصادفی نیست."

ماهیت آزمایش یک فرضیه آماری این است که آیا داده های تجربی و فرضیه ارائه شده با یکدیگر موافق هستند یا خیر ، آیا می توان اختلاف بین فرضیه و نتیجه تجزیه و تحلیل آماری داده های تجربی را به دلایل تصادفی نسبت داد. بنابراین ، یک فرضیه آماری یک فرضیه علمی است که امکان آزمایش آماری را می دهد و آمار ریاضی یک رشته علمی است که وظیفه آن آزمایش علمی فرضیه های آماری است.

فرضیه های آماری به صفر و جایگزین ، جهت دار و غیرمستقیم طبقه بندی می شوند.

فرضیه صفر(H 0) آیا این فرضیه است که هیچ تفاوتی وجود ندارد. اگر می خواهیم اهمیت تفاوت ها را اثبات کنیم ، پس فرضیه صفر مورد نیاز است رد کردن، در غیر این صورت مورد نیاز است تایید.

فرضیه جایگزین (H 1) یک فرضیه در مورد اهمیت تفاوت ها است. این چیزی است که ما می خواهیم ثابت کنیم ، به همین دلیل است که گاهی اوقات نامیده می شود تجربی فرضیه.

وقتی می خواهیم عادلانه را ثابت کنیم ، وظایفی وجود دارد بی اهمیتیتفاوتها ، یعنی تأیید فرضیه صفر. به عنوان مثال ، اگر ما باید اطمینان حاصل کنیم که افراد مختلف دریافت می کنند ، هرچند متفاوت ، اما از نظر دشواری متعادل هستند ، یا اینکه نمونه های آزمایشی و کنترل از نظر برخی ویژگی های قابل توجه تفاوت ندارند. با این حال ، اغلب ما هنوز نیاز به اثبات داریم اهمیت تفاوتها ،زیرا آنها در جستجوی چیز جدیدی برای ما آموزنده تر هستند.

فرضیه های تهی و جایگزین می توانند جهت دار و غیر جهت دار باشند.

فرضیه های جهت دار -اگر فرض شود که مقادیر مشخصه در یک گروه بیشتر و در گروه دیگر کمتر است:

H 0: X 1تجاوز نمی کند X 2,

H 1: X 1فراتر می رود X 2.

فرضیه های غیرمستقیم -اگر فرض بر این باشد که اشکال توزیع یک ویژگی در گروه ها متفاوت است:

H 0: X 1تفاوتی با X 2,

H 1: X 1متفاوت است X 2.

اگر متوجه شدیم که در یکی از گروه ها ، ارزش فردی افراد برای برخی معیارها ، به عنوان مثال ، برای فعالیت های اجتماعی ، بیشتر است ، و در گروه دیگر پایین تر ، برای آزمایش اهمیت این تفاوت ها ، به برای تدوین فرضیه های جهت دار

اگر بخواهیم آن را به صورت گروهی ثابت کنیم ولیتحت تأثیر برخی از تأثیرات تجربی ، تغییرات بارزتری نسبت به گروه رخ داد ب، سپس ما باید فرضیه های جهت دار را نیز تدوین کنیم.

اگر بخواهیم ثابت کنیم که اشکال توزیع صفت در گروه ها متفاوت است ولیو ب، سپس فرضیه های بی جهت تدوین می شود.

آزمون فرضیه با استفاده از معیارهایی برای ارزیابی آماری تفاوت ها انجام می شود.

نتیجه گیری پذیرفته شده تصمیم آماری نامیده می شود. بگذارید تأکید کنیم که چنین راه حلی همیشه احتمالی است. هنگام آزمایش فرضیه ، داده های تجربی ممکن است با فرضیه مغایرت داشته باشند H 0 ،سپس این فرضیه رد می شود. در غیر این صورت ، یعنی اگر داده های تجربی با فرضیه موافق باشند H 0، منحرف نمی شود. اغلب در چنین مواردی گفته می شود که فرضیه H 0پذیرفته می شود این نشان می دهد که آزمون آماری فرضیه ها بر اساس داده های نمونه آزمایشی به طور اجتناب ناپذیری با خطر (احتمال) تصمیم گیری غلط همراه است. در این مورد ، خطاهای دو نوع ممکن است. هنگامی که تصمیمی برای رد یک فرضیه گرفته شود ، خطایی از نوع اول رخ می دهد. H 0 ،اگرچه در واقعیت معلوم می شود که درست است. خطایی از نوع دوم زمانی رخ می دهد که تصمیمی مبنی بر رد فرضیه گرفته شود. H 0، اگرچه در واقعیت نادرست خواهد بود. بدیهی است که نتیجه گیری صحیح نیز در دو مورد قابل پذیرش است. جدول 7.1 موارد فوق را خلاصه می کند.

جدول 7.1

ممکن است روانشناس در تصمیم آماری خود اشتباه کند. همانطور که در جدول 7.1 مشاهده می کنیم ، این خطاها فقط می توانند دو نوع باشند. از آنجا که حذف خطاها هنگام پذیرش فرضیه های آماری غیرممکن است ، لازم است پیامدهای احتمالی ، به عنوان مثال ، به حداقل برسد. پذیرش یک فرضیه آماری نادرست در بیشتر موارد ، تنها راه برای به حداقل رساندن خطاها ، افزایش حجم نمونه است.

معیارهای آماری

معیار آماری- این یک قانون تصمیم گیری است که رفتار قابل اعتماد را تضمین می کند ، یعنی پذیرش یک فرضیه واقعی و رد یک فرضیه غلط با احتمال زیاد.

معیارهای آماری نیز به روش محاسبه یک عدد معین و خود عدد اشاره دارد.

وقتی می گوییم قابلیت اطمینان تفاوت ها با معیار تعیین شد j *(معیار تبدیل زاویه ای فیشر است) ، سپس منظور ما این است که از این روش استفاده کرده ایم j *برای محاسبه یک عدد خاص

با نسبت مقادیر تجربی و انتقادی معیار می توان قضاوت کرد که آیا فرضیه صفر تایید یا رد می شود.

در بیشتر موارد ، برای این که تفاوت ها را به عنوان اهمیت تشخیص دهیم ، لازم است که ارزش تجربی معیار از حد حیاتی فراتر رود ، اگرچه معیارهایی (برای مثال ، معیار من ویتنی یا معیار نشانه) وجود دارد که در آنها باید به قانون مخالف پایبند باشید

در برخی موارد ، فرمول محاسبه معیار شامل تعداد مشاهدات در نمونه مورد مطالعه ، نشان داده شده به عنوان n... در این مورد ، ارزش تجربی معیار در عین حال آزمایشی برای آزمون فرضیه های آماری است. با استفاده از یک جدول خاص ، ما تعیین می کنیم که میزان تجربی مشخص شده به چه میزان از اهمیت آماری تفاوت ها مربوط می شود. نمونه ای از چنین معیاری ملاک است j *بر اساس تبدیل زاویه ای فیشر محاسبه می شود.

با این حال ، در بیشتر موارد ، بسته به تعداد مشاهدات در نمونه مورد مطالعه ، ارزش تجربی یک معیار ممکن است مهم یا ناچیز باشد ( n) یا به اصطلاح تعداد درجه آزادی ، که به عنوان نشان داده شده است vیا چگونه df

تعداد درجات آزادی vبرابر با تعداد کلاسهای سری تنوع منهای تعداد شرایطی است که تحت آن شکل گرفته است. این شرایط شامل اندازه نمونه ( n) ، معنی و واریانس

فرض کنید یک گروه 50 نفره بر اساس اصل به سه کلاس تقسیم شدند:

نحوه کار با رایانه را می داند ؛

می داند که چگونه تنها عملیات خاصی را انجام دهد.

نمی توان روی رایانه کار کرد.

گروه اول و دوم 20 نفر ، گروه سوم 10 نفر بودند.

ما با یک شرط محدود می شویم - حجم نمونه. بنابراین ، حتی اگر اطلاعاتی در مورد تعداد زیادی از افرادی که نحوه کار با رایانه را نمی دانیم از دست داده باشیم ، می توانیم این را تعیین کنیم ، زیرا می دانیم که در کلاس های اول و دوم هر کدام 20 درس دارد. ما در تعیین تعداد موضوعات در دسته سوم آزاد نیستیم ، "آزادی" فقط به دو سلول اول طبقه بندی تعمیم می یابد:

از آنجا که آمار به عنوان یک روش تحقیق با داده هایی سروکار دارد که در آنها الگوهای مورد علاقه محقق توسط عوامل تصادفی مختلف تحریف می شود ، اکثر محاسبات آماری با آزمایش برخی فرض ها یا فرضیه ها در مورد منبع این داده ها همراه است.

فرضیه آموزشی (فرضیه علمینه در مورد مزیت یک روش یا روش دیگر) در فرایند تجزیه و تحلیل آماری به زبان علم آمار ترجمه می شود و حداقل در قالب دو فرضیه آماری دوباره فرموله می شود.

دو نوع فرضیه ممکن است: نوع اول این است توصیفی فرضیه هایی که علل و پیامدهای احتمالی را توصیف می کند. نوع دوم است توضیح دهنده : آنها پیامدهای احتمالی علل خاصی را توضیح می دهند ، و همچنین شرایطی را که تحت آن این پیامدها لزوماً به دنبال خواهند داشت ، توصیف می کنند ، یعنی آنها بر اساس عوامل و شرایطی که اثر معین خواهد داشت توضیح می دهند. فرضیه های توصیفی فاقد آینده نگری هستند ، اما فرضیه های توضیحی اینطور نیست. فرضیه های توضیحی محققان را به فرضیه هایی در مورد وجود برخی روابط منظم بین پدیده ها ، عوامل و شرایط سوق می دهد.

فرضیه های موجود در تحقیقات آموزشی ممکن است نشان دهد که یکی از ابزارها (یا گروهی از آنها) نسبت به سایر ابزارها مثرتر خواهد بود. در اینجا ، به طور فرضی ، فرضیه ای در مورد اثربخشی مقایسه ای وسایل ، روش ها ، روش ها ، اشکال آموزش وجود دارد.

سطح بالاتری از پیش بینی فرضی این است که نویسنده مطالعه این فرضیه را مطرح می کند که برخی از سیستم های اندازه گیری نه تنها از دیگری بهتر خواهد بود ، بلکه از نظر تعدادی از سیستم های ممکن نیز از نظر معیارهای معینی مطلوب به نظر می رسد. چنین فرضیه ای نیاز به اثبات دقیق تری دارد.

A.P. Kulaichev روش ها و ابزارهای تجزیه و تحلیل داده ها در محیط ویندوز اد سوم ، rev. و اضافه کنید - M: InKo ، 1999 ، صص 129-131

فرهنگ لغت روانشناختی و آموزشی برای معلمان و سرپرستان موسسات آموزشی. - روستوف-ن / د: ققنوس ، 1998 ، ص 92

بر اساس داده های جمع آوری شده در مطالعات آماری ، پس از پردازش آنها ، درباره پدیده های مورد مطالعه نتیجه گیری می شود. این نتیجه گیری با ارائه فرضیه های آماری و آزمایش آنها انجام می شود.

فرضیه آماریهر گزاره ای در مورد شکل یا خواص توزیع متغیرهای تصادفی مشاهده شده تجربی نامیده می شود. فرضیه های آماری با روش های آماری مورد آزمایش قرار می گیرد.

فرضیه مورد آزمایش نامیده می شود اصلی (صفر)و نشان داد ح 0 علاوه بر صفر ، همچنین وجود دارد فرضیه جایگزین (رقابت) H 1 ، نفی اصلی . بنابراین ، در نتیجه آزمایش ، یک و تنها یکی از فرضیه ها پذیرفته می شود. , و دومی رد می شود

انواع خطاها... فرضیه ارائه شده بر اساس مطالعه نمونه ای که از جامعه عمومی به دست آمده است ، آزمایش می شود. با توجه به تصادفی بودن نمونه ، اعتبار سنجی همیشه به نتیجه گیری صحیح منجر نمی شود. در این حالت ، شرایط زیر ممکن است ایجاد شود:
1. فرضیه اصلی صحیح و پذیرفته شده است.
2. فرضیه اصلی صحیح است ، اما رد می شود.
3. فرضیه اصلی نادرست است و رد می شود.
4- فرضیه اصلی صحیح نیست ، اما پذیرفته شده است.
در مورد 2 ، یکی صحبت می کند خطای نوع اول، در مورد دوم که ما در مورد آن صحبت می کنیم خطای نوع دوم.
بنابراین ، برای برخی از نمونه ها ، تصمیم درست و برای برخی دیگر ، تصمیم اشتباه گرفته می شود. این تصمیم با توجه به مقدار تابع نمونه گیری ، به نام ویژگی های آماری, معیار آمارییا به سادگی آمار... مجموعه مقادیر این آمار را می توان به دو زیر مجموعه جداگانه تقسیم کرد:

ح 0 پذیرفته می شود (رد نمی شود) ، فراخوانی می شود منطقه پذیرش فرضیه (منطقه امکان پذیر);
زیرمجموعه ای از مقادیر آماری که برای آن فرضیه است ح 0 رد می شود (رد می شود) و فرضیه پذیرفته می شود ح 1 نامیده می شود منطقه بحرانی

نتیجه گیری:

معیاریک متغیر تصادفی K است که به شما اجازه می دهد فرضیه صفر H0 را قبول یا رد کنید.
هنگام آزمایش فرضیه ها ، می توان خطاهای 2 جنس را ایجاد کرد.
خطای نوع اولاین است که فرضیه رد می شود ح 0 در صورت صحیح ("رد کردن هدف"). احتمال اشتباه از نوع اول با α نشان داده می شود و نامیده می شود سطح اهمیت... اغلب در عمل فرض بر این است که α = 0.05 یا α = 0.01.
خطای نوع دوماین است که فرضیه H0 در صورت نادرست بودن ("مثبت کاذب") پذیرفته می شود. احتمال چنین خطایی با β نشان داده می شود.

طبقه بندی فرضیه ها

فرضیه اصلی ح 0 در مورد مقدار پارامتر ناشناخته q توزیع معمولاً به این شکل است:
H 0: q = q 0.
فرضیه رقابت حبنابراین 1 می تواند شکل زیر را داشته باشد:
ح 1: س < س 0 , ح 1: q> س 0 یا ح 1: س ≠ س 0 .
بر این اساس ، معلوم می شود سمت چپ ، راستیا دو طرفهمناطق بحرانی نقاط مرزی مناطق بحرانی ( نقاط بحرانی) از جداول توزیع آمار مربوطه تعیین می شود.

هنگام آزمایش یک فرضیه ، احتیاط این است که احتمال تصمیم گیری های اشتباه را کاهش دهیم. تحمل خطای نوع Iمعمولاً نشان داده می شود آو تماس گرفت سطح اهمیت... مقدار آن معمولاً کوچک است ( 0,1, 0,05, 0,01, 0,001 ...). اما کاهش احتمال خطای نوع I منجر به افزایش احتمال خطای نوع II می شود ( ب) ، یعنی تمایل به پذیرش فقط فرضیه های صحیح باعث افزایش تعداد فرضیه های صحیح رد شده می شود. بنابراین ، انتخاب سطح اهمیت با اهمیت مسئله ایجاد شده و شدت پیامدهای تصمیم نادرست تعیین می شود.
آزمون فرضیه های آماری شامل مراحل زیر است:
1) تعریف فرضیه ها ح 0 و ح 1 ;
2) انتخاب آمار و تعیین سطح اهمیت ؛
3) تعیین نقاط بحرانی K crو منطقه بحرانی ؛
4) محاسبه مقدار آماری از نمونه به سابق;
5) مقایسه مقدار آماری با منطقه بحرانی ( K crو به سابق);
6) تصمیم گیری: اگر ارزش آمار در حوزه بحرانی گنجانده نشده باشد ، فرضیه پذیرفته می شود ح 0 و فرضیه رد می شود ح 1 ، و اگر وارد منطقه بحرانی شود ، فرضیه رد می شود ح 0 و فرضیه پذیرفته می شود حیکی در عین حال ، نتایج آزمایش فرضیه آماری باید به شرح زیر تفسیر شود: اگر فرضیه پذیرفته شود ح 1 , سپس می توان آن را اثبات شده تلقی کرد و اگر فرضیه پذیرفته شود ح 0 , سپس تشخیص داده شد که با نتایج مشاهدات منافات ندارد. با این حال ، این ویژگی ، همراه با ح 0 ممکن است فرضیه های دیگری نیز داشته باشد.

طبقه بندی آزمونهای فرضیه

در زیر چندین فرضیه آماری مختلف و مکانیزم های آزمایش آنها را در نظر خواهیم گرفت.
من) فرضیه در مورد میانگین کلی توزیع نرمال با واریانس نامعلوم. ما فرض می کنیم که جمعیت عمومی دارای توزیع نرمال است ، میانگین و واریانس آن ناشناخته است ، اما دلایلی وجود دارد که معتقد باشیم میانگین عمومی برابر با a است. در سطح معنی داری α ، فرضیه باید آزمایش شود ح 0: x = a به عنوان جایگزین ، یکی از سه فرضیه ای که در بالا مورد بحث قرار گرفت ، می تواند مورد استفاده قرار گیرد. در این مورد ، آمار یک متغیر تصادفی است که دارای توزیع دانشجویی با n- 1 درجه آزادی مقدار تجربی مربوطه (مشاهده شده) تعیین می شود t سابق t cr ح 1: x> a با توجه به سطح اهمیت α و تعداد درجه آزادی یافت می شود n- 1. اگر t سابق < t cr ح 1: x ≠ a ، مقدار بحرانی با توجه به سطح معنی داری α / 2 و همین تعداد درجه آزادی یافت می شود. اگر | | فرضیه صفر پذیرفته شود t ex | II) فرضیه برابری دو مقدار متوسط از جمعیتهای عمومی به طور تصادفی توزیع شده (نمونه های مستقل بزرگ). در سطح معنی داری α ، فرضیه باید آزمایش شود ح 0: x ≠ y اگر اندازه هر دو نمونه بزرگ باشد ، می توان فرض کرد که میانگین نمونه دارای توزیع نرمال است و واریانس آنها مشخص است. در این حالت می توان از یک متغیر تصادفی به عنوان آمار استفاده کرد

,
داشتن توزیع عادی و م(Z) = 0, د(Z) = 1. مقدار تجربی مربوطه تعیین می شود z سابق... مقدار بحرانی از جدول تابع Laplace یافت می شود z cr... تحت یک فرضیه جایگزین ح 1: x> y از حالت یافت می شود اف(z cr) = 0,5 – آ... اگر z سابق< z кр ، سپس فرضیه صفر پذیرفته می شود ، در غیر این صورت رد می شود. تحت یک فرضیه جایگزین ح 1: x ≠ y مقدار بحرانی از شرط یافت می شود اف(z cr) = 0.5 × (1 - آ) اگر | | فرضیه صفر پذیرفته شود z ex |< z кр .

III) فرضیه برابری دو مقدار متوسط از جمعیتهای عادی توزیع شده معمولی ، که واریانس آنها ناشناخته و یکسان است (نمونه های مستقل کوچک). در سطح معنی داری α ، فرضیه اصلی باید آزمایش شود ح 0: x = y به عنوان آمار ، ما از یک متغیر تصادفی استفاده می کنیم
,
داشتن توزیع دانشجویی با ( n x + n در- 2) درجات آزادی. مقدار تجربی مربوطه تعیین می شود t سابق... از جدول نقاط بحرانی توزیع دانشجو ، مقدار بحرانی یافت می شود t cr... همه چیز شبیه فرضیه (I) حل شده است.

IV) حدس و گمان در مورد برابری دو واریانس جمعیتهای عادی توزیع شده عادی... در این مورد ، در سطح اهمیت آنیاز به آزمایش فرضیه ح 0: د(NS) = د(Y) آمار یک متغیر تصادفی است که دارای توزیع فیشر - اسندکور با است f 1 = n ب- 1 و f 2 = n متر- 1 درجه آزادی (S 2 b - واریانس بزرگ ، حجم نمونه آن n ب) مقدار تجربی مربوطه (مشاهده شده) تعیین می شود اف سابق... ارزش بحرانی F crتحت یک فرضیه جایگزین ح 1: د(NS) > د(Y) از جدول نقاط حساس توزیع فیشر - Snedecor بر اساس سطح اهمیت یافت می شود آو تعداد درجات آزادی f 1 و f 2 اگر فرضیه صفر پذیرفته شود اف سابق < F cr.

دستورالعمل برای محاسبه ، باید ابعاد داده منبع را مشخص کنید.

V) فرضیه برابری چندین واریانس از جمعیتهای عادی معمولاً توزیع شده بر روی نمونه های هم اندازه. در این مورد ، در سطح اهمیت آنیاز به آزمایش فرضیه ح 0: د(NS 1) = د(NS 2) = …= د(X l) آمار یک متغیر تصادفی است با توزیع کوچرن با درجه آزادی f = n- 1 و ل (n -اندازه هر نمونه ، لآیا تعداد نمونه). این فرضیه همانند فرضیه قبلی مورد آزمایش قرار گرفته است. از جدول نقاط بحرانی توزیع کاکرن استفاده شده است.

Vi) فرضیه در مورد اهمیت همبستگی.در این مورد ، در سطح اهمیت آنیاز به آزمایش فرضیه ح 0: r= 0. (اگر ضریب همبستگی صفر باشد ، مقادیر مربوطه به یکدیگر مربوط نمی شوند). آمار در این مورد یک متغیر تصادفی است
,
داشتن توزیع دانشجویی با f = n- 2 درجه آزادی این فرضیه همانند فرضیه (I) آزمایش می شود.

دستورالعمل مقدار داده های منبع را مشخص کنید.

Vii) فرضیه ای در مورد اهمیت احتمال وقوع یک رویداد.تعداد نسبتاً زیادی از nمحاکمات مستقل که در آن رویداد ولیاتفاق افتاد متریک بار. دلایلی وجود دارد که بر این باور باشیم که احتمال وقوع این رویداد در یک آزمون وجود دارد ص 0... در سطح اهمیت مورد نیاز است آفرضیه احتمال وقوع یک رویداد را آزمایش کنید ولیبرابر با احتمال فرضی است ص 0... (از آنجا که احتمال با فرکانس نسبی برآورد می شود ، فرضیه مورد آزمایش را می توان به روش دیگری تدوین کرد: آیا فرکانس نسبی مشاهده شده و احتمال فرضی تفاوت قابل توجهی دارد یا نه).
تعداد آزمایشات به اندازه کافی زیاد است ، بنابراین فراوانی نسبی رویداد ولیطبق قانون عادی توزیع می شود. اگر فرضیه صفر درست باشد ، انتظار ریاضی آن درست است ص 0، و واریانس مطابق با این ، به عنوان یک آمار ، ما یک متغیر تصادفی را انتخاب می کنیم
,
که تقریباً طبق قانون عادی با انتظار ریاضی صفر و واریانس واحد توزیع می شود. این فرضیه دقیقاً همانند مورد (I) مورد آزمایش قرار گرفته است.

دستورالعمل برای محاسبه ، باید داده های اولیه را پر کنید.

آمار یک علم پیچیده برای اندازه گیری و تجزیه و تحلیل داده های مختلف است. مانند بسیاری از رشته های دیگر ، مفهومی از فرضیه در این صنعت وجود دارد. بنابراین ، یک فرضیه در آمار عبارت است از هر موقعیتی که باید پذیرفته یا رد شود. علاوه بر این ، در این صنعت چندین نوع فرض وجود دارد که از نظر تعریف مشابه هستند ، اما در عمل متفاوت هستند. فرضیه صفر موضوع مطالعه امروز ما است.

از عمومی به اختصاصی: فرضیه در آمار

یکی دیگر ، نه چندان مهم ، از تعریف اساسی مفروضات فاصله می گیرد - یک فرضیه آماری مطالعه مجموعه ای کلی از اشیاء مهم برای علم است که دانشمندان درباره آنها نتیجه گیری می کنند. می توان آن را با استفاده از نمونه (بخشی از جمعیت) بررسی کرد. در اینجا چند نمونه از فرضیه های آماری آمده است:

1. عملکرد کلی نمرات ممکن است به سطح تحصیلات هر دانش آموز بستگی داشته باشد.

2- دوره ابتدایی ریاضیات هم توسط بچه هایی که در سن 6 سالگی به مدرسه آمده بودند و هم برای کودکانی که در 7 سالگی آموخته بودند ، یکسان است.

یک فرضیه ساده در آمار چنین فرضی است که بدون ابهام پارامتر خاصی از مقداری را که یک دانشمند گرفته است مشخص می کند.

یک پیچیده شامل چندین یا بی نهایت ساده است. آیا منطقه خاصی مشخص شده است یا پاسخ دقیقی وجود ندارد.

درک چندین تعریف از فرضیه ها در آمار مفید است تا آنها را در عمل اشتباه نگیریم.

مفهوم فرضیه صفر

فرضیه صفر یک نظریه است که می گوید دو مجموعه وجود دارد که هیچ تفاوتی با یکدیگر ندارند. با این حال ، در سطح علمی ، هیچ مفهومی وجود ندارد "تفاوت نکنید" ، اما "شباهت آنها برابر با صفر" است. از این تعریف ، مفهوم شکل گرفت. در آمار ، فرضیه صفر به عنوان H0 نشان داده شده است. علاوه بر این ، مقدار شدید غیر ممکن (بعید) از 0.01 تا 0.05 یا کمتر در نظر گرفته می شود.

بهتر است درک کنید که فرضیه صفر چیست ، یک مثال از زندگی کمک می کند. معلم دانشگاه پیشنهاد کرد که سطح مختلف آمادگی دانش آموزان دو گروه برای کار آزمایشی ناشی از پارامترهای ناچیز است ، دلایل تصادفی که بر سطح عمومی تحصیلات تأثیر نمی گذارد (تفاوت در آماده سازی دو گروه دانش آموزان صفر است)

با این حال ، برعکس ، ارزش دارد یک مثال از یک فرضیه جایگزین ارائه شود - فرضی که ادعای نظریه صفر را رد می کند (H1). به عنوان مثال: مدیر دانشگاه پیشنهاد کرد که سطح مختلف آمادگی برای انجام آزمون در بین دانش آموزان دو گروه ناشی از استفاده از روش های مختلف تدریس توسط معلمان بوده است (تفاوت در آماده سازی دو گروه قابل توجه است و توضیحی برای آن وجود دارد).

اکنون می توانید بلافاصله تفاوت بین مفاهیم "فرضیه صفر" و "فرضیه جایگزین" را مشاهده کنید. مثالها این مفاهیم را نشان می دهند.

آزمایش فرضیه صفر

حدس زدن نیمی از مشکل است. آزمایش فرضیه صفر یک چالش واقعی برای مبتدیان محسوب می شود. اینجاست که مشکلات در انتظار بسیاری است.

با استفاده از روش فرضیه جایگزین ، که چیزی خلاف نظریه صفر را تأیید می کند ، می توانید هر دو گزینه را با هم مقایسه کرده و یکی را درست انتخاب کنید. آمار به این شکل عمل می کند.

فرضیه صفر H0 و فرضیه جایگزین H1 باشد ، سپس:

Н0: c = c0؛
Н1: c ≠ c0.

در اینجا c مقدار متوسط معینی از جمعیت عمومی است که باید یافت شود و c0 مقدار اولیه ای است که فرضیه در برابر آن آزمایش شده است. همچنین یک عدد X وجود دارد - مقدار متوسط نمونه ، که برای تعیین c0 استفاده می شود.

بنابراین ، بررسی شامل مقایسه X و c0 است ، اگر X = c0 باشد ، فرضیه صفر پذیرفته می شود. اگر X ≠ c0 ، پس با فرضیه جایگزین معتبر در نظر گرفته می شود.

روش تأیید "معتمد"

قوی ترین روشی وجود دارد که به کمک آن فرضیه آماری خالی به راحتی در عمل آزمایش می شود. این شامل ترسیم طیف وسیعی از مقادیر تا 95 درصد دقت است.

ابتدا باید فرمول محاسبه فاصله اطمینان را بدانید:
X - t * Sx ≤ c ≤ X + t * Sx ،

جایی که X بر اساس فرضیه جایگزین عددی است که در ابتدا داده شده است.
t - مقادیر جدول (ضریب دانش آموز) ؛
Sx خطای میانگین استاندارد است که به صورت Sx = σ / √n محاسبه می شود ، جایی که عدد انحراف استاندارد و مخرج اندازه نمونه است.

بنابراین بیایید یک موقعیت را فرض کنیم. قبل از تعمیر ، نوار نقاله روزانه 32.1 کیلوگرم محصول نهایی را تولید می کرد و پس از تعمیر ، به گفته کارآفرین ، کارایی افزایش می یابد و نوار نقاله ، طبق یک بررسی هفتگی ، به طور متوسط 39.6 کیلوگرم تولید می کند.

فرضیه صفر بیان می کند که تعمیر به هیچ وجه بر بازده نقاله تأثیر نگذاشته است. یک فرضیه جایگزین می گوید تعمیر کارایی نوار نقاله را به شدت تغییر می دهد ، بنابراین بهره وری آن افزایش می یابد.

با توجه به جدول ، n = 7 ، t = 2.447 را می یابیم ، که از آن فرمول فرم زیر را خواهد گرفت:

39.6 - 2.447 * 4.2 ≤ s ≤ 39.6 + 2.447 * 4.2 ؛

29.3 اینچ ≤ 49.9 پوند

به نظر می رسد که مقدار 32.1 در محدوده گنجانده شده است ، و بنابراین مقدار پیشنهادی جایگزین - 39.6 - به طور خودکار پذیرفته نمی شود. به یاد داشته باشید که فرضیه صفر ابتدا برای صحت مورد آزمایش قرار می گیرد ، و سپس برعکس.

انواع انکار

قبل از آن ، چنین نوع ساختن یک فرضیه در نظر گرفته شده بود ، جایی که H0 چیزی را تأیید می کند ، و H1 آن را رد می کند. از کجا می توان چنین سیستمی را تدوین کرد:

H0: c = c0 ؛
Н1: с ≠ с0.

اما دو روش مرتبط دیگر برای رد وجود دارد. به عنوان مثال ، فرضیه صفر بیان می کند که میانگین نمره یک کلاس بیشتر از 4.54 است ، در حالی که فرضیه جایگزین می گوید که میانگین نمره برای همان کلاس کمتر از 4.54 است. و شبیه یک سیستم شبیه به این خواهد بود:

Н0: s ⩾ 4.54 ؛
H1: s< 4.54.

توجه داشته باشید که فرضیه صفر بیان می کند که مقدار بزرگتر یا مساوی با آن است ، و فرضیه آماری مبنی بر اینکه بسیار کمتر است. شدت علامت نابرابری اهمیت زیادی دارد!

بررسی آماری

آزمون آماری فرضیه های صفر شامل استفاده از یک آزمون آماری است. چنین معیارهایی تابع قوانین مختلف توزیع است.

به عنوان مثال ، یک آزمون F وجود دارد که با استفاده از توزیع فیشر محاسبه می شود. یک آزمون T وجود دارد که اغلب در عمل مورد استفاده قرار می گیرد و به توزیع دانش آموز بستگی دارد. تست خوب مربع پیرسون و غیره

منطقه پذیرش فرضیه صفر

در جبر ، مفهوم "محدوده ارزشهای قابل قبول" وجود دارد. این بخش یا نقطه ای در محور X است که بر روی آن مجموعه ای از مقادیر آماری وجود دارد که فرضیه صفر برای آنها درست است. نقاط شدید بخش خط مقادیر بحرانی هستند. اشعه های سمت راست و چپ بخش ، مناطق بحرانی هستند. اگر مقدار یافت شده در آنها گنجانده شود ، نظریه صفر رد می شود و نظریه جایگزین پذیرفته می شود.

رد فرضیه صفر

فرضیه صفر در آمار گاهی اوقات یک مفهوم مبهم است. هنگام بررسی آن ، می توانید دو نوع خطا انجام دهید:

1. رد فرضیه صحیح صحیح. بیایید نوع اول را a = 1 نشان دهیم.
2. پذیرش فرضیه صفر باطل. نوع دوم a = 2 تعیین شده است.

باید درک کرد که این پارامترها یکسان نیستند ، نتایج خطاها می توانند به طور قابل توجهی با یکدیگر متفاوت باشند و نمونه های متفاوتی داشته باشند.

نمونه ای از دو نوع خطا

درک مفاهیم پیچیده با یک مثال آسان تر است.

در طول تولید یک داروی خاص ، دانشمندان باید بسیار مراقب باشند ، زیرا بیش از دوز یکی از اجزا سطح بالایی از سمیت داروی نهایی را ایجاد می کند ، که در نتیجه بیمارانی که از آن استفاده می کنند می توانند جان خود را از دست بدهند. با این حال ، تشخیص بیش از حد دوز در سطح شیمیایی غیرممکن است.
به همین دلیل ، قبل از انتشار دارو در بازار ، دوز کمی از آن روی موش ها یا خرگوش ها آزمایش می شود و دارو را به آنها تزریق می کند. اگر اکثر افراد بمیرند ، فروش دارو مجاز نیست ، اگر افراد آزمایش شده زنده هستند ، دارو مجاز است در داروخانه ها فروخته شود.

مورد اول: در واقع ، دارو سمی نبود ، اما در طول آزمایش ، نظارتی صورت گرفت و دارو در رده سمی طبقه بندی شد و اجازه فروش نداشت. A = 1.

مورد دوم: طی آزمایش دیگری ، هنگام آزمایش دسته دیگری از دارو ، تصمیم گرفته شد که این دارو سمی نبوده و مجاز به فروش است ، اگرچه در واقع این دارو سمی بود. A = 2.

اولین گزینه هزینه های مالی زیادی را برای تأمین کننده-کارآفرین به همراه خواهد داشت ، زیرا شما باید کل دسته دارو را از بین ببرید و از ابتدا شروع کنید.

وضعیت دوم باعث مرگ بیمارانی خواهد شد که این دارو را خریداری کرده و از آن استفاده کرده اند.

نظریه احتمالات

نه تنها صفر ، بلکه همه فرضیه ها در آمار و اقتصاد با توجه به سطح اهمیت تقسیم می شوند.

سطح اهمیت - درصد وقوع خطاهای نوع اول (رد فرضیه صفر صحیح).

سطح اول 5 or یا 0.05 است ، یعنی احتمال اشتباه 5 تا 100 یا 1 تا 20 است.
سطح دوم 1 or یا 0.01 است ، یعنی احتمال 1 در 100 است.
سطح سوم 0.1 or یا 0.001 است ، احتمال 1 در 1000 است.

معیارهای آزمون فرضیه

اگر دانشمند قبلاً به این نتیجه رسیده است که فرضیه صفر صحیح است ، پس باید آزمایش شود. این امر برای رد خطا ضروری است. یک معیار اساسی برای آزمایش فرضیه صفر وجود دارد که شامل چندین مرحله است:

1. احتمال خطای قابل قبول P = 0.05 را در نظر بگیرید.
2. آمار منتخب برای معیار 1.
3. با توجه به یک روش معروف ، محدوده مقادیر قابل قبول پیدا می شود.
4. اکنون مقدار آمار T محاسبه می شود.
5- اگر T (آمار) متعلق به ناحیه پذیرش فرضیه صفر (مانند روش "اطمینان") باشد ، آنگاه مفروضات درست تلقی می شوند و بنابراین خود فرضیه صفر صادق باقی می ماند.

آمار به این شکل عمل می کند. فرضیه صفر ، اگر به درستی آزمایش شود ، پذیرفته یا رد می شود.

شایان ذکر است که برای کارآفرینان و کاربران عادی ، سه مرحله اول به سختی می تواند به درستی انجام شود ، بنابراین توسط ریاضیدانان حرفه ای مورد اعتماد هستند. از سوی دیگر ، مراحل 4 و 5 را می توان توسط هرکسی که از روشهای آماری تأیید اطلاعات کافی برخوردار است انجام داد.