Нула и алтернативни хипотези. Статистически хипотези и критерии Област на приемане на нулева хипотеза

СТАТИСТИЧЕСКА ПРОВЕРКА НА СТАТИСТИЧЕСКАТА

Понятие за статистическа хипотеза.

Видове хипотези. Грешки от първи и втори вид

Хипотеза- това е предположение за някои свойства на изследваните явления. Под статистическа хипотезаразбират всяко твърдение за общата популация, което може да бъде проверено статистически, т.е. въз основа на резултатите от наблюденията в произволна извадка. Помислете за два вида статистически хипотези: хипотези закони за разпределениеобщо население и хипотези относно параметритеизвестни разпределения.

И така, хипотезата, че времето, отделено за сглобяване на машинен възел в група машинни цехове, произвеждащи продукти със същото име и имащи приблизително еднакви технически и икономически условия на производство, се разпределя според нормалния закон, е хипотеза относно закона за разпределението . И хипотезата, че производителността на труда на работниците в две бригади, изпълняващи една и съща работа при еднакви условия, не се различава (докато производителността на труда на работниците във всяка бригада има нормален закон за разпределение) е хипотеза относно параметрите на разпределение.

Извиква се хипотезата, която трябва да се тества нула,или основно,и обозначени З. 0. Нулевата хипотеза се противопоставя състезаващи се,или алтернатива,обозначена хипотеза З.един. Обикновено конкурентната хипотеза З. 1 е логично отрицание на основната хипотеза З. 0.

Пример за нулева хипотеза би бил: средствата на две нормално разпределени популации са равни, тогава конкурентната хипотеза може да се състои от предположението, че средствата не са равни. Това е написано символично по следния начин:

З. 0: М(х) = М(Y.); З. 1: М(х) М(Y.) .

Ако нулевата (изложена) хипотеза бъде отхвърлена, тогава има конкурентна хипотеза.

Разграничаване на прости и сложни хипотези. Ако хипотезата съдържа само едно предположение, тогава е - простохипотеза. Комплексхипотезата се състои от краен или безкраен брой прости хипотези.

Например хипотезата З. 0: стр = стр 0 (неизвестна вероятност стре равно на хипотетичната вероятност стр 0 ) е проста и хипотезата З. 0: стр < стр 0 - сложен, той се състои от безброй прости хипотези на формата З. 0: стр = стр iкъдето стр i- произволно число, по-малко стр 0 .

Предложената статистическа хипотеза може да бъде правилна или грешна, поради което е необходимо проверетевъз основа на резултатите от наблюденията в произволна извадка; извършва се проверка статистически методи, така че се нарича статистически.

При тестване на статистическа хипотеза се използва специално съставена случайна променлива, наречена статистически критерий(или статистика). Приетото заключение за правилността (или неправилността) на хипотезата се основава на изследването на разпределението на тази случайна величина според данните от извадката. Следователно статистическото тестване на хипотези има вероятностен характер: винаги съществува риск от грешка при приемане (отхвърляне) на хипотеза. В този случай са възможни грешки от два вида.

Грешка от първи виде, че нулевата хипотеза ще бъде отхвърлена, въпреки че всъщност е вярна.

Грешка от тип IIе, че нулевата хипотеза ще бъде приета, въпреки че в действителност конкурентната е вярна.

В повечето случаи последиците от тези грешки са неравномерни. Кое е по-добро или по-лошо зависи от конкретната формулировка на проблема и съдържанието на нулевата хипотеза. Нека разгледаме някои примери. Нека приемем, че в едно предприятие качеството на продуктите се оценява по резултатите от вземането на проби. Ако честотата на дискретизация на отхвърлянията не надвишава предварително определена стойност стр 0 , тогава партидата се приема. С други думи, излага се нулева хипотеза: З. 0: стр стр 0 ... Ако при тестване на тази хипотеза се допусне грешка от първи вид, тогава ще отхвърлим подходящи продукти. Ако е допусната грешка от втория вид, дефектът ще бъде изпратен на потребителя. Очевидно последиците от грешка от тип II могат да бъдат много по-сериозни.

Друг пример може да бъде цитиран от областта на юриспруденцията. Ще разглеждаме работата на съдиите като действия за проверка на презумпцията за невиновност на подсъдимия. Като основна проверяема хипотеза, разгледайте хипотезата З. 0 : подсъдимият е невинен. Тогава алтернативна хипотеза З. 1 е хипотеза: обвиняемият е виновен за престъпление. Очевидно е, че съдът може да направи грешки от първи или втори вид, когато осъжда подсъдимия. Ако е допусната грешка от първи вид, това означава, че съдът е наказал невинните: подсъдимият е осъден, когато всъщност не е извършил престъпление. Ако съдиите са допуснали грешка от втори вид, това означава, че съдът е постановил оправдателна присъда, когато всъщност обвиняемият е виновен за извършване на престъпление. Очевидно последиците от грешка от първи вид за обвиняемия ще бъдат много по-сериозни, докато за обществото най-опасни са последиците от грешка от втори вид.

Вероятностангажирам грешка първи видса наречени ниво на значимост критерийи означават.

В повечето случаи се приема, че нивото на значимост на критерия е 0,01 или 0,05. Ако например нивото на значимост се приеме за равно на 0,01, това означава, че в един случай от сто има риск да се допусне грешка от тип I (т.е. отхвърляне на правилната нулева хипотеза).

Вероятностангажирам грешка от втория видозначават. Вероятност
да не се направи грешка от втория вид, тоест да се отхвърли нулевата хипотеза, когато тя е неправилна, се нарича мощност на критерия.

Статистически критерий.

Критични области

Статистическата хипотеза се тества с помощта на специално избрана случайна величина, чието точно или приблизително разпределение е известно (ние я обозначаваме ДА СЕ). Тази случайна променлива се нарича статистически критерий(или просто критерий).

На практика се използват различни статистически критерии: U- и Z.-критерии (тези случайни променливи имат нормално разпределение); F-критерий (случайна променлива се разпределя съгласно закона на Fisher-Snedecor); T-критерий (съгласно закона на Студент); -критерий (според закона "хи-квадрат") и др.

Наборът от всички възможни стойности на критерия може да бъде разделен на две несъединени подмножества: едната от тях съдържа стойностите на критерия, за която е приета нулевата хипотеза, а другата, за която е отхвърлена.

Извиква се набор от стойности на критерия, при който се отхвърля нулевата хипотеза критична зона... Ще обозначим критичния регион с W.

Извиква се набор от стойности на критерия, за който се приема нулевата хипотеза област на хипотезата(или диапазон от приемливи стойности на критерия). Ще обозначим тази област като .

За да проверите валидността на нулевата хипотеза от примерните данни, изчислете наблюдавана стойност на критерия... Ще го обозначим ДА СЕ obs.

Основен принцип на тестване на статистическа хипотезаможе да се формулира по следния начин: ако наблюдаваната стойност на критерия попадне в критичната област (т.е.
), тогава нулевата хипотеза се отхвърля; ако наблюдаваната стойност на критерия е попаднала в зоната на приемане на хипотезата (т.е.
), тогава няма причина да се отхвърля нулевата хипотеза.

Какви принципи трябва да се спазват при изграждането на критичната зона W ?

Нека приемем, че хипотезата З. 0 е всъщност правилно. След това удари критерия
в критичния регион, поради основния принцип за тестване на статистически хипотези, води до отхвърляне на правилната хипотеза З. 0 , което означава да направите грешка от първи вид. Следователно, вероятността за удряне
към региона Wако хипотезата е вярна З. 0 трябва да е равно на нивото на значимост на критерия, т.е.

.

Имайте предвид, че вероятността да се допусне грешка от първи вид е избрана достатъчно малка (като правило,
). След това удря критерия
до критичната зона Wако хипотезата е вярна З. 0 може да се счита за почти невъзможно събитие. Ако според данните на селективното наблюдение събитието
въпреки това се е случило, тогава може да се счита за несъвместимо с хипотезата З. 0 (което се отхвърля в резултат), но в съответствие с хипотезата З. 1 (което се приема като резултат).

Да предположим сега, че хипотезата е вярна З. 1 ... След това удари критерия
в областта на приемането на хипотези води до приемане на неправилна хипотеза З. 0 , което означава да допуснем грешка от втория вид. Следователно
.

Тъй като събитията
и
са взаимно противоположни, тогава вероятността да се постигне критерият
до критичната зона Wще бъде равна на мощността на теста, ако хипотезата З. 1 вярно, т.е.

.

Очевидно критичната зона трябва да бъде избрана така, че на дадено ниво на значимост силата на критерия
беше максимум. Максимизирането на мощността на критерия ще осигури минимална вероятност за допускане на грешка от тип II.

Трябва да се отбележи, че колкото и малко да е значимото ниво на значимост, критерият, удрящ критичната зона, е само малко вероятно, но не абсолютно невъзможно събитие. Следователно е възможно, ако нулевата хипотеза е вярна, стойността на критерия, изчислена от данните от извадката, все пак ще бъде в критичния регион. Отхвърляйки в този случай хипотезата З. 0 , правим грешка от първи вид с вероятност. Колкото по-малък е, толкова по-малко вероятно е да допусне грешка от тип I. С намаляването обаче критичната област намалява, което означава, че става по-малко възможно наблюдаваната стойност да попадне в нея. ДА СЕ obs, дори когато хипотезата З. 0 не е наред. За = 0 хипотезата З. 0 винаги ще бъдат приети, независимо от примерните резултати. Следователно намаляването води до увеличаване на вероятността за приемане на неправилна нулева хипотеза, т.е. допускане на грешка от втория вид. В този смисъл се състезават грешки от първи и втори вид.

Тъй като е невъзможно да се изключат грешки от първи и втори вид, е необходимо поне да се стремим във всеки конкретен случай да минимизираме загубите от тези грешки. Разбира се, желателно е да се намалят и двете грешки едновременно, но тъй като те се конкурират, намаляването на вероятността за допускане на една от тях води до увеличаване на вероятността за допускане на другата. Единствения начинедновременно намаляванерискът от грешки се крие в увеличен размер на извадката.

В зависимост от вида на конкуриращата се хипотеза З. 1 изграждане едностранни (десни и леви) и двустранни критични области.Точки, разделящи критичната зона
от областта на приемане на хипотеза са наречени критични точкии означават кКрит. За намиране на критичната зонатрябва да знаете критичните точки.

Дяснатакритичната област може да се опише с неравенството
ДА СЕ>кКрит. pr, където се приема, че дясната критична точка кКрит. pr> 0. Такава област се състои от точки вдясно от критичната точка. кКрит. pr, тоест съдържа много положителни и достатъчно големи стойности на критерия ДА СЕ.Да намеря кКрит. pr зададе първо нивото на значимост на критерия. След това, дясната критична точка кКрит. pr намери от условието. Защо точно това изискване дефинира десния критичен регион? Тъй като вероятността за събитие (ДА СЕ>кКрит. и т.н. ) е малко, то поради принципа на практическа невъзможност за малко вероятни събития, това събитие, ако нулевата хипотеза е валидна в един тест, не трябва да се случва. Ако въпреки това е дошъл, т.е. наблюдаваната стойност на критерия, изчислена от данните от извадката
се оказа повече кКрит. pr, тогава това може да се обясни с факта, че нулевата хипотеза не е съгласна с данните от наблюдението и следователно трябва да бъде отхвърлена. По този начин, изискването
определя такива стойности на критерия, при които нулевата хипотеза се отхвърля, и те съставляват дясната критична област.

Ако
попадна в диапазона на приемливите стойности на критерия , т.е.
< кКрит. pr, тогава основната хипотеза не се отхвърля, тъй като е съвместима с данните от наблюдението. Имайте предвид, че вероятността да се постигне критерият
в диапазона на допустимите стойности ако нулевата хипотеза е валидна, тя е равна на (1-) и е близка до 1.

Трябва да се помни, че ударът на критерия стойности
в диапазона на допустимите стойности не е строго доказателство за валидността на нулевата хипотеза. Това само показва, че няма съществено несъответствие между изложената хипотеза и резултатите от извадката. Следователно в такива случаи се казва, че данните от наблюдението са съгласни с нулевата хипотеза и няма причина да ги отхвърляме.

Изграждането на други критични региони се извършва по подобен начин.

Така, левространнокритичната област се описва с неравенството
ДА СЕ<кКрит. l къде ккрит.л<0. Такая область состоит из точек, находящихся по левую сторону от левой критической точки к crit.l, тоест това е набор от отрицателни, но достатъчно големи по модул стойности на критерия. Критична точка к crit.l се намира от условието
(ДА СЕ<кКрит. л)
, тоест вероятността критерият да приеме стойност по-малка от к crit.l, е равно на приетото ниво на значимост, ако нулевата хипотеза е вярна.

Двустраннокритична зона
се описва със следните неравенства: ( ДА СЕ< ккрит.л или ДА СЕ>кКрит. pr), където се приема, че ккрит.л<0 и кКрит. pr> 0. Такава площ е набор от критерийни стойности, които са достатъчно големи по абсолютна стойност. Критични точки се намират от изискването: сумата от вероятностите критерият да приеме стойност по-малка от кКрит. l или повече кКрит. pr, трябва да бъде равно на приетото ниво на значимост, ако нулевата хипотеза е валидна, т.е.

(ДА СЕ< кКрит. л )+
(ДА СЕ>кКрит. и т.н. )= .

Ако разпределението на критерия ДА СЕсиметрично около началото, тогава критичните точки ще бъдат разположени симетрично около нулата, следователно кКрит. l = - кКрит. пр. Тогава двустранната критична област става симетрична и може да се опише със следното неравенство: > кКрит. dv къде кКрит. dv = кКрит. pr Критична точка кКрит. dv може да се намери от условието

P (K< -кКрит. dv ) = P (K>кКрит. dv )= .

Забележка 1.За всеки критерий ДА СЕкритични точки на дадено ниво на значимост
може да се намери от състоянието
само числено. Числени резултати к crit са дадени в съответните таблици (виж например приложения 4 - 6 във файла "Прикачени файлове").

Забележка 2.Описаният по-горе принцип на тестване на статистическа хипотеза все още не доказва нейната истина или неистина. Приемане на хипотезата З. 0 сравнено с алтернативна хипотеза З. 1 не означава, че сме сигурни в абсолютната правилност на хипотезата З. 0 - просто хипотеза З. 0 е в съответствие с нашите наблюдателни данни, тоест това е доста правдоподобно твърдение, което не противоречи на опита. Възможно е с увеличаване на размера на извадката нхипотеза З. 0 ще бъде отхвърлено.

СТАТИСТИЧЕСКИ ХИПОТЕЗИ

Данните от пробите, получени при експерименти, винаги са ограничени и са до голяма степен произволни. Ето защо математическата статистика се използва за анализ на такива данни, което прави възможно обобщаването на моделите, получени в извадката, и разширяването им върху цялата обща съвкупност.

Данните, получени в резултат на експеримента върху която и да е извадка, служат като основа за преценка на общата популация. Въпреки това, поради действието на случайни вероятностни причини, оценката на параметрите на генералната съвкупност, направена въз основа на експериментални (примерни) данни, винаги ще бъде придружена от грешка и следователно такива оценки трябва да се считат за предположения, а не като окончателни изявления. Такива предположения за свойствата и параметрите на генералната съвкупност се наричат статистически хипотези . Според Г.В. Суходолски: „Статистическата хипотеза обикновено се разбира като формално предположение, че сходството (или разликата) на някои параметрични или функционални характеристики е случайно или, обратно, неслучайно“.

Същността на тестването на статистическа хипотеза е да се установи дали експерименталните данни и изложената хипотеза са съгласни, дали е допустимо да се приписва несъответствието между хипотезата и резултата от статистическия анализ на експериментални данни поради случайни причини. По този начин статистическата хипотеза е научна хипотеза, която позволява статистическо тестване, а математическата статистика е научна дисциплина, чиято задача е да провери научно статистическите хипотези.

Статистическите хипотези се класифицират на нула и алтернативни, насочени и ненасочени.

Нулева хипотеза(Н 0) Хипотезата ли е, че няма разлики. Ако искаме да докажем значимостта на разликите, тогава се изисква нулевата хипотеза опровергавам, в противен случай се изисква потвърдете.

Алтернативна хипотеза (Н 1) Е хипотеза за значимостта на разликите. Това искаме да докажем, поради което понякога се нарича експериментален хипотеза.

Има задачи, когато искаме да докажем справедливост незначителностразличия, тоест за потвърждаване на нулевата хипотеза. Например, ако трябва да се уверим, че различните субекти получават, макар и различни, но балансирани по трудност, или че експерименталните и контролните проби не се различават по някои значими характеристики. По-често обаче все пак трябва да доказваме значимостта на разликите,тъй като те са по-информативни за нас в търсенето на нещо ново.

Нулевите и алтернативни хипотези могат да бъдат насочени и ненасочени.

Насочени хипотези -ако се приема, че характеристичните стойности са по-високи в едната група и по-ниски в другата:

Н 0: X 1по-малко от X 2,

Н 1: X 1надвишава X 2.

Недиректирани хипотези -ако се приема, че формите на разпределение на характеристика в групи се различават:

Н 0: X 1не се различава от X 2,

Н 1: X 1е различен X 2.

Ако сме забелязали, че в една от групите индивидуалните стойности на субектите за даден критерий, например за социална активност, са по-високи, а в другата по-ниски, то за да проверим значимостта на тези разлики, имаме нужда от за формулиране на насочени хипотези.

Ако искаме да докажем това в група НОпод влияние на някои експериментални влияния настъпиха по-изразени промени, отколкото в групата Б., тогава също трябва да формулираме насочени хипотези.

Ако искаме да докажем, че формите на разпределение на признака в групите се различават НОи Б., тогава се формулират ненасочени хипотези.

Тестването на хипотези се извършва с помощта на критерии за статистическа оценка на разликите.

Приетото заключение се нарича статистическо решение. Нека подчертаем, че такова решение винаги е вероятностно. При тестване на хипотеза експерименталните данни могат да противоречат на хипотезата H 0,тогава тази хипотеза се отхвърля. В противен случай, т.е. ако експерименталните данни са съгласни с хипотезата Н 0, не се отклонява. В такива случаи често се казва, че хипотезата Н 0се приема. Това показва, че статистическото тестване на хипотези въз основа на експериментални данни от извадка е неизбежно свързано с риска (вероятността) от вземане на невярно решение. В този случай са възможни грешки от два вида. Грешка от първи вид ще възникне, когато се вземе решение за отхвърляне на хипотеза. H 0,макар че в действителност се оказва вярно. Грешка от втори вид ще възникне, когато се вземе решение да не се отхвърли хипотезата. Н 0, макар че в действителност ще е неправилно. Очевидно в два случая могат да се приемат и правилни заключения. Таблица 7.1 обобщава горното.

Таблица 7.1

Възможно е психологът да се заблуди в своето статистическо решение; както виждаме от таблица 7.1, тези грешки могат да бъдат само два вида. Тъй като е невъзможно да се изключат грешки при приемане на статистически хипотези, е необходимо да се минимизират възможните последици, т.е. приемане на неправилна статистическа хипотеза. В повечето случаи единственият начин да се минимизират грешките е да се увеличи размерът на извадката.

СТАТИСТИЧЕСКИ КРИТЕРИИ

Статистически критерий- това е правило за решение, което осигурява надеждно поведение, тоест приемане на истинска хипотеза и отхвърляне на фалшива хипотеза с голяма вероятност.

Статистическите критерии също се отнасят до метода за изчисляване на определен брой и самия брой.

Когато казваме, че надеждността на разликите се определя от критерия j *(критерият е ъгловата трансформация на Фишър), тогава имаме предвид, че използвахме метода j *за да се изчисли конкретно число.

По съотношението на емпиричните и критичните стойности на критерия можем да преценим дали нулевата хипотеза е потвърдена или опровергана.

В повечето случаи, за да можем да признаем разликите като значими, е необходимо емпиричната стойност на критерия да надвишава критичната, въпреки че има критерии (например критерият на Ман-Уитни или критерият за знак), в които трябва се придържат към обратното правило.

В някои случаи изчислителната формула на критерия включва броя на наблюденията в изследваната извадка, обозначена като н... В този случай емпиричната стойност на критерия е едновременно тест за тестване на статистически хипотези. Използвайки специална таблица, ние определяме на какво ниво на статистическа значимост на разликите съответства дадена емпирична стойност. Пример за такъв критерий е критерият j *изчислено въз основа на ъгловото преобразуване на Фишър.

В повечето случаи обаче една и съща емпирична стойност на критерия може да се окаже значителна или незначителна в зависимост от броя на наблюденията в изследваната извадка ( н) или върху така наречения брой степени на свобода, който се обозначава като vили как df.

Броят на степените на свобода vе равен на броя на класовете на вариационната поредица минус броя на условията, при които е формиран. Тези условия включват размера на извадката ( н), средства и отклонения.

Да кажем, че група от 50 души е разделена на три класа според принципа:

Знае как да работи на компютър;

Знае как да извършва само определени операции;

Не може да работи на компютър.

Първата и втората групи включват 20 души, третата - 10.

Ние сме ограничени от едно условие - размерът на извадката. Следователно, дори да сме загубили данни за това колко хора не знаят как да работят на компютър, можем да определим това, знаейки, че в първи и втори клас има по 20 предмета. Ние не сме свободни да определяме броя на субектите в третата категория, "свобода" се простира само на първите две клетки от класификацията:

Тъй като статистиката като изследователски метод се занимава с данни, при които моделите от интерес за изследователя се изкривяват от различни случайни фактори, повечето статистически изчисления са придружени от тестване на някои предположения или хипотези за източника на тези данни.

Педагогическа хипотеза (научна хипотезане за предимството на един или друг метод) в процеса на статистическия анализ се превежда на езика на статистическата наука и се преформулира, поне под формата на две статистически хипотези.

Възможни са два вида хипотези: първият тип е описателен хипотези, които описват причините и възможните последици. Вторият тип е обяснителен : те обясняват възможните последици от определени причини и също така характеризират условията, при които тези последици непременно ще последват, тоест обясняват по силата на какви фактори и условия ще бъде дадения ефект. Описателните хипотези нямат предвидливост, докато обяснителните хипотези го правят. Обяснителните хипотези карат изследователите да правят предположения за съществуването на определени редовни връзки между явления, фактори и условия.

Хипотезите в образователните изследвания могат да предполагат, че един от инструментите (или група от тях) ще бъде по-ефективен от другите средства. Тук хипотетично се прави предположение за сравнителната ефективност на средства, методи, методи, форми на обучение.

По-високо ниво на хипотетично прогнозиране е, че авторът на изследването прави хипотеза, че дадена система от мерки не само ще бъде по-добра от друга, но и от редица възможни системи, изглежда оптимално от гледна точка на определени критерии. Такава хипотеза се нуждае от по-подробни доказателства.

А. П. Кулайчев Методи и инструменти за анализ на данни в Windows среда. Изд. 3-ти, рев. и добавете. - М: InKo, 1999, стр. 129-131

Психолого-педагогически речник за учители и ръководители на образователни институции. - Ростов-н / Д: Феникс, 1998, с. 92

Въз основа на данните, събрани в статистическите изследвания, след тяхната обработка се правят изводи за изследваните явления. Тези заключения се правят чрез излагане и тестване на статистически хипотези.

Статистическа хипотезанарича се всяко твърдение за формата или свойствата на разпределението на експериментално наблюдаваните случайни величини. Статистическите хипотези се проверяват със статистически методи.

Извиква се хипотезата, която трябва да се тества главен (нула)и обозначени З. 0. В допълнение към нулата има и алтернативна (конкурираща се) хипотеза H 1, отричайки основното . Така в резултат на тестването ще бъде приета една и само една от хипотезите. , а вторият ще бъде отхвърлен.

Видове грешки... Предложената хипотеза е тествана въз основа на проучване на извадка, получена от общата популация. Поради случайността на извадката, валидирането не винаги води до правилното заключение. В този случай могат да възникнат следните ситуации:
1. Основната хипотеза е правилна и приета.
2. Основната хипотеза е вярна, но е отхвърлена.
3. Основната хипотеза е неправилна и тя се отхвърля.
4. Основната хипотеза не е вярна, но е приета.
В случай 2 се говори за грешка от първи вид, в последния случай говорим грешка от втория вид.
По този начин за някои проби се взема правилното решение, а за други - грешното. Решението се взема от стойността на някаква функция за извадка, наречена статистически характеристики, статистически критерийили просто статистика... Наборът от стойности за тази статистика може да бъде разделен на две несъединени подмножества:

  • З. 0 се приема (не се отхвърля), извиква се зона за приемане на хипотеза (приложима област);
  • подмножество на статистическите стойности, за които хипотезата З. 0 се отхвърля (отхвърля) и хипотезата се приема З. 1 се нарича критична зона.

Заключения:

  1. Критерийе случайна променлива K, която ви позволява да приемете или отхвърлите нулевата хипотеза H0.
  2. При тестване на хипотези могат да се допуснат грешки от 2 рода.
    Грешка от първи виде, че хипотезата ще бъде отхвърлена З. 0, ако е правилно ("пропуснете целта"). Вероятността от грешка от първи вид се обозначава с α и се нарича ниво на значимост... Най-често на практика се приема, че α = 0,05 или α = 0,01.
    Грешка от тип IIе, че хипотезата H0 се приема, ако е неправилна („фалшиво положителна“). Вероятността за грешка от този вид се обозначава с β.

Класификация на хипотезите

Основна хипотеза З. 0 за стойността на неизвестния параметър q на разпределението обикновено изглежда така:
Н 0: q = q 0.
Конкурираща се хипотеза З.По този начин 1 може да има следната форма:
З. 1: q < q 0 , З. 1: q> q 0 или З. 1: qq 0 .
Съответно се оказва ляво, дясноили двустраннокритични области. Гранични точки на критични региони ( критични точки) се определят от таблиците за разпределение на съответната статистика.

При тестване на хипотеза е разумно да се намали вероятността от вземане на лоши решения. Толеранс на грешка от тип Iобикновено се обозначава аи се обади ниво на значимост... Стойността му обикновено е малка ( 0,1, 0,05, 0,01, 0,001 ...). Но намаляването на вероятността за грешка от тип I води до увеличаване на вероятността за грешка от тип II ( б), т.е. желанието да се приемат само правилни хипотези предизвиква увеличаване на броя на отхвърлените правилни хипотези. Следователно изборът на нивото на значимост се определя от важността на поставения проблем и тежестта на последствията от неправилно решение.
Изследването на статистическата хипотеза се състои от следните стъпки:
1) дефиниране на хипотези З. 0 и З. 1 ;
2) избор на статистика и определяне на нивото на значимост;
3) определяне на критични точки Кри критична зона;
4) изчисляване на статистическата стойност от извадката До бивш;
5) сравнение на статистическата стойност с критичната област ( Кри До бивш);
6) вземане на решение: ако стойността на статистиката не е включена в критичната област, тогава хипотезата се приема З. 0 и хипотезата се отхвърля З. 1 и ако навлезе в критичния регион, тогава хипотезата се отхвърля З. 0 и хипотезата се приема З.един. В същото време резултатите от тестването на статистическата хипотеза трябва да се интерпретират по следния начин: ако хипотезата е приета З. 1 , тогава тя може да се счита за доказана и ако хипотезата бъде приета З. 0 , тогава беше признато, че това не противоречи на резултатите от наблюденията, но това свойство, заедно с З. 0 може да има и други хипотези.

Класификация на тестове за хипотези

По-долу ще разгледаме няколко различни статистически хипотези и механизми за тяхното тестване.
I) Хипотеза за общата средна стойност на нормалното разпределение с неизвестна дисперсия. Предполагаме, че генералната съвкупност има нормално разпределение, нейното средно и вариация са неизвестни, но има основание да се смята, че общата средна стойност е равна на a. На ниво значимост α хипотезата трябва да бъде проверена З. 0: x = a. Като алтернатива може да се използва една от трите хипотези, обсъдени по-горе. В този случай статистиката е случайна променлива, имаща разпределение на Student н- 1 степен на свобода. Определя се съответната експериментална (наблюдавана) стойност т пр т кр З. 1: x> a се намира според нивото на значимост α и броя на степени на свобода н- 1. Ако т пр < т кр З. 1: x ≠ a, критичната стойност се намира според нивото на значимост α / 2 и същия брой степени на свобода. Нулевата хипотеза се приема, ако | t ex | II) Хипотезата за равенството на две средни стойности на произволно разпределени генерални популации (големи независими извадки). На ниво значимост α хипотезата трябва да бъде проверена З. 0: x ≠ y. Ако размерът на двете проби е голям, тогава можем да приемем, че средствата за извадка имат нормално разпределение и техните отклонения са известни. В този случай случайна променлива може да се използва като статистика
,
с нормално разпределение и М(Z.) = 0, д(Z.) = 1. Определя се съответната експериментална стойност z напр... Критичната стойност се намира от таблицата на функциите на Лаплас z cr... При алтернативна хипотеза З. 1: x> y се намира от условието F(z cr) = 0,5 – а... Ако z напр< z кр , тогава нулевата хипотеза се приема, в противен случай се отхвърля. При алтернативна хипотеза З. 1: x ≠ y критичната стойност се намира от условието F(z cr) = 0,5 × (1 - а). Нулевата хипотеза се приема, ако | z ex |< z кр .

III) Хипотезата за равенството на две средни стойности на нормално разпределени генерални популации, чиито дисперсии са неизвестни и еднакви (малки независими извадки). На ниво значимост α трябва да се провери основната хипотеза З. 0: x = y. Като статистика използваме случайна променлива
,
с разпределение на студент с ( n x + n в- 2) степени на свобода. Определя се съответната експериментална стойност т пр... От таблицата с критичните точки на разпределението на Student се намира критичната стойност т кр... Всичко се решава подобно на хипотезата (I).

IV) Предположение за равенството на две вариации на нормално разпределени генерални популации... В този случай на ниво на значимост атрябва да се провери хипотезата З. 0: д(х) = д(Y.). Статистиката е случайна променлива с разпределение на Fisher - Snedecor с е 1 = n b- 1 и е 2 = n m- 1 степен на свобода (S 2 b - голяма дисперсия, обемът на неговата проба n b). Определя се съответната експериментална (наблюдавана) стойност F напр... Критична стойност F крпри алтернативната хипотеза З. 1: д(х) > д(Y.) се намира от таблицата на критичните точки на разпределението на Fisher - Snedecor по нивото на значимост аи броя на степени на свобода е 1 и е 2. Нулевата хипотеза се приема, ако F напр < F кр.

Инструкция. За изчислението трябва да посочите измерението на изходните данни.

V) Хипотезата за равенството на няколко вариации на нормално разпределени генерални популации върху проби със същия размер. В този случай на ниво на значимост атрябва да се провери хипотезата З. 0: д(х 1) = д(х 2) = …= д(X l). Статистиката е случайна променлива с разпределение на Кохрен със степени на свобода е = н- 1 и л (н -размера на всяка проба, лЕ броят на пробите). Тази хипотеза се проверява по същия начин като предишната. Използва се таблица на критичните точки от разпределението на Кохрен.

Vi) Хипотезата за важността на корелацията.В този случай на ниво на значимост атрябва да се провери хипотезата З. 0: r= 0. (Ако коефициентът на корелация е нула, тогава съответните стойности не са свързани помежду си). Статистиката в този случай е случайна променлива
,
като има разпределение на Студент с е = н- 2 степени на свобода. Тази хипотеза се проверява по същия начин като хипотезата (I).

Инструкция. Посочете количеството изходни данни.

Vii) Хипотеза за значимостта на вероятността за настъпване на събитие.Доста голям брой ннезависими изпитания, в които събитието НОнастъпили мвреме. Има основания да се смята, че вероятността това събитие да се случи в един тест е p 0... Задължително на ниво значимост апроверете хипотезата, че вероятността за събитие НОе равно на хипотетичната вероятност p 0... (Тъй като вероятността се изчислява от относителната честота, тестваната хипотеза може да бъде формулирана по друг начин: дали наблюдаваната относителна честота и хипотетичната вероятност се различават значително или не).
Броят на опитите е достатъчно голям, така че относителната честота на събитието НОразпределени според нормалния закон. Ако нулевата хипотеза е вярна, тогава нейното математическо очакване е p 0и дисперсията. В съответствие с това като статистика избираме случайна променлива
,
който се разпределя приблизително според нормалния закон с нулево математическо очакване и единична дисперсия. Тази хипотеза се проверява по абсолютно същия начин, както в случая (I).

Инструкция. За изчислението трябва да попълните първоначалните данни.

Статистиката е сложна наука за измерване и анализ на различни данни. Както при много други дисциплини, в тази индустрия съществува концепция за хипотеза. И така, хипотеза в статистиката е всяка позиция, която трябва да бъде приета или отхвърлена. Освен това в този отрасъл има няколко вида такива предположения, които са сходни по дефиниция, но се различават на практика. Нулевата хипотеза е предмет на нашето изследване днес.

От общо към конкретно: хипотези в статистиката

Друго, не по-малко важно, се отклонява от основната дефиниция на предположенията - статистическа хипотеза е изучаването на общ набор от важни за науката обекти, за които учените правят заключения. Може да се провери с помощта на извадка (част от популацията). Ето няколко примера за статистически хипотези:

1. Общото представяне на оценката може да зависи от образователното ниво на всеки ученик.

2. Елементарният курс по математика се усвоява еднакво както от деца, които са дошли на училище на 6-годишна възраст, така и от деца, които са дошли на 7.

Една проста хипотеза в статистиката е предположение, което недвусмислено характеризира определен параметър на стойност, приета от учен.

Сложният се състои от няколко или безкраен брой прости. Посочена ли е определена област или няма точен отговор.

Полезно е да разберете няколко дефиниции на хипотези в статистиката, за да не ги обърквате на практика.

Концепцията за нулевата хипотеза

Нулевата хипотеза е теория, че има някои две групи, които не се различават помежду си. На научно ниво обаче няма понятие „не се различават“, но има „тяхното сходство е равно на нула“. От това определение се оформи концепцията. В статистиката нулевата хипотеза се обозначава като H0. Освен това крайната стойност на невъзможното (малко вероятно) се счита от 0,01 до 0,05 или по-малко.

По-добре е да разберете каква е нулевата хипотеза, пример от живота ще ви помогне. Преподавателят в университета предположи, че различното ниво на подготовка на студентите от двете групи за тестова работа се дължи на незначителни параметри, случайни причини, които не засягат общото ниво на образование (разликата в подготовката на двете групи студенти е нула).

Напротив, струва си да дадем пример за алтернативна хипотеза - предположение, което опровергава твърдението за нулевата теория (H1). Например: директорът на университета предполага, че различното ниво на подготовка за тестовата работа сред студентите от двете групи е причинено от използването на различни методи на преподаване от учителите (разликата в подготовката на двете групи е значителна и има обяснение за това).

Сега можете веднага да видите разликата между понятията "нулева хипотеза" и "алтернативна хипотеза". Примерите илюстрират тези концепции.

Тестване на нулевата хипотеза

Да отгатнеш е половината от проблемите. Тестването на нулевата хипотеза се счита за истинско предизвикателство за начинаещи. Тук мнозина очакват трудности.

Използвайки метода на алтернативната хипотеза, който твърди нещо противоположно на нулевата теория, можете да сравните и двата варианта и да изберете правилния. Ето как работи статистиката.

Нека нулевата хипотеза е H0, а алтернативната хипотеза H1, тогава:

Н0: c = c0;
Н1: c ≠ c0.

Тук c е определена средна стойност на генералната съвкупност, която трябва да бъде намерена, а c0 е първоначално зададената стойност, спрямо която се проверява хипотезата. Съществува и определено число X - средната стойност на пробата, която се използва за определяне на c0.

И така, проверката се състои в сравняване на X и c0, ако X = c0, тогава се приема нулевата хипотеза. Ако X ≠ c0, тогава по хипотеза алтернативата се счита за валидна.

"Доверен" метод за проверка

Има най-мощният начин, по който нулевата статистическа хипотеза лесно се проверява на практика. Състои се в нанасяне на диапазон от стойности с точност до 95%.

Първо, трябва да знаете формулата за изчисляване на доверителния интервал:
X - t * Sx ≤ c ≤ X + t * Sx,

където X е първоначално дадено число въз основа на алтернативна хипотеза;
t - таблични стойности (коефициент на Student);
Sx е стандартната средна грешка, която се изчислява като Sx = σ / √n, където числителят е стандартното отклонение, а знаменателят е размерът на извадката.

Така че нека приемем ситуация. Преди ремонта конвейерът е произвеждал 32,1 кг крайни продукти на ден, а след ремонта, според предприемача, ефективността се е увеличила и конвейерът, според седмична проверка, е започнал да произвежда средно 39,6 кг.

Нулевата хипотеза ще гласи, че ремонтът не е повлиял по никакъв начин ефективността на конвейера. Алтернативна хипотеза би казала, че ремонтът промени коренно ефективността на конвейера, следователно производителността му се увеличи.

Според таблицата намираме n = 7, t = 2.447, откъдето формулата ще приеме следната форма:

39,6 - 2,477 * 4,2 ≤ s ≤ 39,6 + 2,474 * 4,2;

29,3 ≤ s ≤ 49,9.

Оказва се, че стойността 32.1 е включена в диапазона и следователно стойността, предложена от алтернативата - 39.6 - не се приема автоматично. Не забравяйте, че нулевата хипотеза първо се проверява за коректност, а след това и обратното.

Разновидности на отричане

Преди това беше разгледан такъв вариант на изграждане на хипотеза, където H0 твърди нещо, а H1 го опровергава. Откъде може да се компилира такава система:

Н0: с = с0;
Н1: с ≠ с0.

Но има още два свързани начина за опровержение. Например, нулевата хипотеза гласи, че средната оценка за клас е по-голяма от 4,54, докато алтернативната хипотеза ще каже, че средната оценка за същия клас е по-малка от 4,54. И ще изглежда като система като тази:

Н0: s ⩾ 4,54;
Н1: s< 4.54.

Обърнете внимание, че нулевата хипотеза гласи, че стойността е по-голяма или равна на, а статистическата хипотеза, че е строго по-малка. Тежестта на знака за неравенство е от голямо значение!

Статистическа проверка

Статистическото тестване на нулеви хипотези включва използването на статистически тест. Такива критерии са предмет на различни закони за разпространение.

Например, има F-тест, който се изчислява с помощта на разпределението на Fisher. Има T-тест, най-често използван на практика, който зависи от разпределението на Student. Тест за доброта на Пиърсън и др.

Зона за приемане на нулева хипотеза

В алгебрата съществува концепцията за „диапазон от допустими стойности“. Това е сегмент или точка на оста X, върху която има набор от статистически стойности, за които нулевата хипотеза е вярна. Крайните точки на отсечката са критични стойности. Лъчите от дясната и лявата страна на сегмента са критични области. Ако намерената стойност е включена в тях, тогава нулевата теория се опровергава и се приема алтернативна.

Опровержение на нулевата хипотеза

Нулевата хипотеза в статистиката понякога е много хитра концепция. Когато го проверявате, можете да направите два вида грешки:

1. Отхвърляне на правилната нулева хипотеза. Нека обозначим първия тип като a = 1.
2. Приемане на фалшива нулева хипотеза. Вторият тип е обозначен като a = 2.

Трябва да се разбере, че това не са еднакви параметри, резултатите от грешките могат да се различават значително един от друг и да имат различни проби.

Пример за два вида грешки

Сложните концепции са по-лесни за разбиране с пример.

По време на производството на определено лекарство учените трябва да бъдат изключително внимателни, тъй като превишаването на дозата на един от компонентите провокира високо ниво на токсичност на готовото лекарство, от което пациентите, които го приемат, могат да умрат. Невъзможно е обаче да се открие предозиране на химическо ниво.
Поради това, преди пускането на лекарството на пазара, малка доза от него се тества върху плъхове или зайци, инжектирайки ги с лекарството. Ако повечето от субектите умрат, тогава лекарството не е разрешено за продажба, ако субектите са живи, тогава лекарството може да се продава в аптеките.

Първи случай: всъщност лекарството не беше токсично, но по време на експеримента беше направен надзор и лекарството беше класифицирано като токсично и не беше разрешено за продажба. A = 1.

Вторият случай: по време на друг експеримент, при тестване на друга партида от лекарството, беше решено, че лекарството не е токсично и беше разрешено за продажба, въпреки че всъщност лекарството беше отровно. A = 2.

Първият вариант ще доведе до големи финансови разходи за доставчика-предприемач, тъй като ще трябва да унищожите цялата партида лекарства и да започнете от нулата.

Втората ситуация ще провокира смъртта на пациенти, закупили и използвали това лекарство.

Теория на вероятностите

Не само нулата, но всички хипотези в статистиката и икономиката са разделени според нивото на значимост.

Ниво на значимост - процентът на възникване на грешки от първи вид (отхвърляне на правилната нулева хипотеза).

Първото ниво е 5% или 0,05, тоест вероятността за грешка е от 5 до 100 или от 1 до 20.
второто ниво е 1% или 0,01, тоест вероятността е 1 на 100.
третото ниво е 0,1% или 0,001, вероятността е 1 на 1000.

Критерии за тестване на хипотези

Ако ученият вече е стигнал до заключението, че нулевата хипотеза е вярна, тя трябва да бъде проверена. Това е необходимо, за да се изключи грешка. Има основен критерий за тестване на нулевата хипотеза, който се състои от няколко етапа:

1. Вземете допустимата вероятност за грешка P = 0,05.
2. Избрани статистически данни за критерий 1.
3. Съгласно добре познат метод се намира диапазонът на допустимите стойности.
4. Сега се изчислява стойността на Т статистиката.
5. Ако T (статистика) принадлежи към областта на приемане на нулевата хипотеза (както при метода "доверие"), тогава предположенията се считат за верни и следователно самата нулева хипотеза остава вярна.

Ето как работи статистиката. Нулевата хипотеза, ако бъде правилно тествана, ще бъде приета или отхвърлена.

Струва си да се отбележи, че за обикновените предприемачи и потребители първите три етапа могат да бъдат много трудни за попълване правилно, така че те се доверяват от професионални математици. От друга страна, етапи 4 и 5 могат да се извършват от всеки, който е достатъчно добре запознат със статистическите методи за проверка.

Споделете с приятелите си или запазете за себе си:

Зареждане...