Нульова і альтернативна гіпотези. Статистичні гіпотези і критерії Область прийняття нульової гіпотези

СТАТИСТИЧНА ПЕРЕВІРКА СТАТИСТИЧНИХ

Поняття статистичної гіпотези.

Види гіпотез. Помилки першого і другого роду

гіпотеза - це припущення про деякі властивості досліджуваних явищ. під статистичної гіпотезою розуміють всяке висловлювання про генеральної сукупності, яке можна перевірити статистично, тобто спираючись на результати спостережень у випадковій вибірці. Розглядають два види статистичних гіпотез: гіпотези про закони розподілу генеральної сукупності і гіпотези про параметри відомих розподілів.

Так, гіпотеза про те, що витрати часу на складання вузла машини в групі механічних цехів, що випускають продукцію одного найменування і мають приблизно однакові техніко-економічні умови виробництва, розподіляються за нормальним законом, є гіпотезою про закон розподілу. А гіпотеза про те, що продуктивність праці робітників в двох бригадах, які виконують одну й ту ж роботу в однакових умовах, не відрізняється (при цьому продуктивність праці робітників кожної бригади має нормальний закон розподілу), є гіпотезою про параметри розподілу.

Що підлягає перевірці гіпотеза називається нульовий, або основний, і позначається Н 0. Нульовій гіпотезі протиставляють конкуруючу, або альтернативну, гіпотезу, яку позначають Н 1. Як правило, конкуруюча гіпотеза Н 1 є логічним запереченням основної гіпотези Н 0.

Прикладом нульової гіпотези може бути наступна: середні двох нормально розподілених генеральних сукупностей рівні, тоді конкуруюча гіпотеза може складатися з припущення, що середні нерівні. Символічно це записується так:

Н 0: М(Х) = М(Y); Н 1: М(Х) М(Y) .

Якщо нульова (висунута) гіпотеза буде відкинута, то має місце конкуруюча гіпотеза.

Розрізняють гіпотези прості і складні. Якщо гіпотеза містить тільки одне припущення, то це - проста гіпотеза. складна гіпотеза складається з кінцевого або нескінченного числа простих гіпотез.

Наприклад, гіпотеза Н 0: p = p 0 (Невідома ймовірність p дорівнює гіпотетичної ймовірності p 0 ) - проста, а гіпотеза Н 0: p < p 0 - складна, вона складається з незліченної безлічі простих гіпотез виду Н 0: p = p i , де p i - будь-яке число, менше p 0 .

Висунута статистична гіпотеза може бути правильною або неправильною, тому необхідно її перевірити, Спираючись на результати спостережень у випадковій вибірці; перевірку проводять статистичними методами, Тому її називають статистичної.

При перевірці статистичної гіпотези користуються спеціально складеної випадкової величиною, званої статистичним критерієм(або статистикою). Прийняте рішення про правильність (або неправильність) гіпотези грунтується на вивченні розподілу цієї випадкової величини за даними вибірки. Тому статистична перевірка гіпотез має імовірнісний характер: завжди існує ризик припуститися помилки при прийнятті (відхиленні) гіпотези. При цьому можливі помилки двох родів.

Помилка першого роду полягає в тому, що буде відкинута нульова гіпотеза, хоча насправді вона правильна.

Помилка другого роду полягає в тому, що буде прийнята нульова гіпотеза, хоча в дійсності вірна конкуруюча.

У більшості випадків наслідки зазначених помилок нерівнозначні. Що краще або гірше - залежить від конкретної постановки задачі і змісту нульової гіпотези. Розглянемо приклади. Припустимо, що на підприємстві про якість продукції судять за результатами вибіркового контролю. Якщо вибіркова частка шлюбу не перевищує заздалегідь встановленої величини p 0 , То партія приймається. Іншими словами, висувається нульова гіпотеза: Н 0: p p 0 . Якщо при перевірці цієї гіпотези допущена помилка першого роду, то ми забракуем придатну продукцію. Якщо ж зроблена помилка другого роду, то споживачеві буде відправлений шлюб. Очевидно, що наслідки помилки другого роду можуть бути значно серйознішими.

Інший приклад можна привести з області юриспруденції. Будемо розглядати роботу суддів як дії по перевірці презумпції невинності підсудного. В якості основної перевіряється гіпотези слід розглянути гіпотезу Н 0 : Підсудний невинний. Тоді альтернативної гіпотезою Н 1 є гіпотеза: обвинувачений винен в скоєнні злочину. Очевидно, що суд може помилитися першого або другого роду при винесенні вироку підсудному. Якщо допущена помилка першого роду, то це означає, що суд покарав невинного: підсудному було винесено обвинувальний вирок, коли насправді він не скоював злочину. Якщо ж судді допустили помилку другого роду, то це означає, що суд виніс виправдувальний вирок, коли насправді обвинувачений винен в скоєнні злочину. Очевидно, що наслідки помилки першого роду для обвинуваченого будуть значно серйознішими, в той час як для суспільства найбільш небезпечними є наслідки помилки другого роду.

імовірність здійснити помилку першого роду називають рівнем значущості критерію і позначають.

У більшості випадків рівень значимості критерію приймають рівним 0,01 або 0,05. Якщо, наприклад, рівень значущості прийнятий рівним 0,01, то це означає, що в одному випадку зі ста є ризик припуститися помилки першого роду (тобто відкинути правильну нульову гіпотезу).

імовірність здійснити помилку другого роду позначають. імовірність
не зробити помилку другого роду, тобто відкинути нульову гіпотезу, коли вона невірна, називається потужністю критерію.

Статистичний критерій.

критичні області

Статистичну гіпотезу перевіряють за допомогою спеціально підібраної випадкової величини, точне або наближене розподіл якої відомо (позначимо її До). Цю випадкову величину називають статистичним критерієм (або просто критерієм).

Існують різні статистичні критерії, що застосовуються на практиці: U- і Zкритерію (ці випадкові величини мають нормальний розподіл); F-критерій (випадкова величина розподілена за законом Фішера - Снедекора); t-критерій (за законом Стьюдента); -критерій (за законом "хі-квадрат") та ін.

Безліч всіх можливих значень критерію можна розбити на два непересічних підмножини: одне з них містить значення критерію, при яких нульова гіпотеза приймається, а інше - при яких вона відкидається.

Безліч значень критерію, при яких нульова гіпотеза відкидається, називається критичною областю. Будемо позначати критичну область через W.

Безліч значень критерію, при яких нульова гіпотеза приймається, називається областю прийняття гіпотези(або областю допустимих значень критерію). Будемо позначати цю область як .

Для перевірки справедливості нульової гіпотези за даними вибірок обчислюють спостережуване значення критерію. Будемо позначати його До набл.

Основний принцип перевірки статистичних гіпотез можна сформулювати так: якщо бачимо значення критерію потрапило в критичну область (тобто
), То нульову гіпотезу відкидають; якщо ж бачимо значення критерію потрапило в область прийняття гіпотези (тобто
), То немає підстав відкидати нульову гіпотезу.

Якими принципами слід керуватися при побудові критичної області W ?

Припустимо, що гіпотеза Н 0 насправді вірна. Тоді потрапляння критерію
в критичну область в силу основного принципу перевірки статистичних гіпотез тягне за собою відхилення вірної гіпотези Н 0 , А значить, вчинення помилки першого роду. Тому ймовірність попадання
в область W при справедливості гіпотези Н 0 повинна бути дорівнює рівню значущості критерію, тобто

.

Зауважимо, що ймовірність припуститися помилки першого роду вибирається досить малою (як правило,
). Тоді потрапляння критерію
в критичну область Wпри справедливості гіпотези Н 0 можна вважати практично неможливою подією. Якщо за даними вибіркового спостереження подія
все-таки настало, то його можна вважати несумісним з гіпотезою Н 0 (Яка в результаті і відкидається), але сумісним з гіпотезою Н 1 (Яка в результаті приймається).

Припустимо тепер, що вірна гіпотеза Н 1 . Тоді потрапляння критерію
в область прийняття гіпотези тягне за собою прийняття невірної гіпотези Н 0 , Що означає вчинення помилки другого роду. Тому
.

Так як події
і
є взаємно протилежними, то ймовірність попадання критерію
в критичну область Wбуде дорівнює потужності критерію, якщо гіпотеза Н 1 вірна, тобто

.

Очевидно, що критичну область слід вибирати так, щоб при заданому рівні значущості потужність критерію
була максимальною. Максимізація потужності критерію забезпечить мінімум ймовірності припуститися помилки другого роду.

Слід зазначити, що як би не було мало значення рівня значущості, потрапляння критерію в критичну область є тільки малоймовірне, але не абсолютно неможлива подія. Тому не виключено, що при вірній нульовій гіпотезі значення критерію, обчислене за даними вибірки, все ж виявиться в критичній області. Відхиляючи в цьому випадку гіпотезу Н 0 , Ми допускаємо помилку першого роду з ймовірністю. Чим менше, тим менш імовірно допустити помилку першого роду. Однак зі зменшенням зменшується критична область, а значить, стає менш можливим потрапляння в неї спостерігається значення До набл, навіть коли гіпотеза Н 0 невірна. При \u003d 0 гіпотеза Н 0 завжди буде прийматися незалежно від результатів вибірки. Тому зменшення тягне за собою збільшення ймовірності прийняти невірну нульову гіпотезу, тобто зробити помилку другого роду. У цьому сенсі помилки першого і другого роду є конкуруючими.

Так як виключити помилки першого і другого роду неможливо, необхідно хоча б прагнути в кожному конкретному випадку звести до мінімуму втрати від цих помилок. Звичайно, бажано зменшити обидві помилки одночасно, але так як вони є конкуруючими, то зменшення ймовірності припустити одну з них тягне збільшення ймовірності припустити іншу. Єдиний шлях одночасного зменшенняризику помилок полягає в збільшенні обсягу вибірки.

Залежно від виду конкуруючої гіпотези Н 1 будують односторонню (правобічним і лівостороннім) та двосторонню критичні області. Точки, що відокремлюють критичну область
від області прийняття гіпотези , називають критичними точками і позначають k крит. для відшукання критичної області необхідно знати критичні точки.

правобічна критична область може бути описана нерівністю
До>k крит. пр, де передбачається, що права критична точка k крит. пр\u003e 0. Така область складається з точок, що знаходяться праворуч від критичної точки k крит. пр, тобто вона містить безліч позитивних і досить великих значень критерію К.для знаходження k крит. пр задають спочатку рівень значимості критерію. Далі праву критичну точку k крит. пр знаходять з умови. Чому саме ця вимога визначає правостороннім критичну область? Так як ймовірність події (До>k крит. пр ) мала, то, в силу принципу практичної неможливості малоймовірних подій, ця подія при справедливості нульової гіпотези в одиничному випробуванні не повинно настати. Якщо все ж воно настало, тобто обчислене за даними вибірок спостережуване значення критерію
виявилося більше k крит. пр, то це можна пояснити тим, що нульова гіпотеза не узгоджується з даними спостереження і тому повинна бути відкинута. Таким чином, вимога
визначає такі значення критерію, при яких нульова гіпотеза відкидається, а вони і складають правостороннім критичну область.

Якщо ж
потрапило в область допустимих значень критерію , тобто
< k крит. пр, то основна гіпотеза не відкидається, бо вона сумісна з даними спостереження. Зауважимо, що ймовірність попадання критерію
в область допустимих значень при справедливості нульової гіпотези дорівнює (1) і близька до 1.

Необхідно пам'ятати, що потрапляння значень критерію
в область допустимих значень не є строгим доказом справедливості нульової гіпотези. Воно лише вказує, що між висунутою гіпотезою і результатами вибірки немає істотного розбіжності. Тому в таких випадках кажуть, що дані спостережень узгоджуються з нульовою гіпотезою і немає підстав відкидати її.

Аналогічно проводиться побудова та інших критичних областей.

так, левосторонняя критична область описується нерівністю
До<k крит. л, де k кріт.л<0. Такая область состоит из точек, находящихся по левую сторону от левой критической точки k кріт.л, тобто вона являє собою безліч негативних, але досить великих за модулем значень критерію. критичну точку k кріт.л знаходять з умови
(До<k крит. л)
, То є ймовірність того, що критерій приймає значення, менше k кріт.л, дорівнює прийнятому рівню значущості, якщо нульова гіпотеза вірна.

двостороння критична область
описується наступними нерівностями: ( До< k кріт.л або До>k крит. пр), де передбачається, що k кріт.л<0 и k крит. пр\u003e 0. Така область являє собою безліч досить великих за модулем значень критерію. Критичні точки знаходять з вимоги: сума ймовірностей того, що критерій прийме значення, менше k крит. л або більше k крит. пр, повинна дорівнювати прийнятому рівню значущості при справедливості нульової гіпотези, тобто

(До< k крит. л )+
(До>k крит. пр )= .

Якщо розподіл критерію До симетрично відносно початку координат, то критичні точки будуть розташовуватися симетрично відносно нуля, тому k крит. л \u003d - k крит. пр. Тоді двостороння критична область стає симетричною і може бути описана наступним нерівністю: > k крит. дв, де k крит. дв \u003d k крит. пр Критичну точку k крит. дв можна знайти з умови

Р (К< -k крит. дв ) \u003d Р (К>k крит. дв )= .

Зауваження 1.Для кожного критерію До критичні точки при заданому рівні значимості
можуть бути знайдені з умови
тільки чисельно. Результати чисельних обчислень k крит наведені у відповідних таблицях (див., наприклад, дод. 4 - 6 в файлі «Додатки»).

Зауваження 2. Описаний вище принцип перевірки статистичної гіпотези доводить ще її істинність або неістинність. ухвалення гіпотези Н 0 в порівнянні з альтернативної гіпотезою Н 1 не означає, що ми впевнені в абсолютній правильності гіпотези Н 0 - просто гіпотеза Н 0 узгоджується з наявними у нас даними спостереження, тобто є досить правдоподібним, що не суперечить досвіду твердженням. Можливо, що зі збільшенням обсягу вибірки n гіпотеза Н 0 буде відкинута.

СТАТИСТИЧНІ гіпотези

Отримані в експериментах вибіркові дані завжди обмежені і носять в значній мірі випадковий характер. Саме тому для аналізу таких даних і використовується математична статистика, що дозволяє узагальнювати закономірності, отримані на вибірці, і поширювати їх на всю генеральну сукупність.

Отримані в результаті експерименту на будь-якої вибірці дані служать підставою для судження про генеральної сукупності. Однак в силу дії випадкових імовірнісних причин оцінка параметрів генеральної сукупності, зроблена на підставі експериментальних (вибіркових) даних, завжди буде супроводжуватися похибкою, і тому подібного роду оцінки повинні розглядатися як приблизні, а не як остаточні затвердження. Подібні припущення про властивості і параметри генеральної сукупності отримали назву статистичних гіпотез . Як вказує Г.В. Суходольський: «Під статистичної гіпотезою зазвичай розуміють формальне припущення про те, що схожість (або відмінність) деяких параметричних або функціональних характеристик випадково або, навпаки, не випадково».

Сутність перевірки статистичної гіпотези полягає в тому, щоб встановити, чи узгоджуються експериментальні дані і висунута гіпотеза, припустимо віднести розбіжність між гіпотезою і результатом статистичного аналізу експериментальних даних за рахунок випадкових причин. Таким чином, статистична гіпотеза - це наукова гіпотеза, яка припускає статистичну перевірку, а математична статистика - це наукова дисципліна, завданням якої є науково обгрунтована перевірка статистичних гіпотез.

Статистичні гіпотези підрозділяються на нульові й альтернативні, спрямовані і ненаправлення.

нульова гіпотеза(H 0) - це гіпотеза про відсутність відмінностей. Якщо ми хочемо довести значимість відмінностей, то нульову гіпотезу потрібно спростувати, Інакше потрібно підтвердити.

Альтернативна гіпотеза (Н 1) - гіпотеза про значимість відмінностей. Це те, що ми хочемо довести, тому іноді її називають експериментальної гіпотезою.

Бувають завдання, коли ми хочемо довести якраз незначимість відмінностей, тобто підтвердити нульову гіпотезу. Наприклад, якщо нам потрібно переконатися, що різні випробовувані отримують хоча і різні, але врівноважені за складністю заданіяілі що експериментальна і контрольна вибірки не розрізняються між собою по якимось значущим характеристикам. Однак частіше нам все-таки потрібно довести значимість відмінностей, бо вони більш інформативні для нас в пошуку нового.

Нульова і альтернативна гіпотези можуть бути спрямованими і ненаправленої.

Спрямовані гіпотези -якщо передбачається в одній групі значення ознаки вище, а в інший нижче:

Н 0: Х 1 не перевищує Х 2,

Н 1: Х 1 перевищує Х 2.

Ненаправлення гіпотези -якщо передбачається що розрізняються форми розподілу ознаки в групах:

Н 0: Х 1 не відрізняється від Х 2,

Н 1: Х 1 відрізняється Х 2.

Якщо ми помітили, що в одній з груп індивідуальні значення досліджуваних за будь-якою ознакою, наприклад за соціальної активності, вище, а в інший нижче, то для перевірки значущості цих відмінностей нам необхідно сформулювати спрямовані гіпотези.

Якщо ми хочемо довести, що в групі А під впливом якихось експериментальних впливів відбулися більш виражені зміни, ніж в групі Б, То нам теж необхідно сформулювати спрямовані гіпотези.

Якщо ж ми хочемо довести, що розрізняються форми розподілу ознаки в групах А і Б, То формулюються ненаправлення гіпотези.

Перевірка гіпотез здійснюється за допомогою критеріїв статистичної оцінки відмінностей.

Приймається висновок носить назву статистичного рішення. Підкреслимо, що таке рішення завжди вероятностно. При перевірці гіпотези експериментальні дані можуть суперечити гіпотезі Н 0,тоді ця гіпотеза відхиляється. В іншому випадку, тобто якщо експериментальні дані узгоджуються з гіпотезою Н 0, Вона не відхиляється. Часто в таких випадках кажуть, що гіпотеза Н 0приймається. Звідси видно, що статистична перевірка гіпотез, заснована на експериментальних вибіркових даних, неминуче пов'язана з ризиком (імовірністю) прийняти помилкове рішення. При цьому можливі помилки двох родів. Помилка першого роду вийде, коли буде прийнято рішення відхилити гіпотезу Н 0,хоча в дійсності вона виявляється вірною. Помилка другого роду вийде, коли буде прийнято рішення не відхиляти гіпотезу Н 0, Хоча в дійсності вона буде невірна. Очевидно, що і правильні висновки можуть бути прийняті також у двох випадках. У таблиці 7.1 узагальнено вищесказане.

Таблиця 7.1

Не виключено, що психолог може помилитися в своєму статистичному вирішенні; як бачимо з таблиці 7.1, ці помилки можуть бути тільки двох родів. Оскільки виключити помилки при прийнятті статистичних гіпотез неможливо, то необхідно мінімізувати можливі наслідки, тобто прийняття невірної статистичної гіпотези. У більшості випадків єдиний шлях мінімізації помилок полягає в збільшенні обсягу вибірки.

СТАТИСТИЧНІ КРИТЕРІЇ

Статистичний критерій - це вирішальне правило, що забезпечує надійне поведінку, тобто прийняття істинної і відхилення помилкової гіпотези з високою ймовірністю.

Статистичні критерії позначають також метод розрахунку певного числа і саме це число.

Коли ми говоримо, що достовірність відмінностей визначалася за критерієм j *(Критерій - кутовий перетворення Фішера), то маємо на увазі, що використовували метод j *для розрахунку певного числа.

За співвідношенням емпіричного і критичного значень критерію ми можемо судити про те, чи підтверджується або спростовується нульова гіпотеза.

У більшості випадків для того, щоб ми визнали відмінності значущими, необхідно, щоб емпіричне значення критерію перевищувало критичне, хоча є критерії (наприклад, критерій Манна-Уїтні або критерій знаків), в яких ми повинні дотримуватися протилежної правила.

У деяких випадках розрахункова формула критерію включає в себе кількість спостережень у досліджуваній вибірці, що позначається як n. В цьому випадку емпіричне значення критерію одночасно є тестом для перевірки статистичних гіпотез. За спеціальною таблицею ми визначаємо, якому рівню статистичної значущості відмінностей правдива ця емпірична величина. Прикладом такого критерію є критерій j *, Який вираховується на основі кутового перетворення Фішера.

У більшості випадків, однак, одне і те ж емпіричне значення критерію може виявитися значимим або незначущим залежно від кількості спостережень у досліджуваній вибірці ( n) Або від так званого кількості ступенів свободи, яке позначається як vабо як df.

Число ступенів свободи v дорівнює числу класів варіаційного ряду мінус число умов, при яких він був сформований. До числа таких умов відносяться обсяг вибірки ( n), Середні і дисперсії.

Припустимо, групу з 50 осіб розділили на три класи за принципом:

Вміє працювати на комп'ютері;

Вміє виконувати лише певні операції;

Не вміє працювати на комп'ютері.

В першу і другу групи потрапило по 20 чоловік, в третю - 10.

Ми обмежені однією умовою - об'ємом вибірки. Тому, навіть якщо ми втратили дані про те, скільки людина не вміють працювати на комп'ютері, ми можемо визначити це, знаючи, що в першому і другому класах - по 20 випробовуваних. Ми не вільні у визначенні кількості випробовуваних в третьому розряді, «свобода» простягається тільки на перші два осередки класифікації:

Оскільки статистика як метод дослідження має справу з даними, в яких інтересующіеісследователязакономерностііскажени різними випадковими чинниками, більшість статистичних обчислень супроводжується перевіркою деяких припущень або гіпотез про джерело цих даних.

Педагогічна гіпотеза (наукове припущенийие про перевагу того чи іншого методу) в процесі статистичного аналізу перекладається на мову статистичної науки і заново формулюється, щонайменше, у вигляді двох статистичних гіпотез.

Можливі два типи гіпотез: перший тип - описові гіпотези, в яких описуються причини і можливі наслідки. Другий тип - пояснювальні : в них дається пояснення можливим наслідкам з певних причин, а також характеризуються умови, при яких ці слідства обов'язково підуть, т. е. пояснюється, в силу яких чинників і умов буде даний наслідок. Описові гіпотези не володіють передбаченням, а пояснювальні мають таку властивість. Пояснювальні гіпотези виводять дослідників на припущення про існування певних закономірних связеймежду явищами, факторами і умовами.

Гіпотези в педагогічних дослідженнях можуть припускати, що один із засобів (або група їх) буде більш ефективним, ніж інші засоби. Здесьгіпотетіческівисказиваетсяпредположеніе про порівняльну ефективність засобів, способів, методів, форм навчання.

Більш високий рівень гіпотетичного передбачення полягає в тому, що автор дослідження висловлює гіпотезу про те, що якась система заходів буде не тільки краща за іншу, ноіізрядавозможних систем вона здається оптимальною з точки зору певних критеріїв. Така гіпотеза нуждаетсявещеболеестрогоміоттого більш розгорнутому доказі.

Кулаічев А.П. Методи і засоби аналізу даних в середовищі Windows. Вид. 3-е, перераб. і доп. - М: Інко, 1999, стор. 129-131

Психолого-педагогічний словник для вчителів і керівників загальноосвітніх установ. - Ростов-н / Д: Фенікс, 1998, стор. 92

На основі зібраних в статистичних дослідженнях даних після їх обробки робляться висновки про досліджуваних явищах. Ці висновки робляться шляхом висування і перевірки статистичних гіпотез.

статистичної гіпотезою називається будь-яке твердження про вид або властивості розподілу спостережуваних в експерименті випадкових величин. Статистичні гіпотези перевіряються статистичними методами.

Проверяемая гіпотеза називається основний (нульовий) і позначається Н 0. Крім нульовий висувається ще й альтернативна (конкуруюча) гіпотеза Н 1, яка заперечує основну . Таким чином, в результаті перевірки буде прийнята одна і тільки одна з гіпотез , а друга буде відкинута.

типи помилок. Висунута гіпотеза перевіряється на підставі дослідження вибірки, отриманої з генеральної сукупності. Через випадковості вибірки в результаті перевірки не завжди робиться правильний висновок. При цьому можуть виникати такі ситуації:
1. Основна гіпотеза вірна і вона приймається.
2. Основна гіпотеза вірна, але вона відкидається.
3. Основна гіпотеза не вірна і вона відкидається.
4. Основна гіпотеза не вірна, але вона приймається.
У разі 2 говорять про помилку першого роду, В останньому випадку мова йде про помилку другого роду.
Таким чином, за одним вибірках приймається правильне рішення, а за іншими - неправильне. Рішення приймається за значенням деякої функції вибірки, званої статистичної характеристикою, статистичним критерієм або просто статистикою. Безліч значень цієї статистики можна розділити на два непересічних підмножини:

  • Н 0 приймається (не відхиляється), називається областю прийняття гіпотези (допустимої областю);
  • підмножина значень статистики, при яких гіпотеза Н 0 відкидається (відхиляється) і приймається гіпотеза Н 1, називається критичною областю.

висновки:

  1. критерієм називається випадкова величина K, яка дозволяє прийняти або відхилити нульову гіпотезу H0.
  2. При перевірці гіпотез можна допустити помилки 2 пологів.
    Помилка першого роду полягає в тому, що буде відхилена гіпотеза H0, якщо вона вірна ( "пропуск цілі"). Імовірність припуститися помилки першого роду позначається α і називається рівнем значущості. Найбільш часто на практиці приймають, що α \u003d 0,05 або α \u003d 0,01.
    Помилка другого роду полягає в тому, що гіпотеза H0 приймається, якщо вона неправильна ( "помилкове спрацьовування"). Імовірність помилки цього роду позначається β.

Класифікація гіпотез

Основна гіпотеза Н 0 про значення невідомого параметра q розподілу зазвичай виглядає так:
Н 0: q \u003d q 0.
конкуруюча гіпотеза Н 1 може при цьому мати наступний вигляд:
Н 1: q < q 0 , Н 1: q\u003e q 0 або Н 1: qq 0 .
відповідно виходить лівостороння, правостороння або двостороння критичні області. Граничні точки критичних областей ( критичні точки) Визначають за таблицями розподілу відповідної статистики.

При перевірці гіпотези розумно зменшити ймовірність прийняття неправильних рішень. Допустима ймовірність помилки першого родупозначається зазвичай a і називається рівнем значущості. Його значення, як правило, мало ( 0,1, 0,05, 0,01, 0,001 ...). Але зменшення ймовірності помилки першого роду призводить до збільшення ймовірності помилки другого роду ( b), Тобто прагнення приймати тільки вірні гіпотези викликає зростання числа відкинутих правильних гіпотез. Тому вибір рівня значущості визначається важливістю поставленої проблеми і тяжкістю наслідків невірно прийнятого рішення.
Перевірка статистичної гіпотези складається з наступних етапів:
1) визначення гіпотез Н 0 і Н 1 ;
2) вибір статистики та завдання рівня значущості;
3) визначення критичних точок До кр і критичної області;
4) обчислення за вибіркою значення статистики До екс;
5) порівняння значення статистики з критичною областю ( До кр і До екс);
6) прийняття рішення: якщо значення статистики не входить в критичну область, то приймається гіпотеза Н 0 і відкидається гіпотеза H 1, а якщо входить в критичну область, то відкидається гіпотеза Н 0 і приймається гіпотеза Н 1. При цьому, результати перевірки статистичної гіпотези потрібно інтерпретувати так: якщо взяли гіпотезу Н 1 , то можна вважати її доведеною, а якщо прінялігіпотезу Н 0 , то визнали, що вона не суперечить результатам наблюденій.Однако цією властивістю поряд з Н 0 можуть мати і інші гіпотези.

Класифікація перевірок гіпотез

Розглянемо далі кілька різних статистичних гіпотез і механізмів їх перевірки.
I) Гіпотеза про генерального середньому значенні нормального розподілу при невідомої дисперсії. Припускаємо, що генеральна сукупність має нормальний розподіл, її середнє і дисперсія невідомі, але є підстави вважати, що генеральне середнє одно a. При рівні значущості α потрібно перевірити гіпотезу Н 0: x \u003d a. В якості альтернативної можна використовувати одну з трьох розглянутих вище гіпотез. В даному випадку статистикою служить випадкова величина, що має розподіл Стьюдента з n - 1 ступенями свободи. Визначається відповідне експериментальне (що спостерігається) значення t екс t кр Н 1: x\u003e a воно знаходиться за рівнем значущості α і числа ступенів свободи n - 1. Якщо t екс < t кр Н 1: x ≠ a критичне значення знаходиться за рівнем значущості α / 2 і тому ж числі ступенів свободи. Нульова гіпотеза приймається, якщо | t екс | II) Гіпотеза про рівність двох середніх значень довільно розподілених генеральних сукупностей (великі незалежні вибірки). При рівні значущості α потрібно перевірити гіпотезу Н 0: x ≠ y. Якщо обсяг обох вибірок великий, то можна вважати, що вибіркові середні мають нормальний розподіл, а їх дисперсії відомі. У цьому випадку в якості статистики можна використовувати випадкову величину
,
має нормальний розподіл, причому M(Z) = 0, D(Z) \u003d 1. Визначається відповідне експериментальне значення z екс. З таблиці функції Лапласа знаходиться критичне значення z кр. При альтернативної гіпотезі Н 1: x\u003e y воно знаходиться з умови F(z кр) = 0,5 – a. якщо z екс< z кр , То нульова гіпотеза приймається, в протилежному випадку - відкидається. При альтернативної гіпотезі Н 1: x ≠ y критичне значення знаходиться з умови F(z кр) \u003d 0,5 × (1 - a). Нульова гіпотеза приймається, якщо | z екс |< z кр .

III) Гіпотеза про рівність двох середніх значень нормально розподілених генеральних сукупностей, дисперсії яких невідомі і однакові (малі незалежні вибірки). При рівні значущості α потрібно перевірити основну гіпотезу Н 0: x \u003d y. Як статистики використовуємо випадкову величину
,
має розподіл Стьюдента з ( n х + n у - 2) ступенями свободи. Визначається відповідне експериментальне значення t екс. З таблиці критичних точок розподілу Стьюдента знаходиться критичне значення t кр. Все вирішується аналогічно гіпотезі (I).

IV) Гіпотеза про рівність двох дисперсій нормально розподілених генеральних сукупностей. В даному випадку при рівні значущості aпотрібно перевірити гіпотезу Н 0: D(Х) = D(Y). Статистикою служить випадкова величина, що має розподіл Фішера - Снедекора з f 1 = n б - 1 і f 2 = n м - 1 ступенями свободи (S 2 б - велика дисперсія, обсяг її вибірки n б). Визначається відповідне експериментальне (що спостерігається) значення F екс. критичне значення F кр при альтернативній гіпотезі Н 1: D(Х) > D(Y) Знаходиться з таблиці критичних точок розподілу Фішера - Снедекора за рівнем значущості a і числу ступенів свободи f 1 і f 2. Нульова гіпотеза приймається, якщо F екс < F кр.

Інструкція. Для розрахунку необхідно вказати розмірність вихідних даних.

V) Гіпотеза про рівність декількох дисперсій нормально розподілених генеральних сукупностей за вибірками однакового обсягу. В даному випадку при рівні значущості aпотрібно перевірити гіпотезу Н 0: D(Х 1) = D(Х 2) = …= D(Х l). Статистикою служить випадкова величина , Що має розподіл Кочрена зі ступенями свободи f = n - 1 і l (n - обсяг кожної вибірки, l - кількість вибірок). Перевірка цієї гіпотези проводиться так само, як і попередній. Використовується таблиця критичних точок розподілу Кочрена.

VI) Гіпотеза про істотність кореляційного зв'язку. В даному випадку при рівні значущості aпотрібно перевірити гіпотезу Н 0: r \u003d 0. (Якщо коефіцієнт кореляції дорівнює нулю, то відповідні величини не пов'язані один з одним). Статистикою в даному випадку служить випадкова величина
,
має розподіл Стьюдента з f = n - 2 числом ступенів свободи. Перевірка цієї гіпотези проводиться аналогічно перевірці гіпотези (I).

Інструкція. Вкажіть кількість вихідних даних.

VII) Гіпотеза про значення ймовірності появи події. Проведено досить велика кількість n незалежних випробувань, в яких подія А відбулося m раз. Є підстави вважати, що ймовірність настання даної події в одному випробуванні дорівнює р 0. Потрібно при рівні значущості aперевірити гіпотезу про те, що ймовірність події А дорівнює гіпотетичної ймовірності р 0. (Оскільки ймовірність оцінюється по відносній частоті, то перевіряється гіпотезу можна сформулювати й інакше: значимо чи ні розрізняються спостерігається відносна частота і гіпотетична ймовірність).
Кількість випробувань досить велике, тому відносна частота події А розподілена за нормальним законом. Якщо нульова гіпотеза вірна, то її математичне сподівання дорівнює р 0, А дисперсія. Відповідно до цього в якості статистики виберемо випадкову величину
,
яка розподілена приблизно за нормальним законом з нульовим математичним очікуванням і одиничною дисперсією. Перевірка цієї гіпотези здійснюється точно так же, як і в випадку (I).

Інструкція. Для розрахунку необхідно заповнити вихідні дані.

Статистика - складна наука про вимірювання і аналізі різних даних. Як і в багатьох інших дисциплінах, в цій галузі існує поняття гіпотези. Так, гіпотеза в статистиці - це будь-яке положення, яке потрібно прийняти або відкинути. Причому в даній галузі є кілька видів таких припущень, схожих між собою за визначенням, але відрізняються на практиці. Нульова гіпотеза - сьогоднішній предмет вивчення.

Від загального до конкретного: гіпотези в статистиці

Від основного визначення припущень відходить ще одне, не менш важливе, - статистична гіпотеза є вивчення генеральної сукупності важливих для науки об'єктів, щодо яких вченими робляться висновки. Її можна перевірити за допомогою вибірки (частини генеральної сукупності). Наведемо кілька прикладів статистичних гіпотез:

1. Успішність всього класу, можливо, залежить від рівня освіти кожного учня.

2. Початковий курс математики в рівній мірі засвоюється як дітьми, які прийшли в школу в 6 років, так і дітьми, які прийшли в 7.

Простий гіпотезою в статистиці називають таке припущення, яке однозначно характеризує певний параметр величини, взятої вченим.

Складна складається з декількох або нескінченної кількості простих. Вказується деяка область чи ні точної відповіді.

Корисно розуміти кілька визначень гіпотез в статистиці, щоб не плутати їх на практиці.

Концепція нульової гіпотези

Нульова гіпотеза - це теорія про те, що є якісь дві сукупності, які не розрізняються між собою. Однак на науковому рівні немає поняття «не розрізняються», але є «їх схожість дорівнює нулю». Від цього визначення і було утворено поняття. У статистиці нульова гіпотеза позначається як Н0. Причому крайнім значенням неможливого (маловірогідної) вважається від 0.01 до 0.05 або менше.

Краще розібрати, що таке нульова гіпотеза, приклад з життя допоможе. Педагог в університеті припустив, що різний рівень підготовки учнів двох груп до залікової роботи викликаний незначними параметрами, випадковими причинами, що не впливають на загальний рівень освіти (різниця в підготовці двох груп студентів дорівнює нулю).

Однак зустрічно варто навести приклад альтернативної гіпотези - припущення, спростовує твердження нульової теорії (Н1). Наприклад: директор університету припустив, що різний рівень в підготовці до залікової роботи в учнів двох груп викликаний застосуванням педагогами різних методик навчання (різниця в підготовці двох груп істотна і на те є пояснення).

Тепер відразу видно різницю між поняттями «нульова гіпотеза» і «альтернативна гіпотеза». Приклади ілюструють ці поняття.

Перевірка нульової гіпотези

Створити припущення - це ще півбіди. Справжньою проблемою для новачків вважається перевірка нульової гіпотези. Саме тут багатьох і чекають труднощі.

Використовуючи метод альтернативної гіпотези, яка стверджує щось протилежне нульовий теорії, можна порівняти обидва варіанти і вибрати правильний. Так діє статистика.

Нехай нульова гіпотеза Н0, а альтернативна Н1, тоді:

Н0: c \u003d c0;
Н1: c ≠ c0.

Тут c - це якесь середнє значення генеральної сукупності, яке належить знайти, а c0 - це спочатку значення, по відношенню до якого перевіряється гіпотеза. Також є певна кількість Х - середнє значення вибірки, за яким визначається c0.

Отже, перевірка полягає в порівнянні Х і c0, якщо Х \u003d c0, то приймається нульова гіпотеза. Якщо ж Х ≠ c0, то за умовою вірної вважається альтернативна.

«Довірчий» спосіб перевірки

Існує найбільш дієвий спосіб, за допомогою якого нульова статистична гіпотеза легко перевіряється на практиці. Він полягає в побудові діапазону значень до 95% точності.

Для початку знадобиться знати формулу розрахунку довірчого інтервалу:
X - t * Sx ≤ c ≤ X + t * Sx,

де Х - це спочатку число на основі альтернативної гіпотези;
t - табличні величини (коефіцієнт Стьюдента);
Sx - стандартна середня помилка, яка розраховується як Sx \u003d σ / √n, де в чисельнику стандартне відхилення, а в знаменнику - обсяг вибірки.

Отже, припустимо ситуацію. До ремонту конвеєр в день випускав 32.1 кг кінцевої продукції, а після ремонту, як стверджує підприємець, коефіцієнт корисної дії зріс, і конвеєр, по тижневої перевірки, почав випускати 39.6 кг в середньому.

Нульова гіпотеза буде стверджувати, що ремонт ніяк не вплинув на ККД конвеєра. Альтернативна гіпотеза скаже, що ремонт докорінно змінив ККД конвеєра, тому продуктивність його підвищилася.

По таблиці знаходимо n \u003d 7, t \u003d 2,447, звідки формула прийме наступний вигляд:

39,6 - 2,447 * 4,2 ≤ з ≤ 39,6 + 2,447 * 4,2;

29,3 ≤ з ≤ 49,9.

Виходить, що значення 32.1 входить в діапазон, а отже, значення, запропоноване альтернативою - 39.6 - не отримується автоматично. Пам'ятайте, що спочатку перевіряється на правильність нульова гіпотеза, а потім - протилежна.

різновиди заперечення

До цього розглядався такий варіант побудови гіпотези, де Н0 стверджує щось, а Н1 це спростовує. Звідки можна було скласти подібну систему:

Н0: з \u003d С0;
Н1: з ≠ С0.

Але існує ще два споріднених способу спростування. Наприклад, нульова гіпотеза стверджує, що середня оцінка успішності класу більше 4.54, а альтернативна тоді скаже, що середня успішність того ж класу менш 4.54. І виглядати у вигляді системи це буде так:

Н0: з ⩾ 4.54;
Н1: з< 4.54.

Зверніть увагу, що нульова гіпотеза стверджує, що значення більше або дорівнює, а статистична - що строго менше. Строгість знака нерівності має велике значення!

статистична перевірка

Статистична перевірка нульових гіпотез полягає в використанні статистичного критерію. Такі критерії підпорядковуються різним законам розподілу.

Наприклад, існує F-критерій, який розраховується за розподілом Фішера. Є T-критерій, який найчастіше використовують на практиці, залежить від розподілу Стьюдента. Квадратний критерій згоди Пірсона і т. Д.

Область прийняття нульової гіпотези

В алгебрі є поняття "область допустимих значень". Це такий відрізок або точка на осі Х, на якому знаходиться безліч значень статистики, при яких нульова гіпотеза вірна. Крайні точки відрізка - критичні значення. Промені по праву і ліву сторону відрізка - критичні області. Якщо знайдене значення входить в них, то нульова теорія спростовується і приймається альтернативна.

Спростування нульової гіпотези

Нульова гіпотеза в статистиці часом дуже виверткий поняття. Під час перевірки її можна допустити помилки двох типів:

1. Заперечення вірною нульової гіпотези. Позначимо перший тип як а \u003d 1.
2. Прийняття помилкової нульової гіпотези. Другий тип позначимо як а \u003d 2.

Варто розуміти, що це не однакові параметри, результати помилок можуть істотно різнитися між собою і мати різні вибірки.

Приклад помилок двох типів

Зі складними поняттями легше розібратися на прикладі.

Під час виробництва якогось ліки від вчених повинен бути надзвичайно обережними, так як перевищення дози одного з компонентів провокує високий рівень токсичності готового препарату, від якого пацієнти, що приймають його, можуть померти. Однак на хімічному рівні виявити передозування неможливо.
Через це перед тим як випустити ліки в продаж, невелику його дозу перевіряють на щурах або кроликах, вводячи їм препарат. Якщо більшість піддослідних вмирає, то ліки в продаж не допускається, якщо піддослідні живі, то ліки дозволяють продавати в аптеках.

Перший випадок: насправді ліки було не токсичне, але під час експерименту була допущена помилка і препарат класифікували як токсичний і не допустили у продаж. А \u003d 1.

Другий випадок: в ході іншого експерименту при перевірці іншої партії ліки вирішено, що препарат не токсичний, і в продаж його допустили, хоча насправді препарат був отруйний. А \u003d 2.

Перший варіант спричинить за собою великі фінансові витрати постачальника-підприємця, так як доведеться знищити всю партію ліків і починати з нуля.

Друга ситуація спровокує смерть пацієнтів, які купили і вживали ці ліки.

Теорія ймовірності

Не тільки нульові, але все гіпотези в статистиці і економіці поділяють за рівнем значущості.

Рівень значущості - відсоток появи помилок першого роду (відхилення вірної нульової гіпотези).

Перший рівень - 5% або 0.05, т. Е. Ймовірність помилитися 5 до 100 або 1 до 20.
другий рівень - 1% або 0.01, т. е. ймовірність 1 до 100.
третій рівень - 0.1% або 0.001, ймовірність 1 до 1000.

Критерії перевірки гіпотези

Якщо вченим вже був зроблений висновок про правильність нульової гіпотези, то її необхідно піддати перевірці. Це необхідно, щоб виключити помилку. Існує основний критерій перевірки нульової гіпотези, що складається з декількох етапів:

1. Береться допустима помилкова ймовірність P \u003d 0.05.
2. Підбирається статистика для критерію 1.
3. За відомим методом знаходиться область допустимих значень.
4. Тепер обчислюється значення статистики Т.
5. Якщо Т (статистика) належить області прийняття нульової гіпотези (як в «довірчому» методі), то припущення вважаються вірними, а значить, і сама нульова гіпотеза залишається вірною.

Саме так діє статистика. Нульова гіпотеза при грамотній перевірці буде прийнята або відкинута.

Варто зауважити, що для звичайних підприємців і користувачів перші три етапи буває дуже складно виконати безпомилково, тому їх довіряють професійним математикам. Зате 4 і 5 етапи може виконати будь-яка людина, в достатній мірі знає статистичні методи перевірки.

Поділіться з друзями або збережіть для себе:

Завантаження ...