Нулевая и альтернативная гипотезы. Статистические гипотезы и критерии Область принятия нулевой гипотезы

СТАТИСТИЧЕСКАЯ ПРОВЕРКА СТАТИСТИЧЕСКИХ

Понятие статистической гипотезы.

Виды гипотез. Ошибки первого и второго рода

Гипотеза - это предположение о некоторых свойствах изучаемых явлений. Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, которое можно проверить статистически, то есть опираясь на результаты наблюдений в случайной выборке. Рассматривают два вида статистических гипотез: гипотезы о законах распределения генеральной совокупности и гипотезы о параметрах известных распределений.

Так, гипотеза о том, что затраты времени на сборку узла машины в группе механических цехов, выпускающих продукцию одного наименования и имеющих примерно одинаковые технико-экономические условия производства, распределяются по нормальному закону, является гипотезой о законе распределения. А гипотеза о том, что производительность труда рабочих в двух бригадах, выполняющих одну и ту же работу в одинаковых условиях, не различается (при этом производительность труда рабочих каждой бригады имеет нормальный закон распределения), является гипотезой о параметрах распределения.

Подлежащая проверке гипотеза называется нулевой, или основной, и обозначается Н 0 . Нулевой гипотезе противопоставляют конкурирующую, или альтернативную, гипотезу, которую обозначают Н 1 . Как правило, конкурирующая гипотеза Н 1 является логическим отрицанием основной гипотезы Н 0.

Примером нулевой гипотезы может быть следующая: средние двух нормально распределенных генеральных совокупностей равны, тогда конкурирующая гипотеза может состоять из предположения, что средние не равны. Символически это записывается так:

Н 0: М (Х ) = М (Y ); Н 1: М (Х ) М (Y ) .

Если нулевая (выдвинутая) гипотеза будет отвергнута, то имеет место конкурирующая гипотеза.

Различают гипотезы простые и сложные. Если гипотеза содержит только одно предположение, то это - простая гипотеза. Сложная гипотеза состоит из конечного или бесконечного числа простых гипотез.

Например, гипотеза Н 0: p = p 0 (неизвестная вероятность p равна гипотетической вероятности p 0 ) - простая, а гипотеза Н 0: p < p 0 - сложная, она состоит из бесчисленного множества простых гипотез вида Н 0: p = p i , где p i - любое число, меньше p 0 .

Выдвигаемая статистическая гипотеза может быть правильной или неправильной, поэтому необходимо ее проверить , опираясь на результаты наблюдений в случайной выборке; проверку производят статистическими методами , поэтому ее называют статистической.

При проверке статистической гипотезы пользуются специально составленной случайной величиной, называемой статистическим критерием (или статистикой ). Принимаемое заключение о правильности (или неправильности) гипотезы основывается на изучении распределения этой случайной величины по данным выборки. Поэтому статистическая проверка гипотез имеет вероятностный характер: всегда существует риск допустить ошибку при принятии (отклонении) гипотезы. При этом возможны ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута нулевая гипотеза, хотя на самом деле она верна.

Ошибка второго рода состоит в том, что будет принята нулевая гипотеза, хотя в действительности верна конкурирующая.

В большинстве случаев последствия указанных ошибок неравнозначны. Что лучше или хуже - зависит от конкретной постановки задачи и содержания нулевой гипотезы. Рассмотрим примеры. Допустим, что на предприятии о качестве продукции судят по результатам выборочного контроля. Если выборочная доля брака не превышает заранее установленной величины p 0 , то партия принимается. Другими словами, выдвигается нулевая гипотеза: Н 0: p p 0 . Если при проверке этой гипотезы допущена ошибка первого рода, то мы забракуем годную продукцию. Если же совершена ошибка второго рода, то потребителю будет отправлен брак. Очевидно, что последствия ошибки второго рода могут быть значительно более серьезными.

Другой пример можно привести из области юриспруденции. Будем рассматривать работу судей как действия по проверке презумпции невиновности подсудимого. В качестве основной проверяемой гипотезы следует рассмотреть гипотезу Н 0 : подсудимый невиновен. Тогда альтернативной гипотезой Н 1 является гипотеза: обвиняемый виновен в совершении преступления. Очевидно, что суд может совершить ошибки первого или второго рода при вынесении приговора подсудимому. Если допущена ошибка первого рода, то это означает, что суд наказал невиновного: подсудимому был вынесен обвинительный приговор, когда на самом деле он не совершал преступления. Если же судьи допустили ошибку второго рода, то это значит, что суд вынес оправдательный приговор, когда на самом деле обвиняемый виновен в совершении преступления. Очевидно, что последствия ошибки первого рода для обвиняемого будут значительно более серьезными, в то время как для общества наиболее опасными являются последствия ошибки второго рода.

Вероятность совершить ошибку первого рода называют уровнем значимости критерия и обозначают .

В большинстве случаев уровень значимости критерия принимают равным 0,01 или 0,05. Если, например, уровень значимости принят равным 0,01, то это означает, что в одном случае из ста имеется риск допустить ошибку первого рода (то есть отвергнуть правильную нулевую гипотезу).

Вероятность совершить ошибку второго рода обозначают . Вероятность
не совершить ошибку второго рода, то есть отвергнуть нулевую гипотезу, когда она неверна, называется мощностью критерия.

Статистический критерий.

Критические области

Статистическую гипотезу проверяют с помощью специально подобранной случайной величины, точное или приближенное распределение которой известно (обозначим ее К ). Эту случайную величину называют статистическим критерием (или просто критерием ).

Существуют различные статистические критерии, применяемые на практике: U - и Z -критерии (эти случайные величины имеют нормальное распределение); F -критерий (случайная величина распределена по закону Фишера - Снедекора); t -критерий (по закону Стьюдента); -критерий (по закону "хи-квадрат") и др.

Множество всех возможных значений критерия можно разбить на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза принимается, а другое - при которых она отвергается.

Множество значений критерия, при которых нулевая гипотеза отвергается, называется критической областью . Будем обозначать критическую область через W .

Множество значений критерия, при которых нулевая гипотеза принимается, называется областью принятия гипотезы (или областью допустимых значений критерия ). Будем обозначать эту область как .

Для проверки справедливости нулевой гипотезы по данным выборок вычисляют наблюдаемое значение критерия . Будем обозначать его К набл.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия попало в критическую область (то есть
), то нулевую гипотезу отвергают; если же наблюдаемое значение критерия попало в область принятия гипотезы (то есть
), то нет оснований отвергать нулевую гипотезу.

Какими принципами следует руководствоваться при построении критической области W ?

Допустим, что гипотеза Н 0 на самом деле верна. Тогда попадание критерия
в критическую область в силу основного принципа проверки статистических гипотез влечет за собой отклонение верной гипотезы Н 0 , а значит, совершение ошибки первого рода. Поэтому вероятность попадания
в область W при справедливости гипотезы Н 0 должна быть равна уровню значимости критерия, то есть

.

Заметим, что вероятность совершить ошибку первого рода выбирается достаточно малой (как правило,
). Тогда попадание критерия
в критическую область W при справедливости гипотезы Н 0 можно считать практически невозможным событием. Если по данным выборочного наблюдения событие
все же наступило, то его можно считать несовместимым с гипотезой Н 0 (которая в результате и отвергается), но совместимым с гипотезой Н 1 (которая в результате принимается).

Предположим теперь, что верна гипотеза Н 1 . Тогда попадание критерия
в область принятия гипотезы влечет за собой принятие неверной гипотезы Н 0 , что означает совершение ошибки второго рода. Поэтому
.

Так как события
и
являются взаимно противоположными, то вероятность попадания критерия
в критическую область W будет равна мощности критерия, если гипотеза Н 1 верна, то есть

.

Очевидно, что критическую область следует выбирать так, чтобы при заданном уровне значимости мощность критерия
была максимальной. Максимизация мощности критерия обеспечит минимум вероятности допустить ошибку второго рода.

Следует отметить, что как бы ни было мало значение уровня значимости , попадание критерия в критическую область есть только маловероятное, но не абсолютно невозможное событие. Поэтому не исключено, что при верной нулевой гипотезе значение критерия, вычисленное по данным выборки, все же окажется в критической области. Отклоняя в этом случае гипотезу Н 0 , мы допускаем ошибку первого рода с вероятностью . Чем меньше , тем менее вероятно допустить ошибку первого рода. Однако с уменьшением уменьшается критическая область, а значит, становится менее возможным попадание в нее наблюдаемого значения К набл, даже когда гипотеза Н 0 неверна. При =0 гипотеза Н 0 всегда будет приниматься независимо от результатов выборки. Поэтому уменьшение влечет за собой увеличение вероятности принять неверную нулевую гипотезу, то есть совершить ошибку второго рода. В этом смысле ошибки первого и второго рода являются конкурирующими.

Так как исключить ошибки первого и второго рода невозможно, необходимо хотя бы стремиться в каждом конкретном случае свести к минимуму потери от этих ошибок. Конечно, желательно уменьшить обе ошибки одновременно, но так как они являются конкурирующими, то уменьшение вероятности допустить одну из них влечет увеличение вероятности допустить другую. Единственный путь одновременного уменьшения риска ошибок заключается в увеличении объема выборки .

В зависимости от вида конкурирующей гипотезы Н 1 строят одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области. Точки, отделяющие критическую область
от области принятия гипотезы , называют критическими точками и обозначают k крит. Для отыскания критической области необходимо знать критические точки.

Правосторонняя критическая область может быть описана неравенством
К >k крит. пр, где предполагается, что правая критическая точка k крит. пр >0. Такая область состоит из точек, находящихся по правую сторону от критической точки k крит. пр, то есть она содержит множество положительных и достаточно больших значений критерия К. Для нахождения k крит. пр задают сначала уровень значимости критерия . Далее правую критическую точку k крит. пр находят из условия . Почему именно это требование определяет правостороннюю критическую область? Так как вероятность события >k крит. пр ) мала, то, в силу принципа практической невозможности маловероятных событий, это событие при справедливости нулевой гипотезы в единичном испытании не должно наступить. Если все же оно наступило, то есть вычисленное по данным выборок наблюдаемое значение критерия
оказалось больше k крит. пр, то это можно объяснить тем, что нулевая гипотеза не согласуется с данными наблюдения и поэтому должна быть отвергнута. Таким образом, требование
определяет такие значения критерия, при которых нулевая гипотеза отвергается, а они и составляют правостороннюю критическую область.

Если же
попало в область допустимых значений критерия , то есть
< k крит. пр, то основная гипотеза не отвергается, ибо она совместима с данными наблюдения. Заметим, что вероятность попадания критерия
в область допустимых значений при справедливости нулевой гипотезы равна (1-) и близка к 1.

Необходимо помнить, что попадание значений критерия
в область допустимых значений не является строгим доказательством справедливости нулевой гипотезы. Оно лишь указывает, что между выдвигаемой гипотезой и результатами выборки нет существенного расхождения. Поэтому в таких случаях говорят, что данные наблюдений согласуются с нулевой гипотезой и нет оснований отвергать ее.

Аналогично проводится построение и других критических областей.

Так, л евосторонняя критическая область описывается неравенством
К <k крит. л, где k крит.л <0. Такая область состоит из точек, находящихся по левую сторону от левой критической точки k крит.л, то есть она представляет собой множество отрицательных, но достаточно больших по модулю значений критерия. Критическую точку k крит.л находят из условия
(К <k крит. л)
, то есть вероятность того, что критерий принимает значение, меньшее k крит.л, равна принятому уровню значимости , если нулевая гипотеза верна.

Двусторонняя критическая область
описывается следующими неравенствами: (К< k крит.л или К >k крит. пр), где предполагается, что k крит.л <0 и k крит. пр >0. Такая область представляет собой множество достаточно больших по модулю значений критерия. Критические точки находят из требования: сумма вероятностей того, что критерий примет значение, меньшее k крит. л или больше k крит. пр, должна быть равна принятому уровню значимости при справедливости нулевой гипотезы, то есть

(К< k крит. л )+
>k крит. пр )= .

Если распределение критерия К симметрично относительно начала координат, то критические точки будут располагаться симметрично относительно нуля, поэтому k крит. л = - k крит. пр. Тогда двусторонняя критическая область становится симметричной и может быть описана следующим неравенством: > k крит. дв, где k крит. дв = k крит. пр Критическую точку k крит. дв можно найти из условия

Р(К< -k крит. дв )=Р(К >k крит. дв )= .

Замечание 1. Для каждого критерия К критические точки при заданном уровне значимости
могут быть найдены из условия
только численно. Результаты численных вычислений k крит приведены в соответствующих таблицах (см., например, прил. 4 – 6 в файле «Приложения»).

Замечание 2. Описанный выше принцип проверки статистической гипотезы не доказывает еще ее истинность или неистинность. Принятие гипотезы Н 0 в сравнении с альтернативной гипотезой Н 1 не означает, что мы уверены в абсолютной правильности гипотезы Н 0 - просто гипотеза Н 0 согласуется с имеющимися у нас данными наблюдения, то есть является достаточно правдоподобным, не противоречащим опыту утверждением. Возможно, что с увеличением объема выборки n гипотеза Н 0 будет отвергнута.

СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ

Полученные в экспериментах выборочные данные всегда ограничены и носят в значительной мере случайный характер. Именно поэтому для анализа таких данных и используется мате­матическая статистика, позволяющая обобщать закономерности, полученные на выборке, и распространять их на всю генераль­ную совокупность.

Полученные в результате экспери­мента на какой-либо выборке данные служат основанием для суждения о генеральной совокупности. Однако в силу действия случайных вероятностных причин оценка параметров генераль­ной совокупности, сделанная на основании экспериментальных (выборочных) данных, всегда будет сопровождаться погрешнос­тью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не как окончательные утверждения. Подобные предположения о свойствах и параметрах генеральной совокупности получили название статистических гипотез . Как указывает Г.В. Суходольский: «Под статистической гипотезой обычно понимают формальное предположение о том, что сход­ство (или различие) некоторых параметрических или функцио­нальных характеристик случайно или, наоборот, неслучайно» .

Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются ли экспериментальные дан­ные и выдвинутая гипотеза, допустимо ли отнести расхождение между гипотезой и результатом статистического анализа экспериментальных данных за счет случайных причин. Таким образом, статистическая гипотеза – это научная гипотеза, допускающая статистическую проверку, а математическая статистика – это научная дисциплина, задачей которой является научно обосно­ванная проверка статистических гипотез.

Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.

Нулевая гипотеза (H 0 ) – это гипотеза об отсутствии различий. Если мы хотим доказать значимость различий, то нулевую гипотезу требуется опровергнуть , иначе требуется подтвердить .

Альтернатив­ная гипотеза (Н 1 ) – гипотеза о значимости различий. Это то, что мы хотим до­казать, поэтому иногда ее называют экспериментальной гипотезой.

Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности заданияили что экспериментальная и контрольная выборки не различаются между собой по каким-то значи­мым характеристикам. Однако чаще нам все-таки требуется доказать значимость различий, ибо они более информативны для нас в поиске нового.

Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.

Направленные гипотезы – если предполагается в одной группе значения признака выше, а в другой ниже:

Н 0: Х 1 не превышает Х 2 ,

Н 1: Х 1 превышает Х 2 .

Ненаправленные гипотезы – если предполагается что различаются формы распределения признака в группах:

Н 0: Х 1 не отличается от Х 2 ,

Н 1: Х 1 отличается Х 2 .

Если мы заметили, что в одной из групп индивидуальные значения испытуемых по какому-либо признаку, например по социальной активности, выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы.

Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, чем в группе Б , то нам тоже необходимо сформулировать направленные гипотезы.

Если же мы хотим доказать, что различаются формы распределения признака в группах А и Б , то формулируются ненаправленные гипотезы.

Проверка гипотез осуществляется с помощью критериев статистической оценки различий.

Принимаемый вывод носит название статистического решения. Подчеркнем, что такое решение всегда вероятностно. При проверке гипотезы экспериментальные данные могут противоречить гипотезе Н 0 , тогда эта гипотеза отклоняется. В противном случае, т.е. если экспериментальные данные согласуются с гипотезой Н 0 , она не отклоняется. Часто в таких случаях говорят, что гипотеза Н 0 принимается. Отсюда видно, что статистическая проверка гипотез, основанная на экспериментальных выборочных данных, неизбежно связана с риском (вероятностью) принять ложное решение. При этом возможны ошибки двух родов. Ошибка первого рода произойдет, когда будет принято решение отклонить гипотезу Н 0 , хотя в действительности она оказывается верной. Ошибка второго рода произойдет, когда будет принято решение не отклонять гипотезу Н 0 , хотя в действительности она будет неверна. Очевидно, что и правильные выводы могут быть приняты также в двух случаях. В таблице 7.1 обобщено вышесказанное.

Таблица 7.1

Не исключено, что психолог может ошибиться в своем статистическом решении; как видим из таблицы 7.1, эти ошибки могут быть только двух родов. Поскольку исключить ошибки при принятии статистических гипотез невозможно, то необходимо минимизировать возможные последствия, т.е. принятие неверной статистической гипотезы. В большинстве случаев единственный путь минимизации ошибок заключается в увеличении объема выборки.

СТАТИСТИЧЕСКИЕ КРИТЕРИИ

Статистический критерий – это решающее правило, обеспечиваю­щее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью .

Статистические критерии обозначают также метод расчета опре­деленного числа и само это число.

Когда мы говорим, что достоверность различий определялась по критерию j * (критерий – угловое преобразование Фишера), то имеем в виду, что использовали метод j * для расчета определенного числа.

По соотношению эмпирического и критического значений крите­рия мы можем судить о том, подтверждается ли или опровергается нулевая гипотеза.

В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия пре­вышало критическое, хотя есть критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила.

В некоторых случаях расчетная формула критерия включает в се­бя количество наблюдений в исследуемой выборке, обозначаемое как n . В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого крите­рия является критерий j * , вычисляемый на основе углового преобразо­вания Фишера.

В большинстве случаев, однако, одно и то же эмпирическое зна­чение критерия может оказаться значимым или незначимым в зависи­мости от количества наблюдений в исследуемой выборке (n ) или от так называемого количества степеней свободы, которое обозначается как v или как df.

Число степеней свободы v равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относятся объем выборки (n ), средние и дисперсии.

Допустим, группу из 50 человек разделили на три класса по принципу:

Умеет работать на компьютере;

Умеет выполнять лишь определенные опера­ции;

Не умеет работать на компьютере.

В первую и вторую группы попало по 20 человек, в третью – 10.

Мы ограничены одним условием – объемом выборки. Поэтому, даже если мы потеряли данные о том, сколько человек не умеют рабо­тать на компьютере, мы можем определить это, зная, что в первом и втором классах – по 20 испытуемых. Мы не свободны в определении количества испытуемых в третьем разряде, «свобода» простирается только на первые две ячейки классификации:

Поскольку статистика как метод исследования имеет дело с данным, в которых интересующиеисследователязакономерностиискажены различными случайными факторами, большинство статистических вычислений сопровождается проверкой некоторых предположений или гипотез об источнике этих данных.

Педагогическая гипотеза (научное предположен ие о преимуществе того или иного метода) в процессе статистического анализа переводится на язык статисти­ческой науки и заново формулируется, по меньшей мере, в виде двух статистических гипотез.

Возможны два типа гипотез: первый тип - описа­тельные гипотезы, в которых описываются причины и возможные следствия. Второй тип - объяснительные : в них дается объяснение возможным следствиям из опре­деленных причин, а также характеризуются условия, при которых эти следствия обязательно последуют, т. е. объяс­няется, в силу каких факторов и условий будет данное следствие. Описательные гипотезы не обладают предвидением, а объяснительные обладают таким свойством. Объясни­тельные гипотезы выводят исследователей на предпо­ложения о существовании определенных закономерных связеймежду явлениями, факторами и условиями.

Гипотезы в педагогических иссле­дованиях могут предполагать, что одно из средств (или группа их) будет более эффективным, чем другие средства. Здесьгипотетическивысказываетсяпредположение о сравнительной эффективности средств, способов, методов, форм обучения.

Более высокий уровень гипотетического предсказания состоит в том, что автор исследования высказывает гипотезу о том, что какая-то система мер будет не только лучше другой, ноиизрядавозможных систем она кажется оптимальной с точки зрения определенных критериев. Такая гипотеза нуждаетсявещеболеестрогомиоттого более развернутом доказательстве.

Кулаичев А.П. Методы и средства анализа данных в среде Windows. Изд. 3-е, перераб. и доп. - М: ИнКо, 1999, стр. 129-131

Психолого-педагогический словарь для учителей и руководителей общеобразовательных учреждений. – Ростов-н/ Д: Феникс, 1998, стр. 92

На основе собранных в статистических исследованиях данных после их обработки делаются выводы об изучаемых явлениях. Эти выводы делаются путём выдвижения и проверки статистических гипотез.

Статистической гипотезой называется любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Статистические гипотезы проверяются статистическими методами.

Проверяемая гипотеза называется основной (нулевой) и обозначается Н 0 . Кроме нулевой выдвигается ещё и альтернативная (конкурирующая) гипотеза Н 1 ,отрицающая основную. Таким образом, в результате проверки будет принята одна и только одна из гипотез, а вторая будет отвергнута.

Типы ошибок . Выдвинутая гипотеза проверяется на основании исследования выборки, полученной из генеральной совокупности. Из-за случайности выборки в результате проверки не всегда делается правильный вывод. При этом могут возникать следующие ситуации:
1. Основная гипотеза верна и она принимается.
2. Основная гипотеза верна, но она отвергается.
3. Основная гипотеза не верна и она отвергается.
4. Основная гипотеза не верна, но она принимается.
Во случае 2 говорят об ошибке первого рода , в последнем случае речь идёт об ошибке второго рода .
Таким образом, по одним выборкам принимается правильное решение, а по другим – неправильное. Решение принимается по значению некоторой функции выборки, называемой статистической характеристикой , статистическим критерием или просто статистикой . Множество значений этой статистики можно разделить на два непересекающихся подмножества:

  • Н 0 принимается (не отклоняется), называется областью принятия гипотезы (допустимой областью) ;
  • подмножество значений статистики, при которых гипотеза Н 0 отвергается (отклоняется) и принимается гипотеза Н 1 ,называется критической областью.

Выводы:

  1. Критерием называется случайная величина K , которая позволяет принять или отклонить нулевую гипотезу H0 .
  2. При проверке гипотез можно допустить ошибки 2 родов.
    Ошибка первого рода состоит в том, что будет отклонена гипотеза H 0, если она верна ("пропуск цели"). Вероятность совершить ошибку первого рода обозначается α и называется уровнем значимости . Наиболее часто на практике принимают, что α = 0,05 или α = 0,01.
    Ошибка второго рода заключается в том, что гипотеза H0 принимается, если она неверна ("ложное срабатывание"). Вероятность ошибки этого рода обозначается β.

Классификация гипотез

Основная гипотеза Н 0 о значении неизвестного параметра q распределения обычно выглядит так:
Н 0: q = q 0 .
Конкурирующая гипотеза Н 1 может при этом иметь следующий вид:
Н 1: q < q 0 , Н 1: q > q 0 или Н 1: q q 0 .
Соответственно получается левосторонняя, правосторонняя или двусторонняя критические области. Граничные точки критических областей (критические точки ) определяют по таблицам распределения соответствующей статистики.

При проверке гипотезы разумно уменьшить вероятность принятия неправильных решений. Допустимая вероятность ошибки первого рода обозначается обычно a и называется уровнем значимости . Его значение, как правило, мало (0,1, 0,05, 0,01, 0,001 …). Но уменьшение вероятности ошибки первого рода приводит к увеличению вероятности ошибки второго рода (b ), т.е. стремление принимать только верные гипотезы вызывает возрастание числа отброшенных правильных гипотез. Поэтому выбор уровня значимости определяется важностью поставленной проблемы и тяжестью последствий неверно принятого решения.
Проверка статистической гипотезы состоит из следующих этапов :
1) определение гипотез Н 0 и Н 1 ;
2) выбор статистики и задание уровня значимости;
3) определение критических точек К кр и критической области;
4) вычисление по выборке значения статистики К экс ;
5) сравнение значения статистики с критической областью (К кр и К экс );
6) принятие решения: если значение статистики не входит в критическую область, то принимается гипотеза Н 0 и отвергается гипотеза H 1 , а если входит в критическую область, то отвергается гипотеза Н 0 и принимается гипотеза Н 1 . При этом, результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу Н 1 , то можно считать её доказанной, а если принялигипотезу Н 0 , то признали, что она не противоречит результатам наблюдений.Однако этим свойством наряду с Н 0 могут обладать и другие гипотезы.

Классификация проверок гипотез

Рассмотрим далее несколько различных статистических гипотез и механизмов их проверки.
I) Гипотеза о генеральном среднем значении нормального распределения при не известной дисперсии . Предполагаем, что генеральная совокупность имеет нормальное распределение, её среднее и дисперсия неизвестны, но есть основания полагать, что генеральное среднее равно a . При уровне значимости α нужно проверить гипотезу Н 0: x =a. В качестве альтернативной можно использовать одну из трёх рассмотренных выше гипотез. В данном случае статистикой служит случайная величина , имеющая распределение Стьюдента с n – 1 степенями свободы. Определяется соответствующее экспериментальное (наблюдаемое) значение t экс t кр Н 1: x >a оно находится по уровню значимости α и числу степеней свободы n – 1. Если t экс < t кр Н 1: x ≠a критическое значение находится по уровню значимости α / 2 и том же числе степеней свободы. Нулевая гипотеза принимается, если | t экс |II) Гипотеза о равенстве двух средних значений произвольно распределённых генеральных совокупностей (большие независимые выборки). При уровне значимости α нужно проверить гипотезу Н 0: x ≠y . Если объём обеих выборок велик, то можно считать, что выборочные средние имеют нормальное распределение, а их дисперсии известны. В этом случае в качестве статистики можно использовать случайную величину
,
имеющую нормальное распределение, причём M (Z ) = 0, D (Z ) = 1. Определяется соответствующее экспериментальное значение z экс . Из таблицы функции Лапласа находится критическое значение z кр . При альтернативной гипотезе Н 1: x >y оно находится из условия F (z кр ) = 0,5 – a . Если z экс < z кр , то нулевая гипотеза принимается, в противоположном случае – отвергается. При альтернативной гипотезе Н 1: x ≠y критическое значение находится из условия F (z кр ) = 0,5×(1 – a ). Нулевая гипотеза принимается, если |z экс | < z кр .

III) Гипотеза о равенстве двух средних значений нормально распределённых генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки) . При уровне значимости α нужно проверить основную гипотезу Н 0: x =y . В качестве статистики используем случайную величину
,
имеющую распределение Стьюдента с (n х + n у – 2) степенями свободы. Определяется соответствующее экспериментальное значение t экс . Из таблицы критических точек распределения Стьюдента находится критическое значение t кр . Всё решается аналогично гипотезе (I).

IV) Гипотеза о равенстве двух дисперсий нормально распределённых генеральных совокупностей . В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: D (Х ) = D (Y ). Статистикой служит случайная величина , имеющая распределение Фишера – Снедекора с f 1 = n б – 1 и f 2 = n м – 1 степенями свободы (S 2 б – большая дисперсия, объём её выборки n б ). Определяется соответствующее экспериментальное (наблюдаемое) значение F экс . Критическое значение F кр при альтернативной гипотезе Н 1: D (Х ) > D (Y ) находится из таблицы критических точек распределения Фишера – Снедекора по уровню значимости a и числу степеней свободы f 1 и f 2 . Нулевая гипотеза принимается, если F экс < F кр .

Инструкция . Для расчета необходимо указать размерность исходных данных.

V) Гипотеза о равенстве нескольких дисперсий нормально распределённых генеральных совокупностей по выборкам одинакового объёма. В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: D (Х 1) = D (Х 2) = …= D (Х l ). Статистикой служит случайная величина , имеющая распределение Кочрена со степенями свободыf = n – 1 и l (n – объём каждой выборки, l – количество выборок). Проверка этой гипотезы проводится так же, как и предыдущей. Используется таблица критических точек распределения Кочрена.

VI) Гипотеза о существенности корреляционной связи. В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: r = 0. (Если коэффициент корреляции равен нулю, то соответствующие величины не связаны друг с другом). Статистикой в данном случае служит случайная величина
,
имеющая распределение Стьюдента с f = n – 2 числом степеней свободы. Проверка этой гипотезы проводится аналогично проверке гипотезы (I).

Инструкция . Укажите количество исходных данных.

VII) Гипотеза о значении вероятности появления события. Проведено достаточно большое количество n независимых испытаний, в которых событие А произошло m раз. Есть основания полагать, что вероятность наступления данного события в одном испытании равна р 0 . Требуется при уровне значимостиa проверить гипотезу о том, что вероятность события А равна гипотетической вероятности р 0 . (Т.к. вероятность оценивается по относительной частоте, то проверяемую гипотезу можно сформулировать и иначе: значимо или нет различаются наблюдаемая относительная частота и гипотетическая вероятность).
Количество испытаний достаточно велико, поэтому относительная частота события А распределена по нормальному закону. Если нулевая гипотеза верна, то её математическое ожидание равно р 0 , а дисперсия . В соответствии с этим в качестве статистики выберем случайную величину
,
которая распределена приближённо по нормальному закону с нулевым математическим ожиданием и единичной дисперсией. Проверка данной гипотезы осуществляется точно так же, как и в случае (I).

Инструкция . Для расчета необходимо заполнить исходные данные.

Статистика - сложная наука об измерении и анализе различных данных. Как и во многих других дисциплинах, в этой отрасли существует понятие гипотезы. Так, гипотеза в статистике - это какое-либо положение, которое нужно принять или отвергнуть. Причём в данной отрасли есть несколько видов таких допущений, схожих между собой по определению, но отличающихся на практике. Нулевая гипотеза - сегодняшний предмет изучения.

От общего к частному: гипотезы в статистике

От основного определения предположений отходит ещё одно, не менее важное, - статистическая гипотеза есть изучение генеральной совокупности важных для науки объектов, относительно коих учёными делаются выводы. Ее можно проверить с помощью выборки (части генеральной совокупности). Приведём несколько примеров статистических гипотез:

1. Успеваемость всего класса, возможно, зависит от уровня образования каждого учащегося.

2. Начальный курс математики в равной степени усваивается как детьми, пришедшими в школу в 6 лет, так и детьми, пришедшими в 7.

Простой гипотезой в статистике называют такое предположение, которое однозначно характеризует определённый параметр величины, взятой учёным.

Сложная состоит из нескольких или бесконечного множества простых. Указывается некоторая область или нет точного ответа.

Полезно понимать несколько определений гипотез в статистике, чтобы не путать их на практике.

Концепция нулевой гипотезы

Нулевая гипотеза - это теория о том, что есть некие две совокупности, которые не различаются между собой. Однако на научном уровне нет понятия «не различаются», но есть «их сходство равно нулю». От этого определения и было образовано понятие. В статистике нулевая гипотеза обозначается как Н0. Причём крайним значением невозможного (маловероятного) считается от 0.01 до 0.05 или менее.

Лучше разобрать, что такое нулевая гипотеза, пример из жизни поможет. Педагог в университете предположил, что различный уровень подготовки учащихся двух групп к зачётной работе вызван незначительными параметрами, случайными причинами, не влияющими на общий уровень образования (разница в подготовке двух групп студентов равна нулю).

Однако встречно стоит привести пример альтернативной гипотезы - допущения, опровергающего утверждение нулевой теории (Н1). Например: директор университета предположил, что различный уровень в подготовке к зачётной работе у учащихся двух групп вызван применением педагогами разных методик обучения (разница в подготовке двух групп существенна и на то есть объяснение).

Теперь сразу видна разница между понятиями «нулевая гипотеза» и «альтернативная гипотеза». Примеры иллюстрируют эти понятия.

Проверка нулевой гипотезы

Создать предположение - это ещё полбеды. Настоящей проблемой для новичков считается проверка нулевой гипотезы. Именно тут многих и ожидают трудности.

Используя метод альтернативной гипотезы, утверждающей нечто обратное нулевой теории, можно сравнить оба варианта и выбрать верный. Так действует статистика.

Пусть нулевая гипотеза Н0, а альтернативная Н1, тогда:

Н0: c = c0;
Н1: c ≠ c0.

Здесь c - это некое среднее значение генеральной совокупности, которое предстоит найти, а c0 - данное изначально значение, по отношению к которому проверяется гипотеза. Также есть некоторое число Х - среднее значение выборки, по которому определяется c0.

Итак, проверка заключается в сравнении Х и c0, если Х=c0 ,то принимается нулевая гипотеза. Если же Х≠c0, то по условию верной считается альтернативная.

«Доверительный» способ проверки

Существует наиболее действенный способ, с помощью которого нулевая статистическая гипотеза легко проверяется на практике. Он заключается в построении диапазона значений до 95% точности.

Для начала понадобится знать формулу расчёта доверительного интервала:
X - t*Sx ≤ c ≤ X + t*Sx,

где Х - данное изначально число на основе альтернативной гипотезы;
t - табличные величины (коэффициент Стьюдента);
Sx - стандартная средняя ошибка, которая рассчитывается как Sx = σ/√n, где в числителе стандартное отклонение, а в знаменателе - объём выборки.

Итак, предположим ситуацию. До ремонта конвейер в день выпускал 32.1 кг конечной продукции, а после ремонта, как утверждает предприниматель, коэффициент полезного действия вырос, и конвейер, по недельной проверке, начал выпускать 39.6 кг в среднем.

Нулевая гипотеза будет утверждать, что ремонт никак не повлиял на КПД конвейера. Альтернативная гипотеза скажет, что ремонт коренным образом изменил КПД конвейера, поэтому производительность его повысилась.

По таблице находим n=7, t = 2,447, откуда формула примет следующий вид:

39,6 – 2,447*4,2 ≤ с ≤ 39,6 + 2,447*4,2;

29,3 ≤ с ≤ 49,9.

Получается, что значение 32.1 входит в диапазон, а следовательно, значение, предложенное альтернативой - 39.6 - не принимается автоматически. Помните, что сначала проверяется на правильность нулевая гипотеза, а потом - противоположная.

Разновидности отрицания

До этого рассматривался такой вариант построения гипотезы, где Н0 утверждает что-либо, а Н1 это опровергает. Откуда можно было составить подобную систему:

Н0: с = с0;
Н1: с ≠ с0.

Но существует ещё два родственных способа опровержения. К примеру, нулевая гипотеза утверждает, что средняя оценка успеваемости класса больше 4.54, а альтернативная тогда скажет, что средняя успеваемость того же класса менее 4.54. И выглядеть в виде системы это будет так:

Н0: с ⩾ 4.54;
Н1: с < 4.54.

Обратите внимание, что нулевая гипотеза утверждает, что значение больше или равно, а статистическая - что строго меньше. Строгость знака неравенства имеет большое значение!

Статистическая проверка

Статистическая проверка нулевых гипотез заключается в использовании статистического критерия. Такие критерии подчиняются различным законам распределения.

К примеру, существует F-критерий, который рассчитывается по распределению Фишера. Есть T-критерий, чаще всего используемый на практике, зависящий от распределения Стьюдента. Квадратный критерий согласия Пирсона и т. д.

Область принятия нулевой гипотезы

В алгебре есть понятие "область допустимых значений". Это такой отрезок или точка на оси Х, на котором находится множество значений статистики, при которых нулевая гипотеза верна. Крайние точки отрезка - критические значения. Лучи по правую и левую сторону отрезка - критические области. Если найденное значение входит в них, то нулевая теория опровергается и принимается альтернативная.

Опровержение нулевой гипотезы

Нулевая гипотеза в статистике временами очень изворотливое понятие. Во время проверки её можно допустить ошибки двух типов:

1. Отвержение верной нулевой гипотезы. Обозначим первый тип как а=1.
2. Принятие ложной нулевой гипотезы. Второй тип обозначим как а=2.

Стоит понимать, что это не одинаковые параметры, исходы ошибок могут существенно различаться между собой и иметь разные выборки.

Пример ошибок двух типов

Со сложными понятиями легче разобраться на примере.

Во время производства некоего лекарства от учёных требуется чрезвычайная осторожность, так как превышение дозы одного из компонентов провоцирует высокий уровень токсичности готового препарата, от которого пациенты, принимающие его, могут умереть. Однако на химическом уровне выявить передозировку невозможно.
Из-за этого перед тем как выпустить лекарство в продажу, небольшую его дозу проверяют на крысах или кроликах, вводя им препарат. Если большая часть испытуемых умирает, то лекарство в продажу не допускается, если подопытные живы, то лекарство разрешают продавать в аптеках.

Первый случай: на самом деле лекарство было не токсично, но во время эксперимента была допущена оплошность и препарат классифицировали как токсичный и не допустили в продажу. А=1.

Второй случай: в ходе другого эксперимента при проверке другой партии лекарства решено, что препарат не токсичен, и в продажу его допустили, хотя на самом деле препарат был ядовит. А=2.

Первый вариант повлечёт за собой крупные финансовые затраты поставщика-предпринимателя, так как придётся уничтожить всю партию лекарства и начинать с нуля.

Вторая ситуация спровоцирует смерть пациентов, купивших и употреблявших это лекарство.

Теория вероятности

Не только нулевые, но все гипотезы в статистике и экономике разделяют по уровню значимости.

Уровень значимости - процент появления ошибок первого рода (отклонение верной нулевой гипотезы).

Первый уровень - 5% или 0.05, т. е. вероятность ошибиться 5 к 100 или 1 к 20.
второй уровень - 1% или 0.01, т. е. вероятность 1 к 100.
третий уровень - 0.1% или 0.001, вероятность 1 к 1000.

Критерии проверки гипотезы

Если учёным уже был сделан вывод о правильности нулевой гипотезы, то её необходимо подвергнуть проверке. Это необходимо, чтобы исключить ошибку. Существует основной критерий проверки нулевой гипотезы, состоящий из нескольких этапов:

1. Берётся допустимая ошибочная вероятность P=0.05.
2. Подбирается статистика для критерия 1.
3. По известному методу находится область допустимых значений.
4. Теперь вычисляется значение статистики Т.
5. Если Т (статистика) принадлежит области принятия нулевой гипотезы (как в «доверительном» методе), то предположения считаются верными, а значит, и сама нулевая гипотеза остаётся верной.

Именно так действует статистика. Нулевая гипотеза при грамотной проверке будет принята или отвергнута.

Стоит заметить, что для обычных предпринимателей и пользователей первые три этапа бывает очень сложно выполнить безошибочно, поэтому их доверяют профессиональным математикам. Зато 4 и 5 этапы может выполнить любой человек, в достаточной мере знающий статистические методы проверки.

Поделитесь с друзьями или сохраните для себя:

Загрузка...