Бутстреп, малые выборки, применение в анализе данных. Типы выборок

В процессе оценки степени представительности данных выборочного наблюдения важное значение приобретает вопрос об объеме выборочной совокупности. выборка пересчет коэффициент стьюдент

От него зависит не только величина пределов, которые с данной вероятностью не превзойдет ошибка выборки, но и способы определения этих пределов.

При большом числе единиц выборочной совокупности () распределение случайных ошибок выборочной средней в соответствии с теоремой Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений.

Вероятность выхода ошибки за определенные пределы оценивается на основе таблиц интеграла Лапласа . Расчет ошибки выборки базируется на величине генеральной дисперсии, так как при больших коэффициент, на который для получения генеральной умножается выборочная дисперсия, большой роли не играет.

В практике статистического исследования часто приходится сталкиваться с небольшими по объему так называемыми малыми выборками.

Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30.

Разработка теории малой выборки была начата английским статистиком В.С. Госсетом (печатавшимся под псевдонимом Стьюдент ) в 1908 г. Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения.

Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента , определяемым по формуле

где - мера случайных колебаний выборочной средней в

малой выборке.

Величина вычисляется на основе данных выборочного наблюдения:

Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки в генеральной совокупности.

При небольшой численности выборки распределение Стьюдента отличается от нормального: большие величины критерия имеют здесь большую вероятность, чем при нормальном распределении.

Предельная ошибка малой выборки в зависимости от средней ошибки представлена как

Но в данном случае величина иначе связана с вероятной оценкой, чем при большой выборке.

Согласно распределению Стьюдента , вероятная оценка зависит как от величины, так и от объема выборки в случае, если предельная ошибка не превысит среднюю ошибку в малых выборках.

Таблица 3.1 Распределение вероятности в малых выборках в зависимости от коэффициента доверия и объема выборки


Как видно из табл. 3.1 , при увеличении это распределение стремится к нормальному и при уже мало от него отличается.

Покажем, как пользоваться таблицей распределения Стьюдента.

Предположим, что выборочное обследование рабочих малого предприятия показало, что на выполнение одной из производственных операций рабочие затрачивали времени (мин.): . Найдем выборочные средние затраты:

Выборочная дисперсия

Отсюда средняя ошибка малой выборки

По табл. 3.1 находим, что для коэффициента доверия и объема малой выборки вероятность равна.

Таким образом, с вероятностью можно утверждать, что расхождение между выборкой и генеральной средней лежит в пределах от до, т.е. разность не превысит по абсолютной величине ().

Следовательно, средние затраты времени во всей совокупности будут находиться в пределах от до.

Вероятность того, что это предположение в действительности неверно и ошибка по случайным причинам будет больше, чем, равна: .

Таблица вероятностей Стьюдента часто приводится в иной форме, нежели в табл.3.1 . Считается, что в ряде случаев такая форма более удобна для практического использования (табл. 3.2 ).

Из табл. 3.2 следует, что для каждого числа степеней свободы указана предельная величина, которая с данной вероятностью не будет превышена в силу случайных колебаний результатов выборки.

На основе указанной в табл. 3.2 величины определяются доверительные интервалы : и.

Это область тех значений генеральной средней, выход за пределы которой имеет весьма малую вероятность, равную:

В качестве доверительной вероятности при двусторонней проверке используют как правило, или, что не исключает, однако, выбора и других, не приведенных в табл. 3.2 .

Таблица 3.2 Некоторые значения -распределения Стьюдента

Вероятности случайного выхода оцениваемой средней величины за пределы доверительного интервала соответственно будут равны и, т.е. весьма малы.

Выбор между вероятностями и является до известной степени произвольным. Этот выбор во многом определяется содержанием тех задач, для решения которых применяется малая выборка.

В заключение отметим, что расчет ошибок в малой выборке мало отличается от аналогичных вычислений большой выборке. Различие заключается в том, что при малой выборки вероятность нашего утверждения несколько меньше, чем при больше выборке (в частности, в приведенном ранее примере и соответственно).

Однако все это не означает, что можно использовать малую выборку тогда, когда нужна большая выборка. Во многих случаях расхождения между найденными пределами могут достигать значительных размеров, что вряд ли удовлетворяет исследователей. Поэтому малую выборку следует применять в статистическом исследовании социально-экономических явлений с большой осторожностью, при соответствующем теоретическом и практическом обосновании.

Итак, выводы по результатам малой выборки имеют практическое значение лишь при условии, что распределение признака в генеральной совокупности является нормальным или асимптотически нормальным. Необходимо также принимать во внимание и то, что точность результатов выборки малого объема все же ниже, чем при большой выборке.

На практике довольно часто приходится иметь дело с выборками весьма малого объема, численности которых значительно меньше двадцати - тридцати. Такие выборки в статистике получили название малых выборок. Необходимость специального рассмотрения малых выборок вызвана тем, что разобранные выше методы точечной и интервальной оценки выборочных характеристик предполагают достаточно большую численность выборок.

Понятие о малых выборках. Распределение Стьюдента

Выборочная средняя и, соответственно, ее ошибка распределены нормально, а поправка на величину смещения выборочной дисперсии очень близка к единице и не имеет практического значения. Ошибка выборки в этих условиях очень редко превышает величину. Иное дело при небольшом объеме выборки. При малых выборках выборочная дисперсия оказывается значительно смещенной. Поэтому применять функцию нормального распределения для вероятностных выводов о возможной величине ошибки было бы неправомерно. При малом объеме выборки всегда нужно пользоваться несмещенной оценкой дисперсии:

Следовательно, для получения несмещенной оценки дисперсии по данным малой выборки сумму квадратов отклонений нужно делить на величину. Эта величина называется числом степеней свободы вариации. В дальнейшем для краткости число степеней свободы вариации будет обозначаться греческой буквой (ню).

Проблема оценки выборочных характеристик на основе малых выборок впервые была исследована английским математиком статистиком В. Госсетом, публиковавшим свои работы под псевдонимов Стьюдент (1908 г.).

Исходя из предложения о нормальности распределения признака в генеральной совокупности и рассматривая вместо абсолютных отклонений их отношения к независимому стандарту, Стьюдент нашел распределение, которое зависит только от численности выборки. Позже (1925 г.) Р. Фишер дал более строгое доказательство этого распределения, которое получило название распределение Стьюдента.

Величина Стьюдента выражается как следующее отношение:

В числителе выражения фигурирует переменная величина, которая отражает возможные значения отклонений выборочных средних от генеральной средней. Величина распределена нормально с центром, равным нулю, и дисперсией, равной.

Следует особо подчеркнуть, что знаменатель выражения нельзя рассматривать как среднюю ошибку переменной. Величина рассматривается здесь как независимо распределенная от числителя переменная. означает среднее квадратическое (стандартное) отклонение данной выборки и не является оценкой генеральной совокупности, так как распределение Стьюдента не зависит ни от одного параметра генеральной совокупности. определяется по данным выборки как

Распределения независимы друг от друга. Только при этом условии и для выборок из нормальных совокупностей имеет место распределение Стьюдента.

Основное преимущество распределения Стьюдента состоит в том, что оно не зависит от параметров генеральной совокупности и имеет дело только с величинами, полученными непосредственно из выборки.

Дифференциальный закон распределение Стьюдента (плотность вероятности) имеет вид:

где объем выборки;

величина соответствующая максимальной ординате кривой распределения при t = 0.

Соответственно функция распределения Стьюдента выражается:

Иначе говоря,

где t ф стандартизированная (нормированная) разность, вычисляемая по результатам малой выборки.

Величины Г() и Г() являются гамма- функциями. Для некоторого числа гамма - функция выражается несобственным интегралом:

В малых выборках всегда целое положительное число (объем выборки).

В этом случае гамма - функция всегда имеет конечную величину и выражается через факториалы:

следовательно:

При вычислении гамма - функции полезно знать следующие свойства:

1) При есть;

  • 3) Например,

Используя это свойство, легко можно вычислить значения Г() и Г() в выражении плотности распределения;

4) Функция достигает минимума при дробном значении

Рис 3.1

Общий вид гамма - функции показан на рис. 3.1.

Из свойств распределения Стьюдента, рассматриваемых обычно в курсе теории вероятностей, обращается внимание на следующее:

1) Распределение Стьюдента замечательно тем, что зависит только от одного параметра - объема выборки и не зависит от средней и дисперсии генеральной совокупности (в отличие от нормального распределения, зависящего о этих двух параметров).

  • 2) Распределение Стьюдента точно для любого объема выборки следовательно, и для малых выборок, что позволяет делать вероятностные выводы по малому числу наблюдений.
  • 3) При увеличении объема выборки величина приближается к значению, а распределение Стьюдента приближается к нормальному. При распределение Стьюдента становится нормальным. Практически для нормального приближения считается достаточным.

Рис 3.2

На рис. 3.2 показаны соотношения между распределением Стьюдента и нормальным распределением.

Как видно из рис. 3.2, под концами кривой распределения Стьюдента, например или, расположена значительно большая часть площади, чем под кривой нормального распределения при тех же значениях. Это значит, что при малом объеме выборок вероятность допущения больших ошибок заметно увеличивается. Из рисунка видно, что при значениях нормированного отклонения, превышающих по абсолютному значению, площадь под кривой распределения Стьюдента гораздо больше, чем под кривой нормального распределения.

О величине расхождений между значениями функции распределения Стьюдента в зависимости от объема выборки и значениями нормальной функции распределения можно судить по данным табл. 3.2, где приведены значения площадей под кривой распределения от при разной численности выборки при.

Таблица 3.1

Значение нормальной функции распределения

Таблица 3.2

Значения вероятностей при разном объеме выборки

Нормированное отклонение

Значение при малых выборках с численностями

Значение при больших выборках

Из таблицы 3.2. видно, что с увеличением объема выборки малая выборка быстро приближается к нормальной. В то же время при очень маленькой численности выборки расхождения между значениями при данном значении весьма значительны.

Исследованиями было установлено, что распределение Стьюдента практически применимо не только в случае нормального распределения признака в генеральной совокупности. Оказалось, что оно происходит к практически приемлемым выводам и тогда, когда распределения признака в генеральной совокупности не является нормальным, а лишь симметрично и даже несколько асимметрично, но объем выборки не слишком мал.

Значения функции распределения Стьюдента затабулированы при различных значениях Поэтому при оценке выборочных характеристик пользуются готовыми таблицами:

Таблица 3.3

Таблица значений функции

Значения функции распределения Стьюдента могут быть использованы различными способами в зависимости от характера решаемых задач при определении вероятности отклонения выборочной от генеральной. Наиболее часто используются:

1) Определение вероятности того, что разность между выборочной средней и генеральной средней окажется меньше на некоторую заданную величину. В нормированных отклонениях задача сводится к определению вероятности того, что окажется меньше значения, задаваемого условиями задачи, т.е. к нахождению значения

Рис 3.3

Это есть вероятность больших отрицательных отклонений, которая на рис. 3.3 соответствует заштрихованной площади.

2) Определение вероятности того, что разность между выборочной средней и средней генеральной окажется не менее некоторой заданной величины, иначе говоря, следует найти

Рис 3.4

Это есть вероятность больших положительных отклонений, которая показана в виде заштрихованной площади на рис. 3.4. эту вероятность легко найти, используя таблицы.

3) Определение вероятности того, что нормированное отклонение по абсолютной величине окажется менее, выражается

Это есть вероятность меньших по абсолютной величине отклонений. Эта вероятность может быть определена с использованием таблиц. Поскольку на практике чаще всего приходится определять эту вероятность, составленной специальной таблицы значения (табл. 3.3).

Графическая иллюстрация вероятности меньших по абсолютной величине отклонений дана на рис. 3.5

Рис 3.5

4) Определение вероятности того, что ошибка выборки по абсолютной величине окажется не менее некоторой заданной величины. В нормированных единицах вероятность того, что по абсолютной величине окажется не менее, выразится

Это есть вероятность больших по абсолютной величине отклонений. Графически она иллюстрируется на рис. 3.6.

Рис 3.6

Для нахождения вероятности больших по абсолютной величине отклонений имеются специальные таблицы (приложение 3). Эту вероятность легко можно вычислить, также используя таблицы.

  • 6. Виды статистических группировок, их познавательное значение.
  • 7.Статистические таблицы: виды, правила построения, приемы чтения
  • 8.Абсолютные величины: виды, познавательное значение. Условия научного использования абсолютных и относительных показателей.
  • 9. Средние величины: содержание, типы, виды, научные условия применения.
  • 11.Свойства дисперсии. Правило сложения (разложения) дисперсии и его использование в статистическом анализе.
  • 12.Виды статистических графиков по содержанию решаемых задач и способам построения.
  • 13. Ряды динамики: виды, показатели анализа.
  • 14. Методы выявления тенденции в динамических рядах.
  • 15. Индексы: определение, основные элементы индексов, задачи, решаемые при помощи индексов, система индексов в статистике.
  • 16. Правила построения динамических и территориальных индексов.
  • 17. Основы теории выборочного метода.
  • 18. Теория малых выборок.
  • 19. Способы отбора единиц в выборочную совокупность.
  • 20.Виды связей, статистические методы анализа взаимосвязей, понятие корреляции.
  • 21.Содержание корреляционного анализа, корреляционные модели.
  • 22.Оценка силы (тесноты) корреляционной связи.
  • 23. Система показателей социально-экономической статистики.
  • 24. Основные группировки и классификации в социально-экономической статистике.
  • 25. Национальное богатство: содержание категории и состав.
  • 26. Содержание земельного кадастра. Показатели состава земель по формам собственности, целевому назначению и видам угодий.
  • 27. Классификация основных фондов, способы оценки и переоценки, показатели движения, состояния и использования.
  • 28. Задачи статистики труда. Понятие и содержание основных категорий рынка труда.
  • 29. Статистика использования рабочей силы и рабочего времени.
  • 30. Показатели производительности труда и методы анализа.
  • 31. Показатели производства продукции растениеводства и урожайности с.-х. Культур и угодий.
  • 32.Показатели производства продукции животноводства и продуктивности сельскохозяйственных животных.
  • 33.Статистика общественных затрат и себестоимости продукции.
  • 34.Статистика оплаты труда и расходов на рабочую силу.
  • 35.Статистика валовой продукции и доходов.
  • 36.Показатели движения и реализации продукции сельского хозяйства.
  • 37.Задачи статистического анализа сельскохозяйственных предприятий.
  • 38.Статистика цен и товаров отраслей народного хозяйства: задачи и методы анализа.
  • 39.Статистика рынка товаров и услуг.
  • 40.Статистика показателей общественного производства.
  • 41.Статистический анализ цен потребительского рынка.
  • 42.Статистика инфляции и основные показатели ее оценки.
  • 43.Задачи статистики финансов предприятий.
  • 44.Основные показатели финансовых результатов предприятий.
  • 45.Задачи статистики государственного бюджета.
  • 46. Система показателей статистики государственного бюджета.
  • 47. Система показателей статистики денежного обращения.
  • 48. Статистика состава и структуры денежной массы в стране.
  • 49. Основные задачи банковской статистики.
  • 50.Основные показатели банковской статистики.
  • 51.Понятие и классификация кредита. Задачи его статистического изучения.
  • 52.Система показателей статистики кредита.
  • 53.Основные показатели и методы анализа сберегательного дела.
  • 54.Задачи статистики фондового рынка и ценных бумаг.
  • 56.Статистика товарных бирж: задачи и система показателей.
  • 57.Система национальных счетов: понятия, основные категории и классификация.
  • 58.Основные принципы построения снс.
  • 59.Основные макроэкономические показатели – содержание, методы определения.
  • 60.Межотраслевой баланс: понятия, задачи, виды моб.
  • 62.Статистика доходов и расходов населения
  • 18. Теория малых выборок.

    При большом числе единиц выборочной совокупности (n >100) распределение случайных ошибок выборочной средней в соответствии с теоремой А.М.Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений.

    Однако в практике статистического исследования в условиях рыночной экономики все чаще приходится сталкиваться с малыми выборками.

    Малой выборкой называется такое выборочное наблюдение, численность единиц которого не превышает 30.

    При оценке результатов малой выборки величина генеральной совокупности не используется. Для определения возможных пределов ошибки пользуются критерием Стьюдента.

    Величина σ вычисляется на основе данных выборочного наблюдения.

    Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки σ в генеральной совокупности.

    Вероятностная оценка результатов малой выборки отличается от оценки в большой выборке тем, что при малом числе наблюдений распределение вероятностей для средней зависит от числа отобранных единиц.

    Однако для малой выборки величина коэффициента доверия t по другому связана с вероятностной оценкой, чем при большой выборке (так как, закон распределения отличается от нормального).

    Согласно установленному Стьюдентом закону распределения, вероятная ошибка распределения зависит как от величины коэффициента доверия t , так и от объема выборки В.

    Средняя ошибка малой выборки вычисляется по формуле:

    где - дисперсия малой выборки.

    В МВ коэффициент n/(n-1) нужно брать во внимание и обязательно корректировать. При определении дисперсии S2 число степеней свободы равно:

    .

    Предельная ошибка малой выборки определяется по формуле

    При этом значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Для отдельных значений t и n доверительная вероятность малой выборки определяется по специальным таблицам Стьюдента, в которых даны распределения стандартизированных отклонений:

    Вероятностная оценка результатов МВ отличается от оценки в БВ тем что при малом числе наблюдений распределение вероятностей для средней зависит от числа отобранных единиц

    19. Способы отбора единиц в выборочную совокупность.

    1. Выборочная совокупность должна быть достаточно большой по численности.

    2. Структура выборочной совокупности должна наилучшим образом отражать структуру гнеральной совокупности

    3. Способ отбора должен быть случайным

    В зависимости от того участвуют ли отобранные единицы в выборке различают метод - бесповторный и повторный.

    Бесповторным называется такой отбор, при котором попавшая в выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор.

    Расчет средней ошибки бесповторной случайной выборки:

    Расчет предельной ошибки бесповторной случайной выборки:

    При повторном отборе попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную (генеральную) совокупность для участия в дальнейшей процедуре отбора.

    Расчет средней ошибки повторной простой случайной выборки производится следующим образом:

    Расчет предельной ошибки повторной случайной выборки:

    Вид формирования выборочной совокупности подразделяется на - индивидуальный, групповой и комбинированный.

    Способ отбора – определяет конкретный механизм выборки единиц из генеральной совокупности и подразделяется на: собственно – случайный; механический; типический; серийный; комбинированный.

    Собственно – случайный наиболее распространенный способ отбора в случайной выборке, его еще называют методом жеребьевки, при нем на каждую единицу статистической совокупности заготовляется билет с порядковым номером. Далее в случайном порядке отбирается необходимое количество единиц статистической совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку.

    Механическая выборка . Применяется в тех случаях, когда генеральная совокупность каким – либо образом упорядочена т. е. имеется определенная последовательность в расположении единиц.

    Для определения средней ошибки механической выборки используется формула средней ошибки при собственно – случайном бесповторном отборе.

    Типический отбор . Используется когда все единицы генеральной совокупности можно разбить на несколько типических групп. Типический отбор предполагает выборку единиц из каждой группы собственно – случайным или механическим способом.

    Для типической выборки величина стандартной ошибки зависит от точности определения групповых средних. Так, в формуле предельной ошибки типической выборки учитывается средняя из групповых дисперсий, т.е.

    Серийный отбор . Применяется в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. Сущность серийной выборки заключается в собственно случайном либо механическом отборе серий, внутри которых производится сплошное обследование единиц.

    При серийной выборке величина ошибки выборки зависит не от числа исследуемых единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии:

    Комбинированный отбор может проходить одну или несколько ступеней. Выборка называется одноступенчатой, если отобранные однажды единицы совокупности подвергаются изучению.

    Выборка называется многоступенчатой , если отбор совокупности проходит по ступеням, последовательным стадиям, причем каждая ступень, стадия отбора имеет свою единицу отбора.

    "

    В практике статистических исследований часто приходится сталкиваться с малыми выборками , которые имеют объем менее 30 единиц. К большим же обычно относят выборки объемом свыше 100 единиц.

    Обычно малые выборки применяются в случаях, когда невозможно или нецелесообразно использовать большую выборку. Иметь дело с такими выборками приходится, например, при опросах туристов и посетителей гостиниц.

    Величина ошибки малой выборки определяется по формулам, отличающимся от формул для сравнительно большого объема выборки ().

    При малом объеме выборки n следует учитывать взаимосвязь между выборочной и генеральной дисперсией :

    Так как при малой выборке дробь имеет существенное значение, то вычисление дисперсии производится с учетом, так называемого числа степеней свободы . Оно понимается как число вариантов , которые могут принимать произвольные значения, не меняя величины средней .

    Средняя ошибка малой выборки определяется по формуле:

    Предельная ошибка выборки для средней и доли находится аналогично случаю большой выборки:

    где t – коэффициент доверия, зависящий от заданного уровня значимости и числа степеней свободы (Приложение 5).

    Значения коэффициента зависят не только от заданной доверительной вероятности , но и от объема выборки n . Для отдельных значений t и n доверительная вероятность определяется по распределению Стьюдента, которое содержит распределения стандартизованных отклонений:

    Замечание. По мере увеличения объема выбор­ки распределение Стьюдента приближается к нормальному распределению: при n =20 оно уже мало отличается от нормального распределе­ния. При проведении малых выборочных обследований следует учесть, что чем меньше объем выборки n , тем больше раз­личие между распределением Стьюдента и нормальным рас­пределением. Например, при п min . = 4 это различие весьма существенно, что говорит об уменьшении точности результатов малой выборки.

    Распространение выборочных характеристик на генеральную совокупность, основанное на действии закона больших чисел, предполагает достаточно большой объем выборки. Однако в практике статистического исследования часто приходится сталкиваться с невозможностью по тем или иным причинам увеличить численность единиц выборки, имеющей небольшой объем. Это касается изучения деятельности предприятий, учебных заведений, коммерческих банков и т.д., число которых в регионах, как правило, незначительно, а иногда составляет всего 5-10 единиц.

    В том случае когда выборочная совокупность состоит из небольшого числа единиц, менее 30, выборку называют малой. В этом случае для расчета ошибки выборки нельзя пользоваться теоремой Ляпунова, так как на выборочную среднюю значительное влияние оказывает величина каждой из случайно отобранных единиц и ее распределение может существенно отличаться от нормального.

    В 1908 году В.С. Госсет доказал, что оценка расхождения между выборочной средней малой выборки и генеральной средней имеет особый закон распределения (см. главу 4). Занимаясь проблемой вероятностной оценки выборочной средней при небольшом числе наблюдений, он показал, что в этом случае нужно рассматривать распределение не самих выборочных средних, а величин их отклонений от средней исходной совокупности. В этом случае заключения могут быть достаточно надежными.

    Открытие Стьюдента называют теорией малых выборок.

    При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. В малых выборках для расчета средней ошибки выборки применяют «исправленную» выборочную дисперсию:

    т.е. в отличие от больших выборок в знаменателе вместо п стоит (и - 1). Расчет средней ошибки выборки для малой выборки приведен в табл. 5.7.

    Таблица 5.7

    Расчет средней ошибки малой выборки

    Предельная ошибка малой выборки равна: где t - коэффициент доверия.

    Величина t иначе связана с вероятной оценкой, чем при большой выборке. В соответствии с распределением Стьюдента вероятная оценка зависит как от величины t, так и от объема выборки я в случае, если предельная ошибка не превысит г-кратную среднюю ошибку в малых выборках. Однако в большей степени она зависит от числа отобранных единиц.

    В.С. Госсет составил таблицу распределения вероятностей в малых выборках, соответствующих данным значениям коэффициента доверия t и разным объемам малой выборки и, выдержка из нее приведена в табл. 5.8.

    Таблица 5.8

    Фрагмент таблицы вероятностей Стьюдента (вероятности умножены на 1000)

    Данные табл. 5.8 свидетельствуют о том, что при неограниченном возрастании объема выборки (я = °°) распределение Стьюдента стремится к нормальному закону распределения, а при я = 20 уже мало от него отличается.

    Таблица распределения Стьюдента часто приводится в другой форме, более удобной для практического применения (табл. 5.9).

    Таблица 5.9

    Некоторые значения (-распределения Стьюдента

    Число степеней свободы

    для одностороннего интервала

    для двустороннего интервала

    Р= 0,99

    Рассмотрим, как пользоваться таблицей ^распределения. Каждому фиксированному значению п вычисляют число степеней свободы k , где k = п - 1. Для каждого значения степени свободы указана предельная величина t p (t 095 или t 0 99), которая с данной вероятностью Р не будет превышена в силу случайных колебаний результатов выборки. На основе величины t p определяются границы доверительного

    интервала

    В качестве доверительной вероятности при двусторонней проверке, как правило, используют Р = 0,95 или Р = 0,99, что не исключает выбора и других значений вероятностей. Значение вероятности выбирается исходя из конкретных требований задач, для решения которых применяется малая выборка.

    Вероятность выхода значений генеральной средней за пределы доверительного интервала равна q, где q = 1 - р. Это значение весьма мало. Соответственно для рассмотренных вероятностей р оно составляет 0,05 и 0,01.

    Малые выборки имеют широкое распространение в технических науках, в биологии, но применять их в статистических исследованиях нужно с большой осторожностью, только при соответствующем теоретическом и практическом обследовании. Использовать малую выборку можно только в том случае, если распределение признака в генеральной совокупности является нормальным или близким к нему, а средняя величина вычисляется по выборочным данным, полученным в результате независимых наблюдений. Кроме того, следует иметь в виду, что точность результатов выборки малого объема ниже, чем при большой выборке.

    Поделитесь с друзьями или сохраните для себя:

    Загрузка...