В каких случаях генеральная совокупность. Генеральная совокупность и выборка

Распределение случайной величины содержит всю информацию о ее статистических свойствах. Много ли нужно знать значений случайной величины, чтобы построить ее распределение? Для этого нужно исследовать ее генеральную совокупность .

Генеральная совокупность - множество всех значений, которые может принимать данная случайная величина.

Число единиц в генеральной совокупности называется ее объемом N . Эта величина может быть конечной и бесконечной. Например, если исследуется рост жителей некоторого города, то объем генеральной совокупности будет равен числу жителей города. Если выполняется любой физический эксперимент, то объем генеральной совокупности будет бесконечным, т.к. число всех возможных значений любого физического параметра равно бесконечности.

Исследование генеральной совокупности не всегда возможно и целесообразно. Оно невозможно, если объем генеральной совокупности бесконечен. Но и при конечных объемах полное исследование не всегда оправдано, поскольку требует больших затрат времени и труда, а абсолютная точность результатов обычно не требуется. Менее точные результаты, но со значительно меньшими затратами сил и средств можно получить при исследовании только части генеральной совокупности. Такие исследования называются выборочными.

Статистические исследования, проводимые только на части генеральной совокупности, называются выборочными, а исследуемая часть генеральной совокупности называется выборкой.

На рисунке 7.2 символически показаны генеральная совокупность и выборка в виде множества и его подмножества.

Рисунок 7.2 Генеральная совокупность и выборка

Работая с некоторым подмножеством данной генеральной совокупности, часто составляющим незначительную ее часть, мы получаем результаты, по точности вполне удовлетворительные для практических целей. Исследование большей части генеральной совокупности только увеличивает точность, но не изменяет сути результатов, если выборка взята правильно со статистической точки зрения.

Для того, чтобы выборка отражала свойства генеральной совокупности и результаты были достоверными, она должна быть репрезентативной (представительной).

У некоторых генеральных совокупностей любая их часть является репрезентативной в силу их природы. Однако в большинстве случаев необходимо принимать специальные меры для обеспечения репрезентативности выборок.

Одним из главных достижений современной математической статистики считается разработка теории и практики метода случай ных выборок, обеспечивающих репрезентативность отбора данных.

Выборочные исследования всегда проигрывают в точности по сравнению с исследованием всей генеральной совокупности. Однако с этим можно примириться, если величина погрешности будет известной. Очевидно, что чем больше объем выборки будет приближаться к объему генеральной совокупности, тем погрешность будет меньшей. Отсюда ясно, что проблемы статистического вывода становятся особенно актуальными при работе с малыми выборками (N ? 10-50).

В результате изучения материала главы 2 обучающийся должен:

знать

  • основные понятия генеральной и выборочной совокупностей;
  • методы оценивания, виды и свойства оценок параметров генеральной совокупности;
  • основные методы статистической проверки гипотез относительно параметров одномерной и многомерной генеральных совокупностей;

уметь

  • находить по выборочным данным оценки параметров одномерной и многомерной генеральных совокупностей;
  • анализировать свойства параметров;
  • проверять гипотезы относительно параметров и вида распределения генеральной совокупности;
  • сравнивать параметры нескольких генеральных совокупностей;

владеть

  • навыками статистического оценивания параметров одномерной и многомерной генеральных совокупностей;
  • навыками проверки гипотез относительно параметров и вида распределения генеральной совокупности при проведении социально-экономических исследований с использованием аналитического программного обеспечения.

Распределение генеральной совокупности

Вероятностно-статистические методы анализа данных предполагают, что закономерности, которым подчиняется исследуемая переменная (случайная величина), полностью определяются комплексом условий ее наблюдения. Математически эти закономерности задаются соответствующим законом распределения вероятностей. Однако при проведении статистических исследований более удобным является понятие генеральной совокупности.

Таким образом, математические понятия "генеральная совокупность", "случайная величина" и "закон распределения вероятностей", соответствующие данному комплексу условий, можно считать в определенном смысле синонимами.

Генеральной совокупностью называют множество всех мыслимых наблюдений, которые могли бы быть произведены при данном комплексе условий .

Поскольку в определении речь идет о мысленно возможных наблюдениях (или объектах), то генеральная совокупность есть понятие абстрактное, и ее не следует смешивать с реальными совокупностями, подлежащими статистическому исследованию. Так, обследовав даже все предприятия подотрасли, мы можем рассматривать их как представителей гипотетически возможной более широкой совокупности предприятий, которые могли бы функционировать в рамках комплекса условий.

Генеральная совокупность может быть как конечной, так и бесконечной. Конечная совокупность имеет место, например, при обследовании семейных бюджетов, когда выборка берется из совокупности семей, фактически имеющихся в стране. Затем осуществляются наблюдения за доходами и расходами отобранных семей. Бесконечная генеральная совокупность наблюдается, например, в научных исследованиях, когда нас интересует средний результат большого числа экспериментов.

В простейшем случае генеральная совокупность есть одномерная случайная величина х с функцией распределения, которая определяет вероятность того, что х примет значение, меньшее фиксированного действительного числа.

В общем случае изучаются генеральные совокупности, включающие несколько признаков (обычно более двух). Рассматриваемое множество признаков обозначается вектором, имеющим k компонент, каждая из которых характеризует соответствующий признак. Для анализа вектора X используются многомерные статистические методы .

Таким образом, объектом исследования в многомерном анализе является случайный вектор X, или случайная точка в ft-мерном евклидовом пространстве, система к случайных (одномерных) величин, ft-мерная случайная величина

Функцией распределения случайного вектора называется детерминированная неотрицательная величина, определяемая по формуле

где-мерный вектор фиксированных действительных чисел.

Детерминированная неотрицательная величина F(X)

Различают:

  • непрерывные k -мерные случайные величины, все компоненты которых – непрерывные (одномерные) случайные величины;
  • дискретные k -мерные случайные величины, все компоненты которых – дискретные случайные величины;
  • смешанные k -мерные случайные величины, среди компонент которых есть как дискретные, так и непрерывные случайные величины.

Функция распределения F(X) для непрерывной k -мерной случайной величины является непрерывной по определению.

Плотность распределения вероятностей непрерывной k -мерной случайной величины удовлетворяет условию

Плотность f(X) обладает следующими свойствами:

Площадь, ограниченная сверху графиком плотности, всегда равна единице:

где через k обозначено общее число (кратность) интегралов;

Вероятность попадания точки () в какую-нибудь область G равна

Из определения плотности следует, что если проинтегрировать совместную плотность распределения двух величин х 1, х 2 по одной, например в бесконечных пределах, то получим плотность распределения вероятностей другой величины:

Аналогично имеем

Плотности вероятностей, функции распределения подсистем, случайных величин системы к случайных величин называют частными или маргинальными распределениями .

Условными распределениями случайного вектора X называются распределения подсистемы, его компонент при условии, что остальные компоненты являются фиксированными. Эти компоненты будут отделяться от нефиксируемых косой чертой.

Для непрерывной случайной величины справедливы, например, формулы, определяющие плотность условного распределения двумерной случайной величины (), являющейся подсистемой системы () при условии, что в ней фиксированы три последние компоненты:

Подсистема, компонент и дополнительная подсистема компонент вектора X называются независимыми (стохастически, вероятностно), если справедливо равенство

В частности, компоненты вектора X называются независимыми , если

В случае независимости справедливы аналогичные формулы для произведений плотностей или вероятностей маргинальных распределений и совпадение условных распределений с соответствующими маргинальными (23].

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm – очень полезный сайт!

Выборочный метод исследования является основным статистическим методом. Это естественно, так как объем изучаемых объектов как правило бесконечен (и даже, если конечен, то весьма затруднительно перебрать все объекты, приходится довольствоваться лишь их частью, выборкой).

Генеральная и выборочная совокупности

Генеральной совокупностью называется совокупность всех исследуемых в данном эксперименте элементов.

Выборочной совокупностью (или выборкой) называется конечная совокупность объектов, случайно отобранных из генеральной совокупности.

Объемом совокупности (выборочной или генеральной) называется число объектов этой совокупности.

Пример генеральной и выборочной совокупностей

Допустим, исследуется психологическая предрасположенность человека к делению данного отрезка в отношении золотого сечения. Так как происхождение самого понятия золотого сечения продиктовано антропометрией человеческого тела, то понятно, что в данном случае генеральной совокупностью является любое антропогенное существо достигшее физической зрелости и приобретшее окончательные пропорции, то есть - вся взрослая часть человечества. Объем этой совокупности практически бесконечен.

Если же эта предрасположенность исследуется исключительно в художественной среде, то генеральная совокупность - это люди, имеющие непосредственное отношение к дизайну: художники, архитекторы, дизайнеры. Таких людей тоже очень много, и можно считать, что объем генеральной совокупности в данном случае тоже бесконечен.

И в том, и в другом случае для исследования мы вынуждены ограничиться разумными объемами выборок, выбирая в качестве представителей той и другой совокупностей студентов технических специальностей (как людей, далеких от художественного мира) или студентов специальности дизайн (как людей, имеющих непосредственное отношение к миру художественных образов).

Репрезентативность

Основной проблемой выборочного метода является вопрос о том, насколько точно объекты, отобранные из генеральной совокупности для исследования, представляют изучаемые характеристики генеральной совокупности, то есть - вопрос о репрезентативности выборки.

Итак, выборка называется репрезентативной (представительной), если она достаточно точно представляет количественные соотношения генеральной совокупности.

Разумеется, трудно сказать, что именно скрывается за расплывчатой формулировкой достаточно точно . Вопросы репрезентативности вообще являются наиболее спорными в любом экспериментальном исследовании. Имеется масса ставших уже классическими примеров, когда недостаточная представительность выборки приводила экспериментаторов к абсурдным результатам.

Как правило, вопросы репрезентативности решаются при помощи экспертной оценки, когда научное сообщество принимает точку зрения группы авторитетных специалистов по поводу корректности проведенного исследования.

Пример репрезентативности

Вернемся к примеру с делением отрезка. Вопросы репрезентативности выборок лежат здесь в самой основе исследования: мы ни в коем случае не должны смешивать группы испытуемых по признаку принадлежности их к художественной среде.

Статистическое распределение наблюдаемого признака

Частота наблюдаемого значения

Пусть в результате испытания в выборке объема наблюдаемый признакпринял значения,, …, причем значениенаблюдалосьраз, значение-раз, и т. д., значениенаблюдалосьраз. Тогда частотой наблюдаемого значенияназывается число, значения- числои т. д.

Относительная частота наблюдаемого значения

Относительной частотой наблюдаемого значенияпризнаканазывается отношение частотык объемувыборки:

Понятно, что сумма частот наблюдаемого признака должна давать объем выборки

а сумма относительных частот должна давать единицу:

Эти соображения можно использовать для контроля при составлении статистических таблиц. Если равенства не соблюдаются, то при протоколировании результатов эксперимента была допущена ошибка.

Статистическое распределение наблюдаемого значения

Статистическим распределением наблюдаемого признака называется соответствие между наблюдаемыми значениями признака и отвечающими им частотами (или относительными частотами).

Как правило, статистическое распределение записывается в виде двухстрочной таблицы, в которой в первой строке указываются наблюдаемые значения признака, а во второй - соответствующие им частоты (или относительные частоты):

Если наблюдаемый признак характеризуется непрерывной случайной величиной , принимающей значения из интервала, то его статистическое распределение описывается частотами попадания в частичные интервалы:

Генеральная совокупность (в англ. - population ) - совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы.

Генеральная совокупность состоит из всех объектов, которые подлежат изучению. Состав генеральной совокупности зависит от целей исследования. Иногда генеральная совокупность - это все население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объект исследования. Например, мужчины 30-50 лет, использующие бритву определённой марки не реже раза в неделю, и имеющие доход не ниже $100 на одного члена семьи.

Выборка или выборочная совокупность - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

Характеристики выборки:

· Качественная характеристика выборки – кого именно мы выбираем и какие способы построения выборки мы для этого используем.

· Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки

· Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.

· Существует необходимость в сборе первичной информации.

Объём выборки

Объём выборки - число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30 – 35.

Зависимые и независимые выборки

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми . Примеры зависимых выборок:

· пары близнецов,

· два измерения какого-либо признака до и после экспериментального воздействия,

· мужья и жёны

· и т. п.

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми , например:

· мужчины и женщины,

· психологи и математики.

Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Сравнение выборок производится с помощью различных статистических критериев:

· t-критерий Стьюдента

· Критерий Уилкоксона

· U-критерий Манна-Уитни

· Критерий знаков

· и др.

Репрезентативность

Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной.

Пример нерепрезентативной выборки

В США одним из наиболее известных исторических примеров нерепрезентативной выборки считается случай, происшедший во время президентских выборов в 1936 году . Журнал «Литрери Дайджест», успешно прогнозировавший события нескольких предшествующих выборов, ошибся в своих предсказаниях, разослав десять миллионов пробных бюллетеней своим подписчикам, а также людям, выбранным по телефонным книгам всей страны и людям из регистрационных списков автомобилей. В 25 % вернувшихся бюллетеней (почти 2,5 миллиона) голоса были распределены следующим образом:

· 57 % отдавали предпочтение кандидату-республиканцу Альфу Лэндону

· 40 % выбрали действующего в то время президента-демократа Франклина Рузвельта

На действительных же выборах, как известно, победил Рузвельт, набрав более 60 % голосов. Ошибка «Литрери Дайджест» заключалась в следующем: желая увеличить репрезентативность выборки, - так как им было известно, что большинство их подписчиков считают себя республиканцами, - они расширили выборку за счёт людей, выбранных из телефонных книг и регистрационных списков. Однако они не учли современных им реалий и в действительности набрали ещё больше республиканцев: во время Великой депрессии обладать телефонами и автомобилями могли себе позволить в основном представители среднего и высшего класса (то есть большинство республиканцев, а не демократов).

Виды плана построения групп из выборок

Выделяют несколько основных видов плана построения групп :

1. Исследование с экспериментальной и контрольной группами, которые ставятся в разные условия.

2. Исследование с экспериментальной и контрольной группами с привлечением стратегии попарного отбора

3. Исследование с использованием только одной группы - экспериментальной.

4. Исследование с использованием смешанного (факторного) плана - все группы ставятся в разные условия.

Типы выборки

Выборки делятся на два типа:

· вероятностные

· невероятностные

Вероятностные выборки

1. Простая вероятностная выборка:

o Простая повторная выборка. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, потом возвращается обратно. Далее процедура повторяется столько раз, какой объём выборки нам необходим. Минус: повторение единиц отбора.

Процедура построения простой случайной выборки включает в себя следующие шаги:

1. необходимо получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки;

2. определить предполагаемый объем выборки, то есть ожидаемое число опрошенных;

3. извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел. Эти случайные числа могут генерироваться компьютерной программой.

4. выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам

· Простая случайная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность. Большинство подходов к получению статистических выводов предусматривают сбор информации с помощью простой случайной выборки. Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения:

1. зачастую сложно создать основу выборочногo наблюдения, которая позволила бы провести простую случайную выборку.

2. результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных.

3. результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов.

4. в результате применения SRS может сформироваться нерепрезентативная выборка. Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объеме выборки.

· Простая бесповторная выборка. Процедура построения выборки такая же, только карточки с номерами респондентов не возвращаются обратно в колоду.

1. Систематическая вероятностная выборка. Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина К определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки). Минусы: такие же как и в простой вероятностной выборке.

2. Серийная (гнездовая) выборка. Единицы отбора представляют собой статистические серии (семья, школа, бригада и т. п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки. Минус: Возможность большей однородности, чем в генеральной совокупности.

3. Районированная выборка. В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.

4. «Удобная» выборка. Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки - с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснована. «Удобную» выборку часто используют для предварительного тестирования анкет.

Невероятностные выборки

Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д.

1. Квотная выборка – выборка строится как модель, которая воспроизводит структуру генеральной совокупности в виде квот (пропорций) изучаемых признаков. Число элементов выборки с различным сочетанием изучаемых признаков определяется с таким расчётом, чтобы оно соответствовало их доле (пропорции) в генеральной совокупности. Так, например, если генеральная совокупность у нас представлена 5000 человек, из них 2000 женщин и 3000 мужчин, тогда в квотной выборке у нас будут 20 женщин и 30 мужчин, либо 200 женщин и 300 мужчин. Квотированные выборки чаще всего основываются на демографических критериях: пол, возраст, регион, доход, образование и прочих. Минусы: обычно такие выборки нерепрезентативны, т.к. нельзя учесть сразу несколько социальных параметров. Плюсы: легкодоступный материал.

2. Метод снежного кома. Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)

3. Стихийная выборка – выборка так называемого «первого встречного». Часто используется в теле- и радиоопросах. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов. Минусы: невозможно установить какую генеральную совокупность представляют опрошенные, и как следствие – невозможность определить репрезентативность.

4. Маршрутный опрос – часто используется, если единицей изучения является семья. На карте населённого пункта, в котором будет производиться опрос, нумеруются все улицы. С помощью таблицы (генератора) случайных чисел отбираются большие числа. Каждое большое число рассматривается как состоящее из 3-х компонентов: номер улицы (2-3 первых числа), номер дома, номер квартиры. Например, число 14832: 14 – это номер улицы на карте, 8 – номер дома, 32 – номер квартиры.

5. Районированная выборка с отбором типичных объектов. Если после районирования из каждой группы отбирается типичный объект, т.е. объект, который по большинству изучаемых в исследовании характеристик приближается к средним показателям, такая выборка называется районированной с отбором типичных объектов.

Стратегии построения групп

Отбор групп для их участия в психологическом эксперименте осуществляется с помощью различных стратегий, которые нужны для того, чтобы обеспечить максимально возможное соблюдение внутренней и внешней валидности .

· Рандомизация (случайный отбор)

· Попарный отбор

· Стратометрический отбор

· Приближённое моделирование

· Привлечение реальных групп

Рандомизация , или случайный отбор , используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза, можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек - это будет случайным отбором (Гудвин Дж., с. 147).

Попарный отбор - стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп с лучшим вариантом - привлечением близнецовых пар (моно- и дизиготных), так как позволяет создать...

Стратометрический отбор - рандомизация с выделением страт (или кластеров). При данном способе формирования выборки генеральная совокупность делится на группы (страты), обладающие определёнными характеристиками (пол, возраст, политические предпочтения, образование, уровень доходов и др.), и отбираются испытуемые с соответствующими характеристиками.

Приближённое моделирование - составление ограниченных выборок и обобщение выводов об этой выборке на более широкую популяцию. Например, при участии в исследовании студентов 2-го курса университета, данные этого исследования распространяются на «людей в возрасте от 17 до 21 года». Допустимость подобных обобщений крайне ограничена.

Приближенное моделирование – формирование модели, которая для четко оговоренного класса систем (процессов) описывает его поведение (или нужные явления) с приемлемой точностью.

Раздел 2. Выборочная и генеральная совокупность

Генеральная и выборочная совокупности.

Статистическая совокупность

Генеральная (включает все единицы наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования.) Генеральная совокупность может рассматриваться не только в пределах конкретных производств или территориальных границ, но также и ограничиваться другими признаками (пол, возраст) и их сочетанием.

Таким образом, в зависимости от цели исследования и его задач изменяются границы генеральной совокупности, для этого используют основные признаки, ее ограничивающие.

Выборочная (часть генеральной совокупности, которая должна быть репрезентативной по отношению к генеральной и наиболее полно отражать ее свойства). На основе анализа выборочной совокупности можно получить достаточно полное представление о закономерностях, присущих всей генеральной совокупности.

Выборочная совокупность должна быть репрезентативной, т. е. в отобранной части должны быть представлены все элементы и в таком же соотношении, как в генеральной совокупности. Иными словами, выборочная совокупность должна отражать свойства генеральной совокупности, т. е. правильно ее представлять. Репрезентативность должна быть количественной и качественной.

Количественная - основана на законе больших чисел и означает достаточную численность элементов выборочной совокупности, расчитываемую по специальным формулам и таблицам.

Качественная - основана на законе вероятности и означает соотвестиве (однотипность) призщнаков, характеризующих элементы выборочной совокупности по отношению к генеральной.

Методы формирования выборки:

-случайная выборка - отбор единиц наблюдния наугад.

-Механическая выборка - арифметический подход к отбору едниц наблдения типологическая выборка - при формировании генеральная совокупность предварительно делится на типы с послед. отбором единиц наблюдения из каждой типичесской группы. При этом число единиц можно отобрать пропорционально численности типической группы и непропорционально- Серийная выборка (гнездовой выбор) - формируется с помощью отбора не отдельных единиц наблюдения, а целых групп, серий, или гнезд, в состав которых входят организованные отдельным образом единицы наблюдения

Метод многоступенчатого отбора - по количеству этапов различают отдноступенчатый, двуступенчатый, терхступенчатый и т.д. метод направленного выбора - позволяет выявить влияние неизвестных факторов при устанавлении влияния известных

Алгоритмы параметрических критериев.

Параметрические критерии применяются для выборок с нормальным законом распределения. Формула расчета этих критериев содержат параметры выборки: среднее, дисперсии и др. Поэтому они называются параметрическими. Нормальность закона распределения должна быть статистически доказана с помощью одного из критериев согласия: критерий Пирсона, F-критерия Фишера, -критерия Колмогорова и др.


В ряде случаев параметрические критерии мощнее непараметрических критериев. У последних выше вероятность возникновения ошибки второго рода – принятия ложной нулевой гипотезы.


К параметрическим методам относятся следующие:

– Критерий Стьюдента

– Критерий Фишера

– Методы однофакторного анализа

– Методы двухфакторного анализа

Критерий Стьюдента


Назначение.
Критерий позволяет оценивать различия средних значений выборок, имеющих нормальное распределение.

Описание критерия.

Критерий применим для сравнения средних значений двух выборок полученных до и после воздействия некоторого фактора.

Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (а руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в журнале «Биометрика» под псевдонимом «Student» (Студент).

Зависимые(связанные) и независимые (несвязанные) выборки

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установитьгомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называютсязависимыми . Примеры зависимых выборок:

  • пары близнецов,
  • два измерения какого-либо признака до и после экспериментального воздействия,
  • мужья и жёны
  • и т. п.

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаютсянезависимыми , например:

  • мужчины иженщины ,
  • психологи иматематики .

Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Двухвыборочный t-критерий для независимых выборок


Для двух несвязанных выборок(наблюдения не относятся к одной и той же группе объектов) возможны два варианта расчета:

    • когда дисперсии известны
    • когда дисперсии неизвестны, но равны друг другу.

Где

квадратичного отклонения. Здесь и – оценки дисперсий.


Рассмотрим сначала равночисленные выборки. В этом случае

В случае наравночисленных выборок , выражение

В обоих случаев подсчет числа степеней свободы осуществляется по формулам

Понятно, что при численном равенстве выборок

Эмпирическое значениекритерия Стьюдента сравнивается с критическим значением(по таблице 1 приложения) для данного числа степеней свободы.


Нулевая гипотеза .

Пример рассчитаем на лабораторной работе.


Пример.

Психолог измерял время сложной сенсомоторной реакции выбора (в мс) в контрольной и экспериментальных группах. В экспериментальную группу (Х) входило 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающиеся спортом. Психолог приверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем та же величина у людей, не занимающихся спортом.



Группы


Отклонения от среднего


Квадраты отклонений

X

Y

1

504

580

-22

-58

484

3368

2

560

692

34

54

1156

2916

3

420

700

-106

62

11236

3844

4

600

621

74

-17

5476

289

5

580

640

54

-2

2916

4

6

530

561

4

-77

16

5929

7

490

680

-36

42

1296

1764

8

580

630

54

-8

2916

64

9

470

-

-56

-

3136

-

Сумма

4734

5104

0

0

28632

18174

Среднее

526

638

Cредне арифметические значенияXи У:, в контрольной группе.

Тогда

^ Число степеней свободы k=9+8-2=15

По таблице приложения для данного числа степеней находим

Строим ось значимости






Т.о. обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,1% уровне или иначе говоря средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше чем в группе людей активно не занимающихся спортом.

В терминах статистических гипотез это утверждение звучит так: гипотеза Н0 о сходстве отклоняется и на 0,1% уровне значимости принимается альтернативная гипотеза Н1 – о различии между экспериментальной и контрольной группой.

Двухвыборочный t-критерий для зависимых(связанных) выборок

Под связанными выборками понимаются наблюдения для одной группы объектов, причем все наблюдения попарно связаны с каждый объектом исследования и характеризуют его состояние до воздействия и после воздействия некоторого фактора.

Гипотезы

: среднее значение в выборке не отличается от нуля.

: среднее значение в выборке отличается от нуля.

1. Предварительно проверяется нормальность закона распределения по одному из критериев согласия.

2. Рассчитывается(i=1..n) – попарные разности вариант,ирезультаты измерений дляi- го объекта до и после воздействия некоторого фактора. Величинубудем считать независимой для разных объектов и нормально распределенной

3. Рассчитываются (лучше в табличной форме): сумма попарных разностейи вспомогательные параметрыи.

4. Рассчитывается- эмпирическое значение критериястепенями свободы по формуле

Где n – численность выборки.

5.Найденное эмпирическое значение критерия Стьюдента сравнивается с критическим значением (по таблице 1 приложения) для данного числа степеней свободы.
Нулевая гипотеза при заданном уровне значимости принимается, если эмпирическое значение .

Критическое значение для выбранной вероятности и заданного числа степеней свободы можно найти по встроенной в Excel функции СТЬЮДРАСПОБР.


Пример.

Психолог предположил, что в результате тренировки, время решения эквивалентных задач (т.е. имеющих один и тот же алгоритм решения) будет значительно уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задачи.


Решение задачи представим в таблице.


Номер испытуемого


1 задача


3 задача

Поделитесь с друзьями или сохраните для себя:

Загрузка...