W jakich przypadkach jest populacja ogólna. Populacja ogólna i próba

Rozkład zmiennej losowej zawiera wszystkie informacje o jej właściwościach statystycznych. Ile wartości zmiennej losowej trzeba znać, aby wykreślić jej rozkład? Aby to zrobić, musisz to zbadać ogólna populacja.

Populacja ogólna – zbiór wszystkich wartości, jakie może przyjąć dana zmienna losowa.

Liczbę jednostek w populacji ogólnej nazywamy jej objętością n... Ta wartość może być skończona lub nieskończona. Na przykład, jeśli zbadany zostanie wzrost liczby mieszkańców określonego miasta, to wielkość populacji ogólnej będzie równa liczbie mieszkańców miasta. Jeśli zostanie przeprowadzony jakikolwiek eksperyment fizyczny, to wielkość populacji ogólnej będzie nieskończona, ponieważ liczba wszystkich możliwych wartości dowolnego parametru fizycznego jest równa nieskończoności.

Badanie populacji ogólnej nie zawsze jest możliwe i celowe. Nie jest to możliwe, jeśli wielkość populacji ogólnej jest nieskończona. Ale nawet przy ograniczonych ilościach pełne badanie nie zawsze jest uzasadnione, ponieważ wymaga dużo czasu i pracy, a absolutna dokładność wyników zwykle nie jest wymagana. Mniej dokładne wyniki, ale przy znacznie mniejszym wysiłku i zasobach, można uzyskać, badając tylko część populacji ogólnej. Takie badania nazywane są selektywnymi.

Badania statystyczne prowadzone tylko na części populacji ogólnej nazywamy próbą, a badaną część populacji ogólnej nazywamy próbą.

Rysunek 7.2 symbolicznie przedstawia populację i próbkę jako zbiór i jego podzbiór.

Rysunek 7.2 Populacja i próbka

Pracując z pewnym podzbiorem danej populacji ogólnej, często stanowiącej jej nieistotną część, otrzymujemy wyniki o dość zadowalającej dokładności do celów praktycznych. Badanie dużej części populacji tylko zwiększa dokładność, ale nie zmienia istoty wyników, jeśli próba jest pobrana poprawnie ze statystycznego punktu widzenia.

Aby próba odzwierciedlała właściwości populacji ogólnej, a wyniki były wiarygodne, musi być przedstawiciel(przedstawiciel).

W niektórych populacjach ogólnych dowolna ich część jest reprezentatywna ze względu na swój charakter. Jednak w większości przypadków należy podjąć specjalne środki, aby zapewnić reprezentatywność próbek.

Jeden jednym z głównych osiągnięć współczesnej statystyki matematycznej jest rozwój teorii i praktyki metody losowego doboru próby, która zapewnia reprezentatywność doboru danych.

Ankiety na próbach zawsze tracą dokładność w porównaniu z sondażami całej populacji ogólnej. Można to jednak pogodzić, jeśli znana jest wielkość błędu. Oczywiście, im bardziej wielkość próby zbliża się do wielkości populacji ogólnej, tym mniejszy będzie błąd. Stąd jasne jest, że problemy wnioskowania statystycznego stają się szczególnie istotne podczas pracy z małymi próbami ( n ? 10-50).

W wyniku przestudiowania materiału z rozdziału 2 student powinien:

wiedzieć

  • podstawowe pojęcia dotyczące populacji ogólnej i próbnej;
  • metody szacowania, rodzaje i właściwości oszacowań parametrów populacji ogólnej;
  • podstawowe metody statystycznego testowania hipotez dotyczących parametrów jednowymiarowych i wielowymiarowych populacji ogólnych;

być w stanie

  • znaleźć, na podstawie danych z próby, szacunki parametrów jednowymiarowych i wielowymiarowych populacji ogólnych;
  • analizować właściwości parametrów;
  • hipotezy testowe dotyczące parametrów i rodzaju rozkładu populacji ogólnej;
  • porównaj parametry kilku populacji ogólnych;

własny

  • umiejętności statystycznej estymacji parametrów jednowymiarowych i wielowymiarowych populacji ogólnych;
  • umiejętność testowania hipotez dotyczących parametrów i rodzaju rozmieszczenia populacji ogólnej podczas prowadzenia badań społeczno-ekonomicznych z wykorzystaniem oprogramowania analitycznego.

Rozmieszczenie ludnosci

Probabilistyczne i statystyczne metody analizy danych zakładają, że prawa rządzące badaną zmienną (zmienną losową) są całkowicie zdeterminowane przez zespół warunków jej obserwacji. Matematycznie te wzorce są ustalone przez odpowiednie prawo rozkładu prawdopodobieństwa. Jednak przy prowadzeniu badań statystycznych wygodniejsze jest pojęcie populacji ogólnej.

Zatem pojęcia matematyczne „populacja ogólna”, „zmienna losowa” i „prawo rozkładu prawdopodobieństwa” odpowiadające danemu zestawowi warunków można w pewnym sensie uznać za synonimy.

Ogólna populacja nazwij zbiór wszystkich wyobrażalnych obserwacji, które mogą być wykonane w danym zbiorze warunków.

Ponieważ definicja dotyczy możliwych mentalnie obserwacji (lub obiektów), populacja ogólna jest pojęciem abstrakcyjnym i nie należy jej mylić z rzeczywistymi populacjami, które są przedmiotem badań statystycznych. Zatem po zbadaniu nawet wszystkich przedsiębiorstw danego podsektora możemy uznać je za przedstawicieli hipotetycznie możliwego szerszego zbioru przedsiębiorstw, które mogłyby funkcjonować w zbiorze warunków.

Ogólna populacja może być skończona lub nieskończona. Ostateczny populacja ma miejsce np. w badaniu budżetów rodzinnych, gdy próba jest pobierana z populacji rodzin faktycznie obecnych w kraju. Dochody i wydatki wybranych rodzin są następnie monitorowane. Nieskończony populację ogólną obserwuje się np. w badaniach naukowych, gdy interesuje nas średni wynik dużej liczby eksperymentów.

W najprostszym przypadku populacja ogólna jest jednowymiarową zmienną losową NS z dystrybuantą określającą prawdopodobieństwo, że NS przyjmie wartość mniejszą niż ustalona liczba rzeczywista.

W ogólnym przypadku badane są populacje ogólne zawierające kilka cech (zwykle więcej niż dwie). Rozważany zbiór cech jest oznaczony przez wektor mający k składnik, z których każdy charakteryzuje odpowiednią cechę. Aby przeanalizować wektor x stosowane są wielowymiarowe metody statystyczne.

Zatem przedmiotem badań w analizie wielowymiarowej jest wektor losowy X, lub losowy punkt w ft-wymiarowej przestrzeni euklidesowej, system Do zmienne losowe (jednowymiarowe), zmienna losowa ft-wymiarowa

Funkcja dystrybucji losowego wektora nazywana jest deterministyczną nieujemną wielkością określoną wzorem

gdzie jest wektorem wymiarowym ustalonych liczb rzeczywistych.

Deterministyczna nieujemna ilość F (X)

Wyróżnić:

  • ciągły k-wymiarowe zmienne losowe, których wszystkie składowe są ciągłymi (jednowymiarowymi) zmiennymi losowymi;
  • dyskretny k-wymiarowe zmienne losowe, których wszystkie składowe są dyskretnymi zmiennymi losowymi;
  • mieszany k-wymiarowe zmienne losowe, wśród których składowych znajdują się zarówno dyskretne, jak i ciągłe zmienne losowe.

Funkcja dystrybucyjna F (X) dla ciągłego k-wymiarowa zmienna losowa jest z definicji ciągła.

Gęstość rozkładu prawdopodobieństwa ciągu ciągłego k-wymiarowa zmienna losowa spełnia warunek

Gęstość f (X) ma następujące właściwości:

Obszar ograniczony u góry wykresem gęstości jest zawsze równy jeden:

gdzie przez k wskazana jest całkowita liczba (wielokrotność) całek;

Prawdopodobieństwo trafienia w punkt () w jakimś obszarze g jest równe

Z definicji gęstości wynika, że ​​jeśli scałkujemy łączną gęstość rozkładu dwóch wielkości NS 1, NS 2 jeden po drugim, na przykład w nieskończonych granicach, to otrzymujemy gęstość prawdopodobieństwa innej wielkości:

Podobnie mamy

Gęstości prawdopodobieństwa, dystrybuanty podsystemów, zmienne losowe systemu Do zmienne losowe nazywane są prywatny lub rozkłady krańcowe .

Rozkłady warunkowe losowy wektor x nazywamy dystrybucją podsystemu, jego komponentów, pod warunkiem, że pozostałe komponenty są stałe. Te elementy zostaną oddzielone od niestałych ukośnikiem.

Na przykład dla zmiennej losowej ciągłej obowiązują wzory określające gęstość rozkładu warunkowego dwuwymiarowej zmiennej losowej () będącej podsystemem układu (), pod warunkiem, że ostatnie trzy składowe są ustalone w to:

Podsystem, składowa i dodatkowy podsystem składowych wektorów x są nazywane niezależny(stochastycznie, probabilistycznie), jeśli równość

W szczególności składowe wektora x są nazywane niezależny, Jeśli

W przypadku niezależności podobne formuły obowiązują dla iloczynów gęstości lub prawdopodobieństw rozkładów krańcowych oraz koincydencji rozkładów warunkowych z odpowiadającymi im rozkładami krańcowymi (23).

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm- bardzo przydatna strona!

Dobór próby badawczej jest główną metodą statystyczną. Jest to naturalne, gdyż objętość badanych obiektów jest zwykle nieskończona (a nawet jeśli jest skończona, to bardzo trudno wyliczyć wszystkie obiekty, trzeba zadowolić się tylko ich częścią, próbką).

Populacja ogólna i próbna

Zbiór ogólny to suma wszystkich elementów badanych w danym eksperymencie.

Populacja próbna (lub próba) to skończony zbiór obiektów losowo wybranych z populacji ogólnej.

Wielkość populacji (próbnej lub ogólnej) to liczba obiektów w tej populacji.

Przykład populacji ogólnej i próbnej

Powiedzmy, że badana jest psychologiczna predyspozycja osoby do dzielenia danego segmentu w stosunku do złotego podziału. Ponieważ pochodzenie samej koncepcji złotego przekroju jest podyktowane antropometrią ciała ludzkiego, jasne jest, że w tym przypadku populacja ogólna to każda istota antropogeniczna, która osiągnęła dojrzałość fizyczną i uzyskała ostateczne proporcje, czyli całość dorosła część ludzkości. Objętość tej kolekcji jest praktycznie nieskończona.

Jeśli tę predyspozycje badać wyłącznie w środowisku artystycznym, to ogółem są osoby bezpośrednio związane z projektowaniem: artyści, architekci, projektanci. Takich osób też jest sporo i możemy założyć, że wielkość populacji ogólnej w tym przypadku również jest nieskończona.

W obu przypadkach do badań jesteśmy zmuszeni ograniczyć się do rozsądnych liczebności próby, wybierając na reprezentantów taką lub inną grupę studentów kierunków technicznych (jako osoby dalekie od świata artystycznego) lub studentów kierunku wzornictwo (jako osoby bezpośrednio spokrewnione). światowym obrazom artystycznym).

Reprezentatywność

Podstawowym problemem metody doboru próby jest pytanie, na ile obiekty wybrane z populacji ogólnej do badań reprezentują badane cechy populacji ogólnej, czyli pytanie o reprezentatywność próby.

Tak więc próba jest nazywana reprezentatywną (reprezentatywną), jeśli wystarczająco dokładnie reprezentuje stosunki ilościowe w populacji ogólnej.

Oczywiście trudno powiedzieć, co dokładnie kryje się za niejasnym sformułowaniem wystarczająco dokładny... Kwestie reprezentatywności są na ogół najbardziej kontrowersyjne w każdym badaniu eksperymentalnym. Jest wiele przykładów, które stały się już klasyczne, kiedy niewystarczająca reprezentatywność próbki doprowadziła eksperymentatorów do absurdalnych wyników.

Z reguły kwestie reprezentatywności rozwiązywane są za pomocą recenzji naukowej, gdy środowisko naukowe akceptuje punkt widzenia grona autorytatywnych specjalistów o poprawności przeprowadzonych badań.

Przykład reprezentatywności

Wróćmy do przykładu podziału na segmenty. Kwestie reprezentatywności próbek leżą tu u samych podstaw opracowania: w żadnym wypadku nie należy mieszać grup podmiotów ze względu na ich przynależność do środowiska artystycznego.

Rozkład statystyczny obserwowanej cechy

Częstotliwość obserwowanych wartości

Załóżmy, że w wyniku testowania w próbce objętości obserwowana cecha przybrała wartości ,, ..., a wartość została zaobserwowana raz, wartość-razy itp., wartość została zaobserwowana raz. Następnie częstotliwość obserwowanej wartości nazywana jest liczbą, wartości są liczbą i tak dalej.

Względna częstotliwość obserwowanej wartości

Względna częstotliwość obserwowanej wartości to stosunek częstotliwości do objętości próbki:

Oczywiste jest, że suma częstości obserwowanej cechy powinna dać wielkość próbki

a suma względnych częstotliwości powinna dać jeden:

Te rozważania można wykorzystać do kontroli podczas kompilowania tabel statystycznych. Jeśli nie obserwuje się równości, popełniono błąd w zapisie wyników eksperymentu.

Rozkład statystyczny obserwowanej wartości

Rozkład statystyczny obserwowanej cechy to zgodność między obserwowanymi wartościami cechy a odpowiadającymi im częstotliwościami (lub częstotliwościami względnymi).

Z reguły rozkład statystyczny jest zapisywany w postaci dwuliniowej tabeli, w której obserwowane wartości cechy są wskazane w pierwszym wierszu, a odpowiednie częstotliwości (lub częstotliwości względne) w drugim:

Jeżeli obserwowana cecha charakteryzuje się ciągłą zmienną losową przyjmującą wartości z przedziału, to jej rozkład statystyczny jest opisany przez częstości trafiania w przedziały cząstkowe:

Ogólna populacja (po angielsku - populacja) - ogół wszystkich obiektów (jednostek), o których naukowiec zamierza wyciągnąć wnioski podczas badania konkretnego problemu.

Populacja ogólna składa się ze wszystkich obiektów, które podlegają badaniu. Skład populacji ogólnej zależy od celów badania. Czasami populacją ogólną jest cała populacja danego regionu (np. gdy badany jest stosunek potencjalnych wyborców do kandydata), najczęściej ustala się kilka kryteriów, które określają przedmiot badań. Na przykład mężczyźni w wieku 30-50 lat, którzy używają określonej marki maszynki do golenia przynajmniej raz w tygodniu i mają dochód co najmniej 100 USD na członka rodziny.

Próbkalub próbka populacji- wiele przypadków (osoby badane, przedmioty, zdarzenia, próbki), z zastosowaniem określonej procedury, wybranych z populacji ogólnej do udziału w badaniu.

Przykładowe cechy:

· Cechy jakościowe próby – kogo dokładnie wybieramy i jakimi metodami konstruowania próby używamy do tego celu.

· Charakterystyka ilościowa próby – ile przypadków wybieramy, czyli wielkość próby.

Konieczność pobierania próbek

· Temat badań jest bardzo obszerny. Na przykład konsumenci produktów globalnej firmy to ogromna liczba rynków rozproszonych geograficznie.

· Istnieje potrzeba zebrania podstawowych informacji.

Wielkość próbki

Wielkość próbki- liczba przypadków uwzględnionych w próbie. Ze względów statystycznych zaleca się, aby liczba przypadków wynosiła co najmniej 30-35.

Próbki zależne i niezależne

Przy porównywaniu dwóch (lub więcej) próbek ich zależność jest ważnym parametrem. Jeżeli możliwe jest ustalenie pary homomorficznej (tj. gdy jeden przypadek z próbki X odpowiada jednemu i tylko jednemu przypadkowi z próbki Y i odwrotnie) dla każdego przypadku w dwóch próbach (i ta podstawa zależności jest ważna dla charakterystyka mierzona na próbkach), takie próbki nazywa się zależny... Przykłady selekcji zależnych:

· pary bliźniaków,

· dwa pomiary dowolnego znaku przed i po ekspozycji eksperymentalnej,

· mężowie i żony

· itp.

Jeśli nie ma takiej zależności między próbkami, to te próbki są brane pod uwagę niezależny, na przykład:

· mężczyźni i kobiety,

· psycholodzy i matematycy.

W związku z tym próbki zależne mają zawsze ten sam rozmiar, podczas gdy objętość próbek niezależnych może się różnić.

Próbki są porównywane przy użyciu różnych kryteriów statystycznych:

· Test t-Studenta

· Test Wilcoxona

· Test U Manna-Whitneya

· Kryterium znaku

· itd.

Reprezentatywność

Próbkę można uznać za reprezentatywną lub niereprezentatywną.

Przykład niereprezentatywnej próbki

W Stanach Zjednoczonych za jeden z najbardziej znanych historycznych przykładów niereprezentatywnego pobierania próbek uważa się wybory prezydenckie w 1936 roku. Magazyn Leitrery Digest, który z powodzeniem przewidział wydarzenia z kilku poprzednich wyborów, mylił się w swoich przewidywaniach, rozesłając dziesięć milionów kart do głosowania do swoich abonentów, a także do osób wybranych z książek telefonicznych w całym kraju i osób z list rejestracyjnych samochodów. W 25% zwróconych kart do głosowania (prawie 2,5 mln) głosy rozdzielono w następujący sposób:

· 57% preferowało kandydata Republikanów, Alfa Landona

· 40% wybrało ówczesnego demokratycznego prezydenta Franklina Roosevelta

Jak wiadomo, Roosevelt wygrał rzeczywiste wybory, zdobywając ponad 60% głosów. Błąd Leitrery Digest polegał na tym, że chcąc zwiększyć reprezentatywność próby — ponieważ wiedzieli, że większość ich abonentów uważa się za Republikanów — rozszerzyli próbkę, wybierając osoby z książek telefonicznych i list rejestracyjnych. Nie brali jednak pod uwagę realiów swoich czasów i de facto zwerbowali jeszcze więcej Republikanów: w okresie Wielkiego Kryzysu stać było głównie przedstawicieli klasy średniej i wyższej (czyli większość Republikanów, a nie Demokratów). na posiadanie telefonów i samochodów.

Rodzaje planów budowania grup z próbek

Istnieje kilka głównych typów planów budowy grup:

1. Badania z grupami eksperymentalnymi i kontrolnymi, które są umieszczone w różnych warunkach.

2. Badanie z grupami eksperymentalnymi i kontrolnymi przy użyciu strategii selekcji parami

3. Badania z wykorzystaniem tylko jednej grupy - eksperymentalnej.

4. Badania w układzie mieszanym (czynnikowym) – wszystkie grupy znajdują się w różnych warunkach.

Typy próbek

Próbki dzielą się na dwa rodzaje:

· probabilistyczny

· nieprawdopodobny

Próbki prawdopodobieństwa

1. Proste próbkowanie probabilistyczne:

oProste ponowne próbkowanie. Zastosowanie takiej próby opiera się na założeniu, że każdy respondent ma jednakowe szanse na włączenie do próby. Na podstawie spisu populacji ogólnej zestawiane są karty z liczebnością respondentów. Umieszcza się je w talii, tasuje i losowo wyciąga z nich kartę, zapisuje numer, a następnie zwraca z powrotem. Następnie procedurę powtarzamy tyle razy, ile potrzebujemy wielkości próbki. Minus: powtórzenie jednostek selekcji.

Procedura konstruowania prostej próby losowej obejmuje następujące kroki:

1. musisz uzyskać pełną listę członków populacji ogólnej i ponumerować tę listę. Przypomnijmy, że taka lista nazywa się operatem losowania;

2. określić oczekiwaną wielkość próby, czyli oczekiwaną liczbę respondentów;

3. wyodrębnij z tabeli liczb losowych tyle liczb, ile potrzebujemy jednostek próby. Jeśli w próbie powinno być 100 osób, z tabeli pobiera się 100 liczb losowych. Te liczby losowe mogą być generowane przez program komputerowy.

4.wybierz z listy bazowej te obserwacje, których numery odpowiadają wypisanym liczbom losowym

· Proste losowe pobieranie próbek ma oczywiste zalety. Ta metoda jest niezwykle łatwa do zrozumienia. Wyniki badań można rozszerzyć na populację docelową. Większość podejść do uzyskiwania wnioskowania statystycznego obejmuje zbieranie informacji za pomocą prostego losowego próbkowania. Jednak prosta metoda losowego doboru próby ma co najmniej cztery istotne ograniczenia:

1. Często trudno jest stworzyć operat losowania, który umożliwia proste losowe losowanie.

2. Prosta próbka losowa może skutkować dużą populacją lub populacją rozłożoną na dużym obszarze geograficznym, co znacznie wydłuża czas i koszt zbierania danych.

3. Wyniki uzyskane przy użyciu prostej próby losowej często charakteryzują się niską precyzją i wyższym błędem standardowym niż wyniki uzyskane przy użyciu innych metod probabilistycznych.

4. Zastosowanie SRS może skutkować niereprezentatywną próbą. Chociaż próbki otrzymane w wyniku prostego doboru losowego średnio adekwatnie reprezentują całą populację, to niektóre z nich są skrajnie niedokładnie reprezentatywne dla badanej populacji. Jest to szczególnie prawdopodobne przy małej wielkości próbki.

· Proste, nie powtarzające się próbkowanie. Procedura losowania jest taka sama, z tym wyjątkiem, że karty z numerami respondenta nie są odkładane z powrotem do talii.

1. Systematyczne próbkowanie prawdopodobieństwa. Jest to uproszczona wersja prostego próbkowania prawdopodobieństwa. Na podstawie listy populacji ogólnej, w określonym przedziale (K) dobierani są respondenci. Wartość K jest określona przez przypadek. Najbardziej wiarygodny wynik uzyskuje się przy jednorodnej populacji ogólnej, w przeciwnym razie wielkość kroku i niektóre wewnętrzne wzorce cykliczne próbki mogą się pokrywać (mieszanie próbki). Wady: Tak samo jak w przypadku prostego próbkowania prawdopodobieństwa.

2. Próbkowanie seryjne (zagnieżdżone). Jednostki próby to serie statystyczne (rodzina, szkoła, zespół itp.). Wybrane elementy poddawane są ciągłym badaniom. Wybór jednostek statystycznych może być zorganizowany według rodzaju losowego lub systematycznego doboru próby. Negatywne: Możliwość większej jednorodności niż w populacji ogólnej.

3. Pobieranie próbek regionalnych. W przypadku populacji niejednorodnej, przed zastosowaniem probabilistyki próbnej jakąkolwiek techniką selekcyjną, zaleca się podzielenie populacji na jednorodne części, taka próba nazywana jest strefową. Grupy strefowe mogą być zarówno formacjami naturalnymi (na przykład dzielnicami miast), jak i dowolnym elementem leżącym u podstaw badania. Charakterystykę, na podstawie której dokonuje się podziału, nazywamy charakterystyką stratyfikacji i regionalizacji.

4. „Wygodny” wybór. Procedura losowania „convenience” polega na nawiązaniu kontaktu z „komfortowymi” jednostkami losowania — grupą studentów, drużyną sportową, przyjaciółmi i sąsiadami. Jeśli konieczne jest uzyskanie informacji o reakcji ludzi na nową koncepcję, taka próbka jest całkiem rozsądna. Wygodne pobieranie próbek jest często wykorzystywane do wstępnego testowania kwestionariuszy.

Próbkowanie nieprawdopodobieństwa

Dobór w takiej próbie odbywa się nie według zasad losowości, ale według kryteriów subiektywnych - dostępności, typowości, równej reprezentacji itp.

1. Próba kwotowa – próba jest budowana jako model odtwarzający strukturę populacji ogólnej w postaci kwot (proporcji) badanych cech. Liczbę elementów próby o różnej kombinacji badanych cech określa się tak, aby odpowiadała ich udziałowi (proporcji) w populacji ogólnej. Tak więc, na przykład, jeśli mamy ogólną populację 5000 osób, z czego 2000 to kobiety, a 3000 to mężczyźni, to w próbie kwotowej będziemy mieli 20 kobiet i 30 mężczyzn lub 200 kobiet i 300 mężczyzn. Próbki kwot są najczęściej oparte na kryteriach demograficznych: płci, wieku, regionie, dochodach, wykształceniu i innych. Minusy: Zazwyczaj takie próbki są niereprezentatywne. kilka parametrów społecznych nie może być uwzględnionych jednocześnie. Plusy: łatwo dostępny materiał.

2. Metoda kuli śnieżnej. Próbka jest skonstruowana w następujący sposób. Każdy respondent, począwszy od pierwszego, proszony jest o kontakty swoich przyjaciół, kolegów, znajomych, którzy pasowaliby do warunków selekcji i mogliby wziąć udział w badaniu. Tak więc, z wyjątkiem pierwszego kroku, próba tworzona jest przy udziale samych obiektów badawczych. Metoda jest często stosowana, gdy konieczne jest znalezienie i przeprowadzenie wywiadu z trudno dostępnymi grupami respondentów (np. respondenci o wysokich dochodach, respondenci należący do tej samej grupy zawodowej, respondenci o podobnych zainteresowaniach/hobbych itp.)

3. Spontaniczne pobieranie próbek - pobieranie próbek z tzw. „pierwszego przybysza”. Często używany w przesłuchaniach telewizyjnych i radiowych. Wielkość i skład próbek spontanicznych nie jest z góry znana i determinowana jest tylko jednym parametrem – aktywnością respondentów. Wady: nie można ustalić, jaką populację reprezentują respondenci, a co za tym idzie nie można określić reprezentatywności.

4. Ankieta trasy – często stosowana, gdy jednostką studiów jest rodzina. Wszystkie ulice są ponumerowane na mapie miejscowości, w której będą prowadzone badania. Duże liczby są wybierane za pomocą tabeli (generatora) liczb losowych. Każda duża liczba jest uważana za składającą się z 3 elementów: numer ulicy (pierwsze 2-3 numery), numer domu, numer mieszkania. Na przykład liczba 14832: 14 to numer ulicy na mapie, 8 to numer domu, 32 to numer mieszkania.

5. Pobieranie próbek regionalnych z wyborem typowych obiektów. Jeżeli po regionalizacji z każdej grupy zostanie wybrany typowy obiekt, tj. obiekt, który zgodnie z większością cech badanych w badaniu zbliża się do średniej, taka próba nazywana jest strefą z wyborem typowych obiektów.

Strategie budowania grup

Dobór grup do udziału w eksperymencie psychologicznym odbywa się za pomocą różnych strategii, które są potrzebne w celu zapewnienia możliwie maksymalnego przestrzegania trafności wewnętrznej i zewnętrznej.

· Randomizacja (wybór losowy)

· Wybór parami

· Próbkowanie stratometryczne

· Przybliżone modelowanie

· Angażowanie prawdziwych grup

Randomizacja, lub losowy wybór, służy do tworzenia prostych próbek losowych. Użycie takiej próby opiera się na założeniu, że każdy członek populacji ma takie samo prawdopodobieństwo, że zostanie włączony do próby. Na przykład, aby zrobić losową próbkę 100 studentów uniwersytetu, możesz włożyć do kapelusza kawałki papieru z nazwiskami wszystkich studentów, a następnie uzyskać z nich 100 kawałków papieru - będzie to losowy wybór (Goodwin J ., s. 147).

Wybór parami- strategia konstruowania grup próbnych, w której grupy podmiotów składają się z podmiotów równoważnych pod względem parametrów ubocznych, które są istotne dla eksperymentu. Ta strategia jest skuteczna w eksperymentach z wykorzystaniem grup eksperymentalnych i kontrolnych z najlepszą opcją - przyciąganiem par bliźniaczych (mono- i dizygotycznych), ponieważ pozwala tworzyć ...

Próbkowanie stratometryczne - randomizacja z alokacją warstw (lub klastrów). Dzięki tej metodzie doboru próby populację ogólną dzieli się na grupy (warstwy) o określonych cechach (płeć, wiek, preferencje polityczne, wykształcenie, poziom dochodów itp.) i wybiera się podmioty o odpowiednich cechach.

Przybliżone modelowanie - sporządzenie ograniczonych prób i uogólnienie wniosków dotyczących tej próby na szerszą populację. Na przykład, gdy w badaniu wzięli udział studenci dwuletni, dane z tego badania zostały rozszerzone na „osoby w wieku od 17 do 21 lat”. Dopuszczalność takich uogólnień jest niezwykle ograniczona.

Modelowanie przybliżone to tworzenie modelu, który dla jasno określonej klasy systemów (procesów) opisuje jego zachowanie (lub niezbędne zjawiska) z akceptowalną dokładnością.

Sekcja 2. Próba i populacja ogólna

Populacja ogólna i próbna.

Populacja statystyczna

Ogólne (obejmuje wszystkie jednostki obserwacji, które można jej przypisać zgodnie z celem badania.) Populację ogólną można rozpatrywać nie tylko w obrębie określonych branż lub granic terytorialnych, ale także ograniczoną innymi cechami (płeć, wiek) oraz ich połączenie.

Tak więc, w zależności od celu badania i jego zadań, zmieniają się granice populacji ogólnej, w tym celu wykorzystuje się główne cechy, które ją ograniczają.

Próba (część populacji ogólnej, która powinna być reprezentatywna dla populacji ogólnej i jak najpełniej odzwierciedlać jej właściwości). Na podstawie analizy populacji próby można uzyskać dość pełny obraz wzorców właściwych dla całej populacji ogólnej.

Próbka musi być reprezentatywna, to znaczy próbka musi zawierać wszystkie elementy iw takim samym stosunku jak w populacji ogólnej. Innymi słowy, próba musi odzwierciedlać właściwości populacji ogólnej, czyli poprawnie ją reprezentować. Reprezentatywność musi być ilościowa i jakościowa.

Ilościowa - oparta na prawie wielkich liczb i oznacza wystarczającą liczbę pierwiastków w próbce, obliczoną według specjalnych wzorów i tabel.

Jakościowy - oparty na prawie prawdopodobieństwa i oznacza zgodność (jednolitość) znaków charakteryzujących elementy próbki w stosunku do populacji ogólnej.

Metody pobierania próbek:

- losowe pobieranie próbek - losowy dobór jednostek obserwacji.

-Pobieranie próbek mechanicznych - arytmetyczne podejście do doboru jednostek obserwacji próbka typologiczna- podczas tworzenia ogólna populacja jest wstępnie podzielona na typy z ostatnim. dobór jednostek obserwacji z każdej typowej grupy. W takim przypadku liczbę jednostek można dobrać proporcjonalnie do wielkości typowej grupy i nieproporcjonalnie - Próbkowanie seryjne (wybór zagnieżdżony)- powstaje poprzez wybieranie nie pojedynczych jednostek obserwacyjnych, ale całych grup, serii lub gniazd, które zawierają jednostki obserwacyjne zorganizowane w odrębny sposób

Wieloetapowa metoda selekcji - w zależności od liczby etapów rozróżnia się jednoetapowe, dwuetapowe, trzyetapowe itp. metoda selekcji ukierunkowanej- pozwala zidentyfikować wpływ nieznanych czynników przy ustalaniu wpływu znanych

Algorytmy dla kryteriów parametrycznych.

Testy parametryczne stosuje się dla próbek o rozkładzie normalnym. Wzór do obliczania tych kryteriów zawiera parametry próbki: średnią, wariancję itp. Dlatego nazywa się je parametrycznymi. Normalność prawa rozkładu musi zostać udowodniona statystycznie przy użyciu jednego z kryteriów dobroci dopasowania: test Pearsona, test F Fishera,-kryterium Kołmogorowa itp.


W niektórych przypadkach testy parametryczne mają większą moc niż testy nieparametryczne. Te ostatnie mają większe prawdopodobieństwo wystąpienia błędu drugiego rodzaju – przyjęcia fałszywej hipotezy zerowej.


Metody parametryczne obejmują:

- Kryterium studenta

- Kryterium Fishera

- Metody analizy jednokierunkowej

- Metody analizy dwuczynnikowej

Kryterium studenta


Spotkanie.
Kryterium pozwala ocenić różnice w wartościach średnich próbek o rozkładzie normalnym.

Opis kryterium.

Kryterium ma zastosowanie do porównania średnich wartości dwóch próbek uzyskanych przed i po wpływie określonego czynnika.

To kryterium zostało opracowane przez Williama Gossetta do oceny jakości piwa w Guinness. W związku z nałożonym na spółkę zobowiązaniem do nieujawniania tajemnic handlowych (a kierownictwo Guinnessa rozważało wykorzystanie w swojej pracy aparatu statystycznego jako takiego), artykuł Gossetta został opublikowany w czasopiśmie „Biometrics” pod pseudonimem „Student” .

Próbki zależne (połączone) i niezależne (niepowiązane)

Przy porównywaniu dwóch (lub więcej) próbek ich zależność jest ważnym parametrem. Jeśli możesz zainstalować homomorficzny parę (tj. gdy jeden przypadek z próbki X odpowiada jednemu i tylko jednemu przypadkowi z próbki Y i odwrotnie) dla każdego przypadku w dwóch próbkach (i ta podstawa zależności jest ważna dla charakterystyki mierzonej na próbkach), takie próbki nazywają się zależny... Przykłady selekcji zależnych:

  • pary bliźniaków,
  • dwa pomiary dowolnego znaku przed i po ekspozycji eksperymentalnej,
  • mężowie i żony
  • itp.

Jeśli nie ma takiej zależności między próbkami, to te próbki są brane pod uwagę niezależny, na przykład:

  • mężczyźni oraz kobiety,
  • psycholodzy oraz matematyka.

W związku z tym próbki zależne mają zawsze ten sam rozmiar, podczas gdy objętość próbek niezależnych może się różnić.

Test t dla dwóch próbek dla próbek niezależnych


Dla dwóch niepowiązanych próbek (obserwacje nie należą do tej samej grupy obiektów) możliwe są dwie opcje obliczeń:

    • kiedy znane są wariancje
    • gdy wariancje są nieznane, ale równe sobie.

Gdzie

odchylenie kwadratowe. Tutaj oraz - oszacowania wariancji.


Rozważ najpierw równe próbki. W tym przypadku

W przypadku jednakowo ponumerowanych próbek , wyrażenie

W obu przypadkach liczbę stopni swobody oblicza się za pomocą wzorów

Oczywiste jest, że przy numerycznej równości próbek

Wartość empiryczną kryterium Studenta porównuje się z wartością krytyczną (zgodnie z tabelą 1 załącznika) dla danej liczby stopni swobody.


Hipoteza zerowa.

Obliczmy przykład w pracy laboratoryjnej.


Przykład.

Psycholog mierzył czas złożonej reakcji wyboru sensomotorycznego (w ms) w grupie kontrolnej i eksperymentalnej. Grupa eksperymentalna (X) składała się z 9 wysoko wykwalifikowanych sportowców. Grupa kontrolna (Y) składała się z 8 osób nie uprawiających sportu. Psycholog potwierdza hipotezę, że średnia szybkość złożonej reakcji sensomotorycznej z wyboru u sportowców jest wyższa od tej samej wartości u osób nieuprawiających sportu.



Grupy


Odchylenia od średniej


kwadraty odchylenia

x

Y

1

504

580

-22

-58

484

3368

2

560

692

34

54

1156

2916

3

420

700

-106

62

11236

3844

4

600

621

74

-17

5476

289

5

580

640

54

-2

2916

4

6

530

561

4

-77

16

5929

7

490

680

-36

42

1296

1764

8

580

630

54

-8

2916

64

9

470

-

-56

-

3136

-

Suma

4734

5104

0

0

28632

18174

Średnia

526

638

Średnie arytmetyczne wartości X i Y:, w grupie kontrolnej.

Następnie

^ Liczba stopni swobody k = 9 + 8 - 2 = 15

Zgodnie z tabelą zastosowań dla danej liczby stopni znajdujemy

Budowanie osi znaczenia






To. Stwierdzone przez psychologa różnice między grupą eksperymentalną a kontrolną są istotne na poziomie powyżej 0,1%, czyli średnia szybkość wyboru złożonej reakcji sensomotorycznej w grupie sportowców jest istotnie wyższa niż w grupie osób którzy nie są aktywnie zaangażowani w sport.

W zakresie hipotez statystycznych stwierdzenie to brzmi tak: odrzuca się hipotezę H0 o podobieństwie i na poziomie istotności 0,1% przyjmuje się hipotezę alternatywną H1 - o różnicy między grupą eksperymentalną a kontrolną.

Test t dla dwóch prób dla próbek zależnych (połączonych)

Próbki skojarzone są rozumiane jako obserwacje dla jednej grupy obiektów, a wszystkie obserwacje są powiązane parami z każdym obiektem badań i charakteryzują jego stan przed ekspozycją i po ekspozycji na określony czynnik.

Hipotezy

: średnia próbki nie różni się od zera.

: Średnia próbki różni się od zera.

1. Normalność prawa dystrybucji jest wstępnie sprawdzana według jednego z kryteriów dobroci dopasowania.

2. Obliczone (i = 1..n) - wariant różnic parami, a wyniki pomiarów dla i- obiekt przed i po oddziaływaniu jakiegoś czynnika. Ilość będzie uważana za niezależną dla różnych obiektów i normalnie rozłożoną

3. Obliczana (najlepiej w formie tabelarycznej): suma różnic parami i parametrów pomocniczych.

4. Jest obliczana - empiryczna wartość kryterium według stopni swobody według wzoru

Gdzie n jest wielkością próbki.

5. Znaleziono znaczenie empiryczne Test studenta jest porównywany z wartością krytyczną(zgodnie z tabelą 1 w załączniku) dla danej liczby stopni swobody.
Hipoteza zerowana danym poziomie istotnościakceptowane, jeśli wartość empiryczna.

Wartość krytyczną dla wybranego prawdopodobieństwa i danej liczby stopni swobody można znaleźć za pomocą wbudowanej funkcji programu Excel TDFRONT.


Przykład.

Psycholog założył, że w wyniku treningu czas rozwiązywania problemów równorzędnych (tj. mając ten sam algorytm rozwiązywania) znacznie się skróci. Aby przetestować hipotezę, porównano czas rozwiązania (w minutach) pierwszego i trzeciego zadania u ośmiu badanych.


Rozwiązanie problemu przedstawiono w tabeli.


Numer tematu


1 zadanie


3 zadania

Udostępnij znajomym lub zachowaj dla siebie:

Ładowanie...