V akých prípadoch je bežná populácia. Všeobecná populácia a vzorka

Rozdelenie náhodnej premennej obsahuje všetky informácie o jej štatistických vlastnostiach. Koľko hodnôt náhodnej premennej potrebujete poznať, aby ste mohli vykresliť jej rozdelenie? Ak to chcete urobiť, musíte to preskúmať všeobecná populácia.

Všeobecná populácia - súbor všetkých hodnôt, ktoré môže daná náhodná premenná nadobudnúť.

Počet jednotiek v bežnej populácii sa nazýva jej objem N... Táto hodnota môže byť konečná alebo nekonečná. Napríklad, ak sa skúma rast obyvateľov určitého mesta, potom sa objem bežnej populácie bude rovnať počtu obyvateľov mesta. Ak sa vykoná akýkoľvek fyzikálny experiment, objem bežnej populácie bude nekonečný, od r počet všetkých možných hodnôt akéhokoľvek fyzického parametra sa rovná nekonečnu.

Štúdium bežnej populácie nie je vždy možné a účelné. Je to nemožné, ak je objem bežnej populácie nekonečný. Ale aj pri konečných objemoch nie je úplná štúdia vždy opodstatnená, pretože si vyžaduje veľa času a práce a absolútna presnosť výsledkov sa zvyčajne nevyžaduje. Menej presné výsledky, ale s podstatne menšou námahou a prostriedkami možno získať pri vyšetrovaní len časti bežnej populácie. Takéto štúdie sa nazývajú selektívne.

Štatistické štúdie realizované len na časti všeobecnej populácie sa nazývajú vzorka a študovaná časť všeobecnej populácie sa nazýva vzorka.

Obrázok 7.2 symbolicky znázorňuje populáciu a vzorku ako súbor a jeho podmnožinu.

Obrázok 7.2 Populácia a vzorka

Pri práci s určitou podmnožinou danej všeobecnej populácie, ktorá často tvorí jej nepodstatnú časť, dostaneme výsledky, ktoré sú z hľadiska presnosti pre praktické účely celkom uspokojivé. Skúmanie veľkej časti populácie len zvyšuje presnosť, ale nemení podstatu výsledkov, ak je vzorka zo štatistického hľadiska odobratá správne.

Aby vzorka odrážala vlastnosti bežnej populácie a výsledky boli spoľahlivé, musí byť reprezentatívny(reprezentatívny).

V niektorých všeobecných populáciách je akákoľvek ich časť reprezentatívna na základe ich povahy. Vo väčšine prípadov sa však musia prijať osobitné opatrenia, aby sa zabezpečilo, že vzorky budú reprezentatívne.

Jeden jedným z hlavných výdobytkov modernej matematickej štatistiky je rozvoj teórie a praxe metódy náhodného výberu vzoriek, ktoré zabezpečujú reprezentatívnosť výberu údajov.

Vzorové prieskumy vždy strácajú na presnosti v porovnaní s prieskumom celej bežnej populácie. To sa však dá zosúladiť, ak je známa veľkosť chyby. Je zrejmé, že čím viac sa veľkosť vzorky približuje veľkosti všeobecnej populácie, tým menšia bude chyba. Je teda zrejmé, že problémy štatistickej inferencie sú obzvlášť dôležité pri práci s malými vzorkami ( N ? 10-50).

V dôsledku preštudovania materiálu v kapitole 2 by študent mal:

vedieť

základné pojmy všeobecnej a vzorovej populácie;
metódy odhadu, typy a vlastnosti odhadov parametrov všeobecnej populácie;
základné metódy štatistického testovania hypotéz o parametroch jednorozmerných a viacrozmerných všeobecných populácií;

byť schopný

nájsť na základe vzorových údajov odhady parametrov jednorozmerných a viacrozmerných všeobecných populácií;
analyzovať vlastnosti parametrov;
testovať hypotézy týkajúce sa parametrov a typu distribúcie všeobecnej populácie;
porovnať parametre niekoľkých všeobecných populácií;

vlastné

schopnosti štatistického odhadu parametrov jednorozmerných a viacrozmerných všeobecných populácií;
schopnosť testovať hypotézy týkajúce sa parametrov a typu rozloženia bežnej populácie pri vykonávaní socioekonomického výskumu pomocou analytického softvéru.

Rozloženie populácie

Pravdepodobnostno-štatistické metódy analýzy údajov predpokladajú, že zákonitosti, ktorými sa riadi skúmaná premenná (náhodná premenná), sú úplne určené komplexom podmienok na jej pozorovanie. Matematicky sú tieto vzory dané príslušným zákonom o rozdelení pravdepodobnosti. Pri vykonávaní štatistického výskumu je však vhodnejší koncept bežnej populácie.

Matematické pojmy „všeobecná populácia“, „náhodná premenná“ a „zákon rozdelenia pravdepodobnosti“ zodpovedajúce danému súboru podmienok možno teda v určitom zmysle považovať za synonymá.

Všeobecná populácia pomenujte súbor všetkých mysliteľných pozorovaní, ktoré by bolo možné vykonať za daného súboru podmienok.

Keďže definícia sa zaoberá mentálne možnými pozorovaniami (alebo objektmi), všeobecná populácia je abstraktný pojem a nemal by sa zamieňať so skutočnými populáciami, ktoré sú predmetom štatistického výskumu. Takže po preskúmaní dokonca všetkých podnikov subsektora ich môžeme považovať za predstaviteľov hypoteticky možného širšieho súboru podnikov, ktoré by mohli fungovať v rámci súboru podmienok.

Všeobecná populácia môže byť buď konečná, alebo nekonečná. Konečným obyvateľov prebieha napríklad pri prieskume rodinných rozpočtov, keď sa vzorka odoberá z populácie rodín skutočne prítomných v krajine. Následne sa sledujú príjmy a výdavky vybraných rodín. Nekonečné bežnú populáciu sledujeme napríklad vo vedeckom výskume, keď nás zaujíma priemerný výsledok veľkého počtu experimentov.

V najjednoduchšom prípade je všeobecná populácia jednorozmerná náhodná premenná NS s distribučnou funkciou, ktorá určuje pravdepodobnosť, že NS bude mať hodnotu menšiu ako pevné reálne číslo.

Vo všeobecnom prípade sa študujú všeobecné populácie, ktoré zahŕňajú niekoľko znakov (zvyčajne viac ako dva). Uvažovaná množina vlastností je označená vektorom s k komponent, z ktorých každý charakterizuje zodpovedajúcu vlastnosť. Na analýzu vektora X používajú sa viacrozmerné štatistické metódy.

Predmetom výskumu v multivariačnej analýze je teda náhodný vektor X, alebo náhodný bod v ft-rozmernom euklidovskom priestore, systém Komu náhodné (jednorozmerné) premenné, ft-rozmerná náhodná premenná

Distribučná funkcia náhodného vektora sa nazýva deterministická nezáporná veličina určená vzorcom

kde je rozmerový vektor pevných reálnych čísel.

Deterministická nezáporná veličina F (X)

Rozlíšiť:

nepretržitý k-rozmerné náhodné premenné, ktorých všetky zložky sú spojité (jednorozmerné) náhodné premenné;
diskrétne k-rozmerné náhodné premenné, ktorých všetky zložky sú diskrétne náhodné premenné;
zmiešané k-rozmerné náhodné premenné, medzi ktorých zložkami sú diskrétne aj spojité náhodné premenné.

Distribučná funkcia F (X) pre nepretržité k-rozmerná náhodná premenná je podľa definície spojitá.

Hustota rozdelenia pravdepodobnosti spojitého k-rozmerná náhodná premenná spĺňa podmienku

Hustota f (X) má nasledujúce vlastnosti:

Plocha ohraničená v hornej časti grafom hustoty sa vždy rovná jednej:

kde cez k uvádza sa celkový počet (násobnosť) integrálov;

Pravdepodobnosť zasiahnutia bodu () v určitej oblasti G rovná sa

Z definície hustoty vyplýva, že ak integrujeme spoločnú hustotu rozloženia dvoch veličín NS 1, NS 2 jeden po druhom, napríklad v nekonečných medziach, potom získame hustotu pravdepodobnosti inej veličiny:

Podobne to máme aj my

Hustoty pravdepodobnosti, distribučné funkcie podsystémov, náhodné veličiny systému Komu sa nazývajú náhodné premenné súkromné alebo okrajové distribúcie .

Podmienené distribúcie náhodný vektor X nazývaná distribúcia subsystému, jeho komponentov, za predpokladu, že ostatné komponenty sú pevné. Tieto komponenty budú oddelené od nepevných lomkou.

Pre spojitú náhodnú premennú platia napríklad vzorce, ktoré určujú hustotu podmieneného rozdelenia dvojrozmernej náhodnej premennej (), ktorá je podsystémom systému () za predpokladu, že sú v nej zafixované posledné tri zložky. :

Subsystém, komponent a doplnkový subsystém vektorových komponentov X sa volajú nezávislý(stochasticky, pravdepodobnostne) ak je rovnost

Najmä zložky vektora X sa volajú nezávislý, ak

V prípade nezávislosti platia podobné vzorce pre súčin hustôt alebo pravdepodobností hraničných rozdelení a zhody podmienených rozdelení s príslušnými hraničnými rozdeleniami (23).

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm- veľmi užitočná stránka!

Výberová metóda výskumu je hlavnou štatistickou metódou. Je to prirodzené, keďže objem skúmaných objektov je zvyčajne nekonečný (a aj keď je konečný, je veľmi ťažké vymenovať všetky objekty, musíte sa uspokojiť len s časťou z nich, vzorkou).

Všeobecná a vzorová populácia

Všeobecná množina je súhrn všetkých prvkov skúmaných v danom experimente.

Vzorová populácia (alebo vzorka) je konečný súbor objektov náhodne vybraných zo všeobecnej populácie.

Objem populácie (vzorka alebo všeobecná) je počet objektov v tejto populácii.

Príklad všeobecnej a vzorovej populácie

Povedzme, že sa skúma psychologická predispozícia človeka k deleniu daného segmentu vo vzťahu k zlatému rezu. Keďže pôvod samotného konceptu zlatého rezu je diktovaný antropometriou ľudského tela, je zrejmé, že v tomto prípade je všeobecnou populáciou každý antropogénny tvor, ktorý dosiahol fyzickú zrelosť a nadobudol konečné rozmery, teda celý dospelá časť ľudstva. Objem tejto zbierky je prakticky nekonečný.

Ak sa táto predispozícia skúma výlučne v umeleckom prostredí, potom všeobecnú populáciu tvoria ľudia, ktorí majú priamy vzťah k dizajnu: umelci, architekti, dizajnéri. Aj takých ľudí je veľa a môžeme predpokladať, že objem bežnej populácie je v tomto prípade tiež nekonečný.

V oboch prípadoch sme pri výskume nútení obmedziť sa na primeranú veľkosť vzoriek, vybrať si ako zástupcov tej či onej skupiny študentov technických špecializácií (ako ľudia ďaleko od umeleckého sveta) alebo študentov špeciálneho dizajnu (ako ľudia priamo príbuzní svetovým umeleckým obrazom).

Reprezentatívnosť

Hlavným problémom výberovej metódy je otázka, ako presne objekty vybrané z bežnej populácie na výskum reprezentujú skúmané charakteristiky bežnej populácie, teda otázka reprezentatívnosti vzorky.

Vzorka sa teda nazýva reprezentatívna (reprezentatívna), ak dostatočne presne reprezentuje kvantitatívne pomery všeobecnej populácie.

Samozrejme, ťažko povedať, čo presne sa skrýva za vágnym znením dostatočne presné... Otázky reprezentatívnosti sú vo všeobecnosti najkontroverznejšie v každej experimentálnej štúdii. Existuje mnoho príkladov, ktoré sa už stali klasickými, keď nedostatočná reprezentatívnosť vzorky viedla experimentátorov k absurdným výsledkom.

Otázky reprezentatívnosti sa spravidla riešia pomocou peer review, keď vedecká komunita akceptuje názor skupiny autoritatívnych odborníkov na správnosť vykonaného výskumu.

Príklad reprezentatívnosti

Vráťme sa k príkladu rozdelenia segmentov. Problematika reprezentatívnosti vzoriek tu leží v samom základe štúdie: v žiadnom prípade by sme nemali miešať skupiny predmetov na základe ich príslušnosti k umeleckému prostrediu.

Štatistické rozdelenie sledovaného znaku

Frekvencia pozorovanej hodnoty

Nech ako výsledok testovania na vzorke objemu nadobudol pozorovaný znak hodnoty ,, ..., a hodnota bola pozorovaná raz, hodnota-krát atď., hodnota bola pozorovaná raz. Potom sa frekvencia pozorovanej hodnoty nazýva číslo, hodnoty sú číslo atď.

Relatívna frekvencia pozorovanej hodnoty

Relatívna frekvencia pozorovanej hodnoty je pomer frekvencie k objemu vzorky:

Je jasné, že súčet frekvencií pozorovaného znaku by mal udávať veľkosť vzorky

a súčet relatívnych frekvencií by mal dať jednu:

Tieto úvahy možno použiť na kontrolu pri zostavovaní štatistických tabuliek. Ak nie sú dodržané rovnosti, došlo k chybe pri zaznamenávaní výsledkov experimentu.

Štatistické rozdelenie sledovanej hodnoty

Štatistické rozdelenie pozorovaného znaku je súlad medzi pozorovanými hodnotami znaku a zodpovedajúcimi frekvenciami (alebo relatívnymi frekvenciami).

Štatistické rozdelenie sa spravidla zapisuje vo forme dvojriadkovej tabuľky, v ktorej sú v prvom riadku uvedené pozorované hodnoty prvku a v druhom zodpovedajúce frekvencie (alebo relatívne frekvencie):

Ak je pozorovaný znak charakterizovaný spojitou náhodnou premennou naberajúcou hodnoty z intervalu, potom je jeho štatistická distribúcia popísaná frekvenciami zásahov do čiastkových intervalov:

Všeobecná populácia (v angličtine - populácia) - súhrn všetkých objektov (jednotiek), o ktorých chce vedec vyvodiť závery pri štúdiu konkrétneho problému.

Všeobecná populácia pozostáva zo všetkých objektov, ktoré sú predmetom štúdia. Zloženie všeobecnej populácie závisí od cieľov štúdie. Niekedy je všeobecná populácia celá populácia určitého regiónu (napr. keď sa skúma postoj potenciálnych voličov ku kandidátovi), najčastejšie sa stanovuje viacero kritérií, ktoré určujú objekt skúmania. Napríklad muži vo veku 30-50 rokov, ktorí používajú určitú značku holiaceho strojčeka aspoň raz týždenne a majú príjem aspoň 100 dolárov na člena rodiny.

Ukážkaalebo vzorová populácia- veľa prípadov (subjektov, predmetov, udalostí, vzoriek), s použitím určitého postupu, vybraných z bežnej populácie na účasť v štúdii.

Vlastnosti vzorky:

· Kvalitatívne charakteristiky vzorky – koho presne vyberáme a aké metódy konštrukcie vzorky na to používame.

· Kvantitatívna charakteristika vzorky – koľko prípadov vyberieme, inými slovami veľkosť vzorky.

Potreba odberu vzoriek

· Predmet výskumu je veľmi rozsiahly. Napríklad spotrebiteľmi produktov globálnej spoločnosti je obrovské množstvo geograficky rozptýlených trhov.

· Je potrebné zbierať primárne informácie.

Veľkosť vzorky

Veľkosť vzorky- počet prípadov zahrnutých do vzorky. Zo štatistických dôvodov sa odporúča, aby počet prípadov bol aspoň 30 - 35.

Závislé a nezávislé vzorky

Pri porovnávaní dvoch (alebo viacerých) vzoriek je dôležitým parametrom ich závislosť. Ak je možné stanoviť homomorfný pár (to znamená, keď jeden prípad zo vzorky X zodpovedá jednému a iba jeden prípad zo vzorky Y a naopak) pre každý prípad v dvoch vzorkách (a tento základ vzťahu je dôležitý pre charakteristika nameraná na vzorkách), takéto vzorky sa nazývajú závislý... Príklady závislých výberov:

· páry dvojčiat,

· dve merania akéhokoľvek znaku pred a po experimentálnej expozícii,

· manželia a manželky

· atď.

Ak medzi vzorkami takýto vzťah neexistuje, potom sa berú do úvahy tieto vzorky nezávislý, napríklad:

· muži a ženy,

· psychológovia a matematici.

V súlade s tým majú závislé vzorky vždy rovnakú veľkosť, zatiaľ čo objem nezávislých vzoriek sa môže líšiť.

Vzorky sa porovnávajú pomocou rôznych štatistických kritérií:

· Študentov t-test

· Wilcoxonov test

· Mann-Whitney U test

· Kritérium podpisu

· atď.

Reprezentatívnosť

Vzorku možno považovať za reprezentatívnu alebo nereprezentatívnu.

Príklad nereprezentatívnej vzorky

V Spojených štátoch sa za jeden z najznámejších historických príkladov nereprezentatívneho vzorkovania považuje prezidentské voľby v roku 1936. Časopis Leitrery Digest, ktorý úspešne predpovedal udalosti niekoľkých predchádzajúcich volieb, sa vo svojich predpovediach mýlil a svojim predplatiteľom, ako aj ľuďom vybraným z telefónnych zoznamov po celej krajine a ľuďom z registračných zoznamov áut, rozoslal desať miliónov skúšobných hlasovacích lístkov. V 25 % vrátených hlasovacích lístkov (takmer 2,5 milióna) boli hlasy rozdelené takto:

· 57 % preferovalo republikánskeho kandidáta Alfa Landona

· 40 % zvolilo vtedajšieho demokratického prezidenta Franklina Roosevelta

Ako je známe, Roosevelt vyhral skutočné voľby a získal viac ako 60% hlasov. Chybou Leitrery Digest bolo, že v snahe zvýšiť reprezentatívnosť vzorky – keďže vedeli, že väčšina ich predplatiteľov sa považuje za republikánov – rozšírili vzorku výberom ľudí z telefónnych zoznamov a registračných zoznamov. Nebrali však do úvahy realitu svojej doby a v skutočnosti naverbovali ešte viac republikánov: počas Veľkej hospodárskej krízy si väčšina strednej a vyššej triedy (teda väčšina republikánov, nie demokratov) mohla dovoliť vlastniť telefóny a autá.

Typy plánov na zostavenie skupín zo vzoriek

Existuje niekoľko hlavných typov plánu budovania skupiny:

1. Výskum s experimentálnymi a kontrolnými skupinami, ktoré sú umiestnené v rôznych podmienkach.

2. Štúdia s experimentálnymi a kontrolnými skupinami pomocou stratégie párového výberu

3. Výskum s použitím iba jednej skupiny – experimentálnej.

4. Výskum pomocou zmiešaného (faktoriálneho) dizajnu – všetky skupiny sú umiestnené v rôznych podmienkach.

Typy vzoriek

Vzorky sú rozdelené do dvoch typov:

· pravdepodobnostný

· nepravdepodobné

Vzorky pravdepodobnosti

1. Jednoduchý pravdepodobnostný výber:

oJednoduché prevzorkovanie. Použitie takejto vzorky je založené na predpoklade, že každý respondent bude rovnako pravdepodobne zaradený do vzorky. Na základe zoznamu bežnej populácie sú zostavené kartičky s počtom respondentov. Vložia sa do balíčka, zamiešajú a náhodne sa z nich vyberie karta, zaznamená sa číslo a potom sa vráti späť. Potom sa postup opakuje toľkokrát, koľkokrát potrebujeme veľkosť vzorky. Mínus: opakovanie výberových jednotiek.

Postup vytvorenia jednoduchej náhodnej vzorky zahŕňa nasledujúce kroky:

1. musíte získať úplný zoznam členov bežnej populácie a očíslovať tento zoznam. Pripomeňme, že takýto zoznam sa nazýva vzorkovací rámec;

2. určiť očakávanú veľkosť vzorky, teda predpokladaný počet respondentov;

3. vytiahnite z tabuľky náhodných čísel toľko čísel, koľko potrebujeme vzorových jednotiek. Ak má byť vo vzorke 100 ľudí, z tabuľky sa vyberie 100 náhodných čísel. Tieto náhodné čísla môže generovať počítačový program.

4.vyberte zo základného zoznamu tie pozorovania, ktorých čísla zodpovedajú vypísaným náhodným číslam

· Jednoduchý náhodný výber má zjavné výhody. Táto metóda je mimoriadne jednoduchá na pochopenie. Výsledky výskumu možno rozšíriť na cieľovú populáciu. Väčšina prístupov k získaniu štatistických záverov zahŕňa zber informácií pomocou jednoduchého náhodného výberu vzoriek. Jednoduchá metóda náhodného výberu má však aspoň štyri významné obmedzenia:

1. Často je ťažké vytvoriť rámec vzorkovania, ktorý umožňuje jednoduché náhodné vzorkovanie.

2. Výsledkom jednoduchej náhodnej vzorky môže byť veľká populácia alebo populácia rozložená na veľkej geografickej oblasti, čo výrazne zvyšuje čas a náklady na zber údajov.

3. Výsledky použitia jednoduchej náhodnej vzorky sa často vyznačujú nízkou presnosťou a vyššou štandardnou chybou ako výsledky použitia iných pravdepodobnostných metód.

4. Výsledkom aplikácie SRS môže byť nereprezentatívna vzorka. Hoci vzorky získané jednoduchým náhodným výberom v priemere adekvátne reprezentujú celú populáciu, niektoré z nich sú extrémne nepresne reprezentatívne pre skúmanú populáciu. Je to pravdepodobné najmä pri malej veľkosti vzorky.

· Jednoduché neopakujúce sa vzorkovanie. Postup odberu vzoriek je rovnaký, ibaže karty s číslami respondentov sa nevkladajú späť do balíčka.

1. Systematické vzorkovanie pravdepodobnosti. Je to zjednodušená verzia jednoduchého vzorkovania pravdepodobnosti. Na základe zoznamu bežnej populácie sa v určitom intervale (K) vyberajú respondenti. Hodnota K je určená náhodou. Najspoľahlivejší výsledok sa dosiahne s homogénnou všeobecnou populáciou, inak sa veľkosť kroku a niektoré vnútorné cyklické vzorce vzorky môžu zhodovať (miešanie vzorky). Nevýhody: Rovnaké ako pri jednoduchom vzorkovaní pravdepodobnosti.

2. Sériové (vnorené) vzorkovanie. Jednotky výberu sú štatistické rady (rodina, škola, tím atď.). Vybrané prvky sú podrobované priebežnému skúmaniu. Výber štatistických jednotiek môže byť organizovaný podľa typu náhodného alebo systematického výberu. Negatíva: Možnosť väčšej homogenity ako u bežnej populácie.

3. Regionálny odber vzoriek. V prípade heterogénnej populácie sa pred použitím pravdepodobnostného vzorkovania akoukoľvek selekčnou technikou odporúča rozdeliť populáciu na homogénne časti, takáto vzorka sa nazýva regionalizovaná vzorka. Skupiny zón môžu byť prírodné útvary (napríklad mestské časti) a akýkoľvek prvok, ktorý je základom štúdie. Charakteristika, na základe ktorej sa delenie uskutočňuje, sa nazýva charakteristika stratifikácie a regionalizácie.

4. "Pohodlný" výber. „Pohodlný“ postup odberu vzoriek pozostáva z nadviazania kontaktov s „pohodlnými“ jednotkami odberu vzoriek – skupinou študentov, športovým tímom, priateľmi a susedmi. Ak je potrebné získať informácie o reakcii ľudí na nový koncept, takáto vzorka je celkom rozumná. Na predbežné testovanie dotazníkov sa často používa pohodlný odber vzoriek.

Vzorkovanie nepravdepodobnosti

Výber v takejto vzorke sa neuskutočňuje podľa princípov náhodnosti, ale podľa subjektívnych kritérií - dostupnosť, typickosť, rovnomerné zastúpenie atď.

1. Kvótová vzorka - vzorka je zostavená ako model, ktorý reprodukuje štruktúru všeobecnej populácie vo forme kvót (proporcií) študovaných charakteristík. Počet prvkov vzorky s rôznou kombináciou skúmaných charakteristík je stanovený tak, aby zodpovedal ich podielu (podielu) v celkovej populácii. Ak je teda napríklad všeobecná populácia zastúpená 5 000 ľuďmi, z toho 2 000 žien a 3 000 mužov, tak v kvótnej vzorke budeme mať 20 žien a 30 mužov alebo 200 žien a 300 mužov. Vzorky kvót sú najčastejšie založené na demografických kritériách: pohlavie, vek, región, príjem, vzdelanie a iné. Nevýhody: Zvyčajne sú takéto vzorky nereprezentatívne. nemožno brať do úvahy viacero sociálnych parametrov naraz. Plusy: ľahko dostupný materiál.

2. Metóda snehovej gule. Vzorka je zostavená nasledovne. Každý respondent, počnúc prvým, dostane kontakty na svojich priateľov, kolegov, známych, ktorí by vyhovovali podmienkam výberu a mohli by sa štúdie zúčastniť. Vzorka je teda s výnimkou prvého kroku tvorená za účasti samotných výskumných objektov. Metóda sa často používa, keď je potrebné nájsť a vypočuť ťažko dostupné skupiny respondentov (napríklad respondenti s vysokým príjmom, respondenti patriaci do rovnakej profesijnej skupiny, respondenti s akýmikoľvek podobnými záľubami/hobby a pod.)

3. Spontánny odber vzoriek – odber vzoriek takzvaného „prvého prichádzajúceho“. Často sa používa pri televíznych a rozhlasových výsluchoch. Veľkosť a zloženie spontánnych vzoriek nie je vopred známe a určuje ich len jeden parameter – aktivita respondentov. Nevýhody: nie je možné určiť, akú všeobecnú populáciu respondenti zastupujú, a v dôsledku toho nie je možné určiť reprezentatívnosť.

4. Prieskum trasy – často sa používa, keď je jednotkou štúdia rodina. Všetky ulice sú očíslované na mapke sídla, v ktorom sa bude prieskum vykonávať. Veľké čísla sa vyberajú pomocou tabuľky (generátora) náhodných čísel. Každé veľké číslo sa považuje za pozostávajúce z 3 zložiek: číslo ulice (prvé 2-3 čísla), číslo domu, číslo bytu. Napríklad číslo 14832: 14 je číslo ulice na mape, 8 je číslo domu, 32 je číslo bytu.

5. Regionálny odber vzoriek s výberom typických objektov. Ak sa po regionalizácii vyberie z každej skupiny typický objekt, t.j. objekt, ktorý sa podľa väčšiny charakteristík skúmaných v štúdii približuje k priemeru, takáto vzorka sa nazýva zónovaná s výberom typických objektov.

Stratégie budovania skupiny

Výber skupín pre ich účasť na psychologickom experimente sa uskutočňuje pomocou rôznych stratégií, ktoré sú potrebné na zabezpečenie maximálneho možného dodržania vnútornej a vonkajšej validity.

· Randomizácia (náhodný výber)

· Párový výber

· Stratometrické vzorkovanie

· Približné modelovanie

· Zapojenie skutočných skupín

Randomizácia, alebo náhodný výber, sa používa na vytváranie jednoduchých náhodných vzoriek. Použitie takejto vzorky je založené na predpoklade, že každý člen populácie bude rovnako pravdepodobne zahrnutý do vzorky. Napríklad, ak chcete urobiť náhodnú vzorku 100 vysokoškolákov, môžete do klobúka vložiť papieriky s menami všetkých vysokoškolákov a potom z toho získať 100 papierikov – pôjde o náhodný výber (Goodwin J ., s. 147).

Párový výber- stratégia konštrukcie výberových skupín, v ktorej sú skupiny subjektov zložené zo subjektov ekvivalentných z hľadiska vedľajších parametrov, ktoré sú významné pre experiment. Táto stratégia je účinná pre experimenty využívajúce experimentálne a kontrolné skupiny s najlepšou možnosťou - prilákaním dvojčiat (mono- a dizygotných), pretože vám umožňuje vytvoriť ...

Stratometrické vzorkovanie - randomizácia s prideľovaním vrstiev (alebo zhlukov). Pri tejto metóde odberu vzoriek sa všeobecná populácia rozdelí do skupín (vrstvy) s určitými charakteristikami (pohlavie, vek, politické preferencie, vzdelanie, úroveň príjmu atď.) a vyberú sa subjekty s príslušnými charakteristikami.

Približné modelovanie - zostavenie obmedzených vzoriek a zovšeobecnenie záverov o tejto vzorke na širšiu populáciu. Napríklad, keď sa štúdie zúčastnili 2-roční univerzitní študenti, údaje z tejto štúdie sa rozšírili na „ľudí vo veku 17 až 21 rokov“. Prípustnosť takýchto zovšeobecnení je extrémne obmedzená.

Približné modelovanie je vytvorenie modelu, ktorý pre jasne definovanú triedu systémov (procesov) popisuje jej správanie (alebo potrebné javy) s prijateľnou presnosťou.

Sekcia 2. Vzorka a všeobecná populácia

Všeobecná a vzorová populácia.

Štatistická populácia

Všeobecné (zahŕňa všetky jednotky pozorovania, ktoré jej možno priradiť v súlade s účelom štúdie.) Všeobecnú populáciu možno posudzovať nielen v rámci špecifických odvetví alebo územných hraníc, ale aj limitovanú inými charakteristikami (pohlavie, vek) a ich kombinácia.

V závislosti od účelu štúdie a jej úloh sa teda menia hranice bežnej populácie, na to sa využívajú hlavné črty, ktoré ju obmedzujú.

Vzorka (časť bežnej populácie, ktorá by mala byť reprezentatívna pre všeobecnú populáciu a čo najlepšie odrážať jej vlastnosti). Na základe analýzy vzorovej populácie môžete získať pomerne úplný obraz o vzoroch, ktoré sú vlastné celej všeobecnej populácii.

Vzorka musí byť reprezentatívna, to znamená, že vzorka musí obsahovať všetky prvky a v rovnakom pomere ako v bežnej populácii. Inými slovami, vzorka musí odrážať vlastnosti bežnej populácie, teda ju správne reprezentovať. Reprezentatívnosť musí byť kvantitatívna a kvalitatívna.

Kvantitatívny - vychádza zo zákona veľkých čísel a znamená dostatočný počet prvkov vo vzorke, vypočítaný podľa špeciálnych vzorcov a tabuliek.

Kvalitatívne - vychádza zo zákona pravdepodobnosti a znamená zhodu (jednotnosť) znakov, ktoré charakterizujú prvky vzorky vo vzťahu k bežnej populácii.

Metódy odberu vzoriek:

- náhodné vzorkovanie - náhodný výber pozorovacích jednotiek.

- Mechanický odber vzoriek - aritmetický prístup k výberu pozorovacích jednotiek typologická vzorka- pri formovaní sa všeobecná populácia predbežne delí na typy s posl. výber pozorovacích jednotiek z každej typickej skupiny. V tomto prípade môže byť počet jednotiek zvolený v pomere k veľkosti typickej skupiny a neúmerne - Sériové vzorkovanie (vnorený výber)- vzniká výberom nie jednotlivých pozorovacích jednotiek, ale celých skupín, sérií alebo hniezd, ktoré zahŕňajú pozorovacie jednotky organizované samostatným spôsobom

Viacstupňová metóda výberu - podľa počtu stupňov sa rozlišujú jednostupňové, dvojstupňové, trojstupňové atď. metóda riadeného výberu- umožňuje identifikovať vplyv neznámych faktorov pri zisťovaní vplyvu známych

Algoritmy pre parametrické kritériá.

Parametrické testy sa používajú pre vzorky s normálnym rozdelením. Vzorec na výpočet týchto kritérií obsahuje parametre vzorky: priemer, rozptyl atď. Preto sa nazývajú parametrické. Normálnosť distribučného zákona musí byť štatisticky preukázaná pomocou jedného z kritérií dobrej zhody: Pearsonov test, Fisherov F-test,-kritérium Kolmogorov atď.

V niektorých prípadoch sú parametrické testy výkonnejšie ako neparametrické testy. Posledne menované majú vyššiu pravdepodobnosť výskytu chyby druhého druhu - prijatia falošnej nulovej hypotézy.

Parametrické metódy zahŕňajú:

- Študentské kritérium

- Fisherovo kritérium

- Metódy jednosmernej analýzy

- Metódy dvojfaktorovej analýzy

Študentské kritérium

Vymenovanie.
Kritérium vám umožňuje vyhodnotiť rozdiely v stredných hodnotách vzoriek s normálnym rozdelením.

Popis kritéria.

Kritérium je použiteľné na porovnanie stredných hodnôt dvoch vzoriek získaných pred a po ovplyvnení určitého faktora.

Toto kritérium vyvinul William Gossett na hodnotenie kvality piva v Guinness. V súvislosti so záväzkom voči spoločnosti za mlčanlivosť o obchodných tajomstvách (a vedenie Guinessovej rady za to považovalo používanie štatistického aparátu pri svojej práci) bol Gossettov článok publikovaný v časopise „Biometrika“ pod pseudonymom „Student“ .

Závislé (prepojené) a nezávislé (nesúvisiace) vzorky

Pri porovnávaní dvoch (alebo viacerých) vzoriek je dôležitým parametrom ich závislosť. Ak môžete nainštalovať homomorfný pár (to znamená, keď jeden prípad zo vzorky X zodpovedá jednému a iba jednému prípadu zo vzorky Y a naopak) pre každý prípad v dvoch vzorkách (a tento základ vzťahu je dôležitý pre charakteristiku meranú na vzorkách), takéto vzorky sa nazývajú závislý... Príklady závislých výberov:

páry dvojčiat,
dve merania akéhokoľvek znaku pred a po experimentálnej expozícii,
manželia a manželky
atď.

Ak medzi vzorkami takýto vzťah neexistuje, potom sa berú do úvahy tieto vzorky nezávislý, napríklad:

muži a ženy,
psychológovia a matematiky.

V súlade s tým majú závislé vzorky vždy rovnakú veľkosť, zatiaľ čo objem nezávislých vzoriek sa môže líšiť.

Dvojvýberový t-test pre nezávislé vzorky

Pre dve nesúvisiace vzorky (pozorovania nepatria do rovnakej skupiny objektov) sú možné dve možnosti výpočtu:

keď sú známe odchýlky
keď sú odchýlky neznáme, ale navzájom sa rovnajú.

Kde

štvorcová odchýlka. Tu a - odhady rozptylu.

Najprv zvážte rovnaké vzorky. V tomto prípade

V prípade rovnako očíslovaných vzoriek , výraz

V oboch prípadoch sa počet stupňov voľnosti vypočíta pomocou vzorcov

Je jasné, že pri číselnej rovnosti vzoriek

Empirická hodnota študentského kritéria sa porovnáva s kritickou hodnotou (podľa tabuľky 1 v prílohe) pre daný počet stupňov voľnosti.

Nulová hypotéza.

Vypočítajme príklad v laboratórnej práci.

Príklad.

Psychológ meral čas komplexnej senzomotorickej výberovej reakcie (v ms) v kontrolnej a experimentálnej skupine. Experimentálnu skupinu (X) tvorilo 9 vysokokvalifikovaných športovcov. Kontrolnú skupinu (Y) tvorilo 8 ľudí, ktorí sa aktívne nevenovali športu. Psychológ potvrdzuje hypotézu, že priemerná rýchlosť zvolenej komplexnej senzomotorickej reakcie u športovcov je vyššia ako rovnaká hodnota u ľudí, ktorí sa športu nevenujú.

№	skupiny		Odchýlky od priemeru		Odchýlkové štvorce
№	X	Y
1	504	580	-22	-58	484	3368
2	560	692	34	54	1156	2916
3	420	700	-106	62	11236	3844
4	600	621	74	-17	5476	289
5	580	640	54	-2	2916	4
6	530	561	4	-77	16	5929
7	490	680	-36	42	1296	1764
8	580	630	54	-8	2916	64
9	470	-	-56	-	3136	-
Sum	4734	5104	0	0	28632	18174
Priemerný	526	638

Hodnoty aritmetického priemeru X a Y : v kontrolnej skupine.

Potom

^ Počet stupňov voľnosti k = 9 + 8 - 2 = 15

Podľa aplikačnej tabuľky pre daný počet stupňov zistíme

Budovanie osi významnosti

To. Psychológom zistené rozdiely medzi experimentálnou a kontrolnou skupinou sú signifikantné na úrovni viac ako 0,1 %, alebo inými slovami, priemerná rýchlosť komplexnej senzomotorickej reakcie výberu v skupine športovcov je výrazne vyššia ako v skupine ľudí. ktorí sa aktívne nevenujú športu.

Z hľadiska štatistických hypotéz znie toto tvrdenie takto: hypotéza H0 o podobnosti sa zamieta a na hladine významnosti 0,1 % sa prijíma alternatívna hypotéza H1 - o rozdiele medzi experimentálnou a kontrolnou skupinou.

Dvojvýberový t-test pre závislé (prepojené) vzorky

Pridružené vzorky sú chápané ako pozorovania pre jednu skupinu objektov a všetky pozorovania sú párovo spojené s každým objektom výskumu a charakterizujú jeho stav pred expozíciou a po expozícii určitému faktoru.

Hypotézy

: priemer vzorky sa nelíši od nuly.

: Priemer vzorky sa líši od nuly.

1. Normálnosť distribučného zákona sa predbežne kontroluje podľa jedného z kritérií vhodnosti.

2. Vypočítané (i = 1..n) - variant párových rozdielov a výsledky merania pre ja- objekt pred a po vplyve nejakého faktora. Množstvo sa bude považovať za nezávislé pre rôzne objekty a bude normálne rozdelené

3. Vypočítané (najlepšie vo forme tabuľky): súčet párových rozdielov a pomocných parametrov.

4. Vypočíta sa - empirická hodnota kritéria podľa stupňov voľnosti podľa vzorca

Kde n je veľkosť vzorky.

5.Nájdený empirický význam Študentov test sa porovnáva s kritickou hodnotou(podľa tabuľky 1 prílohy) pre daný počet stupňov voľnosti.
Nulová hypotézana danej úrovni významnostiakceptovaná ako empirická hodnota.

Kritická hodnota pre zvolenú pravdepodobnosť a daný počet stupňov voľnosti sa dá nájsť pomocou vstavanej funkcie Excel TDFRONT.

Príklad.

Psychológ predpokladal, že v dôsledku tréningu sa čas na riešenie ekvivalentných problémov (t. j. s rovnakým algoritmom riešenia) výrazne zníži. Na overenie hypotézy sa porovnával čas riešenia (v minútach) prvej a tretej úlohy u ôsmich subjektov.

Riešenie problému je uvedené v tabuľke.

Číslo predmetu

1 úloha

3 úloha

V akých prípadoch je bežná populácia. Všeobecná populácia a vzorka

Rozloženie populácie

Všeobecná a vzorová populácia

Príklad všeobecnej a vzorovej populácie

Reprezentatívnosť

Príklad reprezentatívnosti

Veľkosť vzorky

Závislé a nezávislé vzorky

Reprezentatívnosť

Príklad nereprezentatívnej vzorky

Typy plánov na zostavenie skupín zo vzoriek

Typy vzoriek

Vzorky pravdepodobnosti

Vzorkovanie nepravdepodobnosti

Stratégie budovania skupiny

Všeobecná a vzorová populácia.

Závislé (prepojené) a nezávislé (nesúvisiace) vzorky

Dvojvýberový t-test pre nezávislé vzorky

X

Y

1

504

580

-22

-58

484

3368

2

560

692

34

54

1156

2916

3

420

700

-106

62

11236

3844

4

600

621

74

-17

5476

289

5

580

640

54

-2

2916

4

6

530

561

4

-77

16

5929

7

490

680

-36

42

1296

1764

8

580

630

54

-8

2916

64

9

470

-

-56