U kojim slučajevima je opća populacija. Opća populacija i uzorak

Distribucija slučajne varijable sadrži sve informacije o njezinim statističkim svojstvima. Koliko vrijednosti slučajne varijable trebate znati da biste nacrtali njezinu distribuciju? Da biste to učinili, morate ga istražiti opća populacija.

Opća populacija - skup svih vrijednosti koje određena slučajna varijabla može uzeti.

Broj jedinica u općoj populaciji naziva se njezin volumen N... Ova vrijednost može biti konačna ili beskonačna. Na primjer, ako se istražuje rast stanovnika određenog grada, tada će volumen opće populacije biti jednak broju stanovnika grada. Ako se izvede bilo koji fizički eksperiment, tada će volumen opće populacije biti beskonačan, budući da broj svih mogućih vrijednosti bilo kojeg fizičkog parametra jednak je beskonačnosti.

Proučavanje opće populacije nije uvijek moguće i svrsishodno. To je nemoguće ako je obujam opće populacije beskonačan. Ali čak i uz ograničene količine, cjelovita studija nije uvijek opravdana, jer zahtijeva puno vremena i rada, a apsolutna točnost rezultata obično nije potrebna. Manje točni rezultati, ali uz znatno manje truda i sredstava, mogu se dobiti ispitivanjem samo dijela opće populacije. Takve studije nazivaju se selektivnim.

Statistička istraživanja koja se provode samo na dijelu opće populacije nazivaju se uzorkom, a proučavani dio opće populacije uzorkom.

Slika 7.2 simbolički prikazuje populaciju i uzorak kao skup i njegov podskup.

Slika 7.2 Populacija i uzorak

Radeći s određenom podskupinom određene opće populacije, koja često čini njezin beznačajan dio, dobivamo rezultate koji su u praktične svrhe sasvim zadovoljavajuće u točnosti. Ispitivanje velikog dijela populacije samo povećava točnost, ali ne mijenja bit rezultata, ako je uzorak ispravno uzet sa statističke točke gledišta.

Kako bi uzorak odražavao svojstva opće populacije i kako bi rezultati bili pouzdani, mora biti predstavnik(predstavnik).

U nekim općim populacijama, bilo koji njihov dio je reprezentativan zbog svoje prirode. Međutim, u većini slučajeva moraju se poduzeti posebne mjere kako bi se osiguralo da su uzorci reprezentativni.

Jedan jedno od glavnih dostignuća suvremene matematičke statistike je razvoj teorije i prakse metode slučajnog uzorkovanja, koji osiguravaju reprezentativnost odabira podataka.

Uzorak anketa uvijek gubi u točnosti u usporedbi s istraživanjem cijele opće populacije. Međutim, to se može pomiriti ako je poznata veličina pogreške. Očito, što se veličina uzorka više približava veličini opće populacije, to će pogreška biti manja. Stoga je jasno da problemi statističkog zaključivanja postaju posebno aktualni kada se radi s malim uzorcima ( N ? 10-50).

Kao rezultat proučavanja gradiva iz poglavlja 2, student treba:

znati

  • osnovni pojmovi opće populacije i populacije uzorka;
  • metode procjene, vrste i svojstva procjena parametara opće populacije;
  • osnovne metode statističke provjere hipoteza o parametrima jednodimenzionalnih i višedimenzionalnih općih populacija;

biti u mogućnosti

  • pronaći, na temelju podataka uzorka, procjene parametara jednodimenzionalnih i višedimenzionalnih općih populacija;
  • analizirati svojstva parametara;
  • testirati hipoteze o parametrima i vrsti distribucije opće populacije;
  • usporediti parametre nekoliko općih populacija;

vlastiti

  • vještine statističke procjene parametara jednodimenzionalnih i višedimenzionalnih općih populacija;
  • vještina provjere hipoteza o parametrima i vrsti distribucije opće populacije pri provođenju socio-ekonomskih istraživanja pomoću analitičkog softvera.

Raspodjela stanovništva

Vjerojatnostno-statističke metode analize podataka pretpostavljaju da su zakonitosti proučavane varijable (slučajne varijable) potpuno određene kompleksom uvjeta za njezino promatranje. Matematički, ovi obrasci su postavljeni odgovarajućim zakonom raspodjele vjerojatnosti. Međutim, pri provođenju statističkih istraživanja prikladniji je koncept opće populacije.

Dakle, matematički koncepti "opća populacija", "slučajna varijabla" i "zakon raspodjele vjerojatnosti" koji odgovaraju danom skupu uvjeta mogu se u određenom smislu smatrati sinonimima.

Opća populacija imenovati skup svih zamislivih opažanja koja bi se mogla izvesti pod danim skupom uvjeta.

Budući da se definicija bavi mentalno mogućim opažanjima (ili objektima), opća je populacija apstraktan pojam i ne smije se miješati sa stvarnim populacijama koje su predmet statističkog istraživanja. Dakle, nakon što smo ispitali čak i sva poduzeća jednog podsektora, možemo ih smatrati predstavnicima hipotetski mogućeg šireg skupa poduzeća koja bi mogla funkcionirati unutar niza uvjeta.

Opća populacija može biti konačna ili beskonačna. Krajnji stanovništva odvija se, na primjer, u istraživanju obiteljskih budžeta, kada se uzima uzorak iz populacije obitelji koja je stvarno prisutna u zemlji. Zatim se prate prihodi i rashodi odabranih obitelji. Beskrajna opća populacija promatra se npr. u znanstvenim istraživanjima, kada nas zanima prosječni rezultat velikog broja pokusa.

U najjednostavnijem slučaju, opća populacija je jednodimenzionalna slučajna varijabla NS s funkcijom distribucije koja određuje vjerojatnost da NSće poprimiti vrijednost manju od fiksnog realnog broja.

U općem slučaju proučavaju se opće populacije koje uključuju nekoliko značajki (obično više od dvije). Razmatrani skup značajki označen je vektorom koji ima k komponenta, od kojih svaka karakterizira odgovarajuću značajku. Za analizu vektora x koriste se višedimenzionalne statističke metode.

Dakle, predmet istraživanja u multivarijantnoj analizi je slučajni vektor X, ili slučajna točka u ft-dimenzionalnom euklidskom prostoru, sustav Do slučajne (jednodimenzionalne) varijable, ft-dimenzionalna slučajna varijabla

Funkcija distribucije slučajnog vektora naziva se deterministička nenegativna veličina određena formulom

gdje je dimenzionalni vektor fiksnih realnih brojeva.

Deterministička nenegativna veličina Ž (X)

razlikovati:

  • kontinuirano k-dimenzionalne slučajne varijable, čije su sve komponente kontinuirane (jednodimenzionalne) slučajne varijable;
  • diskretno k-dimenzionalne slučajne varijable, čije su sve komponente diskretne slučajne varijable;
  • mješoviti k-dimenzionalne slučajne varijable, među čijim komponentama postoje i diskretne i kontinuirane slučajne varijable.

Funkcija distribucije Ž (X) za kontinuirano k-dimenzionalna slučajna varijabla je po definiciji kontinuirana.

Gustoća distribucije vjerojatnosti kontinuiranog k-dimenzionalna slučajna varijabla zadovoljava uvjet

Gustoća f (X) ima sljedeća svojstva:

Područje ograničeno na vrhu grafikonom gustoće uvijek je jednako jedan:

gdje kroz k naznačen je ukupan broj (višestrukost) integrala;

Vjerojatnost pogađanja točke () u nekom području G jednako je

Iz definicije gustoće slijedi da ako integriramo zajedničku gustoću raspodjele dviju veličina NS 1, NS 2 jedan po jedan, na primjer, unutar beskonačnih granica, tada dobivamo gustoću vjerojatnosti druge veličine:

Slično, imamo

Gustoće vjerojatnosti, funkcije distribucije podsustava, slučajne varijable sustava Do nazivaju se slučajne varijable privatna ili marginalne distribucije .

Uvjetne distribucije slučajni vektor x naziva distribucija podsustava, njegovih komponenti, pod uvjetom da su ostale komponente fiksne. Ove komponente bit će odvojene od nefiksiranih kosom crtom naprijed.

Za kontinuiranu slučajnu varijablu, na primjer, vrijede formule koje određuju gustoću uvjetne distribucije dvodimenzionalne slučajne varijable (), koja je podsustav sustava (), pod uvjetom da su posljednje tri komponente fiksne u to:

Podsustav, komponenta i dodatni podsustav vektorskih komponenti x se zovu neovisna(stohastički, vjerojatno) ako je jednakost

Konkretno, komponente vektora x se zovu neovisna, ako

U slučaju neovisnosti, slične formule vrijede za produkte gustoća ili vjerojatnosti graničnih distribucija i podudarnosti uvjetnih distribucija s odgovarajućim graničnim distribucijama (23).

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm- vrlo korisna stranica!

Metoda uzorkovanja je glavna statistička metoda. To je prirodno, budući da je volumen predmeta koji se proučavaju obično beskonačan (a čak i ako je konačan, onda je vrlo teško nabrojati sve objekte, morate se zadovoljiti samo dijelom njih, uzorkom).

Opća i uzorkovana populacija

Opći skup je ukupnost svih elemenata koji se istražuju u danom eksperimentu.

Populacija uzorka (ili uzorak) je konačan skup objekata nasumično odabranih iz opće populacije.

Volumen populacije (uzorak ili opći) je broj objekata u ovoj populaciji.

Primjer opće populacije i populacije uzorka

Recimo da se istražuje psihološka predispozicija osobe za dijeljenje zadanog segmenta u odnosu na zlatni rez. Budući da nastanak samog pojma zlatnog presjeka diktira antropometrija ljudskog tijela, jasno je da je u ovom slučaju opća populacija svako antropogeno stvorenje koje je doseglo fizičku zrelost i poprimilo konačne razmjere, odnosno cjelokupno odrasli dio čovječanstva. Volumen ove kolekcije je praktički beskonačan.

Ako se ta predispozicija istražuje isključivo u umjetničkom okruženju, onda su opća populacija ljudi koji su izravno povezani s dizajnom: umjetnici, arhitekti, dizajneri. Takvih je također puno, a možemo pretpostaviti da je i volumen opće populacije u ovom slučaju beskonačan.

U oba slučaja, za istraživanje smo prisiljeni ograničiti se na razumne veličine uzorka, birajući kao predstavnike jednog ili drugog skupa studente tehničkih specijalnosti (kao osobe daleko od umjetničkog svijeta) ili studente specijalnosti dizajna (kao osobe izravno povezane svjetskim umjetničkim slikama).

Reprezentativnost

Glavni problem metode uzorkovanja je pitanje koliko točno odabrani objekti iz opće populacije za istraživanje predstavljaju proučavane karakteristike opće populacije, odnosno pitanje reprezentativnosti uzorka.

Dakle, uzorak se naziva reprezentativnim (reprezentativnim) ako dovoljno točno predstavlja kvantitativne omjere opće populacije.

Naravno, teško je reći što se točno krije iza nejasne formulacije dovoljno precizno... Pitanja reprezentativnosti općenito su najkontroverznija u bilo kojoj eksperimentalnoj studiji. Mnogo je primjera, koji su već postali klasični, kada je nedovoljna reprezentativnost uzorka dovodila eksperimentatore do apsurdnih rezultata.

Pitanja reprezentativnosti rješavaju se u pravilu uz pomoć peer reviewa, kada znanstvena zajednica prihvaća stajalište skupine autoritativnih stručnjaka o ispravnosti provedenog istraživanja.

Primjer reprezentativnosti

Vratimo se na primjer podjele segmenta. Pitanja reprezentativnosti uzoraka ovdje su u samom temelju istraživanja: ni u kojem slučaju ne smijemo miješati skupine subjekata na temelju njihove pripadnosti umjetničkom okruženju.

Statistička raspodjela promatranog svojstva

Učestalost promatrane vrijednosti

Pretpostavimo da je, kao rezultat testiranja u uzorku volumena, promatrana značajka uzela vrijednosti ,, ..., a vrijednost je promatrana jednom, vrijednost-vremena, itd., vrijednost je promatrana jednom. Tada se frekvencija promatrane vrijednosti naziva broj, vrijednosti su broj i tako dalje.

Relativna učestalost promatrane vrijednosti

Relativna učestalost promatrane vrijednosti je omjer frekvencije i volumena uzorka:

Jasno je da bi zbroj frekvencija promatranog obilježja trebao dati veličinu uzorka

a zbroj relativnih frekvencija trebao bi dati jedan:

Ova razmatranja mogu se koristiti za kontrolu pri sastavljanju statističkih tablica. Ako se jednakosti ne poštuju, učinjena je pogreška u bilježenju rezultata pokusa.

Statistička distribucija promatrane vrijednosti

Statistička distribucija promatranog obilježja je korespondencija između promatranih vrijednosti značajke i odgovarajućih frekvencija (ili relativnih frekvencija).

U pravilu se statistička distribucija ispisuje u obliku tablice s dva retka, u kojoj su promatrane vrijednosti značajke navedene u prvom redu, a odgovarajuće frekvencije (ili relativne frekvencije) u drugom:

Ako je promatrana značajka karakterizirana kontinuiranom slučajnom varijablom koja uzima vrijednosti iz intervala, tada je njezina statistička distribucija opisana učestalostima pogađanja parcijalnih intervala:

Opća populacija (na engleskom - populacija) - ukupnost svih objekata (jedinica) o kojima znanstvenik namjerava donijeti zaključke prilikom proučavanja određenog problema.

Opću populaciju čine svi objekti koji su predmet proučavanja. Sastav opće populacije ovisi o ciljevima studije. Ponekad je opća populacija cjelokupna populacija određene regije (npr. kada se proučava odnos potencijalnih birača prema kandidatu), najčešće se postavlja nekoliko kriterija koji određuju predmet istraživanja. Na primjer, muškarci od 30-50 godina koji koriste britvu određene marke barem jednom tjedno, a imaju prihod od najmanje 100 dolara po članu obitelji.

Uzorakili uzorak populacije- veliki broj slučajeva (subjekata, objekata, događaja, uzoraka) određenim postupkom odabranih iz opće populacije za sudjelovanje u istraživanju.

Karakteristike uzorka:

· Kvalitativne karakteristike uzorka - koga točno biramo i koje metode konstruiranja uzorka koristimo za to.

· Kvantitativna karakteristika uzorka - koliko slučajeva odabiremo, drugim riječima, veličina uzorka.

Potreba za uzorkovanjem

· Predmet istraživanja je vrlo opsežan. Primjerice, potrošači proizvoda globalne tvrtke je ogroman broj geografski raspršenih tržišta.

· Postoji potreba za prikupljanjem primarnih informacija.

Veličina uzorka

Veličina uzorka- broj slučajeva uključenih u uzorak. Iz statističkih razloga preporuča se da broj slučajeva bude najmanje 30 - 35.

Zavisni i nezavisni uzorci

Kada se uspoređuju dva (ili više) uzoraka, njihova je ovisnost važan parametar. Ako je moguće uspostaviti homomorfni par (tj. kada jedan slučaj iz uzorka X odgovara jednom i samo jednom slučaju iz uzorka Y i obrnuto) za svaki slučaj u dva uzorka (a ta je osnova odnosa važna za karakteristika mjerena na uzorcima), takvi se uzorci nazivaju ovisni... Primjeri ovisnih odabira:

· parovi blizanaca,

· dva mjerenja bilo kojeg predznaka prije i nakon eksperimentalnog izlaganja,

· muževi i žene

· itd.

Ako ne postoji takav odnos između uzoraka, onda se ti uzorci smatraju neovisna, na primjer:

· muškarci i žene,

· psiholozi i matematičari.

Sukladno tome, zavisni uzorci uvijek imaju istu veličinu, dok se volumen neovisnih uzoraka može razlikovati.

Uzorci se uspoređuju pomoću različitih statističkih kriterija:

· Studentov t-test

· Wilcoxonov test

· Mann-Whitney U test

· Kriterij znaka

· i tako dalje.

Reprezentativnost

Uzorak se može smatrati reprezentativnim ili nereprezentativnim.

Primjer nereprezentativnog uzorka

U Sjedinjenim Državama smatra se da je jedan od najpoznatijih povijesnih primjera nereprezentativnog uzorkovanja tijekom predsjedničkih izbora 1936. godine. Časopis Leitrery Digest, koji je uspješno predvidio događaje na nekoliko prethodnih izbora, pogriješio je u svojim predviđanjima, poslavši deset milijuna probnih listića svojim pretplatnicima, kao i osobama odabranim iz telefonskih imenika diljem zemlje i osobama s popisa za registraciju automobila. U 25% vraćenih listića (gotovo 2,5 milijuna) glasovi su raspoređeni na sljedeći način:

· 57% je preferiralo republikanskog kandidata Alfa Landona

· 40% je izabralo tadašnjeg demokratskog predsjednika Franklina Roosevelta

Kao što je poznato, Roosevelt je pobijedio na stvarnim izborima, osvojivši više od 60% glasova. Pogreška Leitrery Digesta bila je u tome što su u želji da povećaju reprezentativnost uzorka - budući da su znali da se većina njihovih pretplatnika smatra republikancima - proširili uzorak odabirom ljudi iz telefonskih imenika i popisa za registraciju. Međutim, nisu uzeli u obzir stvarnost svog vremena i, zapravo, regrutirali su još više republikanaca: tijekom Velike depresije, uglavnom su si mogli priuštiti predstavnici srednje i više klase (odnosno većina republikanaca, a ne demokrati). posjedovati telefone i automobile.

Vrste plana za građenje grupa iz uzoraka

Postoji nekoliko glavnih tipova grupnih planova izgradnje:

1. Istraživanja s eksperimentalnim i kontrolnim skupinama koje su smještene u različitim uvjetima.

2. Proučite s eksperimentalnim i kontrolnim skupinama koristeći strategiju odabira u paru

3. Istraživanje koristeći samo jednu skupinu – eksperimentalno.

4. Istraživanje korištenjem mješovitog (faktorskog) dizajna – sve grupe su smještene u različite uvjete.

Vrste uzoraka

Uzorci su podijeljeni u dvije vrste:

· vjerojatnosni

· nevjerojatan

Uzorci vjerojatnosti

1. Jednostavno probabilističko uzorkovanje:

oJednostavno ponovno uzorkovanje. Korištenje takvog uzorka temelji se na pretpostavci da je jednako vjerojatno da će svaki ispitanik biti uključen u uzorak. Na temelju popisa opće populacije sastavljaju se kartice s brojevima ispitanika. Stavljaju se u špil, promiješaju i iz njih se nasumce vadi karta, bilježi se broj, a zatim se vraća natrag. Zatim se postupak ponavlja onoliko puta koliko nam je potrebna veličina uzorka. Minus: ponavljanje izbornih jedinica.

Postupak za konstruiranje jednostavnog slučajnog uzorka uključuje sljedeće korake:

1. trebate dobiti kompletan popis pripadnika opće populacije i numerirati ovaj popis. Podsjetimo da se takav popis naziva okvir uzorkovanja;

2. odrediti očekivanu veličinu uzorka, odnosno očekivani broj ispitanika;

3. izdvojiti iz tablice slučajnih brojeva onoliko brojeva koliko nam je potrebnih jedinica uzorka. Ako u uzorku treba biti 100 ljudi, iz tablice se uzima 100 slučajnih brojeva. Te nasumične brojeve može generirati računalni program.

4.odaberite s osnovne liste ona opažanja čiji brojevi odgovaraju ispisanim slučajnim brojevima

· Jednostavno nasumično uzorkovanje ima očite prednosti. Ova metoda je izuzetno laka za razumijevanje. Rezultati istraživanja mogu se proširiti na ciljanu populaciju. Većina pristupa dobivanju statističkih zaključaka uključuje prikupljanje informacija korištenjem jednostavnog slučajnog uzorkovanja. Međutim, jednostavna metoda slučajnog uzorkovanja ima najmanje četiri značajna ograničenja:

1. Često je teško stvoriti okvir za uzorkovanje koji omogućuje jednostavno nasumično uzorkovanje.

2. Jednostavan slučajni uzorak može rezultirati velikom populacijom ili populacijom raširenom na velikom geografskom području, što značajno povećava vrijeme i troškove prikupljanja podataka.

3. Rezultati korištenja jednostavnog slučajnog uzorka često su obilježeni niskom preciznošću i višom standardnom pogreškom od rezultata korištenja drugih probabilističkih metoda.

4. Primjena SRS-a može rezultirati nereprezentativnim uzorkom. Iako uzorci dobiveni jednostavnim slučajnim odabirom, u prosjeku, adekvatno predstavljaju cjelokupnu populaciju, neki od njih su krajnje netočno reprezentativni za proučavanu populaciju. To je osobito vjerojatno kod male veličine uzorka.

· Jednostavno uzorkovanje bez ponavljanja. Postupak uzorkovanja je isti, osim što se karte s brojevima ispitanika ne vraćaju u špil.

1. Sustavno uzorkovanje vjerojatnosti. To je pojednostavljena verzija jednostavnog uzorkovanja vjerojatnosti. Na temelju popisa opće populacije, ispitanici se biraju u određenom intervalu (K). Vrijednost K je određena slučajno. Najpouzdaniji rezultat postiže se s homogenom općom populacijom, inače se veličina koraka i neki unutarnji ciklički obrasci uzorka mogu podudarati (miješanje uzorka). Protiv: Isto kao i za jednostavno uzorkovanje vjerojatnosti.

2. Serijsko (ugniježđeno) uzorkovanje. Jedinice uzorka su statističke serije (obitelj, škola, tim itd.). Odabrani elementi su podvrgnuti kontinuiranom ispitivanju. Odabir statističkih jedinica može se organizirati prema vrsti slučajnog ili sustavnog uzorkovanja. Negativno: Mogućnost veće homogenosti nego u općoj populaciji.

3. Regionalno uzorkovanje. U slučaju heterogene populacije, prije korištenja vjerojatnosnog uzorkovanja s bilo kojom tehnikom selekcije, preporuča se podijeliti populaciju na homogene dijelove, takav se uzorak naziva regionalizirani uzorak. Grupe za zoniranje mogu biti i prirodne formacije (na primjer, gradske četvrti) i bilo koje obilježje na kojem se temelji studija. Obilježje na temelju koje se provodi podjela naziva se obilježje stratifikacije i regionalizacije.

4. "Prikladan" izbor. Postupak uzorkovanja „pogodnosti“ sastoji se od uspostavljanja kontakata s „udobnim“ jedinicama za uzorkovanje — grupom učenika, sportskom ekipom, prijateljima i susjedima. Ako je potrebno dobiti informacije o reakciji ljudi na novi koncept, takav je uzorak sasvim razuman. Zgodno uzorkovanje često se koristi za preliminarno testiranje upitnika.

Uzorkovanje nevjerojatnosti

Odabir u takvom uzorku se ne provodi prema načelima slučajnosti, već prema subjektivnim kriterijima - dostupnosti, tipičnosti, jednakoj zastupljenosti itd.

1. Kvotni uzorak – uzorak se gradi kao model koji reproducira strukturu opće populacije u obliku kvota (omjera) proučavanih karakteristika. Broj elemenata uzorka s različitom kombinacijom proučavanih karakteristika određuje se tako da odgovara njihovom udjelu (udjelu) u općoj populaciji. Tako, na primjer, ako opću populaciju predstavlja 5000 ljudi, od čega 2000 žena i 3000 muškaraca, tada ćemo u kvotnom uzorku imati 20 žena i 30 muškaraca, odnosno 200 žena i 300 muškaraca. Uzorci kvota najčešće se temelje na demografskim kriterijima: spol, dob, regija, prihod, obrazovanje i ostalo. Protiv: Obično takvi uzorci nisu reprezentativni. nekoliko društvenih parametara ne može se uzeti u obzir odjednom. Prednosti: lako dostupan materijal.

2. Metoda snježne grudve. Uzorak je konstruiran na sljedeći način. Od svakog ispitanika, počevši od prvog, traže se kontakti njegovih prijatelja, kolega, poznanika koji bi odgovarali uvjetima selekcije i mogli sudjelovati u istraživanju. Dakle, s izuzetkom prvog koraka, uzorak se formira uz sudjelovanje samih objekata istraživanja. Metoda se često koristi kada je potrebno pronaći i intervjuirati teško dostupne skupine ispitanika (na primjer, ispitanike s visokim primanjima, ispitanike koji pripadaju istoj profesionalnoj skupini, ispitanike sa sličnim hobijem/hobijima itd.)

3. Spontano uzimanje uzoraka – uzorkovanje tzv. „prvog dolaska“. Često se koristi u televizijskim i radijskim ispitivanjima. Veličina i sastav spontanih uzoraka nije unaprijed poznat, a određen je samo jednim parametrom – aktivnošću ispitanika. Protiv: nemoguće je utvrditi koju opću populaciju ispitanici predstavljaju, a kao rezultat toga, nemoguće je odrediti reprezentativnost.

4. Istraživanje rute - često se koristi kada je jedinica studija obitelj. Sve ulice označene su brojevima na karti naselja u kojem će se izmjera vršiti. Veliki brojevi se biraju pomoću tablice (generatora) slučajnih brojeva. Smatra se da se svaki veliki broj sastoji od 3 komponente: broja ulice (prva 2-3 broja), kućnog broja, broja stana. Na primjer, broj 14832: 14 je broj ulice na karti, 8 je kućni broj, 32 je broj stana.

5. Regionalno uzorkovanje s izborom tipičnih objekata. Ako se nakon regionalizacije iz svake skupine odabere tipičan objekt, t.j. objekt koji se prema većini proučavanih karakteristika u istraživanju približava prosjeku, takav uzorak nazivamo zoniranim s izborom tipičnih objekata.

Strategije izgradnje grupe

Odabir grupa za njihovo sudjelovanje u psihološkom eksperimentu provodi se različitim strategijama koje su potrebne kako bi se osiguralo maksimalno moguće poštivanje unutarnje i vanjske valjanosti.

· Slučajni odabir (slučajni odabir)

· Odabir u paru

· Stratometrijsko uzorkovanje

· Približno modeliranje

· Angažiranje stvarnih grupa

Randomizacija, ili slučajni odabir, koristi se za stvaranje jednostavnih slučajnih uzoraka. Korištenje takvog uzorka temelji se na pretpostavci da će svaki član populacije jednako vjerojatno biti uključen u uzorak. Na primjer, da biste napravili slučajni uzorak od 100 sveučilišnih studenata, možete staviti komadiće papira s imenima svih studenata u šešir, a zatim iz njega dobiti 100 papirića - to će biti slučajni odabir (Goodwin J. ., str. 147).

Odabir u paru- strategija za konstruiranje skupina uzoraka, u kojoj su skupine ispitanika sastavljene od ispitanika koji su ekvivalentni po bočnim parametrima koji su značajni za eksperiment. Ova strategija je učinkovita za eksperimente s eksperimentalnim i kontrolnim skupinama s najboljom opcijom - privlačenjem parova blizanaca (mono- i dizigotnih), jer vam omogućuje stvaranje ...

Stratometrijsko uzorkovanje - randomizacija s raspodjelom slojeva (ili klastera). Ovom metodom uzorkovanja opća populacija se dijeli na skupine (stratume) s određenim karakteristikama (spol, dob, političke sklonosti, obrazovanje, razina dohotka i sl.), a odabiru se ispitanici s odgovarajućim karakteristikama.

Približno modeliranje - izrada ograničenih uzoraka i generaliziranje zaključaka o ovom uzorku na širu populaciju. Na primjer, kada su dvogodišnji studenti sudjelovali u istraživanju, podaci iz te studije prošireni su na “ljude u dobi od 17 do 21 godine”. Dopustivost takvih generalizacija je krajnje ograničena.

Približno modeliranje je formiranje modela koji za jasno definiranu klasu sustava (procesa) opisuje njegovo ponašanje (ili potrebne pojave) s prihvatljivom točnošću.

Odjeljak 2. Uzorak i opća populacija

Opća i uzorkovana populacija.

Statistička populacija

Općenito (uključuje sve jedinice promatranja koje joj se mogu pripisati u skladu sa svrhom studije.) Opća populacija može se smatrati ne samo unutar određenih industrija ili teritorijalnih granica, već i ograničena drugim karakteristikama (spol, dob) i njihovu kombinaciju.

Dakle, ovisno o svrsi studije i njezinim zadaćama, mijenjaju se granice opće populacije, a za to se koriste glavne značajke koje ga ograničavaju.

Uzorak (dio opće populacije, koji bi trebao biti reprezentativan za opću populaciju i najpotpunije odražavati njezina svojstva). Na temelju analize populacije uzorka, možete dobiti prilično potpunu sliku obrazaca svojstvenih cijeloj općoj populaciji.

Uzorak mora biti reprezentativan, odnosno uzorak mora sadržavati sve elemente i to u istom omjeru kao u općoj populaciji. Drugim riječima, uzorak mora odražavati svojstva opće populacije, odnosno ispravno je predstavljati. Reprezentativnost mora biti kvantitativna i kvalitativna.

Kvantitativno - temelji se na zakonu velikih brojeva i znači dovoljan broj elemenata u uzorku, izračunat prema posebnim formulama i tablicama.

Kvalitativna – temelji se na zakonu vjerojatnosti i označava podudarnost (ujednačenost) karakteristika koje karakteriziraju elemente uzorka u odnosu na opću populaciju.

Metode uzorkovanja:

- nasumično uzorkovanje - nasumičan odabir promatračkih jedinica.

-Mehaničko uzorkovanje - aritmetički pristup odabiru jedinica promatranja tipološki uzorak- pri formiranju opća populacija se preliminarno dijeli na tipove s posljednjom. izbor jedinica promatranja iz svake tipične skupine. U ovom slučaju, broj jedinica može se odabrati proporcionalno veličini tipične skupine i nesrazmjerno - Serijsko uzorkovanje (ugniježđeni odabir)- formira se odabirom ne pojedinačnih jedinica promatranja, već cijelih skupina, serija ili gnijezda, koji uključuju promatračke jedinice organizirane na poseban način

Višestupanjski metod odabira - prema broju stupnjeva razlikuju se jednostupanjske, dvostupanjske, trostupanjske itd. metoda usmjerene selekcije- omogućuje vam da identificirate utjecaj nepoznatih čimbenika prilikom utvrđivanja utjecaja poznatih

Algoritmi za parametarske kriterije.

Parametarski testovi koriste se za uzorke s normalnom distribucijom. Formula za izračun ovih kriterija sadrži parametre uzorka: srednju vrijednost, varijancu itd. Stoga se nazivaju parametarskim. Normalnost zakona distribucije mora se statistički dokazati korištenjem jednog od kriterija dobrote uklapanja: Pearsonov test, Fisherov F-test,-kriterijum Kolmogorov itd.


U nekim slučajevima, parametarski testovi su moćniji od neparametarskih testova. Potonji imaju veću vjerojatnost pojave greške druge vrste – prihvaćanja lažne nulte hipoteze.


Parametarske metode uključuju sljedeće:

- Studentov kriterij

- Fisherov kriterij

- Metode jednosmjerne analize

- Metode dvofaktorske analize

Studentov kriterij


Ugovoreni sastanak.
Kriterij vam omogućuje procjenu razlika u srednjim vrijednostima uzoraka s normalnom distribucijom.

Opis kriterija.

Kriterij je primjenjiv za usporedbu srednjih vrijednosti dvaju uzoraka dobivenih prije i nakon utjecaja određenog faktora.

Ovaj kriterij razvio je William Gossett za procjenu kvalitete piva u Guinnessu. U vezi s obvezom prema tvrtki za neotkrivanje poslovne tajne (a vodstvo Guinnessa smatralo je korištenje statističkog aparata u svom radu kao takvom), Gossettov je članak objavljen u časopisu "Biometrics" pod pseudonimom "Student" .

Zavisni (povezani) i nezavisni (nepovezani) uzorci

Kada se uspoređuju dva (ili više) uzoraka, njihova je ovisnost važan parametar. Ako možete instalirati homomorfna par (tj. kada jedan slučaj iz uzorka X odgovara jednom i samo jednom slučaju iz uzorka Y i obrnuto) za svaki slučaj u dva uzorka (a ta je osnova odnosa važna za karakteristiku mjerenu na uzorcima), takvi se uzorci nazivaju ovisni... Primjeri ovisnih odabira:

  • parovi blizanaca,
  • dva mjerenja bilo kojeg predznaka prije i nakon eksperimentalnog izlaganja,
  • muževi i žene
  • itd.

Ako ne postoji takav odnos između uzoraka, onda se ti uzorci smatraju neovisna, na primjer:

  • muškarci i žene,
  • psiholozima i matematika.

Sukladno tome, zavisni uzorci uvijek imaju istu veličinu, dok se volumen neovisnih uzoraka može razlikovati.

T-test s dva uzorka za neovisne uzorke


Za dva nepovezana uzorka (promatranja ne pripadaju istoj skupini objekata) moguće su dvije opcije izračuna:

    • kada su varijance poznate
    • kada su varijance nepoznate ali su međusobno jednake.

Gdje

kvadratna devijacija. Ovdje i - procjene varijance.


Razmotrimo prvo jednake uzorke. U ovom slučaju

U slučaju jednakobrojnih uzoraka , izraz

U oba slučaja, broj stupnjeva slobode izračunava se pomoću formula

Jasno je da uz brojčanu jednakost uzoraka

Empirijska vrijednost Studentovog kriterija uspoređuje se s kritičnom vrijednošću (prema tablici 1. u dodatku) za zadani broj stupnjeva slobode.


Nulta hipoteza.

Izračunajmo primjer u laboratorijskom radu.


Primjer.

Psiholog je izmjerio vrijeme složene senzomotoričke reakcije izbora (u ms) u kontrolnoj i eksperimentalnoj skupini. Eksperimentalnu skupinu (X) činilo je 9 visokokvalificiranih sportaša. Kontrolnu skupinu (Y) činilo je 8 osoba koje se nisu aktivno bavile sportom. Psiholog potvrđuje hipotezu da je prosječna brzina složene senzomotoričke reakcije izbora kod sportaša veća od iste vrijednosti kod osoba koje se ne bave sportom.



Grupe


Odstupanja od srednje vrijednosti


Kvadrati odstupanja

x

Y

1

504

580

-22

-58

484

3368

2

560

692

34

54

1156

2916

3

420

700

-106

62

11236

3844

4

600

621

74

-17

5476

289

5

580

640

54

-2

2916

4

6

530

561

4

-77

16

5929

7

490

680

-36

42

1296

1764

8

580

630

54

-8

2916

64

9

470

-

-56

-

3136

-

Iznos

4734

5104

0

0

28632

18174

Prosječno

526

638

Srednje aritmetičke vrijednosti X i Y :, u kontrolnoj skupini.

Zatim

^ Broj stupnjeva slobode k = 9 + 8 - 2 = 15

Prema tablici primjene za zadani broj stupnjeva nalazimo

Izgradnja osi značaja






Da. Razlike koje je psiholog utvrdio između eksperimentalne i kontrolne skupine značajne su na razini više od 0,1%, odnosno prosječna brzina složene senzomotoričke reakcije izbora u skupini sportaša značajno je veća nego u skupini ljudi. koji se ne bave aktivno sportom.

U smislu statističkih hipoteza, ova tvrdnja zvuči ovako: hipoteza H0 o sličnosti se odbacuje i na razini značajnosti od 0,1% prihvaća se alternativna hipoteza H1 - o razlici između eksperimentalne i kontrolne skupine.

T-test s dva uzorka za ovisne (povezane) uzorke

Pridruženi uzorci shvaćaju se kao opažanja za jednu skupinu objekata, a sva su opažanja u paru povezana sa svakim objektom istraživanja i karakteriziraju njegovo stanje prije izlaganja i nakon izlaganja određenom čimbeniku.

Hipoteze

: srednja vrijednost uzorka se ne razlikuje od nule.

: Srednja vrijednost uzorka je različita od nule.

1. Normalnost zakona raspodjele preliminarno se provjerava prema jednom od kriterija ispravnosti.

2. Izračunato (i = 1..n) - varijanta parnih razlika, a rezultati mjerenja za ja- th objekt prije i poslije utjecaja nekog faktora. Količina će se smatrati neovisnom za različite objekte i normalno raspoređenom

3. Izračunati (po mogućnosti u tabličnom obliku): zbroj razlika u paru i pomoćnih parametara.

4. Izračunava se - empirijska vrijednost kriterija po stupnjevima slobode prema formuli

Gdje je n veličina uzorka.

5.Pronađeno empirijsko značenje Studentov test se uspoređuje s kritičnom vrijednošću(prema tablici 1. dodatka) za zadani broj stupnjeva slobode.
Nulta hipotezana danoj razini značajaprihvaćena ako je empirijska vrijednost.

Kritična vrijednost za odabranu vjerojatnost i zadani broj stupnjeva slobode može se pronaći korištenjem ugrađene funkcije Excel TDFRONT.


Primjer.

Psiholog je pretpostavio da će se kao rezultat treninga vrijeme za rješavanje ekvivalentnih problema (tj. imati isti algoritam rješenja) značajno smanjiti. Za provjeru hipoteze uspoređeno je vrijeme rješavanja (u minutama) prvog i trećeg zadatka kod osam ispitanika.


Rješenje problema prikazano je u tablici.


Broj predmeta


1 zadatak


3 zadatak

Podijelite s prijateljima ili sačuvajte za sebe:

Učitavam...