BOOTSSTREM, mali uzorci, primjena u analizi podataka. Vrste uzoraka

U procesu ocjenjivanja stupnja reprezentativnosti ovih selektivnog promatranja, pitanje obujma agregata uzorka postaje važno. Uzorkovanje koeficijent rekalkulacije student

Ne samo veličina granica, koja s tom vjerojatnošću ne prelazi pogrešku uzorkovanja, već i metode za određivanje tih granica.

S velikim brojem jedinica selektivnog agregata () distribucije slučajnih pogrešaka uzorka medija u skladu s teorem Lyapunova Normalno ili se približava normalnom kao i broj opažanja povećava se.

Vjerojatnost izlaza pogrešaka za određena ograničenja procjenjuje se na temelju tablica laplas integral , Izračun pogrešaka uzorka temelji se na veličini opće disperzije, budući da s velikim koeficijentom, koji se pomnože s selektivnim varijancem kako bi se dobio general, velika uloga ne igra.

U praksi statističkog pregleda često je potrebno nositi se s malim takozvanim malim uzorcima.

Pod malim uzorkom znači takvo selektivno promatranje, od kojih broj jedinica ne prelazi 30.

Razvoj teorije malih uzorka započeo je engleska statistika V.S. Goset (tiskan pod pseudonim Student ) Godine 1908. dokazao je da procjena odstupanja između srednjeg uzorka i općeg prosjeka ima poseban zakon o distribuciji.

Odrediti moguće granice pogreške koristiti tzv kriteriji Student, definiran formulom

gdje je mjera slučajnih oscilacija selektivnog medija u

mali uzorak.

Vrijednost se izračunava na temelju selektivnih podataka o opažanju:

Ova se vrijednost koristi samo za ukupnu ukupnost, a ne kao približnu procjenu u općoj populaciji.

S malim brojem distribucije uzorkovanja Student Razlikuje se od normalnog: velike vrijednosti kriterija imaju veću vjerojatnost ovdje nego kod normalne distribucije.

Ogranična pogreška malog uzorka ovisno o prosječnoj pogrešci prikazana je kao

No, u ovom slučaju, vrijednost je inače povezana s vjerojatno procjenom nego s velikim uzorkom.

Prema distribuciji Student Ova vjerojatna procjena ovisi i od veličine i veličine uzorka ako granična pogreška ne prelazi prosječnu pogrešku u malim uzorcima.

Tablica 3.1 Distribucija vjerojatnosti u malim uzorcima ovisno od koeficijenta povjerenja i uzorkovanje


Kao što se može vidjeti stol. 3.1 Uz povećanje ove distribucije, ona traži normalno i već se malo razlikuje od njega.

Pokazujemo kako koristiti studentski tablicu za distribuciju.

Pretpostavimo da je uzorak istraživanja radnika malih poduzeća pokazalo da su radnici proveli na provedbu jednog od proizvodnih operacija (min.). Pronađite selektivne prosječne troškove:

Selektivna disperzija

Stoga prosječna pogreška malog uzorka

Po stol. 3.1 Otkrili smo da je za koeficijent povjerenja i volumen malog uzorka, vjerojatnost je jednaka.

Dakle, s vjerojatnošću, može se tvrditi da je odstupanje između uzorka i općeg prosjeka leži u rasponu od do, tj. Razlika neće prelaziti apsolutnu vrijednost ().

Prema tome, prosječno vrijeme provedeno u cijeloj ukupnosti bit će od do.

Vjerojatnost da je ta pretpostavka zapravo netočna i pogreška slučajnim razlozima bit će veća od, jednaka :.

Tablica vjerojatnosti Student često se daje u drugim uniformama nego u 32.1. , Vjeruje se da je u nekim slučajevima takav oblik prikladniji za praktičnu uporabu ( stol. 3.2. ).

Od stol. 3.2. Iz toga slijedi da je za svaki broj stupnjeva slobode indiciran granična vrijednost, koja s tom vjerojatnošću neće biti prekoračena povremenim oscilacijama rezultata uzorka.

Na temelju navedenog u stol. 3.2. Vrijednosti se određuju intervali povjerenja : i.

Ovo je područje tih vrijednosti općeg prosjeka, izlaz izvan kojih ima vrlo nisku vjerojatnost jednaku:

Kao pouzdana vjerojatnost, bilateralni test se koristi u pravilu, ili da ne isključuje, međutim, izbor i drugi koji nisu dani u stol. 3.2. .

Tablica 3.2. Neka značenja Studentski student

Vjerojatnost slučajnog izlaza procijenjene prosječne vrijednosti izvan granica intervala pouzdanosti bit će jednaka i, tj. Jako malo.

Izbor između vjerojatnosti u određenoj je mjeri proizvoljan. Ovaj izbor je u velikoj mjeri određen sadržajem tih zadataka za rješavanje malog uzorka.

U zaključku, napominjemo da se izračun pogrešaka u malom uzorku malo razlikuje od sličnih izračuna velikog uzorka. Razlika je u tome što s malim uzorkom, vjerojatnost naše izjave je nešto manje nego s više uzorka (posebno, u gornjem primjeru i, u skladu s tim).

Međutim, sve to ne znači da možete koristiti mali uzorak kada vam je potreban veliki uzorak. U mnogim slučajevima, odstupanja između pronađenih tvrtki mogu doseći značajne veličine, što istraživači jedva zadovoljavaju. Stoga se mali uzorak treba primijeniti u statističkoj studiji socio-ekonomskih fenomena s velikom pažnjom, uz odgovarajuće teorijsko i praktično opravdanje.

Dakle, nalazi na temelju rezultata malih uzoraka praktični su samo pod uvjetom da je raspodjela osobine u općoj populaciji normalna ili asimptotski normalna. Također je potrebno uzeti u obzir točnost rezultata uzorkovanja malog volumena je još uvijek niža nego s velikim uzorkom.

U praksi je vrlo često potrebno nositi se s uzorcima vrlo malog volumena, čiji je broj znatno manje od dvadeset i trideset. Takvi uzorci u statistici zvani su mali uzorci. Potreba za posebnim razmatranjem malih uzoraka uzrokovana je činjenicom da metode rastavljeni iznad metoda točke i interval procjene karakteristika uzorka ukazuju na dovoljno velik broj uzoraka.

Koncept malih uzoraka. Distribucija studenata

Selektivni prosjek i, prema tome, njegova pogreška se distribuira normalno, a korekcija po količini disperzije selekcije je vrlo blizu jedan i nema praktičnu vrijednost. Pogreška uzorkovanja pod ovim uvjetima vrlo rijetko prelazi vrijednost. Drugi se bavi malim uzorkovanjem. Uz male uzorke, selektivna disperzija je značajno raseljena. Stoga bi bilo pogrešno primijeniti funkciju normalne distribucije za probabilističke zaključke o mogućem vrijednosti pogreške. Uz malu uzorkovanje, uvijek je potrebno koristiti nekuliziranu procjenu disperzije:

Prema tome, da bi se dobila nevjerojatna procjena disperzije prema manjem uzorku, zbroj kvadrata odstupanja mora biti podijeljen s iznosom. Ova se vrijednost naziva broj stupnjeva slobode varijacija. U budućnosti, za kratkoću, broj stupnjeva slobode varijacije će biti označeno grčkim slovom (NU).

Problem procjene selektivnih karakteristika temeljenih na malim uzorcima prvi put je istraživao britanski matematičar statistike V. Gosset, koji su objavili svoja djela pod pseudonimima studenta (1908).

Na temelju prijedloga za normalnost raspodjele obilježje u općoj populaciji i uzimajući u obzir umjesto apsolutnih odstupanja njihovog odnosa prema neovisnom standardu, student je pronašao distribuciju koja ovisi samo o broju uzorka. Kasnije (1925) R. Fisher je dao težnji dokaz ove distribucije, koji se zvao studentske distribucije.

Student se izražava kao sljedeći stav:

Ekspresijski broj se pojavljuje varijabilna vrijednost koja odražava moguće vrijednosti odstupanja uzorka medija iz općeg prosjeka. Vrijednost se normalno distribuira s centrom jednakom nuli, a disperzija jednaka.

Posebno se naglašava da se nazivnik ekspresije ne može smatrati prosječnom pogreškom varijable. Vrijednost se ovdje razmatra kao neovisno distribuirana varijabla od numerizatora. Označava prosječnu kvadratnu (standardnu) devijaciju ovog uzorka i nije procjena opće populacije, budući da distribucija styyudent ne ovisi o općem parameru populacije. Određeno uzorkovanjem kao

Distribucije su međusobno neovisne. Samo pod ovim stanjem i za uzorke iz normalnih agregata se odvija raspodjela studenta.

Glavna prednost studentske distribucije je da ne ovisi o parametrima opće populacije i bavi se samo vrijednostima dobivenim izravno iz uzorka.

Diferencijalno pravo studenata (gustoća vjerojatnosti) ima oblik:

gdje je veličina uzorka;

vrijednost koja odgovara maksimalnoj ordiniranju krivulje raspodjele na t \u003d 0.

Prema tome, izražava se studentska funkcija distribucije:

Drugim riječima,

gdje je t f standardizirana (normalizirana) razlika izračunata rezultatima malog uzorka.

Vrijednosti G () i g () su gama funkcije. Za određeni broj gama - funkcija je izražena nekompatibilnim integralom:

U malim uzorcima uvijek postoji cijeli pozitivan broj (volumen uzorkovanja).

U ovom slučaju, gama - funkcija uvijek ima konačnu vrijednost i izražena je faktorily:

stoga:

Prilikom izračunavanja gama - funkcija korisno znati sljedeća svojstva:

1) kada postoji;

  • 3) na primjer,

Koristeći ovu nekretninu, lako je izračunati vrijednosti G () i g () u ekspresiju distribucijske gustoće;

4) Funkcija doseže minimum tijekom frakcijske vrijednosti.

Slika 3.1

Opća vrsta gama - funkcije prikazana je na Sl. 3.1.

Od svojstava studentske distribucije, obično se razmatraju tijekom teorije vjerojatnosti, pozornost je privučena na sljedeće:

1) Studentska distribucija je velika jer ovisi samo o jednom parametru - volumen uzorkovanja i ne ovisi o prosječnom i disperziju opće populacije (za razliku od normalne distribucije ovisno o ova dva parametra).

  • 2) Studentska distribucija je upravo za bilo koju veličinu uzorka, a za male uzorke, što vam omogućuje da napravite probabilističke zaključke za mali broj opažanja.
  • 3) Uz povećanje veličine uzorka, vrijednost se približava vrijednosti i raspodjelu stiludentnih pristupa normalnim. Kada raspodjela učenika postane normalna. Gotovo za normalnu aproksimaciju smatra se dovoljno.

Slika 3.2

Na sl. 3.2 prikazuje omjer raspodjele studenta i normalne distribucije.

Kao što se može vidjeti iz sl. 3.2, ispod krajeva uštene krivulje raspodjele, na primjer, ili je znatno veliki dio područja nego ispod krivulje normalne raspodjele s istim vrijednostima. To znači da s malim količinom uzorka, vjerojatnost izrade velikih pogrešaka značajno se povećava. Može se vidjeti s figure da na vrijednosti normaliziranog odstupanja koje prelaze apsolutnu vrijednost, područje ispod krivulje distribucije je mnogo veće od normalne krivulje raspodjele.

Na veličinu odstupanja između vrijednosti funkcije studentske distribucije, ovisno o veličini uzorka, a vrijednosti normalne funkcije distribucije mogu se prosuditi prema tablici. 3.2, gdje se daju vrijednosti područja ispod krivulje distribucije iz različitih brojeva uzorka.

Tablica 3.1

Vrijednost normalne funkcije distribucije

Tablica 3.2.

Vrijednosti vjerojatnosti s različitim uzorkovanjem

Normirano odstupanje

Značenje s malim uzorcima s brojevima

Vrijednost na velikim uzorcima

Iz tablice 3.2. Može se vidjeti da s povećanjem veličine uzorka, mali uzorak se brzo približava normalnom. U isto vrijeme, s vrlo malim brojem odstupanja između vrijednosti na toj vrijednosti, vrlo je značajno.

Istraživanja su pokazala da je studentska distribucija gotovo primjenjiva ne samo u slučaju normalne raspodjele osobine u općoj populaciji. Pokazalo se da se javlja praktično prihvatljivim zaključcima, a zatim kada raspodjela osobine u općoj populaciji nije normalna, ali samo simetrično, pa čak i nekoliko asimetrično, ali veličina uzorka nije premala.

Vrijednosti funkcije distribucije studenata snimljene su na različitim vrijednostima, stoga, pri ocjenjivanju selektivnih karakteristika, koristite gotove tablice:

Tablica 3.3.

Tablica funkcijskih vrijednosti

Vrijednosti funkcije distribucije studenata mogu se koristiti na različite načine, ovisno o prirodi čvrstih zadataka, pri određivanju vjerojatnosti odstupanja uzorka od generala. Najčešće korišteni:

1) Određivanje vjerojatnosti da će razlika između selektivnog srednjeg i općeg medija biti manja od određene vrijednosti. U normaliziranim odstupanjima, zadatak se smanjuje kako bi se utvrdila vjerojatnost da postoji manje od vrijednosti navedenog uvjetima problema, tj. Pronalaženje značenja

Slika 3.3.

To je vjerojatnost velikih negativnih odstupanja, koji je na slici. 3.3 odgovara zasjenjenom području.

2) Određivanje vjerojatnosti da će razlika između selektivnog srednjeg i srednjeg generala biti barem određena vrijednost, drugim riječima, treba pronaći

Slika 3.4.

To je vjerojatnost velikih pozitivnih odstupanja, što je prikazano u obliku zasjenjenog područja na Sl. 3.4. Ova vjerojatnost je lako pronaći pomoću tablica.

3) određivanje vjerojatnosti da će normalizirano odstupanje u apsolutnoj vrijednosti biti manje izražena

To je vjerojatnost abolitne vrijednosti odstupanja. Ova vjerojatnost može se odrediti pomoću tablica. Budući da u praksi najčešće mora odrediti tu vjerojatnost sastavljenu posebnu vrijednost (tablica 3.3).

Grafička ilustracija vjerojatnosti manjih u apsolutnoj vrijednosti odstupanja na Sl. 3.5

Slika 3.5

4) Određivanje vjerojatnosti da će pogreška uzorka u apsolutnoj vrijednosti biti barem određena vrijednost. U normaliziranim jedinicama, vjerojatnost da će u apsolutnoj vrijednosti biti ništa manje, izražavat će se

To je vjerojatnost velikih odstupanja u apsolutnoj vrijednosti. Grafički je ilustriran na Sl. 3.6.

Slika 3.6.

Da biste pronašli vjerojatnost velikog u apsolutnoj vrijednosti odstupanja, postoje posebni tablice (Dodatak 3). Ta se vjerojatnost može lako izračunati, koristeći i tablice.

  • 6. Vrste statističkih skupina, njihova informativna važnost.
  • 7.state tablice: vrste, konstruirati pravila, čitanje
  • 8. Apsolutne vrijednosti: vrste, kognitivna važnost. Uvjete za znanstvenu uporabu apsolutnih i relativnih pokazatelja.
  • 9. Srednje vrijednosti: sadržaj, vrste, vrste, znanstveni uvjeti.
  • 11. Disperzija make-up. Pravilo dodavanja (raspadanje) disperzije i njegove uporabe u statističkoj analizi.
  • 12. Poslovi statističke grafove na sadržaju riješenih zadataka i konstruktivne metode.
  • 13. Redovi govornika: vrste, pokazatelji analize.
  • 14. Metode identificiranja trendova u dinamičkim redovima.
  • 15. Indeksi: Definicija, osnovni elementi indeksa, zadaci riješeni pomoću indeksa, indeksnog sustava u statistici.
  • 16. Pravila za izgradnju dinamičkih i teritorijalnih indeksa.
  • 17. Osnove teorije selektivne metode.
  • 18. Teorija malih uzoraka.
  • 19. Metode za odabir jedinica u selektivni skup.
  • 20. Vida veze, statističke metode za analizu odnosa, koncept korelacije.
  • 21. Analiza odgovarajućih korelacije, modeli korelacije.
  • 22. Nastavlja (nepropusnost) korelacije.
  • 23. Sustav pokazatelja društveno-ekonomske statistike.
  • 24. Osnovne grupe i klasifikacije u društveno-ekonomskoj statistici.
  • 25. Nacionalno bogatstvo: kategorija i sastav.
  • 26. Sadržaj zaliha zemljišta. Pokazatelji sastava zemljišta za oblik vlasništva, namjene i vrste zemljišta.
  • 27. Klasifikacija dugotrajne imovine, metode procjene i revalorizacije, pokazatelji pokreta, države i uporabe.
  • 28. Ciljevi statistike rada. Koncept i sadržaj glavnih kategorija tržišta rada.
  • 29. Statistika Korištenje rada i radnog vremena.
  • 30. Pokazatelji metode produktivnosti i analize rada.
  • 31. Pokazatelji proizvodnje proizvodnje usjeva i prinosa S.-H. Kulture i zemlja.
  • 32. Patelori proizvodnje stočarstva i produktivnosti domaćih životinja.
  • 33.statizam javnih troškova i troškova proizvodnje.
  • 34.Slatizam rada i troškova rada.
  • 35.Babilnost bruto proizvoda i prihoda.
  • 36. Pokreti kretanja i prodaja poljoprivrednih proizvoda.
  • 37. suzbijaju statističke analize poljoprivrednih poduzeća.
  • 38.Slatizam cijena i roba sektora nacionalnog gospodarstva: zadaci i metode analize.
  • 39.STrivost tržišta roba i usluga.
  • 40. Pokazatelji socijalne proizvodnje.
  • 41. Analiza cijena tržišta potrošača.
  • 42. Inflacija i glavni pokazatelji njegove procjene.
  • 43. Fast statistika financiranja poduzeća.
  • 44. Glavni pokazatelji financijskih rezultata poduzeća.
  • 45. brza statistika državnog proračuna.
  • 46. \u200b\u200bSustav pokazatelja statistike državnog proračuna.
  • 47. Sustav pokazatelja monetarne statistike.
  • 48. Statistika sastava i struktura opskrbe novcem u zemlji.
  • 49. Glavne zadaće novčanica.
  • 50. Glavni pokazatelji bankarske statistike.
  • 51.Things i klasifikacija kredita. Zadatke statističke studije.
  • 52. Sustav pokazatelja kreditne statistike.
  • 53. Glavni pokazatelji i metode za analizu poslovanja uštede.
  • 54. posjeduje statistiku tržišta dionica i vrijednosnih papira.
  • 56. Razmjena robe: zadaci i sustav pokazatelja.
  • 57. Sustav nacionalnih računa: koncepti, glavne kategorije i razvrstavanje.
  • 58. Glavna načela izgradnje SNA.
  • 59. Glavni makroekonomski pokazatelji su sadržaj, metode određivanja.
  • 60. Menzijana bilanca: koncepti, zadaci, vrste mafija.
  • 62. Troškovi dohotka i stanovništva
  • 18. Teorija malih uzoraka.

    S velikim brojem jedinica selektivnog agregata (n\u003e 100), distribucija slučajnih pogrešaka uzorka medija u skladu s TORIPUNOV teorem je normalna ili se približava normalnom jer se broj opažanja povećava.

    Međutim, u praksi statističkog istraživanja u uvjetima tržišne ekonomije postaje sve više suočeni s malim uzorcima.

    Mali uzorak naziva se tako selektivno promatranje, od kojih broj jedinica ne prelazi 30.

    Pri ocjenjivanju rezultata malog uzorka ne koristi se vrijednost opće populacije. Da biste odredili moguće ograničenja pogrešaka, koristite kriterij učenika.

    Vrijednost σ izračunava se na temelju selektivnih podataka o opažanju.

    Ova se vrijednost koristi samo za taluidnost u studiju, a ne kao približna procjena Σ u općoj populaciji.

    Probabilistička procjena rezultata malog uzorka razlikuje se od procjene u velikom uzorku u tome s malim brojem opažanja, distribucija vjerojatnosti za prosjek ovisi o broju odabranih jedinica.

    Međutim, za mali uzorak, vrijednost koeficijenta povjerenja t je inače povezan s probabilističkom procjenom nego s velikim uzorkom (budući da se zakon distribucije razlikuje od normalnog).

    Prema distribuciji, vjerojatna pogreška distribucije, vjerojatna pogreška distribucije ovisi i o vrijednosti koeficijenta povjerenja t i na volumen uzorkovanja V.

    Prosječna manja pogreška uzorka izračunava se formulom:

    gdje - disperzija malog uzorka.

    U MV, n / (n-1) koeficijent se mora uzeti u obzir i biti siguran da se podesi. Prilikom određivanja disperzije S2, broj stupnjeva slobode je jednak:

    .

    Granična pogreška malog uzorkovanja određena je formulom

    U isto vrijeme, vrijednost koeficijenta povjerenja t ovisi ne samo o određenoj vjerojatnosti povjerenja, već i na broju uzoraka uzoraka N. Za pojedinačne vrijednosti t i n, vjerojatnost pouzdanosti malog uzorka određena je posebnim tablicama učenika, u kojima se daje raspodjela standardiziranih odstupanja:

    Probabilistička procjena rezultata MV razlikuje se od procjene u BV u činjenici da s malim brojem opažanja, distribucija vjerojatnosti za prosjek ovisi o broju odabranih jedinica

    19. Metode za odabir jedinica u selektivni skup.

    1. Selektivni set mora biti dovoljno velik.

    2. Struktura selektivnog agregata trebala bi najbolje odražavati strukturu djelomičnog agregata

    3. Metoda odabira mora biti slučajna

    Ovisno o tome jesu li odabrane jedinice uključene u uzorak, metoda se razlikuje - slika i ponavlja.

    Snimanje se naziva takav odabir u kojem se jedinica koja pala u uzorak ne vraća na agregat, iz kojih se provodi daljnji izbor.

    Izračun prosječne pogreške ne-slučajnog slučajnog uzorka:

    Izračun ograničene pogreške slučajnog uzorka ne-nesreća:

    Uz ponovni odabir, jedinicu koja je pala u uzorak nakon registracije promatranih značajki vraća se na početni (općenito) skup za sudjelovanje u daljnjem postupku odabira.

    Izračun prosječne pogreške ponovnog jednostavnog slučajnog uzorka je kako slijedi:

    Izračun ograničenja pogreške Re-slučajno uzorkovanje:

    Formiranje agregata uzorka podijeljena je na - pojedinačnu, skupinu i kombinirana.

    Metoda odabira - određuje specifičan mehanizam uzorkovanja jedinica iz opće populacije i podijeljen je u: zapravo - slučajno; mehanički; tipično; serijski; kombinirani.

    Zapravo - slučajno Najčešća metoda odabira u slučajnom uzorku, također se naziva i način izvlačenja, s njom za svaku jedinicu statističkog skupa, ulaznica s nizovima je prazan. Nadalje, u slučajnom redoslijedu odabran je potreban broj statističkih jedinica agregata. Pod tim uvjetima svaka od njih ima istu vjerojatnost da uđe u uzorak.

    Mehanički uzorak, Primijenjena je u slučajevima kada se na bilo koji način naređuje na bilo koji način koji je e. Postoji određeni slijed na mjestu jedinica.

    Da biste odredili prosječnu pogrešku mehaničkog uzorka, formula za srednju pogrešku se koristi na slučajnim ne-slučajnim neizglašima.

    Tipičan izbor, Koristi se kada se sve jedinice opće populacije mogu podijeliti u nekoliko tipičnih skupina. Tipični izbor podrazumijeva uzorak jedinica iz svake skupine po sebi slučajno ili mehanički.

    Za tipično uzorkovanje vrijednost standardne pogreške ovisi o točnosti definicije prosječnih skupina. Dakle, u formuli konačne pogreške tipičnog uzorka, prosjek grupnih disperzija se uzima u obzir, tj.

    Serijski izbor, Primijenjena je u slučajevima kada su jedinice agregata kombinirane u male skupine ili serije. Suština serijskog uzorka je sama po sebi slučajni ili mehanički izbor serije, unutar kojeg se izvodi kontinuirano istraživanje jedinica.

    U serijskom uzorku, vrijednost pogrešaka uzorka ne ovisi o broju po studiju jedinica i na broju ispitanih serija (a) i na integroup disperzijsku vrijednost:

    Kombinirani izbor Može proći jedan ili više koraka. Uzorak se naziva jednostupanjski, ako su jedinice ukupnosti odabrane jednom izloženom.

    Uzorak se zove višestrukoAko odabir agregata prolazi uz korake, serijske faze i svaku fazu, faza odabira ima vlastitu jedinicu odabira.

    "

    U praksi statističkog istraživanja često se moraju nositi mali uzorci koji imaju volumen manje od 30 jedinica. Veliki obično uključuju uzorke više od 100 jedinica.

    Obično se mali uzorci primjenjuju u slučajevima kada je nemoguće ili neprikladno koristiti veliki uzorak. Potrebno je nositi se s takvim uzorcima, na primjer, u anketama turista i posjetitelja hotela.

    Veličina manjeg uzorka pogreške određena je formulama koje se razlikuju od formula za relativno veliku veličinu uzorka ().

    S malim uzorkovanjem n. Treba uzeti u obzir odnos između selektivnog i općeg disperzije:

    Budući da je s malim uzorkom, frakcija je bitna, izračun disperzije se uzima u obzir tzv. broj stupnjeva slobode , Podrazumijeva se kao broj opcija koje mogu poduzeti proizvoljne vrijednosti bez promjene vrijednosti prosjeka.

    Prosječna pogreška malog uzorka određena je formulom:

    Greška ograničenja odabira sredstva i dijeljenja slična je slučaju velikog uzorka:

    gdje je T povjerenje koeficijent, ovisno o specificiranoj razini značajnosti i broju stupnjeva slobode (Dodatak 5).

    Vrijednosti koeficijenta ne ovise ne samo o određenoj vjerojatnosti povjerenja, već i na veličini uzorka n., Za pojedinačne vrijednosti t i n, vjerojatnost pouzdanosti određuje se distribucijom studenta, koja sadrži distribuciju standardiziranih odstupanja:

    Komentar.Kako se uzorak povećava, raspodjela učenika se približava normalnoj distribuciji: kada n.\u003d 20 više se ne razlikuje od normalne distribucije. Prilikom izvođenja malih primjeraka uzorka treba napomenuti da je manja veličina uzorka N.Što je veća razlika između raspodjele studenta i normalne distribucije. Na primjer, za p minuta. \u003d.4 Ova razlika je vrlo značajna, što ukazuje na smanjenje točnosti rezultata malog uzorka.

    Distribucija karakteristika uzorka na općoj populaciji, na temelju djelovanja zakona velikih brojeva, sugerira dovoljno veliko uzorkovanje. Međutim, u praksi statističkog istraživanja često je potrebno nositi se s nemogućnošću iz nekog razloga ili drugog povećanja broja jedinica uzorkovanja koje imaju mali volumen. To se odnosi na proučavanje aktivnosti poduzeća, obrazovnih institucija, poslovnih banaka, itd, čiji je broj u regijama, u pravilu, neznatno, a ponekad je samo 5-10 jedinica.

    U slučaju kada selektivni agregat sastoji od malog broja jedinica, manje od 30, uzorak se zove mali. U tom slučaju, izračunati pogrešku uzorka, nemoguće je koristiti Lyapunov teorem, jer je veličina svake od nasumično odabranih jedinica i njegovu distribuciju može se značajno razlikovati od normalne.

    1908. godine V.S. Gosset je dokazao da procjena odstupanja između selektivnog srednjeg uzorka i općeg prosjeka ima poseban zakon o distribuciji (vidi poglavlje 4). Uzimajući problem probabilističke procjene selektivnog medija s malim brojem opažanja, pokazalo je da je u ovom slučaju potrebno razmotriti raspodjelu neselektivnih prosjeka samih i vrijednosti njihovih odstupanja od prosječnog izvora postavljen. U tom slučaju zaključci mogu biti prilično pouzdani.

    Nazvan je otvaranje studenta teorija malih uzoraka.

    Pri ocjenjivanju rezultata malog uzorka se ne koristi veličina opće disperzije u izračunima. U malim uzorcima koristi se "ispravljeno" disperzija uzorka za izračunavanje prosječne pogreške uzorka:

    oni. Za razliku od velikih uzoraka u denominatoru umjesto toga p vrijedi (i - 1). Izračun prosječne pogreške uzorka za mali uzorak je dan u tablici. 5.7.

    Tablica 5.7.

    Izračun prosječne pogreške malog uzorka

    Ograničenje pogreške malog uzorka jednaka je: gdje t. - koeficijent povjerenja.

    Vrijednost t. Inače, ona je povezana s vjerojatno procjenom nego s velikim uzorkom. U skladu s raspodjelom studenta, vjerojatna procjena ovisi o veličini t, I na veličini uzorka, u slučaju da granična pogreška ne prelazi M-više srednju pogrešku u malim uzorcima. Međutim, to ovisi o broju odabranih jedinica.

    V.S. Gosset je sastavio tablicu distribucije vjerojatnosti u malim uzorcima, što odgovara tim vrijednostima koeficijenta povjerenja t. i drugačiju količinu malih uzoraka i, izvadak iz njega dan je u tablici. 5.8.

    Tablica 5.8.

    Fragment tablice vjerojatnosti učenika (vjerojatnosti se pomnoženo s 1000)

    Tablica podataka. 5.8 Navedite da s neograničenim povećanjem veličine uzorka (i \u003d °°), raspodjela učenika nastoji normalnom zakon o distribuciji, a kada se i \u003d 20 razlikuje od njega.

    Tablica za distribuciju studenata često se daje u drugom obliku, prikladniji za praktičnu primjenu (tablica 5.9).

    Tablica 5.9.

    Neke vrijednosti (distribucija studenta

    Broj stupnjeva slobode

    za jednostrani interval

    za bilateralni interval

    P \u003d. 0,99

    Razmotrite kako koristiti tablicu za distribuciju. Svaka fiksna vrijednost p Izračunati broj stupnjeva slobode k. gdje k \u003d p - 1. Za svaku vrijednost stupnja slobode, označena je granična vrijednost t p (t 095 ili t 0. 99), koji s ovom vjerojatnošću R Neće se prekoračiti povremenim oscilacijama rezultata uzorka. Na temelju veličine t p. Određuju se granice povjerenja

    interval

    Kao vjerojatnost povjerenja kada je bilateralna provjera, u pravilu, koristiti P \u003d. 0,95 ili P \u003d. 0,99, koji ne isključuje izbor i druge vrijednosti vjerojatnosti. Vrijednost vjerojatnosti je odabrana na temelju specifičnih zahtjeva zadataka, za rješavanje malog uzorka.

    Vjerojatnost oslobađanja vrijednosti općeg prosjeka izvan granice intervala pouzdanosti je jednaka q, Gdje p: = 1 - r. Ova vrijednost je vrlo mala. Prema tome za razmatrane vjerojatnosti r To je 0,05 i 0,01.

    Mali uzorci su široko raspoređeni u tehničkim znanostima u biologiji, ali se primjenjuju u statističke studije potrebne su s velikom pažnjom, samo s odgovarajućim teorijskim i praktičnim ispitivanjem. Moguće je koristiti mali uzorak ako je distribucija osobine u općoj populaciji normalna ili blizu njega, a prosječna vrijednost se izračunava selektivnim podacima dobivenim kao rezultat neovisnih zapažanja. Osim toga, treba imati na umu da je točnost rezultata uzoraka malog volumena niža nego s velikim uzorkom.

    Podijelite s prijateljima ili spremite za sebe:

    Učitavam...