Koja je značajka karakteristična značajka varijacijske serije. Varijacijske serije i njegove karakteristike

Pozvat će se razne uzorkovane vrijednosti mogućnosti niz vrijednosti i označavaju: x 1 , x 2,…. Prije svega, mi ćemo proizvoditi u rasponu mogućnosti, tj. njihov raspored u rastućem ili silaznom redoslijedu. Svaka opcija ima svoju težinu, tj. broj koji karakterizira doprinos ove opcije ukupnoj populaciji. Frekvencije ili frekvencije koriste se kao utezi.

Frekvencija n i opcija x i je broj koji pokazuje koliko se puta određena opcija javlja u razmatranoj populaciji uzoraka.

Učestalost ili relativna frekvencija w i opcija x i naziva se brojem jednakim omjeru frekvencije varijante i zbroju frekvencija svih varijanti. Učestalost pokazuje koji dio populacije uzorka ima zadanu opciju.

Slijed opcija s pripadajućim težinama (frekvencijama ili frekvencijama), zapisanim uzlaznim (ili silaznim) redoslijedom, naziva se varijacijska serija.

Varijacijske serije su diskretne i intervalne.

Za diskretni niz varijacija specificiraju se točke vrijednosti značajke, za intervalne vrijednosti značajke se navode kao intervali. Varijacijske serije mogu prikazati raspodjelu frekvencija ili relativnih frekvencija (frekvencija), ovisno o tome koja je vrijednost naznačena za svaku opciju - frekvenciju ili frekvenciju.

Niz diskretnih varijacija raspodjele frekvencija izgleda kao:

Frekvencije se pronalaze po formuli, i = 1, 2, ..., m.

w 1 +w 2 + … + w m = 1.

Primjer 4.1. Za zadani skup brojeva

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

graditi diskretno varijacijska serija raspodjela frekvencija i frekvencija.

Odluka . Količina stanovništva iznosi n= 10. Diskretni niz frekvencijskih raspodjela ima oblik

Intervalni nizovi imaju sličan oblik zapisa.

Niz varijacijskih intervala distribucije frekvencije zapisano je kao:

Zbroj svih frekvencija jednak je ukupnom broju promatranja, tj. obujam stanovništva: n = n 1 +n 2 + … + n m.

Intervalne varijacijske serije raspodjele relativnih frekvencija (frekvencija) izgleda kao:

Učestalost se pronalazi po formuli, i = 1, 2, ..., m.

Zbroj svih frekvencija jednak je jedinici: w 1 +w 2 + … + w m = 1.

Intervalne serije najčešće se koriste u praksi. Ako postoji puno podataka statističkog uzorka i njihove se vrijednosti međusobno razlikuju po proizvoljno malom iznosu, tada diskretne serije jer će ti podaci biti prilično glomazni i nezgodni za daljnja istraživanja. U ovom slučaju koristi se grupiranje podataka, t.j. interval koji sadrži sve vrijednosti značajke podijeljen je u nekoliko djelomičnih intervala i, izračunavanjem učestalosti za svaki interval, dobiva se intervalni niz. Zapišimo detaljnije shemu za konstrukciju intervalskog niza, pod pretpostavkom da će duljine djelomičnih intervala biti iste.

2.2 Izgradnja intervalne serije

Da biste izgradili intervalnu seriju, trebate:

Odredite broj intervala;

Odredite duljinu intervala;

Odredite mjesto razmaka na osi.

Za utvrđivanje broj intervala k postoji Sturgesova formula prema kojoj

,

Gdje n- obujam cjelokupne populacije.

Na primjer, ako postoji 100 vrijednosti karakteristike (varijante), tada se preporučuje uzimati broj intervala u jednakim intervalima za izgradnju niza intervala.

Međutim, vrlo često u praksi broj intervala bira sam istraživač, s obzirom na to da taj broj ne bi trebao biti jako velik, tako da serija nije glomazna, ali ni vrlo mala, kako ne bi izgubila neka svojstva distribucija.

Duljina intervala h određuje se sljedećom formulom:

,

Gdje x max i x min je najveći i najviše mala vrijednost mogućnosti.

Vrijednost se zovu pomesti red.

Da bi sami konstruirali intervale, oni to rade drugačije. Jedan od najvažnijih jednostavni načini je kako slijedi. Kao vrijednost uzima se početak prvog intervala
... Tada se ostatak granica intervala pronalazi po formuli. Očito, kraj posljednjeg intervala a m + 1 mora zadovoljiti uvjet

Nakon što su pronađene sve granice intervala, određuju se frekvencije (ili frekvencije) tih intervala. Da biste riješili taj problem, pregledajte sve opcije i odredite broj opcija koje spadaju u jedan ili drugi interval. Razmotrimo na primjeru kompletnu konstrukciju intervalnog niza.

Primjer 4.2. Za slijedeće statistike, napisane uzlaznim redoslijedom, konstruirajte niz intervala s brojem intervala jednakim 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Odluka. Ukupno n= 50 vrijednosti opcija.

Broj intervala naveden je u iskazu problema, tj. k=5.

Duljina intervala je
.

Odredimo granice intervala:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Da bismo odredili učestalost intervala, računamo broj varijanti koje spadaju u taj interval. Na primjer, opcije 11, 12, 12, 14, 14, 15 spadaju u prvi interval od 2,5 do 19,5. Njihov je broj 6, stoga je učestalost prvog intervala n 1 = 6. Učestalost prvog intervala je ... Drugi interval od 19,5 do 36,5 uključuje inačice 21, 21, 22, 23, 25, čiji je broj 5. Stoga je učestalost drugog intervala n 2 = 5 i frekvencija ... Pronašavši na sličan način frekvencije i frekvencije za sve intervale, dobivamo sljedeće intervalne serije.

Intervalni niz raspodjele frekvencije je sljedeći:

Zbir frekvencija je 6 + 5 + 9 + 11 + 8 + 11 = 50.

Intervalni niz raspodjele frekvencije je sljedeći:

Zbir frekvencija je 0,12 + 0,1 + 0,18 + 0,22 + 0,16 + 0,22 = 1. ■

Prilikom konstruiranja intervalskih serija, ovisno o specifičnim uvjetima problema koji se razmatra, mogu se primijeniti i druga pravila, naime

1. Intervalne varijacijske serije mogu se sastojati od djelomičnih intervala različitih duljina. Nejednake duljine intervala omogućuju izdvajanje svojstava statističke populacije s neravnomjernom raspodjelom značajke. Primjerice, ako granice intervala određuju broj stanovnika u gradovima, tada je poželjno u ovom problemu koristiti intervale koji su nejednake duljine. Očito je da je za male gradove također bitna mala razlika u broju stanovnika, a za velike gradove razlika od desetaka i stotina stanovnika nije značajna. Intervalni redovi s nejednakom duljinom djelomičnih intervala proučavaju se uglavnom u opća teorija statistike i njihovo razmatranje je izvan dosega ovog priručnika.

2.U matematička statistika ponekad se uzimaju u obzir intervalske serije za koje se pretpostavlja da je lijeva granica prvog intervala –∞, a desna granica posljednjeg intervala + ∞. To je učinjeno kako bi se statistička raspodjela približila teoretskoj.

3. Pri konstruiranju intervalskih serija može se ispostaviti da se vrijednost neke varijante točno podudara s granicom intervala. Najbolje u ovom slučaju je učiniti sljedeće. Ako postoji samo jedna takva podudarnost, tada uzmite u obzir da je razmatrana opcija sa svojom učestalošću upala u interval smješten bliže sredini intervalskog niza, ako postoji nekoliko takvih opcija, tada se sve one pripisuju pravim intervalima ove opcije ili sve - lijeve.

4. Nakon određivanja broja intervala i njihove duljine, raspored intervala može se izvršiti na drugi način. Pronađite aritmetičku sredinu svih razmatranih vrijednosti opcija x oženiti se a prvi interval je konstruiran na takav način da bi ova srednja vrijednost uzorka bila unutar nekog intervala. Tako dobivamo interval od x oženiti se - 0,5 h prije x Sri + 0,5 h... Zatim lijevo i desno, zbrajajući duljinu intervala, gradimo preostale intervale do x min i x max neće spadati u prvi, odnosno zadnji interval.

5. Intervalni redovi na veliki broj prikladno je intervale pisati okomito, tj. intervali se ne smiju bilježiti u prvom retku, već u prvom stupcu, već frekvencije (ili frekvencije) u drugom stupcu.

Podaci uzorka mogu se smatrati vrijednostima neke slučajne varijable x... Slučajna varijabla ima svoj zakon raspodjele. Iz teorije vjerojatnosti poznato je da se zakon raspodjele diskretne slučajne varijable može odrediti u obliku distribucijskog niza i kontinuirano - pomoću funkcije gustoće raspodjele. Međutim, postoji univerzalni zakon o raspodjeli koji vrijedi i za diskretnu i za kontinuiranu slučajne varijable... Ovaj zakon raspodjele dan je u obliku funkcije raspodjele F(x) = Str(x<x). Za uzorke podataka možete odrediti analog funkcije distribucije - empirijsku funkciju distribucije.

Statističke distribucijske serije- Ovo je uređena raspodjela jedinica stanovništva u skupine prema određenim promjenjivim karakteristikama.
Ovisno o značajci koja leži u osnovi formiranja distribucijskog niza, oni razlikuju atributivni i varijacijski niz raspodjele.

Prisutnost zajedničkog obilježja osnova je za formiranje statističke populacije, što je rezultat opisa ili mjerenja zajedničkih obilježja predmeta istraživanja.

Predmet proučavanja u statistici mijenjaju se (variraju) znakovi ili statistički znakovi.

Vrste statističkih značajki.

Distribucijski nizovi nazivaju se atributivnim na temelju kriterija kvalitete. Atributivni Je li znak koji ima ime (na primjer, zanimanje: krojačica, učiteljica itd.).
Uobičajeno je rasporediti brojne distribucije u obliku tablica. Stol 2.8 prikazuje atributivni niz raspodjele.
Tablica 2.8 - Raspodjela vrsta pravne pomoći koju odvjetnici pružaju građanima jedne od regija Ruske Federacije.

Varijacijske serije Jesu li vrijednosti karakteristike (ili intervali vrijednosti) i njihove frekvencije.
Nizovi raspodjele nazivaju se varijacijskim nizovima izgrađena na kvantitativnoj osnovi. Bilo koja varijacijska serija sastoji se od dva elementa: opcija i frekvencija.
Varijante se smatraju pojedinačnim vrijednostima karakteristike koje ona uzima u nizu varijacija.
Frekvencije su brojevi pojedinih varijanti ili svake skupine niza varijacija, tj. to su brojevi koji pokazuju koliko se često pojavljuju određene varijante u distribucijskom nizu. Zbroj svih frekvencija određuje veličinu cjelokupne populacije i njezin volumen.
Frekvencije su frekvencije izražene u dijelovima jednog ili kao postotak od ukupnog broja. Sukladno tome, zbroj frekvencija je 1 ili 100%. Varijacijski niz omogućuje procjenu oblika zakona distribucije na temelju stvarnih podataka.

Ovisno o prirodi varijacije osobine, razlikuju se diskretne i intervalne varijacijske serije.
Primjer diskretnih serija varijacija dan je u tablici. 2.9.
Tablica 2.9 - Raspodjela obitelji prema broju zauzetih soba u pojedinim stanovima 1989. godine u Ruskoj Federaciji.

Prvi stupac tablice prikazuje inačice diskretnih varijacijskih serija, drugi - frekvencije varijacijskog niza, treći - indekse frekvencija.

Varijacijske serije

U općoj populaciji istražuje se određena kvantitativna značajka. Iz njega se nasumično izdvaja uzorak volumena n, odnosno broj elemenata u uzorku je n... U prvoj fazi statističke obrade, u rasponu uzorkovanje, tj. naručivanje brojeva x 1, x 2, ..., x n Uzlazni. Svaka promatrana vrijednost x i nazvao varijanta... Frekvencija m i Je li broj opažanja vrijednosti x i u uzorku. Relativna frekvencija (frekvencija) w i Je li omjer frekvencije m i do veličine uzorka n: .
Pri proučavanju varijacijskih serija također se koriste koncepti akumulirane frekvencije i akumulirane frekvencije. Neka bude x neki broj. Zatim broj opcija , čije su vrijednosti manje x, naziva se akumulirana frekvencija: za x i n naziva se akumulirana frekvencija w i max.
Značajka se naziva diskretno variranom ako se njezine pojedinačne vrijednosti (varijante) međusobno razlikuju nekom konačnom vrijednošću (obično cijelim brojem). Niz varijacija takve značajke naziva se diskretni niz varijacija.

Tablica 1. Opći prikaz diskretnih varijacijskih serija frekvencija

Karakteristične vrijednostix i x 1 x 2 x n
Frekvencijem i m 1 m 2 m n

Značajka se naziva kontinuirano varirajući ako se njezine vrijednosti međusobno razlikuju po proizvoljno malom iznosu, t.j. atribut može poprimiti bilo koje vrijednosti u određenom intervalu. Kontinuirana varijacijska serija za takvu značajku naziva se interval.

Tablica 2. Opći prikaz intervala varijacijskog niza frekvencija

Tablica 3. Grafičke slike varijacijske serije

RedPoligon ili histogramFunkcija empirijske raspodjele
Diskretna
Interval
Gledajući rezultate promatranja, utvrđuje se koliko je vrijednosti opcija ušlo u svaki određeni interval. Pretpostavlja se da svaki interval pripada jednom od svojih krajeva: ili je u svim slučajevima lijevo (češće), ili u svim slučajevima desno, a frekvencije ili frekvencije pokazuju broj opcija uključenih u naznačene granice. Razlike a i - a i +1 nazivaju se djelomični intervali. Da bi se pojednostavili naknadni izračuni, serija varijacija intervala može se zamijeniti konvencionalno diskretnom. U ovom slučaju, medijan vrijednosti ja-th interval se uzima kao varijanta x i i odgovarajuću frekvenciju intervala m i- za frekvenciju ovog intervala.
Za grafički prikaz varijacijskih serija najčešće se koriste poligon, histogram, kumulativna krivulja i empirijska funkcija raspodjele.

Stol 2.3 (Prikazano je grupiranje stanovništva Rusije prema prosječnom dohotku po stanovniku u travnju 1994.) serija varijacija intervala.
Prikladno je analizirati distribucijske serije uz pomoć grafičke slike, što omogućuje prosudbu oblika distribucije. Jasnu ideju o prirodi promjene frekvencija varijacijskog niza daje poligon i histogram.
Poligon se koristi za prikazivanje diskretnih varijacijskih serija.
Prikažimo, na primjer, grafički raspodjelu stambenog fonda prema vrsti stanova (tablica 2.10).
Tablica 2.10 - Raspodjela stambenog fonda urbanog područja prema vrsti stanova (proizvoljni brojevi).


Sl. Poligon za dodjelu stambenog fonda


Na ordinatnoj osi mogu se ucrtati ne samo vrijednosti frekvencija, već i frekvencije varijacijskog niza.
Histogram se uzima za sliku serije varijacija intervala... Prilikom izrade histograma, vrijednosti intervala crtaju se na osi apscise, a frekvencije se prikazuju pravokutnicima izgrađenim u odgovarajućim intervalima. Visina šipki u slučaju jednakog razmaka trebala bi biti proporcionalna frekvencijama. Histogram je graf u kojem je niz prikazan u obliku traka koje su susjedne jedna drugoj.
Grafički prikažimo intervalne distribucijske serije dane u tablici. 2.11.
Tablica 2.11 - Raspodjela obitelji prema veličini životnog prostora po osobi (proizvoljne brojke).
N str / str Grupe obitelji prema veličini životnog prostora po osobi Broj obitelji s danom veličinom životnog prostora Akumulirani broj obitelji
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
UKUPNO 115 ----


Sl. 2.2. Histogram raspodjele obitelji prema veličini životnog prostora po osobi


Koristeći podatke akumuliranog niza (tablica 2.11), konstruiramo kumulativna raspodjela.


Sl. 2.3. Kumulativna raspodjela obitelji prema životnom prostoru po osobi


Prikaz varijacijskih serija u obliku kumulata posebno je učinkovit za varijacijske serije, čije su frekvencije izražene u dijelovima ili postocima do zbroja frekvencija serije.
Ako promijenimo osi kada grafički prikazujemo niz varijacija u obliku kumulata, tada ćemo dobiti ogive... Na sl. 2.4 prikazuje cilj izgrađen na temelju podataka u tablici. 2.11.
Histogram se može pretvoriti u distribucijski poligon pronalaženjem središnjih točaka stranica pravokutnika i zatim povezivanjem tih točaka ravnim linijama. Rezultirajući distribucijski poligon prikazan je na sl. 2.2 s isprekidanom crtom.
Pri konstruiranju histograma raspodjele varijacijskog niza s nejednakim intervalima na osi ordinata, ne crtaju se frekvencije, već gustoća raspodjele obilježja u odgovarajućim intervalima.
Gustoća raspodjele je frekvencija izračunata po jedinici širine intervala, tj. koliko je jedinica u svakoj skupini po jedinici intervala. Primjer izračuna gustoće raspodjele prikazan je u tablici. 2.12.
Tablica 2.12 - Raspodjela poduzeća prema broju zaposlenih (uvjetni brojevi)
N str / str Grupe poduzeća prema broju zaposlenih, ljudi Broj poduzeća Veličina intervala, osoba Gustoća distribucije
ALI 1 2 3=1/2
1 Do 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
UKUPNO 147 ---- ----

Za grafički prikaz varijacijskih serija također se mogu koristiti kumulativna krivulja... Uz pomoć kumulacija (krivulja zbroja) prikazuje se niz akumuliranih frekvencija. Akumulirane frekvencije određuju se sekvencijalnim zbrajanjem frekvencija po skupinama i pokazuju koliko jedinica populacije ima vrijednost obilježja koja nije veća od razmatrane vrijednosti.


Sl. 2.4. Raspon raspodjele obitelji prema veličini životnog prostora po osobi

Prilikom konstruiranja kumulata serije varijacija intervala, varijante reda crtaju se duž osi apscise, a akumulirane frekvencije duž osi ordinata.

Kontinuirane varijacijske serije

Niz kontinuiranih varijacija je niz izgrađen na temelju kvantitativne statističke značajke. Primjer. Prosječno trajanje bolesti osuđenika (dana po osobi) u jesensko-zimskom razdoblju u tekućoj godini iznosilo je:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

RUSKA AKADEMIJA NARODNE EKONOMIJE I JAVNE SLUŽBE PREDSJEDNIK RUSKE FEDERACIJE

PODRUŽNICA ORLOV

Zavod za matematiku i matematičke metode u menadžmentu

Samostalan rad

Matematika

na temu "Varijacijske serije i njegove karakteristike"

za redovite studente Fakulteta za ekonomiju i menadžment

područja obuke "Upravljanje osobljem"


Svrha rada: Ovladavanje pojmovima matematičke statistike i metodama primarne obrade podataka.

Primjer rješavanja tipičnih zadataka.

Cilj 1.

Sljedeći podaci dobiveni su anketom ():

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

Nužno je:

1) Sastavite varijacijsku seriju (statistička raspodjela uzorka), prethodno zabilježivši rangirani diskretni niz opcija.

2) Konstruirajte poligon frekvencija i kumulativno.

3) Sastaviti niz raspodjela relativnih frekvencija (frekvencija).

4) Pronađite glavne numeričke karakteristike niza varijacija (upotrijebite pojednostavljene formule da biste ih pronašli): a) aritmetička sredina, b) medijan Mi i moda Moe, c) varijanca s 2, d) standardno odstupanje s, e) koeficijent varijacije V.

5) Objasnite značenje dobivenih rezultata.

Odluka.

1) Za sastavljanje rangirani diskretni raspon opcija razvrstajte podatke ankete po veličini i poredajte ih uzlaznim redoslijedom

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

Sastavimo niz varijacija tako što ćemo u prvi red tablice upisati uočene vrijednosti (opcije), a u drugi odgovarajuće frekvencije (tablica 1)

Stol 1.

2) Frekvencijski poligon je izlomljena crta koja povezuje točke ( x i; n i), ja=1, 2,…, m gdje m x.

Nacrtajmo poligon frekvencija varijacijskog niza (slika 1).

Sl. 1. Frekvencijski poligon

Kumulativna krivulja (kumulativna) za diskretni niz varijacija izlomljena je crta koja povezuje točke ( x i; n i nak), ja=1, 2,…, m.

Pronađite akumulirane frekvencije n i nak(kumulativna učestalost pokazuje koliko je varijanti primijećeno s vrijednošću značajke manjom x). Pronađene vrijednosti unose se u treći redak tablice 1.



Izgradimo kumulativ (slika 2).

Slika 2. Kumulata

3) Pronađimo relativne frekvencije (frekvencije), gdje, gdje m- broj različitih vrijednosti karakteristike x, koji će se izračunati s istom točnošću.

Zapišimo niz raspodjele relativnih frekvencija (frekvencija) u obliku tablice 2

tablica 2

4) Pronađimo glavne numeričke karakteristike varijacijske serije:

a) Aritmetičku sredinu pronalazimo pomoću pojednostavljene formule:

,

gdje su uvjetne opcije

Stavljamo iz= 3 (jedna od prosječno promatranih vrijednosti), k= 1 (razlika između dvije susjedne opcije) i sastavite tablicu izračuna (tablica 3).

Tablica 3.

x i n ja u i u i n i u i 2 n i
-3 -12
-2 -26
-1 -14
Iznos -11

Tada je aritmetička sredina

b) Medijan Mi varijacijska serija je vrijednost značajke koja pada usred rangirane serije promatranja. Ova diskretna varijacijska serija sadrži paran broj pojmova ( n= 80), što znači da je medijan jednak polovičnom zbroju dviju mogućnosti medijana.

Moda Moe varijacijska serija je varijanta koja odgovara najvišoj frekvenciji. Za datu seriju varijacija, najvišu frekvenciju n max = 24 odgovara varijanti x= 3 znači moda Moe=3.

c) Disperzija s 2, što je mjera disperzije mogućih vrijednosti pokazatelja x oko njegove srednje vrijednosti nalazimo pomoću pojednostavljene formule:

gdje u i- uvjetne opcije

U tablicu 3 uvest ćemo i posredne izračune.

Zatim varijance

d) Standardno odstupanje s naći po formuli:

.

e) Koeficijent varijacije V: (),

Koeficijent varijacije nemjerljiva je veličina, pa je prikladan za usporedbu rasipanja varijacijskih serija, čije varijante imaju različite dimenzije.

Koeficijent varijacije

.

5) Značenje dobivenih rezultata je da vrijednost karakterizira prosječnu vrijednost značajke x unutar razmatranog uzorka, odnosno prosječna vrijednost bila je 2,86. Standardno odstupanje s opisuje apsolutni raspon vrijednosti pokazatelja x a u ovom slučaju je s≈ 1,55. Koeficijent varijacije V karakterizira relativnu varijabilnost pokazatelja x, odnosno relativni raspon oko njegove prosječne vrijednosti, a u ovom slučaju je.

Odgovor: ; ; ; .

Cilj 2.

O kapitalu 40 najvećih banaka u središnjoj Rusiji dostupni su sljedeći podaci:

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

Nužno je:

1) Konstruirajte niz varijacija intervala.

2) Izračunajte srednju vrijednost uzorka i varijansu uzorka

3) Pronađite standardno odstupanje i koeficijent varijacije.

4) Konstruirajte histogram distribucijskih frekvencija.

Odluka.

1) Odaberimo proizvoljan broj intervala, na primjer 8. Tada je širina intervala:

.

Sastavimo tablicu izračuna:

Opcija intervala, x k –x k +1 Frekvencija, n i Sredina intervala x i Uvjetna opcija, i ja i ja n i i ja 2 n i (i i + 1) 2 n i
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
Iznos – 5

Vrijednost je odabrana kao lažna nula c = 62,5 (ova se opcija nalazi približno u sredini reda varijacija) .

Uvjetne opcije određuju se formulom

Primjer rješavanja testa iz matematičke statistike

Problem 1

Početni podaci : studenti određene grupe od 30 ljudi položili su ispit iz kolegija "Informatika". Ocjene koje su učenici dobili čine sljedeći niz brojeva:

I. Sastavimo varijacijsku seriju

m x

w x

m x nak

w x nak

Ukupno:

II. Grafički prikaz statističkih podataka.

III. Numeričke karakteristike uzorka.

1. Aritmetička sredina

2. Geometrijska sredina

3. Moda

4. Medijan

222222333333333 | 3 34444444445555

5. Varijacija uzorka

7. Koeficijent varijacije

8. Asimetrija

9. Koeficijent asimetrije

10. Višak

11. Koeficijent kurtoze

2. zadatak

Početni podaci : studenti određene skupine napisali su svoj završni test. Skupinu čini 30 ljudi. Bodovi koje su postigli studenti tvore sljedeću seriju brojeva

Odluka

I. Budući da značajka ima različita značenja, za nju ćemo konstruirati niz varijacija intervala. Da biste to učinili, prvo postavite vrijednost intervala h... Upotrijebit ćemo Stairgerovu formulu

Sastavimo ljestvicu intervala. U tom ćemo slučaju za gornju granicu prvog intervala uzeti vrijednost određenu formulom:

Gornje granice sljedećih intervala određene su sljedećom rekurzivnom formulom:

zatim

Završavamo izgradnju skale intervala, jer je gornja granica sljedećeg intervala postala veća ili jednaka maksimalnoj vrijednosti uzorka
.

II. Grafički prikaz serija varijacija intervala

III. Numeričke karakteristike uzorka

Da bismo odredili numeričke karakteristike uzorka, sastavit ćemo pomoćnu tablicu

Iznos:

1. Aritmetička sredina

2. Geometrijska sredina

3. Moda

4. Medijan

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Varijacija uzorka

6. Uzorak standardne devijacije

7. Koeficijent varijacije

8. Asimetrija

9. Koeficijent asimetrije

10. Višak

11. Koeficijent kurtoze

3. problem

Stanje : podjela ljestvice ampermetra je 0,1 A. Očitavanja se zaokružuju na najbližu cijelu podjelu. Pronađite vjerojatnost da pogreška prelazi 0,02 A.

Odluka.

Pogreška zaokruživanja može se smatrati slučajnom vrijednošću. x, koji se ravnomjerno raspoređuje u intervalu između dvije susjedne cjelobrojne podjele. Gustoća jednolike raspodjele

,

Gdje
- duljina intervala u kojem su zatvorene moguće vrijednosti x; izvan ovog intervala
U ovom problemu duljina intervala koji sadrži moguće vrijednosti x, jednako je 0,1, dakle

Pogreška brojanja premašit će 0,02 ako je zatvorena u intervalu (0,02; 0,08). Zatim

Odgovor: R=0,6

Problem 4

Početni podaci: matematičko očekivanje i standardno odstupanje normalno raspodijeljene značajke x su jednake 10 i 2. Pronađi vjerojatnost da je u rezultatu testa x poprimit će vrijednost priloženu u intervalu (12, 14).

Odluka.

Upotrijebimo formulu

I teoretske frekvencije

Odluka

Za X, njegovo matematičko očekivanje M (X) i varijansa D (X). Odluka... Pronađimo funkciju raspodjele F (x) slučajne varijable ... pogreška uzorkovanja). Sastavimo varijacijski redŠirina raspona bit će: Za svaku vrijednost nekoliko izračunajmo koliko ...

  • Rješenje: Odvojena jednadžba

    Odluka

    U obrascu Pronaći privatno rješenja nehomogena jednadžba šminka sustav Riješimo rezultirajući sustav ...; +47; +61; +10; -osam. Interval konstrukcije varijacijski red... Dati statističke procjene srednje vrijednosti ...

  • Rješenje: Izračunajmo lančane i osnovne apsolutne prirastke, stope rasta, stope rasta. Dobivene vrijednosti sažete su u tablici 1

    Odluka

    Količina proizvodnje. Odluka: Aritmetička sredina intervala varijacijski nekoliko izračunava se na sljedeći način: za ... Granična pogreška uzorkovanja s vjerojatnošću od 0,954 (t = 2) bit će: Δ w = t * μ = 2 * 0,0146 = 0,02927 Odrediti granice ...

  • Odluka. Znak

    Odluka

    O čijem radnom iskustvu i izmišljeni uzorak. Uzorak prosječnog radnog staža ... radnog dana ovih zaposlenika i izmišljeni uzorak. Prosječno trajanje uzorka je ... 1,16, razina značajnosti je α = 0,05. Odluka. Varijacijski red ovog uzorka ima oblik: 0,71 ...

  • Radni kurikulum iz biologije za razrede 10-11 Sastavila: Polikarpova S.V

    Radni kurikulum

    Najjednostavnije sheme križanja "5 LR. " Odluka osnovni genetski problemi "6 L. r. " Odluka elementarni genetski problemi “7 L. r. “..., 110, 115, 112, 110. Šminka varijacijski red, crtati varijacijski krivulja, pronađite prosječnu vrijednost značajke ...

  • Posebno mjesto u statističkoj analizi pripada definiciji prosječne razine proučavanog atributa ili pojave. Prosječna razina značajke mjeri se prosječnim vrijednostima.

    Prosječna vrijednost karakterizira opću kvantitativnu razinu svojstva koje se proučava i skupno je svojstvo statističke populacije. Neutralizira, slabi slučajna odstupanja pojedinačnih promatranja u jednom ili drugom smjeru i izvlači u prvi plan glavno, tipično svojstvo ispitivane osobine.

    Prosječne vrijednosti su široko korištene:

    1. Procijeniti zdravstveno stanje stanovništva: karakteristike tjelesnog razvoja (visina, težina, opseg prsa, itd.), Utvrđivanje rasprostranjenosti i trajanja različitih bolesti, analiza demografskih pokazatelja (prirodno kretanje stanovništva, prosječni životni vijek , reprodukcija stanovništva, prosječna populacija itd.).

    2. Proučiti aktivnosti medicinskih ustanova, medicinskog osoblja i procijeniti kvalitetu njihovog rada, planirati i utvrditi potrebe stanovništva u raznim vrstama medicinske skrbi (prosječni broj poziva ili posjeta po stanovniku godišnje, prosječna duljina boravka pacijenta u bolnici, prosječno trajanje pregleda pacijenta, prosječna opskrbljenost liječnika, kreveta itd.).

    3. Okarakterizirati sanitarno i epidemiološko stanje (prosječni sadržaj prašine u radionici, prosječna površina po osobi, prosječna potrošnja bjelančevina, masti i ugljikohidrata itd.).

    4. Utvrditi medicinske i fiziološke parametre u zdravlju i bolestima, prilikom obrade laboratorijskih podataka, utvrditi pouzdanost rezultata studije uzorka u socijalnim i higijenskim, kliničkim, eksperimentalnim studijama.

    Prosječne vrijednosti izračunavaju se na temelju niza varijacija. Varijacijske serije Je kvalitativno homogena statistička populacija, čije pojedinačne jedinice karakteriziraju kvantitativne razlike svojstva ili fenomena koji se proučava.

    Kvantitativne varijacije mogu biti dvije vrste: diskontinuirane (diskretne) i kontinuirane.

    Diskontinuirani (diskretni) znak izražava se samo kao cijeli broj i ne može imati nikakve posredne vrijednosti (na primjer, broj posjeta, populacija nalazišta, broj djece u obitelji, težina bolesti u bodovima itd.).

    Kontinuirani znak može imati bilo koje vrijednosti unutar određenih granica, uključujući i razlomljene, i izražava se samo približno (na primjer, težina - za odrasle se možete ograničiti na kilograme, a za novorođenčad - grame; visina, krvni tlak, utrošeno vrijeme prilikom pregleda pacijenta itd.).



    Numerička vrijednost svake pojedine značajke ili pojave uključene u varijacijski niz naziva se varijantom i označava se slovom V ... U matematičkoj literaturi postoje i druge oznake, na primjer x ili g.

    Niz varijacija, gdje je svaka opcija naznačena jednom, naziva se jednostavnim. Takve se serije koriste u većini statističkih zadataka u slučaju računalne obrade podataka.

    S povećanjem broja promatranja, u pravilu se ponavljaju vrijednosti varijante. U ovom slučaju, a grupirane varijacijske serije, gdje je naznačen broj ponavljanja (učestalost, označena slovom " R »).

    Rangirane varijacijske serije sastoji se od varijanti poredanih u rastućem ili silaznom redoslijedu. Mogu se rangirati i jednostavne i grupirane serije.

    Niz varijacija intervala sastavljeni su kako bi se pojednostavili naknadni izračuni izvedeni bez upotrebe računala, s vrlo velikim brojem promatračkih jedinica (više od 1000).

    Kontinuirane varijacijske serije uključuje vrijednosti varijanti, koje se mogu izraziti bilo kojom vrijednošću.

    Ako su u nizu varijacija vrijednosti značajke (opcije) dane u obliku zasebnih specifičnih brojeva, tada se takav niz naziva diskretna.

    Opće karakteristike vrijednosti atributa, odražene u nizu varijacija, su prosječne vrijednosti. Među njima se najčešće koriste: aritmetička sredina M, moda Moe i medijan Mi. Svaka od ovih karakteristika je jedinstvena. Ne mogu se međusobno zamijeniti, a samo su u agregatu dovoljno cjeloviti i u komprimiranom obliku su obilježja niza varijacija.

    Moda (Mo) imenovati značenje najčešćih opcija.

    Medijan (Mi) Je li vrijednost varijacije, dijeleći poredani niz varijacija na pola (na svakoj strani medijane postoji polovica varijacije). U rijetkim slučajevima, kada postoji simetrična varijacijska serija, način i medijan jednaki su jedni drugima i podudaraju se s vrijednošću aritmetičke sredine.

    Najtipičnija karakteristika varijantnih vrijednosti je aritmetička sredina količina ( M ). U matematičkoj se literaturi označava .

    Aritmetička sredina (M, ) Opća je kvantitativna karakteristika određene značajke proučavanih pojava koje čine kvalitativno homogenu statističku populaciju. Razlikovati jednostavnu i ponderiranu aritmetičku sredinu. Jednostavna aritmetička sredina izračunava se za jednostavni niz varijacija zbrajanjem svih opcija i dijeljenjem tog zbroja s ukupnim brojem opcija uključenih u danu varijacijsku seriju. Izračuni se provode prema formuli:

    Gdje: M - jednostavna aritmetička sredina;

    Σ V - iznos opcije;

    n- broj opažanja.

    U grupiranim varijacijskim serijama određuje se ponderirana aritmetička sredina. Formula za njegov izračun:

    Gdje: M - ponderirana aritmetička sredina;

    Σ Vp - zbroj djela varijante na njihovoj učestalosti;

    n- broj opažanja.

    Za velik broj opažanja u slučaju ručnih izračuna može se koristiti metoda momenata.

    Aritmetička sredina ima sljedeća svojstva:

    Zbir odstupanja varijante od srednje vrijednosti ( Σ d ) jednak je nuli (vidi tablicu 15);

    · Kada množite (dijelite) sve opcije istim faktorom (djelitelj), aritmetička sredina množi se (dijeli) s istim faktorom (djelitelj);

    · Ako svim opcijama dodate (oduzmete) isti broj, aritmetička sredina povećava se (smanjuje) za isti broj.

    Aritmetičke srednje vrijednosti, uzete same od sebe, ne uzimajući u obzir varijabilnost niza iz kojeg su izračunate, možda neće u potpunosti odražavati svojstva varijacijskog niza, posebno kada je potrebna usporedba s drugim prosjecima. Prosjeci koji su blizu vrijednosti mogu se dobiti iz serija s različitim stupnjevima raspršenja. Što su pojedinačne opcije bliže jedna drugoj u pogledu svojih kvantitativnih karakteristika, to su manje raspršenje (oscilacija, varijabilnost) redak, to je tipičniji njegov prosjek.

    Glavni parametri koji nam omogućuju procjenu varijabilnosti svojstva su:

    · Prijeđite prstom;

    · Amplituda;

    · Standardna devijacija;

    · Koeficijent varijacije.

    Približna varijabilnost svojstva može se procijeniti prema opsegu i amplitudi niza varijacija. Zamah označava maksimalnu (V max) i minimalnu (V min) opciju u redu. Amplituda (A m) je razlika između ovih opcija: A m = V max - V min.

    Glavna, općeprihvaćena mjera varijabilnosti niza varijacija su disperzija (D ). Ali najčešće se koristi prikladniji parametar izračunat na osnovi varijance - standardna devijacija ( σ ). Uzima u obzir količinu odstupanja ( d ) svaka varijanta varijacijskog niza iz aritmetičke sredine ( d = V - M ).

    Budući da odstupanja varijante od srednje vrijednosti mogu biti pozitivna i negativna, onda kada se zbroje daju vrijednost "0" (S d = 0). Da bi se to izbjeglo, vrijednosti odstupanja ( d) podižu se na drugu stepen i prosječno izračunavaju. Dakle, varijanca varijacijskog niza je srednji kvadrat odstupanja varijante od aritmetičke sredine i izračunava se po formuli:

    To je najvažnija karakteristika varijabilnosti i koristi se za izračunavanje mnogih statističkih kriterija.

    Budući da se varijanca izražava u kvadratu odstupanja, njezina se vrijednost ne može koristiti u usporedbi s aritmetičkom sredinom. U ove se svrhe primjenjuje standardna devijacija, koji je označen znakom "Sigma" ( σ ). Karakterizira prosječno odstupanje svih varijacija niza varijacija od aritmetičke sredine u istim jedinicama kao i sama sredina, pa se mogu koristiti zajedno.

    Standardno odstupanje određuje se formulom:

    Navedena formula primjenjuje se kada se broj opažanja ( n ) je veći od 30. Za manji broj n vrijednost standardne devijacije imat će pogrešku povezanu s matematičkom pristranošću ( n - jedan). S tim u vezi, točniji rezultat može se dobiti uzimajući u obzir takvu pristranost u formuli za izračunavanje standardne devijacije:

    standardna devijacija (s ) Je li procjena standardne devijacije slučajne varijable x u odnosu na njegovo matematičko očekivanje na temelju nepristrane procjene njegove varijance.

    S vrijednostima n > 30 standardnih odstupanja ( σ ) i standardna devijacija ( s ) bit će isti ( σ = s ). Stoga se u većini praktičnih priručnika ti kriteriji smatraju dvosmislenim. U Excelu izračun standardnog odstupanja može se izvesti funkcijom = STDEV (raspon). A da biste izračunali standardno odstupanje, morate stvoriti odgovarajuću formulu.

    Srednji kvadrat ili standardna devijacija omogućuje vam utvrđivanje koliko se vrijednosti karakteristike mogu razlikovati od prosječne vrijednosti. Pretpostavimo da postoje dva grada s jednakim prosječnim dnevnim temperaturama tijekom ljeta. Jedan od tih gradova nalazi se na obali, a drugi na kontinentu. Poznato je da su u gradovima smještenim na obali razlike u dnevnim temperaturama manje nego u gradovima koji se nalaze u unutrašnjosti kontinenta. Stoga će standardno odstupanje dnevnih temperatura za obalni grad biti manje od onog za drugi grad. U praksi to znači da će se prosječna temperatura zraka za svaki pojedini dan u gradu smještenom na kontinentu više razlikovati od prosječne vrijednosti nego u gradu na obali. Uz to, standardno odstupanje omogućuje vam procjenu mogućih odstupanja temperature od prosjeka s potrebnom razinom vjerojatnosti.

    Prema teoriji vjerojatnosti, u pojavama koje se pokoravaju zakonu normalne raspodjele postoji stroga veza između vrijednosti aritmetičke sredine, standardne devijacije i opcija ( pravilo tri sigme). Na primjer, 68,3% vrijednosti atributa varijable nalazi se u rasponu od M ± 1 σ , 95,5% - unutar M ± 2 σ i 99,7% - unutar M ± 3 σ .

    Vrijednost standardne devijacije omogućuje nam prosudbu prirode homogenosti varijacijskog niza i ispitivane skupine. Ako je vrijednost standardne devijacije mala, to ukazuje na dovoljno visoku homogenost fenomena koji se proučava. U ovom slučaju, aritmetičku sredinu treba prepoznati kao posve karakterističnu za dati niz varijacija. Međutim, preniska vrijednost sigme navodi na razmišljanje o umjetnom odabiru promatranja. S vrlo velikom sigmom, aritmetička sredina u manjoj mjeri karakterizira varijacijske serije, što ukazuje na značajnu varijabilnost proučavane osobine ili pojave ili heterogenost ispitivane skupine. Međutim, usporedba vrijednosti standardnog odstupanja moguća je samo za značajke iste dimenzije. Zapravo, ako usporedimo raznolikost težine između novorođenčadi i odraslih, uvijek ćemo dobiti veće vrijednosti sigme kod odraslih.

    Usporedba varijabilnosti svojstava različitih dimenzija može se izvršiti pomoću koeficijent varijacije... Izražava različitost kao postotak prosjeka, što omogućuje usporedbu različitih osobina. Koeficijent varijacije u medicinskoj literaturi označen je znakom „ IZ ", I u matematičkom" v"I izračunava se po formuli:

    Vrijednosti koeficijenta varijacije manje od 10% ukazuju na malo raspršivanje, od 10 do 20% - otprilike u prosjeku, više od 20% - o snažnoj varijanti raspršenja oko aritmetičke sredine.

    Aritmetička sredina u pravilu se izračunava na temelju podataka populacije uzorka. Ponovljenim studijama, pod utjecajem slučajnih pojava, aritmetička sredina se može promijeniti. To je zbog činjenice da se u pravilu istražuje samo dio mogućih jedinica promatranja, odnosno populacija uzoraka. Podaci o svim mogućim jedinicama koje predstavljaju fenomen koji se proučava mogu se dobiti proučavanjem cjelokupne opće populacije, što nije uvijek moguće. Istodobno, za generaliziranje eksperimentalnih podataka zanimljiva je vrijednost prosjeka u općoj populaciji. Stoga, da bi se formulirao opći zaključak o pojavi koja se proučava, rezultati dobiveni na temelju uzorka populacije moraju se statističkim metodama prenijeti u opću populaciju.

    Da bi se utvrdio stupanj podudarnosti između studije uzorka i opće populacije, potrebno je procijeniti veličinu pogreške koja se neizbježno javlja u promatranju uzorka. Ova se pogreška naziva „ Pogreška reprezentativnosti"Ili" Prosječna pogreška aritmetičke sredine. " Zapravo je razlika između prosjeka dobivenih tijekom selektivnog statističkog promatranja i sličnih vrijednosti koja bi se dobila u kontinuiranom proučavanju istog predmeta, t.j. prilikom proučavanja opće populacije. Budući da je srednja vrijednost uzorka slučajna varijabla, takva se prognoza provodi s prihvatljivom razinom vjerojatnosti za istraživača. U medicinskim istraživanjima iznosi najmanje 95%.

    Pogrešku reprezentativnosti ne treba miješati s pogreškama u registraciji ili pogreškama pažnje (administrativne pogreške, pogrešne izračune, pogreške pri upisu itd.), Koje bi trebalo umanjiti odgovarajućim metodama i alatima koji se koriste u eksperimentu.

    Veličina pogreške reprezentativnosti ovisi i o veličini uzorka i o varijabilnosti svojstva. Što je veći broj opažanja, uzorak je bliži općoj populaciji i pogreška je manja. Što je atribut nestabilniji, to je veća veličina statističke pogreške.

    U praksi se za utvrđivanje pogreške reprezentativnosti u varijacijskim serijama koristi sljedeća formula:

    Gdje: m - pogreška reprezentativnosti;

    σ - standardna devijacija;

    n- broj opažanja u uzorku.

    Formula pokazuje da je veličina srednje pogreške izravno proporcionalna standardnoj devijaciji, tj. Varijabilnosti ispitivane osobine, i obrnuto proporcionalna kvadratnom korijenu broja opažanja.

    Prilikom provođenja statističke analize na temelju izračuna relativnih vrijednosti, konstrukcija varijacijskog niza nije obavezna. U ovom slučaju, određivanje prosječne pogreške za relativne pokazatelje može se izvršiti pomoću pojednostavljene formule:

    Gdje: R- vrijednost relativnog pokazatelja, izražena u postocima, ppm itd .;

    q- inverzna vrijednost P i izražena kao (1-P), (100-P), (1000-P) itd., ovisno o osnovi za koju se izračunava pokazatelj;

    n- broj opažanja u uzorku.

    Međutim, naznačena formula za izračunavanje pogreške reprezentativnosti za relativne vrijednosti može se primijeniti samo kada je vrijednost pokazatelja manja od njegove osnovice. U nekim slučajevima izračunavanja intenzivnih pokazatelja takav uvjet nije zadovoljen, a pokazatelj se može izraziti brojem većim od 100% ili 1000%. U takvoj se situaciji konstruira varijacijski niz i izračunava se pogreška reprezentativnosti pomoću formule za srednje vrijednosti temeljene na standardnom odstupanju.

    Predviđanje vrijednosti aritmetičke sredine u općoj populaciji provodi se uz naznaku dvije vrijednosti - minimalne i maksimalne. Te ekstremne vrijednosti mogućih odstupanja, unutar kojih tražena prosječna vrijednost opće populacije može varirati, nazivaju se " Ograničenja povjerenja».

    Postulati teorije vjerojatnosti dokazali su da s normalnom raspodjelom svojstva s vjerojatnošću od 99,7%, ekstremne vrijednosti odstupanja srednje vrijednosti neće premašiti vrijednost trostruke pogreške reprezentativnosti ( M ± 3 m ); u 95,5% - ne više od udvostručene srednje greške srednje vrijednosti ( M ± 2 m ); u 68,3% - ne više od jedne srednje pogreške ( M ± 1 m ) (slika 9).

    P%

    Sl. 9. Gustoća vjerojatnosti normalne raspodjele.

    Imajte na umu da gornja izjava vrijedi samo za značajku koja je u skladu s normalnom Gaussovom raspodjelom.

    Većina eksperimentalnih istraživanja, uključujući i područje medicine, povezana je s mjerenjima, čiji rezultati mogu poprimiti gotovo bilo koju vrijednost u danom intervalu, pa su u pravilu opisani modelom kontinuiranih slučajnih varijabli. S tim u vezi, većina statističkih metoda razmatra kontinuirane raspodjele. Jedna od takvih raspodjela, koja ima temeljnu ulogu u matematičkoj statistici, je normalna, ili Gaussova raspodjela.

    Za to postoji niz razloga.

    1. Prije svega, mnoga eksperimentalna opažanja mogu se uspješno opisati pomoću normalne raspodjele. Treba odmah napomenuti da ne postoje raspodjele empirijskih podataka koje bi bile potpuno normalne, jer se normalno raspodijeljena slučajna varijabla kreće od do, što se u praksi nikad ne događa. Međutim, normalna raspodjela vrlo je često dobra aproksimacija.

    Provode li se mjerenja težine, visine i drugih fizioloških parametara ljudskog tijela - posvuda na rezultate utječe vrlo velik broj slučajnih čimbenika (prirodni uzroci i pogreške u mjerenju). Štoviše, učinak svakog od ovih čimbenika u pravilu je beznačajan. Iskustvo pokazuje da će se rezultati u takvim slučajevima približno normalno distribuirati.

    2. Mnoge raspodjele povezane sa slučajnim uzorkom, s povećanjem veličine potonjeg, pretvaraju se u normalne.

    3. Normalna raspodjela dobro odgovara kao približni opis ostalih kontinuiranih raspodjela (na primjer, asimetrična).

    4. Normalna raspodjela ima niz povoljnih matematičkih svojstava, što je u velikoj mjeri osiguralo njezinu široku upotrebu u statistici.

    Istodobno, valja napomenuti da postoji mnogo eksperimentalnih raspodjela medicinskih podataka koje se ne mogu opisati normalnim modelom raspodjele. U tu svrhu statistika je razvila metode koje se obično nazivaju "neparametrijskim".

    Izbor statističke metode koja je prikladna za obradu podataka određenog eksperimenta trebao bi se izvršiti ovisno o pripadnosti dobivenih podataka normalnom zakonu raspodjele. Ispitivanje hipoteze o podređivanju obilježja normalnom zakonu raspodjele izvodi se pomoću histograma raspodjele frekvencija (grafa), kao i niza statističkih kriterija. Među njima:

    Kriterij asimetrije ( b );

    Kriterij za provjeru kurtoze ( g );

    Shapiro - Wilkesov kriterij ( W ) .

    Analiza prirode raspodjele podataka (koja se naziva i provjera normalne raspodjele) provodi se za svaki parametar. Za pouzdanu prosudbu podudarnosti raspodjele parametra normalnom zakonu potreban je dovoljno velik broj promatračkih jedinica (najmanje 30 vrijednosti).

    Za normalnu raspodjelu kriteriji za iskrivljenost i kurtozu uzimaju vrijednost 0. Ako je raspodjela pomaknuta udesno b > 0 (pozitivna asimetrija), za b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g = 0. Kada g > 0, krivulja raspodjele je oštrija ako g < 0 пик более сглаженный, чем функция нормального распределения.

    Da bi se provjerila normalnost prema Shapiro-Wilksovom testu, potrebno je pronaći vrijednost ovog kriterija pomoću statističkih tablica na potrebnoj razini značajnosti i ovisno o broju promatračkih jedinica (stupnjevi slobode). Dodatak 1. Hipoteza normalnosti odbija se za male vrijednosti ovog kriterija, u pravilu, za w <0,8.

    Podijelite s prijateljima ili spremite za sebe:

    Učitavam...