Indikatori varijacije. Izračun varijance alternativnog atributa Po kojoj se ovisnosti izračunava varijanca alternativnog atributa

Prosječna vrijednost alternativnog obilježja i njegova varijanca :

Prosječna vrijednost alternativne karakteristike

Varijanca alternativnog obilježja

Zamjena u formulu varijance q= 1 - str, dobivamo:

Tako, alternativno odstupanje obilježja jednak proizvodu razlomci jedinica, posjeduju ovu značajku i udio jedinica koje nemaju ovu značajku.

Standardna devijacija alternativne značajke:

Varijacija alternativnog atributa sastoji se u prisutnosti ili odsutnosti proučavanog svojstva u jedinicama populacije. Kvantitativno, varijacija alternativnog obilježja izražava se u dvije vrijednosti: prisutnost proučavanog svojstva u jedinici označava se jedinicom (1), a njegovo odsutnost nulom (0). Udio jedinica koje imaju proučavano svojstvo označava se slovom, a udio jedinica koje nemaju tu osobinu - kroz. Uzimajući u obzir da je p + q = 1 (dakle q = 1 - p), a prosječna vrijednost alternativnog obilježja je

,

srednji kvadrat odstupanja

Dakle, varijanca alternativnog obilježja jednaka je umnošku ulomka jedinica s ovim svojstvom () s udjelom jedinica koje nemaju ovo svojstvo ().

Srednji kvadrat odstupanja (varijance) poprima maksimalnu vrijednost u slučaju jednakosti udjela, t.j. kada tj. ... Donja granica ovog pokazatelja je nula, što odgovara situaciji u kojoj nema agregatne varijacije. Standardna devijacija alternativne značajke:

Selektivno promatranje, prednosti i nedostaci.

Selektivno promatranje jedna je od najsuvremenijih vrsta statističkog promatranja, u kojoj se ispituje dio jedinica proučavane populacije, odabranih na temelju znanstveno razvijenih principa koji daju dovoljnu količinu pouzdanih podataka za karakterizaciju cjelokupne populacije. u cjelini.

Prosječni i relativni pokazatelji dobiveni na temelju podataka uzorka trebali bi dovoljno u potpunosti reproducirati odgovarajuće pokazatelje populacije u cjelini.

Glavne prednosti selektivnog promatranja su to što se može provoditi po širem programu, jeftinije je u smislu troškova i može se organizirati kada i u onim slučajevima kada ne možemo koristiti izvješćivanje.

Glavni nedostaci su što dobiveni podaci uvijek sadrže pogreške, a rezultati promatranja mogu se ocjenjivati ​​samo s određenim stupnjem pouzdanosti. Također zahtijeva kvalificirano osoblje.

Metode formiranja uzorka.

U statistici se koriste različite metode formiranja skupova uzoraka koje su određene ciljevima istraživanja i ovise o specifičnostima predmeta proučavanja.

Glavni uvjet za provođenje uzorka je spriječiti pojavu sustavnih pogrešaka koje proizlaze iz kršenja načela jednakih mogućnosti da svaka jedinica opće populacije bude uključena u uzorak. Prevencija sustavnih pogrešaka postiže se korištenjem znanstveno utemeljenih metoda formiranja uzorka populacije.

Postoje sljedeći načini odabira jedinica iz opće populacije:

1) individualna selekcija - pojedinačne jedinice se biraju u uzorku;

2) grupni odabir - u uzorak spadaju kvalitativno homogene skupine ili serije ispitivanih jedinica;

3) kombinirana selekcija je kombinacija individualne i grupne selekcije.

Metode odabira određuju se pravilima za formiranje populacije uzorka.

Uzorak može biti:

Strogo slučajan se sastoji u činjenici da se uzorkovana populacija formira kao rezultat slučajnog (nenamjernog) odabira pojedinačnih jedinica iz opće populacije. U ovom slučaju, broj jedinica odabranih za populaciju uzorka obično se određuje na temelju prihvaćenog udjela uzorka. Udio uzorka je omjer broja jedinica u uzorku n prema broju jedinica u općoj populaciji N, t.j.

§ mehanički je da se odabir jedinica u uzorku vrši iz opće populacije, podijeljene u jednake intervale (skupine). Štoviše, veličina intervala u općoj populaciji jednaka je recipročnom udjelu uzorka. Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0,02), kod uzorka od 5% svaka 20. jedinica (1:0,05) itd. Dakle, u skladu s prihvaćenim udjelom selekcije, opća populacija se takoreći mehanički dijeli na skupine jednake veličine. Iz svake grupe bira se samo jedna jedinica.

§ tipični - u kojem se opća populacija najprije dijeli na homogene tipične skupine. Zatim se iz svake tipične skupine, pravilnim slučajnim ili mehaničkim uzorkovanjem, vrši individualni odabir jedinica u populaciju uzorka. Važna značajka tipičnog uzorka je da daje točnije rezultate u usporedbi s drugim metodama odabira jedinica u uzorku;

§ serijski – u kojem se opća populacija dijeli na grupe iste veličine – serije. Za uzorak su odabrane serije. Unutar serije provodi se kontinuirano promatranje jedinica uključenih u seriju;

Kombinirani - uzorak može biti dvostupanjski. U tom se slučaju opća populacija najprije dijeli u skupine. Zatim se odabiru grupe, a unutar potonjeg odabiru se pojedinačne jedinice.

U statistici se razlikuju sljedeće metode odabira jedinica za uzorak:

§ jednostupanjsko uzorkovanje - svaka odabrana jedinica odmah se ispituje prema zadanom kriteriju (ispravno slučajno i serijsko uzorkovanje);

Višestupanjsko uzorkovanje – odabir se vrši iz opće populacije pojedinih skupina, a pojedinačne jedinice se biraju iz skupina (tipično uzorkovanje s mehaničkom metodom odabira jedinica u populaciji uzorka).

Osim toga, pravi se razlika između:

§ ponovni odabir - prema shemi vraćene lopte. Štoviše, svaka jedinica ili serija koja je ušla u uzorak vraća se u opću populaciju i stoga ima priliku ponovno ući u uzorak;

Varijacija- to su razlike u individualnim vrijednostima osobine u jedinicama proučavane populacije. Proučavanje varijacija od velike je praktične važnosti i neophodna je karika u ekonomskoj analizi. Potreba za proučavanjem varijacije proizlazi iz činjenice da prosjek, kao rezultanta, ispunjava svoj glavni zadatak s različitim stupnjevima točnosti: što su manje razlike u pojedinačnim vrijednostima osobine koja se usrednjuje, to je homogenija stanovništva, a samim time i točniji i pouzdaniji prosjek, i obrnuto. Posljedično, prema stupnju varijacije mogu se suditi granice varijacije osobine, homogenost populacije za ovu osobinu, tipičnost prosjeka, odnos čimbenika koji određuju varijaciju.

Promjena varijacije značajke u agregatu provodi se pomoću apsolutno i relativno pokazatelji.

Apsolutni pokazatelji varijacije uključuju:

Varijacija zamaha (R)

Varijacija prijelaza Je li razlika između maksimalne i minimalne vrijednosti karakteristike

Prikazuje granice u kojima se mijenja vrijednost osobine u ispitivanoj osobini.

Primjer... Radno iskustvo pet kandidata u dosadašnjem radu iznosi: 2,3,4,7 i 9 godina.
Rješenje: raspon varijacije = 9 - 2 = 7 godina.

Za generaliziranu karakteristiku razlika u vrijednostima atributa, prosječni pokazatelji varijacije izračunavaju se na temelju uzimanja u obzir odstupanja od aritmetičke sredine. Razlika se uzima kao odstupanje od srednje vrijednosti.

Istovremeno, kako bi se izbjegao zbroj odstupanja varijanti atributa od srednje vrijednosti (nulto svojstvo srednje vrijednosti), treba ili zanemariti predznake odstupanja, odnosno uzeti ovaj zbroj po modulu, ili kvadratirati vrijednosti odstupanja u nulu.

Prosječna linearna i standardna devijacija

Prosječna linearna devijacija- ovo je od apsolutnih odstupanja pojedinačnih vrijednosti karakteristike od prosjeka.

Prosječna linearna devijacija je jednostavna:

Radno iskustvo pet kandidata u dosadašnjem radu iznosi: 2,3,4,7 i 9 godina.

U našem primjeru: godine;

Odgovor: 2,4 godine.

Ponderirano srednje linearno odstupanje odnosi se na grupirane podatke:

Prosječno linearno odstupanje, zbog svoje konvencije, u praksi se koristi relativno rijetko (posebice za karakterizaciju ispunjenja ugovornih obveza za ujednačenost isporuke; u analizi kvalitete proizvoda, uzimajući u obzir tehnološke značajke proizvodnje).

Standardna devijacija

Najsavršenija karakteristika varijacije je standardna devijacija, koja se naziva standard (ili standardna devijacija). () jednak je kvadratnom korijenu srednjeg kvadrata odstupanja pojedinačnih vrijednosti značajke od:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija koristi se za grupirane podatke:

Između srednje kvadratne i standardne linearne devijacije u uvjetima normalne distribucije, odvija se sljedeća veza: ~ 1.25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se za određivanje vrijednosti ordinata krivulje normalne distribucije, u izračunima koji se odnose na organiziranje promatranja uzorka i utvrđivanje točnosti karakteristika uzorka, kao i pri ocjenjivanju granice varijacije obilježja u homogenoj populaciji.

Disperzija

Disperzija- je srednji kvadrat odstupanja pojedinačnih vrijednosti osobine od njihove srednje vrijednosti.

Varijanca je jednostavna:

U našem primjeru:

Ponderirana disperzija:

Prikladnije je izračunati varijancu po formuli:

koji se iz glavnog dobiva jednostavnim transformacijama. U ovom slučaju, srednji kvadrat odstupanja jednak je sredini kvadrata vrijednosti obilježja minus kvadrat srednje vrijednosti.

Za neagregirane podatke:

Za grupirane podatke:

Varijacija alternativne značajke sastoji se u prisutnosti ili odsutnosti proučavanog svojstva u jedinicama stanovništva. Kvantitativno, varijacija alternativnog obilježja izražava se u dvije vrijednosti: prisutnost proučavanog svojstva u jedinici označava se jedinicom (1), a njegovo odsutnost nulom (0). Udio jedinica koje imaju proučavano svojstvo označava se slovom, a udio jedinica koje nemaju tu osobinu - kroz. Uzimajući u obzir da je p + q = 1 (dakle q = 1 - p), a prosječna vrijednost alternativnog obilježja je

,

srednji kvadrat odstupanja

Dakle, varijanca alternativnog obilježja jednaka je umnošku ulomka jedinica s ovim svojstvom () s udjelom jedinica koje nemaju ovo svojstvo ().

Srednji kvadrat odstupanja (varijance) poprima maksimalnu vrijednost u slučaju jednakosti udjela, t.j. kada tj. ... Donja granica ovog pokazatelja je nula, što odgovara situaciji u kojoj nema agregatne varijacije. Standardna devijacija alternativne značajke:

Dakle, ako se u proizvedenoj seriji 3% proizvoda pokazalo nestandardnim, tada je varijanca udjela nestandardnih proizvoda i standardna devijacija ili 17,1%.

Standardna devijacija jednak je kvadratnom korijenu srednjeg kvadrata odstupanja pojedinačnih vrijednosti obilježja od aritmetičke sredine.

Relativne stope varijacije

Relativne stope varijacije uključuju:

Usporedba varijacija nekoliko populacija za isto obilježje, a još više za različite značajke pomoću apsolutnih pokazatelja nije moguća. U tim se slučajevima, za usporednu ocjenu stupnja razlike, konstruiraju relativni pokazatelji varijacije. Izračunavaju se kao omjer apsolutnih pokazatelja varijacije i srednje vrijednosti:

Izračunavaju se i druge relativne karakteristike. Na primjer, za procjenu varijacije u slučaju asimetrične distribucije, izračunava se omjer srednjeg linearnog odstupanja i medijana

budući da je zbog svojstva medijana zbroj apsolutnih odstupanja atributa od njegove vrijednosti uvijek manji nego od bilo kojeg drugog.

Kao relativna mjera disperzije koja procjenjuje varijaciju u središnjem dijelu populacije, izračunava se relativna kvartilna devijacija, gdje je prosječni kvartil poluzbroja razlike između trećeg (ili gornjeg) kvartila () i prvi (ili donji) kvartil ().

U praksi se najčešće izračunava koeficijent varijacije. Donja granica ovog pokazatelja je nula, nema gornju granicu, međutim, poznato je da s povećanjem varijacije značajke, njegova vrijednost također raste. Koeficijent varijacije je u izvjesnom smislu kriterij homogenosti populacije (u slučaju normalne distribucije).

Izračunajmo koeficijent varijacije na temelju standardne devijacije za sljedeći primjer. Potrošnja sirovina po jedinici proizvoda iznosila je (kg): za jednu tehnologiju u, a za drugu - u. Izravna usporedba vrijednosti standardnih devijacija mogla bi dovesti do zablude da je varijacija u potrošnji sirovina za prvu tehnologiju intenzivnija nego za drugu (. Relativna mjera varijacije (omogućuje nam da izvedemo suprotan zaključak

Primjer izračuna pokazatelja varijacije

U fazi odabira kandidata za sudjelovanje u složenom projektu, tvrtka je raspisala natječaj za profesionalce. Distribucija kandidata prema radnom iskustvu pokazala je sljedeće rezultate:

Izračunajmo prosječno iskustvo u proizvodnji, godine

Izračunajmo varijancu na temelju trajanja radnog staža

Isti rezultat dobivamo ako koristimo drugu formulu za izračun varijance za izračun

Izračunajmo standardnu ​​devijaciju, godine:

Odredite koeficijent varijacije,%:

Pravilo zbrajanja varijance

Za procjenu utjecaja čimbenika koji određuju varijaciju koristi se tehnika grupiranja: skup se dijeli u skupine, odabirom jednog od determinirajućih čimbenika kao atributa grupiranja. Zatim se, zajedno s ukupnom varijansom izračunatom za cijelu populaciju, izračunavaju intra-grupna varijanca (ili prosjek grupe) i varijansa među skupinama (ili varijanca prosječnih vrijednosti grupe).

Ukupna varijanca karakterizira varijaciju značajke u cijelom skupu, koja se razvila pod utjecajem svih čimbenika i uvjeta.

Varijanca među skupinama mjeri sustavnu varijaciju zbog utjecaja čimbenika kojim se grupira:

Varijanca unutar grupe procjenjuje varijaciju osobine koja se razvila prema utjecaju drugih čimbenika koji se u ovom istraživanju ne razmatraju i neovisna je o faktoru grupiranja. Definira se kao prosjek grupnih varijacija.

Sve tri varijance () međusobno su povezane sljedećom jednakošću, koja je poznata kao pravilo zbrajanja varijance:

ovaj se omjer koristi za konstruiranje pokazatelja koji procjenjuju utjecaj atributa grupiranja na formiranje opće varijacije. To uključuje empirijski koeficijent determinacije () i empirijski korelacijski omjer ()

() karakterizira udio međuskupne varijance u ukupnoj varijansi:

i pokazuje koliko je varijacija osobine u agregatu posljedica faktora grupiranja.

Empirijski korelacijski odnos(!! \ eta = \ sqrt (\ frac (\ delta ^ 2) (\ sigma ^ 2))

procjenjuje čvrstoću odnosa između proučavanih i grupiranih karakteristika. Granične vrijednosti su nula i jedan. Što je bliže jedan, to je veza bliža.

Primjer. Trošak 1 četvornog metra ukupne površine (konvencionalnih jedinica) na stambenom tržištu za deset 17 kuća s poboljšanim planiranjem bio je:

Istodobno, poznato je da je prvih pet kuća izgrađeno u blizini poslovnog centra, a ostale - na znatnoj udaljenosti od njega.

Da bismo izračunali ukupnu varijansu, izračunajmo prosječnu cijenu 1 m². ukupna površina: Ukupna varijanca određena je formulom :

Izračunajmo prosječnu cijenu od 1 m2. i varijanca za ovaj pokazatelj za svaku skupinu kuća koje se razlikuju po položaju u odnosu na centar grada:

a) za kuće izgrađene u blizini centra:

b) za kuće izgrađene daleko od centra:

Varijacija u cijeni 1 m². utvrđuje se ukupna površina uzrokovana promjenom položaja kuća međugrupna varijansa:

Varijacija u cijeni 1 m². ukupne površine, zbog promjene preostalih pokazatelja koje ne uzimamo u obzir, mjeri se unutargrupna varijansa

Pronađene varijance zbrajaju ukupnu varijansu

Empirijski koeficijent determinacije:

pokazuje da je varijanca cijene 1 m2. od ukupne površine na stambenom tržištu za 81,8% objašnjava se razlikama u lokaciji novogradnje u odnosu na poslovni centar, a za 18,2% - drugim čimbenicima.

Empirijski korelacijski odnos ukazuje na značajan utjecaj na cijenu stanovanja, lokaciju kuća.

Pravilo za zbrajanje odstupanja za razlomak znak je napisan kako slijedi:

i tri vrste varijacija udjela za grupirane podatke određene su sljedećim formulama:

ukupna varijanca:

Formule međugrupne i unutargrupne disperzije:

Karakteristike oblika distribucije

Da biste dobili ideju o obliku distribucije, koriste se pokazatelji prosječne razine (,), pokazatelji varijacije, asimetrije i kurtosis.

U simetričnim distribucijama, aritmetička sredina, mod i medijan se podudaraju (. Ako je ova jednakost prekršena, distribucija je asimetrična.

Najjednostavniji pokazatelj asimetrije je razlika, koja je pozitivna u slučaju desnostrane asimetrije, a negativna u slučaju lijevostrane asimetrije.

Asimetrična raspodjela

Za usporedbu asimetrije nekoliko redaka izračunava se relativni pokazatelj

Varijacije se koriste kao generalizirajuće karakteristike momenti središnje distribucije--ti red, koji odgovara stupnju do kojeg se povećavaju odstupanja pojedinih vrijednosti atributa od aritmetičke sredine:

Za negrupirane podatke:

Za grupirane podatke:

Trenutak prvog reda, prema svojstvu aritmetičke sredine, jednak je nuli.

Trenutak drugog reda je varijansa.

Trenuci trećeg i četvrtog reda koriste se za konstruiranje pokazatelja koji ocjenjuju značajke oblika empirijskih distribucija.

Korištenjem momenta trećeg reda mjeri se stupanj zakrivljenosti ili asimetrije raspodjele.

- koeficijent asimetrije

U simetričnim distribucijama, kao i svi središnji momenti neparnog reda, središnji moment trećeg reda različit od nule ukazuje na asimetriju raspodjele. U ovom slučaju, ako, tada je asimetrija desnostrana, a desna grana je izdužena u odnosu na maksimalnu ordinatu; ako, onda je asimetrija lijevo-strana (na grafu to odgovara produljenju lijeve grane).

Za karakterizaciju vršnosti ili ravnosti distribucije, izračunava se omjer momenta četvrtog reda () i standardne devijacije u četvrtoj potenciji (). Za normalnu distribuciju, stoga, eksces se nalazi po formuli:

Za normalnu distribuciju, nestaje. Za vršne distribucije, za one s ravnim vrhom.

Distribucijska kurtoza

Uz gore navedene pokazatelje, generalizirajuća karakteristika varijacije u homogenoj populaciji je određeni red u promjeni frekvencija distribucije u skladu s promjenama vrijednosti proučavanog atributa, tzv. obrazac distribucije.

Priroda (vrsta) obrasca distribucije može se identificirati konstruiranjem varijacijskog niza na temelju velikog broja opažanja, kao i takvim izborom broja grupa i vrijednosti integrala, pri kojima bi uzorak mogao biti najpovoljniji. jasno očitovana.

Analiza niza varijacija uključuje utvrđivanje prirode distribucije (kao rezultat mehanizma varijacije), utvrđivanje funkcije distribucije, provjeru korespondencije empirijske distribucije s teoretskom.

Empirijska distribucija, dobiven na temelju podataka promatranja, grafički je prikazan empirijskom krivuljom distribucije pomoću poligona.

U praksi postoje različite vrste distribucija, među kojima se mogu razlikovati simetrične i asimetrične, jednovrhske i viševrhske.

Ustanoviti vrstu distribucije znači izraziti mehanizam formiranja uzorka u analitičkom obliku. Mnoge pojave i njihove značajke karakteriziraju karakteristični oblici distribucije, koji su aproksimirani odgovarajućim krivuljama. Uz svu raznolikost oblika distribucije, najrašireniji kao teorijski su normalna distribucija, Paussonova distribucija, binomna distribucija itd.

Posebno mjesto u proučavanju varijacije pripada normalnom zakonu, zbog njegovih matematičkih svojstava. Za normalni zakon je ispunjeno pravilo tri sigme, prema kojem je varijacija pojedinačnih vrijednosti obilježja u rasponu od vrijednosti prosjeka. Pritom je oko 70% svih jedinica unutar granica, a 95% unutar granica.

Procjena sukladnosti empirijskih i teorijskih distribucija provodi se pomoću kriterija dobrote prilagodbe, među kojima su nadaleko poznati kriteriji Pearson, Romanovsky, Yastremsky, Kolmogorov.

POKAZATELJI VARIJACIJE

Metodičke upute za rješavanje problema

Na temu "Pokazatelji varijacije"

Za mjerenje stupnja varijabilnosti (varijabilnosti) osobine koristi se varijacija čiji su pokazatelji: raspon varijacije, srednja linearna devijacija, standardna devijacija, srednji kvadrat odstupanja (varijance), koeficijent varijacije. .

Varijacija prijelaza

Raspon varijacija ( R) karakterizira granice varijacije (promjene) pojedinačnih vrijednosti (ili varijanti) atributa ( x) u statističkoj populaciji

gdje je najveća i najmanja vrijednost značajke.

Prosječna linearna devijacija

Prosječna linearna devijacija izračunava se pomoću formula aritmetičke sredine:

Jednostavno (neponderirano)

,

gdje - i-th značajka vrijednost x ;

Prosječna vrijednost značajke x ;

Statistička težina i-th vrijednost atributa;

n- broj pripadnika stanovništva;

Ponderirano

Standardna devijacija

Standardna devijacija izračunava se pomoću formula:

Neponderirano

Ponderirano

Disperzija kvantitativne osobine

Disperzija kvantitativni atribut određen je formulama aritmetičke sredine:

Neponderirano

Ponderirano

Varijanca se može izračunati na sljedeći način:

gdje je srednji kvadrat vrijednosti značajke;

Kvadrat prosječne vrijednosti značajke.

Svojstva varijanse kvantitativne osobine

1. Sa smanjenjem ili povećanjem težine (učestalosti) promjenjivog atributa u K budući da se varijansa ne mijenja

2. Prilikom smanjenja ili povećanja svake vrijednosti atributa za istu konstantnu vrijednost A varijansa se ne mijenja

gdje je prosječna vrijednost značajke ( x- A).

3. Prilikom smanjenja ili povećanja svake vrijednosti atributa u istom broju K puta se varijanca smanjuje ili povećava za K 2 puta, a standardna devijacija - in K jednom



gdje je prosječna vrijednost značajke xK.

4. Disperzija značajke s obzirom na proizvoljnu vrijednost A uvijek veća od varijance u odnosu na aritmetičku sredinu po kvadratu razlike između srednje i proizvoljne vrijednosti

Dokaz:

Disperzija u odnosu na srednju vrijednost

Izračunavanje varijance metodom momenata

Metoda pojednostavljenog izračuna varijance provodi se prema formuli

a naziva se načinom trenutaka.

Indikatori m 1 , m 2 predstavljaju momente prvog i drugog reda i izračunavaju se na sljedeći način

Dokaz:

Disperzija kvantitativne osobine u agregatu,

Podijeljeni u grupe

Za analizu odnosa kvantitativnih karakteristika u statističkoj populaciji podijeljenoj u skupine izračunavaju se sljedeće varijanse: grupna, međuskupina, unutarskupina i ukupna.

Grupna varijansa (djelomična) karakterizira varijaciju osobine u skupini zbog djelovanja svih ostalih čimbenika na nju, osim osobine koja leži u osnovi grupiranja (obilježje grupiranja):

gdje - i-ta vrijednost značajke u j-th grupa;

Privatna (skupna) prosječna vrijednost značajke u j-th grupa;

Statistička težina i-th vrijednost atributa u j-th grupa;

Broj različitih karakterističnih vrijednosti u j skupina.

Varijanca među grupama mjeri stupanj varijabilnosti (varijacije) osobine u cijeloj statističkoj populaciji zbog faktora koji leži u osnovi grupiranja (obilježje grupiranja):

gdje je prosječna vrijednost karakteristike u agregatu (ukupni prosjek);

Težina j-ta grupa, koja predstavlja broj jedinica u j th

J- broj grupa u statističkoj populaciji.

Varijanca unutar grupe (prosjek grupnih varijacija) mjeri stupanj varijabilnosti osobine u cijeloj populaciji kao cjelini zbog djelovanja na nju svih ostalih čimbenika (osobina), osim grupne osobine:

Ukupna varijansa mjeri stupanj varijabilnosti osobine, zbog utjecaja svih čimbenika koji na nju djeluju:

Ukupna varijanca obilježja u statističkoj populaciji, podijeljena u skupine, može se odrediti osnovnom formulom disperzije

Za određivanje pokazatelja bliskosti odnosa pokazatelja u agregatu, podijeljenih u skupine, koriste se međuskupna i ukupna varijanca.

Varijanca kvalitativne alternativne značajke

Za određivanje varijance alternativnog obilježja, pretpostavimo da je ukupan broj populacijskih jedinica jednak n... Broj jedinica s proučavanim svojstvom - f, tada je broj jedinica koje ne posjeduju proučavano obilježje jednak ( n- f). Serija distribucije kvalitativne (alternativne) značajke je kako slijedi

Vrijednost varijable Stopa ponavljanja
f n-f
Ukupno n

Aritmetička sredina takvog niza je:

odnosno jednaka je relativnoj učestalosti (učestalosti) pojavljivanja osobine koja se proučava, što se može označiti sa str, onda

Udio jedinica s proučavanim svojstvom jednak je str, jednak je udio jedinica koje ne posjeduju proučavano svojstvo q, onda p + q = 1.

Varijanca alternativnog obilježja

Poseban slučaj atributivnog (nekvantitativnog) obilježja je alternativno obilježje. Kada jedinice populacije ili imaju zadani proučavani atribut, ili ga nemaju. Primjer takvih znakova je: prisutnost neispravnih proizvoda, akademska diploma sveučilišnih nastavnika, rad u stečenoj specijalnosti, višak prosječnog dohotka po glavi stanovnika na njihovoj sveruskoj razini, prisutnost djece u obitelji itd. .

Ako postoji alternativno obilježje, jedinici stanovništva dodjeljuje se vrijednost "1". U odsutnosti - "0".

Težine u izračunima su:

Udio jedinica s ovom značajkom;

Udio jedinica koje nemaju ovu značajku

Tada je prosječna vrijednost alternativne značajke jednaka:

varijanca će poprimiti oblik:

Varijanca alternativnog obilježja kreće se od 0 do 0,25. Maksimalna vrijednost od 0,25 doseže na 0,5

Primjer 4.11. U uzorku ankete od 300 stanovnika Kurska, njih 60 pozitivno je govorilo o čuvanju osobne štednje u gradskim poslovnim bankama.

Odredite prosječnu razinu, varijancu i standardnu ​​devijaciju osobine

Praktična primjena varijacije alternativnog obilježja uglavnom se sastoji u konstruiranju intervala pouzdanosti prilikom provođenja promatranja uzorka.

Proučavanje oblika raspodjele obilježja. Glavne karakteristike obrazaca distribucije

Neizostavan uvjet za uspješnost konstrukcija, proračuna i zaključaka temeljenih na nizu varijacija je homogenost u njima sažetih agregata, utvrđena na temelju duboke teorijske analize.

Jasno izražen redoslijed promjene frekvencije u skladu s promjenom vrijednosti neke značajke naziva se distribucijski uzorak.

Prije svega potrebno je poznavanje vrste obrasca distribucije (i, posljedično, oblika krivulje):

1. Pojasniti tipične uvjete za dobivanje primarne statističke građe. Dakle, pojava viševrhske ili bitno asimetrične krivulje ukazuje na raznolik sastav populacije i potrebu za pregrupiranjem podataka kako bi se identificirale homogenije skupine.

2. Osigurati točnost praktičnih proračuna i prognoza. Dakle, korištenje G. Sturgessove formule za izračun optimalnog broja skupina u intervalnom nizu, pravilo "tri sigme", koeficijent varijacije Vu kao pokazatelj homogenosti njemu bliskih distribucija.

Na grafovima se jasno pojavljuju obrasci varijacijskih serija, koji se izražavaju u vrsti raspodjele njihovih frekvencija - histogramu i poligonu raspodjele frekvencija. Njihovo razmatranje pokazuje da u histogramu postoji veliki diskontinuitet u distribuciji, a u poligonu dolazi do postupnog prijelaza iz jedne skupine u drugu. Poligon poligona djelomično izglađuje diskontinuitet histograma; to je generaliziranija tehnika za analizu distribucije.

S povećanjem redova niza varijacije intervala i odgovarajućim smanjenjem vrijednosti njegovih intervala, broj strana poligona distribucije će se povećati, a izlomljena linija će težiti da se pretvori u određenu krivulju u granici. Ova krivulja se zove krivulja distribucije... U njemu dolazi do najvećeg oslobađanja podataka od utjecaja slučajnih čimbenika. Ona otkriva i pokazuje u najopćenitijem obliku prirodu varijacije, obrazac raspodjele frekvencija unutar jednokvalitetnog skupa fenomena.

Krivulje distribucije mogu biti različitih tipova. U praksi socio-ekonomskih istraživanja, krivulja normalne distribucije ima široku primjenu. To je jednovršna simetrična zvonolika figura, čija se desna i lijeva grana ravnomjerno i simetrično smanjuju, asimptotski se približavajući osi apscise.

Posebnost ove krivulje je podudarnost aritmetičke sredine, moda i medijana u njoj. Ako se cijelo područje između krivulje i osi apscise uzme za 100%, tada je 68,3% frekvencija unutar granica, unutar 95,4%, unutar 99,7% ("pravilo tri sigma").

Iako normalna, ili simetrična, distribucija odgovara prirodi brojnih pojava, za društvene pojave je nekarakteristična, budući da odražava razlike uzrokovane vanjskim utjecajima, svojstvene ne razvoju, već samo fluktuirajućem skupu jedinice. Razvoj i dinamizam karakteristični su za društvene pojave. Stoga su serije i krivulje raspodjele frekvencija društvenih pojava u pravilu asimetrične, u njima se frekvencije maksimalno povećavaju i neravnomjerno smanjuju. Upravo prisutnost asimetrije, odnosno iskrivljenosti, u redovima homogenih agregata služi kao neizravni pokazatelj da je proces koji se proučava u aktivnoj fazi razvoja.

Asimetrični nizovi i odgovarajuće krivulje imaju različite oblike distribucije, istražene matematičkom statistikom. Takvi oblici su Poissonova distribucija, Maxwellova distribucija, Pearsonova distribucija itd. Ovdje se asimetrija promatra kao cjelina kao jedan tip distribucije. U ovom se slučaju razlikuje asimetrija na desnoj i lijevoj strani (iskrivljenost).

Ako se duga grana krivulje nalazi desno od vrha, tada se asimetrija naziva desnostrana, ako se ova grana nalazi lijevo od vrha - lijevostrana. S desnostranom asimetrijom s lijevom. Stoga se navedena razlika između njih naziva koeficijent K. Pearsona i koristi se kao koeficijent asimetrije:

Kod asimetrije s desne strane, ovaj koeficijent je pozitivan, s lijevom - negativan. Ako je = 0, varijacijski niz je simetričan. Što je veća apsolutna vrijednost koeficijenta, to je veći stupanj iskošenja.

Najtočniji pokazatelj asimetrije distribucije je koeficijent asimetrije izračunat po formuli

gdje je n broj jedinica u populaciji. Kao iu slučaju Pearsonovog koeficijenta, za > 0 postoji desna asimetrija, za< 0 левосторонняя. В симметричных распределениях = 0.

Što je veća vrijednost ||, to je distribucija asimetričnija. Uspostavljena je sljedeća skala ocjenjivanja asimetrije:

|| - beznačajna asimetrija;

0,25 < || - асимметрия заметная (умеренная);

|| > 0,5 - značajna asimetrija.

Budući da su koeficijenti i relativne bezdimenzijske veličine, često se koriste za komparativnu analizu asimetrije različitih distribucijskih redova.

Priroda asimetrije ponekad ukazuje na smjer razvoja. Kada se proučava varijacija znakova u odnosu na koje postoji interes za njihovo povećanje (ispunjenje normi, proizvodni učinak itd.), desna asimetrija ukazuje na progresivnost razvoja, da ide prema povećanju pokazatelja i lijevostrana asimetrija ukazuje na prisutnost velikog broja zaostalih mjesta.

Prilikom proučavanja varijacije znakova u odnosu na koje postoji interes za njihovo smanjenje (trošak, intenzitet rada, potrošnja sirovina po jedinici proizvodnje i sl.), desnostrana asimetrija ukazuje na nedostatke u razvoju proučavanog procesa, lijevo - o progresivnosti njegovog razvoja, o tome kako potonji ide u smjeru smanjenja pokazatelja. U raspodjeli zaposlenika prema radnom stažu (vidi primjer 4.9 = 5,75) uočava se desna asimetrija, budući da je koeficijent asimetrije pozitivan: (5,955-5,75): 2,47 = 0,095. Ova asimetrija je progresivna za ovu seriju, ona ukazuje na razvoj serije prema povećanju proučavanog pokazatelja.

Oblik raspodjele može se grubo odrediti izravno izravno ispitivanjem empirijskih podataka serije, osobito ako su prikazani histogramom i poligonom. Kako bismo bili sigurni da je približna definicija oblika distribucije točna, empirijski podaci serije ispituju se na njihovu bliskost teorijskoj raspodjeli, što se utvrđuje konstruiranjem odgovarajuće krivulje raspodjele. Međutim, u mnogim slučajevima ni teorija ni izravno razmatranje empirijskih podataka ne daju odgovore na pitanje o obliku distribucije. Zatim se obično provodi studija o bliskosti empirijskih podataka s normalnom distribucijom, budući da su distribucije s malom ili umjerenom asimetrijom u većini slučajeva normalne po svom tipu.

Za objektivan sud o stupnju podudarnosti empirijske distribucije s normalnom u statistici, koristi se niz kriterija koji se nazivaju kriteriji slaganja ili usklađenosti.

To uključuje kriterije Pearsona, Romanovskog, Yastremskog, Kolmogorova, temeljene na korištenju različitih teorijskih koncepata.

Na primjer, najčešće korišteni Pearsonov hi-kvadrat test određen je formulom:

gdje su empirijske frekvencije (frekvencije)

Teorijske frekvencije (frekvencije)

Kako bi se procijenila blizina empirijske distribucije teorijskoj, utvrđuje se vjerojatnost postizanja ove vrijednosti prema ovom kriteriju. Ako ta vjerojatnost prelazi 0,05, onda se odstupanja stvarnih frekvencija od teorijskih smatraju slučajnim, beznačajnim. Međutim, ako se odstupanja smatraju značajnim, a empirijska raspodjela bitno se razlikuje od teorijske.

Za karakterizaciju stupnja odstupanja simetrične distribucije od normale izračunava se indeks kurtosis. Može se približno odrediti pomoću Lindberghovog koeficijenta.

gdje je udio (u%) broja varijanti koje leže u intervalu jednak pola srednje kvadratno odstupanje (u bilo kojem smjeru od srednje vrijednosti) u ukupnom iznosu varijante ove serije;

38,29 - udio (u%) broja opcija koje leže u intervalu jednak pola srednje kvadratno odstupanje (u jednom ili drugom smjeru srednje vrijednosti) u ukupnom iznosu varijante serije normalne distribucije

Kurtosis može biti pozitivan, negativan ili nula.

Za krivulje s visokim vrhom, indeks kurtosisa ima pozitivan predznak, za krivulje s niskim vrhom negativan predznak. Za krivulju normalne distribucije, njena vrijednost je nula.

Za točniju karakterizaciju stupnja odstupanja simetrične distribucije od normalne, indeks vršnosti (indeks kurtoze) (Ek) izračunava se po formuli:

On, kao i Lindberghov koeficijent, može biti pozitivan, negativan i jednak nuli. Pokazatelj ekscesa, kao i indikator asimetrije, je apstraktan broj. Granična vrijednost negativnog ekscesa je Ek = -2; veličina pozitivnog ekscesa je beskonačna.

Određivanje pokazatelja asimetrije i kurtoze nema samo deskriptivno značenje, često njihove vrijednosti daju određene naznake za daljnja istraživanja proučavanih pojava. Tako, na primjer, pojava značajnog negativnog kurtoza može ukazivati ​​na kvalitativnu heterogenost proučavane populacije.

Suvremene računalne tehnologije otvaraju velike mogućnosti za izvođenje glomaznih računskih operacija za analizu varijacijskih nizova. Ako se gradivo teoretski sagleda i postavi razumna hipoteza o obliku distribucije (potonje, inače, i računala mogu provjeriti), računalni uređaji mogu brzo izračunati razne generalizirajuće pokazatelje i kriterije, graditi grafove itd. . To je tim više moguće jer su pokazatelji varijacije relativno jednostavni i dobro formalizirani.

Koncept varijacije

Prosjek daje generalizirajuću karakteristiku cjelokupnog skupa proučavanog fenomena.

Varijacija značajke naziva se razlika u individualnim vrijednostima osobine unutar proučavane populacije.

Prosječna vrijednost je apstraktna, generalizirajuća karakteristika karakteristike proučavane populacije, ali ne pokazuje strukturu populacije.

Prosječna vrijednost ne daje predodžbu o tome kako su pojedinačne vrijednosti ispitivane osobine grupirane oko prosjeka, jesu li koncentrirane blizu njega ili značajno odstupaju od njega.

Ako su pojedinačne vrijednosti atributa bliske aritmetičkoj sredini, onda u ovom slučaju srednja vrijednost dobro predstavlja cijelu populaciju. I obrnuto.

Fluktuaciju pojedinačnih vrijednosti karakterizira pokazatelji varijacije.

Pojam "varijacija" dolazi od latinskog variatio - promjena, fluktuacija, razlika. Međutim, sve se razlike obično ne nazivaju varijacijama.

Pod varijacijama u statistici podrazumijevaju takve kvantitativne promjene vrijednosti ispitivane osobine unutar homogene populacije, koje su posljedica međusobnog utjecaja djelovanja različitih čimbenika. Razlikovati varijaciju osobine u apsolutnim i relativnim vrijednostima. Apsolutno - R, L, σ, σ 2.

Indikatori varijacije

1 agregat 2 agregat
n = 5 80, 100, 120, 200, 300 n = 8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Stoga, u ovom slučaju, postaje potrebno odrediti varijaciju značajke, t.j. omjer pojedinačnih vrijednosti serije jedna u odnosu na drugu.

Indikatori varijacije

1. Raspon varijacije je razlika između maksimalne i minimalne vrijednosti značajke.

R = X max - X min

R 1 = 300-80 = 220 R 2 = 180-145 = 35

Praksa: za homogenu populaciju, za kontrolu kvalitete proizvoda.

2. Indikatori koji uzimaju u obzir odstupanja svih opcija od aritmetičke sredine.

a) Prosječna linearna devijacija

b) Standardna devijacija

Prosječna linearna devijacija je aritmetička sredina apsolutnih vrijednosti odstupanja pojedinih opcija od srednje vrijednosti.

za negrupirane:

;

za grupirane:

Praksa: analizira:

1. Sastav zaposlenika

2. Ritam proizvodnje

3. Jedinstvena opskrba materijalima

Mana: ovaj pokazatelj komplicira izračune vjerojatnog tipa, otežava primjenu metoda matematičke statistike

Srednja kvadratna devijacija (standard)- ovo je

za negrupirane podatke

za grupirane podatke

Za umjereno iskrivljene distribucije

Standardna devijacija, kao i standardna devijacija, apsolutni je pokazatelj, izražen u istim jedinicama kao i aritmetička sredina.

Pokazatelji srednjeg kvadrata ili standardne linearne devijacije za dvije populacije pokazuju se neusporedivim ako same karakteristike za te populacije nisu iste. Ovi pokazatelji se ne uspoređuju za različite karakteristike iste populacije. Oni. kada su srednje vrijednosti u obje populacije izražene u istim mjernim jedinicama i iste, usporedba je moguća i odražavat će razlike u varijaciji osobine.

Standardna devijacija je mjera pouzdanosti srednje vrijednosti. Što je σ manji, to bolje aritmetička sredina odražava cjelokupnu zastupljenu populaciju.

3. Disperzija koristi se za mjerenje varijabilnosti obilježja. Ovaj pokazatelj objektivnije odražava mjeru varijacije

jer nije grupiran

za grupirane

Posebnost ovog pokazatelja je da kada se kvadrira, udio malih odstupanja pada, a velikih se povećava u ukupnom iznosu odstupanja.

Ovo je također apsolutni pokazatelj.

Varijanca ima niz svojstava, od kojih neka olakšavaju izračun:

1. Varijanca konstante je 0

2. Ako su sve varijante vrijednosti atributa (x) ↓ za isti broj, tada se varijanca ne smanjuje

3. Ako su sve opcije ↓ za isti broj puta (K puta), tada je varijanca ↓ za K 2 puta

x f x "

x 100 puta

Varijanca σ je 0,909 * 10000 = 9090

Izračun pokazatelja varijacije za kvantitativne karakteristike razmatran je gore, ali se može postaviti zadatak procjene varijacije kvalitativne karakteristike. Na primjer, kada se proučava kvaliteta proizvedenih proizvoda, može se podijeliti na dobre i neispravne.

U ovom slučaju govorimo o alternativnim značajkama.

Varijanca alternativnog obilježja

Alternativni znakovi nazivaju se one koje neke jedinice agregata imaju, a druge nemaju. Na primjer, dostupnost radnog iskustva među kandidatima, akademski stupanj od sveučilišnih profesora itd. Prisutnost obilježja u jedinicama populacije konvencionalno se označava s 1, a odsutnost - 0. x 1 = 1, x 2 = 0. Udio jedinica koje imaju obilježje (u ukupnoj populaciji) označava se s p, a udio jedinica koje nemaju obilježje - s q. Oni. p + q = 1, q = 1-p.

Izračunajmo prosječnu vrijednost alternativnog obilježja

; ;

Oni. prosječna vrijednost alternativnog obilježja jednaka je udjelu jedinica s tim karakteristikama, udjelu jedinica koje nemaju te karakteristike.

Standardna devijacija je jednaka B p =

Kvaliteta je provjerena: 1000 gotovih proizvoda, 20 neispravnih.

Pronađite stopu brakova: (20/1000) * 100% = 0,02%

Disperzija ima niz svojstava, što pojednostavljuje izračun.

1. Ako od svih vrijednosti opcija oduzme neki konstantni broj A, tada se standardno odstupanje od toga neće promijeniti.

Podijelite s prijateljima ili sačuvajte za sebe:

Učitavam...