Variačné ukazovatele. Výpočet rozptylu alternatívneho atribútu Podľa akej závislosti sa vypočíta rozptyl alternatívneho atribútu

Priemerná hodnota alternatívneho prvku a jeho rozptyl :

Priemerná hodnota alternatívnej charakteristiky

Rozptyl alternatívnej funkcie

Dosadzovanie do vzorca rozptylu q= 1 - p, dostaneme:

teda alternatívny rozptyl funkcií rovná produktu zlomky jednotiek, ktoré majú túto vlastnosť a podiel jednotiek, ktoré túto vlastnosť nemajú.

Smerodajná odchýlka alternatívneho znaku:

Variácia alternatívneho atribútu spočíva v prítomnosti alebo neprítomnosti študovanej vlastnosti v jednotkách populácie. Kvantitatívne je variácia alternatívneho znaku vyjadrená v dvoch hodnotách: prítomnosť študovanej vlastnosti v jednotke je označená jednotkou (1) a jej absencia nulou (0). Podiel jednotiek, ktoré majú študovanú vlastnosť, je označený písmenom a zlomok jednotiek, ktoré túto vlastnosť nemajú - cez. Berúc do úvahy, že p + q = 1 (teda q = 1 - p), a priemerná hodnota alternatívneho znaku je

,

stredná štvorec odchýlok

Rozptyl alternatívneho znaku sa teda rovná súčinu zlomku jednotiek s touto vlastnosťou () a zlomku jednotiek, ktoré túto vlastnosť nemajú ().

Stredná štvorec odchýlky (rozptyl) nadobúda maximálnu hodnotu v prípade rovnosti podielov, t.j. keď t.j. ... Dolná hranica tohto ukazovateľa je nula, čo zodpovedá situácii, v ktorej nedochádza k žiadnej agregovanej variácii. Smerodajná odchýlka alternatívneho znaku:

Selektívne pozorovanie, výhody a nevýhody.

Selektívne pozorovanie je jedným z najmodernejších typov štatistického pozorovania, pri ktorom sa skúma časť jednotiek skúmanej populácie, vybraných na základe vedecky vyvinutých princípov, ktoré poskytujú dostatočné množstvo spoľahlivých údajov na charakterizáciu celej populácie. ako celok.

Priemerné a relatívne ukazovatele získané na základe údajov zo vzorky by mali dostatočne plne reprodukovať zodpovedajúce ukazovatele populácie ako celku.

Hlavné výhody selektívneho pozorovania spočívajú v tom, že sa môže vykonávať podľa širšieho programu, je lacnejšie z hľadiska nákladov a dá sa organizovať vtedy a v tých prípadoch, keď nemôžeme použiť výkazníctvo.

Hlavnou nevýhodou je, že získané údaje vždy obsahujú chyby a výsledky pozorovania možno posudzovať len s určitým stupňom spoľahlivosti. Vyžaduje si to aj kvalifikovaný personál.

Spôsoby tvorby vzorky.

V štatistike sa využívajú rôzne metódy tvorby výberových súborov, ktoré sú určené cieľmi výskumu a závisia od špecifík predmetu skúmania.

Hlavnou podmienkou vykonania výberového zisťovania je zamedzenie vzniku systematických chýb vyplývajúcich z porušenia princípu rovnosti príležitostí pre každú jednotku všeobecnej populácie, ktorá má byť zaradená do výberového súboru. Predchádzanie systematickým chybám je dosiahnuté použitím vedecky podložených metód tvorby vzorky populácie.

Existujú nasledujúce spôsoby výberu jednotiek z bežnej populácie:

1) individuálny výber - vo vzorke sú vybrané jednotlivé jednotky;

2) skupinový výber - do vzorky spadajú kvalitatívne homogénne skupiny alebo série študovaných jednotiek;

3) kombinovaný výber je kombináciou individuálneho a skupinového výberu.

Spôsoby výberu sú určené pravidlami pre tvorbu výberovej populácie.

Vzorka môže byť:

Prísne náhodný spočíva v tom, že výberová populácia vzniká ako výsledok náhodného (neúmyselného) výberu jednotlivých jednotiek zo všeobecnej populácie. V tomto prípade sa počet jednotiek vybraných pre populáciu vzorky zvyčajne určuje na základe akceptovaného podielu vzorky. Podiel vzorky je pomer počtu jednotiek vo vzorke n k počtu jednotiek vo všeobecnej populácii N, t.j.

§ mechanické je, že výber jednotiek vo vzorke sa robí zo všeobecnej populácie, ktorá je rozdelená do rovnakých intervalov (skupín). Navyše, veľkosť intervalu vo všeobecnej populácii sa rovná prevrátenej časti podielu vzorky. Takže pri 2% vzorke sa vyberie každá 50. jednotka (1: 0,02), pri 5% vzorke každá 20. jednotka (1: 0,05) atď. Všeobecná populácia je teda v súlade s akceptovaným podielom selekcie akoby mechanicky rozdelená na skupiny rovnakej veľkosti. Z každej skupiny sa vyberie len jedna jednotka.

§ typický – v ktorom sa všeobecná populácia najskôr rozdelí na homogénne typické skupiny. Potom sa z každej typickej skupiny správnym náhodným alebo mechanickým vzorkovaním uskutoční individuálny výber jednotiek do vzorky. Dôležitou črtou typickej vzorky je, že poskytuje presnejšie výsledky v porovnaní s inými metódami výberu jednotiek vo vzorke;

§ sériový – v ktorom je všeobecná populácia rozdelená do rovnako veľkých skupín – rad. Pre vzorku sú vybrané série. V rámci série sa vykonáva nepretržité sledovanie jednotiek zahrnutých v sérii;

Kombinovaná - vzorka môže byť dvojstupňová. V tomto prípade je všeobecná populácia najskôr rozdelená do skupín. Potom sa vyberú skupiny a v rámci nich sa vyberú jednotlivé jednotky.

V štatistike sa rozlišujú tieto metódy výberu jednotiek pre vzorku:

§ jednostupňový odber vzoriek - každá vybraná jednotka je okamžite preskúmaná podľa daného kritéria (správny náhodný a sériový odber vzoriek);

Viacstupňový výber - výber sa robí zo všeobecnej populácie jednotlivých skupín a zo skupín sa vyberajú jednotlivé jednotky (typický výber s mechanickou metódou výberu jednotiek vo výberovej populácii).

Okrem toho sa rozlišuje:

§ opätovný výber - podľa schémy vrátenej gule. Navyše, každá jednotka alebo séria, ktorá sa dostala do vzorky, sa vráti do všeobecnej populácie, a preto má šancu dostať sa znova do vzorky;

Variácia- ide o rozdiely v jednotlivých hodnotách znaku v jednotkách skúmanej populácie. Štúdium variácií má veľký praktický význam a je nevyhnutným článkom v ekonomickej analýze. Potreba študovať variáciu je spôsobená skutočnosťou, že priemer, ktorý je výsledkom, plní svoju hlavnú úlohu s rôznym stupňom presnosti: čím menšie sú rozdiely v jednotlivých hodnotách vlastnosti, ktorá sa má spriemerovať, tým je homogénnejšia. obyvateľov, a teda tým presnejší a spoľahlivejší priemer a naopak. Následne podľa stupňa variácie možno posudzovať hranice variácie vlastnosti, homogenitu populácie pre túto vlastnosť, typickosť priemeru, vzťah faktorov určujúcich variáciu.

Zmena variácie prvku v súhrne sa vykonáva pomocou absolútne a relatívne ukazovatele.

Absolútne ukazovatele variácie zahŕňajú:

Variácia švihu (R)

Variácia potiahnutia prstom Je rozdiel medzi maximálnymi a minimálnymi hodnotami charakteristiky

Ukazuje hranice, v ktorých sa mení hodnota znaku v skúmanom.

Príklad... Pracovná prax piatich uchádzačov v predchádzajúcej práci je: 2, 3, 4, 7 a 9 rokov.
Riešenie: rozsah variácie = 9 - 2 = 7 rokov.

Pre všeobecnú charakteristiku rozdielov v hodnotách atribútu sa priemerné ukazovatele variácie vypočítajú na základe odchýlok od aritmetického priemeru. Rozdiel sa berie ako odchýlka od priemeru.

Zároveň, aby sme sa vyhli súčtu odchýlok variantov atribútu od priemeru (nulová vlastnosť priemeru), musíme buď ignorovať znamienka odchýlok, to znamená vziať tento súčet modulo, alebo odmocniť hodnoty odchýlok. do nuly.

Priemerná lineárna a štandardná odchýlka

Priemerná lineárna odchýlka- to je z absolútnych odchýlok jednotlivých hodnôt charakteristiky od priemeru.

Priemerná lineárna odchýlka je jednoduchá:

Pracovná prax piatich uchádzačov v predchádzajúcej práci je: 2, 3, 4, 7 a 9 rokov.

V našom príklade: roky;

Odpoveď: 2,4 roka.

Vážený priemer lineárnej odchýlky platí pre zoskupené údaje:

Priemerná lineárna odchýlka, vzhľadom na svoju konvenciu, sa v praxi používa pomerne zriedka (najmä na charakterizáciu plnenia zmluvných záväzkov na jednotnosť dodávok; pri analýze kvality produktu s prihliadnutím na technologické vlastnosti výroby).

Smerodajná odchýlka

Najdokonalejšou charakteristikou variácie je štandardná odchýlka, ktorá sa nazýva štandard (alebo štandardná odchýlka). () sa rovná druhej odmocnine stredného štvorca odchýlok jednotlivých hodnôt prvku od:

Štandardná odchýlka je jednoduchá:

Vážená štandardná odchýlka sa používa pre zoskupené údaje:

Medzi strednou kvadratickou a štandardnou lineárnou odchýlkou ​​za normálnych distribučných podmienok platí nasledujúci vzťah: ~ 1,25.

Štandardná odchýlka, ktorá je hlavnou absolútnou mierou variácie, sa používa na určenie hodnôt ordinát normálnej distribučnej krivky vo výpočtoch súvisiacich s organizáciou pozorovania vzorky a stanovením presnosti charakteristík vzorky, ako aj pri hodnotení hranice variácie znaku v homogénnej populácii.

Disperzia

Disperzia- je stredná štvorec odchýlok jednotlivých hodnôt znaku od ich priemeru.

Rozdiel je jednoduchý:

V našom príklade:

Vážená disperzia:

Je vhodnejšie vypočítať rozptyl podľa vzorca:

ktorý sa získava z hlavného jednoduchými transformáciami. V tomto prípade sa stredná druhá mocnina odchýlok rovná priemeru druhých mocnín hodnôt funkcie mínus štvorec priemeru.

Pre neagregované údaje:

Pre zoskupené údaje:

Variácia alternatívnej funkcie spočíva v prítomnosti alebo neprítomnosti skúmanej vlastnosti v jednotkách populácie. Kvantitatívne je variácia alternatívneho znaku vyjadrená v dvoch hodnotách: prítomnosť študovanej vlastnosti v jednotke je označená jednotkou (1) a jej absencia nulou (0). Podiel jednotiek, ktoré majú študovanú vlastnosť, je označený písmenom a zlomok jednotiek, ktoré túto vlastnosť nemajú - cez. Berúc do úvahy, že p + q = 1 (teda q = 1 - p), a priemerná hodnota alternatívneho znaku je

,

stredná štvorec odchýlok

Rozptyl alternatívneho znaku sa teda rovná súčinu zlomku jednotiek s touto vlastnosťou () a zlomku jednotiek, ktoré túto vlastnosť nemajú ().

Stredná štvorec odchýlky (rozptyl) nadobúda maximálnu hodnotu v prípade rovnosti podielov, t.j. keď t.j. ... Dolná hranica tohto ukazovateľa je nula, čo zodpovedá situácii, v ktorej nedochádza k žiadnej agregovanej variácii. Smerodajná odchýlka alternatívneho znaku:

Ak sa teda vo vyrobenej dávke 3 % výrobkov ukázalo ako neštandardných, potom rozptyl podielu neštandardných výrobkov a smerodajná odchýlka alebo 17,1 %.

Smerodajná odchýlka sa rovná druhej odmocnine stredného štvorca odchýlok jednotlivých hodnôt znaku od aritmetického priemeru.

Relatívne miery variácie

Relatívne miery variácie zahŕňajú:

Porovnanie variácií niekoľkých populácií pre ten istý znak a ešte viac pre rôzne znaky pomocou absolútnych ukazovateľov nie je možné. V týchto prípadoch sa na porovnávacie posúdenie miery rozdielu skonštruujú relatívne ukazovatele variácie. Vypočítajú sa ako pomer absolútnych ukazovateľov variácie k priemeru:

Vypočítajú sa aj ďalšie relatívne charakteristiky. Napríklad na odhad variácie v prípade asymetrického rozdelenia sa vypočíta pomer strednej lineárnej odchýlky k mediánom

keďže v dôsledku vlastnosti mediánu je súčet absolútnych odchýlok atribútu od jeho hodnoty vždy menší ako od ktoréhokoľvek iného.

Ako relatívna miera rozptylu, ktorá odhaduje variáciu v centrálnej časti populácie, sa vypočíta relatívna kvartilová odchýlka, kde je stredný kvartil polovičného súčtu rozdielu medzi tretím (alebo horným) kvartilom () a prvý (alebo nižší) kvartil ().

V praxi sa najčastejšie počíta variačný koeficient. Spodná hranica tohto ukazovateľa je nulová, nemá hornú hranicu, je však známe, že s nárastom variácie znaku rastie aj jeho hodnota. Variačný koeficient je v istom zmysle kritériom homogenity populácie (v prípade normálneho rozdelenia).

Vypočítajme variačný koeficient na základe štandardnej odchýlky pre nasledujúci príklad. Spotreba surovín na jednotku produktu bola (kg): pre jednu technológiu pri a pre druhú - pri. Priame porovnanie hodnoty štandardných odchýlok by mohlo viesť k mylnej predstave, že kolísanie spotreby surovín pre prvú technológiu je intenzívnejšie ako pre druhú (. Relatívna miera variácie (umožňuje nám vyvodiť opačný záver

Príklad výpočtu ukazovateľov variácie

Vo fáze výberu kandidátov na účasť v komplexnom projekte firma vyhlásila súťaž pre profesionálov. Rozdelenie uchádzačov podľa pracovných skúseností ukázalo tieto výsledky:

Vypočítajme priemerné výrobné skúsenosti, roky

Vypočítajme rozptyl na základe trvania pracovných skúseností

Rovnaký výsledok získame, ak na výpočet rozptylu použijeme iný vzorec

Vypočítajme smerodajnú odchýlku v rokoch:

Určte variačný koeficient, %:

Pravidlo sčítania odchýlky

Na posúdenie vplyvu faktorov určujúcich variáciu sa používa technika zoskupovania: súbor sa rozdelí na skupiny, pričom sa ako atribút zoskupenia vyberie jeden z určujúcich faktorov. Potom sa spolu s celkovým rozptylom vypočítaným pre celú populáciu vypočíta vnútroskupinový rozptyl (alebo priemer skupiny) a medziskupinový rozptyl (alebo rozptyl priemerov skupiny).

Celkový rozptyl charakterizuje variáciu znaku v celom súbore, ktorý sa vyvinul pod vplyvom všetkých faktorov a podmienok.

Medziskupinový rozptyl meria systematickú odchýlku v dôsledku vplyvu faktora, ktorým sa zoskupenie uskutočňuje:

Vnútroskupinový rozptyl posudzuje variáciu znaku, ktorý sa vyvinul podľa vplyvu iných faktorov, ktoré nie sú v tejto štúdii zohľadnené a je nezávislý od faktora zoskupenia. Je definovaný ako priemer skupinových rozptylov.

Všetky tri odchýlky () sú navzájom spojené nasledujúcou rovnosťou, ktorá je známa ako pravidlo sčítania rozptylu:

tento pomer sa používa na konštrukciu ukazovateľov hodnotiacich vplyv atribútu zoskupenia na vytvorenie všeobecnej variácie. Patria sem empirický koeficient determinácie () a empirický korelačný pomer ()

() charakterizuje podiel medziskupinového rozptylu na celkovom rozptyle:

a ukazuje, do akej miery je variácia znaku v súhrne spôsobená faktorom zoskupenia.

Empirický korelačný vzťah(!! \ eta = \ sqrt (\ frac (\ delta ^ 2) (\ sigma ^ 2))

posudzuje tesnosť vzťahu medzi študovanými a zoskupovacími charakteristikami. Hraničné hodnoty sú nula a jedna. Čím bližšie k jednej, tým bližšie je spojenie.

Príklad. Náklady na 1 meter štvorcový celkovej plochy (konvenčné jednotky) na trhu s bývaním pre desať 17 domov s vylepšeným plánovaním boli:

Zároveň je známe, že prvých päť domov bolo postavených v blízkosti obchodného centra a zvyšok - v značnej vzdialenosti od neho.

Na výpočet celkového rozptylu vypočítajme priemerné náklady na 1 m2. celková plocha: Celkový rozptyl je určený vzorcom :

Vypočítajme priemerné náklady na 1 m2. a rozptyl tohto ukazovateľa pre každú skupinu domov, ktoré sa líšia polohou v porovnaní s centrom mesta:

a) pre domy postavené blízko centra:

b) pre domy postavené ďaleko od centra:

Rozdiel v cene 1 m2. zisťuje sa celková plocha spôsobená zmenou polohy domov medziskupinový rozptyl:

Rozdiel v cene 1 m2. z celkovej plochy, vzhľadom na zmenu zostávajúcich ukazovateľov, ktoré neberieme do úvahy, sa meria vnútroskupinový rozptyl

Nájdené odchýlky sa sčítajú k celkovému rozptylu

Empirický koeficient determinácie:

ukazuje, že rozptyl nákladov na 1 m2. z celkovej plochy na trhu s bývaním o 81,8% sa vysvetľuje rozdielmi v umiestnení nových budov vo vzťahu k obchodnému centru a o 18,2% - inými faktormi.

Empirický korelačný vzťah naznačuje významný vplyv na náklady na bývanie, umiestnenie domov.

Pravidlo pre sčítanie rozptylov pre zlomok znak je napísaný takto:

a tri typy rozptylov podielov pre zoskupené údaje sú určené nasledujúcimi vzorcami:

celkový rozptyl:

Medziskupinové a vnútroskupinové disperzné vzorce:

Charakteristiky tvaru distribúcie

Na získanie predstavy o distribučnej forme sa používajú ukazovatele priemernej úrovne (,), ukazovatele variácie, asymetrie a špičatosti.

V symetrických rozdeleniach sa aritmetický priemer, modus a medián zhodujú (. Ak je táto rovnosť porušená, rozdelenie je asymetrické.

Najjednoduchším ukazovateľom asymetrie je rozdiel, ktorý je pozitívny v prípade pravostrannej asymetrie a negatívny v prípade ľavostrannej asymetrie.

Asymetrická distribúcia

Na porovnanie asymetrie niekoľkých riadkov sa vypočíta relatívny ukazovateľ

Variácie sa používajú ako zovšeobecňujúce charakteristiky centrálne distribučné momenty- rád, zodpovedajúci stupňu zvýšenia odchýlok jednotlivých hodnôt atribútu od aritmetického priemeru:

Pre nezoskupené údaje:

Pre zoskupené údaje:

Okamih prvého rádu sa podľa vlastnosti aritmetického priemeru rovná nule.

Momentom druhého rádu je rozptyl.

Momenty tretieho a štvrtého rádu sa využívajú na konštrukciu ukazovateľov, ktoré hodnotia znaky tvaru empirických rozdelení.

Pomocou momentu tretieho rádu sa meria miera šikmosti alebo asymetrie rozloženia.

- koeficient asymetrie

V symetrických rozdeleniach, ako všetky centrálne momenty nepárneho rádu, nenulový centrálny moment tretieho rádu indikuje asymetriu rozdelenia. V tomto prípade, ak, potom je asymetria pravostranná a pravá vetva je predĺžená vzhľadom na maximálnu ordinátu; ak, potom je asymetria ľavostranná (na grafe to zodpovedá predĺženiu ľavej vetvy).

Na charakterizáciu vrcholovosti alebo plochosti distribúcie sa vypočíta pomer krútiaceho momentu štvrtého rádu () k štandardnej odchýlke pri štvrtom výkone (). Pre normálne rozdelenie sa preto špičatosť nachádza podľa vzorca:

Pre normálne rozdelenie zmizne. Pre špičkové distribúcie, pre ploché.

Distribučná špičatosť

Okrem vyššie uvažovaných ukazovateľov je zovšeobecňujúcou charakteristikou variácie v homogénnej populácii určité poradie v zmene distribučných frekvencií v súlade so zmenami hodnoty študovaného atribútu, tzv. distribučný vzor.

Povaha (typ) distribučného vzoru môže byť identifikovaná zostrojením variačného radu na základe veľkého množstva pozorovaní, ako aj takého výberu počtu skupín a hodnoty integrálov, pri ktorých by vzor mohol byť najviac jasne prejavil.

Analýza série variácií zahŕňa identifikáciu povahy rozdelenia (ako výsledok variačného mechanizmu), stanovenie distribučnej funkcie, kontrolu zhody empirického rozdelenia s teoretickým.

Empirická distribúcia, získaný na základe pozorovaných údajov, je graficky znázornený empirickou distribučnou krivkou pomocou mnohouholníka.

V praxi existujú rôzne typy rozdelení, medzi ktorými je možné rozlíšiť symetrické a asymetrické, jednovrcholové a viacvrcholové.

Stanoviť typ distribúcie znamená vyjadriť mechanizmus tvorby obrazca v analytickej forme. Mnohé javy a ich znaky sú charakterizované charakteristickými formami distribúcie, ktoré sú aproximované príslušnými krivkami. Pri všetkej rozmanitosti foriem rozdelenia sú najrozšírenejšie ako teoretické normálne rozdelenie, Paussonovo rozdelenie, binomické rozdelenie atď.

Zvláštne miesto pri štúdiu variácií patrí normálnemu zákonu, kvôli jeho matematickým vlastnostiam. Pre normálny zákon je splnené pravidlo troch sigma, podľa ktorého je variácia jednotlivých hodnôt znaku v rozmedzí od hodnoty priemeru. Zároveň je asi 70 % všetkých jednotiek v rámci hraníc a 95 % v rámci limitov.

Posudzovanie zhody empirických a teoretických rozdelení sa vykonáva pomocou kritérií dobrej zhody, medzi ktorými sú všeobecne známe Pearsonove, Romanovského, Yastremského, Kolmogorovove kritériá.

UKAZOVATELE VARIANTOV

Metodické pokyny na riešenie úloh

Na tému „Ukazovatele variácie“

Na meranie stupňa variácie (variability) znaku sa používa variácia, ktorej indikátormi sú: rozsah variácie, stredná lineárna odchýlka, smerodajná odchýlka, stredná štvorec odchýlok (variancia), variačný koeficient. .

Variácia potiahnutia prstom

Rozsah variácií ( R) charakterizuje hranice variácie (zmeny) jednotlivých hodnôt (alebo variantov) atribútu ( X) v štatistickej populácii

kde je najväčšia a najmenšia hodnota prvku.

Priemerná lineárna odchýlka

Priemerná lineárna odchýlka sa vypočíta pomocou vzorcov aritmetického priemeru:

Jednoduché (nevážené)

,

kde - i-tá charakteristická hodnota X ;

Priemerná hodnota funkcie X ;

Štatistická váha i-tá hodnota atribútu;

n- počet členov obyvateľstva;

Vážené

Smerodajná odchýlka

Smerodajná odchýlka sa vypočíta pomocou vzorcov:

Nevážené

Vážené

Rozptyl kvantitatívneho znaku

Disperzia kvantitatívny atribút je určený vzorcami aritmetického priemeru:

Nevážené

Vážené

Rozptyl možno vypočítať takto:

kde je stredná štvorec hodnôt funkcie;

Druhá mocnina priemernej hodnoty objektu.

Variačné vlastnosti kvantitatívneho znaku

1. So znížením alebo zvýšením váh (frekvencií) premenlivého atribútu v K keďže rozptyl sa nemení

2. Pri znižovaní alebo zvyšovaní každej hodnoty atribútu o rovnakú konštantnú hodnotu A rozptyl sa nemení

kde je priemerná hodnota funkcie ( X- A).

3. Pri znižovaní alebo zvyšovaní hodnoty každého atribútu v rovnakom čísle K krát sa rozptyl zníži alebo zvýši o K 2 krát a štandardná odchýlka - v K raz



kde je priemerná hodnota funkcie xK.

4. Rozptyl znaku vzhľadom na ľubovoľnú hodnotu A vždy väčší ako rozptyl vo vzťahu k aritmetickému priemeru na štvorec rozdielu medzi strednou a ľubovoľnou hodnotou

dôkaz:

Rozptyl vo vzťahu k priemeru

Výpočet rozptylu metódou momentov

Metóda zjednodušeného výpočtu rozptylu sa vykonáva podľa vzorca

a nazýva sa to cesta okamihov.

Ukazovatele m 1 , m 2 predstavujú momenty prvého a druhého rádu a sú vypočítané nasledovne

dôkaz:

Rozptýlenie kvantitatívneho znaku v súhrne,

Rozdelené do skupín

Na analýzu vzťahov kvantitatívnych charakteristík v štatistickej populácii rozdelenej do skupín sa vypočítajú tieto rozptyly: skupinové, medziskupinové, vnútroskupinové a celkové.

Skupinová variácia (čiastočná) charakterizuje variáciu vlastnosti v skupine v dôsledku pôsobenia všetkých ostatných faktorov na ňu, s výnimkou vlastnosti, ktorá je základom zoskupenia (skupinová črta):

kde - i-tá hodnota funkcie v j-tá skupina;

Súkromná (skupinová) priemerná hodnota objektu v j-tá skupina;

Štatistická váha i-tá hodnota atribútu v j-tá skupina;

Počet rôznych charakteristických hodnôt v j skupina.

Medziskupinový rozptyl meria stupeň variability (variácie) znaku v celej štatistickej populácii v dôsledku faktora, ktorý je základom zoskupenia (skupinový znak):

kde je priemerná hodnota charakteristiky v súhrne (celkový priemer);

Váha j-tá skupina, ktorá predstavuje počet jednotiek v j th

J- počet skupín v štatistickej populácii.

Vnútroskupinový rozptyl (priemer skupinových rozptylov) meria stupeň variability znaku v celej populácii ako celku v dôsledku pôsobenia všetkých ostatných faktorov (znakov), okrem znaku zoskupenia:

Celkový rozptyl meria stupeň variability znaku v dôsledku vplyvu všetkých faktorov, ktoré naň pôsobia:

Celkový rozptyl znaku v štatistickej populácii rozdelenej do skupín možno určiť pomocou základného rozptylového vzorca

Medziskupinový a celkový rozptyl sa používajú na určenie ukazovateľov blízkosti vzťahu ukazovateľov v súhrne, rozdelených do skupín.

Rozptyl kvalitatívneho alternatívneho znaku

Na určenie rozptylu alternatívneho znaku predpokladajme, že celkový počet populačných jednotiek sa rovná n... Počet jednotiek so študovaným znakom - f, potom sa počet jednotiek, ktoré nemajú študovaný znak, rovná ( n- f). Distribučný rad kvalitatívneho (alternatívneho) znaku je nasledovný

Variabilná hodnota Frekvencia opakovania
f n-f
Celkom n

Aritmetický priemer takejto série je:

to znamená, že sa rovná relatívnej frekvencii (frekvencii) objavenia sa študovaného znaku, ktorý možno označiť p, potom

Podiel jednotiek so študovaným znakom sa rovná p, podiel jednotiek, ktoré nemajú skúmanú vlastnosť, sa rovná q, potom p + q = 1.

Rozptyl alternatívnej funkcie

Špeciálnym prípadom atribútového (nekvantitatívneho) znaku je alternatívny znak. Keď jednotky populácie buď majú daný študovaný atribút, alebo ho nemajú. Príkladom takýchto znakov je: prítomnosť chybných výrobkov, akademický titul od vysokoškolských učiteľov, práca v získanej špecializácii, prekročenie priemerného príjmu na obyvateľa na ich celoruskej úrovni, prítomnosť detí v rodine atď. .

Ak existuje alternatívna vlastnosť, populačnej jednotke sa priradí hodnota „1“. V neprítomnosti - "0".

Váhy vo výpočtoch sú:

Podiel jednotiek s touto vlastnosťou;

Podiel jednotiek, ktoré túto funkciu nemajú

Potom sa priemerná hodnota alternatívneho prvku rovná:

odchýlka bude mať tvar:

Rozptyl alternatívneho znaku sa pohybuje od 0 do 0,25. Maximálna hodnota 0,25 dosahuje pri 0,5

Príklad 4.11. Vo výberovom prieskume medzi 300 obyvateľmi Kurska sa 60 z nich vyjadrilo pozitívne o vedení osobných úspor v mestských komerčných bankách.

Určte priemernú úroveň, rozptyl a štandardnú odchýlku vlastnosti

Praktická aplikácia variácie alternatívneho znaku spočíva najmä v konštrukcii intervalov spoľahlivosti pri vykonávaní vzorového pozorovania.

Štúdium tvaru distribúcie prvkov. Hlavné charakteristiky distribučných vzorcov

Nevyhnutnou podmienkou úspešnosti konštrukcií, výpočtov a záverov založených na sérii variácií je homogenita v nich zhrnutých agregátov, stanovená na základe hlbokej teoretickej analýzy.

Jasne vyjadrené poradie zmeny frekvencie v súlade so zmenou hodnoty vlastnosti sa nazýva distribučný vzor.

Znalosť typu distribučného vzoru (a následne aj tvaru krivky) je potrebná predovšetkým:

1. Objasniť typické podmienky získavania primárneho štatistického materiálu. Vzhľad multivertexovej alebo v podstate asymetrickej krivky teda naznačuje rôznorodé zloženie populácie a potrebu preskupenia údajov s cieľom identifikovať homogénnejšie skupiny.

2. Zabezpečiť správnosť praktických výpočtov a prognóz. Teda použitie vzorca G. Sturgessa na výpočet optimálneho počtu skupín v intervalovom rade, pravidlo „tri sigma“, variačný koeficient Vу ako indikátor homogenity rozdelenia jemu blízkych.

Na grafoch sú zreteľne zobrazené vzory variačných radov, ktoré sú vyjadrené typom rozloženia ich frekvencií – histogram a polygón rozloženia frekvencií. Ich úvaha ukazuje, že v histograme je veľká diskontinuita v rozložení a v polygóne dochádza k postupnému prechodu z jednej skupiny do druhej. Polygónová línia čiastočne vyhladzuje diskontinuitu histogramu; ide o všeobecnejšiu techniku ​​na analýzu rozloženia.

S nárastom riadkov intervalu variačného radu a zodpovedajúcim poklesom hodnoty jeho intervalov sa počet strán distribučného mnohouholníka zvýši a prerušovaná čiara bude mať tendenciu prechádzať do určitej krivky v limite. Táto krivka sa nazýva distribučná krivka... V ňom dochádza k najväčšiemu uvoľneniu údajov z vplyvu náhodných faktorov. Odhaľuje a ukazuje v najvšeobecnejšej forme povahu variácií, vzor distribúcie frekvencií v rámci súboru javov jedinej kvality.

Distribučné krivky môžu byť rôznych typov. V praxi sociálno-ekonomického výskumu sa bežne používa krivka normálneho rozdelenia. Je to jednovrcholová symetrická zvonovitá postava, ktorej pravá a ľavá vetva sa rovnomerne a symetricky zmenšujú, asymptoticky sa približujú k osi x.

Charakteristickým znakom tejto krivky je zhoda aritmetického priemeru, módu a mediánu v nej. Ak sa celá oblasť medzi krivkou a osou x vezme ako 100 %, potom 68,3 % frekvencií je v rámci limitov, v rámci 95,4 %, v rámci 99,7 % („pravidlo troch sigma“).

Normálne alebo symetrické rozdelenie síce zodpovedá povahe viacerých javov, pre sociálne javy je však necharakteristické, pretože odráža rozdiely spôsobené vonkajšími vplyvmi, ktoré sú vlastné nie rozvíjajúcemu sa, ale iba kolísajúcemu súboru javov. Jednotky. Rozvoj a dynamika sú charakteristické pre spoločenské javy. Preto sú rady a krivky distribúcie frekvencií sociálnych javov spravidla asymetrické, v ktorých frekvencie narastajú na maximum a nerovnomerne z nich klesajú. Prítomnosť asymetrie alebo zošikmenia v radoch homogénnych agregátov slúži ako nepriama indikácia toho, že skúmaný proces prechádza aktívnou fázou vývoja.

Asymetrické rady a zodpovedajúce krivky majú rôzne formy distribúcie, skúmané matematickou štatistikou. Takýmito formami sú Poissonova distribúcia, Maxwellova distribúcia, Pearsonova distribúcia atď. V tomto prípade sa asymetria považuje za jeden celok ako jeden typ distribúcie. V tomto prípade sa rozlišuje pravostranná a ľavostranná asymetria (skosenie).

Ak je dlhá vetva krivky umiestnená vpravo od vrcholu, potom sa asymetria nazýva pravostranná, ak je táto vetva umiestnená vľavo od vrcholu - ľavostranná. S pravostrannou asymetriou s ľavostrannou. Preto sa uvedený rozdiel medzi nimi nazýva koeficient K. Pearson a používa sa ako koeficient asymetrie:

Pri pravostrannej asymetrii je tento koeficient pozitívny, pri ľavostrannej - negatívny. Ak = 0, rad variácií je symetrický. Čím väčšia je absolútna hodnota koeficientu, tým väčší je stupeň zošikmenia.

Najpresnejším ukazovateľom šikmosti rozloženia je koeficient šikmosti vypočítaný vzorcom

kde n je počet jednotiek v populácii. Rovnako ako v prípade Pearsonovho koeficientu pre > 0 existuje pravostranná asymetria, napr.< 0 левосторонняя. В симметричных распределениях = 0.

Čím väčšia je hodnota ||, tým je rozdelenie asymetrickejšie. Pre asymetriu bola stanovená táto klasifikačná stupnica:

|| - nevýznamná asymetria;

0,25 < || - асимметрия заметная (умеренная);

|| > 0,5 - výrazná asymetria.

Keďže koeficienty a sú relatívne bezrozmerné veličiny, často sa používajú na porovnávaciu analýzu asymetrie rôznych distribučných radov.

Povaha asymetrie niekedy naznačuje smer vývoja. Pravostranná asymetria pri skúmaní variácií znakov, v súvislosti s ktorými je záujem o ich zvyšovanie (plnenie noriem, produkcia a pod.), naznačuje progresívnosť vývoja, že smeruje k zvyšovaniu ukazovateľa, resp. ľavostranná asymetria naznačuje prítomnosť veľkého počtu zaostávajúcich miest.

Pri štúdiu variácií znakov, v súvislosti s ktorými existuje záujem o ich zníženie (náklady, pracovná náročnosť, spotreba surovín na jednotku produkcie atď.), pravostranná asymetria naznačuje nedostatky vo vývoji skúmaného procesu, ľavostranný - o progresivite jeho vývoja, o tom, ako ide v smere znižovania ukazovateľa. Pri rozdelení zamestnancov podľa odpracovaných rokov (pozri príklad 4,9 = 5,75) je pozorovaná pravostranná asymetria, keďže koeficient asymetrie je kladný: (5,955-5,75): 2,47 = 0,095. Táto asymetria je pre tento rad progresívna, naznačuje vývoj radu smerom k nárastu skúmaného ukazovateľa.

Tvar rozdelenia možno zhruba určiť priamo skúmaním empirických údajov série, najmä ak sú znázornené histogramom a mnohouholníkom. Aby sa zabezpečilo, že približná definícia tvaru rozdelenia je správna, empirické údaje série sa skúmajú z hľadiska ich blízkosti k teoretickému rozdeleniu, ktoré sa stanoví zostrojením zodpovedajúcej distribučnej krivky. V mnohých prípadoch však ani teória, ani priame zvažovanie empirických údajov neposkytujú odpovede na otázku o tvare rozdelenia. Potom sa zvyčajne vykoná štúdia o blízkosti empirických údajov k normálnemu rozdeleniu, pretože rozdelenia s malou alebo miernou asymetriou sú vo väčšine prípadov normálne podľa svojho typu.

Na objektívne posúdenie miery zhody empirického rozdelenia s normálom v štatistike sa používa množstvo kritérií, ktoré sa nazývajú kritériá zhody alebo zhody.

Patria sem kritériá Pearsona, Romanovského, Yastremského, Kolmogorova, založené na použití rôznych teoretických konceptov.

Napríklad najčastejšie používaný Pearsonov chí-kvadrát test je určený vzorcom:

kde sú empirické frekvencie (frekvencie)

Teoretické frekvencie (frekvencie)

Na posúdenie blízkosti empirického rozdelenia k teoretickému sa určuje pravdepodobnosť dosiahnutia tejto hodnoty týmto kritériom. Ak táto pravdepodobnosť presiahne 0,05, odchýlky skutočných frekvencií od teoretických sa považujú za náhodné, nevýznamné. Ak sa však odchýlky považujú za významné a empirické rozdelenie je zásadne odlišné od teoretického.

Na charakterizáciu stupňa odchýlky symetrického rozdelenia od normálu sa vypočíta index špičatosti. Dá sa približne určiť pomocou Lindberghova koeficientu.

kde je podiel (v %) počtu variantov ležiacich v intervale rovný polovicu stredná kvadratická odchýlka (v oboch smeroch od strednej hodnoty) v celkovom množstve variantu tohto radu;

38,29 - podiel (v %) počtu opcií ležiacich v intervale rovný polovicu stredná kvadratická odchýlka (v jednom alebo druhom smere od strednej hodnoty) v celkovom množstve variantu radu normálneho rozdelenia

Špicatá môže byť kladná, záporná alebo nulová.

Pre krivky s vysokým vrcholom má index špičatosti kladné znamienko, pre krivky s nízkym vrcholom záporné znamienko. Pre normálnu distribučnú krivku je jej hodnota nulová.

Pre presnejšiu charakterizáciu stupňa odchýlky symetrického rozdelenia od normálneho sa index vrcholov (kurtosis index) (Ek) vypočíta podľa vzorca:

Rovnako ako Lindberghov koeficient môže byť kladný, záporný a rovný nule. Indikátor špičatosti, rovnako ako indikátor asymetrie, je abstraktné číslo. Hraničná hodnota zápornej špičatosti je Ek = -2; veľkosť kladnej špičatosti je nekonečná.

Stanovenie ukazovateľov asymetrie a špičatosti nemá len popisný význam, často ich hodnoty dávajú určité indície pre ďalší výskum skúmaných javov. Takže napríklad výskyt výraznej negatívnej špičatosti môže naznačovať kvalitatívnu heterogenitu študovanej populácie.

Moderné počítačové technológie otvárajú široké možnosti na vykonávanie ťažkopádnych výpočtových operácií na analýzu variačných radov. Ak je materiál teoreticky pochopený a je predložená rozumná hypotéza o tvare rozdelenia (ten, mimochodom, počítač je tiež schopný skontrolovať), výpočtové zariadenia môžu rýchlo vypočítať rôzne zovšeobecňujúce ukazovatele a kritériá, zostaviť grafy atď. . Je to o to viac možné, že ukazovatele variácie sú relatívne jednoduché a dobre formalizované.

Variačný koncept

Priemer dáva zovšeobecňujúcu charakteristiku celého súboru skúmaného javu.

Variácia funkcie sa nazýva rozdiel v individuálnych hodnotách znaku v rámci skúmanej populácie.

Priemerná hodnota je abstraktná, zovšeobecňujúca charakteristika charakteristiky skúmanej populácie, ale neukazuje štruktúru populácie.

Priemerná hodnota nedáva predstavu o tom, ako sú jednotlivé hodnoty skúmaného znaku zoskupené okolo priemeru, či sú sústredené blízko neho alebo sa od neho výrazne odchyľujú.

Ak sú jednotlivé hodnoty atribútu blízko aritmetického priemeru, potom v tomto prípade priemer dobre reprezentuje celú populáciu. A naopak.

Kolísanie jednotlivých hodnôt sa vyznačuje ukazovatele variácie.

Pojem „variácia“ pochádza z latinského variatio – zmena, kolísanie, rozdiel. Nie všetky rozdiely sa však zvyčajne nazývajú variácie.

Pod variáciou v štatistike znamenajú také kvantitatívne zmeny v hodnote skúmaného znaku v rámci homogénnej populácie, ktoré sú dôsledkom prelínajúceho sa vplyvu pôsobenia rôznych faktorov. Rozlišujte variáciu znaku v absolútnych a relatívnych hodnotách. Absolútne - R, L, σ, σ 2.

Variačné ukazovatele

1 agregát 2 agregát
n = 5 80, 100, 120, 200, 300 n = 8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Preto je v tomto prípade potrebné určiť variáciu znaku, t.j. pomer jednotlivých hodnôt série voči sebe navzájom.

Variačné ukazovatele

1. Rozsah variácie je rozdiel medzi maximálnou a minimálnou hodnotou prvku.

R = X max - X min

R1 = 300-80 = 220 R2 = 180-145 = 35

Prax: pre homogénnu populáciu, pre kontrolu kvality produktov.

2. Ukazovatele, ktoré zohľadňujú odchýlky všetkých možností od aritmetického priemeru.

a) Priemerná lineárna odchýlka

b) Smerodajná odchýlka

Priemerná lineárna odchýlka je aritmetický priemer absolútnych hodnôt odchýlok jednotlivých možností od priemeru.

pre nezoskupené:

;

pre zoskupené:

Cvičenie: analyzuje:

1. Zloženie zamestnancov

2. Rytmus výroby

3. Jednotná dodávka materiálov

Chyba: tento ukazovateľ komplikuje výpočty pravdepodobného typu, sťažuje aplikáciu metód matematickej štatistiky

Stredná kvadratická odchýlka (štandard)- toto je

pre nezoskupené údaje

pre zoskupené údaje

Pre mierne šikmé rozvody

Smerodajná odchýlka, podobne ako smerodajná odchýlka, je absolútny ukazovateľ vyjadrený v rovnakých jednotkách ako aritmetický priemer.

Ukazovatele strednej hodnoty alebo štandardných lineárnych odchýlok pre dve populácie sa ukážu ako neporovnateľné, ak samotné charakteristiky pre tieto populácie nie sú rovnaké. Tieto ukazovatele sa neporovnávajú pre rôzne charakteristiky tej istej populácie. Tie. keď sú priemery v oboch populáciách vyjadrené v rovnakých jednotkách merania a sú rovnaké, porovnanie je možné a bude odrážať rozdiely vo variáciách znaku.

Smerodajná odchýlka je mierou spoľahlivosti priemeru. Čím menšie je σ, tým lepšie aritmetický priemer odráža celú reprezentovanú populáciu.

3. Disperzia používa sa na meranie variability funkcie. Tento ukazovateľ objektívnejšie odráža mieru variácie

za nezoskupené

pre zoskupené

Charakteristickým znakom tohto ukazovateľa je, že pri štvorci pomer malých odchýlok klesá a veľkých na celkovom množstve odchýlok narastá.

Toto je tiež absolútny ukazovateľ.

Rozptyl má množstvo vlastností, z ktorých niektoré uľahčujú výpočet:

1. Rozptyl konštanty je 0

2. Ak sú všetky varianty hodnôt atribútu (x) ↓ o rovnaké číslo, potom sa rozptyl neznižuje

3. Ak sú všetky možnosti ↓ rovnaký počet krát (K-krát), potom rozptyl ↓ krát K 2-krát

X f X "

x 100 krát

Rozptyl σ je 0,909 * 10000 = 9090

Výpočet variačných ukazovateľov pre kvantitatívne charakteristiky bol zvážený vyššie, ale úloha hodnotenia variácie môže byť stanovená kvalitatívne vlastnosti. Napríklad pri štúdiu kvality vyrábaných výrobkov sa dá rozdeliť na dobré a chybné.

V tomto prípade hovoríme o alternatívnych funkciách.

Rozptyl alternatívnej funkcie

Alternatívne znaky sa nazývajú tie, ktoré niektoré jednotky agregátu majú, zatiaľ čo iné nie. Napríklad dostupnosť pracovných skúseností medzi uchádzačmi, akademický titul od univerzitných profesorov atď. Prítomnosť znaku v jednotkách populácie sa konvenčne označuje 1 a neprítomnosť - 0. x 1 = 1, x 2 = 0. Podiel jednotiek, ktoré majú znak (na celkovej populácii) sa označí p a podiel jednotiek, ktoré znak nemajú - q. Tie. p + q = 1, q = 1-p.

Vypočítajme priemernú hodnotu alternatívneho prvku

; ;

Tie. priemerná hodnota alternatívneho znaku sa rovná podielu jednotiek s týmito charakteristikami a podielu jednotiek, ktoré tieto charakteristiky nemajú.

Smerodajná odchýlka sa rovná B p =

Kvalita je kontrolovaná: 1000 hotových výrobkov, 20 chybných.

Nájdite mieru sobáša: (20/1000) * 100 % = 0,02 %

Disperzia má množstvo vlastností, ktoré zjednodušujú výpočet.

1. Ak od všetkých hodnôt možnosť odčíta nejaké konštantné číslo A, potom sa štandardná odchýlka od tohto nezmení.

Zdieľajte s priateľmi alebo si uložte:

Načítava...