Co jest cechą charakterystyczną cechą serii wariacyjnej. Varilitariies i jego cechy

Różne wartości selektywne Zadzwońmy opcje Szereg wartości i oznaczania: h. 1 , h. 2, .... Przede wszystkim pracujemy nośny Opcje, tj. Układ ich w rosnącej lub malejącym porządku. W przypadku każdej opcji waga jest wskazana, tj. Numer, który charakteryzuje wkład tej opcji do agregatu ogólnego. Częstotliwość lub częstotliwość wystają jako ciężary.

Częstotliwość n I. opcja x I. Numer wskazuje, ile razy ta opcja znajduje się w rozważanym selektywnym krumieniu.

Częstotliwość lub częstotliwość względna w I. opcja x I. Numer równy stosunku częstotliwości opcji do sumy częstotliwości wszystkich opcji jest nazywany. Częstotliwość pokazuje, którą część jednostek kruszywa selektywnego ma tę opcję.

Nazywana jest sekwencja opcji o odpowiednich ciężarach (częstotliwościach lub częstotliwościach wewnętrznych). wariacje blisko.

Wiersze odmianowe są dyskretne i interwałowe.

W przypadku dyskretnych wierszy odmianowych wartości są ustawione, w przypadku interwału - wartości znaków są ustawiane jako interwały. Władki mogą wykazywać rozkład częstotliwości lub częstotliwości (częstotliwości), w zależności od tego, która wartość jest wskazana dla każdej opcji - częstotliwość lub częstotliwość.

Odmiana rozkładu częstotliwości dyskretnej Ma formularz:

Najczęstsze są na wzorze, I \u003d 1, 2, ..., m..

w. 1 + W. 2 + … + w. M \u003d 1.

Przykład 4.1. Do tego zestawu liczb

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

konstruuj dyskretne zakresy wariatyczne częstotliwości i rozkładu częstotliwości.

Decyzja . Objętość całości jest równa n. \u003d 10. Dyskretny zakres dystrybucji częstotliwości ma formularz

Wiersze interwałowe są podobne.

Odmiana dystrybucji częstotliwości interwałowych Nagrany w formularzu:

Suma wszystkich częstotliwości jest równa całkowitej liczbie obserwacji, tj. Wielkość agregatu: n. = n. 1 + N. 2 + … + n. m.

Odstęp Wariatucjonalny zakres względnej rozkładu częstotliwości (częstotliwości)ma formularz:

Częstotliwość jest formuła, I \u003d 1, 2, ..., m..

Suma wszystkich częstotliwości jest równa: w. 1 + W. 2 + … + w. M \u003d 1.

Najczęściej w praktyce stosuje się szeregi interwałowe. Jeśli statystyczne dane selektywne są bardzo wiele i ich wartości różnią się od siebie z dowolnej wartości, w którym dyskretny wiersz do tych danych będzie wystarczająco nieporęczny i niewygodny w celu dalszych badań. W tym przypadku używa się grupowanie danych, tj. Lukę zawierającą wszystkie wartości znaków są podzielone na kilka częściowych odstępówek i obliczanie częstotliwości dla każdego przedziału, otrzymuje się zakres interwału. Piszemy bardziej szczegółowo system budowy serii interwałów, zakładając, że długość odstępów częściowych będzie taki sam.

2.2 Budowa wiersza interwału

Aby zbudować numer interwałowy:

Określić liczbę interwałów;

Określić długość odstępów;

Określ lokalizację interwałów na osi.

Do określenia interwały numeryczne k. Istnieje formuła, w których

,

gdzie n. - objętość całej populacji.

Na przykład, jeśli istnieją 100 wartości funkcji (opcja), zaleca się konstruowanie wiersza interwału, aby podjąć liczbę odstępówek w równych odstępach czasu.

Jednak bardzo często w praktyce liczba odstępów wybiera sama badacza, biorąc pod uwagę, że liczba ta nie powinna być bardzo duża, aby rząd nie był masywny, ale nie bardzo mały, aby nie stracić pewnych właściwości dystrybucji.

Interwał długości h. Określony przez następujący wzór:

,

gdzie x. Max I. x. Min jest odpowiednio największa i najmniejsza opcja.

Wielkość Połączenie koło rząd.

Na budowę samych interwałów pojawiają się na różne sposoby. Jednym z najłatwiejszych sposobów jest następujący. Na początku pierwszego interwału ma wielkość
. Następnie pozostałe granice interwałów są w formule. Oczywiście koniec ostatniego interwału zA. M + 1 musi spełniać stan

Po znalezieniu wszystkich granic odstępów określają częstotliwości (lub częstotliwość) tych odstępówek. Aby rozwiązać ten problem, przeglądasz wszystkie warianty i określasz liczbę opcji w jednym lub innym przedziale. Kompletny interwał budynku rozważy na przykładzie.

Przykład 4.2. W przypadku następujących danych statystycznych odnotowanych w kolejności rosnącej, zbudować zakres interwału z liczbą odstępówek równych 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Decyzja. Całkowity n.\u003d 50 opcji opcji.

Liczba interwałów jest określona w stanie problemu, tj. k.=5.

Długość odstępów jest równa
.

Definiujemy granice interwałów:

zA. 1 = 11 − 8,5 = 2,5; zA. 2 = 2,5 + 17 = 19,5; zA. 3 = 19,5 + 17 = 36,5;

zA. 4 = 36,5 + 17 = 53,5; zA. 5 = 53,5 + 17 = 70,5; zA. 6 = 70,5 + 17 = 87,5;

zA. 7 = 87,5 +17 = 104,5.

Aby określić częstotliwość odstępów, liczymy liczbę opcji w tym przedziale. Na przykład w pierwszym przedziale od 2,5 do 19,5, opcje 11, 12, 12, 14, 14, 15 spadają. Ich liczba wynosi 6, dlatego pierwsza częstotliwość interwałowa jest równa n. 1 \u003d 6. Częstotliwość pierwszego interwału jest równa . W drugim przedziale od 19,5 do 36,5 opcji 21, 21, 22, 23, 25 spadają, której liczba jest 5. W konsekwencji częstotliwość drugiego przedziału jest równa n. 2 \u003d 5 i częstotliwość . Znalezienie podobnie częstotliwości i częstotliwości dla wszystkich interwałów, otrzymujemy następujące wiersze interwałowe.

Zakres interwału rozkładu częstotliwości jest:

Ilość częstotliwości jest równa 6 + 5 + 9 + 11 + 8 + 11 \u003d 50.

Zakres interwału rozkładu częstotliwości jest:

Ilość częstotliwości wynosi 0,12 + 0,1 + 0,18 + 0,22 + 0,16 + 0,22 \u003d 1. ■.

Przy konstruowaniu serii interwałów, w zależności od określonych warunków rozpatrywanego problemu, można stosować inne zasady, a mianowicie, a mianowicie

1. Interwałowa seria wariacyjnego może składać się z częściowych odstępów różnych długości. Niezrównawne długości interwałów pozwalają podświetlić właściwości zestawu statystycznego z nierównomiernym dystrybucją funkcji. Na przykład, jeśli granice odstępów określają liczbę mieszkańców w miastach, wskazane jest w tym problemie, aby stosować nierówne interwały wzdłuż długości. Oczywiście, dla małych miast, niewielka różnica jest wśród mieszkańców, a dla dużych miast różnica w dziesiątkach i setkach mieszkańców nie ma znaczenia. Zbadane są rzędy odstępów z nierównymi długościami odstępów częściowych, głównie w ogólnej teorii statystyk i ich uwagę wykraczają poza zakres niniejszej instrukcji.

2. W statystykach matematycznych, czasami uważane są rzędy interwałowe, dla których lewa granica pierwszego interwału ma być -∞, a prawa granica ostatniego przedziału + ∞. Odbywa się to w celu przyniesienia rozkładu statystycznego do teoretycznego.

3. Podczas budowy serii interwałowych może to być, że wartość wariantu zbiega się z dokładnością z granicą interwału. Najlepiej to zrobić w tym przypadku w następujący sposób. Jeśli taki przypadek jest tylko jedną rzeczą, uważa się, że dana opcja z częstotliwością uderzyła w przedział, który jest bliżej środka serii interwałowych, jeśli istnieje kilka takich opcji, a następnie wszystkich atrybutów prawo z tych interwałów lub wszystkiego w lewo.

4. Po określeniu liczby interwałów i ich długości lokalizacja interwałów może być wykonana w inny sposób. Znajdź średnią arytmetyczną wszystkich rozważanych opcji h. por. i zbuduj pierwszy interwał w taki sposób, że ten średnia selektywna byłaby w pewnym przedziale. W ten sposób otrzymujemy interwał h. por. - 0,5. h.przed h. CF. + 0,5. h.. Następnie w lewo i prawy, dodając długość interwału, budujemy pozostałe odstępy do x. min ja. x. Max nie spadnie odpowiednio w pierwszych i ostatnich odstępach czasu.

5. Wiersze interwałowe z dużą liczbą odstępówek są wygodnie zarejestrowane pionowo, tj. Interwały nie są rejestrowane w pierwszej linii, ale w pierwszej kolumnie i częstotliwości (lub częstotliwości) w drugiej kolumnie.

Dane selektywne można uznać za wartość pewnej zmiennej losowej. H.. Wartość losowa ma swój własny dystrybucję prawa. Teorii prawdopodobieństw, wiadomo, że prawo dystrybucji dyskretnej zmiennej losowej można ustawić jako seria dystrybucji i ciągła - przy użyciu funkcji gęstości dystrybucji. Istnieje jednak uniwersalne prawo dystrybucyjne, które odbywa się dla dyskretnych i ciągłych zmiennych losowych. Prawo dystrybucyjne jest ustawione w formie funkcji dystrybucji. FA.(x.) = P.(X.<x.). W przypadku danych selektywnych można określić analog funkcji dystrybucji - funkcja dystrybucji empirycznej.

Dystrybucja statystyczna - Jest to zamówiony dystrybucja jednostek kruszywa w grupie danej funkcji zmiennej.
W zależności od podstawy, podstawę tworzenia wielu dystrybucji wyróżnia się atrybut i warianty dystrybucji.

Istnienie ogólnej funkcji jest podstawą tworzenia się kruszywa statystycznego, co stanowi wyniki opisu lub pomiaru ogólnych oznak obiektów badawczych.

Przedmiotem badań w statystykach zmieniają się (różne) cechy lub znaki statystyczne.

Rodzaje znaków statystycznych.

Atrybuty wywołuje rzędy dystrybucjizbudowany przez funkcje jakości. Atrybutywny - Jest to znak, który ma nazwę (na przykład zawód: krawcowa, nauczyciel itp.).
Numer dystrybucyjny jest wykonany w postaci tabel. W zakładce. 2.8 przedstawia numer atrybutu dystrybucji.
Tabela 2.8 - Dystrybucja rodzajów pomocy prawnej przewidzianej prawnikom obywatelom jednego z regionów Federacji Rosyjskiej.

Seria waratyjna - Są to wartości funkcji (lub interwałów wartości) i ich częstotliwości.
Variatycjonal Series Call rzędy dystrybucjizbudowany na zasadzie ilościowej. Każda seria wariacyjnego składa się z dwóch elementów: opcji i częstotliwości.
Opcje są uważane za oddzielne wartości funkcji, które zajmuje w wierszu zmienności.
Częstotliwości są liczbą poszczególnych wariantów lub każdej grupy serii zmienności, tj. Są to liczby pokazujące, jak często znaleziono pewne opcje w wielu dystrybucji. Suma wszystkich częstotliwości określa liczbę całej całości, jego objętości.
Części nazywane są częstotliwościami wyrażonymi w frakcjach jednostki lub w procentach do wyniku. Odpowiednio, ilość częstotliwości jest równa 1 lub 100%. Rodzaj zmienności pozwala na rzeczywiste dane oceniające formę prawa dystrybucyjnego.

W zależności od charakteru zmienności rozróżniania funkcji seria dyskretna i interwałowa.
Przykładem dyskretnej serii wariacyjnej podano w tabeli. 2.9.
Tabela 2.9 - Dystrybucja rodzin w liczbie pomieszczeń zajmowanych w oddzielnych apartamentach w 1989 roku w Federacji Rosyjskiej.

W pierwszej kolumnie tabeli przedstawiono warianty dyskretnej serii zmienności, w drugim - częstotliwości zakresu zmienności są umieszczone, w wskaźnikach trzeciej - częstotliwości.

Seria waratyjna

W ogólnej populacji zbadano niektóre znak ilościowy. Losowo usuwa próbkę objętości n.Oznacza to, że liczba elementów próbkowania jest równa n.. Na pierwszym etapie wyprodukowanego przetwarzania statystycznego nośny próbki, tj. Numery zamawiania x 1, x 2, ..., x n Rosnąco. Każda obserwowana wartość x I.nazywa opcja. Częstotliwość m I. - Jest to liczba obserwacji wartości x I. W próbce. Częstotliwość względna (częstotliwość) w I.- Jest to stosunek częstotliwości m I.do objętości próbki n.: .
Podczas badania serii wariacyjnej stosuje również koncepcje zgromadzonej częstotliwości i zgromadzonej częstotliwości. Zostawiać x. Jakiś numer. Następnie liczba opcji , Wartości, których są mniej x.nazywa się zgromadzoną częstotliwością: dla x I n. Nazywa się, że zgromadzona częstotliwość w I max.
Funkcja nazywana jest dyskretnie zróżnicowana, jeśli jego pojedyncze wartości (opcje) różnią się od siebie do pewnej wartości skończonej (zwykle całkowitą). Wariatucjonalna seria takiego znaku nazywana jest dyskretnym wariacją.

Tabela 1. Ogólny widok dyskretnego zakresu częstotliwości wariacyjnej

Wartości podpisux I. x 1. x 2. x N.
Częstotliwośćm I. m 1. m 2. m n.

Znak nazywa się ciągle różnorodnością, jeśli jego wartości różnią się od siebie w dowolnej wartości, tj. Znak może podjąć dowolne wartości w pewnym przedziale. Ciągłe seria wariacyjnej dla takiej funkcji nazywana jest interwałem.

Tabela 2. Ogólny widok interwału zakresu częstotliwości wariacyjnej

Tabela 3. Graficzne obrazy serii wariacyjnej

RządWielokąt lub histogram.Funkcja dystrybucji empirycznej
Oddzielny
Interwał
Patrząc przez wyniki wykonywanych obserwacji, określ liczbę wartości opcji wpadł w każdy konkretny interwał. Zakłada się, że każdy interwał jest właścicielem jednego z jego celów: we wszystkich przypadkach pozostawionych (częściej), albo we wszystkich przypadkach, prawy, a częstotliwość lub częstotliwość pokazuje liczbę opcji ujętych w określonych granicach. Różnica a ja - a +1zwane odstępami częściowymi. Aby uprościć kolejne obliczenia, wariacje interwałowe można zastąpić konwencjonalnie dyskretną. W tym przypadku wartość środkowa jA.- Interwał jest podejmowany na opcję x I.i odpowiednia częstotliwość interwału m I. - dla częstotliwości tego interwału.
Dla graficznego obrazu serii zmienności, wielokąt, histogram, skumulowana krzywa i funkcja dystrybucji empirycznej jest najczęstsza.

W zakładce. 2.3 Przedstawiono 2,3 (grupa ludności rosyjskiej pod względem przychodu na mieszkańca w kwietniu 1994 r.) interwałowa seria wariacyjnego.
Wygodne wiersze dystrybucyjne do analizy grafiką, która pozwala ocenić i na formę dystrybucji. Podana jest wizualna idea charakteru zmiany zakresu zmienności częstotliwości wielokąt i histogram..
Wielokąt jest używany na obrazie dyskretnej serii wariacyjnej.
Pokaż na przykład graficznie dystrybucję funduszy mieszkaniowych według rodzaju apartamentów (tabela 2.10).
Tabela 2.10 - Dystrybucja pól mieszkalnej obszaru miejskiego według rodzaju apartamentów (dane warunkowe).


Figa. Dystrybucja wielokątnego magazynu mieszkaniowego


Na osi rzędnej, nie tylko wartości częstotliwości, ale można zastosować częstotliwości serii zmienności.
Histogram jest akceptowany dla obrazu interwałowej serii wariacyjnej. Podczas konstruowania histogramu na osi odciętej, rozmiar odstępów jest zdeponowany, a częstotliwości są przedstawione przez prostokąty zbudowane w odpowiednich odstępach czasu. Wysokość kolumn w przypadku równych odstępów powinna być proporcjonalna do częstotliwości. Histogram jest wykresem, na którym wiersz jest przedstawiony w postaci zanieczyszczonej.
Pokażę zakres dystrybucji interwału graficznego podanego w tabeli. 2.11.
Tabela 2.11 - Dystrybucja rodzin w wielkości przestrzeni mieszkalnej na osobę (liczby warunkowe).
N p / n Grupy rodzin w wielkości przestrzeni mieszkalnej na osobę Liczba rodzin z danym salonem Skumulowana liczba rodzin
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
CAŁKOWITY 115 ----


Figa. 2.2. Dystrybucja histogramów rodzin w rozmiarze przestrzeni mieszkalnej na osobę


Korzystanie z gromadzonych danych serii (Tabela 2.11), Build kumulacyjna dystrybucja.


Figa. 2.3. Cumulating dystrybucja rodzin w wielkości przestrzeni mieszkalnej na osobę


Wizerunek wariatycznego rzędu w postaci kumuluszów jest szczególnie skuteczny dla serii wariacyjnej, których częstotliwości są wyrażone w frakcjach lub procentach do sumy częstotliwości wiersza.
Jeśli z graficznym wizerunkiem serii wariacyjnej w formie kumuluje, aby zmienić oś, a następnie dostaniemy ogiva.. Na rys. 2.4 przedstawia nieuczciwość na podstawie tabeli danych. 2.11.
Histogram może być przekształcony w wielokąt dystrybucyjny, jeśli znajdziesz środek boków prostokątów, a następnie podłączyć te punkty za pomocą linii prostych. Powstały wielokąt dystrybucyjny jest pokazany na FIG. 2.2 przerywana linia.
Podczas konstruowania histogramu rozkładu zakresu zmienności z nierównymi odstępami wzdłuż osi rzędnej nie jest stosowane częstotliwości, ale gęstość dystrybucji funkcji w odpowiednich odstępach czasu.
Gęstość dystrybucji jest częstotliwością obliczoną na szerokość jednostki interwału, tj. Ile jednostek w każdej grupie uwzględniono jednostkę wielkości interwału. Przykład obliczania gęstości rozkładu przedstawiono w tabeli. 2.12.
Tabela 2.12 - Dystrybucja przedsiębiorstw według liczby zatrudnionych (dane warunkowe)
N p / n Grupy przedsiębiorstw w liczbie zatrudnionych, ludzie Liczba przedsiębiorstw Wielkość interwału, ludzie Gęstość dystrybucji
ALE 1 2 3=1/2
1 Do 20. 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
CAŁKOWITY 147 ---- ----

Graficzny obraz serii wariacyjnej może być również stosowany. krzywa skumulowana. Z pomocą kumuluje (sumy krzywej) przedstawiono szereg zgromadzonych częstotliwości. Skumulowane częstotliwości są określane przez spójne podsumowanie częstotliwości w grupach i pokazują, ile jednostek zestawu ma wartości atrybutu nie więcej niż rozważana wartość.


Figa. 2.4. Rogue dystrybucja rodzin w wielkości przestrzeni mieszkalnej na osobę

Podczas konstruowania kumuluje serii odmianowych odstępów wzdłuż osi odcięcia, warianty rzędu są przełożone, a nagromadzone częstotliwości są gromadzone wzdłuż osi.

Ciągła seria wariacyjnego

Ciągła seria wariacyjna - seria zbudowana na podstawie ilościowej cechy statystycznej. Przykład. Średni czas trwania chorób skazanych (dni na osobę) w okresie jesienno-zimowym w bieżącym roku wyniosły:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

Rosyjska Akademia Gospodarki Narodowej i Publiczna Służba Pod Prezesem Federacji Rosyjskiej

Oryol Branch.

katedra Matematyki i Metody matematyczne w zarządzaniu

Niezależna praca

Matematyka

na temat "Seria wariacyjna i jego cechy"

dla studentów pełnoetatowego Departamentu Wydziału "Ekonomia i zarządzanie"

wskazówki szkoleniowe "Zarządzanie personelem"


Cel pracy:Opanowanie koncepcji statystyk matematycznych i przyjęć podstawowych przetwarzania danych.

Przykład rozwiązywania typowych zadań.

Zadanie 1.

Przez ankietę uzyskano następujące dane ():

1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

Potrzeba:

1) Wykonaj serię wariacyjną (statystyczna dystrybucja próbki), przed piszącym w rankingowej dyskretnej liczbie opcji.

2) Zbuduj wielokąt i cumulat.

3) Utwórz szereg dystrybucji częstotliwości względnych (częstotliwości).

4) Znajdź główne właściwości numeryczne serii wariacyjnej (stosować uproszczone wzory na ich pobyt): a) średnią arytmetykę, b) mediana Mnie. i moda Mo., c) dyspersja s 2., d) wtórne odchylenie kwadratowe S., e) współczynnik zmienności V..

5) Wyjaśnij znaczenie uzyskanych wyników.

Decyzja.

1) Do kompilacji zgraniony dyskretną liczbę opcji Uporządkuj dane odpytywania w rozmiarze i umieść je w kolejności rosnącej.

0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5 6 6 6 7 7.

Wykonujemy serię wariacyjną, pisanie w pierwszym wierszu tabeli obserwowanych wartości (opcje), aw drugiej częstotliwości odpowiadają im (Tabela 1)

Tabela 1.

2) Wielokąt częstotliwości jest uszkodzony punkt łączący ( x I.; n I.), jA.=1, 2,…, m.gdzie m. X..

Będę przedstawić wielokąt częstotliwości serii wariacyjnej (rys. 1).

Rys. 1. Częstotliwość wielokąt

Krzywa skumulowana (Cumulat) dla dyskretnego zakresu zmienności reprezentuje uszkodzony punkt łączący ( x I.; n I H.), jA.=1, 2,…, m..

Znajdź nagromadzone częstotliwości n I H. (Skumulowana częstotliwość pokazuje, ile opcji obserwowano za pomocą znaku znaku mniejszego h.). Wartości znalezione w trzecim wierszu tabeli 1.



Konstruujemy kumulatory (rys. 2).

Rys. 2. Cumulat.

3) Znajdziemy względne częstotliwości (częstotliwości), gdzie, gdzie, gdzie m. - liczba różnych objawów funkcji X.które będziemy obliczyć z taką samą dokładnością.

Piszemy szereg dystrybucji częstotliwości względnych (częstotliwości) w formie tabeli 2

Tabela 2

4) Znajdujemy główne cechy numeryczne serii wariacyjnej:

a) środkowy arytmetyka znaleziona przy użyciu uproszczonej formuły:

,

gdzie - opcje warunkowe

Położyć z\u003d 3 (jedna ze średnich zaobserwowanych wartości), k.\u003d 1 (różnica między dwiema sąsiednimi opcjami) i wykonuje obliczoną tabelę (Tabela 3).

Tabela 3.

x I. n. JA. u I. u ja u 2 n I
-3 -12
-2 -26
-1 -14
Suma -11

Potem średnia arytmetyka

b) mediana Mnie. Seria odmianowa nazywana jest wartością atrybutu, która zbliża się do środka rankingowej rzędu obserwacji. Ten dyskretny zakres zmienności zawiera równą liczbę członków ( n.\u003d 80) Oznacza to, że mediana jest równa połowie środka dwóch środkowych opcji.

Modoy. Mo. Zakres zmienności nazywa się opcją, do której odpowiada najwyższą częstotliwość. Dla tej serii wariacyjnej najwyższej częstotliwości N. Max \u003d 24 spełnia opcję h. \u003d 3, to moda Mo.=3.

c) dyspersja s 2.który jest miarą rozpraszania możliwych wartości wskaźnika X. Około średniej znajdziemy przy użyciu uproszczonej formuły:

gdzie u I. - Opcje warunkowe.

Obliczenia pośrednie doprowadzają również do tabeli 3.

Następnie dyspersja

d) wtórne odchylenie kwadratowe s. Znajdź według formuły:

.

e) współczynnik zmienności V.: (),

Współczynnik zmienności jest niezmierzoną wartością, dlatego nadaje się do porównania rozpraszania serii wariacyjnej, których opcje mają różne wymiary.

Współczynnik zmienności

.

5) Znaczenie uzyskanych wyników jest to, że wartość charakteryzuje średni znak X. W ramach rozpatrywanego próbki, że średnia wartość wynosiła 2,86. Średnie odchylenie kwadratowe s. opisuje bezwzględny rozproszenie wartości wskaźnika X. Iw tym przypadku wynosi s. ≈ 1.55. Współczynnik zmienności V. charakteryzuje względną zmienność wskaźnika X.Oznacza to, że względny rozproszony wokół jego średniej wartości iw takim przypadku jest.

Odpowiedź: ; ; ; .

Zadanie 2.

Istnieją następujące dane dotyczące własnego kapitału 40 największych banków w Rosji Centralnej:

12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

Potrzeba:

1) Buduj Varilitariies.

2) Oblicz średnię selektywną i selektywną dyspersję

3) Znajdź średni odchylenie kwadratowe i współczynnik zmienności.

4) Zbuduj histogram częstotliwości dystrybucji.

Decyzja.

1) Wybierz dowolną liczbę odstępów, na przykład, 8. Następnie szerokość interwału:

.

Zróbmy tabelę obliczeniową:

Opcja interwałowa x k -x k +1 Częstotliwość, n I. Przedział środkowy x I. Warunkowa opcja i ja. i ja i ja. 2 n I. (i i +.1) 2 N I.
10 – 25 17,5 – 3 – 12
25 – 40 32,5 – 2 – 10
40 – 55 47,5 – 1 – 11
55 – 70 62,5
70 – 85 77,5
85 – 100 92,5
100 – 115 107,5
115 – 130 122,5
Suma – 5

Jako fałszywe zero wybrano wartość c \u003d.62.5 (Ta opcja znajduje się w przybliżeniu w środku serii wariacyjnej) .

Opcje warunkowe są określane przez formułę

Przykład rozwiązywania prac testowych na statystykach matematycznych

Zadanie 1.

Wstępne dane : Uczniowie pewnej grupy składającej się z 30 osób przekazywali egzamin na kursie informatycznym. Szacunki uzyskane przez studentów tworzą kolejną liczbę numerów:

I. Zrób serię wariacyjną

m. x.

w. x.

m. x. nack.

w. x. nack.

CAŁKOWITY:

II. Graficzna reprezentacja informacji statystycznych.

III. Właściwości numeryczne próbki.

1. Średnia arytmetyka

2. Średnia geometryczna

3. Moda

4. Mediana.

222222333333333 | 3 34444444445555

5. Selektywna dyspersja

7. Cameffitt of Vluition

8. Asmetry.

9. Współczynnik asymetrii

10. Nadmiar

11. Współczynnik nadzoru

Zadanie 2.

Wstępne dane : Uczniowie niektórych grupy napisali prace testowe ukończenia studiów. Grupa składa się z 30 osób. Studenci zdobyli punkty tworzą następującą liczbę liczb

Decyzja

I. Ponieważ znak akceptuje wiele różnych wartości, wtedy skonstruujemy interwałową serię wariacyjną. Aby to zrobić, najpierw ustaw rozmiar interwału h.. Używamy Formuły Stardgera

Zróbmy skalę odstępówek. Jednocześnie, dla górnej granicy pierwszego interwału, kwota określona przez wzór:

Górne granice kolejnych odstępów określają następującą powtarzalną formułę:

, następnie

Budowa skali wykończenia przedziałów, ponieważ górna granica następnego interwału stała się większa lub równa maksymalnej wartości próbkowania
.

II. Wyświetlanie graficzne serii Variatyoral Interval

III. Charakterystyka numeryczna próbki

Aby określić właściwości liczbowe próbki, będzie tabelą pomocniczą

Suma:

1. Średnia arytmetyka

2. Średnia geometryczna

3. Moda

4. Mediana.

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Selektywna dyspersja

6. Selektywne odchylenie standardowe

7. Cameffitt of Vluition

8. Asmetry.

9. Współczynnik asymetrii

10. Nadmiar

11. Współczynnik nadzoru

Zadanie 3.

Stan: schorzenie : Cena podziału skali amperomierza wynosi 0,1 A. Odczyty są zaokrąglone do najbliższego całego podziału. Znajdź szansę, że błąd przekracza 0,02 A.

Decyzja.

Błąd zaokrąglania odliczania można uznać za zmienną losową H.który jest równomiernie rozprowadzany w przedziale między dwoma sąsiednimi całymi działami. Gęstość jednolitej dystrybucji

,

gdzie
- Długość interwału, w jakiej możliwe wartości są zawierane H.; Poza tym interwałem
W tym problemie długość interwału, w jakiej możliwe wartości zostaną zawarte H.wynosi 0,1, więc

Błąd odniesienia przekracza 0,02, jeśli jest w przedziale (0,02; 0,08). Następnie

Odpowiedź: r.=0,6

Zadanie 4.

Wstępne dane: Oczekiwanie matematyczne i odchylenie standardowe funkcji normalnie rozproszonej H. odpowiednio 10 i 2. Znajdź prawdopodobieństwo wyniku testu H. podejmie wartość zawartą w przedziale (12, 14).

Decyzja.

Używamy formuły.

I częstotliwości teoretyczne.

Decyzja

Dla X jego matematycznego oczekiwania m (x) i dyspersji D (X). Decyzja. Znajdź funkcję dystrybucji F (x) zmiennej losowej ... Błąd próbkowania próbek). Makijaż wariacyjny rząd Szerokość interwałowa. będzie: Dla każdej wartości rząd Oblicz, ile ...

  • Rozwiązanie: równanie z zmiennymi oddzielającymi

    Decyzja

    W formie do znalezienia prywatnego rozwiązania niejednorodne równanie makijaż System rozwiązuje wynikowy system ...; +47; +61; +10; -osiem. Budować interwał wariacyjny rząd. Daj statystyczne szacunki średniej wartości ...

  • Rozwiązanie: Oblicz łańcuch i podstawowe zyski absolutne, stopy wzrostu, wskaźniki wzrostu. Uzyskane wartości zostaną zredukowane do tabeli 1

    Decyzja

    Wielkość produkcji. Decyzja: Przedział średniego arytmetycznego wariacyjny rząd Jest obliczany w następujący sposób: dla ... Błąd limitu wyboru z prawdopodobieństwem 0,954 (t \u003d 2) będzie: Δ W \u003d T * μ \u003d 2 * 0,0146 \u003d 0,02927 Określ granice ...

  • Decyzja. Znak

    Decyzja

    O doświadczeniu pracy, którego i składający się próba. Medium na przykładowym doświadczeniu ... dnia roboczego tych pracowników i składający się próba. Średni czas trwania próbki ... 1,16, poziom istotności α \u003d 0,05. Decyzja. Wariacyjny rząd Ta próbka ma formularz: 0.71 ...

  • Praca programowa na biologii dla kompilatora 10-11 klasy: PolyCarpova S. in

    Praca programowa

    Najprostsze schematy przejścia »5 L.r. " Decyzja Podstawowe zadania genetyczne »6 L.r. " Decyzja Podstawowe zadania genetyczne »7 L.r. "..., 110, 115, 112, 110. Makijaż wariacyjny rząd, remis wariacyjny Krzywa, znajdź średni rozmiar znaku ...

  • Specjalne miejsce w analizie statystycznej należy do definicji średniego poziomu badanego znaku lub zjawiska. Średni poziom charakterystyczny mierzy się średnich wartości.

    Średnia wartość charakteryzuje ogólny poziom ilościowy cechy w ramach studiów i jest właściwością grupową agregatu statystycznego. Poziomy IT, osłabia losowe odchylenia indywidualnych obserwacji w taki czy inny sposób i podkreśla główną, typową własność studiowanego znaku.

    Średnie zmienne są szeroko stosowane:

    1. Aby ocenić stan zdrowia ludności: charakterystyki rozwoju fizycznego (wzrost, waga, obwód klatki piersiowej itp.), Wykrywanie częstości występowania i czas trwania różnych chorób, analiza wskaźników demograficznych (naturalny ruch ludności, średnia Czas trwania nadchodzącego życia, reprodukcji populacji, średniej populacji itp.).

    2. Badanie działalności instytucji medycznych i profilaktycznych, personelu medycznego i ocenić jakość swojej pracy, planowanie i określenie potrzeb ludności w różnych rodzajach opieki medycznej (średnia liczba odwołań lub wizyt na rezydenta rocznie, Średni czas trwania pobytu pacjenta w szpitalu, średni czas trwania badania pacjent, średnie bezpieczeństwo lekarzy, łuki itp.).

    3. Charakteryzowanie stanu sanitarnego i epidemiologicznego (średnie odkurzanie powietrza w warsztacie, średnia powierzchnia na osobę, średnie normy zużycia białek, tłuszczów i węglowodanów itp.).

    4. Określenie wskaźników medycznych i fizjologicznych, zwykle i patologii, podczas przetwarzania danych laboratoryjnych w celu ustalenia niezawodności wyników badania próbki w badaniach społeczno-higienicznych, klinicznych, eksperymentalnych.

    Obliczanie średnich wartości opiera się na serii wariacyjnej. Seria waratyjna - Jest to jednorodny statystyczny zestaw w relacji jakościowej, których niektóre jednostki charakteryzują różnice ilościowe w badanym atrybucie lub zjawisku.

    Odmiana ilościowa może być dwa typy: zakończone (dyskretne) i ciągły.

    Funkcja nieciągła (dyskretna) jest wyrażona tylko przez liczbę całkowitą i nie może mieć żadnych wartości pośrednich (na przykład liczby wizyt, populacji ludności, liczby dzieci w rodzinie, ciężkości choroby w punktach itp .).

    Ciągły znak może przyjmować dowolne wartości w pewnych limitach, w tym ułamkowym i wyraża się tylko w przybliżeniu (na przykład, waga - dla dorosłych może być ograniczona do kilogramów, a dla noworodków - gramów; wzrost, ciśnienie krwi, czas spędzony na Recepcja pacjenta itp.).



    Wartość cyfrowa każdej indywidualnej funkcji lub zjawiska zawarta w zakresie zmienności nazywana jest opcją i jest wskazana przez list V. . W literaturze matematycznej są na przykład inne oznaczenia x. lub y.

    Rodzaj zmienności, w którym każda opcja jest określona raz, jest nazywana prostym. Takie wiersze są używane w większości zadań statystycznych w przypadku przetwarzania danych komputerowych.

    Wraz ze wzrostem liczby obserwacji, z reguły istnieją opcja powtarzalnych wartości. W tym przypadku jest tworzony zgrupowane wariacjeW przypadku wskazywania liczby powtórzeń (częstotliwość jest wskazana literą " r. »).

    Rainted Varilitaries. Składa się z opcji ułożonej w kolejności rosnącej lub malejącym. Zarówno proste i zgrupowane wiersze mogą być skompilowane z rankingiem.

    Interwałowa seria wariacyjnego Uzupełnij, aby uprościć kolejne obliczenia wykonywane bez użycia komputera, z bardzo dużą liczbą jednostek obserwacyjnych (ponad 1000).

    Ciągła seria wariacyjnego Obejmuje wartości opcji, która może być wyrażona przez dowolne wartości.

    Jeśli w serii wariacyjnej wartości atrybutu (opcji) podano w postaci poszczególnych numerów określonych, wtedy taki numer zwany oddzielny.

    Całkowite cechy znaków, które znajdują się odzwierciedlenie w seriach wariacyjnej, są średnie wartości. Wśród nich są najbardziej używane: średnia wartość arytmetyczna M,moda Mo.i Mediana. Mnie.Każda z tych cech jest pierwotnie. Nie mogą zastąpić się nawzajem i tylko w krumieniu całkiem w pełni iw skompresowanej formie są cechy serii wariacyjnej.

    Modoy. (Mo) zadzwoń do wartości najczęstszych opcji.

    Mediana (Mnie) - Jest to wartość opcji dzielących rolę rankingową w połowie (po każdej stronie mediany jest połowa opcji). W rzadkich przypadkach, gdy istnieje symetryczna seria wariacyjnego, mod i mediana są równe wzajemnie i pokrywają się z wartością średniej arytmetyki.

    Najbardziej typową cechą wartości jest opcja jest Środkowy arytmetyka Ilość ( M. ). W literaturze matematycznej jest to wskazane .

    Wartość arytmetyczna środkowa (M, ) - Jest to całkowita cecha ilościowa pewnego znaku badanych zjawisk stanowiących jakościowo jednorodnego zagregowania statystycznego. Odróżnić średnią arytmetykę prostą i ważoną. Średnia arytmetyka jest prosta, oblicza się dla prostej serii wariacyjnej, podsumowując cały wariant i podzielenie tej kwoty dla całkowitej liczby opcji zawartych w tym zakresie zmienności. Obliczenia prowadzone są według wzoru:

    gdzie: M. - Średnia arytmetyka prosta;

    Σ V. - opcja kwoty;

    n. - liczba obserwacji.

    W zgrupowanej serii wariacyjnej jest określona średnia arytmetyka. Formuła jego obliczenia:

    gdzie: M. - średnia ważona arytmetyczna;

    Σ Vp. - kwota opcji produktów według ich częstotliwości;

    n. - liczba obserwacji.

    Dzięki dużej liczbie obserwacji w przypadku obliczeń ręcznych można zastosować metodę momentów.

    Średnia arytmetyka ma następujące właściwości:

    · Ilość opcji odchylenia ze średniej ( Σ rE. ) równa zero (patrz tabela 15);

    · Po pomnożeniu (podział) wszystkich opcji na tym samym współczynniku (dzielnik), średnia arytmetyka jest mnożona (podzielona) na ten sam czynnik (dzielnik);

    · Jeśli dodasz (odjąć) do wszystkich wariantów, tej samej liczby, średnie wzrasta arytmetyczne (zmniejsza się) do tego samego numeru.

    Średnie wartości arytmetyczne, podjęte przez siebie, bez uwzględnienia zmienności serii, z których są obliczane, mogą nie odzwierciedlać właściwości serii wariacyjnej, zwłaszcza gdy potrzebne jest porównanie z innymi mediami. Prawidłowe medium można uzyskać z rzędu o różnych stopniach rozpraszania. Im bliżej siebie niektóre opcje w ich charakterystyce ilościowej, tym mniej rozrzucanie (zmienność, zmienność) Liczba, tym bardziej typowa dla jego średnia.

    Główne parametry umożliwiające ocenę zmienności funkcji są:

    · Zakres;

    · Amplituda;

    · Średnie odchylenie kwadratowe;

    · Współczynnik zmienności.

    W przybliżeniu co do sekcji znaku można ocenić według zakresu i amplitudy serii wariacyjnej. Zakres Wskazuje maksymalne opcje (V Max) i minimalne opcje (V min) w rzędzie. Amplituda (A M) jest różnicą tych opcji: A M \u003d v Max - V min.

    Główna, ogólnie przyjęta miara odmian wahań dyspersja (RE. ). Jednak najczęściej używany bardziej wygodny parametr, obliczony na podstawie dyspersji - średnie odchylenie kwadratowe ( σ ). Bierze pod uwagę wielkość odchylenia ( rE. ) Każde warianty zakresu zmienności od jego środkowego arytmetycznego ( d \u003d v - m ).

    Ponieważ opcja odchyleń ze średniej może być pozytywna i negatywna, a następnie podsumowując, podają wartości "0" (s d \u003d 0.). Aby tego uniknąć, wartości odchyleń ( rE.) Na początku drugiego stopnia i są uśrednione. Zatem dyspersja serii zmienności jest przeciętnym kwadratem opcji odchyleń z środkowego arytmetycznego i jest obliczana przez wzoru:

    Jest to najważniejsza cecha zmienności i służy do obliczania wielu kryteriów statystycznych.

    Ponieważ dyspersja wyraża się przez kwadrat odchyleń, jego wartość nie może być stosowana w porównaniu ze średnim arytmetycznym. Dla tych celów dotyczy Średnie odchylenie kwadratowektóry jest wskazany przez znak "Sigma" ( σ ). Charakteryzuje średnią odchylenie całej zmiany zmienności od wartości środkowej arytmetycznej w tych samych jednostkach, co sama wartość środkowa, więc mogą być używane razem.

    Średnie odchylenie kwadratowe zależy od wzoru:

    Ta formuła jest stosowana z liczbą obserwacji ( n. ) więcej niż 30. Z mniejszą liczbą n. Średnia wartość odchylenia kwadratowa będzie miała błąd związany z wypornością matematyczną ( n. - jeden). W tym względzie można uzyskać bardziej dokładny wynik, biorąc pod uwagę takie przemieszczenie w wzorze obliczania odchylenia standardowego:

    odchylenie standardowe (s. ) - Jest to ocena odchylenia riconductical zmiennej losowej H. W odniesieniu do jego matematycznego oczekiwania na podstawie niewiarygodnego oszacowania jego dyspersji.

    W wartościach N. \u003e 30 średnie odchylenie kwadratowe ( σ ) i odchylenie standardowe ( s. ) będzie taki sam ( Σ \u003d S. ). Dlatego w większości praktycznych korzyści kryteria są uważane za zróżnicowane. W programie Excel obliczenie odchylenia standardowego można wykonać za pomocą funkcji \u003d standollone (zakres). I w celu obliczenia średniego odchylenia kwadratowego, wymagane jest utworzenie odpowiedniej formuły.

    Średnie odchylenie kwadratowe lub standardowe umożliwia określenie, jak ważne są wartości znaków mogą różnić się od średniej wartości. Przypuśćmy, że istnieją dwa miasta o tej samej średniej temperaturze dziennej w lecie. Jeden z tych miast znajduje się na wybrzeżu, a drugi na kontynencie. Wiadomo, że w miastach znajdujących się na wybrzeżu różnice w temperaturze dziennej są mniejsze niż miasta znajdujące się w kontynencie. Dlatego średnie odchylenie kwadratowe temperatury w ciągu dnia w nadmorskim mieście będzie mniejsze niż drugie miasto. W praktyce oznacza to, że średnia temperatura powietrza każdego konkretnego dnia w mieście położona na kontynencie będzie się trudniejsza od średniej wartości niż w mieście na wybrzeżu. Ponadto, odchylenie standardowe pozwala oszacować możliwe odchylenia temperatury ze średniej z wymaganym poziomem prawdopodobieństwa.

    Zgodnie z teorią prawdopodobieństwa, w fenomenach złożonych do normalnego prawa dystrybucji pomiędzy wartościami średniego arytmetycznego, średniego odchylenia kwadratowego i opcji istnieje ścisła zależność ( rządzi trzej sigm). Na przykład 68,3% wartości funkcji zmienności znajduje się w objęciu m ± 1 σ , 95,5% - w granicach M ± 2 σ i 99,7% - w granicach M ± 3 σ .

    Wielkość średniego odchylenia kwadratowego pozwala ocenić charakter jednorodności serii wariacyjnej i badanej grupy. Jeśli wielkość średniego odchylenia kwadratowego jest niewielka, wskazuje na to wystarczająco dużą jednorodność z badań na fenomen. Średni arytmetyczny w tym przypadku należy uznać za dość charakterystyczne dla tej serii wariacyjnej. Jednak zbyt małe sigma myśli o sztucznym wyborze obserwacji. Z bardzo dużym Sigma, średnia arytmetyka w mniejszym stopniu charakteryzuje serię wariacyjną, co wskazuje na znaczną zmienność badanego charakteru lub zjawiska lub heterogeniczności w ramach badania grupy. Jednakże porównanie wielkości średniego odchylenia kwadratowego jest możliwe tylko dla objawów tego samego wymiaru. Rzeczywiście, jeśli porównujesz różnorodność wagi noworodków i dorosłych, zawsze otrzymujemy wyższe wartości Sigma u dorosłych.

    Porównanie zmienności znaków różnych wymiarów można wykonać za pomocą zmiana współczynnika. Wyraża różnorodność jako procent średniej wartości, co umożliwia porównanie różnych znaków. Współczynnik zmienności w literaturze medycznej jest wskazywany przez znak " Z "I w matematycznym" v."I obliczony według wzoru:

    Wartości współczynnika zmienności mniejszej niż 10% wskazują na małe rozpraszanie, od 10 do 20% - o średnio, ponad 20% - o silnym rozpraszaniu opcji wokół środkowej arytmetycznej.

    Średnia wartość arytmetyczna jest zwykle obliczana na podstawie selektywnego zestawu danych. Dzięki wielokrotnym badaniom, pod wpływem przypadkowych zjawisk, średnia arytmetyka może się zmienić. Wynika to z faktu, że jest zbadany, z reguły, tylko część możliwych jednostek obserwacji, czyli selektywnego kruszywa. Informacje o wszystkich możliwych jednostkach reprezentujących badane zjawisko można uzyskać podczas badania całej ogólnej populacji, co nie zawsze jest możliwe. Jednocześnie, w celu uogólnienia danych eksperymentalnych, wartość średnia w ogólnej populacji jest interesująca. Dlatego w celu sformułowania ogólnego konkluzji na temat badanego zjawiska, wyniki uzyskane na podstawie selektywnego kruszywa muszą zostać przeniesione do ogólnego zestawu metod statystycznych.

    Aby określić stopień zbieżności badania próbki i ogólnej populacji, konieczne jest ocenę wielkości błędu, który nieuchronnie występuje podczas selektywnej obserwacji. Ten błąd jest nazywany " Błąd reprezentatywny"Lub" Błąd środkowy arytmetyczne ". W rzeczywistości różnica między średniej uzyskanymi w selektywnej obserwacji statystycznej oraz podobnych wartości, które zostaną uzyskane przy ciągłym badaniu tego samego obiektu, tj. Podczas badania ogólnej populacji. Ponieważ średnia selektywna jest wartością losową, taka prognoza jest wykonywana przy akceptowalnym prawdopodobieństwie badaczowi. W badaniach medycznych jest co najmniej 95%.

    Błąd przedstawiający nie można mieszać z błędami referencyjnymi lub błędami uwagi (itd.), Które należy zmniejszyć do minimum za pomocą odpowiednich technik i narzędzi stosowanych w eksperymencie.

    Wielkość błędu reprezentatywności zależy zarówno na rozmiarze próbki, jak i zmienności spekomity. Im większa liczba obserwacji, tym bliżej próbki w kierunku ogólnej populacji i mniejszego błędu. Im bardziej zmieniający znak, tym większa wartość błędu statystycznego.

    W praktyce, aby określić błąd reprezentatywności w serii wariacyjnej wykorzystuje następujący wzór:

    gdzie: m. - Błąd przedstawiciela;

    σ - wtórne odchylenie kwadratowe;

    n. - liczba obserwacji w próbce.

    Z formuły widać, że rozmiar średniego błędu jest bezpośrednio proporcjonalny do średniego odchylenia kwadratowego, tj. Zróżnicowanie badanego przypisania i odwrotnie proporcjonalne do korzenia kwadratu od liczby obserwacji.

    Podczas wykonywania analizy statystycznej, w oparciu o obliczanie względnych wartości, budowa liczby zmienności nie jest obowiązkowa. Jednocześnie definicja średniego błędu dla względnych wskaźników można wykonać na uproszczonej formule:

    gdzie: R.- wielkość wskaźnika względnego, wyrażona w procentach, ppm itp.;

    p. - ilość, odwrotność p i wyrażona jako (1 p), (100 p), (1000-P) itp., W zależności od podstawy, na której obliczany jest wskaźnik;

    n. - liczba obserwacji w kruszywie selekcyjnej.

    Jednak określona formuła obliczania błędu reprezentatywności dla wartości względnych może być stosowana tylko w przypadku, gdy wartość wskaźnika jest mniejsza niż jej podstawa. W niektórych przypadkach obliczenie intensywnych wskaźników nie jest przestrzegane takim warunkiem, a wskaźnik może być wyrażony przez liczbę więcej niż 100% lub 1000%. W takiej sytuacji znajduje się seria koniunkcyjna i obliczanie błędu przedstawiciela według wzoru dla średnich wartości opartych na środkowym odchyleniu kwadratowym.

    Przewidywanie wartości średniego arytmetyki w ogólnej populacji przeprowadza się wraz ze wskazaniem dwóch wartości - minimum i maksimum. Te ekstremalne wartości możliwych odchyleń, w których wymagana jest pożądana średnia wartość ogólnej populacji, są nazywane " Borders zaufania».

    Tłumaczenia teorii prawdopodobieństwa udowodniono, że w normalnym rozkładzie funkcji z prawdopodobieństwem 99,7%, ekstremalne wartości średnie odchylenia nie będą więcej niż wielkość potrójonego błędu reprezentatywności ( M. ± 3. m. ); 95,5% - nie więcej niż wartość podwójnego średniego błędu średniej wartości ( M. ± 2. m. ); 68,3% - nie więcej niż ilość jednego średniego błędu ( M. ± 1. m. ) (Rys. 9).

    P%

    Figa. 9. Gęstość prawdopodobieństwa normalnego rozkładu.

    Należy pamiętać, że powyższe oświadczenie jest dość tylko dla funkcji, która podlega normalnym prawie dystrybucji Gaussa.

    Większość badań eksperymentalnych, w tym w dziedzinie medycyny, wiąże się z pomiarami, których wyniki mogą wymagać prawie wszelkich wartości w danym przedziale, dlatego, z reguły, opisano model ciągłych zmiennych losowych. W tym względzie w większości metod statystycznych rozważane są ciągłe rozkłady. Jednym z takich dystrybucji, która ma zasadniczą rolę w statystykach matematycznych normalny lub Gaussian, dystrybucja.

    Jest to wyjaśnione przez wiele powodów.

    1. Przede wszystkim wiele obserwacji eksperymentalnych można pomyślnie opisać przy użyciu normalnego rozkładu. Należy natychmiast zauważyć, że nie ma przydzielających dystrybucji danych empirycznych, które byłyby w porządku z normalnym, ponieważ normalnie rozproszona wartość losowa od tego, co nigdy nie jest znalezione w praktyce. Jednak normalna dystrybucja jest bardzo często dobrze nadaje się jako przybliżenie.

    Niezależnie od tego, czy przeprowadza się pomiary wagi, wzrostu i innych parametrów fizjologicznych organizmu ludzkiego - wszędzie wyniki mają wpływ bardzo dużej liczby czynników losowych (przyczyn naturalnych i błędów pomiarowych). Ponadto, z reguły działanie każdego z tych czynników jest nieznaczne. Doświadczenie pokazuje, że wyniki w takich przypadkach będą rozprowadzane w przybliżeniu normalne.

    2. Wiele dystrybucji związanych z próbką losową, ze wzrostem tego ostatniego, przejdź do normy.

    3. Dystrybucja normalna jest dobrze nadaje się jako przybliżony opis innych ciągłych rozkładów (na przykład asymetryczny).

    4. Dystrybucja normalna ma wiele korzystnych właściwości matematycznych, pod wieloma względami zapewniającymi jego powszechne stosowanie w statystykach.

    Jednocześnie należy zauważyć, że istnieje wiele dystrybucji eksperymentalnych w danych medycznych, opis, którego model dystrybucji normalnej jest niemożliwe. Aby to zrobić, w statystykach opracowanych metodami, które nazywają się "nie-parametryczną".

    Wybór metody statystycznej, która nadaje się do przetwarzania danych konkretnego doświadczenia, musi być wykonana w zależności od przynależności do danych do normalnego prawa dystrybucyjnego. Sprawdzanie hipotezy o złożeniu znaku przez normalne prawo dystrybucyjne jest wykonywane przy użyciu histogramu dystrybucji częstotliwości (wykres), a także szereg kryteriów statystycznych. Pomiędzy nimi:

    Kryterium asymetrii ( b. );

    Kryterium sprawdzania Exscess ( sOL. );

    Kryteria Shapiro - Wilx ( W. ) .

    Analiza charakteru dystrybucji danych (nazywana jest również ważnością dystrybucji) prowadzona jest dla każdego parametru. Aby pewnie ocenić zgodność dystrybucji parametru przez normalne prawo, potrzebne są wystarczająco dużą liczbę jednostek obserwacyjnych (co najmniej 30 wartości).

    W przypadku dystrybucji normalnej kryteria asymetrii i ekscesów pobierają wartość 0. Jeśli dystrybucja zostanie przesunięta w prawo b. \u003e 0 (asymetria dodatnia), z b. < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона sOL. \u003d 0. Dla sOL. \u003e 0 Krzywa ostrej dystrybucji, jeśli sOL. < 0 пик более сглаженный, чем функция нормального распределения.

    Aby sprawdzić normalność przy kryterium Shapiro - Wilx, konieczne jest znalezienie znaczenia tego kryterium w tabelach statystycznych z wymaganym poziomem istotności i w zależności od liczby jednostek obserwacyjnych (stopni wolności). Załącznik 1. Hipoteza normalności jest odrzucana w małych wartościach tego kryterium, co do zasady, w. <0,8.

    Udostępnij znajomym lub zapisz dla siebie:

    Ładowanie...