Współczynnik korelacji równy 1 oznacza to. Statystyki i przetwarzanie danych w psychologii (ciąg dalszy)

"Statystyka

Statystyki i przetwarzanie danych w psychologii
(nieprzerwany)

Analiza korelacji

Podczas nauki korelacjespróbuj ustalić, czy istnieje jakiekolwiek połączenie między dwoma wskaźnikami w jednej próbce (na przykład między wzrostem a ciężarem dzieci lub między poziomem ILORAZ INTELIGENCJI.i wydajność szkoły) lub między dwiema różnymi próbkami (na przykład, przy porównaniu par bliźniąt), a jeśli to istnieje połączenie, to wzrost jednego wskaźnika towarzyszy wzrost (korelacja dodatnia) lub zmniejszenie (korelacja negatywna) .

Innymi słowy, analiza korelacji pomaga ustalić, czy możliwe jest przewidzenie możliwych wartości jednego wskaźnika, znając ilość drugiej.

Do tej pory analizując wyniki naszych doświadczeń w badaniu działania marihuany celowo zignorowaliśmy taki wskaźnik jako czas reakcji. Tymczasem interesujące byłoby sprawdzenie, czy istnieje połączenie między skutecznością reakcji a ich prędkością. Pozwoliłoby to na przykład, aby twierdzić, że osoba spowalnia, tym dokładniejsze i skuteczniej będzie jego działaniami i odwrotnie.

W tym celu można stosować dwie różne metody: metoda parametryczna do obliczania współczynnika anty-Purson (R) i obliczanie współczynnika korelacji szeregów Spirmen (R S), który jest stosowany do danych porządkowych, tj. Jest nie parametryczny. Jednak najpierw zrozumiemy, że taki współczynnik korelacji jest.

Współczynnik korelacji

Współczynnik korelacji jest wartością, która może się różnić w zależności od +1 do -1. W przypadku całkowitej korelacji dodatnich współczynnik ten jest plus 1, a przy kompletnym ujemnym - minus 1. Direct Line odpowiada wykresie przecięcia wartości każdej pary danych:

W przypadku, jeśli te punkty nie zostaną zbudowane w linii prostej i tworzą "chmurę", współczynnik korelacji w wartości bezwzględnej staje się mniejszy niż jednostka i jako ta chmura zaokrąglona jest zbliża się zero:

Jeśli współczynnik korelacji wynosi 0, obie zmienne są całkowicie niezależne od siebie.

W nauce humanitarnej korelacja jest uważana za silną, jeśli jego współczynnik wynosi powyżej 0,60; Jeśli przekracza 0,90, korelacja jest uważana za bardzo silna. Jednakże, aby dokonać wniosków na temat powiązań między zmiennymi, wielkość próbki ma ogromne znaczenie: niż próbka jest większa, tym droższa wartość współczynnika korelacji. Istnieją tabele o kluczowych wartościach współczynnika korelacji Brave-Pearson i Spearmana dla innej liczby stopni swobody (jest równa liczbie par mniej niż 2, tj. n-2). Tylko wtedy, gdy współczynniki korelacji są większe niż te krytyczne wartości, można je uznać za wiarygodne. Tak więc, aby współczynnik korelacji 0,70 był wiarygodny, nie mniej niż 8 par danych należy podjąć w analizie (h. \u003d N.-2 \u003d 6) Podczas obliczania R (patrz tabela 4 w dodatku) i 7 par danych (h \u003d n-2 \u003d5) Przy obliczaniu R S (tabela 5 w dodatku).

Chciałbym ponownie podkreślić, że istota tych dwóch współczynników jest nieco inna. Ujemny współczynnik R wskazuje, że wydajność jest najczęściej wyższa niż czas reakcji mniej, podczas gdy przy obliczaniu współczynnika R S, konieczne było sprawdzenie, czy szybsze testy zawsze reagują dokładniej, i wolniej - mniej dokładnie.

Współczynnik korelacji Brave-Pearson (R) - jest to wskaźnik etoparametryczny do obliczania średnich i standardowych odchyleń wyników dwóch wymiarów. Jednocześnie używają formuły (od różnych autorów może wyglądać inaczej)

gdzie σ. Xy -ilość danych z każdej pary;
n-liczba par;
X - Średnia dla danych zmiennych X;
Y. - Środek do zmiennej danych Y.
S x -
odchylenie standardowe dla dystrybucji x;
S y -
odchylenie standardowe dla dystrybucji w.

Współczynnik korelacji Spearmana (r S. ) - Jest to wskaźnik nie parametryczny, z którym próbują zidentyfikować relację między szeregami odpowiednich wartości w dwóch rzędach pomiarów.

Ten współczynnik jest łatwiejszy do obliczenia, ale wyniki są mniej dokładne niż w przypadku korzystania z R. Wynika to z faktu, że przy obliczaniu współczynnika Ducha należy użyć kolejności danych, a nie ich charakterystyki ilościowe i interwały między klasami.

Faktem jest, że przy użyciu współczynnika korelacji rangi Spirmen (Rs) sprawdzane jest tylko, czy ranking danych dla żadnej próbki jest taka sama jak w wielu innych danych dla tej próbki, parę połączoną z pierwszym (na przykład, Niezależnie od tego, czy uczniowie "rangi" przechodzą jak psychologia i matematyka, a nawet z dwoma różnymi nauczycielami psychologii?). Jeśli współczynnik jest blisko +1, oznacza to, że oba wiersze są praktycznie zbiegły, a jeśli ten współczynnik jest blisko -1, możemy porozmawiać o pełnym odwrotnym uzależnieniu.

Współczynnik r S.obliczyć według formuły

gdzie rE.- różnica między szeregami koniugatu oznak znaków (niezależnie od jego znaku) oraz liczbę par.

Zwykle ten test nie parametryczny jest używany w przypadkach, w których musisz dokonać pewnych wniosków interwałymiędzy danymi, ile o ich rangaa nawet gdy krzywe dystrybucji są zbyt asymetryczne i nie pozwalają na używanie kryteriów parametrycznych jako współczynnika R (w tych przypadkach konieczne jest włączenie danych ilościowych do porządkowania).

streszczenie

Przeglądamy więc różne parametryczne i nie parametryczne metody statystyczne stosowane w psychologii. Nasza recenzja była bardzo powierzchowna, a jego głównym zadaniem było to, że czytelnik zrozumie, że statystyki nie były tak straszne, jak się wydaje i wymaga głównie zdrowego rozsądku. Przypominamy, że dane "doświadczenia", z którymi zajmowaliśmy się tutaj, fikcyjne i nie mogą służyć jako podstawa do żadnych wniosków. Jednak taki eksperyment byłby kosztowny spędzić. Od tego czasu wybrano czysto klasyczną technikę, ta sama analiza statystyczna może być stosowana w różnych różnych eksperymentach. W każdym razie wydaje nam się, że przedstawiliśmy kilka głównych kierunków, które mogą być przydatne dla tych, którzy nie wiedzą, gdzie rozpocząć analizę statystyczną uzyskanych wyników.

Literatura

  1. Godfrau J.Czym jest psychologia. - M., 1992.
  2. Chatillon G.,1977. Statistique en Sciences Humaine, Trois-Rivieres, Ed. SMG.
  3. Gilbert n ..1978. Statystyczne, Montreal, Ed. Hrw.
  4. Moroney M.J.,1970. Comprender La Statistique, Verviers, Gerard i Cie.
  5. Siegel S.,1956. Statystyka nie parametryczna, Nowy Jork, MacGRAW-Hill Book Co.

Dodatek Tabela

Notatki.1) W przypadku dużych próbek lub poziomu znaczenia, mniej niż 0,05 powinno być skierowane do tabel w zakresie dodatków statystycznych.

2) Tabele wartości innych kryteriów innych niż parametryczne można znaleźć w specjalnych podręcznikach (patrz bibliografia).

Tabela 1. Wartości kryteriów t.Student
h. 0,05
1 6,31
2 2,92
3 2,35
4 2,13
5 2,02
6 1,94
7 1,90
8 1,86
9 1,83
10 1,81
11 1,80
12 1,78
13 1,77
14 1,76
15 1,75
16 1,75
17 1,74
18 1,73
19 1,73
20 1,73
21 1,72
22 1,72
23 1,71
24 1,71
25 1,71
26 1,71
27 1,70
28 1,70
29 1,70
30 1,70
40 1,68
¥ 1,65
Tabela 2. Wartości kryterium χ 2
h. 0,05
1 3,84
2 5,99
3 7,81
4 9,49
5 11,1
6 12,6
7 14,1
8 15,5
9 16,9
10 18,3
Tabela 3. Niezawodne wartości z
r. Z.
0,05 1,64
0,01 2,33
Tabela 4. Niezawodne wartości (krytyczne)
h \u003d (n-2) p \u003d.0,05 (5%)
3 0,88
4 0,81
5 0,75
6 0,71
7 0,67
8 0,63
9 0,60
10 0,58
11 0.55
12 0,53
13 0,51
14 0,50
15 0,48
16 0,47
17 0,46
18 0,44
19 0,43
20 0,42
Tabela 5. Niezawodne wartości (krytyczne) wartości r s
h \u003d (n-2) p \u003d.0,05
2 1,000
3 0,900
4 0,829
5 0,714
6 0,643
7 0,600
8 0,564
10 0,506
12 0,456
14 0,425
16 0,399
18 0,377
20 0,359
22 0,343
24 0,329
26 0,317
28 0,306

Podczas nauki korelacjespróbuj ustalić, czy istnieje jakiekolwiek połączenie między dwoma wskaźnikami w jednej próbce (na przykład między wzrostem a ciężarem dzieci lub między poziomem ILORAZ INTELIGENCJI.i wydajność szkoły) lub między dwiema różnymi próbkami (na przykład, przy porównaniu par bliźniąt), a jeśli to istnieje połączenie, to wzrost jednego wskaźnika towarzyszy wzrost (korelacja dodatnia) lub zmniejszenie (korelacja negatywna) .

Innymi słowy, analiza korelacji pomaga ustalić, czy możliwe jest przewidzenie możliwych wartości jednego wskaźnika, znając ilość drugiej.

Do tej pory analizując wyniki naszych doświadczeń w badaniu działania marihuany celowo zignorowaliśmy taki wskaźnik jako czas reakcji. Tymczasem interesujące byłoby sprawdzenie, czy istnieje połączenie między skutecznością reakcji a ich prędkością. Pozwoliłoby to na przykład, aby twierdzić, że osoba spowalnia, tym dokładniejsze i skuteczniej będzie jego działaniami i odwrotnie.

W tym celu można stosować dwie różne metody: metoda parametryczna do obliczania dzielnego współczynnika - Pearson (R)i obliczanie współczynnika korelacji szeregów alkoholowych (R. s. ), który jest stosowany do danych porządkowych, tj. Jest nie parametryczny. Jednak najpierw zrozumiemy, że taki współczynnik korelacji jest.

Współczynnik korelacji

Współczynnik korelacji jest wartością, która może się różnić w zależności od -1 do 1. W przypadku kompletnej korelacji dodatnich, współczynnik ten jest plus 1, a przy kompletnym ujemnym - minus 1. Linia prosta przechodzi przez punkty przecięcia każdej pary Dane:

Zmienna

W przypadku, jeśli te punkty nie zostaną zbudowane w linii prostej i tworzą "chmurę", współczynnik korelacji w wartości bezwzględnej staje się mniejszy niż jednostka i jako ta chmura zaokrąglona jest zbliża się zero:

Jeśli współczynnik korelacji wynosi 0, obie zmienne są całkowicie niezależne od siebie.

W nauce humanitarnej korelacja jest uważana za silną, jeśli jego współczynnik wynosi powyżej 0,60; Jeśli przekracza 0,90, korelacja jest uważana za bardzo silna. Jednakże, aby dokonać wniosków na temat powiązań między zmiennymi, wielkość próbki ma ogromne znaczenie: niż próbka jest większa, tym droższa wartość współczynnika korelacji. Istnieją tabele o kluczowych wartościach współczynnika korelacji Brave-Pearson i Spearmana dla innej liczby stopni swobody (jest równa liczbie par mniej niż 2, tj. n.-2). Tylko wtedy, gdy współczynniki korelacji są większe niż te krytyczne wartości, można je uznać za wiarygodne. Tak więc, aby współczynnik korelacji 0,70 był wiarygodny, nie mniej niż 8 par danych należy podjąć w analizie ( = p -2 = 6) Przy obliczaniu r.(Tabela. V.4) i 7 pary danych ( \u003d P -2 \u003d 5) Podczas obliczania r. s. (Tabela 5 w dodatku B. 5).

Odważny współczynnik - Pearson

Aby obliczyć ten współczynnik, używany jest następujący formuła (od różnych autorów może wyglądać inaczej):

gdzie . XY. - ilość danych z każdej pary;

n. - liczba par;

- Środek do zmiennej danych X.;

Środek do zmiennej danych Y.;

S. H. - x.;

s. Y. - odchylenie standardowe dla dystrybucji y.

Teraz możemy wykorzystać ten współczynnik w celu ustalenia, czy istnieje połączenie między czasem odpowiedzi przedmiotów a skuteczności ich działań. Weźmy na przykład poziom tła grupy kontrolnej.

n.= 15  15,8  13,4 = 3175,8;

(n.1)S. x. S. y. = 14  3,07  2,29 = 98,42;

r. =

Ujemna wartość współczynnika korelacji może oznaczać, że większy czas reakcji, niższa wydajność. Jednak jest zbyt małe, aby porozmawiać o niezawodnym połączeniu między tymi dwoma zmiennymi.

nxy \u003d.………

(N.- 1) S. X. S. Y. = ……

Jaki wniosek można wykonać z tych wyników? Jeśli uważasz, że między zmiennymi jest połączenie między zmiennymi, to co to jest - bezpośrednie lub odwrotne? Jest niezawodny [patrz Stół. 4 (w suplemencie B. 5) z wartościami krytycznymi r.]?

Współczynnik korelacji rangi Spearmanar. s.

Ten współczynnik jest łatwiejszy do obliczenia, ale wyniki są mniej dokładne niż w przypadku używania r.Wynika to z faktu, że przy obliczaniu współczynnika Ducha należy użyć kolejności danych, a nie ich charakterystyki ilościowe i interwały między klasami.

Faktem jest, że przy użyciu współczynnika korelacji rangi Włócznia(R. s. ) tylko sprawdzić czy dane ranking dla każdej próbki jest taka sama, jak w wielu innych danych dla tej próbki, parami połączone z pierwszym (na przykład, studenci będą równie „rankingu”, gdy przechodzą one w psychologii i matematyki, a nawet z dwoma różnych nauczycieli psychologii?). Jeśli współczynnik jest blisko + 1, oznacza to, że oba wiersze są prawie zbiegły, a jeśli ten współczynnik jest blisko - 1, możesz mówić o pełnym odwrotnym uzależnieniu.

Współczynnik r. s. oblicz wzorem

gdzie rE-różnica między szeregami znaków koniugatu znaków znaków (niezależnie od jego znaku) i n.- Paras.

Zwykle ten test nie parametryczny jest używany w przypadkach, w których musisz dokonać pewnych wniosków interwałymiędzy danymi, ile o ich rangaa następnie, gdy krzywe dystrybucji są zbyt asymetryczne i nie pozwalają na używanie takich kryteriów parametrycznych jak współczynnik r.(W takich przypadkach konieczne jest kolejność ilościowych do porządkowania).

Ponieważ tak jest w przypadku rozkładu wartości wydajności i czasu reakcji w grupie eksperymentalnej po ekspozycji, możliwe jest powtórzenie obliczeń, które już wykonałeś dla tej grupy, tylko teraz nie jest dla współczynnik r., i dla wskaźnika r. s. . Pozwoli to zobaczyć, ile te dwa wskaźniki różnią się *.

* Należy pamiętać

1) W przypadku liczby trafień, pierwsza ranga odpowiada najwyższej i 15 niskiej wydajności, podczas gdy w czasie reakcji, pierwsza ranga odpowiada najkrótszym czasie i 15 długi czas;

2) dane ex aequo dołączony średnią rangę.

Tak więc, jak w przypadku współczynników r,otrzymał pozytywny, choć niewiarygodny, wynik. Co z dwóch wyników jest wiarygodny: r \u003d.-0,48 lub r. s. \u003d +0.24? To pytanie może tylko stać, jeśli wyniki są wiarygodne.

Chciałbym ponownie podkreślić, że istota tych dwóch współczynników jest nieco inna. Współczynnik negatywny r.wskazuje, że wydajność jest najczęściej wyższa niż czas reakcji mniej, podczas gdy przy obliczaniu współczynnika r. s. konieczne było sprawdzenie, czy szybsze tematy zawsze reagują dokładniej i wolniejsze - mniej dokładnie.

Ponieważ grupa eksperymentalna po ekspozycji uzyskano współczynnik r. s. , równy 0,24, taka tendencja nie jest tu oczywiście prześledzić. Spróbuj wymyślić to we własnych danych dla grupy kontrolnej po ekspozycji, wiedząc, że  rE. 2 = 122,5:

; Znacznie?

Jaki jest Twój wniosek? ............................................. .................................................. ............

…………………………………………………………………………………………………………………….

Przeglądamy więc różne parametryczne i nie parametryczne metody statystyczne stosowane w psychologii. Nasza recenzja była bardzo powierzchowna, a jego głównym zadaniem było to, że czytelnik zrozumie, że statystyki nie były tak straszne, jak się wydaje i wymaga głównie zdrowego rozsądku. Przypominamy, że dane "doświadczenia", z którymi zajmowaliśmy się tutaj, fikcyjne i nie mogą służyć jako podstawa do żadnych wniosków. Jednak taki eksperyment byłby kosztowny spędzić. Od tego czasu wybrano czysto klasyczną technikę, ta sama analiza statystyczna może być stosowana w różnych różnych eksperymentach. W każdym razie wydaje nam się, że przedstawiliśmy kilka głównych kierunków, które mogą być przydatne dla tych, którzy nie wiedzą, gdzie rozpocząć analizę statystyczną uzyskanych wyników.

Istnieją trzy główne partycje statystyk: statystyki opisowe, statystyki indukcyjne i analiza korelacji.

7.3.1. Współczynniki korelacji i determinacji.Możesz określić kwantyfikację mocno komunikacja między nią czynników i jedzenie(Direct lub Reverse), obliczone:

1) Jeśli konieczne jest określenie relacji użytkownika relacji między dwoma czynnikami - współczynnik parakorelacja: w 7.3.2 i 7.3.3, operacje obliczeniowe sparowanego współczynnika liniowego korelacji na Brash-Purson ( r.) i współczynnik rankingu pary korelacji w duchu ( r.);

2) Jeśli chcemy określić relację między dwoma czynnikami, ale ten związek jest wyraźnie nieliniowy korelantion. ;

3) Jeśli chcemy określić relację między jednym czynnikiem a kombinacją innych czynników - wtedy (lub tak samo, "współczynnik korelacji wielu");

4) Jeśli chcemy zidentyfikować połączenie jednego czynnika tylko z określonym, który jest zawarty w czynnikach grupowych wpływających na pierwsze, dla których konieczne jest rozważenie wpływu wszystkich innych czynników niezmienionych - prywatny (częściowy) współczynnik korelacji .

Każdy współczynnik korelacji (R, R) nie może w wartości bezwzględnej przekraczającej 1, to znaczy -1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

Znak w współczynniku korelacji określa cel komunikacji: znak "+" (lub brak znaku) oznacza, że \u200b\u200bpołączenie prosto (pozytywny), znak "-" - że połączenie odwrotność (negatywny). Żaden związek nie ma żadnego związku z szczelność połączenia

Współczynnik korelacji charakteryzuje stosunek statystyczny. Ale często konieczne jest zidentyfikowanie innego rodzaju uzależnienia, a mianowicie: jaki jest wkład każdego czynnika w tworzeniu innego czynnika związanego z nim. Charakteryzuje się tego rodzaju zależność z częścią konwencji współczynnik determinacji (RE. ) zdefiniowany przez wzór RE. \u003d R2 '100% (gdzie R oznacza współczynnik korelacji Brash-Purson, patrz 7.3.2). Jeśli pomiary przeprowadzono w skala skali (skala rangi), Z pewnymi uszkodzeniem niezawodności, możliwe jest zastąpienie wartości R w wzorze R (współczynnik korelacji na spirmetue, patrz 7.3.3).

Na przykład, jeśli otrzymaliśmy jako charakterystykę zależności czynnika B od współczynnika i współczynnika korelacji R \u003d 0,8 lub R \u003d -0,8, następnie d \u003d 0,8 2 '100% \u003d 64%, czyli około 2 ½ 3. W konsekwencji wkład współczynnika A i jego zmiany w tworzeniu czynnika B wynosi około 2 ½ 3 z całkowitego wkładu wszystkich czynników.

7.3.2. Współczynnik korelacji na Brave-Pearson. Procedura obliczania współczynnika korelacji na Brash-Purson ( r. ) Może być używany tylko w przypadkach, gdy komunikacja jest uważana na podstawie próbek, które mają normalną rozkład częstotliwości ( normalna dystrybucja ) i pomiary uzyskane w zakresach odstępów lub relacji. Obliczona formuła tego współczynnika korelacji:



å ( x. JA -) ( y. JA -)

R. = .

n × s x × y y

Co pokazuje współczynnik korelacji? Po pierwsze, znak współczynnika korelacji pokazuje ostrość komunikacji, a mianowicie: znak "-" wskazuje, że połączenie odwrotnośćlub. negatywny (Istnieje tendencja: ze spadkiem wartości jednego czynnika, odpowiednie wartości innego czynnika rosną, a zwiększając - zmniejszenie), a brak znaku lub znaku "+" wskazuje prostolub. pozytywnykomunikacja (istnieje tendencja: ze wzrostem wartości tego samego czynnika, wartości drugiego wzrastają i zmniejszają spadek). Po drugie, absolutny (niezależny od znaku) wielkość współczynnika korelacji mówi o szczelności (siła) komunikacji. Jest uważany (wystarczająco warunkowo): w wartościach r< 0,3 корреляция bardzo słaby, często nie jest to po prostu brane pod uwagę, w 0,3 £ r< 5 корреляция słaby, przy 0,5 £ r< 0,7) - średni, o 0,7 £ r £ 0,9) - silny I wreszcie, w R\u003e 0,9 - bardzo silny.W naszym przypadku (R "0,83) relacja jest odwrotna (ujemna) i silna.

Przypomnij: Wartości współczynnika korelacji mogą mieścić się w zakresie od -1 do +1. Wartość wyjściowa R dla tych limitów wskazuje, że w obliczeniach błąd jest dozwolony . Jeśli r. \u003d 1 oznacza to, że związek nie jest statystyczny, ale funkcjonalny - który w sporcie, biologii, medycyna praktycznie nie zdarza się. Chociaż z niewielką ilością pomiarów, możliwe jest losowy wybór wartości, który daje obraz komunikacji funkcjonalnej, jest możliwe, ale ten przypadek jest mniej prawdopodobny, tym większa ilość porównanych próbek (n), to znaczy Liczba par porównanych pomiarów.

Obliczona tabela (tabela 7.1) jest zbudowana zgodnie z formułą.

Tabela 7.1.

Tabela obliczeniowa do obliczenia na torebce wózka

X I. Y I. (x. JA -) (x. I -) 2 (y. JA -) (y. I -) 2 (x. JA -) ( y. JA -)
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
Åx I \u003d 137 \u003d 13.00 Åy I \u003d 56,1 \u003d 5.1 å( x. I -) 2 \u003d \u003d 1,78 å( y. I -) 2 \u003d \u003d 1,015 å( x. JA -) ( y. I -) \u003d -1.24

ISOFAR AS. s. x \u003d. ï ï = ï ï» 0,42, A.

s. y \u003d. ï ï» 0,32, r » –1,24ï (11'0,42'0,0,32) » –1,24ï 1,48 » –0,83 .

Innymi słowy, konieczne jest bardzo mocno wiedzieć, że współczynnik korelacji nie mogę W wartości bezwzględnej przekraczającej 1,0. To często unika błędów brutto, bardziej precyzyjnie - znaleźć i poprawić błąd dozwolony przy obliczaniu.

7.3.3. Współczynnik korelacji Spearmen.. Jak już wspomniano, możliwe jest zastosowanie współczynnika korelacji Bravee-Peyson (R) tylko w przypadkach, gdy analizowane czynniki dystrybucji częstotliwości są zbliżone do opcji normalnych i wartościowych uzyskuje się przez pomiary koniecznie w skali relacji lub w skali interwałowej, które dzieje się, jeśli wyrażają jednostki fizyczne. W innych przypadkach znaleziono współczynnik korelacji ducha ( r.). Jednak ten współczynnik mogą zastosuj w przypadkach, gdy dozwolone (i najlepiej ! ) Zastosuj współczynnik korelacji na Bävse-Pearson. Ale należy pamiętać, że procedura określania współczynnika współczynnika walki większa moc ("zezwolenieumiejętność"), więc r.bardziej pouczający niż r.. Nawet z dużym n. odchylenie r. Może wynosić około ± 10%.

Tabela 7.2 Obliczona formuła współczynnika

x I y i r x r y | d r | D r 2 Korelacja Spearmana

13,2 4,75 8,5 3,0 5,5 30,25 r. \u003d 1 -. Reszta

13.5 4.70 11.0 2.0 9.0 81.00 Korzystamy z naszego przykładu

12.7 5,10 4.5 6.5 2.0 4.00 do obliczenia r.Ale budować

12.5 5.40 3.0 9.0 6.0 36.00 Inna tabela (tabela 7.2).

13.0 5.10 6.0 6.5 0,5 0,25 Zastąp wartości:

13.2 5.00 8,5 4,5 4.0 16.00 R \u003d 1- \u003d

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13.4 4.65 10.0 1.0 9.0 81.00 Widzimy: r. Okazało się trochę

12.4 5.60 2.0 11.0 9,0 81,00 Więcej niż r.ale to jest

12.3 5.50 1,0 10,0 9,0 81,00 Chiya nie jest zbyt duża. W końcu, kiedy

12.7 5.20 4.5 8.0 3,5 12,25 Taki mały n. Wartości r. i r.

Åd r 2 \u003d 423 jest bardzo przybliżony, niewiele wiarygodnych, ich rzeczywistą wartość może znosić szeroko, dlatego różnicę r. i r. 0,1 jest niepotrzebnie. Zazwyczajr.rozważaj jako analogr. ale tylko mniej dokładne. Znaki dla r.i r.pokazuje ostrość komunikacji.

7.3.4. Zastosowanie i weryfikacja dokładności współczynników korelacji. Określenie stopnia relacji korelacji między czynnikami jest niezbędne do zarządzania rozwojem czynników, których potrzebujemy: dla tego musisz wpływać na inne czynniki, które znacząco wpływają na to, a musisz poznać miarę ich skuteczności. Musisz wiedzieć o relacji czynników, aby opracować lub wybrać gotowe testy: Informacje testu jest określona przez korelację swoich wyników z manifestarem funkcji lub właściwości zainteresowania nam. Bez wiedzy o korelacjach, jakiekolwiek formy wyboru są niemożliwe.

Należy zauważyć ponad to, że w sporcie i ogólnie pedagogicznym, medycznym, a nawet praktyce gospodarczej i socjologicznej jest bardzo zainteresowany definicją kaucja , który jednym z czynników przyczynia się do formacji innego. Wynika to z faktu, że oprócz rozważanych czynników, cel (Jesteśmy zainteresowani) czynnikiem czynnikiem, podając każdy inny lub inny wkład w niego i innych.

Uważa się, że środek wkładu każdego czynnika może być współczynnik determinacji D i \u003d r 2 '100%. Na przykład, jeśli r \u003d 0,6, tj. Związek między czynnikami A i B jest średni, następnie d \u003d 0,6 2 '100% \u003d 36%. Wiedząc, w taki sposób, że wkład współczynnika A do tworzenia czynnika B wynosi około 1 ½ 3, możesz na przykład poświęcić ukierunkowanego rozwoju tego współczynnika około 1 ½ 3 Czas szkolenia. Jeśli współczynnik korelacji wynosi R \u003d 0,4, następnie d \u003d R2 100% \u003d 16% lub około 1 ½ 6 - dwa kolejne razy mniej i poświęcić go na rozwój tej logiki, odpowiednio, tylko 1 ½ 6 części czasu szkolenia.

Wartości di dla różnych istotnych czynników dają przybliżony pogląd na ilość relacji ich wpływów na czynnik docelowy, który nas interesuje, ze względu na poprawę, którą w rzeczywistości i pracujemy na innych czynnikach (na przykład Długoterminowy zworka biegnąca na wzrost prędkości jego przędzenia, tak jak jest czynnikiem, który daje najważniejszy wkład w tworzenie wyniku skakania).

Przypomnijmy to określanie RE. Zamiast tego jest możliwe r. Położyć r.Chociaż oczywiście dokładność definicji jest niższa.

Na podstawie selektywny (Obliczone na danych selektywnych) Współczynnik korelacji nie można stwierdzić, że relacja między czynnikami rozważnymi nie jest możliwa. W celu dokonania takiego wniosku z jednym stopniem racjonalności, użyj standardu kryteria korelacji. Ich użycie oznacza liniową zależność między czynnikami i normalna dystrybucja Częstotliwości w każdym z nich (co oznacza, że \u200b\u200bnie próbka, ale ich ogólna prezentacja).

Możesz na przykład stosować kryteria T ucznia. Jego odległość

nawet formuła: t P.= –2 , gdzie k jest badanym selektywnym współczynnikiem korelacji, a n. - objętość komponowanych próbek. Uzyskana obliczona wartość kryterium T (T P) jest porównywana z tabelą z tabelą, która wybrana przez nas i liczba swobody wolności N \u003d N - 2. Aby pozbyć się pracy rozliczeniowej, możesz użyć Specjalny stół. wartości krytyczne selektywnych współczynników korelacji(patrz wyżej) odpowiadający obecności niezawodnego połączenia między czynnikami (w tym n. i zA.).

Tabela 7.3.

Wartości graniczne zaufania selektywnego współczynnika korelacji

Liczba stopni swobody przy określaniu współczynników korelacji jest pobierana równa 2 (tj. n. \u003d 2) określone w tabeli. 7.3 Wartości mają dolną granicę przedziału ufności prawdziwe współczynnik korelacji wynosi 0, czyli w takich wartościach nie można powiedzieć, że korelacja jest ogólnie nastąpiła. W przypadku wartości selektywnego współczynnika korelacji powyżej określonego w tabeli jest to możliwe na odpowiednim poziomie znaczenia, aby wierzyć, że prawdziwy współczynnik korelacji nie jest zerowy.

Ale odpowiedź na pytanie jest to, czy istnieje prawdziwe połączenie między rozważnymi czynnikami, pozostawia miejsce na kolejne pytanie: w jakim przedziale leży prawdziwa wartość współczynnik korelacji, jak to może być, z nieskończenie dużym n.? Ten interwał dla jakiejkolwiek konkretnej wartości r. i n. Porównane czynniki można obliczyć, ale wygodniejsze jest korzystanie z systemu wykresów ( nomogram), gdzie każda para krzywych, zbudowana na jeden określona powyżej n.odpowiada granicom przedziału.

Figa. 7.4. Borders zaufania z selektywnego współczynnika korelacji (A \u003d 0,05). Każda krzywa odpowiada określonym powyżej n..

Obracając się do nomogramu na rys. 7.4, interwał wartości prawdziwego współczynnika korelacji można określić dla obliczonych wartości współczynnika korelacji selektywnej w A \u003d 0,05.

7.3.5. Relacje korelacji.Jeśli korelacja pary nelinene., niemożliwe jest obliczenie współczynnika korelacji, określ relacje korelacji . Obowiązkowe wymagania: znaki muszą być mierzone w skali relacji lub w skali odstępów. Możliwe jest obliczenie uzależnienia korelacji czynnika X. od współczynnika Y.i zależność korelacji czynnika Y.od współczynnika X. - Różnią się. Z małą ilością n. Próbki omawiane, reprezentujące czynniki, mogą być używane do obliczenia relacji korelacji:

stosunek korelacji H. x ½ y.= ;

współczynnik korelacji h y ½ X.= .

Tutaj i - średnie próbki arytmetyczne X i Y i - intraclass. Środkowy arytmetyki. Jest - średnia arytmetyczna tych wartości w próbce czynnika X, z którą koniugate identyczne wartości W próbce współczynnika Y (na przykład, jeśli we współczynniku x są wartościami 4, 6 i 5, przy czym 3 opcje o tej samej wartości 9 są koniugatowe w próbce współczynnika Y, a następnie \u003d (4 + 6 + 5) ½ 3 \u003d 5). W związku z tym średnia arytmetyczna tych wartości w próbce współczynnika Y, z którym te same wartości są sprzężone w próbce współczynnika X. Daj nam przykład i wykonaj obliczenie:

X: 75 77 78 76 80 79 83 82 ; Y: 42 42 43 43 43 44 44 45 .

Tabela 7.4.

Obliczona tabela

X I. Y I. X Y. x i - x (x i - x) 2 x I - x y. (x I. X Y.) 2
–4 –1
–2
–3 –2
–1
–3
x \u003d 79. Y \u003d 43. S \u003d 76. S \u003d 28.

W konsekwencji H. Y ½ x.\u003d "0,63.

7.3.6. Prywatne i wiele współczynników korelacji.Aby oszacować relację między 2 czynnikami, obliczając współczynniki korelacji, jak to było, zakładamy, że żadne inne czynniki tej zależności nie mają wpływu. W rzeczywistości sytuacja jest błędna. Więc zależność między wagą a wzrostem jest bardzo znacząco pod wpływem kaloreness odżywiania, wielkość systematycznego wysiłku fizycznego, dziedziczności itp. W razie potrzeby podczas oceny komunikacji między 2 czynnikami znaczny wpływ inne czynniki i jednocześnie odizolować od nich biorąc pod uwagę ich niezmienione, Oblicz prywatny (Inaczej - częściowy ) Współczynniki korelacji.

Przykład: Musisz ocenić sparowane zależności między 3 zasadniczo aktywnymi czynnikami X, Y i Z. Onote r. XY (Z) Prywatny (częściowy) współczynnik korelacji między czynnikami X a Y (w tym samym czasie, rozważamy wartość czynnika Z niezmienionego), r. ZX (y) jest prywatnym współczynnikiem korelacji między czynnikami Z a X (z konsekwentną wartością współczynnika Y), r. YZ (X) jest prywatnym współczynnikiem korelacji między czynnikami Y i Z (z stałą wartością czynnika X). Korzystanie z obliczonej prostej pary (Brave-Purson) współczynniki korelacji r. Xy. r. Xz I. r. YZ, M.

możliwe jest obliczenie prywatnych (częściowych) współczynników korelacji według formuł:

r xy - r. Xz ' r. YZ. r. Xz - r. Xy ' r. Zy. r. Zy -r zx ' r. YZ.

r. Xy (z) \u003d; r. Xz (y) \u003d; r. Zy (x) \u003d

Ö (1- r. 2 xz) (1- r. 2 yz) Ö (1- r. 2 xy) (1- r. 2 ZY) Ö (1- r. 2 ZX) (1- r. 2 yx)

A prywatne współczynniki korelacji mogą przyjmować wartości od -1 do +1. Wznosząc je na placu, uzyskaj odpowiedni prywatny współczynniki determinacji. , określane również jako prywatne środki pewności (mnożenie przez 100, ekspresowe w %%). Prywatne współczynniki korelacji są mniejsze niż mniej różne od prostych (kompletnych) sparowanych współczynników, które zależy od wytrzymałości wpływu na ich 3. czynnik (jakby niezmienił). Hipoteza zerowa (H 0), czyli hipotezę o braku komunikacji (zależność) pomiędzy czynnikami X i Y (z sumą znaków k.) Obliczanie kryterium T za pomocą wzoru: t. P \u003d. r. XY (Z) '( n.-K) 1. ½ 2 '(1- r. 2 xy (z)) -1 ½ 2 .

Jeśli t. R.< t. n, hipoteza jest akceptowana (wierzymy, że nie ma uzależnienia), jeśli t.t. N - hipoteza jest obalana, to znaczy uważa się, że zależność naprawdę ma miejsce. t. N jest pobierany na stole t.-Citeria student i k. - Liczba rachunkowanych czynników (w naszym przykładzie 3), liczba stopni wolności n. \u003d N - 3. Inne prywatne współczynniki korelacji są sprawdzane podobnie (zamiast tego we wzorze r. XY (Z) są odpowiednio zastąpione r. Xz (y) lub r. Zy (x)).

Tabela 7.5.

Wstępne dane

Ö (1 - 0,71 2) (1 - 0,71 2) Ö (1 - 0,5) (1 - 0,5)

Aby ocenić zależność odczynników ze wspólnego działania kilku czynników (tutaj, czynniki Y i Z), obliczają wartości prostych współczynników korelacji pary i, używając ich, obliczają wiele współczynnika korelacji. r. X (YZ):

Ö r. 2 XY +. r. 2 xz - 2 r. Xy ' r. Xz ' r. YZ.

r. X (yz) = .

Ö 1 - r. 2 yz.

7.2.7. Współczynnik stowarzyszenia. Często wymaga określenia relacji między jakość Znaki, tj. takie znaki, których nie można składać (scharakteryzować) ilościowo, co niezmierzony. Na przykład warto stwierdzić, czy zależność między specjalizacją sportu jest również zaangażowana w takie właściwości osobiste jako intrverter (kierunek osoby na temat zjawiska własnego subiektywnego świata) i ekstrawersji (kierunek osoby na świat obiektów zewnętrznych). Wskazania warunkowe zostaną przesłane w tabeli. 7.6.

Tabela 7.6.

X (lata) Y (razy) Z (razy) X (lata) Y (razy) Z (razy)
Znak 1 znak 2 Intravter Ekstażowalność
Gry sportowe ale b.
Gimnastyka z rE.

Oczywiście tylko częstotliwości dystrybucji mogą być tutaj numery do dyspozycji. W tym przypadku oblicz współczynnik stowarzyszenia (inna nazwa " współczynnik konitulacy "). Rozważmy najprostszy przypadek: relacja między dwiema parami znaków, z obliczonym współczynnikiem połączenia konirutu tetrachoryczny. (Patrz tabela.).

Tabela 7.7.

a \u003d 20. b \u003d 15. zA. + b. = 35
c \u003d 15. d \u003d 5. dO. + rE. = 20
zA. + dO. = 35 b. + rE. = 20 n. = 55

Obliczenia produkcyjne według wzoru:

ad - BC 100 - 225 -123

Obliczanie współczynników stowarzyszenia (współczynniki parowania) z większą liczbą funkcji wiąże się z obliczeniami na podobnej matrycy odpowiedniej kolejności.

Współczynnik korelacji - Jest to wielkość, która może się różnić w zależności od +1 do -1. W przypadku pełnej korelacji dodatnich współczynnik ten jest plus 1 (sugerują, że ze wzrostem wartości jednej zmiennej wartości innej zmiennej wzrasta), a przy kompletnym ujemnym - minus 1 (wskazuje zwrot opinii, tj. Wraz ze wzrostem wartości jednej zmiennej, różne wartości są zmniejszone).

Pr1.:

Wykres uzależnienia od nieśmiałości i dyrezy. Jak widać, punkty (przedmioty) nie są chaotyczne, ale zbudowane wokół jednej linii i patrząc na tę linię, możemy powiedzieć, że im wyższa osoba jest wyrażona w osobie, tym więcej depresywności, tj. Te zjawiska są połączone.

PR2: harmonogram dla nieśmiałości i towarzyszy. Widzimy, że ze wzrostem nieśmiałości maleje spotkań. Ich współczynnik korelacji wynosi -0.43. Zatem współczynnik korelacji większy od 0 do 1 mówi o komunikacji z bezpośrednim proporcjonalnym (większy ... im więcej ...) i współczynnik od -1 do 0 o haniebnym (tym więcej ... .)

Jeśli współczynnik korelacji wynosi 0, obie zmienne są całkowicie niezależne od siebie.

Korelacja - Jest to połączenie, w którym ekspozycja poszczególnych czynników przejawia się tylko jako tendencja (średnio) z masową obserwacją rzeczywistych danych. Przykłady zależności korelacji mogą być zależności między wielkością aktywów Banku a kwotą zysków Banku, wzrost wydajności pracy i doświadczenia pracowników.

Wykorzystywane są dwa systemy klasyfikacji więzi korelacji: ogólne i prywatne.

Klasyfikacja ogólna korelacji: 1) silna lub blisko współczynnika korelacji R\u003e 0,70; 2) średnia na 0,500,70, a nie tylko korelacji wysokiego poziomu istotności.

Poniższa tabela napisała nazwy współczynników korelacji dla różnych rodzajów skal.

Skala dichotomiczna (1/0) Skala rangi (porządkowa)
Skala dichotomiczna (1/0) Współczynnik Stowarzyszenia Pearsona, czterokrotny współczynnik Pearsona. Sywizacyjna korelacja
Skala rangi (porządkowa) Ranga korelacji biserialnej. Współczynnik zakresu korelacji ducha lub Kendalla.
Skala interwałowa i absolutna Sywizacyjna korelacja Wartości skali interwału są tłumaczone na szeregi i jest używany współczynnik rankingu Współczynnik korelacji Pearson (współczynnik korelacji liniowej)

Dla r.=0 brakuje korelacji liniowej. Jednocześnie średnie zmienne grupy pokrywa się ze swoimi średnimi średnimi, a linie regresji są równoległe do osi współrzędnych.

Równość r.=0 mówi tylko o braku zależności liniowej korelacji (niekorozja zmiennych), ale wcale o braku korelacji, a jeszcze bardziej, uzależnienie statystyczne.

Czasami wniosek o braku korelacji jest ważniejszy niż obecność silnej korelacji. Zero korelacji dwóch zmiennych może wskazywać, że nie ma wpływu na jedną zmienną do drugiej, pod warunkiem, że ufamy wyniki pomiarów.

W SPSS: 11.3.2 Współczynniki korelacji.

Do tej pory pomyśliliśmy tylko fakt istnienia uzależnienia statystycznego między dwoma znakami. Następnie spróbujemy dowiedzieć się, które wnioski można wykonać o wytrzymałości lub osłabieniu tej zależności, a także o jego formie i orientacji. Kryteria oceny ilościowej relacji między zmiennymi nazywane są współczynniki korelacji lub środki związane z nimi związane. Dwie zmienne korelują ze sobą pozytywnie, jeśli istnieje bezpośredni, jednokierunkowy stosunek między nimi. W stosunku jednokierunkowym, małe wartości jednej zmiennej odpowiadają małym wartościom innej zmiennej, duże wartości są duże. Dwie zmienne korelują negatywnie, jeśli istnieje odwrotny, wielokierunkowy stosunek między nimi. W stosunku wielokierunkowym małe wartości jednej zmiennej odpowiadają dużym wartościom innej zmiennej i odwrotnie. Wartości współczynników korelacji zawsze leżą w zakresie od -1 do +1.

Współczynnik korelacji między zmiennymi należącymi do skali porządkowej stosuje się we współczynniku współczynnika i dla zmiennych należących do interwału - współczynnik korelacji Pearson (moment robót). Należy zauważyć, że każda zmienna dychotomiczna, która jest zmienna należąca do skali nominalnej i posiadająca dwie kategorie można uznać za porządek porządkowy.

Aby rozpocząć, sprawdzimy, czy korelacja między zmiennymi seksu i psychiki z pliku studium.sav. Jednocześnie biorą pod uwagę, że zmienna dychotomiczna seksu można uznać za zwykły. Wykonaj następujące kroki:

· Wybierz statystyki opisowe (statystyki opisowe) Polecenia w menu polecenia analizy ... (Tabele konirutu)

· Przenieś zmienną płciową do listy ciągów, a zmienna Psyche znajduje się na liście kolumn.

· Kliknij przycisk Statystyki ... (statystyki). W oknie dialogowym Crosstabs: Statystyka wybierz pole wyboru korelacje (korelacja). Potwierdź kontakt z przyciskiem Kontynuuj.

· W oknie dialogowym Crosstabs odmówić wyświetlania tabel, zaznaczając pole wyboru Tables SUPSPRESS. Kliknij przycisk OK.

Współczynniki współczynników korelacji Spirytują i Pearson zostaną obliczone, a ich znaczenie jest sprawdzane:

/ SPSS 10.

Analiza korelacji zadania 10

Koncepcja korelacji

Współczynnik korelacji lub korelacji jest wskaźnikiem statystycznym probabilistycznykomunikacja między dwiema zmiennymi mierzonymi skalami ilościowymi. W przeciwieństwie do funkcjonalnego połączenia, w którym każda wartość jednej zmiennej odpowiada Ściśle zdefiniowanywartość innej zmiennej, komunikacja probabilistycznacharakteryzuje się faktem, że każda wartość jednej zmiennej odpowiada wiele wartościinną zmienną, przykładem komunikacji probabilistycznej jest relacja między wzrostem i ciężarem ludzi. Jasne jest, że ta sama wysokość może być w ludziach o różnej wagi i odwrotnie.

Korelacja jest wartością zawartą z od -1 do + 1 i jest wskazana literą R. Ponadto, jeśli wartość jest bliższa 1, oznacza to obecność silnego połączenia, a jeśli jest bliżej 0, a następnie słaby. Wartość korelacji mniejsza niż 0,2 jest uważana za słabą korelację, ponad 0,5 - wysokość. Jeśli współczynnik korelacji jest ujemny, oznacza to obecność sprzężenia zwrotnego: Im wyższa wartość jednej zmiennej, dolna różna wartość.

W zależności od wartości wartości współczynników, możliwe jest przeznaczenie różnych rodzajów korelacji:

Surowa dodatnia korelacjaokreślony według wartości \u003d 1. Termin "ścisły" oznacza, że \u200b\u200bwartość jednej zmiennej jest wyjątkowo określona przez wartości innej zmiennej, a termin " pozytywny "- To ze wzrostem wartości jednej zmiennej, wartość innej zmiennej wzrasta również wartość innej zmiennej.

Ścisła korelacja jest abstrakcją matematyczną i praktycznie nie występuje w prawdziwych badaniach.

Pozytywna korelacja Odpowiada wartościom 0.

Brak korelacjiokreślone według wartości \u003d 0. Współczynnik zerowy korelacji sugeruje, że wartości zmiennych nie są związane ze sobą.

Brak korelacji H. o. : 0 r. xY. =0 sformułowany jako odbicie zero Hipoteza w analizie korelacji.

Ujemna korelacja: -1

Ścisła negatywna korelacjaokreślone według wartości \u003d -1. It również, a także ścisłą dodatnią korelację, jest abstrakcja i nie znajduje wyraz w praktycznych badaniach.

Tabela 1

Rodzaje korelacji i ich definicje

Metoda obliczania współczynnika korelacji zależy od rodzaju skali, na której mierzono wartości zmiennej.

Współczynnik korelacji r.osobajest to główny i może być używany do zmiennych z nominalnymi i częściowo zamówionych, skalami interwałowymi, dystrybucją wartości, według których odpowiada normalnemu (korelacja momentów pracy). Współczynnik korelacji Pearson zapewnia dość dokładne wyniki oraz w przypadkach nieprawidłowych dystrybucji.

W przypadku dystrybucji, które nie są normalne, korzystne jest stosowanie współczynników rankingowej korelacji Spirmen i Kendalla. Range są dlatego, że program jest wstępnie rangą korelowane zmienne.

Korelacja programów RPRMAN zapewnia następująco: Po pierwsze, zmienne są przenoszone do szeregów, a następnie formulason jest używany do rangi.

W sercu korelacji zaproponowanej przez M. Kendalla istnieje pomysł, że kierunek komunikacji można ocenić, w parach porównując przedmioty między sobą. Jeśli para testowanych zmian w X zbiega się w kierunku z zmianą płacenia, oznacza to dodatnie połączenie. Jeśli nie pokrywa się - wtedy negatywne połączenie. Współczynnik ten stosuje się głównie przez psychologów pracujących z małymi próbkami. Ponieważ socjologowie pracują z dużymi tablicami danych, trudno jest zidentyfikować różnicę w względnych częstotliwościach i inwersji wszystkich pary badanych w próbce. Najczęściej jest współczynnik. Osoba.

Ponieważ współczynnik korelacji RPIRSON jest główny i może być używany (z pewnym błędem w zależności od rodzaju skali i poziomu nieprawidłowości w dystrybucji) dla wszystkich zmiennych mierzonych skalami ilościowymi, rozważmy przykłady jego użycia i porównują wyniki uzyskane przy pomiarze Wyniki zgodnie z innymi współczynnikami korelacji.

Formuła do obliczania współczynnika r.- Osoba:

r xy \u003d σ (XI-XCP) ∙ (Yi-YCR) / (N - 1) ∙ σ x ∙ σ y ∙

Gdzie: XI, wartości dwóch zmiennych;

XSR, YCR - średnie wartości dwóch zmiennych;

σ x, σ y - odchylenia standardowe,

N- Liczba obserwacji.

Sparowane korelacje.

Na przykład, chcielibyśmy dowiedzieć się, jak odpowiedzi między różnymi typami tradycyjnych wartości odnoszą się do idei studentów o idealnym miejscu pracy (zmienne: A9.1, A9.3, A9.5, A9.7), a następnie stosunek liberalnych wartości (A9 .2, A9.4. A9.6, A9.8). Zmienne te mierzy się 5 - członkowymi skalami zamówionymi.

Korzystamy z procedury: "Analiza",  "Korelacja",  "sparowana". Domyślny Coeff. Pearson jest ustawiony w oknie dialogowym. Używamy współczynników. osoba

Zmienne testowe są przenoszone do okna wyboru: A9.1, A9.3, A9.5, A9.7

Naciskając OK, otrzymujemy obliczenia:

Korelacja

a9.1.t. Jak ważne jest wystarczająco dużo czasu na rodzinie i życiu osobistym?

Korelacja Pearsona

Znch. (2 boki)

a9.3.t. Jak ważne jest, aby nie bać się utraty pracy?

Korelacja Pearsona

Znch. (2 boki)

a9.5.t. Jak ważne jest, aby mieć taki szef, który doradzi z tobą, przyjmując to lub tę decyzję?

Korelacja Pearsona

Znch. (2 boki)

a9.7.t. Jak ważna jest praca w spójnej drużynie, poczuć jej część?

Korelacja Pearsona

Znch. (2 boki)

** Korelacja jest znacząca na poziomie 0,01 (2 boki).

Tabela wartości ilościowych konstruowanej matrycy korelacji

Prywatne korelacje:

Aby rozpocząć, konstruując korelację pary między określonymi dwoma zmiennymi:

Korelacja

c8. Poczuj intymność z tymi, którzy mieszkają w pobliżu, sąsiedzi

Korelacja Pearsona

Znch. (2 boki)

c12. Poczuj intymność z rodziną

Korelacja Pearsona

Znch. (2 boki)

**. Korelacja jest znacząca na poziomie 0,01 (2-boki).

Następnie użyj procedury budowy korelacji prywatnej: "Analiza",  "Korelacja",  "prywatna".

Przypuśćmy, że wartość "Ważne jest, aby określić i zmienić kolejność swojej pracy" w odniesieniu do określonych zmiennych będzie decydującym czynnikiem, pod wpływem, którego wcześniej zidentyfikowane połączenie zniknie lub będzie bezpodstawne.

Korelacja

Zmienne wykluczone

c8. Poczuj intymność z tymi, którzy mieszkają w pobliżu, sąsiedzi

c12. Poczuj intymność z rodziną

c16. Czuć intymność z ludźmi, którzy mają takie same bogactwo jak ty

c8. Poczuj intymność z tymi, którzy mieszkają w pobliżu, sąsiedzi

Korelacja

Znaczenie (2.)

c12. Poczuj intymność z rodziną

Korelacja

Znaczenie (2.)

Jak widać z tabeli pod wpływem zmiennej sterowania, połączenie ma nieznacznie zmniejszone: od 0, 120 do 0, 102. Jednak ten nieznacznie spadek nie pozwala na stwierdzenie, że rana jest odbiciem fałszywej korelacji, dlatego Pozostaje wystarczająco wysoki i pozwala na błąd zerowy, aby obalić zerową hipotezę.

Współczynnik korelacji

Najbardziej dokładny sposób na określenie krzyży i charakteru korelacji jest znalezienie współczynnika korelacji. Współczynnik korelacji jest liczbą zdefiniowaną przez wzór:


gdzie r hu jest współczynnikiem korelacji;

x I -Todiczne pierwszej funkcji;

na I-stosunek drugiej cechy;

Średnie wartości arytmetyczne pierwszego znaku

Średnie wartości arytmetyczne drugiej funkcji

Aby użyć wzoru (32), budujemy tabelę, która zapewni niezbędną sekwencję w przygotowaniu liczb, aby znaleźć liczbę i mianownik współczynnika korelacji.

Jak widać z formuły (32), sekwencję działań jest to: znajdziemy średnią arytmetykę obu znaków X i Y, znajdziemy różnicę między wartościami funkcji a jego średniej (XI -) i і -), a następnie znajdź swoją pracę (X і) (i і -) - suma kapłana daje współczynnik korelacji. Aby znaleźć jego mianownika, podąża za różnicą (x I -) i (w і -), aby zbudować kwadrat, znajdź ich kwoty i wyciągnij pierwiastek kwadratowy przed ich pracą.

Tak więc na przykład 31 współczynnik korelacji zgodnie z wzorem (32) może być reprezentowany w następujący sposób (Tabela 50).

Wynikowa liczba współczynnika korelacji umożliwia ustanowienie obecności, szczelności i charakteru komunikacji.

1. Jeśli współczynnik korelacji wynosi zero, nie ma połączenia między znakami.

2. Jeśli współczynnik korelacji jest równy, stosunek między objawami jest tak duży, co zamienia się w funkcjonalny.

3. Wartość bezwzględna współczynnika korelacji nie wykracza poza zakres od zera do jednego:

Umożliwia to poruszanie się po szczelności połączenia: Wartość współczynnika bliżej zera, połączenie jest słabsze, a tym bliżej jednego, połączenie jest bliżej.

4. Znak współczynnika korelacji "Plus" oznacza korelację bezpośredniej, znak "minus".

Stół 50

x і. І. (x I -) (y -) (x і -) (y -) (x і -) 2 (y і -) 2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


Zatem obliczany w przykładzie 31, współczynnik korelacji R XY \u003d +0,9. Umożliwia dokonanie takich wniosków: istnieje wiązanie korelacji między wielkością siły mięśniowej prawej i lewej szczotki w badanych uczniów (współczynnik R XY \u003d + 0,9 jest inny niż zero), połączenie jest bardzo blisko (współczynnik R XY \u003d + 0,9 jest Blisko jednego), korelacja jest prosta (współczynnik R XY \u003d +0,9 dodatnia), tj. Wraz ze wzrostem siły mięśniowej jednej z pędzli, siła innego szczotki wzrasta.

Przy obliczaniu współczynnika korelacji i przy użyciu jego właściwości należy zauważyć, że wnioski podają poprawne wyniki w przypadku, gdy znaki są dystrybuowane normalnie i gdy rozważany jest relacja między dużą liczbą wartości obu znaków.

W badanym przykładem 31 przeanalizowano tylko 7 wartości obu znaków, które oczywiście nie wystarczy do takich badań. Przypomniamy tu ponownie, że przykłady w tej książce w ogóle iw niniejszym rozdziale są charakteriem metod metod, a nie szczegółowej prezentacji żadnych eksperymentów naukowych. W rezultacie rozpatrywana jest niewielka liczba oznak znaków, pomiar jest zaokrąglony - wszystko to robi w kolejności, aby obliczenia nieporęczne nie zadziwić idei metody.

Szczególną uwagę należy zwrócić na istotę rozważanej relacji. Współczynnik korelacji nie może prowadzić do właściwych wyników badania, jeżeli analiza relacji między znakami jest wykonana formalnie. Zwróćmy ponownie na przykład 31. Oba uważane cechy były znaczeniem siły mięśniowej prawej i lewej szczotki. Wyobraź sobie, że pod znakiem XI w przykładzie 31 (14.0; 14.2; 14.9 ... ... 18.1) Rozumiemy długość przypadkowo złapanej ryby w centymetrach i pod znakiem і (12,1; 13.8; 14.2. .. ... 17.4) Urządzenia -at w laboratorium w kilogramach. Formalnie, przy użyciu aparatu obliczeniowego, aby znaleźć współczynnik korelacji i uzyskiwanie w tym przypadku również R XY \u003d + 0\u003e 9, musieliśmy stwierdzić, że istnieje ścisły związek między rybami a ciężarem instrumentów. Bez znaczenia tego wniosku jest oczywista.

Aby uniknąć formalnego podejścia do stosowania współczynnika korelacji, wynika z dowolnej innej metody - matematyczne, logiczne, eksperymentalne, teoretyczne - aby zidentyfikować możliwość istnienia korelacji między objawami, czyli, aby wykryć organiczną jedność oznaki. Dopiero po tym możesz przystąpić do stosowania analizy korelacji i ustawić wartość i charakter relacji.

W statystykach matematycznych jest nadal koncepcja wiele korelacji - Relacje między trzema a bardziej znakami. W takich przypadkach użyj współczynnika współczynnika korelacji składającego się z sparowanych współczynników korelacji opisanych powyżej.

Na przykład współczynnik korelacji trzech znaków-x і, y і, z і - tam:

gdzie R XYZ jest wielokrotnym cylindrem korelacji, wyrażając jako znak X, zależy od znaków і i z i;

r korelacja komórek XY między znakami x I i Y i;

r XZ -Ceffer korelacja między znakami XI i ZI;

r YZ. - współczynnik korelacji między znakami y i, z i

Analiza korelacji to:

Analiza korelacji

Korelacja - stosunek statystyczny między dwiema lub kilkoma zmiennymi losowymi (lub wartościami, które można uznać za takie, że z niektórych dopuszczalnych dokładności). Jednocześnie zmiany w jednej lub więcej tych wartości prowadzą do systematycznej zmiany w innych lub innych wartościach. Matematyczna miara korelacji dwóch zmiennych losowych jest współczynnik korelacji.

Korelacja może być pozytywna i negatywna (istnieje również sytuacja braku stosunków statystycznych - na przykład dla niezależnych zmiennych losowych). Ujemna korelacja - Korelacja, w której wzrost jednej zmiennej wiąże się ze spadkiem innej zmiennej, podczas gdy współczynnik korelacji jest ujemny. Pozytywna korelacja - Korelacja, w której wzrost jednej zmiennej wiąże się ze wzrostem innej zmiennej, podczas gdy współczynnik korelacji jest dodatni.

Autokorelacja. - stosunek statystyczny między wartościami losowymi z jednego rzędu, ale do pobrania z przesunięciem, na przykład dla procesu losowego - z przejściem w czasie.

Nazywany jest metoda przetwarzania danych statystycznych składających się w badaniu współczynników (korelacji) między zmiennymi, jest nazywana analiza korelacji.

Współczynnik korelacji

Współczynnik korelacji lub współczynnik korelacji rolnika. W teorii prawdopodobieństwa i statystyk jest to wskaźnik charakteru zmiany dwóch zmiennych losowych. Współczynnik korelacji jest oznaczony literą łacińską R i może przyjmować wartości między -1 a +1. Jeśli wartość modułu jest bliższa do 1, oznacza to obecność silnej wiązania (z współczynnikiem korelacji, urządzenie mówi o połączeniu funkcjonalnym), a jeśli jest bliżej 0, a następnie słaby.

Współczynnik korelacji pearson.

W przypadku wartości metrycznych zastosowany jest współczynnik korelacji Pearson, dokładna formuła została wprowadzona przez Francis Galton:

Zostawiać X.,Y. - Dwie zmienne losowe zdefiniowane na jednej przestrzeni probabilistycznej. Następnie ich współczynnik korelacji jest ustawiony przez wzór:

,

gdzie Cov oznacza kowariancję, a D jest dyspersją lub to samo

,

gdzie symbol odnosi się do oczekiwań matematycznych.

Możesz użyć prostokątnego układu współrzędnych z osiami odpowiadającymi obu zmiennych. Każda para wartości jest zaznaczona za pomocą określonego symbolu. Taki wykres nazywa się "diagramem rozpraszającym".

Sposób obliczania współczynnika korelacji zależy od rodzaju skali, do której odnoszą się zmienne. Tak więc, aby zmierzyć zmienne z wagonami i skalami ilościowymi, konieczne jest stosowanie współczynnika korelacji Pearson (korelacja momentów robót). Jeśli co najmniej jedna z dwóch zmiennych ma skalę sekwencji, lub zwykle nie jest dystrybuowany, konieczne jest stosowanie korelacji rangi alkoholu lub τ (Tau) Kendale. W przypadku, gdy jeden z dwóch zmiennych jest dychotomiczny, stosuje się korelację dwurzędową punktową, a jeśli obie zmienne są dychotomoczne: czterokierunkowa korelacja. Obliczanie współczynnika korelacji między dwoma zmiennymi nieryjnymi nie jest tylko pozbawiony znaczenia, link jest wiązaniem między nimi liniowych (jednokierunkowy).

Współczynnik korelacji Kendella.

Używane do pomiaru wzajemnego zaburzenia.

Współczynnik korelacji Spearmana.

Właściwości współczynnika korelacji

  • Nierówność Cauchy - Bunyakovsky:
Jeśli przyjmujesz jako skalarny produkt dwóch losowych kowariantów, wówczas stawka zmiennej losowej będzie równa A konsekwencją nierówności Cauchy - Bunyakovsky będzie :. gdzie. Ponadto w tym przypadku znaki i k. Dopasuj :.

Analiza korelacji

Analiza korelacji - metoda przetwarzania danych statystycznych polegających na badaniu współczynników ( korelacja) Między zmiennymi. W tym przypadku współczynniki korelacji są porównywane między jedną parą lub różnorodnymi parami funkcji do ustanowienia relacji statystycznych między nimi.

cel, powód analiza korelacji - Podaj informacje o jednej zmiennej za pomocą innej zmiennej. W przypadkach, w których można osiągnąć cel, mówi się, że zmienne korelat. W najbardziej ogólnej formie przyjęcie hipotezy na obecności korelacji oznacza, że \u200b\u200bzmiana wartości zmiennej A nastąpi jednocześnie z proporcjonalną zmianą wartości B: Jeśli oba zmienne rosną korelacja pozytywnaJeśli jedna zmienna rośnie, a druga zmniejsza się, ujemna korelacja.

Korelacja odzwierciedla jedynie liniową zależność ilości, ale nie odzwierciedla ich funkcjonalnej związku. Na przykład, jeśli obliczanie współczynnika korelacji między wartościami ZA. = s.jA.n.(x.) JA. B. = dO.o.s.(x.) Następnie będzie blisko zero, tj. Zależność między wartościami jest nieobecna. Tymczasem wartości A i B są oczywiście związane z prawem s.jA.n.2(x.) + dO.o.s.2(x.) = 1.

Ograniczenia analizy korelacji



Wykresy dystrybucji par (x, y) z odpowiednimi współczynnikami korelacji X i Y dla każdego z nich. Należy zauważyć, że współczynnik korelacji odzwierciedla zależność liniową (górna linia), ale nie opisuje krzywej zależności (przeciętnej linii) i nie jest w ogóle odpowiedni do opisywania złożonych, zależności nieliniowych (dolna linia).
  1. Aplikacja jest możliwa w przypadku wystarczającej liczby przypadków do badania: dla określonego typu współczynnika korelacji w zakresie od 25 do 100 par nadzoru.
  2. Drugie ograniczenie wynika z hipotezy analizy korelacji, w której jest układany liniowa zależność zmiennych. W wielu przypadkach, gdy jest niezawodnie wiadomo, że istnieje zależność, analiza korelacji może nie dać wyników po prostu ze względu na fakt, że relacja jest nieliniowa (wyrażona, na przykład w formie paraboli).
  3. Sam fakt zależności korelacji nie zapewnia podstawy argumentowania, które z zmiennych poprzedzających lub jest przyczyną zmian, lub że zmienne są na ogół przyczynowo związane ze sobą, na przykład, ze względu na działania trzeciego czynnika.

Obszar zastosowań

Ta metoda przetwarzania danych statystycznych jest bardzo popularny w gospodarce i naukach społecznych (w szczególności w psychologii i socjologii), choć zakres współczynników korelacji jest rozległy: kontrola jakości produktów przemysłowych, badań agrochemii, hydrobiologii, biometrycznych i innych .

Popularność metody wynika z dwóch momentów: współczynniki korelacji są stosunkowo proste w liczeniu, ich użycie nie wymaga specjalnego szkolenia matematycznego. W połączeniu z prostotą interpretacji prostota współczynnika doprowadziła do szeroko rozpowszechnionego w zakresie analizy danych statystycznych.

Fałszywa korelacja

Często kusząca prostota badań korelacji popycha badacza, aby uczynić fałszywe intuicyjne wnioski o obecności związku przyczynowego między parami znaków, podczas gdy współczynniki korelacji ustanawiają jedynie stosunki statystyczne.

W nowoczesnej ilościowej metodologii nauk społecznych, w rzeczywistości odbyło się odmowę ustanowienia stosunków przyczynowych między obserwowanymi zmiennymi metodami empirycznymi. Dlatego też, gdy naukowcy w naukach społecznych mówią o ustanowieniu powiązań między badanymi zmiennymi, oznacza to albo odpowiednie założenie ogólne lub uzależnienie statystyczne.

Zobacz też

  • Funkcja autokorelacji.
  • Funkcja korespondowalna
  • Covariator.
  • Współczynnik determinacji
  • Analiza regresji

Fundacja Wikimedia. 2010.

Współczynnik korelacji - Jest to wielkość, która może się różnić w zależności od +1 do -1. W przypadku pełnej korelacji dodatnich współczynnik ten jest plus 1 (sugerują, że ze wzrostem wartości jednej zmiennej wartości innej zmiennej wzrasta), a przy kompletnym ujemnym - minus 1 (wskazuje zwrot opinii, tj. Wraz ze wzrostem wartości jednej zmiennej, różne wartości są zmniejszone).

Pr1.:

Wykres uzależnienia od nieśmiałości i dyrezy. Jak widać, punkty (przedmioty) nie są chaotyczne, ale zbudowane wokół jednej linii i patrząc na tę linię, możemy powiedzieć, że im wyższa osoba jest wyrażona w osobie, tym więcej depresywności, tj. Te zjawiska są połączone.

PR2: harmonogram dla nieśmiałości i towarzyszy. Widzimy, że ze wzrostem nieśmiałości maleje spotkań. Ich współczynnik korelacji wynosi -0.43. Zatem współczynnik korelacji większy od 0 do 1 mówi o komunikacji z bezpośrednim proporcjonalnym (większy ... im więcej ...) i współczynnik od -1 do 0 o haniebnym (tym więcej ... .)

Jeśli współczynnik korelacji wynosi 0, obie zmienne są całkowicie niezależne od siebie.

Korelacja - Jest to połączenie, w którym ekspozycja poszczególnych czynników przejawia się tylko jako tendencja (średnio) z masową obserwacją rzeczywistych danych. Przykłady zależności korelacji mogą być zależności między wielkością aktywów Banku a kwotą zysków Banku, wzrost wydajności pracy i doświadczenia pracowników.

Wykorzystywane są dwa systemy klasyfikacji więzi korelacji: ogólne i prywatne.

Klasyfikacja ogólna korelacji: 1) silna lub blisko współczynnika korelacji R\u003e 0,70; 2) średnia na 0,500,70, a nie tylko korelacji wysokiego poziomu istotności.

Poniższa tabela napisała nazwy współczynników korelacji dla różnych rodzajów skal.

Skala dichotomiczna (1/0) Skala rangi (porządkowa)
Skala dichotomiczna (1/0) Współczynnik Stowarzyszenia Pearsona, czterokrotny współczynnik Pearsona. Sywizacyjna korelacja
Skala rangi (porządkowa) Ranga korelacji biserialnej. Współczynnik zakresu korelacji ducha lub Kendalla.
Skala interwałowa i absolutna Sywizacyjna korelacja Wartości skali interwału są tłumaczone na szeregi i jest używany współczynnik rankingu Współczynnik korelacji Pearson (współczynnik korelacji liniowej)

Dla r.=0 brakuje korelacji liniowej. Jednocześnie średnie zmienne grupy pokrywa się ze swoimi średnimi średnimi, a linie regresji są równoległe do osi współrzędnych.

Równość r.=0 mówi tylko o braku zależności liniowej korelacji (niekorozja zmiennych), ale wcale o braku korelacji, a jeszcze bardziej, uzależnienie statystyczne.

Czasami wniosek o braku korelacji jest ważniejszy niż obecność silnej korelacji. Zero korelacji dwóch zmiennych może wskazywać, że nie ma wpływu na jedną zmienną do drugiej, pod warunkiem, że ufamy wyniki pomiarów.

W SPSS: 11.3.2 Współczynniki korelacji.

Do tej pory pomyśliliśmy tylko fakt istnienia uzależnienia statystycznego między dwoma znakami. Następnie spróbujemy dowiedzieć się, które wnioski można wykonać o wytrzymałości lub osłabieniu tej zależności, a także o jego formie i orientacji. Kryteria oceny ilościowej relacji między zmiennymi nazywane są współczynniki korelacji lub środki związane z nimi związane. Dwie zmienne korelują ze sobą pozytywnie, jeśli istnieje bezpośredni, jednokierunkowy stosunek między nimi. W stosunku jednokierunkowym, małe wartości jednej zmiennej odpowiadają małym wartościom innej zmiennej, duże wartości są duże. Dwie zmienne korelują negatywnie, jeśli istnieje odwrotny, wielokierunkowy stosunek między nimi. W stosunku wielokierunkowym małe wartości jednej zmiennej odpowiadają dużym wartościom innej zmiennej i odwrotnie. Wartości współczynników korelacji zawsze leżą w zakresie od -1 do +1.

Współczynnik korelacji między zmiennymi należącymi do skali porządkowej stosuje się we współczynniku współczynnika i dla zmiennych należących do interwału - współczynnik korelacji Pearson (moment robót). Należy zauważyć, że każda zmienna dychotomiczna, która jest zmienna należąca do skali nominalnej i posiadająca dwie kategorie można uznać za porządek porządkowy.

Aby rozpocząć, sprawdzimy, czy korelacja między zmiennymi seksu i psychiki z pliku studium.sav. Jednocześnie biorą pod uwagę, że zmienna dychotomiczna seksu można uznać za zwykły. Wykonaj następujące kroki:

· Wybierz statystyki opisowe (statystyki opisowe) Polecenia w menu polecenia analizy ... (Tabele konirutu)

· Przenieś zmienną płciową do listy ciągów, a zmienna Psyche znajduje się na liście kolumn.

· Kliknij przycisk Statystyki ... (statystyki). W oknie dialogowym Crosstabs: Statystyka wybierz pole wyboru korelacje (korelacja). Potwierdź kontakt z przyciskiem Kontynuuj.

· W oknie dialogowym Crosstabs odmówić wyświetlania tabel, zaznaczając pole wyboru Tables SUPSPRESS. Kliknij przycisk OK.

Współczynniki współczynników korelacji Spirytują i Pearson zostaną obliczone, a ich znaczenie jest sprawdzane:

/ Teoria. Współczynnik korelacji

Współczynnik korelacji - dwuwymiarowe statystyki opisowe, ilość środka relacji (wspólna zmienność) dwóch zmiennych.

Do tej pory opracowano wiele różnych współczynników korelacji. Jednak najważniejsze środki komunikacji - Pearson, Spearman i Kendalla . Ich ogólna funkcja jest taka odzwierciedlają relacje dwóch znaków , mierzone w skali ilościowej - ranga lub metryka .

Ogólnie rzecz biorąc, każde badanie empiryczne koncentruje się na badaniu relacji dwóch lub więcej zmiennych. .

Jeśli zmiana w jednej zmiennej na jednostkę zawsze prowadzi do zmiany innej zmiennej w tej samej wartości, funkcja jest liniowy (harmonogram reprezentuje linię prostą); Wszelkie inne połączenie - nieliniowy . Jeśli wzrost w jednej zmiennej jest związany ze wzrostem drugiego, to komunikacja - pozytywny ( prosto ) ; Jeśli wzrost jednej zmiennej wiąże się ze spadkiem drugiego, następnie komunikacja - negatywny ( odwrotność ) . Jeśli kierunek zmiany jednej zmiennej nie zmienia się wraz ze wzrostem (malejącą) inną zmienną, a następnie taką funkcją - monotonne. ; W przeciwnym razie funkcja jest nazywana nonmonotonic. .

Relacje funkcjonalne są idealizacjami. Ich cechą jest to, że jedna wartość jednej zmiennej odpowiada ściśle określonej wartości innej zmiennej. Na przykład jest to relacja dwóch zmiennych fizycznych - ciężarków i długości ciała (liniowy dodatni). Jednak nawet w eksperymentach fizycznych, relacja empiryczna różni się od relacji funkcjonalnej z powodu niewyjaśnionych lub nieznanych przyczyn: oscylacje składu materiału, błędów pomiarowych itp.

Podczas badania relacji znaków z dziedziny widzenia badacza wiele możliwych przyczyn zmienności tych znaków nieuchronnie spada nieuchronnie. Rezultatem jest to, że nawet istniejące w rzeczywistości, funkcjonalne połączenie między zmiennymi działa empirycznie jako probabilistyczne (stochastyczne): Ta sama wartość jednej zmiennej odpowiada rozkładowi różnych wartości innej zmiennej (i odwrotnie).

Najprostszym przykładem jest stosunek wzrostu i wagi osób. Empiryczne wyniki badania tych dwóch znaków pokażą oczywiście ich pozytywny związek. Ale łatwo jest odgadnąć, że będzie się różnić od ścisłego, liniowego, pozytywnego - idealnej funkcji matematycznej, nawet ze wszystkimi sztuczkami badacza na rachunkowości harmonii lub kompletności przedmiotów. Jest mało prawdopodobne, że na tej podstawie ktoś przyjdzie na myśl, aby zaprzeczyć faktowi obecności ścisłego funkcjonalnego połączenia między długością a ciężarem ciała.

Więc, relacja funkcjonalna zjawisk empirycznie może być wykrywana tylko jako probabilistyczne połączenie odpowiednich znaków.

Wizualna idea charakteru komunikacji probabilistycznej daje diagram dyspersji - wykres, z którego osią odpowiada wartościom dwóch zmiennych, a każdy temat jest punktem. Współczynniki korelacji są używane jako charakterystyka numeryczna komunikacji prawdopodobieństwa.

Możesz wprowadzić trzy oceny wartości korelacji do siły komunikacyjnej:

r.< 0,3 - слабая связь (менее 10% от общей доли дисперсии);

0,3 < r < 0,7 - умеренная связь (от 10 до 50% от общей доли дисперсии);

r\u003e 0,7 - mocna wiązanie (50% lub więcej całkowitej frakcji dyspersji).

Korelacja prywatna

Często zdarza się, że dwie zmienne korelują ze sobą tylko ze względu na fakt, że oboje zmieniają się pod wpływem pewnej trzeciej zmiennej. Oznacza to, że związek między odpowiednimi właściwościami tych dwóch zmiennych jest nieobecny, ale manifestuje się w stosunku statystycznym lub korelacji, pod wpływem całkowitej przyczyny trzeciej zmiennej).

Tak więc, jeżeli korelacja między dwiema zmiennymi zmniejszy się, z ustaloną trzecią wartością losową oznacza to, że ich współzależność występuje po części poprzez wpływ tej trzeciej zmiennej. Jeśli korelacja prywatna jest zerowa lub bardzo mała, możemy stwierdzić, że ich współzależność jest całkowicie ze względu na własny wpływ i nie jest związany z trzecią zmienną.

Ponadto, jeśli korelacja prywatna jest większa niż początkowa korelacja między dwiema zmiennymi, możemy stwierdzić, że pozostałe zmienne osłabiły połączenie lub "ukryty" korelację.

Ponadto konieczne jest to, aby to pamiętać korelacja nie jest przyczynowości . Oparte na tym, nie mamy prawa do projektowania rozmowy o obecności połączenia przyczynowego: Niektóre zupełnie inne niż analiza rozpatrywana w analizie mogą być źródłem tej korelacji. Zarówno ze zwykłą korelacją, jak i w ramach korelacji prywatnych, założenie przyczynowości powinno zawsze mieć własne fundacje nieważne.

Współczynnik korelacji pearson.

r- osoba używane do badania relacji dwóch zmiennych metrycznych , mierzone na tej samej próbce . Istnieje wiele sytuacji, w których jego użycie jest odpowiednie. Czy inteligencja wpływa na występ akademicki na wyższych kursach uniwersytetu? Czy kwota wynagrodzenia pracownika z jego życzliwością dla kolegów? Czy nastrój uczniów wpływa na sukces rozwiązania złożonego zadania arytmetycznego? Odpowiedź na takie pytania badacz musi mierzyć dwa wskaźniki zainteresowania każdego członka próbki.

Wartość współczynnika korelacji nie wpływa na to, jakie znaki są prezentowane, w których jednostki pomiarowe. W związku z tym każda konwersja znaków liniowych (mnożenie do stałej, dodanie stałej) nie zmieniają wartości współczynnika korelacji. Wyjątkiem jest mnożenie jednego ze znaków na stałym stałym: współczynnik korelacji zmienia swój znak na odwrót.

Korelacja Pearsona istnieje komunikacja liniowa między dwiema zmiennymi . Umożliwia określenie , jak proporcjonalne do zmienności dwóch zmiennych . Jeśli zmienne są proporcjonalne do siebie, a następnie graficznie połączenie między nimi może być reprezentowane jako linia prosta z dodatnią (proporcja bezpośrednia) lub ujemna (odwrotna proporcja) przez nachylenie.

W praktyce relacja między dwiema zmiennymi, jeśli jest, jest probabilistyczna i graficznie wygląda jak dyspersja chmury formy elipsoid. Ellipsoid można jednak przedłożyć (przybliżony) w postaci linii prostej lub linii regresji. Linia regresji - Jest to linia prosta skonstruowana przez najmniejszych kwadratów: suma kwadratów odległości (obliczonych wzdłuż osi Y) z każdego punktu harmonogramu rozpraszania do prostego jest minimalny.

Szczególne znaczenie dla oszacowania dokładności przewidywania jest dyspersja szacunków zmiennej zależnej. W rzeczywistości dyspersja szacunków zmiennej zależnej Y jest częścią jego całkowitej dyspersji, która wynika z wpływu niezależnej zmiennej X. Innymi słowy, stosunek dyspersji szacunków zmiennej zależnej do jego prawda Dyspersja jest równa kwadratowi współczynnika korelacji.

Plac współczynnika korelacji zależnych i zmiennych niezależnych jest ułamek dyspersji zmiennej zależnej ze względu na wpływ zmiennej niezależnej i nazywa się współczynnik determinacji . Współczynnik determinacji, pokazuje zatem stopień, w jakim zmienność jednej zmiennej wynika z (określona) z wpływem innej zmiennej.

Współczynnik determinacji ma ważną korzyść w porównaniu z współczynnikiem korelacji. Korelacja nie jest funkcją komunikacji liniowej między dwiema zmiennymi. W związku z tym średnie współczynniki korelacji arytmetycznej dla wielu próbek nie pokrywa się z korelacją obliczoną natychmiast dla wszystkich obiektów z tych próbek (tj. Współczynnik korelacji nie jest dodatnikiem). Wręcz przeciwnie, współczynnik determinacji odzwierciedla połączenie liniowo, a zatem jest dodatek: jego uśrednianie jest dozwolone dla kilku próbek.

Dodatkowe informacje na temat siły komunikacji dają wartość współczynnika korelacji na placu - współczynnik determinacji: jest to część dyspersji jednej zmiennej, którą można wyjaśnić efektem innej zmiennej. W przeciwieństwie do współczynnika korelacji, współczynnik determinacji jest liniowo wzrastający ze wzrostem siły komunikacji.

Współczynniki korelacji ducha i τ-kendalla (korelacje rangi). Jeśli obie zmienne są między którymi badano połączenie, przedstawiono w skali procedury lub jeden z nich - w kolejności, a drugi - w metryce, wówczas stosuje się współczynniki korelacji rangi: Spearman lub τ. - Kendella. . Oraz T. , i inny współczynnik wymaga użycia przed rankingu obu zmiennych. .

Współczynnik korelacji rangi Spearmana - jest to metoda nie parametryczna , który jest używany do celów statystycznych badań komunikacji między zjawiskami . W tym przypadku rzeczywisty stopień równoległości jest określony między dwoma ilościowymi rzędami badanych cech i otrzymuje ocenę definicji ustalonego połączenia przy użyciu ilościowego wymawianego współczynnika współczynnika.

Jeżeli członkowie członków grupy zostały uszeregowane pierwsze wzdłuż zmiennej X, a następnie zgodnie z zmienną Y, następnie można uzyskać korelację między zmiennymi X i Y, po prostu obliczanie współczynnika Pearsona dla dwóch rzędów szeregów. Z zastrzeżeniem braku obligacji w szeregach (to znaczy brak powtarzanych szeregów) na drugiej zmiennej, formuła dla Pearson może być znacznie uproszczona w warunkach obliczeniowych i przekształcona w formułę znaną jako Włócznia .

Współczynnik mocy korelacji rzeki Ducha jest nieco gorsza od siły współczynnika korelacji parametrycznej.

Współczynnik korelacji rangi jest wskazany do zastosowania, jeśli istnieje niewielka liczba obserwacji . Ta metoda może być używana nie tylko do wyraźnie wymawianych danych. , ale także w przypadkach , gdy zarejestrowane wartości są określane przez opisowe oznaki o różnej intensywności .

Współczynnik korelacji rangą alkoholu z dużą liczbą identycznych szeregów na jednej lub oba skomponowanych zmiennych zapewnia grube wartości. Idealnie, oba korelowane wiersze muszą być dwiema sekwencjami niewłaściwymi wartościami.

Alternatywa dla korelacji Spearman dla praw reprezentuje korelację τ-kendalla. . W sercu korelacji zaproponowanej przez M. Kendalle, polega na pomysłu, że kierunek komunikacji można ocenić, w parę porównując testy między sobą: jeśli para testów poniżej X zbiega się w kierunku ze zmianą Y, Oznacza to dodatnie połączenie, jeśli nie pokrywa się - wtedy na ujemnym połączeniu.

Współczynniki korelacji były specjalnie zaprojektowane do numerycznego określenia wytrzymałości i kierunku komunikacji między dwoma właściwościami zmierzonymi w skalach numerycznych (metryczny lub ranga).

Jak już wspomniano maksymalna wytrzymałość komunikatu odpowiada wartościom korelacji +1 (ścisły bezpośrednie lub bezpośrednio proporcjonalne komunikację) i -1 (ścisłej odwrotnej lub tylnej komunikacji proporcjonalnej), brak komunikacji odpowiada korelacji równej zero.

Dodatkowe informacje na temat siły komunikacji nadają wartości współczynnika określania: jest to część dyspersji jednej zmiennej, którą można wyjaśnić przez efekt innej zmiennej.

Temat 12 Analiza korelacji

Zależność funkcjonalna i korelacja. Więcej Hipokratów w VI wieku. pne mi. Zwróciła uwagę na obecność komunikacji między sylwetką i temperamentem ludzi, między strukturą ciała a predyspozycją do jednej lub innych chorób. Niektóre rodzaje tego związku są również identyfikowane u zwierzęcia i świata roślin. Jest więc związek między sylwetką a wydajnością zwierząt gospodarskich; Relacja między jakością nasion a wydajnością uprawianych roślin itp. Jeśli chodzi o takie zależności w ekologii, istnieją zależności między zawartością metali ciężkich w glebie i osłonie śniegu z ich koncentracji w powietrzu atmosferycznym itp. Dlatego, naturalnie pragnienie wykorzystania tego wzoru w interesie człowieka, daje mu mniej lub bardziej dokładny wyraz ilościowy.

Jak wiadomo, matematyczna koncepcja funkcji dotyczy opisać linki między zmiennymi fA.który wkłada zgodnie z każdą konkretną wartością zmiennej niezależnej x. Zdefiniowana wartość zmiennej zależnej y.. . Tego rodzaju jednoznaczne relacje między zmiennymi x. i y. Połączenie funkcjonalny. Jednak ten rodzaj komunikacji w naturalnych obiektach jest zawsze od zawsze. Dlatego zależność między biologicznymi, a także oznakami środowiskowymi nie jest funkcjonalna, ale natura statystyczna, gdy w masie jednorodnych osób, pewna wartość jednej funkcji uważana za argument odpowiada nie jest to samo znaczenie numeryczne, ale całość Zakres dystrybucji odmian liczbowych wartości innej funkcji uważaną za zmienną zależną lub funkcję. Ten rodzaj zależności między zmiennymi jest nazywany korelacja lub korelacja ..

Obligacje funkcjonalne można łatwo wykryć i mierzyć na obiektach pojedynczych i grupowych, ale nie można tego zrobić za pomocą wiązań korelacji, które mogą być badane tylko na obiektach grupowych metodami statystyk matematycznych. Obligacja korelacji między objawami jest liniowa i nieliniowa, pozytywna i negatywna. Zadanie analizy korelacji zmniejsza się do ustanowienia kierunku i formy komunikacji między różnymi znakami, pomiaru jego szlifowania, a na koniec w celu weryfikacji dokładności selektywnych wskaźników korelacji.

Zależność między zmiennymi X. i Y. Może być wyrażony analitycznie (za pomocą formuł i równań) i graficznie (jako położenie geometryczne w systemie współrzędnych prostokątnych). Wykres uzależnienia korelacji jest zbudowany przez funkcję równania lub wywołane regresja. Tutaj i - średnia arytmetyka znaleziona na stanie X. lub Y. Niektóre wartości będą akceptować x. lub y.. Nośnik te są nazywane warunkowy.

11.1. Wskaźniki komunikacji parametrycznej

Współczynnik korelacji. Conams między wartościami zmiennymi x. i y. Możesz ustawić, dopasowując wartości numeryczne jednego z nich z odpowiednimi wartościami drugiej. Jeśli druga wzrasta wraz ze wzrostem jednej zmiennej, wskazuje, że pozytywna komunikacja między tymi wartościami i odwrotnie, gdy wzrost jednej zmiennej towarzyszy spadek wartości innej, wskazuje to negatywna komunikacja.

Aby scharakteryzować połączenie, jego kierunek i stopień konitulacji zmiennych są używane przez następujące wskaźniki:

    uzależnienie liniowe - współczynnik korelacji;

    nieliniowy - relacja korelacji.

Aby określić empiryczny współczynnik korelacji, używany jest następujący formuła:

. (1)

Tutaj s. x. i s. y. - Średnie odchylenia kwadratowe.

Współczynnik korelacji można obliczyć bez uciekania się do obliczania średnich odchyleń kwadratowych, co upraszcza prace obliczeniowe, zgodnie z poniższym podobnym wzorem:

. (2)

Współczynnik korelacji jest liczbą bezwymiarową w zakresie od -1 do +1. W przypadku niezależnej zmienności znaków, gdy związek między nimi jest całkowicie nieobecny ,. Im silniejsza konitulacja między znakami, tym wyższa wartość współczynnika korelacji. Dlatego z tym wskaźnikiem charakteryzuje nie tylko obecność, ale także stopień konitutualności między znakami. Z dodatnim lub bezpośrednim połączeniem, gdy duże wartości jednej funkcji odpowiadają największym wartościom drugiego, współczynnik korelacji ma pozytywny znak i znajduje się w zakresie od 0 do +1, z negatywną lub informacją zwrotną, Gdy mniejsze wartości pozostałych odpowiadają dużym wartościom jednej funkcji, współczynnik korelacji towarzyszy znak ujemny i wynosi od 0 do -1.

Współczynnik korelacji był szeroko stosowany w praktyce, ale nie jest to uniwersalny wskaźnik wiązań korelacji, ponieważ tylko połączenia liniowe są w stanie scharakteryzować, tj. wyrażone przez równanie regresji liniowej (patrz temat 12). Jeśli istnieją zależność nieliniowa między różnymi znakami, stosuje się inne wskaźniki komunikacji, omówione poniżej.

Obliczanie współczynnika korelacji. Obliczenia to jest wytwarzane na różne sposoby i na różne sposoby w zależności od liczby obserwacji (pobieranie próbek). Rozważ osobno specyfikę obliczania współczynnika korelacji w obecności małych próbek i próbek dużej objętości.

Małe próbki.. W obecności małych próbek współczynnik korelacji jest obliczany bezpośrednio przez wartości znaków koniugatu, bez przed grupowaniem przykładowych danych do opasek zmiennych. W tym celu podawane są powyższe wzory (1) i (2). Wygodniejsze, zwłaszcza w obecności liczb wielowartościowych i ułamkowych, które są wyrażone przez wariant h. jA. i y. jA. Od średniej i podano następujące wzory pracy:

gdzie ;

;

Tutaj x. jA. i y. jA. - Sparowane wersje znaków koniugatu x. i y.; i arytmetyki; - Różnica między opcjami znaków koniugatu x. i y.; n. - Całkowita liczba sparowanych obserwacji lub ilość selektywnego kruszywa.

Empiryczny współczynnik korelacji, jak każdy inny wskaźnik selektywny, służy jako ocena jego ogólny parametr. ρ A jako wartość losowa towarzyszy błąd:

Stosunek selektywnego współczynnika korelacji do jego błędu służy jako kryterium sprawdzania hipotezy zerowej - założeniem, że w ogólnej populacji ten parametr jest zero, tj. . Zerowa hipoteza odrzuca na akceptowanym poziomie znaczenia α , Jeśli

Wartości punktów krytycznych t. Św. Dla różnych poziomów znaczenia α i liczba stopni swobody podano w tabeli 1 aplikacjach.

Ustalono, że podczas przetwarzania małych próbek (zwłaszcza gdy n.< 30 ) Obliczanie współczynnika korelacji zgodnie z wzorami (1) - (3) daje kilka niedocenianych szacunków parametru ogólnego ρ . Konieczne jest dokonanie następującej poprawki:

rybak Z-konwersja. Właściwe zastosowanie współczynnika korelacji obejmuje normalny rozkład dwóch wymiarowych wartości koniugatowych zmiennych losowych x. i y.. Od statystyk matematycznych wiadomo, że ze znaczącą korelacją między zmiennymi, tj. gdy R. xY. > 0,5 Selektywny rozkład współczynnika korelacji dla większej liczby małych próbek pobranych z normalnie dystrybucji populacji ogólnej jest znacznie odchylony od normalnej krzywej.

Biorąc pod uwagę tę okoliczność R. Fisher. Znalazłem dokładniejszy sposób na oszacowanie ogólnego parametru do wartości selektywnego współczynnika korelacji. Ta metoda spada do wymiany R. xY. Transformowana wartość Z, która jest związana z empirycznym współczynnikiem korelacji, w następujący sposób:

Dystrybucja wartości Z jest prawie niezmieniona w postaci, ponieważ niewiele zależy od wielkości próbki i wartości współczynnika korelacji w ogólnej populacji i zbliża się do normalnego rozkładu.

Kryterium niezawodności wskaźnika Z jest następującą postawą:

Hipoteza zerowa jest odrzucana na akceptowanym poziomie znaczenia α i liczba stopni wolności. Wartości punktów krytycznych t. Św. Dioda w tabeli 1 aplikacjach.

Podanie z-transformacja Umożliwia ocenę istotności statystycznej selektywnego współczynnika korelacji, a także różnicę między współczynnikami empirycznymi, gdy pojawia się potrzeba.

Minimalny rozmiar próbki do dokładnego oszacowania współczynnika korelacji. Możesz obliczyć rozmiar próbki do określonej wartości współczynnika korelacji, które byłyby wystarczające do obalenia hipotezy zerowej (jeśli korelacja między znakami Y. i X. naprawdę istnieje). Dla tego służy jako następujący wzula:

gdzie n. - pożądany rozmiar próbki; t. - wartość określona zgodnie z przyjętym poziomem istotności (lepiej dla α \u003d 1%); z. - przekształcony współczynnik korelacji empirycznej.

Duże próbki.. W obecności wielu danych źródłowych muszą być zgrupowane w rzędy wariatyczne, a konstruowanie siatki korelacji, różnicę w komórkach (komórkach) ogólne częstotliwości koniugatu rzędów. Grille korelacji jest utworzona przez przecięcie wierszy i kolumn, której liczba jest równa liczbie grup lub klas skorelowanych wierszy. Zajęcia znajdują się w górnym ciągu iw pierwszej (po lewej) kolumnie tabeli korelacji, a całkowite częstotliwości wskazane przez symbol fA. xY. - W komórkach kratownicy korelacji, która stanowi główną część tabeli korelacji.

Zajęcia umieszczone w górnej linii stołu są zwykle znajdujące się z lewej do prawej w kolejności, w pierwszej kolumnie tabeli - od góry do dołu w kolejności malejącej. Dzięki tej lokalizacji klasy serii wariacyjnej, ich całkowite częstotliwości (jeśli istnieje dodatnie połączenie między znakami Y. i X.) Zostaną rozpowszechniane przez komórki sieciowe w postaci elipsy ukośnie z lewego dolnego rogu do prawego górnego rogu kraty lub (w obecności negatywnego połączenia między znakami) w kierunku z lewego górnego rogu do prawego dolnego rogu kratownicy. Jeśli częstotliwość fA. xY. Jest dystrybuowany nad komórkami kraty korelacji mniej równomierniej, bez tworzenia liczby elipsy, wskaże brak korelacji między znakami.

Rozkład częstotliwości fA. xY. Zgodnie z komórkami sieci korelacji, tylko ogólna idea obecności lub braku komunikacji między znakami. Oznaczać lub mniej tylko ze względu na wartość i znak współczynnik korelacji. Przy obliczaniu współczynnika korelacji z wstępnym grupowaniem próbek danych w przedziałach oddziałowych nie należy przyjmować zbyt szerokich przedziałów klasowych. Szorstki grupowanie jest znacznie silniejsze niż wartość współczynnika korelacji niż następuje przy obliczaniu średnich wartości i wskaźników zmienności.

Przypomnijmy, że wielkość interwału klasy jest określona przez formułę

gdzie x. max. , x. min. - maksymalne i minimalne opcje kombinacji; DO - Liczba zajęć, do których należy podzielić charakterystykę cechy. Doświadczenie pokazało, że w dziedzinie analizy korelacji, wielkość DO Może być uzależniony od wielkości próbki w przybliżeniu w następujący sposób (Tabela 1).

Tabela 1

Objętość próbkowania

Co oznacza k.

50 ≥ N\u003e 30

100 ≥ N\u003e 50

200 ≥ N\u003e 100

300 ≥ N\u003e 200

Podobnie jak inne cechy statystyczne obliczone z wstępnym grupowaniem danych początkowych do serii wariacyjnej, współczynnik korelacji jest określony przez różne metody, które zapewniają całkowicie identyczne wyniki.

Metoda prac. Współczynnik korelacji można obliczyć za pomocą podstawowych wzorów (1) lub (2), dokonując korekcji do powtarzalności wersji w całości dimerycznej. Jednocześnie uproszczenie symboliki, odchylenia od ich średnich oznaczonych przez ale. i. Następnie wzorze (2), biorąc pod uwagę powtarzalność odchyleń, przejmie następującą ekspresję:

Wiarygodność tego wskaźnika szacowana jest przez kryterium ucznia, która reprezentuje stosunek selektywnego współczynnika korelacji do jego błędu określonego przez wzór

Dlatego, a jeśli ta wartość przekracza standardową wartość studenta CRITERATATY ST stopnia swobody i poziomu znaczenia (patrz tabela 2 aplikacji), a następnie odrzucana jest hipoteza zerowa.

Metoda średnich warunkowych. Przy obliczaniu współczynnika korelacji opcji odchylenia ("klasy") można znaleźć nie tylko ze średnich arytmetyków i, ale także na średniej warunkową i X i Y. W tym przypadku sposób w liczbie wzoru (2) dokonuje korekty, a formuła nabywa następującą formę:

gdzie fA. xY. - częstotliwości klasy jednego i innych rzędów dystrybucji; i to. Odchylenia klas od średnich warunkowych związanych z wielkością interwałami klas λ ; n. - całkowita liczba sparowanych obserwacji lub próbkowania; i - warunkowe chwile pierwszego rzędu, gdzie fA. x. - Częstotliwości wiersza H., ale fA. y. - Częstotliwości wiersza Y.; s. x. i s. y. - Średnio kwadratowe odchylenia serii X.i Y.obliczony przez wzór.

Sposób średnich warunkowych ma przewagę nad metodą prac, ponieważ umożliwia uniknięcie transakcji z numbami ułamkowymi i daje ten sam (pozytywny) znak odchyleń zA. x. i zA. y. To upraszcza technikę prac obliczeniowych, zwłaszcza w obecności wielowartościowych numerów.

Ocena różnicy między współczynnikami korelacji. Przy porównywaniu współczynników korelacji dwóch niezależnych próbek, hipoteza zerowa zmniejsza się do założenia, że \u200b\u200bw ogólnej populacji różnica między tymi wskaźnikami wynosi zero. Innymi słowy, należy postępować z założenia, że \u200b\u200bróżnica zaobserwowana między kompetentnymi empirycznymi współczynnikami korelacji wystąpiła przez przypadek.

Aby sprawdzić hipotezę zerową, kryterium Studenta jest serwowane, tj. Stosunek różnicy między empirycznymi współczynnikami korelacji R. 1 i R. 2 Do jego błędu statystycznego określonego przez wzór:

gdzie s. R1. i s. R2. - Błędy porównania współczynników korelacji.

Zerowa hipoteza jest redagowana, pod warunkiem, że stopa znaczenia ma α i liczba stopni wolności.

Wiadomo, że bardziej dokładna ocena dokładności współczynnika korelacji otrzymuje się przez przeniesienie R. xY. Numer z.. Nie wyjątkiem i ocena różnicy między selektywnymi współczynnikami korelacji R. 1 i R. 2 , zwłaszcza w przypadkach, gdy te ostatnie są obliczane na próbkach stosunkowo małej objętości ( n.< 100 ) I w swojej wartości bezwzględnej znacznie przekracza 0,50.

Różnica szacowana jest przez Student T-Criterion, który jest wbudowany w odniesieniu do tej różnicy w jego błędzie obliczany przez wzór

Hipoteza zerowa odrzucająca się, jeśli za przyjęty poziom istotności.

Korelantion.. Aby zmierzyć relacje nieliniowe między zmiennymi x. i y. Użyj wskaźnika, który jest nazywany związek korelacjiopisuje połączenie dwustronne. Projektowanie relacji korelacji obejmuje porównanie dwóch rodzajów zmienności: zmienność indywidualnych obserwacji w odniesieniu do poszczególnych średnich i odmian średnie prywatnych w porównaniu z całkowitą średnią wartością. Mniejsza część będzie pierwszym składnikiem w stosunku do drugiego, tematy komunikacji będą większe. W limicie, gdy nie ma odmiany poszczególnych znaków w pobliżu średnich prywatnych, będzie bardzo duży. Podobnie, w przypadku braku zmienności średnich prywatnych, sprzęgło jest minimalne. Ponieważ ten stosunek zmienności można rozważyć dla każdego z dwóch znaków, otrzymuje się dwa wskaźniki szczelności - h. yx. i h. xY. . Relacja korelacji jest wartością względnej i może podjąć wartości od 0 do 1. w tym samym czasie, współczynniki współczynnika korelacji są zwykle równe sobie nawzajem, tj. . Równość między tymi wskaźnikami jest możliwa tylko z ściśle liniowymi relacjami między znakami. Relacja korelacji jest wskaźnikiem uniwersalnym: umożliwia scharakteryzowanie dowolnej formy korelacji i liniowej i nieliniowej.

Wskaźniki korelacji. h. yx. i h. xY. Określ metody omówione powyżej, tj. Sposób prac i metodą średnich warunkowych.

Metoda prac. Wskaźniki korelacji. h. yx. i h. xY. Określ następujące wzory:

gdzie i - dyspersje grupowe,

dyspersje i ogólne dyspersje.

Tutaj i - ogólny średnia arytmetyka i - grupa średnia arytmetyczna; fA. yi. - Częstotliwości wiersza Y., ale fA. xi. - Częstotliwości wiersza X.; k. - liczba zajęć; n. - liczba różnych znaków.

Formuły do \u200b\u200bobliczania wskaźników korelacji są następujące:

Metoda średnich warunkowych. Określanie współczynników stosunku korelacji przez wzory (15), odchylenia opcji klasy x. jA. A Y mogę zabrać nie tylko ze średnich arytmetyków i, ale także z średniej warunkowej i X i Y. W takich przypadkach grupa i ogólne odchylenia są obliczane przez wzory i, jak i, i gdzie.

W rozmieszczonej formie formuły (15) wyglądają tak:

;

. (17)

W tych wzorach i - odchylenia klas z średnich warunkowych, skróconych przez wartość przedziałów klasowych; Wartości zA. y. i zA. x. Wyrażono liczbę naturalnych wierszy: 0, 1, 2, 3, 4, .... Symbole ostalowe są wyjaśnione powyżej.

Porównując metodę prac z metodą średniej warunkowej, nie można nie zauważyć zalet pierwszej metody, zwłaszcza w przypadkach, w których musisz radzić sobie z liczbami wielofunkcyjnymi. Podobnie jak inne wskaźniki selektywne, relacja korelacji jest oszacowaniem jego ogólnego parametru i, jako wartość losowa, towarzyszy błąd określony przez wzór

Dokładność szacowania korelacji można sprawdzić przez kryterium T Studenta. H 0 jest hipoteciami z założenia, że \u200b\u200bogólny parametr wynosi zero, tj. Należy wykonać następujący warunek:

dla liczby stopni wolności i poziomu znaczenia.

Współczynnik determinacji. Interpretować wartości podjęte przez wskaźniki szczelności korelacji; współczynniki determinacji.Który pokazuje, jaki proporcja odmian jednej funkcji zależy od zmienności innej funkcji. W obecności połączenia liniowego współczynnik determinacyjny jest kwadratem współczynnika korelacji R2 XY i z niezależnością nieliniową między znakami y. i x. - Plac współczynnika korelacji H2 YX. Współczynniki determinacyjne dają powód, aby zbudować następującą przykładową skalę, umożliwiając osądzenie szczelności związku między objawami: przyłączenie jest uważane za średnie; Wskazuje słabe połączenie i tylko wtedy, gdy można ocenić silne połączenie, gdy około 50% charakterystyki funkcji Y. Zależy od odmiany funkcji X..

Ocena formularza komunikacji. Z ściśle liniowymi relacjami między zmiennymi y. i x. Równość jest przeprowadzana. W takich przypadkach współczynniki stosunku korelacji pokrywa się z wartością współczynnika korelacji. Zbieg okoliczności w tej wartości i współczynniki określania, tj. . W związku z tym, pod względem różnicy między tymi wartościami, można ocenić formę uzależnienia z korelacji między zmiennymi y. i x.:

Oczywiście, z liniowym połączeniem między zmiennymi y. i x. Wskaźnik γ będzie zerowy; Jeśli połączenie między zmiennymi y. i x. Nieliniowy, γ\u003e 0.

Wskaźnik γ jest oszacowaniem ogólnego parametru i, jako wartość losowa, należy zweryfikować. Niniejsze wpływa z założenia, że \u200b\u200bzwiązek między wartościami y. i x. Liniowy (zerowa hipoteza). Sprawdź, że hipoteza umożliwia Fisher F-kryteria:

gdzie zA. - liczba grup lub klas serii wariacyjnej; N - objętość próbkowania. Hipoteza zerowa jest odrzucana, jeśli aplikacje są poziomo (znalezione poziomo), (znalezione w pierwszej kolumnie tej samej tabeli) i przyjętym poziomem istotności.

Określenie znaczenia korelacji

Klasyfikacja współczynników korelacji

Współczynniki korelacji charakteryzują się siłą i znaczeniem.

Klasyfikacja współczynników korelacji do siły.

Klasyfikacja współczynników korelacji do znaczenia.

2 z tych klasyfikacji nie należy mylić, ponieważ definiują różne cechy. Silna korelacja może być przypadkowa i stała się niewiarygodna. Szczególnie często zdarza się w próbce z małym objętością. W dużej próbce nawet słaba korelacja może być wysoko ceniona.

Po obliczeniu współczynnika korelacji konieczne jest umieszczenie hipotez statystycznych:

H 0: Wskaźnik korelacji nie różni się znacząco od zera (jest losowy).

H 1: Wskaźnik korelacji znacznie różni się od zera (jest nie-losowy).

Sprawdzanie hipotezy w porównaniu z wynikami wzmocnionymi współczynnikami empirycznymi z wartościami krytycznymi tabelami. Jeśli znaczenie empiryczne osiągnie krytyczne lub przekracza go, to hipoteza zerowa zostanie odrzucona: r emf ≥ r KR, ale þ H 1. W takich przypadkach stwierdzają, że wykryto dokładność różnic.

Jeśli znaczenie empiryczne nie przekracza krytycznego, wówczas hipoteza zerowa nie jest odrzucana: R EMF< r кр Þ Н 0 . В таких случаях делают вывод, что достоверность различий не установлена.

Statystyki / korelacja

Obliczanie matrycy sparowanych współczynników

korelacja

Aby obliczyć matrycę sparowanych współczynników korelacji, zadzwoń do menu Matryce korelacji. moduł Podstawastatystycy..

Figa. 1 panel modułu Statystyki podstawowe

Główne etapy analizy korelacji w systemie StatST_S będzie spojrzeć na dane z przykładu (patrz rys. 2). Początkowe dane są wynikiem obserwacji działalności 23 przedsiębiorstw jednego z branż.

Rys.2 Dane początkowe

Wykresy stołu zawierają następujące wskaźniki:

Opłacalna - rentowność,%;

Udział podrzędny jest udział pracowników w składzie PPP, jednostek;

Fondono - Fondo Studios, jednostki;

Osnfonds - średnia roczna wartość głównych zakładów produkcyjnych, milion rubli;

Niepowiedziane - koszty nieprodukcyjne, tysiące rubli. Wymagane jest zbadanie zależności rentowności od innych

wskaźniki GIH.

Przypuśćmy, że pod uwagę znaki rozważane w ogólnym krumieniu podlegają normalnym prawu dystrybucji, a te obserwacje są próbką kruszywa.

Oblicz sparowane współczynniki korelacji między wszystkimi zmiennymi. Po wybraniu linii Matryce korelacji. Na ekranie pojawi się okno dialogowe. Korelacje pearson.. Nazwa wynika z faktu, że po raz pierwszy ten współczynnik był Pearson, Edgeworth i Veldon.

Wybierz zmienne do analizy. Aby to zrobić, są dwa przyciski w oknie dialogowym: Kwadrat. macierz (jedna lista) i Dobrze. macierz (dwie listy).


Figa. 3 Okno dialogowe analizy korelacji

Pierwszy przycisk ma na celu obliczenie matrycy niestandardowej. Symetryczne gatunki z współczynnikami korelacji parami wszystkich kombinacji zmiennych. Jeśli używasz wszystkich wskaźników podczas analizy, możesz nacisnąć przycisk w oknie dialogowym Zmienne wybór. Wybierz wszystko. (Jeśli zmienne nie są z rzędu, możesz wybrać kliknięcie myszy z jednocześnie naciśnięciem klucza Ctrl.)


Jeśli klikniesz Detale. Zostanie wyświetlone okno dialogowe, dla każdej zmiennej długiej nazwy zostanie wyświetlone. Klikając ten przycisk ponownie (zostanie nazwany Krótko) Dostaję krótkie imiona.

Przycisk Informacja Otwiera okno dla wybranego ponownego, w którym można wyświetlić jego charakterystykę: długie imię, format wyświetlania, posortowana lista wartości, statystyki opisowe (liczba wartości, średnia, odchylenie standardowe).

Po wybraniu zmiennych kliknij przycisk OK lub przycisk Corre.lata. Okno dialogowe Korelacja osoba. Na ekranie pojawia się obliczona matryca korelacji.

Znaczące współczynniki korelacji na ekranie są podświetlone na czerwono.

W naszym przykładzie wskaźnik rentowności był najbardziej związany z wskaźnikami fondoostitch. (Link Direct) i wydatki produkcyjne. (Sprzężenie zwrotne, obejmujące zakończenie V z rosnącym X). Ale jak ściśle są znaki wzajemnie zadowoleni? Tight jest uważany za połączenie z wartościami współczynnika modułu większym niż 0,7 i słaby - mniej niż 0,3. Tak więc, z dalszą konstruowaniem równania regresji, należy ograniczyć się do wskaźników "funduszu" i "wydatków nieprodukcyjnych" jako najbardziej informacyjnych.

Jednak w naszym przykładzie jest zjawisko. wielokolorowy, Gdy istnieje łącze między samymi zmiennymi niezależnymi (współczynnik korelacji pary w module jest większa niż 0,8).

Opcja prostokątna matryca (dwie listy zmiennych) otwiera okno dialogowe do wyboru dwóch zmiennych list. Pozować jak na zdjęciu


W rezultacie otrzymujemy prostokątną matrycę korelacji zawierającej tylko współczynniki korelacji z zmienną zależną.


Jeśli jest zainstalowana opcja Corr. Matryca (sensowne próbki),następnie po kliknięciu przycisku Korelacja Zostanie zbudowana macierz z Coeoph, odizolowane na poziomie znaczenia r..


Jeśli wybrano opcję Szczegółowe wyniki tabeli, a następnie na guziku Korelacja, otrzymujemy tabelę, która zawiera nie tylko współczynniki korelacji, ale także średnie, odchylenia Mill-Dart, współczynniki równania regresji, jego członek Bodie w równaniu regresji i innych statystykach


Gdy zmienne mają niewielką względną zmienność (stosunek odchylenia standardowego średnio mniejszej niż 0,00 mld 20 000 000 0001), wymagane jest wyższy stopień oceny. Można go ustawić, umieszczając opcję obliczeniową ze zwiększającym dokładnością okna dialogowego korelacji Pearson.

Tryb pracy z nieodebranymi danymi jest określona przez Desigid Usunięcie PD. Jeśli go wybierzesz, statіst ignoruje wszystkie obserwacje, które pomijają. W przeciwnym przypadku dokonuje się usuwanie parami.

Wykazujący tryb wyświetlania długich nazwy zmiennych spowoduje stół o długiej nazwy zmiennych.

Graficzny wizerunek zależności korelacji

Okno dialogowe Korelacji Pearson zawiera wiele przycisków, aby uzyskać graficzny wizerunek zależności korelacji.

Opcja Rozpraszająca 2M buduje sekwencję wykresu rozpraszania dla każdej wybranej zmiennej. Okno do wyboru jest identyczne z rysunkiem 6. Po lewej stronie należy określić żywe zmienne, po prawej niezależnej - opłacalne. Klikając OK, otrzymujemy wykres, na którym zostanie przedstawiony wyrównanie bezpośredniego regresji i zaufania granic Rognozy.

Współczynnik korelacji liniowej daje najbardziej obiektywną ocenę tonu komunikacji, jeśli lokalizacja punktów w układzie współrzędnych przypomina linię bezpośrednią lub wydłużoną elipsę, jeśli punkty znajdują się w postaci krzywej, a następnie współczynnik organizacji daje rating dotknięty.

Na podstawie harmonogramu możemy ponownie potwierdzić relację między wskaźnikami rentowności i fundamentów, ponieważ obserwacje te znajdują się w postaci skłonnej elipsy. Należy powiedzieć, że relacja jest uważana za fakt, że istnieje punkt blistry do głównej osi elipsy.

W naszym przykładzie zmiana wskaźnika Fundacji na jednostkę doprowadzi do zmiany rentowności o 5,776%.

Spójrzmy na wpływ wydatków bez produktywnych na wartość rentowności. Aby to zrobić, zbuduj podobny harmonogram

Analizowane dane są już mniej przypomniane przez formularz elipsy, a współczynnik korelacji jest nieco niższy. Znaleziono wartość współczynnika regresji pokazuje, że wraz ze wzrostem wydatków bez produkcji na 1000 rubli, rentowność zmniejsza się o 0,7017%.

Należy zauważyć, że budowa regresji wielokrotnej (rozpatrywanej w kolejnych rozdziałach), gdy równanie jest jednocześnie oba cechy, prowadzi do innych wartości współczynników regresji, co wyjaśnia interakcję wyjaśniającą zmienne między sobą .

Podczas korzystania z przycisków Nazwa punktu na diagramie rozpraszania otrzymasz odpowiednie liczby lub nazwy, jeśli są predefiniowane.

Poniższa opcja wskazująca grafika macierzy buduje przewyższenia diagramów rozpraszających dla wybranych zmiennych.

patrząc graficzny element tej matrycy zawiera pola korelacyjne-jowizowane utworzone przez odpowiednie zmienne

Żonaty na ich linii regresji.

Podczas analizy matrycy diagramów rozpraszających należy zwrócić uwagę na te wykresy, których linie regresji mają znaczne nachylenie do osi X, co sugeruje istnienie współzależności między odpowiednimi początkowymi znakami.

Opcja rozproszenia SM buduje trójwymiarową pole korelacji dla wybranych zmiennych. Jeśli używany jest przycisk Nazwa, punkty na diagramie rozpraszania będą oznaczone liczbami lub nazwami odpowiednich obserwacji, jeśli ich mają.

Powierzchnia opcji graficznej buduje SM do diagramu rozpraszania dla wybranych trzech zmiennych wraz z dopasowaną powierzchnią drugiego rzędu.

Katagor opcji. Schematy rozpraszające z kolei budują kaskadę pola korelacji dla wybranych wskaźników.

Po naciśnięciu odpowiedniego przycisku program poprosi użytkownika o wykonanie dwóch zestawów wybranych wcześniej za pomocą przycisku zmiennych. Następnie na ekranie pojawi się nowy.

okno zapytań do zadania zmiennej grupowania, na podstawie której zostaną sklasyfikowane wszystkie dostępne obserwacje.

Rezultatem jest budowa pola korelacji w cięciach grup obserwacyjnych dla każdej pary zmiennych, reakcja do różnych list

3.4. Obliczanie prywatnych i wielu współczynnikówkorelacje

Obliczyć prywatne i wielokrotne współczynniki KOR. Moduł połączeń relacji Wielokrotna regresjaZa pomocą przycisku przełącznika modułu. Na ekranie pojawi się następujące okno dialogowe:

naciśnij przycisk Zmienne, wybierz zmienne do analizy: Po lewej zależnej - rentownośći po prawej stronie niezależnej - fondoostitch. i nieproduktywne wydatki. Pozostałe zmienne nie będą uczestniczyć w dalszej analizie - w oparciu o analizę korelacji, są one uznawane za nieinformatywne dla modelu regresji.

W polu Wprowadzanie plików. Wspólne dane źródłowe są proponowane jako dane wejściowe, które są tabelą z zmiennymi i obserwacjami lub matrycą korelacji. Matryca korelacji może być wstępnie utworzona w samym module regresji wielokrotnej lub oblicz szybkie podstawowe statystyki za pomocą opcji.

Podczas pracy z plikiem źródłowym można ustawić renderowanie pomijania:

    Wybudowa. Jeśli ta opcja zostanie wybrana, tylko te obserwacje, które nie są nieodebrane we wszystkich wybranych zmiennych, są używane w analizie.

    Średnia substytucyjna. Nieodebrane wartości w każdej zmiennej zastępuje się średnią obliczoną przez istniejące pełne obserwacje.

    Usunięcie rodzicielskie nieodebranych danych. Jeśli ta opcja zostanie wybrana, a następnie przy obliczaniu korelacji pary, obserwacje, które nieodebrane wartości w odpowiednich parach są usuwane.

W polu Rodzaj regresji Użytkownik może wybrać standardową lub stałą regresję nieliniową. Domyślnie wybrana jest standardowa analiza regresji wielokrotnej, w której obliczana jest standardowa macierz korelacji wszystkich wybranych zmiennych.

Tryb Naprawiono regresję nieliniową Umożliwia przeprowadzenie różnych transformacji zmiennych niezależnych. Opcja Analiza postępowania Domyślnie ustawienia odpowiednie do definicji standardowej rozkoszy regresji, w tym bezpłatnego członka. Jeśli ta opcja zostanie anulowana, następnie po kliknięciu przycisku OK panel startowy, określenie okna dialogowego Definicja modelu, w którym jesteś ejetem do wyboru jako rodzaj analizy regresji (na przykład krok po kroku, grzebień itp.) I inne opcje.

Sprawdzanie wyboru opcji linii Pokaż opisowy opisowyCorr. Matryjscy. I klikając OK, uzyskujemy okno dialogowe z charakterystyką danych statystycznych.

W nim można przeglądać szczegółowe statystyki opisowe (w tym liczba obserwacji, przez które obliczono współczynnik korelacji dla każdej pary zmiennych). Aby kontynuować analizę i otwórz okno dialogowe Deteracja modelu, kliknij OK.

Jeśli analizowane wskaźniki mają niezwykle małą względną dyspersję obliczoną jako ogólną dyspersję podzieloną średnio, a następnie zaznacz pole wyboru w pobliżu opcji Obliczenia o wysokiej dokładności Aby uzyskać dokładniejsze wartości elementów macierzy korelacji.

Instalując wszystkie niezbędne parametry w oknie dialogowym. Wielokrotna regresja, Naciśnij OK i uzyskaj wyniki wymaganych obliczeń.

Według naszego przykładu wielokrotny współczynnik korelacji okazał się 0,61357990, a odpowiednio, współczynnik określony wynosi 0,37648029. Zatem tylko 37,6% dyspersji wskaźnika "rentowność" wyjaśniono przez pomiar wskaźników "badania funduszy" i "kosztów nieprodukcyjnych". Taka niska wartość wskazuje brak liczby czynników wprowadzonych do modelu. Spróbujmy zmienić liczbę zmiennych niezależnych, dodając listę re- "Fundusze główne" (wprowadzenie do modelu wskaźnika "Udział pracowników w PPP" prowadzi do multicollenance, co jest niedopuszczalne). Współczynnik determinacyjny wzrósł nieco, ale nie tak wiele do znacząco poprawy wyników - jego wartość wynosiła około 41%. Oczywiście nasz domek wymaga dodatkowych badań w celu zidentyfikowania czynników wpływających na rentowność.

Znaczenie współczynnika współczynnika korelacji jest bez wątpienia bez wątpienia na tabeli Fischera F-kryteria. Hipoteza jej znaczenia jest odrzucona, jeśli wartość prawdopodobieństwa odchylenia przekracza określony poziom (najczęściej pobrany A \u003d 0,1, 0,05; 0,01 0,001). W naszym przykładzie p \u003d 0,008882< 0.05, что свидетельствует о значимости коэффициента.

Tabela wyników zawiera następujące wykresy:

    Współczynnik beta (C) - standaryzowany współczynnik regresji odpowiednich zmiennych;

    Korelacja prywatna - Współczynniki prywatne korelacji między odpowiednią zmienną a zależną, przy ustalaniu wpływu pozostałych w modelu.

Prywatny współczynnik korelacji między rentownością a funduszem studentem w naszym przykładzie wynosi 0,459899. Oznacza to, że po wejściu do modelu wskaźnika nieodtwarzalnego RAS-EVI wpływ funduszy na rentowność nieco jest nieco - od 0,49 (wartość współczynnika korelacji parę) 0,46. Zmniejszył się również podobny współczynnik wskaźnika wydatków nie pochodnych - od 0,46 (wartość stosunku pary korelacji) do 0,42 (podejmują wartość modułu), charakteryzuje zmianę połączenia z zmienną zależną od Wejście w modelu wskaźnika fundamentu.

    Korelacja partii jest korelacją między nieskorowaną zmienną zależną a odpowiednim niezależnym z uwzględnieniem wpływu pozostałych w modelu.

    Tolerancja (zdefiniowana jako 1 minus kwadrat korelacji mnogiej między odpowiednią zmienną a wszystkimi zmiennymi niezależnymi w równaniu regresji).

    Współczynnik determinacyjny jest kwadratem wielokrotnego współczynnika korelacji między odpowiednią zmienną niezależną a wszystkimi innymi zmiennymi zawartymi w równaniu regresji.

    1 Wartości - obliczona wartość kryterium ucznia do testowania hipotezy o znaczeniu prywatnego współczynnika korelacji z określonym (w nawiasach) według liczby stopni swobody.

    r-poziom! - Prawdopodobieństwo odchylenia hipotezy na znaczeniu prywatnego współczynnika korelacji.

W naszym przypadku uzyskana wartość P dla pierwszego współczynnika (0,031277) jest mniejsza niż wybrana  \u003d 0,05. Wartość drugiego współczynnika jest nieco wyższa (0,050676), co wskazuje na jej nieważność na tym poziomie. Ale jest to znaczące, na przykład w  \u003d 0,1 (w dziesięciu przypadkach z stu hipotezy będzie jednak nieprawidłowy).

Udostępnij znajomym lub zapisz dla siebie:

Ładowanie...