ضریب همبستگی برابر با 1 به معنای آن است. آمار و پردازش داده ها در روانشناسی (ادامه)

"آمار

آمار و پردازش داده ها در روانشناسی
(ادامه)

تجزیه و تحلیل همبستگی

هنگام مطالعه همبستگیسعی کنید تعیین کنید که آیا ارتباط بین دو شاخص در یک نمونه وجود دارد (به عنوان مثال، بین رشد و وزن کودکان یا بین سطح IQو عملکرد مدرسه) یا بین دو نمونه مختلف (به عنوان مثال، هنگام مقایسه زوج های دوقلوها)، و اگر این اتصال وجود داشته باشد، افزایش یک شاخص همراه با افزایش (همبستگی مثبت) یا کاهش (همبستگی منفی) دیگری است .

به عبارت دیگر، تجزیه و تحلیل همبستگی به ایجاد اینکه آیا ممکن است پیش بینی مقادیر احتمالی یک شاخص، دانستن مقدار دیگر باشد، کمک می کند.

تا به حال، هنگام تجزیه و تحلیل نتایج تجربه ما در مطالعه عمل ماری جوانا، ما عمدا چنین شاخصی را به عنوان زمان واکنش نادیده گرفتیم. در همین حال، جالب خواهد بود که بررسی کنیم که آیا ارتباط بین کارایی واکنش ها و سرعت آنها وجود دارد. به عنوان مثال، این اجازه می دهد تا استدلال کند که فرد در حال کاهش است، دقیق تر و موثرتر اقدامات او خواهد بود و بالعکس.

برای این منظور، دو روش مختلف می تواند مورد استفاده قرار گیرد: یک روش پارامتریک برای محاسبه ضریب ضد پورسون (R) و محاسبه ضریب همبستگی صفات Spirmen (R S)، که به داده های مرتعی اعمال می شود، I.E. این غیر پارامتری است. با این حال، ما ابتدا در این واقعیت درک خواهیم کرد که چنین ضریب همبستگی است.

ضریب همبستگی

ضریب همبستگی یک مقدار است که می تواند از 1 تا -1 متفاوت باشد. در مورد همبستگی مثبت مثبت، این ضریب به علاوه 1، و با منفی کامل - منهای 1. خط مستقیم مربوط به نمودار تقاطع مقادیر هر جفت داده است:

در مورد، اگر این نکات در یک خط مستقیم ساخته نشود، و یک "ابر" را تشکیل می دهند، ضریب همبستگی در مقدار مطلق کمتر از واحد می شود و به این ترتیب این ابر به صفر نزدیک می شود:

اگر ضریب همبستگی 0 باشد، هر دو متغیرها کاملا مستقل از یکدیگر هستند.

در علم بشردوستانه، اگر ضریب آن بالاتر از 0.60 باشد، همبستگی قوی محسوب می شود. اگر بیش از 0.90 باشد، همبستگی بسیار قوی است. با این حال، به منظور نتیجه گیری در مورد ارتباط بین متغیرها، حجم نمونه از اهمیت زیادی برخوردار است: از نمونه بیشتر است، ارزش ضریب همبستگی گران تر است. جداول با مقادیر بحرانی ضریب همبستگی شجاع پیرسون و اسپیرمن برای تعداد مختلفی از درجه آزادی وجود دارد (برابر با تعداد جفت کمتر از 2، I.E. n-2). فقط اگر ضرایب همبستگی بزرگتر از این مقادیر بحرانی باشد، آنها می توانند قابل اعتماد باشند. بنابراین، به منظور ضریب همبستگی 0.70 قابل اعتماد است، کمتر از 8 جفت داده ها باید به تجزیه و تحلیل منتقل شود (h. \u003d n.-2 \u003d 6) هنگام محاسبه R (جدول 4 را در ضمیمه) و 7 جفت داده (H \u003d n-2 \u003d5) هنگام محاسبه R S (جدول 5 در ضمیمه).

من می خواهم دوباره تأکید کنم که ماهیت این دو ضرایب تا حدودی متفاوت است. ضریب منفی R نشان می دهد که کارایی بیشتر از زمان واکنش کمتر است، در حالی که محاسبه ضریب R S، لازم بود بررسی کنیم که آیا تست های سریعتر همیشه دقیق تر واکنش نشان می دهند و به آرامی به آرامی واکنش نشان می دهند.

ضریب همبستگی شجاع-پیرسون (R) - این شاخص Etoparametric برای محاسبه انحرافات متوسط \u200b\u200bو استاندارد نتایج دو بعد است. در عین حال، آنها از فرمول استفاده می کنند (از نویسندگان مختلف ممکن است متفاوت باشند)

جایی که σ. xy -مقدار داده ها از هر جفت؛
تعداد زوج ها؛
x - میانگین برای داده های متغیر ایکس؛
Y. - وسط برای متغیر داده Y.
s x -
انحراف استاندارد برای توزیع ایکس؛
s y -
انحراف استاندارد برای توزیع w.

ضریب همبستگی درست اسپیرمن (r S. ) - این یک شاخص غیر پارامتری است که آنها سعی می کنند ارتباط بین صفوف مقادیر مربوطه را در دو ردیف اندازه گیری شناسایی کنند.

این ضریب محاسبه آسان تر است، اما نتایج دقیق تر از زمان استفاده از R. این به خاطر این واقعیت است که هنگام محاسبه ضریب روح، منظور از داده ها استفاده می شود، و نه ویژگی های کمی و فواصل زمانی آنها بین طبقات.

واقعیت این است که هنگام استفاده از ضریب همبستگی رتبه Spirmen (RS)، آن را بررسی می شود که آیا رتبه بندی داده ها برای هر نمونه مشابه در تعدادی از داده های دیگر برای این نمونه است، به عنوان مثال، به عنوان مثال (به عنوان مثال، آیا همان دانش آموزان "رتبه" در هنگام عبور از روانشناسی و ریاضیات، و یا حتی با دو معلم روانشناسی مختلف؟). اگر ضریب نزدیک به +1 باشد، این بدان معنی است که هر دو ردیف عملا همخوانی دارند و اگر این ضریب نزدیک به -1 باشد، ما می توانیم در مورد اعتیاد کامل معکوس صحبت کنیم.

ضریب r S.محاسبه فرمول

جایی که d.- تفاوت بین صفوف علائم کنجکاوی علائم (بدون توجه به علامت آن) و تعداد جفت ها.

معمولا این آزمون غیر پارامتری در مواردی که شما باید برخی از نتایج را نپذیرید، استفاده می شود فواصلبین داده ها، چقدر در مورد آنها رتبهو حتی زمانی که منحنی های توزیع بیش از حد نامتقارن هستند و اجازه استفاده از معیارهای پارامتری را به عنوان ضریب R (در این موارد لازم است که داده های کمی را به ترتیب داده شود).

خلاصه

بنابراین، ما روش های مختلف پارامتریک و غیر پارامتری مورد استفاده در روانشناسی را بررسی کردیم. بررسی ما بسیار سطحی بود و وظیفه اصلی او این بود که خواننده متوجه شد که آمار به عنوان وحشتناک نیست، به نظر می رسد، به نظر می رسد، و نیاز به عمدتا به معنای معمول است. ما به شما یادآوری می کنیم که داده های "تجربه" که با آن ما در اینجا مورد رسیدگی قرار می گیریم، داستانی است و نمی تواند به عنوان پایه ای برای هر نتیجه گیری خدمت کند. با این حال، چنین آزمایشی واقعا هزینه می شود. از آنجا که برای این تجربه، یک روش کاملا کلاسیک انتخاب شد، همان تجزیه و تحلیل آماری می تواند در انواع آزمایش های مختلف مورد استفاده قرار گیرد. در هر صورت، به نظر می رسد که ما برخی از جهات مهم را مشخص کرده ایم که ممکن است مفید باشد برای کسانی که نمی دانند کجا شروع به تجزیه و تحلیل آماری نتایج به دست آمده اند.

ادبیات

  1. Godfrau J.روانشناسی چیست؟ - M.، 1992.
  2. Chatillon G.1977. آمار EN Science Humaines، Trois-Rivieres، Ed. SMG
  3. گیلبرت n ..1978. آمار، مونترال، اد. hrw
  4. Moroney M.J.1970. Comprender La Statistique، Verviers، Gerard Et Cie.
  5. Siegel S.1956. آمار غیر پارامتری، نیویورک، شرکت کتاب MacGraw-Hill.

جدول ضمیمه

یادداشت.1) برای نمونه های بزرگ یا سطح اهمیت، کمتر از 0.05 باید به جداول در کمک های آمار مراجعه شود.

2) جداول مقادیر سایر معیارهای غیر پارامتری را می توان در کتابچه های ویژه یافت (نگاه کنید به کتابشناسی).

جدول 1. مقادیر معیار t.دانشجو
h. 0,05
1 6,31
2 2,92
3 2,35
4 2,13
5 2,02
6 1,94
7 1,90
8 1,86
9 1,83
10 1,81
11 1,80
12 1,78
13 1,77
14 1,76
15 1,75
16 1,75
17 1,74
18 1,73
19 1,73
20 1,73
21 1,72
22 1,72
23 1,71
24 1,71
25 1,71
26 1,71
27 1,70
28 1,70
29 1,70
30 1,70
40 1,68
¥ 1,65
جدول 2. مقادیر معیار χ 2
h. 0,05
1 3,84
2 5,99
3 7,81
4 9,49
5 11,1
6 12,6
7 14,1
8 15,5
9 16,9
10 18,3
جدول 3. مقادیر قابل اعتماد Z
r Z.
0,05 1,64
0,01 2,33
جدول 4. مقادیر قابل اعتماد (بحرانی) R
h \u003d (n-2) p \u003d.0,05 (5%)
3 0,88
4 0,81
5 0,75
6 0,71
7 0,67
8 0,63
9 0,60
10 0,58
11 0.55
12 0,53
13 0,51
14 0,50
15 0,48
16 0,47
17 0,46
18 0,44
19 0,43
20 0,42
جدول 5. مقادیر قابل اعتماد (بحرانی) R
h \u003d (n-2) p \u003d.0,05
2 1,000
3 0,900
4 0,829
5 0,714
6 0,643
7 0,600
8 0,564
10 0,506
12 0,456
14 0,425
16 0,399
18 0,377
20 0,359
22 0,343
24 0,329
26 0,317
28 0,306

هنگام مطالعه همبستگیسعی کنید تعیین کنید که آیا ارتباط بین دو شاخص در یک نمونه وجود دارد (به عنوان مثال، بین رشد و وزن کودکان یا بین سطح IQو عملکرد مدرسه) یا بین دو نمونه مختلف (به عنوان مثال، هنگام مقایسه زوج های دوقلوها)، و اگر این اتصال وجود داشته باشد، افزایش یک شاخص همراه با افزایش (همبستگی مثبت) یا کاهش (همبستگی منفی) دیگری است .

به عبارت دیگر، تجزیه و تحلیل همبستگی به ایجاد اینکه آیا ممکن است پیش بینی مقادیر احتمالی یک شاخص، دانستن مقدار دیگر باشد، کمک می کند.

تا به حال، هنگام تجزیه و تحلیل نتایج تجربه ما در مطالعه عمل ماری جوانا، ما عمدا چنین شاخصی را به عنوان زمان واکنش نادیده گرفتیم. در همین حال، جالب خواهد بود که بررسی کنیم که آیا ارتباط بین کارایی واکنش ها و سرعت آنها وجود دارد. به عنوان مثال، این اجازه می دهد تا استدلال کند که فرد در حال کاهش است، دقیق تر و موثرتر اقدامات او خواهد بود و بالعکس.

برای این منظور، دو روش مختلف می تواند مورد استفاده قرار گیرد: یک روش پارامتری برای محاسبه ضریب شجاع - پیرسون (R)و محاسبه ضریب همبستگی صفوف الکل (R. s. ), که به داده های مرتعی اعمال می شود، I.E. غیر پارامتریک است. با این حال، ما ابتدا در این واقعیت درک خواهیم کرد که چنین ضریب همبستگی است.

ضریب همبستگی

ضریب همبستگی ارزش است که می تواند از -1 تا 1 متفاوت باشد، در صورت همبستگی مثبت مثبت، این ضریب به علاوه 1، و با منفی کامل - منهای 1. خط مستقیم از طریق نقاط تقاطع هر جفت عبور می کند داده ها:

متغیر

در مورد، اگر این نکات در یک خط مستقیم ساخته نشود، و یک "ابر" را تشکیل می دهند، ضریب همبستگی در مقدار مطلق کمتر از واحد می شود و به این ترتیب این ابر به صفر نزدیک می شود:

اگر ضریب همبستگی 0 باشد، هر دو متغیرها کاملا مستقل از یکدیگر هستند.

در علم بشردوستانه، اگر ضریب آن بالاتر از 0.60 باشد، همبستگی قوی محسوب می شود. اگر بیش از 0.90 باشد، همبستگی بسیار قوی است. با این حال، به منظور نتیجه گیری در مورد ارتباط بین متغیرها، حجم نمونه از اهمیت زیادی برخوردار است: از نمونه بیشتر است، ارزش ضریب همبستگی گران تر است. جداول با مقادیر بحرانی ضریب همبستگی شجاع پیرسون و اسپیرمن برای تعداد مختلفی از درجه آزادی وجود دارد (برابر با تعداد جفت کمتر از 2، I.E. n.-2) فقط اگر ضرایب همبستگی بزرگتر از این مقادیر بحرانی باشد، آنها می توانند قابل اعتماد باشند. بنابراین، به منظور ضریب همبستگی 0.70 قابل اعتماد است، کمتر از 8 جفت داده ها باید به تجزیه و تحلیل منتقل شود ( = پ -2 = 6) هنگام محاسبه r.(جدول v.4) و 7 جفت داده ( \u003d P -2 \u003d 5) هنگام محاسبه r. s. (جدول 5 در ضمیمه B. 5).

ضریب شجاع - پیرسون

برای محاسبه این ضریب، فرمول زیر استفاده می شود (از نویسندگان مختلف ممکن است متفاوت باشد):

جایی که  xy - مقدار داده ها از هر جفت؛

n. - تعداد جفت؛

- وسط برای متغیر داده ایکس.;

وسط برای متغیر داده Y.;

S. H. - ایکس.;

s. Y. - انحراف استاندارد برای توزیع y

در حال حاضر ما می توانیم از این ضریب استفاده کنیم تا تعیین کنیم که آیا ارتباط بین زمان پاسخ افراد و اثربخشی اقدامات آنها وجود دارد. به عنوان مثال، سطح پس زمینه گروه کنترل را انتخاب کنید.

n.= 15  15,8  13,4 = 3175,8;

(n.1)S. ایکس. S. y = 14  3,07  2,29 = 98,42;

r. =

مقدار منفی ضریب همبستگی ممکن است به این معنی باشد که زمان واکنش بزرگتر، کاهش کارایی پایین تر است. با این حال، به منظور صحبت در مورد ارتباط قابل اعتماد بین این دو متغیر بسیار کوچک است.

nxy \u003d.………

(N.- 1) S. ایکس. S. Y. = ……

چه نتیجه ای از این نتایج حاصل می شود؟ اگر فکر می کنید ارتباط بین متغیرها وجود دارد، پس چه چیزی است - مستقیم یا معکوس؟ قابل اعتماد است [دیدن جدول. 4 (در مکمل B. 5) با ارزش های بحرانی r.]?

ضریب همبستگی رتبه Spearmanr. s.

این ضریب آسان تر محاسبه شده است، اما نتایج دقیق تر از استفاده از آن است ر.این به خاطر این واقعیت است که هنگام محاسبه ضریب روح، منظور از داده ها استفاده می شود، و نه ویژگی های کمی و فواصل زمانی آنها بین طبقات.

واقعیت این است که هنگام استفاده از ضریب همبستگی رتبه اسپارمن(R. s. ) بررسی کنید که آیا رتبه بندی داده ها برای هر نمونه همانند در تعدادی از داده های دیگر برای این نمونه است، با اولین بار متصل به اولین (به عنوان مثال، دانش آموزان به همان اندازه "رتبه بندی" به همان اندازه "رتبه" زمانی که آنها به عنوان روانشناسی و ریاضیات منتقل می شود، و یا حتی با دو معلمان مختلف روانشناسی؟). اگر ضریب نزدیک به + 1 باشد، این بدان معنی است که هر دو ردیف تقریبا همخوانی دارند و اگر این ضریب نزدیک به 1 باشد، می توانید در مورد اعتیاد کامل معکوس صحبت کنید.

ضریب r. s. محاسبه فرمول

جایی که دتفاوت بین صفوف علائم کنجکاو علائم (بدون در نظر گرفتن علامت آن) و n.- پارا

معمولا این آزمون غیر پارامتری در مواردی که شما باید برخی از نتایج را نپذیرید، استفاده می شود فواصلبین داده ها، چقدر در مورد آنها رتبهو سپس هنگامی که منحنی های توزیع بیش از حد نامتقارن هستند و اجازه نمی دهند با استفاده از معیارهای پارامتری به عنوان ضریب r.(در این موارد، لازم است داده های کمی را به ترتیب داده شود).

از آنجا که این مورد با توزیع مقادیر کارایی و زمان واکنش در گروه تجربی پس از قرار گرفتن در معرض، ممکن است محاسبات را که قبلا برای این گروه انجام داده اید، تکرار کنید، تنها در حال حاضر برای ضریب r., و برای شاخص r. s. . این به شما این امکان را می دهد که این دو شاخص متفاوت باشد.

* باید به یاد داشته باشید که

1) برای تعداد بازدید ها، رتبه اول به بالاترین، و 15 عملکرد پایین، در حالی که برای زمان واکنش رتبه اول مربوط به کوتاه ترین زمان، و 15th طولانی مدت؛

2) داده های EX AEQUO به طور متوسط \u200b\u200bرتبه بندی شده است.

بنابراین، همانطور که در مورد ضریب دریافت مثبت، اگر چه غیر قابل اعتماد، نتیجه. از این دو نتیجه قابل باور است: r \u003d.-0.48 یا r. s. \u003d +0.24؟ این سوال تنها می تواند در صورتی که نتایج قابل اعتماد باشد، حفظ شود.

من می خواهم دوباره تأکید کنم که ماهیت این دو ضرایب تا حدودی متفاوت است. ضریب منفی r.نشان می دهد که کارایی اغلب بالاتر از زمان واکنش کمتر است، در حالی که محاسبه ضریب r. s. لازم بود بررسی کنیم که آیا افراد سریعتر همیشه دقیق تر واکنش نشان می دهند و کمتر می شوند.

از آنجا که گروه آزمایشی پس از قرار گرفتن در معرض یک ضریب به دست آمد r. s. , برابر با 0.24، چنین تمایل در اینجا بدیهی است که ردیابی نشده است. سعی کنید آن را در داده های خود را برای گروه کنترل پس از قرار گرفتن در معرض، دانستن آن را d. 2 = 122,5:

؛ به طور قابل ملاحظه؟

نتیجه گیری شما چیست؟ ............................................. .................................................. ............

…………………………………………………………………………………………………………………….

بنابراین، ما روش های مختلف پارامتریک و غیر پارامتری مورد استفاده در روانشناسی را بررسی کردیم. بررسی ما بسیار سطحی بود و وظیفه اصلی او این بود که خواننده متوجه شد که آمار به عنوان وحشتناک نیست، به نظر می رسد، به نظر می رسد، و نیاز به عمدتا به معنای معمول است. ما به شما یادآوری می کنیم که داده های "تجربه" که با آن ما در اینجا مورد رسیدگی قرار می گیریم، داستانی است و نمی تواند به عنوان پایه ای برای هر نتیجه گیری خدمت کند. با این حال، چنین آزمایشی واقعا هزینه می شود. از آنجا که برای این تجربه، یک روش کاملا کلاسیک انتخاب شد، همان تجزیه و تحلیل آماری می تواند در انواع آزمایش های مختلف مورد استفاده قرار گیرد. در هر صورت، به نظر می رسد که ما برخی از جهات مهم را مشخص کرده ایم که ممکن است مفید باشد برای کسانی که نمی دانند کجا شروع به تجزیه و تحلیل آماری نتایج به دست آمده اند.

سه پارتیشن اصلی از آمار وجود دارد: آمار توصیفی، آمار القایی و تحلیل همبستگی.

7.3.1 ضرایب همبستگی و تعیین.شما می توانید اندازه گیری کنید ارتباطات تنگ بین عوامل و او غذا(مستقیم یا معکوس)، محاسبه شده:

1) اگر لازم باشد تعیین رابطه مصرف کننده رابطه بین دو عامل - ضریب جفتهمبستگی: در 7.3.2 و 7.3.3، عملیات محاسبه ضریب همبستگی زوجی همبستگی در براش-پورسون ( r.) و ضریب همبستگی جفت همبستگی در روح ( r.);

2) اگر ما می خواهیم رابطه بین دو عامل را تعیین کنیم، اما این رابطه به وضوح غیر خطی است همبستگی ;

3) اگر ما می خواهیم رابطه بین یک عامل و ترکیبی از عوامل دیگر را تعیین کنیم - پس از آن (یا همان، "ضریب همبستگی چندگانه")؛

4) اگر ما می خواهیم اتصال یک عامل را فقط با یک مورد خاص شناسایی کنیم، که در عوامل گروهی که در ابتدا تاثیر می گذارد، لازم است تا نفوذ تمام عوامل دیگر را بدون تغییر در نظر بگیریم - ضریب همبستگی خصوصی (جزئی) .

هر ضریب همبستگی (R، R) نمی تواند مقدار مطلق بیش از 1 باشد، یعنی -1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

علامت ضریب همبستگی، تمرکز ارتباطات را تعیین می کند: علامت "+" (یا عدم وجود علامت) به این معنی است که اتصال سر راست (مثبت)، علامت "-" - این اتصال معکوس کردن (منفی) هیچ ارتباطی با تنگی اتصال ندارد

ضریب همبستگی یک رابطه آماری را مشخص می کند. اما اغلب لازم است که نوع دیگری از اعتیاد را شناسایی کنید، یعنی: سهم برخی از عوامل در شکل گیری یکی دیگر از عوامل مرتبط با آن چیست. این نوع وابستگی به بخشی از کنوانسیون مشخص شده است ضریب تعیین (D. ) تعریف شده توسط فرمول D. \u003d R 2 '100٪ (جایی که R یک ضریب همبستگی براش-پورسون است، به 7.3.2 مراجعه کنید). اگر اندازه گیری ها انجام شود مقیاس مقیاس (مقیاس رتبه)، با برخی از آسیب به قابلیت اطمینان، می توان مقدار R را در فرمول R جایگزین کرد (ضریب همبستگی در Spirmetue، به 7.3.3 مراجعه کنید).

به عنوان مثال، اگر ما به عنوان یک ویژگی از وابستگی فاکتور B از عامل به دست آمده و ضریب همبستگی R \u003d 0.8 یا r \u003d -0.8، سپس D \u003d 0.8 2 '100٪ \u003d 64٪، یعنی حدود 2 ½ 3. در نتیجه، سهم فاکتور A و تغییرات آن در شکل گیری عامل B تقریبا 2 است ½ 3 از کل سهم همه عوامل به طور کلی.

7.3.2. ضریب همبستگی در شجاع پیرسون. روش محاسبه ضریب همبستگی بر روی براش-پورسون ( r. ) تنها می تواند در مواردی که ارتباطات بر اساس نمونه هایی که دارای توزیع فرکانس نرمال هستند ( توزیع نرمال ) و اندازه گیری های به دست آمده در محدوده فواصل یا روابط. فرمول محاسبه شده این ضریب همبستگی:



å ( ایکس. من -) ( y من -)

R. = .

n × s x × s y

چه ضریب همبستگی را نشان می دهد؟ اول، علامت ضریب همبستگی، تمرکز ارتباطات را نشان می دهد، یعنی: علامت "-" نشان می دهد که اتصال معکوس کردن، یا منفی (گرایش وجود دارد: با کاهش ارزش های یک عامل، مقادیر مربوط به عامل دیگر در حال رشد است، و با افزایش - کاهش)، و عدم نشانه یا نشانه "+" نشان می دهد سر راست، یا مثبتارتباطات (گرایش وجود دارد: با افزایش ارزش های مشابه عامل، مقادیر دیگر افزایش می یابد و با کاهش کاهش می یابد). ثانیا، مطلق (مستقل از علامت) مقدار ضریب همبستگی از تنگی (قدرت) ارتباطات صحبت می کند. این در نظر گرفته شده (به اندازه کافی مشروط): در مقادیر R< 0,3 корреляция خیلی ضعیف، اغلب آن را به سادگی در نظر گرفته نشده است، در 0.3 £ R< 5 корреляция ضعیف، در 0.5 £ R< 0,7) - میانگین، در 0.7 £ R £ 0.9) - قوی و در نهایت، در R\u003e 0.9 - بسیار قوی.در مورد ما (R "0.83) رابطه معکوس (منفی) و قوی است.

به یاد بیاورید: مقادیر ضریب همبستگی می تواند در محدوده -1 تا +1 باشد. مقدار خروجی R برای این محدودیت ها نشان می دهد که در محاسبات خطا مجاز است . اگر یک r. \u003d 1، این به این معنی است که رابطه آماری نیست، اما کاربردی - که در ورزش، زیست شناسی، دارو عملا اتفاق نمی افتد. اگر چه با مقدار کمی اندازه گیری ها، انتخاب تصادفی از مقادیر، که تصویری از ارتباطات عملکردی را ارائه می دهد، ممکن است، اما این مورد کمتر احتمال دارد، مقدار بیشتر از نمونه های قابل مقایسه (N)، یعنی بیشتر تعداد جفت های اندازه گیری مقایسه.

جدول محاسبه شده (جدول 7.1) با توجه به فرمول ساخته شده است.

جدول 7.1

محاسبه جدول برای محاسبه بر روی کیف پول

x I. y I. (ایکس. من -) (ایکس. I -) 2 (y من -) (y I -) 2 (ایکس. من -) ( y من -)
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
åx I \u003d 137 \u003d 13.00 Åy I \u003d 56،1 \u003d 5.1 å( ایکس. I -) 2 \u003d \u003d 1.78 å( y I -) 2 \u003d \u003d 1،015 å( ایکس. من -) ( y I -) \u003d -1.24

تا آنجا که s. x \u003d ï ï = ï ï» 0.42، A.

s. y \u003d. ï ï» 0,32, r » –1,24ï (11'0،42'0،32) » –1,24ï 1,48 » –0,83 .

به عبارت دیگر، لازم است بسیار محکم بدانیم که ضریب همبستگی نمی توانم در مقدار مطلق بیش از 1.0 است. این اغلب از اشتباهات ناخوشایند اجتناب می کند، دقیق تر - برای پیدا کردن و اصلاح خطا در هنگام محاسبه.

7.3.3. ضریب همبستگی Spearmen. همانطور که قبلا ذکر شد، ممکن است ضریب همبستگی شجاع-پیسون (R) را تنها در مواردی که فاکتورهای توزیع فرکانس تجزیه شده نزدیک به حالت عادی قرار می گیرند، اعمال می شود و گزینه های ارزش را به دست می آورید اتفاق می افتد اگر آنها واحدهای فیزیکی بیان شوند. در موارد دیگر، ضریب همبستگی روح یافت می شود ( r.) با این حال، این ضریب می توان در مواردی که مجاز است (و ترجیحا ! ) ضریب همبستگی بر Bävse-Pearson را اعمال کنید. اما باید در نظر گرفته شود که روش تعیین ضریب کیف پول نقد داشته باشد قدرت بیشتر ("اجازه دادنتوانایی")، بنابراین r.آموزنده تر از r.. حتی با بزرگ n. انحراف r. ممکن است حدود ± 10٪ باشد.

جدول 7.2 فرمول محاسبه ضریب

x i y I r x r y | d r | همبستگی اسپیرمن د 2

13,2 4,75 8,5 3,0 5,5 30,25 r. \u003d 1 - باقی مانده

13.5 4.70 11.0 2.0 9.0 81.00 ما از مثال ما استفاده می کنیم

12.7 5،10 4.5 6.5 2.0 4.00 برای محاسبه r.اما ساخت

12.5 5.40 3.0 9.0 6.0 36.00 جدول دیگر (جدول 7.2).

13.0 5.10 6.0.5 6.5 0.5 0.25 جایگزین مقادیر:

13.2 5.00 8.5 4.5 4.0 16.00 R \u003d 1- \u003d

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13.4 4.65 10.0 1.0 9.0 81.00 ما می بینیم: r. معلوم شد کمی

12.4 5.60 2.0 11.0 9.0 81.00 بیشتر از r.اما آن است

12.3 5.50 1.0 10.0 9.0 81.00 Chiya بسیار بزرگ نیست. پس از همه، زمانی که

12.7 5.20 4.5 8.0 3.5 12.25 چنین کوچک n. ارزش های r. و r.

Åd R 2 \u003d 423 بسیار تقریبی است، کمی قابل اعتماد است، ارزش واقعی آنها می تواند به طور گسترده ای تغییر کند، بنابراین تفاوت r. و r. 0.1 غیر ضروری است معمولاr.به عنوان آنالوگ را در نظر بگیریدr. اما تنها کمتر دقیق است. علائم برای r.و r.تمرکز ارتباطات را نشان می دهد.

7.3.4. کاربرد و تأیید صحت ضرایب همبستگی. تعیین میزان ارتباط همبستگی بین عوامل ضروری است برای مدیریت عوامل ما نیاز به: برای این منظور شما باید بر عوامل دیگر تاثیر بگذارد، و شما باید اندازه گیری اثربخشی آنها را بدانید. شما باید در مورد رابطه عوامل برای توسعه یا انتخاب تست های آماده شده بدانید: اطلاعات مربوط به آن با همبستگی نتایج آن با تظاهرات ویژگی یا خواص مورد علاقه ما تعیین می شود. بدون اطلاع از همبستگی، هر گونه اشکال انتخاب غیر ممکن است.

در بالا ذکر شد که در ورزش و به طور کلی، آموزش های آموزشی، پزشکی، پزشکی و حتی اقتصادی و حتی اقتصادی، علاقه زیادی به تعریف بسیار مهم است سپرده ، که یک عامل به شکل گیری دیگری کمک می کند. این به خاطر این واقعیت است که علاوه بر عوامل مورد نظر، هدف (ما علاقه مند به) قانون عامل، دادن هر یک یا یکی دیگر از سهم به آن، و دیگران.

اعتقاد بر این است که اندازه گیری سهم هر عامل باعث می شود ضریب تعیین D I \u003d R 2 '100٪. به عنوان مثال، اگر r \u003d 0.6، I.E. رابطه بین عوامل A و B متوسط \u200b\u200bاست، سپس D \u003d 0.6's 100٪ \u003d 36٪. دانستن، به طوری که سهم عامل A به شکل گیری عامل B تقریبا 1 است ½ 3، شما می توانید، به عنوان مثال، به اختصاص به توسعه هدفمند این عامل تقریبا 1 ½ 3 زمان آموزش اگر ضریب همبستگی R \u003d 0.4 باشد، پس از آن D \u003d R 2 100٪ \u003d 16٪ یا تقریبا 1 ½ 6 - دو بار دیگر کمتر، و به ترتیب آن را به توسعه این منطق اختصاص دهید، به ترتیب تنها 1 ½ 6 بخشی از زمان آموزش.

مقادیر DI برای عوامل مختلف ضروری، دیدگاه تقریبی نسبت به رابطه کمی از تأثیرات آنها بر عامل هدف را به ما می دهد، به خاطر بهبود ما، ما، در واقع، و کار بر سایر عوامل (به عنوان مثال، جهنده بلند مدت در حال افزایش سرعت اجرای چرخش آن، به طوری که یک عامل است که مهمترین سهم را در شکل گیری نتیجه در پریدن فراهم می کند).

به یاد بیاورید که تعیین کنید D. به جای آن امکان پذیر است r. قرار دادن r.اگر چه، البته دقت تعریف پایین تر است.

مستقر انتخابی (محاسبه شده بر روی داده های انتخابی) ضریب همبستگی نمی تواند نتیجه گیری شود که رابطه بین عوامل مورد بررسی امکان پذیر نیست. به منظور ایجاد چنین نتیجه ای با یک درجه معقول، از استاندارد استفاده کنید معیارهای همبستگی. استفاده آنها به معنای یک رابطه خطی بین عوامل و توزیع نرمال فرکانس ها در هر یک از آنها (به معنی نمونه نیست، بلکه ارائه عمومی آنها).

مثلا می توانید معیارهای T دانش آموز را اعمال کنید. فاصله او

حتی فرمول: t P.= –2 , جایی که K ضریب همبستگی انتخابی مورد مطالعه است، a n. - حجم نمونه های کامپایلر. مقدار محاسبه شده به دست آمده از معیار t (t p) با جدول با میز که توسط ما و تعداد آزادی آزادی n \u003d n \u003d n انتخاب شده است، مقایسه می شود. برای خلاص شدن از کار حل و فصل، شما می توانید از یک استفاده کنید جدول ویژه مقادیر بحرانی ضرایب همبستگی انتخابی(نگاه کنید به بالا) مربوط به حضور یک ارتباط قابل اعتماد بین عوامل (از جمله n. و آ.).

جدول 7.3

ارزش های مرزی اعتماد به نفس ضریب همبستگی انتخابی

تعداد درجه آزادی در تعیین ضرایب همبستگی برابر با 2 (I.E. n. \u003d 2) مشخص شده در جدول 7.3 ارزش مرز پایین تر از فاصله اطمینان دارند درست است، واقعی ضریب همبستگی 0 است، یعنی، در چنین مقادیری غیرممکن است که بگوییم همبستگی به طور کلی رخ داده است. با ارزش ضریب همبستگی انتخابی بالاتر از مشخص شده در جدول، ممکن است در سطح مناسب اهمیت به این باور باشد که ضریب همبستگی واقعی صفر نیست.

اما پاسخ به این سوال این است که آیا ارتباط واقعی بین عوامل مورد توجه، یک مکان برای یک سوال دیگر وجود دارد: که در آن فاصله قرار دارد ارزش واقعی ضریب همبستگی، چگونه می تواند در واقع، با بی نهایت بزرگ باشد n.؟ این فاصله برای هر مقدار خاص r. و n. فاکتورهای مقایسه شده را می توان محاسبه کرد، اما استفاده از سیستم نمودارها راحت تر است نوموگرام)، جایی که هر جفت منحنی، ساخته شده برای یک مشخص شده در بالا آنها n.مربوط به مرزهای فاصله است.

شکل. 7.4 مرزهای اعتماد ضریب همبستگی انتخابی (a \u003d 0.05). هر منحنی مربوط به مشخص شده در بالا است n..

تبدیل به نوموگرام در شکل. 7.4، فاصله ای از مقادیر ضریب همبستگی واقعی را می توان برای مقادیر محاسبه ضریب همبستگی انتخابی در A \u003d 0.05 تعیین کرد.

7.3.5. روابط همبستگیاگر همبستگی جفتی باشد نئولین، محاسبه ضریب همبستگی غیرممکن است، تعیین کنید روابط همبستگی . الزامات اجباری: علائم باید در مقیاس روابط یا در مقیاس فواصل اندازه گیری شود. ممکن است وابستگی همبستگی عامل را محاسبه کند ایکس. از عامل Y.و وابستگی همبستگی عامل Y.از عامل ایکس. - آنها متفاوتند با مقدار کمی n. نمونه های مورد نظر، نمایندگی عوامل، می توانند برای محاسبه روابط همبستگی مورد استفاده قرار گیرند:

نسبت همبستگی H. x ½.= ;

نسبت همبستگی H y ½ x.= .

در اینجا و نمونه های ریاضی متوسط \u200b\u200bX و Y، و - درون کلاسیک محاسبات متوسط به این است که میانگین محاسبات آن مقادیر در نمونه ای از عامل X، که با آن کنجد مقادیر یکسان در نمونه ای از عامل y (به عنوان مثال، اگر در عامل x مقدار 4، 6 و 5 وجود دارد، که 3 گزینه با همان مقدار 9 در نمونه از عامل y، سپس \u003d (4 + 6 + 5) ½ 3 \u003d 5). بر این اساس، میانگین محاسباتی این مقادیر در نمونه ای از عامل y، که مقادیر مشابه در نمونه ای از عامل x وجود دارد. بگذارید نمونه ای را ارائه دهیم و محاسبه را انجام دهیم:

ایکس: 75 77 78 76 80 79 83 82 ; y: 42 42 43 43 43 44 44 45 .

جدول 7.4

جدول محاسبه شده

x I. y I. x y. x i - x (x i - x) 2 x i - x y (x I. x y.) 2
–4 –1
–2
–3 –2
–1
–3
x \u003d 79. y \u003d 43 S \u003d 76. S \u003d 28

در نتیجه، H. y ½ x.\u003d "0.63.

7.3.6. ضرایب خصوصی و چندگانه همبستگی.برای برآورد رابطه بین 2 عامل، محاسبه ضرایب همبستگی، ما، ما فرض می کنیم که هیچ عامل دیگری برای این وابستگی هیچ اثری ندارد. در واقعیت، وضعیت اشتباه است. بنابراين وابستگي بين وزن و رشد، به طور معني داري تحت تاثير كليزي تغذيه تغذيه، بزركي از اعمال فيزيكي اسيماتيكي، ويژگي قرار مي گيرد، در هنگام ارزيابي ارتباطات بين 2 عامل، نفوذ قابل توجهی عوامل دیگر و در عین حال نحوه جداسازی آنها با توجه به آنها بدون تغییر، محاسبه خصوصی (در غیر این صورت - جزئي ) ضرایب همبستگی

به عنوان مثال: شما نیاز به ارزیابی وابستگی های زوج بین 3 عامل قابل ملاحظه ای فعال X، Y و Z. r. XY (Z) ضریب همبستگی خصوصی (جزئی) بین عوامل X و Y (در همان زمان، ما ارزش عامل Z را بدون تغییر در نظر می گیریم)، r. ZX (Y) یک ضریب همبستگی خصوصی بین عوامل Z و X (با مقدار ثابت عامل Y) است r. YZ (X) یک ضریب همبستگی خصوصی بین عوامل Y و Z (با مقدار ثابت عامل x) است. با استفاده از ضرایب همبستگی جفتی ساده (شجاعانه) r. چکیدن r. xz I. r. یز، M.

ممکن است ضریب همبستگی خصوصی (جزئی) را با فرمول ها محاسبه کنید:

r xy - r. xz ' r. یز r. xz - r. xy ' r. zy r. ZY -R ZX ' r. یز

r. xy (z) \u003d؛ r. xz (y) \u003d؛ r. zy (x) \u003d

Ö (1- r. 2 xz) (1- r. 2 یز) Ö (1- r. 2 xy) (1- r. 2 زی) Ö (1- r. 2 zx) (1- r. 2 yx)

و ضرایب همبستگی خصوصی می تواند مقادیر از -1 تا +1 باشد. آنها را در یک مربع قرار دهید، خصوصی مناسب را دریافت کنید ضرایب تعیین ، همچنین به عنوان اشاره شده است اقدامات خصوصی اطمینان (ضرب 100، بیان در ٪٪). ضرایب همبستگی خصوصی بیشتر یا کمتر از ضرایب ساده (کامل) زوجی متفاوت است، که بستگی به قدرت نفوذ بر آنها از عامل سوم (به عنوان اگر بدون تغییر). فرضیه صفر (H 0)، یعنی یک فرضیه در مورد عدم ارتباط (وابستگی) بین عوامل X و Y بررسی می شود (با مجموع علائم k.) محاسبه معیار t توسط فرمول: t. p \u003d. r. xy (z) '( n.-k) 1 ½ 2 '(1- r. 2 xy (z)) -1 ½ 2 .

اگر یک t. r< t. a n، فرضیه پذیرفته شده است (ما معتقدیم که وابستگی وجود ندارد)، اگر t.t. N - این فرضیه رد شده است، یعنی اعتقاد بر این است که وابستگی واقعا اتفاق می افتد. t. یک N بر روی میز گرفته شده است t.دانش آموز Criteia، و k. - تعداد عوامل حسابدار (به عنوان مثال ما 3)، تعداد درجه آزادی n. \u003d n - 3. سایر ضرایب همبستگی خصوصی به طور مشابه بررسی می شود (به جای فرمول r. xy (z) بر این اساس جایگزین شده است r. xz (y) یا r. زی (X)).

جدول 7.5

اطلاعات اولیه

Ö (1 - 0.71 2) (1 - 0.71 2) Ö (1 - 0.5) (1 - 0.5)

برای ارزیابی وابستگی عوامل موثر از عمل مشترک چند عامل (در اینجا، عوامل Y و Z)، مقادیر ضرایب همبستگی جفت ساده را محاسبه کرده و با استفاده از آنها محاسبه می شود ضریب همبستگی چندگانه r. x (yz):

Ö r. 2 xy +. r. 2 xz - 2 r. xy ' r. xz ' r. یز

r. x (yz) = .

Ö 1 - r. 2 یز

7.2.7. ضریب ارتباط اغلب لازم است که رابطه بین را تعیین کنید کیفیت علائم، I.E. چنین نشانه هایی که نمی توانند به صورت کمی ارائه شوند (مشخصه)، که غیر قابل اندازه گیری. به عنوان مثال، لازم به ذکر است که آیا وابستگی بین تخصص های ورزشی نیز در خواص شخصی مانند intraverter (جهت فرد بر پدیده دنیای ذهنی خود) و برون گرا (جهت فرد در مورد جهان از اشیاء خارجی). تعریف های شرطی در جدول ارائه می شود. 7.6.

جدول 7.6

x (سال) Y (بار) z (بار) x (سال) Y (بار) z (بار)
علامت 1 علامت 2 دستمال سفره بیگانه بودن
بازی های ورزشی ولی ب
ژیمناستیک از جانب d.

بدیهی است، تنها فرکانس توزیع ها می تواند اعداد در اینجا در اختیار ما باشد. در این مورد، محاسبه ضریب ارتباط (اسم دیگر " ضریب همبستگی ") ساده ترین مورد را در نظر بگیرید: رابطه بین دو جفت علائم، با ضریب محاسبه تماس تلفیقی چهار هسته ای (جدول را ببینید).

جدول 7.7

a \u003d 20 b \u003d 15. آ. + ب = 35
c \u003d 15 d \u003d 5 c. + d. = 20
آ. + c. = 35 ب + d. = 20 n. = 55

محاسبات تولید شده توسط فرمول:

aD - BC 100 - 225 -123

محاسبه ضرایب انجمن (ضرایب جفت) با تعداد بیشتری از ویژگی های با محاسبات بر روی یک ماتریس مشابه از نظم مناسب همراه است.

ضریب همبستگی - این یک مقدار است که می تواند از +1 تا -1 متفاوت باشد. در مورد همبستگی مثبت مثبت، این ضریب به علاوه 1 است (آنها پیشنهاد می کنند که با افزایش ارزش یک متغیر، مقدار یک متغیر دیگر افزایش می یابد) و با یک منفی کامل - منهای 1 (نشان دهنده بازخورد، یعنی با افزایش مقادیر یک متغیر، مقادیر مختلف کاهش می یابد).

PR1:

نمودار وابستگی خجالت و دیپرسز. همانطور که می بینید، امتیازات (افراد) هرج و مرج نیست، اما در اطراف یک خط ساخته شده است، و به دنبال این خط ما می توانیم بگوییم که بالاتر از فرد در فرد بیان شده است، افسردگی بیشتر، به عنوان مثال، این پدیده ها متصل هستند.

PR2 .: برنامه ریزی برای خجالت و اجتماعی بودن. ما می بینیم که با افزایش خجالت، جامعه شناسی کاهش می یابد. ضریب همبستگی آنها -0.43 است. بنابراین، ضریب همبستگی بیشتر از 0 تا 1 صحبت از ارتباطات متناسب مستقیم (بیشتر ... بیشتر ...)، و ضریب از -1 تا 0 در مورد نارضایتی (بیشتر ... کمتر .. .)

اگر ضریب همبستگی 0 باشد، هر دو متغیرها کاملا مستقل از یکدیگر هستند.

همبستگی - این یک اتصال است که در آن قرار گرفتن در معرض عوامل فردی تنها به عنوان گرایش (به طور متوسط) با مشاهدات توده ای از داده های واقعی ظاهر می شود. نمونه هایی از وابستگی های همبستگی می تواند وابستگی بین اندازه دارایی های بانک و میزان سود بانک، رشد بهره وری کار و تجربه کارکنان باشد.

دو سیستم طبقه بندی ارتباطات همبستگی در قدرت خود استفاده می شود: عمومی و خصوصی.

طبقه بندی عمومی همبستگی: 1) قوی یا نزدیک با ضریب همبستگی R\u003e 0.70؛ 2) میانگین 0.500.70، و نه تنها یک همبستگی سطح بالایی از اهمیت.

جدول زیر نام ضرایب همبستگی برای انواع مختلف مقیاس ها را نوشت.

مقیاس دوگانگی (1/0) مقیاس رتبه (مرتبه)
مقیاس دوگانگی (1/0) ضریب انجمن پیرسون، ضریب پیرسون چهار هیئت مدیره. همبستگی بیسنی
مقیاس رتبه (مرتبه) رتبه همبستگی بیسیال. ضریب همبستگی روح یا کناللا.
فاصله و مقیاس مطلق همبستگی بیسنی مقادیر مقیاس فاصله به صفوف ترجمه می شود و از ضریب رتبه استفاده می شود ضریب همبستگی پیرسون (ضریب همبستگی خطی)

برای r.=0 همبستگی خطی از دست رفته است. در عین حال، متغیرهای متوسط \u200b\u200bگروه با میانگین های مشترک آنها همخوانی دارند و خطوط رگرسیون موازی با محورهای مختصات هستند.

برابری r.=0 این فقط در مورد عدم وابستگی همبستگی خطی (غیر خوردگی متغیرها) صحبت می کند، اما در مورد عدم وجود همبستگی، و حتی بیشتر، وابستگی آماری نیست.

گاهی اوقات نتیجه گیری در مورد عدم وجود همبستگی مهمتر از حضور یک همبستگی قوی است. همبستگی صفر دو متغیر ممکن است نشان دهد که هیچ تاثیری از یک متغیر به دیگری وجود ندارد، به شرطی که ما به نتایج اندازه گیری اعتماد داریم.

در SPSS: 11.3.2 ضرایب همبستگی

تا به حال، ما تنها واقعیت وجود وابستگی آماری بین دو نشانه را کشف کردیم. بعد، ما سعی خواهیم کرد تا نتیجه گیری کنیم که نتیجه گیری می تواند در مورد قدرت یا ضعف این وابستگی، و همچنین در مورد شکل و جهت آن انجام شود. معیارهای ارزیابی کمی از رابطه بین متغیرها ضرایب همبستگی یا اقدامات مرتبط با همبستگی نامیده می شود. دو متغیر با یکدیگر مثبت همبستگی دارند، اگر نسبت مستقیم و یک طرفه بین آنها وجود داشته باشد. با یک نسبت یک طرفه، مقادیر کوچک یک متغیر به مقادیر کوچک متغیر دیگری مربوط می شود، مقادیر زیادی بزرگ هستند. دو متغیر با یکدیگر منفی هستند، اگر نسبت معکوس و چند منظوره بین آنها وجود داشته باشد. با یک نسبت چند منظوره، مقادیر کوچک یک متغیر به مقادیر زیادی متغیر دیگری متصل می شود و بالعکس. مقادیر ضرایب همبستگی همیشه در محدوده -1 تا +1 قرار دارد.

ضریب همبستگی بین متغیرهای متعلق به مقیاس مقادیر با ضریب ضریب و متغیرهای مربوط به فاصله - ضریب همبستگی پیرسون (لحظه ای از آثار) استفاده می شود. لازم به ذکر است که هر متغیر دوجانبه، یعنی یک متغیر متعلق به مقیاس اسمی و داشتن دو دسته می تواند به عنوان مرتبه در نظر گرفته شود.

برای شروع، ما بررسی می کنیم که آیا همبستگی بین متغیرهای جنسی و روان از فایل Studium.SAV وجود دارد. در عین حال، ما در نظر می گیریم که متغیر دوگانگی جنس می تواند عادی باشد. این مراحل را دنبال کنید:

· آمار توصیفی را انتخاب کنید (آمار توصیفی) دستورات در منوی فرمان تجزیه و تحلیل ... (جداول همجوشی)

· انتقال متغیر جنسی به لیست رشته، و متغیر روان در لیست ستون است.

· بر روی آمار ... (آمار) دکمه کلیک کنید. در CrosStabs: گفتگوی آمار، کادر مربوط به همبستگی (همبستگی) را انتخاب کنید. تماس با دکمه ادامه را تایید کنید.

· در گفتگوی CrosStabs، از خروجی جداول با چک کردن جعبه بررسی جداول SURPRESS امتناع کنید. روی دکمه OK کلیک کنید.

ضرایب ضرایب همبستگی اسپرینت و پیرسون محاسبه خواهد شد و اهمیت آنها بررسی می شود:

/ SPSS 10

وظیفه شماره 10 تجزیه و تحلیل همبستگی

مفهوم همبستگی

ضریب همبستگی یا همبستگی یک شاخص آماری است احتمالیارتباط بین دو متغیر اندازه گیری شده توسط مقیاس های کمی. در مقایسه با اتصال عملکردی، که در آن هر مقدار یک متغیر مربوط به آن است به شدت تعریف شده استمقدار متغیر دیگری ارتباطات احتمالیاین مشخصه با این واقعیت است که هر مقدار یک متغیر مربوط به آن است بسیاری از ارزش هایک متغیر دیگر، یک مثال از ارتباطات احتمالاتی رابطه بین رشد و وزن مردم است. واضح است که همان ارتفاع می تواند در افراد مختلف وزن و بالعکس باشد.

همبستگی ارزش از -1 تا + 1 است و توسط نامه R نشان داده شده است. علاوه بر این، اگر ارزش به 1 نزدیک تر باشد، این به معنای وجود یک اتصال قوی است و اگر نزدیک به 0 باشد، ضعیف است. مقدار همبستگی کمتر از 0.2 به عنوان یک همبستگی ضعیف، بیش از 0.5 برابر است. اگر ضریب همبستگی منفی باشد، این به معنای حضور بازخورد است: بالاتر از مقدار یک متغیر، مقدار متفاوت پایین تر است.

بسته به مقدار ارزش های ضریب، ممکن است انواع مختلف همبستگی را تخصیص دهد:

همبستگی مثبت دقیقتعیین شده توسط مقدار OFR \u003d 1. اصطلاح "سخت" به این معنی است که مقدار یک متغیر به طور منحصر به فرد توسط مقادیر متغیر دیگری تعیین می شود و اصطلاح " مثبت "- که با افزایش مقادیر یک متغیر، مقدار متغیر دیگری نیز افزایش می یابد.

همبستگی دقیق، انتزاع ریاضی است و عملا در مطالعات واقعی رخ نمی دهد.

همبستگی مثبت مربوط به مقادیر 0 است.

عدم همبستگیتعیین شده توسط مقدار OFR \u003d 0. ضریب همبستگی صفر نشان می دهد که مقادیر متغیرها به یکدیگر مرتبط نیستند.

عدم همبستگی H. o. : 0 r. xy =0 فرموله شده به عنوان بازتاب خالی فرضیه در تجزیه و تحلیل همبستگی.

همبستگی منفی: -1

همبستگی منفی منفیتعیین شده توسط مقدار OFR \u003d -1. همچنین، همچنین یک همبستگی شدید مثبت، انتزاع است و در تحقیقات عملی بیان نمی کند.

میز 1

انواع همبستگی و تعاریف آنها

روش محاسبه ضریب همبستگی بستگی به نوع مقیاس است که مقادیر متغیر اندازه گیری می شود.

ضریب همبستگی r.پیرسوناین اصلی است و می تواند برای متغیرهای با مقیاس های اسمی و جزئی، توزیع مقادیر، توزیع مقادیر که به حالت عادی (همبستگی لحظات کار) مربوط می شود، استفاده شود. ضریب همبستگی پیرسون نتایج دقیق دقیق و در موارد توزیع غیر طبیعی را ارائه می دهد.

برای توزیع هایی که طبیعی نیستند، ترجیح می دهیم از ضرایب همبستگی رتبه بندی Spirmen و Kendalla استفاده کنیم. محدوده آنها به این دلیل است که برنامه متغیرهای همبستگی پیشگام است.

همبستگی برنامه های Rprman به صورت زیر ارائه می شود: اول، متغیرها به صفوف منتقل می شوند و سپس فرمولزون برای رتبه بندی استفاده می شود.

در قلب همبستگی پیشنهاد شده توسط M. Kendalla، ایده ای وجود دارد که جهت ارتباطات را می توان به قضاوت کرد، در مقایسه با افراد نسبت به افراد در میان خود. اگر یک جفت تغییرات آزمایش شده در X همزمان در جهت با تغییر در پرداخت، این نشان دهنده اتصال مثبت است. اگر آن را هماهنگ نمی کند - سپس یک اتصال منفی. این ضریب به طور عمده توسط روانشناسان کار با نمونه های کوچک استفاده می شود. از آنجایی که جامعه شناسان با آرایه های داده های بزرگ کار می کنند، تفاوت در فرکانس های نسبی و نوراتیهای تمام جفت افراد در نمونه دشوار است. شایع ترین ضریب است. پیرسون.

از آنجا که ضریب همبستگی RPIONSON اصلی است و می تواند مورد استفاده قرار گیرد (با یک خطای خاص بسته به نوع مقیاس و سطح غیر طبیعی در توزیع) برای همه متغیرهای اندازه گیری شده توسط مقیاس های کمی، نمونه هایی از استفاده از آن را در نظر بگیرید و نتایج حاصل از اندازه گیری را مقایسه کنید نتایج بر اساس سایر ضرایب همبستگی.

فرمول برای محاسبه ضریب r.- پیرسون:

r xy \u003d Σ (xi-xcp) ∙ (yi-ycr) / (n - 1) ∙ Σ x ∙ Σ y ∙

جایی که: Xi، Yi- مقادیر دو متغیر؛

XSR، YCR - مقادیر متوسط \u200b\u200bدو متغیر؛

Σ x، Σ y - انحرافات استاندارد،

n- تعداد مشاهدات.

همبستگی زوجین

به عنوان مثال، ما می خواهیم بدانیم چگونه پاسخ های بین انواع مختلف ارزش های سنتی در ایده دانشجویان در مورد محل کار ایده آل (متغیرها: A9.1، A9.3، A9.5، A9.7)، و سپس نسبت ارزش های لیبرال (A9 .2، A9.4. A9.6، A9.8). این متغیرها توسط مقیاس های سفارش شده 5 عضو اندازه گیری می شوند.

ما از روش استفاده می کنیم: "تجزیه و تحلیل"،  "همبستگی"،  "زوج". ضریب پیش فرض پیرسون در کادر محاوره ای تنظیم شده است. ما از ضرایب استفاده می کنیم. پیرسون

متغیرهای آزمون به پنجره انتخاب منتقل می شوند: A9.1، A9.3، A9.5، A9.7

با فشار دادن OK، ما محاسبه می کنیم:

همبستگی

a9.1.T. چقدر مهم است زمان کافی برای زندگی خانوادگی و شخصی؟

همبستگی پیرسون

Znch (2 طرف)

a9.3.T. چقدر مهم نیست که از دست دادن کار خود نترسید؟

همبستگی پیرسون

Znch (2 طرف)

a9.5.T. چقدر مهم است که چنین رئیس را داشته باشیم که با شما مشاوره، پذیرش این یا تصمیم گیری؟

همبستگی پیرسون

Znch (2 طرف)

a9.7.T. چقدر مهم است که در یک تیم منسجم کار کند، بخشی از آن را احساس کنید؟

همبستگی پیرسون

Znch (2 طرف)

** همبستگی در سطح 0.01 (2 طرف) معنی دار است.

جدول مقادیر کمی از ماتریس همبستگی ساخته شده

همبستگی خصوصی:

برای شروع، ما یک همبستگی جفتی بین دو متغیر مشخص کردیم:

همبستگی

c8 احساس صمیمیت با کسانی که در نزدیکی شما زندگی می کنند، همسایگان

همبستگی پیرسون

Znch (2 طرف)

c12 احساس صمیمیت با خانواده اش

همبستگی پیرسون

Znch (2 طرف)

** همبستگی در سطح 0.01 (2 طرفه) معنی دار است.

سپس از روش برای ایجاد یک همبستگی خصوصی استفاده کنید: "تجزیه و تحلیل"،  "همبستگی"،  "خصوصی".

فرض کنید ارزش "مهم است که تعیین و تغییر نظم کار خود را" در ارتباط با متغیرهای مشخص، عامل تعیین کننده ای باشد، تحت تاثیر آن، اتصال قبلا شناسایی شده ناپدید خواهد شد یا بی اساس خواهد بود.

همبستگی

متغیرهای محروم شده

c8 احساس صمیمیت با کسانی که در نزدیکی شما زندگی می کنند، همسایگان

c12 احساس صمیمیت با خانواده اش

c16. احساس صمیمیت با افرادی که ثروت مشابهی دارند

c8 احساس صمیمیت با کسانی که در نزدیکی شما زندگی می کنند، همسایگان

همبستگی

اهمیت (دوم)

c12 احساس صمیمیت با خانواده اش

همبستگی

اهمیت (دوم)

همانطور که می توان از جدول تحت تاثیر متغیر کنترل دیده می شود، اتصال کمی کاهش یافته است: از 0، 120 تا 0، 102. با این حال، این کاهش کمی اجازه نمی دهد تا ادعا کنید که زخم بازتابی از همبستگی نادرست است، زیرا این به اندازه کافی بالا باقی می ماند و اجازه می دهد تا یک خطای صفر برای رد فرض صفر باشد.

ضریب همبستگی

دقیق ترین روش برای تعیین صلیب ها و ماهیت همبستگی، یافتن ضریب همبستگی است. ضریب همبستگی تعداد تعریف شده توسط فرمول است:


جایی که R Hu ضریب همبستگی است؛

x i -thodics از ویژگی اول؛

در i-apposition از ویژگی دوم؛

میانگین مقادیر ریاضی اولین علامت

میانگین مقادیر محاسباتی از ویژگی دوم

برای استفاده از فرمول (32)، ما یک جدول را ساختیم که توالی لازم را در تهیه اعداد فراهم می کند تا عددی را پیدا کند و نامزدی ضریب همبستگی را پیدا کند.

همانطور که می توان از فرمول دیده می شود (32)، دنباله ای از اقدامات این است: ما به طور متوسط \u200b\u200bریاضی از هر دو نشانه X و Y پیدا می کنیم، ما تفاوت بین مقادیر ویژگی و میانگین آن (XI -) و і پیدا کنید -)، سپس کار خود را پیدا کنید (x і) (من -) - مجموع کشیش به ضریب همبستگی می دهد. برای پیدا کردن جانشین خود، آن را به دنبال تفاوت (x i -) و (در і -) برای ساخت یک مربع، پیدا کردن آنها مقادیر و استخراج ریشه مربع از کار خود را.

بنابراین به عنوان مثال 31، ضریب همبستگی مطابق با فرمول (32) می تواند به شرح زیر باشد (جدول 50).

تعداد حاصل ضریب همبستگی باعث ایجاد حضور، تنگی و ماهیت ارتباطات می شود.

1. اگر ضریب همبستگی صفر باشد، هیچ ارتباطی بین نشانه ها وجود ندارد.

2. اگر ضریب همبستگی برابر با یک باشد، رابطه بین نشانه ها بسیار بزرگ است، که تبدیل به یک عملکردی می شود.

3. ارزش مطلق ضریب همبستگی فراتر از محدوده صفر به یک نیست:

این باعث می شود تا حرکت به شدت اتصال را حرکت دهید: ارزش ضریب نزدیک به صفر، اتصال ضعیف تر است، و نزدیک به یک، اتصال نزدیک تر است.

4. علامت ضریب همبستگی "به علاوه" به معنای همبستگی مستقیم، علامت "منهای" است.

جدول 50

x і. і (x i -) (y -) (x і -) (y -) (x і -) 2 (y і -) 2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


بنابراین، محاسبه شده در مثال 31، ضریب همبستگی R xy \u003d +0.9. به شما اجازه می دهد چنین نتیجه گیری کنید: یک پیوند همبستگی بین قدرت عضلانی برس راست و چپ در دانش آموزان مورد مطالعه وجود دارد (ضریب R xy \u003d + 0.9 متفاوت از صفر است)، اتصال بسیار نزدیک است (ضریب R xy \u003d + 0.9 نزدیک به یک)، همبستگی ساده است (ضریب x xy \u003d +0.9 مثبت)، به عنوان مثال، با افزایش قدرت عضلانی یکی از برس ها، قدرت یک قلم مو دیگر افزایش می یابد.

هنگام محاسبه ضریب همبستگی و استفاده از خواص آن، باید توجه داشت که نتیجه گیری نتایج صحیح را در مورد زمانی که علائم به طور معمول توزیع می شود، ارائه می دهد و زمانی که رابطه بین تعداد زیادی از مقادیر هر دو نشانه در نظر گرفته می شود.

در مثال 31 مورد نظر، تنها 7 مقادیر هر دو نشانه مورد تجزیه و تحلیل قرار گرفت، که البته برای چنین مطالعات کافی نیست. ما دوباره به یاد می آوریم که نمونه هایی در این کتاب به طور کلی و در این فصل به طور خاص، ماهیت روش های روش ها و نه ارائه دقیق از هر آزمایش علمی نیست. در نتیجه، تعداد کمی از نشانه های نشانه ها در نظر گرفته می شود، اندازه گیری گرد است - همه اینها به منظور محاسبات بزرگ انجام می شود تا ایده روش را انجام ندهد.

توجه ویژه باید به ماهیت رابطه مورد بررسی پرداخت شود. ضریب همبستگی نمی تواند منجر به نتایج صحیح این مطالعه شود، اگر تجزیه و تحلیل رابطه بین نشانه ها به صورت رسمی انجام شود. بیایید دوباره به عنوان مثال 31 بازگردیم. هر دو ویژگی های مورد نظر، معنای قدرت عضلانی برس راست و چپ بود. تصور کنید که تحت نشانه XI به عنوان مثال 31 (14.0؛ 14.2؛ 14.9 ... ... 18.1) ما طول ماهی را به طور تصادفی گرفتار ماهی در سانتی متر، و تحت نشانه і (12،1؛ 13.8؛ 14.2. .. ... 17.4) - دستگاه در آزمایشگاه در کیلوگرم. به طور رسمی، با استفاده از دستگاه محاسبات برای پیدا کردن ضریب همبستگی و به دست آوردن در این مورد نیز r xy \u003d + 0\u003e 9، ما باید نتیجه گیری کنیم که رابطه نزدیک ماهی و وزن ابزارها وجود دارد. بی معنی بودن این نتیجه گیری واضح است.

برای جلوگیری از یک رویکرد رسمی به استفاده از ضریب همبستگی، با هر روش دیگری - ریاضی، منطقی، تجربی، نظری، به منظور شناسایی امکان همبستگی بین نشانه ها، یعنی تشخیص وحدت ارگانیک، پیگیری می شود علائم فقط پس از آن شما می توانید به استفاده از تحلیل همبستگی ادامه دهید و ارزش و ماهیت رابطه را تعیین کنید.

در آمار ریاضی هنوز یک مفهوم وجود دارد همبستگی چندگانه - روابط بین سه و علائم بیشتر. در این موارد، از ضریب همبستگی چندگانه متشکل از ضرایب همبستگی زوجی که در بالا ذکر شد استفاده کنید.

به عنوان مثال، ضریب همبستگی سه نشانه x і، y і، z u - وجود دارد:

جایی که R XYZ یک سیلندر همبستگی چندگانه است، بیانگر به عنوان نشانه X من بستگی به نشانه های і و z i؛

همبستگی سلولی R xy بین علائم X I و Y I؛

همبستگی R xz -Coeffer بین علائم Xi و Zi؛

r yz - ضریب همبستگی بین علائم Y I، Z I

تجزیه و تحلیل همبستگی این است:

تجزیه و تحلیل همبستگی

همبستگی - رابطه آماری بین دو یا چند متغیرهای تصادفی (یا مقادیر که می تواند به عنوان یک دقت مجاز در نظر گرفته شود). در عین حال، تغییرات در یک یا چند این ارزش ها منجر به تغییر سیستماتیک در سایر یا سایر ارزش ها می شود. معیار ریاضی همبستگی دو متغیرهای تصادفی ضریب همبستگی است.

همبستگی می تواند مثبت و منفی باشد (همچنین وضعیت کمبود روابط آماری وجود دارد - به عنوان مثال، برای متغیرهای تصادفی مستقل). همبستگی منفی - همبستگی که در آن افزایش یک متغیر با کاهش متغیر دیگری همراه است، در حالی که ضریب همبستگی منفی است. همبستگی مثبت - همبستگی که افزایش یک متغیر با افزایش متغیر دیگری همراه است، در حالی که ضریب همبستگی مثبت است.

همبستگی خودکار - رابطه آماری بین مقادیر تصادفی از یک ردیف، اما باید با تغییر، به عنوان مثال، برای یک فرایند تصادفی - با تغییر در زمان.

روش پردازش داده های آماری متشکل از بررسی ضرایب (همبستگی) بین متغیرها نامیده می شود تجزیه و تحلیل همبستگی.

ضریب همبستگی

ضریب همبستگی یا ضریب همبستگی کشاورز در نظریه احتمالات و آمار، این شاخصی از ماهیت تغییر در دو متغیر تصادفی است. ضریب همبستگی توسط نامه لاتین R نشان داده شده است و می تواند مقادیر بین -1 و + 1 را داشته باشد. اگر مقدار ماژول به 1 نزدیک تر باشد، این بدان معنی است که وجود یک پیوند قوی (با ضریب همبستگی، واحد در مورد اتصال عملکردی صحبت می کند)، و اگر نزدیک به 0، پس از آن ضعیف است.

ضریب همبستگی پیرسون

برای مقادیر متریک، ضریب همبستگی پیرسون اعمال می شود، فرمول دقیق آن توسط فرانسیس گالتون معرفی شد:

بیایید ایکس.,Y. - دو متغیر تصادفی که در یک فضای احتمالی تعریف شده اند. سپس ضریب همبستگی آنها توسط فرمول تعیین می شود:

,

جایی که COV به معنای کوواریانس است، و D پراکندگی است یا همان چیزی است

,

جایی که نماد به انتظارات ریاضی اشاره دارد.

شما می توانید یک سیستم مختصات مستطیلی با محورهای مربوط به هر دو متغیر استفاده کنید. هر جفت مقادیر با استفاده از یک نماد خاص مشخص شده است. چنین نمودار "نمودار پراکنده" نامیده می شود.

روش محاسبه ضریب همبستگی بستگی به نوع مقیاس دارد که متغیرهای مربوط به آن هستند. بنابراین، برای اندازه گیری متغیرهای با فاصله و مقیاس های کمی، لازم است از ضریب همبستگی پیرسون (همبستگی لحظات آثار) استفاده شود. اگر حداقل یکی از دو متغیر دارای مقیاس توالی باشد یا به طور معمول توزیع نشده باشد، لازم است از همبستگی رتبه الکل یا τ (Tau) Kendale استفاده شود. در مورد زمانی که یکی از دو متغیر دوقطبی است، یک همبستگی دو ردیف دو ردیف استفاده می شود و اگر هر دو متغیر دوجانبه باشند: همبستگی چهار طرفه. محاسبه ضریب همبستگی بین دو متغیر غیر کسری تنها به معنای محروم نیست، پیوند پیوند بین آنها از خطی (یک طرفه) است.

ضریب همبستگی کانندلا

برای اندازه گیری اختلال متقابل استفاده می شود.

ضریب همبستگی اسپیرمن

خواص ضریب همبستگی

  • نابرابری کوشی - Bunyakovsky:
اگر شما به عنوان یک محصول اسکالر از دو covariances تصادفی انتخاب کنید، میزان متغیر تصادفی برابر خواهد بود و نتیجه نابرابری کوشی - Bunyakovsky خواهد بود :. جایی که. علاوه بر این در این مورد علائم و k. مطابقت :.

تجزیه و تحلیل همبستگی

تجزیه و تحلیل همبستگی - روش پردازش داده های آماری متشکل از مطالعه ضرایب ( همبستگی) بین متغیرها در این مورد، ضرایب همبستگی بین یک جفت یا انواع جفت ویژگی ها برای ایجاد روابط آماری بین آنها مقایسه می شود.

هدف تجزیه و تحلیل همبستگی - ارائه اطلاعاتی در مورد یک متغیر با استفاده از یک متغیر دیگر. در مواردی که امکان دستیابی به هدف وجود دارد، گفته شده است که متغیرها بهم پیوستن. به طور کلی، پذیرش فرضیه در حضور همبستگی به این معنی است که تغییر در مقدار متغیر A به طور همزمان با تغییر متناسب در مقدار B رخ می دهد: اگر هر دو متغیر رشد کنند همبستگی مثبتاگر یک متغیر رشد کند، و دوم کاهش می یابد همبستگی منفی.

همبستگی تنها وابستگی خطی مقادیر را نشان می دهد، اما وابستگی عملکردی آنها را منعکس نمی کند. به عنوان مثال، اگر محاسبه ضریب همبستگی بین مقادیر آ. = s.من.n.(ایکس.) من. ب = c.o.s.(ایکس.)، پس از آن نزدیک به صفر خواهد بود، به عنوان مثال، وابستگی بین ارزش ها وجود ندارد. در همین حال، مقادیر A و B به وضوح به طور عملی توسط قانون مرتبط است s.من.n.2(ایکس.) + c.o.s.2(ایکس.) = 1.

محدودیت های تجزیه و تحلیل همبستگی



زوج ها (X، Y) نمودار توزیع با ضریب همبستگی مناسب X و Y برای هر یک از آنها. توجه داشته باشید که ضریب همبستگی نشان دهنده وابستگی خطی (خط بالا) است، اما منحنی وابستگی (خط متوسط) را توصیف نمی کند و برای توصیف وابستگی های پیچیده و غیر خطی (خط پایین تر) مناسب نیست.
  1. کاربرد در مورد تعداد کافی از موارد مورد مطالعه امکان پذیر است: برای یک نوع خاص از ضریب همبستگی از 25 تا 100 جفت مدارس.
  2. محدودیت دوم از فرضیه تجزیه و تحلیل همبستگی که در آن قرار دارد، دنبال می شود وابستگی خطی متغیرها. در بسیاری از موارد، زمانی که به طور قابل اعتماد شناخته شده است، وابستگی وجود دارد، تجزیه و تحلیل همبستگی ممکن است نتایج به سادگی به دلیل این واقعیت است که رابطه غیر خطی (به عنوان مثال، به عنوان مثال، به شکل یک پارابولا) نیست.
  3. به خودی خود، واقعیت وابستگی های همبستگی، زمینه هایی را برای استدلال که از متغیرها پیش از یا علت تغییرات است، ارائه نمی دهد یا اینکه متغیرها به طور کلی با یکدیگر ارتباط برقرار می کنند، به عنوان مثال، به عنوان مثال، به دلیل اقدامات عامل سوم.

منطقه کاربردی

این روش پردازش داده های آماری در اقتصاد و علوم اجتماعی بسیار محبوب است (به ویژه روانشناسی و جامعه شناسی)، هرچند دامنه ضرایب همبستگی گسترده است: کنترل کیفیت محصولات صنعتی، مطالعات فلزی، مواد شیمیایی کشاورزی، هیدروبیولوژی، بیومتریک و دیگران .

محبوبیت این روش به علت دو لحظه است: ضرایب همبستگی نسبتا ساده در شمارش، استفاده از آنها نیاز به آموزش ویژه ریاضی ندارد. در ترکیب با سادگی تفسیر، سادگی ضریب به طور گسترده ای در گستره تجزیه و تحلیل داده های آماری منجر شده است.

همبستگی نادرست

اغلب سادگی وسوسه انگیز تحقیقات همبستگی، محقق را فشار می دهد تا نتیجه های بصری نادرست در مورد وجود یک رابطه علی بین زوجین علائم ایجاد کند، در حالی که ضریب همبستگی تنها روابط آماری را ایجاد می کند.

در حقیقت، در روش های کمی مدرن علوم اجتماعی، در واقع، امتناع تلاش برای ایجاد روابط علی بین متغیرهای مشاهده شده از روش های تجربی وجود داشت. بنابراین، زمانی که محققان علوم اجتماعی از ایجاد ارتباطات بین متغیرهای مورد مطالعه سخن می گویند، به این معنی است که یک فرض کلی یا وابستگی آماری به طور کلی مرتبط است.

همچنین ببینید

  • تابع تکاملی
  • تابع مربوط به
  • کوارتیتور
  • ضریب تعیین
  • تجزیه و تحلیل رگرسیون

بنیاد ویکیمدیا. 2010.

ضریب همبستگی - این یک مقدار است که می تواند از +1 تا -1 متفاوت باشد. در مورد همبستگی مثبت مثبت، این ضریب به علاوه 1 است (آنها پیشنهاد می کنند که با افزایش ارزش یک متغیر، مقدار یک متغیر دیگر افزایش می یابد) و با یک منفی کامل - منهای 1 (نشان دهنده بازخورد، یعنی با افزایش مقادیر یک متغیر، مقادیر مختلف کاهش می یابد).

PR1:

نمودار وابستگی خجالت و دیپرسز. همانطور که می بینید، امتیازات (افراد) هرج و مرج نیست، اما در اطراف یک خط ساخته شده است، و به دنبال این خط ما می توانیم بگوییم که بالاتر از فرد در فرد بیان شده است، افسردگی بیشتر، به عنوان مثال، این پدیده ها متصل هستند.

PR2 .: برنامه ریزی برای خجالت و اجتماعی بودن. ما می بینیم که با افزایش خجالت، جامعه شناسی کاهش می یابد. ضریب همبستگی آنها -0.43 است. بنابراین، ضریب همبستگی بیشتر از 0 تا 1 صحبت از ارتباطات متناسب مستقیم (بیشتر ... بیشتر ...)، و ضریب از -1 تا 0 در مورد نارضایتی (بیشتر ... کمتر .. .)

اگر ضریب همبستگی 0 باشد، هر دو متغیرها کاملا مستقل از یکدیگر هستند.

همبستگی - این یک اتصال است که در آن قرار گرفتن در معرض عوامل فردی تنها به عنوان گرایش (به طور متوسط) با مشاهدات توده ای از داده های واقعی ظاهر می شود. نمونه هایی از وابستگی های همبستگی می تواند وابستگی بین اندازه دارایی های بانک و میزان سود بانک، رشد بهره وری کار و تجربه کارکنان باشد.

دو سیستم طبقه بندی ارتباطات همبستگی در قدرت خود استفاده می شود: عمومی و خصوصی.

طبقه بندی عمومی همبستگی: 1) قوی یا نزدیک با ضریب همبستگی R\u003e 0.70؛ 2) میانگین 0.500.70، و نه تنها یک همبستگی سطح بالایی از اهمیت.

جدول زیر نام ضرایب همبستگی برای انواع مختلف مقیاس ها را نوشت.

مقیاس دوگانگی (1/0) مقیاس رتبه (مرتبه)
مقیاس دوگانگی (1/0) ضریب انجمن پیرسون، ضریب پیرسون چهار هیئت مدیره. همبستگی بیسنی
مقیاس رتبه (مرتبه) رتبه همبستگی بیسیال. ضریب همبستگی روح یا کناللا.
فاصله و مقیاس مطلق همبستگی بیسنی مقادیر مقیاس فاصله به صفوف ترجمه می شود و از ضریب رتبه استفاده می شود ضریب همبستگی پیرسون (ضریب همبستگی خطی)

برای r.=0 همبستگی خطی از دست رفته است. در عین حال، متغیرهای متوسط \u200b\u200bگروه با میانگین های مشترک آنها همخوانی دارند و خطوط رگرسیون موازی با محورهای مختصات هستند.

برابری r.=0 این فقط در مورد عدم وابستگی همبستگی خطی (غیر خوردگی متغیرها) صحبت می کند، اما در مورد عدم وجود همبستگی، و حتی بیشتر، وابستگی آماری نیست.

گاهی اوقات نتیجه گیری در مورد عدم وجود همبستگی مهمتر از حضور یک همبستگی قوی است. همبستگی صفر دو متغیر ممکن است نشان دهد که هیچ تاثیری از یک متغیر به دیگری وجود ندارد، به شرطی که ما به نتایج اندازه گیری اعتماد داریم.

در SPSS: 11.3.2 ضرایب همبستگی

تا به حال، ما تنها واقعیت وجود وابستگی آماری بین دو نشانه را کشف کردیم. بعد، ما سعی خواهیم کرد تا نتیجه گیری کنیم که نتیجه گیری می تواند در مورد قدرت یا ضعف این وابستگی، و همچنین در مورد شکل و جهت آن انجام شود. معیارهای ارزیابی کمی از رابطه بین متغیرها ضرایب همبستگی یا اقدامات مرتبط با همبستگی نامیده می شود. دو متغیر با یکدیگر مثبت همبستگی دارند، اگر نسبت مستقیم و یک طرفه بین آنها وجود داشته باشد. با یک نسبت یک طرفه، مقادیر کوچک یک متغیر به مقادیر کوچک متغیر دیگری مربوط می شود، مقادیر زیادی بزرگ هستند. دو متغیر با یکدیگر منفی هستند، اگر نسبت معکوس و چند منظوره بین آنها وجود داشته باشد. با یک نسبت چند منظوره، مقادیر کوچک یک متغیر به مقادیر زیادی متغیر دیگری متصل می شود و بالعکس. مقادیر ضرایب همبستگی همیشه در محدوده -1 تا +1 قرار دارد.

ضریب همبستگی بین متغیرهای متعلق به مقیاس مقادیر با ضریب ضریب و متغیرهای مربوط به فاصله - ضریب همبستگی پیرسون (لحظه ای از آثار) استفاده می شود. لازم به ذکر است که هر متغیر دوجانبه، یعنی یک متغیر متعلق به مقیاس اسمی و داشتن دو دسته می تواند به عنوان مرتبه در نظر گرفته شود.

برای شروع، ما بررسی می کنیم که آیا همبستگی بین متغیرهای جنسی و روان از فایل Studium.SAV وجود دارد. در عین حال، ما در نظر می گیریم که متغیر دوگانگی جنس می تواند عادی باشد. این مراحل را دنبال کنید:

· آمار توصیفی را انتخاب کنید (آمار توصیفی) دستورات در منوی فرمان تجزیه و تحلیل ... (جداول همجوشی)

· انتقال متغیر جنسی به لیست رشته، و متغیر روان در لیست ستون است.

· بر روی آمار ... (آمار) دکمه کلیک کنید. در CrosStabs: گفتگوی آمار، کادر مربوط به همبستگی (همبستگی) را انتخاب کنید. تماس با دکمه ادامه را تایید کنید.

· در گفتگوی CrosStabs، از خروجی جداول با چک کردن جعبه بررسی جداول SURPRESS امتناع کنید. روی دکمه OK کلیک کنید.

ضرایب ضرایب همبستگی اسپرینت و پیرسون محاسبه خواهد شد و اهمیت آنها بررسی می شود:

/ تئوری. ضریب همبستگی

ضریب همبستگی - آمار توصیفی دو بعدی، اندازه گیری کمی از رابطه (متغیر مشترک) دو متغیر.

تا به امروز، بسیاری از ضرایب همبستگی بسیار متفاوت توسعه یافته است. با این حال، مهمترین اقدامات ارتباطی - Pearson، Spearman و Kendalla . ویژگی کلی آنها این است آنها رابطه دو نشانه را نشان می دهند , اندازه گیری شده در مقیاس کمی - رتبه یا متریک .

به طور کلی، هر مطالعه تجربی بر روی مطالعه روابط دو یا چند متغیر متمرکز است. .

اگر تغییر در یک متغیر در هر واحد همیشه منجر به تغییر در یک متغیر دیگر در همان مقدار، عملکرد است خطی (برنامه نشان دهنده یک خط مستقیم است)؛ هر گونه اتصال دیگر - غیر خطی . اگر افزایش یک متغیر با افزایش در دیگری همراه باشد، پس از آن ارتباط - مثبت ( سر راست ) ; اگر افزایش یک متغیر با کاهش دیگر همراه باشد، سپس ارتباطات - منفی ( معکوس کردن ) . اگر جهت تغییر یک متغیر با افزایش (نزولی) یک متغیر دیگر تغییر نمی کند، پس از آن چنین عملکرد - مونوتون ; در غیر این صورت عملکرد نامیده می شود غیر عادی .

روابط عملکردی ایده آل است. ویژگی آنها این است که یک مقدار از یک متغیر مربوط به یک مقدار کاملا تعریف شده از یک متغیر دیگر است. به عنوان مثال، این رابطه دو متغیر فیزیکی - وزن و طول بدن (خطی مثبت) است. با این حال، حتی در آزمایش های فیزیکی، رابطه تجربی از رابطه عملکردی به علت علل غیرقابل قبول یا ناشناخته متفاوت خواهد بود: نوسانات ترکیب مواد، خطاهای اندازه گیری، و غیره

هنگام مطالعه رابطه علائم از زمینه دیدگاه محقق، بسیاری از علل احتمالی تغییرات این نشانه ها به ناچار سقوط می کنند. نتیجه این است که حتی موجود در واقعیت، ارتباط عملکردی بین متغیرها به صورت تجربی به عنوان احتمال (تصادفی) عمل می کند: همان مقدار یک متغیر مربوط به توزیع مقادیر مختلف متغیر دیگری است (و بالعکس).

ساده ترین مثال نسبت رشد و وزن مردم است. نتایج تجربی مطالعه این دو نشانه، البته، رابطه مثبت آنها را نشان می دهد. اما آسان است حدس بزنید که آن را از یک تابع ریاضی دقیق، خطی، مثبت ایده آل، حتی با تمام ترفندهای محقق بر حسابداری هماهنگی یا کامل بودن موضوعات متفاوت خواهد بود. بعید است که بر این اساس کسی به ذهن خود ادامه خواهد داد تا واقعیت حضور یک ارتباط دقیق عملکردی بین طول و وزن بدن را انکار کند.

بنابراین، رابطه عملکردی پدیده های تجربی تنها می تواند به عنوان یک اتصال احتمالی علائم مربوطه شناسایی شود.

یک ایده بصری از شخصیت ارتباطات احتمالاتی، یک نمودار پراکنده - یک نمودار، محور آن مربوط به مقادیر دو متغیر است و هر موضوع یک نقطه است. ضرایب همبستگی به عنوان یک ویژگی عددی ارتباط احتمالی استفاده می شود.

شما می توانید سه درجه مقادیر همبستگی برای نیروی ارتباطی را وارد کنید:

r.< 0,3 - слабая связь (менее 10% от общей доли дисперсии);

0,3 < r < 0,7 - умеренная связь (от 10 до 50% от общей доли дисперсии);

r\u003e 0.7 - پیوند قوی (50٪ یا بیشتر از کل کسری از پراکندگی).

همبستگی خصوصی

اغلب اتفاق می افتد که دو متغیر تنها با یکدیگر همبستگی دارند تنها به دلیل این واقعیت است که هر دو آنها تحت تاثیر برخی از متغیر سوم تغییر می کنند. به این ترتیب، در واقع، رابطه بین خواص مربوطه این دو متغیر وجود ندارد، اما خود را در یک رابطه آماری یا همبستگی تحت تاثیر کل علت سوم متغیر نشان می دهد).

بنابراین، اگر همبستگی بین دو متغیر کاهش یابد، با یک مقدار تصادفی سوم ثابت، این بدان معنی است که وابستگی متقابل آنها بخشی از طریق تاثیر این متغیر سوم رخ می دهد. اگر همبستگی خصوصی صفر یا بسیار کوچک باشد، می توانیم نتیجه گیری کنیم که وابستگی متقابل آنها به طور کامل به دلیل تاثیر آن است و به متغیر سوم مربوط نیست.

همچنین، اگر همبستگی خصوصی بیشتر از همبستگی اولیه بین دو متغیر باشد، می توان نتیجه گرفت که متغیرهای دیگر ارتباطات را تضعیف کرده یا همبستگی "پنهان" را تضعیف می کنند.

علاوه بر این، لازم است به یاد داشته باشید که همبستگی علیت نیست . بر اساس این، ما حق نداریم در مورد حضور یک رابطه علمی به طریقی طراحی کنیم: برخی از آنها کاملا متفاوت از تجزیه و تحلیل مورد نظر در تجزیه و تحلیل می تواند منبع این همبستگی باشد. هر دو با همبستگی عادی، و تحت همبستگی خصوصی، فرضیه علیت باید همیشه پایه های غیر حیاتی خود را داشته باشد.

ضریب همبستگی پیرسون

ر - پیرسون مورد استفاده برای مطالعه رابطه دو متریک متریک , اندازه گیری شده در همان نمونه . موقعیت های زیادی وجود دارد که در آن استفاده از آن مناسب است. آیا هوش بر عملکرد تحصیلی در دوره های ارشد دانشگاه تاثیر می گذارد؟ آیا میزان دستمزد کارمند با خیرخواهی خود به همکارانش است؟ آیا خلق و خوی دانشجویی بر موفقیت حل یک کار ریاضی پیچیده تاثیر می گذارد؟ برای پاسخ به چنین سوالاتی، محقق باید دو شاخص مورد علاقه به هر عضو نمونه را اندازه گیری کند.

مقدار ضریب همبستگی تاثیری بر علائم ارائه نمی دهد که در آن واحدهای اندازه گیری ارائه می شود. در نتیجه، هر تبدیل شخصیت خطی (ضرب به ثابت، اضافه کردن ثابت)، مقادیر ضریب همبستگی را تغییر نمی دهد. استثناء، ضرب یکی از نشانه های ثابت منفی است: ضریب همبستگی نشانه آن را به مخالف تغییر می دهد.

همبستگی پیرسون ارتباط خطی بین دو متغیر وجود دارد . این اجازه می دهد تا شما را تعیین کنید , چقدر متناسب با تغییرات دو متغیر . اگر متغیرها متناسب با یکدیگر باشند، سپس به صورت گرافیکی ارتباط بین آنها را می توان به عنوان یک خط مستقیم با یک خط مثبت (نسبت مستقیم) یا منفی (نسبت معکوس) توسط شیب نشان داد.

در عمل، رابطه بین دو متغیر، اگر این باشد، احتمالا احتمالا و گرافیکی به نظر می رسد مانند پراکندگی ابر یک فرم بیضوی است. با این وجود این بیضوی می تواند به صورت یک خط مستقیم یا خطوط رگرسیون (تقریبی) ارائه شود. خط رگرسیون - این یک خط مستقیم است که توسط حداقل مربعات ساخته شده است: مجموع مربعات فاصله (محاسبه شده در امتداد محور Y) از هر نقطه از برنامه پراکندگی به راست حداقل است.

اهمیت ویژه ای برای برآورد دقت پیش بینی پراکندگی برآوردهای متغیر وابسته است. در حقیقت، پراکندگی برآوردهای متغیر وابسته Y بخشی از پراکندگی کامل آن است که به دلیل تأثیر یک متغیر مستقل X است. به عبارت دیگر، نسبت پراکندگی تخمین های متغیر وابسته به درست است پراکندگی برابر با مربع ضریب همبستگی است.

مربع ضریب همبستگی متغیرهای وابسته و مستقل، کسری از پراکندگی متغیر وابسته به علت تأثیر یک متغیر مستقل است و نامیده می شود ضریب تعیین . ضریب تعیین، بنابراین، نشان می دهد که میزان تغییرات یک متغیر به علت (تعیین شده) با تأثیر متغیر دیگری نشان می دهد.

ضریب تعیین در مقایسه با ضریب همبستگی، مزیت مهمی دارد. همبستگی یک تابع ارتباطی خطی بین دو متغیر نیست. بنابراین، ضرایب همبستگی ریاضی به طور متوسط \u200b\u200bبرای نمونه های چندگانه با همبستگی محاسبه شده بلافاصله برای همه افراد از این نمونه ها محاسبه نمی شود (به عنوان مثال، ضریب همبستگی افزودنی نیست). برعکس، ضریب تعیین نشان دهنده اتصال به صورت خطی است و بنابراین افزودنی است: میانگین آن برای چند نمونه مجاز است.

اطلاعات اضافی در مورد قدرت ارتباط، ارزش ضریب همبستگی را در میدان می دهد - ضریب تعیین: این بخشی از پراکندگی یک متغیر است که می تواند با اثر متغیر دیگری توضیح داده شود. در مقایسه با ضریب همبستگی، ضریب تعیین با افزایش نیروی ارتباطی به صورت خطی افزایش می یابد.

ضرایب همبستگی روح و τ-kendalla (همبستگی های رتبه). اگر هر دو متغیرهایی بین آن ارتباطات مورد مطالعه قرار گیرند، در مقیاس روش، یا یکی از آنها - به ترتیب، و دیگری - در متریک، و سپس ضرایب همبستگی رتبه اعمال می شود: اسپیرمن یا τ. - کندلا . و T. , و ضریب دیگر نیاز به استفاده از پیش از رتبه بندی هر دو متغیر دارد. .

ضریب همبستگی رتبه Spearman - این روش غیر پارامتری است , که به منظور مطالعه آماری ارتباطات بین پدیده ها استفاده می شود . در این مورد، درجه واقعی همبستگی بین دو ردیف کمی از ویژگی های مورد مطالعه تعیین می شود و ارزیابی تعریف ارتباط برقرار شده با استفاده از ضریب اندازه گیری کمی تعیین می شود.

اگر اعضای اعضای گروه در ابتدا در امتداد متغیر x قرار داشته باشند، پس با توجه به متغیر y، سپس همبستگی بین متغیرهای X و Y را می توان به دست آورد، به سادگی محاسبه ضریب پیرسون برای دو ردیف از صفوف. با توجه به عدم وجود اوراق قرضه در صفوف (یعنی فقدان صفات تکراری) بر روی متغیر دیگر، فرمول برای پیرسون می تواند به طور قابل توجهی در شرایط محاسباتی ساده شده و تبدیل به یک فرمول شناخته شده به عنوان اسپارمن .

ضریب توان همبستگی رودخانه روح، تا حدودی پایین تر از قدرت ضریب همبستگی پارامتری است.

ضریب همبستگی رتبه بندی توصیه می شود اگر تعداد کمی از مشاهدات وجود داشته باشد . این روش می تواند نه تنها برای داده های کمی سنجی مورد استفاده قرار گیرد. , اما همچنین در موارد , هنگامی که مقادیر ثبت شده توسط نشانه های توصیفی از شدت های مختلف تعیین می شود .

ضریب همبستگی رتبه الکل با تعداد زیادی از صفوف یکسان در یک یا هر دو متغیرهای قانع کننده، مقادیر درشت را می دهد. در حالت ایده آل، هر دو ردیف همبسته باید دو توالی از مقادیر نامناسب باشند.

جایگزینی برای همبستگی اسپیرمن برای حقوق نشان دهنده همبستگی است τ-kendalla . در قلب همبستگی پیشنهاد شده توسط M. Kendalle، این ایده را مطرح می کند که جهت ارتباطات را می توان در مقایسه با آزمون های خود در میان خود مقایسه کرد: اگر یک جفت آزمون تحت X همزمان در جهت با تغییر در Y باشد این نشان می دهد که اتصال مثبت اگر همزمان نباشد - سپس بر روی یک اتصال منفی.

ضرایب همبستگی به ویژه برای تعیین عددی قدرت و جهت ارتباط بین دو خواص اندازه گیری شده در مقیاس های عددی طراحی شده است (متریک یا رتبه).

همانطور که قبلا ذکر شد حداکثر مقاومت ارتباطی مطابق با مقادیر همبستگی +1 (ارتباط مستقیم مستقیم یا مستقیما) و -1 (ارتباطات دقیق معکوس یا عقب نسبت به عقب) مطابقت دارد، عدم وجود ارتباطات مربوط به همبستگی برابر صفر است.

اطلاعات اضافی در مورد قدرت ارتباط، ارزش ضریب تعیین را می دهد: این بخشی از پراکندگی یک متغیر است که می تواند با اثر متغیر دیگری توضیح داده شود.

موضوع 12 تجزیه و تحلیل همبستگی

وابستگی عملکردی و همبستگی. بیشتر برپایپ در قرن وی قبل از میلاد مسیح e توجه به حضور ارتباط بین بدن و خلق و خوی افراد، بین ساختار بدن و مستعد ابتلا به بیماری های یک یا چند بیماری را جلب کرد. انواع خاصی از این رابطه نیز در حیوانات و دنیای گیاه شناسایی شده است. بنابراین، رابطه بین بدن و بهره وری در حیوانات مزرعه رابطه وجود دارد؛ رابطه بین کیفیت دانه ها و عملکرد گیاهان کشت شده و غیره همانطور که برای چنین وابستگی های زیست محیطی، وابستگی بین محتوای فلزات سنگین در خاک و پوشش برف از غلظت آنها در هوا اتمسفر وجود دارد. بنابراین، به طور طبیعی، تمایل به استفاده از این الگو در منافع انسان، آن را به بیان کمی یا کمتر دقیق کمی.

همانطور که شناخته شده است، مفهوم ریاضی عملکرد اعمال می شود برای توصیف ارتباط بین متغیرها f.که با هر مقدار خاصی از یک متغیر مستقل مواجه می شود ایکس. ارزش تعریف شده متغیر وابسته y. . این نوع روابط یکپارچه بین متغیرها ایکس. و y زنگ زدن کاربردی. با این حال، این نوع ارتباطات در اشیاء طبیعی همیشه از همیشه دور است. بنابراین، وابستگی بین علائم زیستی، و همچنین نشانه های زیست محیطی عملکردی نیست، اما ماهیت آماری، زمانی که در توده افراد همگن، یک مقدار مشخصی از یک ویژگی در نظر گرفته شده به عنوان یک استدلال مربوط به اهمیت عددی مشابه نیست، بلکه یک کل است محدوده توزیع تغییرات عددی مقادیر یکی دیگر از ویژگی های مورد نظر به عنوان یک متغیر وابسته یا تابع. این نوع وابستگی بین متغیرها نامیده می شود همبستگی یا همبستگی ..

اوراق قرضه عملکردی را می توان به راحتی تشخیص داده و اندازه گیری شده بر روی اشیاء تک و گروهی، اما این را نمی توان با اوراق قرضه همبستگی انجام داد، که می تواند تنها بر روی اشیاء گروهی با روش های آمار ریاضی مورد مطالعه قرار گیرد. پیوند همبستگی بین علائم خطی و غیر خطی، مثبت و منفی است. وظیفه تجزیه و تحلیل همبستگی برای ایجاد جهت و شکل ارتباط بین نشانه های مختلف، اندازه گیری شدت آن و در نهایت، برای بررسی صحت شاخص های همبستگی انتخابی، کاهش می یابد.

وابستگی بین متغیرها ایکس. و Y. این را می توان از لحاظ تحلیلی بیان کرد (با کمک فرمول ها و معادلات) و گرافیکی (به عنوان یک مکان هندسی در سیستم مختصات مستطیلی). گراف وابستگی همبستگی توسط تابع معادله یا نامیده می شود پسرفت. در اینجا و - میانگین ریاضیات در وضعیتی که ایکس. یا Y. برخی از ارزش ها قبول خواهند کرد ایکس. یا y. این رسانه ها نامیده می شوند مشروط.

11.1 شاخص های ارتباطی پارامتری

ضریب همبستگی. conams بین مقادیر متغیر ایکس. و y شما می توانید با تطبیق مقادیر عددی یکی از آنها با مقادیر مربوطه دیگر تنظیم کنید. اگر دیگر با افزایش یک متغیر افزایش یابد، نشان می دهد ارتباط مثبت بین این مقادیر، و بالعکس، زمانی که افزایش یک متغیر با کاهش ارزش دیگری همراه است، این نشان می دهد ارتباط منفی.

برای مشخص کردن اتصال، جهت آن و درجه همبستگی متغیرها توسط شاخص های زیر استفاده می شود:

    اعتیاد خطی - ضریب همبستگی;

    غیر خطی - رابطه همبستگی.

برای تعیین ضریب همبستگی تجربی، فرمول زیر استفاده می شود:

. (1)

اینجا s. ایکس. و s. y - انحراف متوسط \u200b\u200bدرجه دوم.

ضریب همبستگی را می توان بدون استفاده از محاسبه انحرافات درجه دوم متوسط \u200b\u200bمحاسبه کرد، که با توجه به فرمول مشابه زیر، کار محاسباتی را ساده می کند:

. (2)

ضریب همبستگی یک عدد بدون بعد در محدوده -1 تا +1 است. در صورت تنوع مستقل نشانه ها، زمانی که رابطه بین آنها کاملا غایب است. قوی تر همبستگی بین علائم، بالاتر از ضریب همبستگی است. بنابراین، با این شاخص نه تنها حضور، بلکه درجه همبستگی بین علائم را مشخص می کند. با یک اتصال مثبت یا مستقیم، زمانی که مقادیر زیادی از یک ویژگی به بزرگترین ارزش های دیگر مربوط می شود، ضریب همبستگی دارای علامت مثبت است و در محدوده 0 تا 1 برابر است، با منفی یا بازخورد، هنگامی که مقادیر کوچکتر دیگر مربوط به مقادیر زیادی از یک ویژگی است، ضریب همبستگی همراه با علامت منفی است و از 0 تا 1 متغیر است.

ضریب همبستگی در عمل به طور گسترده ای مورد استفاده قرار گرفت، اما این شاخص جهانی از اوراق قرضه همبستگی نیست، زیرا تنها اتصالات خطی قادر به مشخص شدن هستند، I.E. بیان شده توسط معادله رگرسیون خطی (نگاه کنید به موضوع 12). اگر وابستگی غیر خطی بین علائم مختلف وجود داشته باشد، سایر شاخص های ارتباطی مورد استفاده قرار می گیرند، در زیر مورد بحث قرار می گیرند.

محاسبه ضریب همبستگی. این محاسبه به روش های مختلف و به روش های مختلف بسته به تعداد مشاهدات (نمونه گیری) تولید می شود. به طور جداگانه جزئیات محاسبه ضریب همبستگی در حضور نمونه های کوچک و نمونه های حجم بزرگ را در نظر بگیرید.

نمونه های کوچک. در حضور نمونه های کوچک، ضریب همبستگی به طور مستقیم توسط مقادیر علائم کنسانتره محاسبه می شود، بدون قبل از گروه بندی داده های نمونه به باند های تنوع. برای این، فرمول های بالا (1) و (2) خدمت می کنند. راحت تر، به خصوص در حضور تعداد مولکولی و کسری، که توسط نوع بیان شده است h. من. و y من. از میانگین و فرمول های کار زیر خدمت می کنند:

جایی که ;

;

اینجا ایکس. من. و y من. - نسخه های زوج نشانه های کنجد ایکس. و y؛ و -s- یک ریاضی؛ - تفاوت بین گزینه های جفت نشانه های کنجد ایکس. و y; n. - تعداد کل مشاهدات زوج یا مقدار جمع بندی انتخابی.

ضریب همبستگی تجربی، به عنوان هر شاخص انتخابی دیگر، به عنوان ارزیابی آن عمل می کند پارامتر عمومی ρ و به عنوان یک مقدار تصادفی با یک خطا همراه است:

نسبت ضریب همبستگی انتخابی به خطای آن به عنوان یک معیار برای بررسی فرضیه صفر عمل می کند - فرضیه ای که در جمعیت عمومی، این پارامتر صفر است، I.E. . فرضیه صفر در سطح اهمیت پذیرفته شده رد می شود α ، اگر یک

مقادیر نقاط بحرانی t. خیابان برای سطوح مختلف اهمیت α و تعداد درجه آزادی در برنامه های جدول 1 داده می شود.

ثابت شده است که هنگام پردازش نمونه های کوچک (به ویژه زمانی که n.< 30 ) محاسبه ضریب همبستگی با توجه به فرمول ها (1) - (3) تخمین های دست کم از پارامتر عمومی را می دهد ρ . لازم است اصلاحات زیر را انجام دهیم:

فیشر Z-تبدیل. استفاده مناسب از ضریب همبستگی شامل توزیع نرمال مجموعه دو بعدی از مقادیر همجوشی متغیرهای تصادفی است ایکس. و y. از آمار ریاضی، شناخته شده است که با همبستگی معنی داری بین متغیرها، I.E. چه زمانی R. xy > 0,5 توزیع انتخابی ضریب همبستگی برای تعداد بیشتری از نمونه های کوچک گرفته شده از جمعیت به طور معمول توزیع عمومی به طور قابل توجهی از منحنی طبیعی جدا شده است.

با توجه به این شرایط R. Fisher یک روش دقیق تر برای برآورد پارامتر کلی به ارزش ضریب همبستگی انتخابی پیدا کرد. این روش برای جایگزینی پایین آمده است R. xy ارزش Z، که با ضریب همبستگی تجربی همراه است، به شرح زیر است:

توزیع مقدار Z تقریبا بدون تغییر در فرم است، زیرا کمی بستگی به اندازه نمونه و ارزش ضریب همبستگی در جمعیت عمومی دارد و به توزیع نرمال نزدیک می شود.

معیار قابلیت اطمینان شاخص Z نگرش زیر است:

فرضیه صفر در سطح اهمیت پذیرفته شده رد می شود α و تعداد درجه آزادی. مقادیر نقاط بحرانی t. خیابان LED در جدول 1 برنامه های کاربردی.

کاربرد z-transform به شما امکان می دهد تا اهمیت آماری ضریب همبستگی انتخابی، و همچنین تفاوت بین ضرایب تجربی، زمانی که نیاز به وجود دارد، ارزیابی کنید.

حداقل اندازه نمونه برای برآورد دقیق ضریب همبستگی. شما می توانید اندازه نمونه را برای مقدار مشخص شده ضریب همبستگی محاسبه کنید، که کافی خواهد بود تا فرضیه صفر را رد کند (اگر همبستگی بین علائم Y. و ایکس. واقعا وجود دارد) برای این به عنوان فرمول زیر عمل می کند:

جایی که n. - اندازه نمونه مورد نظر؛ t. - ارزش مشخص شده با توجه به سطح پذیرفته شده از اهمیت (بهتر برای α \u003d 1٪)؛ z. - ضریب همبستگی تجربی تبدیل شده است.

نمونه های بزرگ. در حضور داده های متعدد منبع، آنها باید به ردیف های متغیر و ایجاد یک شبکه همبستگی، تفاوت در سلول های خود را (سلول ها) فرکانس های عمومی از ردیف های کنجد دسته بندی شوند. مشبک همبستگی توسط تقاطع ردیف ها و ستون ها تشکیل شده است، تعداد آن برابر با تعداد گروه ها یا کلاس های ردیف همبستگی است. کلاس ها در رشته بالا و در ستون اول (سمت چپ) جدول همبستگی قرار دارند و فرکانس های کل نشان داده شده توسط نماد f. xy - در سلول های شبکه همبستگی، که بخش اصلی جدول همبستگی را تشکیل می دهد.

کلاس های قرار داده شده در خط بالای جدول معمولا از سمت چپ به راست به منظور افزایش سفارش، و در ستون اول جدول - از بالا به پایین در کاهش سفارش. با این مکان از کلاس از سری های متغیر، فرکانس های کل آنها (اگر ارتباط مثبت بین علائم وجود دارد Y. و ایکس.) آنها از طریق سلول های شبکه ای به صورت مورب بیضوی از گوشه پایین سمت چپ به گوشه بالا سمت راست شبکه یا (در حضور یک اتصال منفی بین علائم) در جهت از گوشه بالا سمت چپ توزیع می شوند به گوشه پایین سمت راست شبکه. اگر فرکانس f. xy این بر روی سلول های شبکه همبستگی بیشتر یا کمتر به طور مساوی توزیع می شود، بدون تشکیل یک شکل بیضوی، عدم وجود همبستگی بین علائم را نشان می دهد.

توزیع فرکانس f. xy با توجه به سلول های شبکه همبستگی، تنها یک ایده کلی حضور یا عدم وجود ارتباط بین نشانه ها داده می شود. فقط به دلیل ارزش و نشانه کمتر یا کمتر نشان داده شده است ضریب همبستگی. هنگام محاسبه ضریب همبستگی با گروه بندی اولیه از داده های نمونه در نوارهای تنوع فاصله نباید فواصل زمانی بیش از حد گسترده باشد. گروه بندی خشن بسیار قوی تر از مقدار ضریب همبستگی است که در هنگام محاسبه میانگین مقادیر و شاخص های تنوع، اتفاق می افتد.

به یاد بیاورید که مقدار فاصله کلاس توسط فرمول تعیین می شود

جایی که ایکس. مکس , ایکس. دقیقه - حداکثر و حداقل گزینه های ترکیبی؛ به - تعداد کلاس هایی که مشخصه ویژگی ویژگی باید تقسیم شود. تجربه نشان داده است که در زمینه تجزیه و تحلیل همبستگی، مقدار به این می تواند به اندازه نمونه تقریبا به صورت زیر شناخته شود (جدول 1).

میز 1

حجم نمونه برداری

معنی K.

50 ≥ n\u003e 30

100 ≥ n\u003e 50

200 ≥ n\u003e 100

300 ≥ n\u003e 200

همانند سایر ویژگی های آماری محاسبه شده با گروه بندی اولیه از داده های اولیه به مجموعه های متغیر، ضریب همبستگی با روش های مختلفی تعیین می شود که نتایج کاملا یکسان را ارائه می دهند.

روش کار. ضریب همبستگی را می توان با استفاده از فرمول های اساسی (1) یا (2) محاسبه کرد، و تصحیح را به تکرارپذیری نسخه در کل دیمریک انجام داد. در عین حال، ساده سازی نمادگرایی، انحرافات از میانگین آنها نشان می دهد ولی. و. سپس فرمول (2)، با توجه به تکرارپذیری انحراف، بیان زیر را انجام می دهد:

قابلیت اطمینان این شاخص توسط معیار دانشجویی برآورد شده است، که نشان دهنده نسبت ضریب همبستگی انتخابی به خطای آن تعیین شده توسط فرمول است

از این رو، و اگر این مقدار بیش از ارزش استاندارد معیار دانشجویی برای درجه آزادی و سطح معنی داری باشد (جدول 2 برنامه های کاربردی را ببینید)، سپس فرضیه صفر رد می شود.

روش میانگین مشروط. هنگام محاسبه ضریب همبستگی گزینه انحراف ("کلاس ها")، امکان پیدا کردن نه تنها از میانگین ریاضی و، بلکه همچنین بر روی میانگین شرطی و X و A Y است. در این مورد، روش در عددی فرمول (2) تصحیح می کند و فرمول فرم زیر را به دست می آورد:

جایی که f. xy - فرکانس کلاس های یک و دیگر ردیف های توزیع؛ و، من انحراف از کلاس ها از میانگین های شرطی مربوط به اندازه فواصل کلاس λ ; n. - تعداد کل مشاهدات زوج یا نمونه برداری؛ و - لحظات شرطی شرط اول، که در آن f. ایکس. - فرکانس ردیف H.، ولی f. y - فرکانس ردیف Y.; s. ایکس. و s. y - انحراف متوسط \u200b\u200bدرجه دوم سری ایکس.و Y.محاسبه شده توسط فرمول.

روش میانگین های مشروط دارای مزیت بیش از روش آثار است، زیرا امکان اجتناب از معاملات با اعداد کسری را فراهم می کند و نشانه ای از انحرافات مشابه (مثبت) را می دهد آ. ایکس. و آ. y این تکنیک کار محاسباتی را ساده می کند، به خصوص در حضور شماره های چندگانه.

ارزیابی تفاوت ضرایب همبستگی. هنگام مقایسه ضرایب همبستگی دو نمونه مستقل، فرضیه صفر به این فرضیه کاهش می یابد که در جمعیت عمومی، تفاوت بین این شاخص ها صفر است. به عبارت دیگر، باید از این فرض که تفاوت بین ضرایب همبستگی تجربی محاکمه ای رخ داده است، انجام شود.

برای بررسی فرضیه صفر، معیار T دانش آموز خدمت می کند، به عنوان مثال نسبت تفاوت بین ضرایب همبستگی تجربی R. 1 و R. 2 به خطای آماری آن تعیین شده توسط فرمول:

جایی که s. R1 و s. R2 - خطاهای ضرایب همبستگی مقایسه شده.

فرضیه صفر رد شده است، در صورتی که میزان اهمیت آن داشته باشد α و تعداد درجه آزادی.

شناخته شده است که ارزیابی دقیق تر از دقت ضریب همبستگی با انتقال به دست می آید R. xy عدد z.. نه استثنا و ارزیابی تفاوت بین ضریب همبستگی انتخابی R. 1 و R. 2 ، به ویژه در مواردی که در آن دوم بر روی نمونه های یک حجم نسبتا کوچک محاسبه می شود ( n.< 100 ) و در ارزش مطلق آن به طور قابل توجهی بیش از 0.50 است.

این تفاوت توسط معیار دانشجویی برآورد شده است، که در ارتباط با این تفاوت به خطای آن محاسبه شده توسط فرمول ساخته شده است

فرضیه صفر اگر برای سطح قابل قبول اهمیت باشد، رد می شود.

همبستگی. برای اندازه گیری روابط غیر خطی بین متغیرها ایکس. و y از یک شاخص که نامیده می شود استفاده کنید رابطه همبستگیکه اتصال دو جانبه را توصیف می کند. طراحی رابطه همبستگی شامل مقایسه دو نوع تنوع است: تغییرات مشاهدات فردی با توجه به میانگین فردی و تغییرات نسبتا خصوصی خود در مقایسه با مقدار کل میانگین. بخش کوچکتر اولین مولفه در رابطه با دوم خواهد بود، موضوعات ارتباطات بیشتر خواهد بود. در حد، زمانی که هیچ تغییری از نشانه های فردی نزدیک به میانگین های خصوصی وجود ندارد، بسیار بزرگ خواهد بود. به طور مشابه، در غیاب تنوع میانگین های خصوصی، اتصال حداقل است. از آنجایی که این نسبت تغییرات را می توان برای هر یک از دو نشانه در نظر گرفت، دو شاخص از تنگی به دست می آید - h. یکس و h. xy . رابطه همبستگی ارزش نسبی است و می تواند مقادیر 0 تا 1 را در همان زمان داشته باشد، ضرایب نسبت همبستگی معمولا برابر با یکدیگر نیستند. . برابری بین این شاخص ها تنها با روابط شدید خطی بین نشانه ها امکان پذیر است. رابطه همبستگی یک شاخص جهانی است: به شما این امکان را می دهد که هر نوع همبستگی و خطی و خطی و غیر خطی را مشخص کنید.

نسبت همبستگی h. یکس و h. xy روش های مورد بحث در بالا را تعیین کنید، I.E. روش آثار و روش میانگین مشروط.

روش کار. نسبت همبستگی h. یکس و h. xy فرمول های زیر را تعیین کنید:

کجا و پراکندگی گروهی،

یک پراکندگی عمومی.

در اینجا و - میانگین حسابرسی عمومی، و به طور متوسط \u200b\u200bریاضی گروه؛ f. یی - فرکانس ردیف Y.، ولی f. چی - فرکانس ردیف ایکس.; k. - تعداد کلاس ها؛ n. - تعداد علائم مختلف

فرمول ها برای محاسبه نسبت همبستگی به شرح زیر است:

روش میانگین مشروط. تعیین ضرایب نسبت همبستگی با فرمول ها (15)، انحراف از گزینه کلاس ایکس. من. و من می توانم نه تنها از میانگین ریاضیات و، بلکه همچنین از میانگین شرطی و X و A نیز گرفته شود. در چنین مواردی، گروه ها و انحرافات عمومی توسط فرمول ها محاسبه می شوند و، و همچنین، و، جایی.

در فرم مستقر فرمول (15) به نظر می رسد:

;

. (17)

در این فرمول ها و - انحراف از کلاس ها از میانگین های شرطی، به اختصار با ارزش فواصل کلاس؛ ارزش های آ. y و آ. ایکس. تعداد ردیف های طبیعی بیان می شود: 0، 1، 2، 3، 4، .... نمادهای OSTAL در بالا توضیح داده شده است.

مقایسه روش آثار با روش متوسط \u200b\u200bمشروط، غیرممکن است که مزیت روش اول را نادیده بگیریم، به خصوص در مواردی که شما باید با اعداد چند ارزش مقابله کنید. همانند سایر شاخص های انتخابی، رابطه همبستگی برآورد پارامتر کلی آن است و به عنوان یک مقدار تصادفی، با یک خطا تعیین شده توسط فرمول همراه است

دقت برآورد همبستگی را می توان با توجه به معیار دانش آموز بررسی کرد. H 0 یک درآمد هیپوتیز از این فرض است که پارامتر کلی صفر است، به عنوان مثال شرایط زیر باید انجام شود:

برای تعداد درجه آزادی و سطح معنی دار.

ضریب تعیین. برای تفسیر مقادیر گرفته شده توسط شاخص های تنگی همبستگی؛ ضرایب تعیینکه نشان می دهد که نسبت تغییرات یک ویژگی بستگی به تغییرات یک ویژگی دیگر دارد. در حضور یک اتصال خطی، ضریب تعیین مربع ضریب همبستگی R2 XY و با وابستگی غیر خطی بین علائم است y و ایکس. - مربع نسبت همبستگی H2 YX. ضرایب تعیین دلیل برای ساخت مقیاس نمونه زیر، اجازه می دهد تا قضاوت در مورد شدت ارتباط بین علائم: با اتصال به طور متوسط \u200b\u200bدر نظر گرفته می شود؛ یک اتصال ضعیف را نشان می دهد و تنها زمانی که می توان یک اتصال قوی را قضاوت کرد، زمانی که حدود 50 درصد از ویژگی های این ویژگی را قضاوت می کند Y. بستگی به تغییر ویژگی دارد ایکس..

ارزیابی فرم ارتباطی. با روابط دقیق خطی بین متغیرها y و ایکس. برابری انجام می شود. در چنین مواردی ضرایب رابطه همبستگی با ارزش ضریب همبستگی همخوانی دارد. تصادف در این مقدار و ضرایب تعیین، I.E. . در نتیجه، از لحاظ تفاوت بین این مقادیر، می توان فرم وابستگی همبستگی بین متغیرها را قضاوت کرد y و ایکس.:

بدیهی است، با اتصال خطی بین متغیرها y و ایکس. شاخص γ صفر خواهد بود؛ اگر ارتباط بین متغیرها باشد y و ایکس. غیر خطی، γ\u003e 0.

شاخص γ برآورد پارامتر عمومی است و به عنوان یک مقدار تصادفی، باید تأیید شود. این نتیجه از این فرض است که رابطه بین ارزش ها y و ایکس. خطی (فرضیه صفر). این فرضیه را بررسی کنید.

جایی که آ. - تعداد گروه ها یا کلاس های سری متغیر؛ N - حجم نمونه برداری. فرضیه صفر رد می شود اگر برنامه های کاربردی به صورت افقی (به صورت افقی یافت می شود) (در ستون اول همان جدول یافت می شود) و سطح مشخصی از اهمیت آن.

تعیین اهمیت همبستگی

طبقه بندی ضرایب همبستگی

ضرایب همبستگی با نیروی و اهمیت مشخص می شود.

طبقه بندی ضرایب همبستگی برای قدرت.

طبقه بندی ضرایب همبستگی به اهمیت.

2 از این طبقه بندی ها نباید اشتباه گرفته شوند، زیرا ویژگی های مختلف را تعریف می کنند. همبستگی قوی ممکن است تصادفی باشد و غیر قابل اعتماد بود. به خصوص اغلب آن در نمونه با حجم کوچک اتفاق می افتد. و در یک نمونه بزرگ، حتی یک همبستگی ضعیف ممکن است بسیار ارزشمند باشد.

پس از محاسبه ضریب همبستگی، لازم است فرضیه های آماری را مطرح کنید:

H 0: میزان همبستگی به طور قابل توجهی متفاوت از صفر نیست (تصادفی است).

H 1: میزان همبستگی به طور قابل توجهی متفاوت از صفر است (غیر تصادفی).

بررسی فرضیه با ضرایب تجربی حاصل شده با مقادیر بحرانی جدول مقایسه شده است. اگر اهمیت تجربی به شدت به بحرانی برسد یا از آن فراتر رود، فرضیه صفر رد می شود: R EMF ≥ R kr اما، þ h 1. در چنین مواردی، آنها نتیجه می گیرند که دقت تفاوت ها شناسایی می شود.

اگر اهمیت تجربی از بحرانی تجاوز نکند، فرضیه صفر رد نمی شود: R EMF< r кр Þ Н 0 . В таких случаях делают вывод, что достоверность различий не установлена.

آمار / همبستگی

محاسبه ماتریس ضرایب زوج

همبستگی

برای محاسبه ماتریس ضرایب همبستگی زوجی، با منو تماس بگیرید ماتریس همبستگی مدول اساسstatisticians.

شکل. 1 پانل ماژول آمار پایه

مراحل اصلی تجزیه و تحلیل همبستگی در سیستم Statst_S به داده های مثال نگاه می کند (نگاه کنید به شکل 2). داده های اولیه نتایج مشاهدات فعالیت های 23 شرکت یکی از صنایع است.

fig.2 اطلاعات اولیه

نمودارهای جدول شامل شاخص های زیر هستند:

سودآور - سودآوری،٪؛

سهم برده، سهم کارگران در ترکیب PPP، واحد است؛

Fondootd - Fondo Studios، واحدهای؛

Osnfonds - میانگین ارزش سالانه امکانات اصلی تولید، میلیون روبل؛

پیشگویی - هزینه های غیر تولید، هزار روبل. لازم است که وابستگی سودآوری را از دیگران بررسی کنیم

شاخص های GIH.

فرض کنید که نشانه هایی که در مجموع در مجموع در نظر گرفته شده اند، تحت قانون توزیع نرمال قرار می گیرند، و این مشاهدات نمونه ای از کل است.

ضریب همبستگی زوجی بین تمام متغیرها را محاسبه کنید. پس از انتخاب خط ماتریس همبستگی یک کادر محاوره ای روی صفحه نمایش ظاهر می شود. همبستگی پیرسون. این نام به دلیل این واقعیت است که برای اولین بار این ضریب پیرسون، Edgeworth و Veldon بود.

متغیرهای تجزیه و تحلیل را انتخاب کنید. برای انجام این کار، دو دکمه در کادر محاوره ای وجود دارد: چهار حرف ماتریکس (یک لیست) و درست. ماتریکس (دو لیست).


شکل. 3 گفتگوی همبستگی همبستگی

اولین دکمه برای محاسبه ماتریس سفارشی طراحی شده است. گونه های متقارن با ضریب همبستگی زوجین تمام ترکیبی از متغیرها. اگر هنگام تجزیه و تحلیل از تمام شاخص ها استفاده می کنید، می توانید دکمه را در جعبه محاوره انتخاب متغیر انتخاب کنید. همه را انتخاب کنید (اگر متغیرها در یک ردیف نیستند، شما می توانید انتخاب کنید که یک کلیک ماوس را انتخاب کنید با همزمان با فشار دادن کلید سیپوش)


اگر کلیک کنید جزئیات. کادر محاوره ای، برای هر نام متغیر طولانی نمایش داده خواهد شد. با کلیک بر روی این دکمه دوباره (آن را نامیده می شود به طور خلاصه) من نامهای کوتاه دریافت می کنم.

دکمه اطلاعات پنجره را برای دوباره انتخاب شده باز می کند که در آن شما می توانید ویژگی های آن را مشاهده کنید: نام طولانی، فرمت نمایش، لیست مرتب شده از مقادیر، آمار توصیفی (تعداد مقادیر، میانگین، انحراف استاندارد) را باز کنید.

پس از انتخاب متغیرها، روی OK یا دکمه کلیک کنید گورلاتین کادر محاوره ای همبستگی پیرسون. ماتریس همبستگی محاسبه شده بر روی صفحه نمایش ظاهر می شود.

ضرایب همبستگی قابل توجهی بر روی صفحه نمایش قرمز برجسته می شود.

در مثال ما، شاخص سودآوری بیشتر با شاخص ها ارتباط داشت fondoostitch (لینک مستقیم) و هزینه های تولید (بازخورد، شامل پایان دادن به پایان V با افزایش X). اما چقدر نشانه ها به طور متقابل راضی هستند؟ تنگ در نظر گرفته شده است به عنوان اتصال با مقادیر ضریب ماژول بیش از 0.7 و ضعیف - کمتر از 0.3. بنابراین، با ایجاد بیشتر معادله رگرسیون، باید به شاخص های "صندوق دانشجویی" و "هزینه های غیر تولیدی" به عنوان آموزنده ترین محدود شود.

با این حال، در مثال ما یک پدیده وجود دارد. چند رنگ، هنگامی که ارتباط بین متغیرهای مستقل وجود دارد (ضریب همبستگی جفتی در ماژول بیشتر از 0.8 است).

گزینه ماتریس مستطیلی (دو لیست متغیرها) یک کادر محاوره ای را برای انتخاب دو لیست متغیر باز می کند. به عنوان تصویر ظاهر می شود


در نتیجه، ما یک ماتریس همبستگی مستطیلی حاوی تنها ضرایب همبستگی با متغیر وابسته به دست می آوریم.


اگر گزینه نصب شده باشد corr ماتریس (نمونه معنی دار)،سپس پس از کلیک روی دکمه همبستگی یک ماتریس با Coeoph ساخته خواهد شد، جدا شده در سطح اهمیت r.


اگر گزینه انتخاب شده باشد نتایج جدول دقیق، سپس بر روی دکمه آتش همبستگی، ما یک جدول را دریافت می کنیم که نه تنها ضرایب همبستگی، بلکه همچنین انحراف متوسط، میل-دورت، ضرایب معادله رگرسیون، عضو Bodie آن در معادله رگرسیون و سایر آمار است


هنگامی که متغیرها دارای تنوع نسبی کوچک هستند (نسبت انحراف استاندارد به طور متوسط \u200b\u200bکمتر از 0.00000000000001)، درجه بالاتر ارزیابی مورد نیاز است. این را می توان با قرار دادن گزینه محاسبه با دقت بیشتری از کادر محاوره ای پیرسون همبستگی تنظیم کرد.

حالت عملیات با داده های از دست رفته توسط حذف DesigID PD تعیین می شود. اگر آن را انتخاب کنید، سپس همه مشاهدات را که پرش دارند، نادیده می گیرد. در مورد مخالف، حذف زوج آنها ساخته شده است.

یک حالت مشخص برای نمایش نام های متغیر طولانی منجر به یک جدول با نام های متغیر طولانی خواهد شد.

تصویر گرافیکی وابستگی های همبستگی

کادر محاوره ای پیرسون شامل تعدادی دکمه برای به دست آوردن یک تصویر گرافیکی از وابستگی های همبستگی است.

گزینه پراکندگی 2M یک توالی نمودار پراکندگی برای هر متغیر انتخاب شده ایجاد می کند. پنجره برای انتخاب آنها یکسان است. شکل 6 در سمت چپ، شما باید متغیرهای پر جنب و جوش را در سمت راست مستقل - سودآور مشخص کنید. با کلیک کردن بر روی OK، ما یک گراف را دریافت می کنیم که در آن تراز کردن مرزهای مستقیم و اعتماد Rognosis به تصویر می کشد.

ضریب همبستگی خطی بیشترین ارزیابی هدف از لحاظ ارتباط را ارائه می دهد، اگر محل نقاط در سیستم مختصات شبیه یک خط مستقیم یا یک بیضی بلند باشد، اگر نقاط در قالب یک منحنی قرار داشته باشند، پس از آن ضریب Orregulation یک امتیاز تحت تاثیر قرار می دهد.

بر اساس برنامه، ما می توانیم یک بار دیگر ارتباط بین شاخص های سودآوری و شاخص های پایه را تایید کنیم، زیرا این مشاهدات به شکل یک بیضی شیب دار قرار دارد. لازم به ذکر است که این ارتباط در نظر گرفته شده این واقعیت است که یک نقطه تاول زده ای به محور اصلی بیضی وجود دارد.

به عنوان مثال، تغییر در شاخص بنیاد در هر واحد منجر به تغییر سودآوری توسط 5.7376٪ خواهد شد.

بیایید به تاثیر هزینه های غیر تولیدی بر ارزش سودآوری نگاه کنیم. برای انجام این کار، یک برنامه مشابه را بسازید

داده های تجزیه و تحلیل شده در حال حاضر کمتر از فرم بیضوی آن به یاد می آید، و ضریب همبستگی تا حدودی پایین تر است. مقدار یافت شده از ضریب رگرسیون نشان می دهد که با افزایش هزینه های تولید غیر تولید در هر 1000 روبل، سودآوری به میزان 0.7017٪ کاهش می یابد.

لازم به ذکر است که ساخت رگرسیون چندگانه (در فصل های بعدی مورد توجه قرار گرفته است)، زمانی که معادله همزمان هر دو ویژگی، منجر به سایر مقادیر ضرایب رگرسیون می شود که توسط تعامل توضیح می دهد که متغیرها در میان خودشان توضیح داده شده است .

هنگام استفاده از دکمه های نقطه نقطه در نمودار پراکنده، اگر آنها از پیش تعریف شده باشند، اعداد یا اسامی مربوطه را دریافت خواهید کرد.

گزینه زیر نشان دهنده گرافیک ماتریس، روشنایی از نمودارهای پراکندگی برای متغیرهای انتخاب شده ایجاد می کند.

به دنبال عنصر گرافیکی این ماتریس حاوی زمینه های همبستگی یونیک تشکیل شده توسط متغیرهای مربوطه با

متاهل در خط رگرسیون آنها.

هنگام تجزیه و تحلیل ماتریس نمودارهای پراکنده، باید به این نمودارها توجه شود که خطوط رگرسیون آنها شیب قابل توجهی را نسبت به محور x دارند، که نشان می دهد وجود وابستگی متقابل بین علائم اولیه مربوطه است.

گزینه پراکندگی SM یک میدان همبستگی سه بعدی برای متغیرهای انتخاب شده ایجاد می کند. اگر دکمه نام استفاده شود، نقاط در نمودار پراکنده با اعداد یا نام مشاهدات مربوطه مشخص می شود اگر آنها آنها را داشته باشند.

سطح گزینه گرافیکی SM را به نمودار پراکندگی برای سه متغیر انتخاب شده همراه با سطح مرتبه دوم تنظیم شده ایجاد می کند.

گزینه Catagor. نمودارهای پراکندگی به نوبه خود باعث ایجاد آبشار از زمینه های همبستگی برای شاخص های انتخاب شده می شود.

پس از فشار دادن دکمه مربوطه، این برنامه از کاربر خواسته است تا دو مجموعه از آنها را قبلا با استفاده از دکمه متغیرها انتخاب کند. سپس یک جدید بر روی صفحه نمایش ظاهر می شود.

پنجره پرس و جو برای وظیفه یک متغیر گروهی، بر اساس آن همه مشاهدات موجود طبقه بندی خواهد شد.

نتیجه ساخت زمینه های همبستگی در کاهش گروه های مشاهده برای هر جفت متغیرها، برگزاری مجدد لیست های مختلف

3.4. محاسبه ضرایب خصوصی و چندگانههمبستگی

برای محاسبه ضرایب خصوصی و چندگانه COR. ماژول تماس روابط رگرسیون چندگانهبا استفاده از دکمه سوئیچ ماژول. کادر محاوره ای زیر روی صفحه نمایش ظاهر می شود:

دکمه را فشار دهید متغیرها، متغیرهای تجزیه و تحلیل را انتخاب کنید: در سمت چپ وابسته - سودآوری، و در سمت راست مستقل - fondoostitch و هزینه های غیر تولیدی. متغیرهای باقی مانده در تجزیه و تحلیل بیشتر شرکت نمی کنند - بر اساس تجزیه و تحلیل همبستگی، آنها به عنوان غیر قابل استفاده برای مدل رگرسیون شناخته می شوند.

در زمینه ورودی فایل داده های منبع مشترک به عنوان داده های ورودی پیشنهاد شده است، که یک جدول با متغیرها و مشاهدات یا یک ماتریس همبستگی است. ماتریس همبستگی را می توان پیش از ایجاد در ماژول رگرسیون چندگانه خود و یا محاسبه آمار اولیه اولیه با کمک گزینه.

هنگام کار با فایل داده منبع، می توانید رندر کردن را تنظیم کنید:

    حذف حذف اگر این گزینه انتخاب شده باشد، تنها این مشاهدات که مقادیر از دست رفته را در تمام متغیرهای انتخابی نداشته اند، در تجزیه و تحلیل استفاده می شود.

    میانگین جایگزینی مقادیر از دست رفته در هر متغیر با میانگین محاسبه شده توسط مشاهدات کامل موجود جایگزین می شود.

    حذف والدین از داده های از دست رفته. اگر این گزینه انتخاب شده باشد، هنگام محاسبه همبستگی های جفت، مشاهداتی که مقادیر را از دست داده اند در جفت متغیر مربوطه حذف می شوند.

در زمینه نوع رگرسیون کاربر می تواند یک رگرسیون غیر خطی استاندارد یا ثابت را انتخاب کند. به طور پیش فرض، تجزیه و تحلیل استاندارد از رگرسیون چندگانه انتخاب شده است، که در آن ماتریس همبستگی استاندارد تمام متغیرهای انتخاب شده محاسبه می شود.

حالت رگرسیون غیر خطی ثابت به شما اجازه می دهد تا تغییرات مختلف متغیرهای مستقل را انجام دهید. گزینه تجزیه و تحلیل به طور پیش فرض، تنظیمات مناسب برای تعریف لذت رگرسیون استاندارد، از جمله یک عضو آزاد است. اگر این گزینه لغو شود، پس از کلیک بر روی دکمه شروع پانل، تعریف جعبه محاوره ای تعریف مدل که در آن شما یک EJET هستید، به عنوان یک نوع تحلیل رگرسیون انتخاب کنید (به عنوان مثال، گام به گام، Crest ، و غیره) و سایر گزینه ها.

چک کردن جعبه گزینه خط توصیفی توصیفی توصیفیcorr ماتریان و با کلیک بر روی OK، ما یک جعبه محاوره ای را با ویژگی های آماری آماری به دست می آوریم.

در آن شما می توانید آمار توصیفی دقیق را مشاهده کنید (از جمله تعداد مشاهدات که ضریب همبستگی برای هر جفت متغیره محاسبه شده است). برای ادامه تجزیه و تحلیل و باز کردن کادر محاوره ای تعیین کننده مدل، روی OK کلیک کنید.

اگر شاخص های تجزیه شده، پراکندگی نسبی بسیار کوچک را محاسبه کنند، به طور کلی پراکندگی به طور کلی تقسیم شده است، سپس کادر تأیید را در نزدیکی گزینه بررسی کنید محاسبات دقت بالا برای به دست آوردن مقادیر دقیق تر عناصر ماتریس همبستگی.

با نصب تمام پارامترهای لازم در کادر محاوره ای. رگرسیون چندگانه، OK را فشار دهید و نتایج محاسبات مورد نیاز را دریافت کنید.

بر طبق مثال ما، ضریب همبستگی چندگانه 0.61357990 بود و بر این اساس ضریب تعیین 0.37648029 است. بنابراین، تنها 37.6٪ از پراکندگی شاخص "سودآوری" توسط اندازه گیری شاخص های "مبانی مطالعات" و "هزینه های تولید غیر تولید" توضیح داده شده است. چنین مقدار کم نشان دهنده کمبود تعداد عوامل معرفی شده در مدل است. بیایید سعی کنیم تعدادی از متغیرهای مستقل را با اضافه کردن لیست صندوق های اصلی (مقدمه ای بر مدل شاخص "سهم کارگران در PPP" تغییر دهیم، منجر به چند منظوره می شود که غیر قابل قبول است). ضریب تعیین تا حدودی افزایش یافته است، اما نه خیلی به طور قابل توجهی بهبود نتایج - ارزش آن حدود 41٪ بود. بدیهی است، کلبه ما نیاز به تحقیقات بیشتری برای شناسایی عوامل موثر بر سودآوری دارد.

اهمیت ضریب همبستگی چندگانه طرفدار بی تردید بر روی جدول F-معیارهای Fischer است. فرضیه اهمیت آن رد می شود اگر ارزش احتمال انحراف بیش از سطح مشخص شده باشد (اغلب A \u003d 0.1، 0.05، 0.01 0.01). در مثال ما P \u003d 0.008882< 0.05, что свидетельствует о значимости коэффициента.

جدول نتایج شامل نمودارهای زیر است:

    ضریب بتا (C) - ضریب رگرسیون استاندارد متغیر مربوطه؛

    همبستگی خصوصی - ضرایب خصوصی همبستگی بین متغیر مناسب و وابسته، هنگام رفع نفوذ باقی مانده در مدل.

ضریب همبستگی خصوصی بین سودآوری و دانشجویان صندوق در مثال ما 0.459899 است. این به این معنی است که پس از وارد شدن به مدل شاخصی از RAS-EVI غیر تولیدی، تأثیر پرداخت صندوق بر سودآوری تا حدودی تا حدودی تا حدودی - از 0.49 (ارزش ضریب همبستگی زوج) 0.46 است. ضریب مشابهی برای شاخص هزینه های غیر مشتق شده نیز کاهش یافته است - از 0.46 (ارزش نسبت جفت همبستگی) به 0.42 (آنها ارزش ماژول را دریافت می کنند)، تغییر تغییر در ارتباط با متغیر وابسته را مشخص می کند ورودی در مدل شاخص بنیاد.

    همبستگی حزب همبستگی بین یک متغیر وابسته به اصلاح نشده و با توجه به عدم وابستگی مربوط به تأثیر باقی مانده در مدل است.

    تحمل (تعریف شده به عنوان 1 منهای مربع همبستگی چندگانه بین متغیر متناظر و تمام متغیرهای مستقل در معادله رگرسیون) تعریف شده است.

    ضریب تعیین مربع ضریب همبستگی چندگانه بین متغیر مستقل مربوطه و سایر متغیرهای دیگر موجود در معادله رگرسیون است.

    1-values \u200b\u200b- ارزش محاسبه معیار دانشجویی برای تست فرضیه در مورد اهمیت ضریب همبستگی خصوصی با مشخصه های مشخص شده (در براکت) توسط تعداد درجه آزادی.

    سطح R! - احتمال انحراف از فرضیه بر اهمیت ضریب همبستگی خصوصی.

در مورد ما، مقدار به دست آمده از P برای ضریب اول (0.031277) کمتر از انتخاب  \u003d 0.05 است. مقدار ضریب دوم تا حدودی بالاتر است (0.050676)، که نشان دهنده عدم رعایت آن در این سطح است. اما به عنوان مثال، قابل توجه است، به عنوان مثال، در  \u003d 0.1 (در ده مورد از یک صد فرضیه، آن را نادرست خواهد بود).

با دوستان خود به اشتراک بگذارید یا خودتان را ذخیره کنید:

بارگذاری...