7 ضریب همبستگی. معیارهای همبستگی پینسون

در هنگام مطالعه بهداشت عمومی و مراقبت های بهداشتی در اهداف علمی و عملی، محقق اغلب باید تجزیه و تحلیل آماری از رابطه بین عامل ها و نشانه های موثر آمار آماری (رابطه علی) را انجام دهد یا تعیین وابستگی تغییرات موازی در چندین نشانه از این موارد کل از هر مقدار سوم (از کل علت آنها). لازم است که بتوانیم ویژگی های این اتصال را مطالعه کنیم تا اندازه و جهت آن را تعیین کنیم، و همچنین دقت آن را ارزیابی کنیم. این از روش های همبستگی استفاده می کند.

انواع تظاهرات ارتباطات کمی بین نشانه ها
- ارتباطات عملکردی
- همبستگی
تعاریف عملکرد و همبستگی
ارتباطات عملکردی - این نوع رابطه بین دو نشانه، زمانی که هر مقدار از یکی از آنها مربوط به یک مقدار دقیق تعریف شده از دیگر (منطقه دایره بستگی به شعاع دایره، و غیره). ارتباطات کاربردی مشخصه فرایندهای فیزیکی و ریاضی است.
همبستگی - چنین ارتباطی، که در آن هر مقدار خاصی از یک ویژگی مربوط به چند مقدار دیگر از ویژگی های متصل شده با آن است (رابطه بین رشد و وزن بدن بدن انسان؛ رابطه بین دمای بدن و میزان پالس ، و غیره.). پیوند همبستگی مشخصه فرایندهای پزشکی و بیولوژیکی است.
اهمیت عملی ایجاد همبستگی. تشخیص علت بین عامل و ویژگی های موثر (در ارزیابی توسعه فیزیکی، تعیین رابطه بین شرایط کاری، زندگی و سلامت، در تعیین وابستگی فرکانس موارد بیماری از سن، تجربه، دسترسی به نظرات صنعتی و غیره)
وابستگی تغییرات موازی چندین نشانه از مقدار سوم. به عنوان مثال، تحت تاثیر دمای بالا در کارگاه، تغییرات وجود دارد فشار خون، ویسکوزیته خون، فرکانس پالس، و غیره
مقدار که جهت و قدرت ارتباط بین نشانه ها را مشخص می کند. ضریب همبستگی، که در یک عدد، ایده ای از جهت و قدرت اتصال بین نشانه ها (پدیده)، محدودیت های نوسانات آن از 0 تا ± 1 را ارائه می دهد
روش ها برای ارائه همبستگی
- برنامه (نمودار پراکندگی)
- ضریب همبستگی
جهت همبستگی
- سر راست
- ابطال
نیروی همبستگی
- قوی: ± 0.7 تا ± 1
- میانگین: ± 0.3 تا ± 0.699
- ضعیف: 0 تا ± 0.299
روش های تعیین ضریب همبستگی و فرمول
- روش مربع (روش پیرسون)
- روش محدوده (روش اسپیرمن)
الزامات روشنی برای استفاده از ضریب همبستگی
- اندازه گیری ارتباط تنها در ترکیبات همگن با کیفیت بالا امکان پذیر است (به عنوان مثال، اندازه گیری ارتباط بین رشد و وزن در دانه ها، همگن توسط جنس و سن)
- محاسبه را می توان با استفاده از مقادیر مطلق یا مشتق شده انجام داد
- برای محاسبه ضریب همبستگی گروه بندی نشده است ردیف های تنوع (این الزام تنها زمانی اعمال می شود که محاسبه ضریب همبستگی با روش مربع ها)
- تعداد مشاهدات حداقل 30
توصیه هایی برای استفاده از روش همبستگی حلقه ها (روش اسپیرمن)
- هنگامی که نیازی به برقراری ارتباط دقیق برق وجود ندارد و داده های نسبتا نشان داده شده است
- هنگامی که نشانه ها نه تنها کمی، بلکه ارزش را نیز ارائه می دهند
- هنگامی که ردیف توزیع علائم گزینه های باز (به عنوان مثال، تجربه کاری تا 1 سال و غیره)
توصیه هایی برای استفاده از روش مربعات (روش پیرسون)
- هنگامی که استقرار دقیق نیروی اتصال بین نشانه ها مورد نیاز است
- هنگامی که علائم تنها یک بیان کمی دارند
روش شناسی و روش محاسبه ضریب همبستگی
1) روش مربع
2) روش رتبه
طرح ارزیابی همبستگی برای ضریب همبستگی
محاسبه خطا ضریب همبستگی
ارزیابی صحت ضریب همبستگی به دست آمده از همبستگی رتبه و روش مربعات
روش 1
دقت توسط فرمول تعیین می شود:
معیار T در جدول مقادیر T برآورد شده است، با توجه به تعداد درجه آزادی (n-2)، که N تعداد گزینه زوج است. معیار T باید برابر یا بیشتر جدول های مربوط به احتمال P ≥99٪ باشد.
روش 2
قابلیت اطمینان بر روی یک جدول خاص از ضرایب همبستگی استاندارد تخمین زده می شود. در عین حال، چنین ضریب همبستگی قابل اعتماد است، زمانی که با تعداد مشخصی از درجه های آزادی (N-2) قابل اعتماد است، برابر با یک جدول بیشتر، مربوط به درجه پیش بینی بدون خطا P ≥95٪ .

برای اعمال روش مربع

وظیفه: ضریب همبستگی را محاسبه کنید، جهت و مقاومت ارتباط بین مقدار کلسیم در آب و سفتی آب را تعیین کنید، اگر داده های زیر شناخته شده باشند (جدول 1). دقت ارتباطات را ارزیابی کنید. نتیجه گیری کنید

میز 1

توجیه انتخاب روش. برای حل مشکل، روش مربع انتخاب شده است (پیرسون)، زیرا هر یک از علائم (استحکام آب و مقدار کلسیم) دارای بیان عددی است؛ بدون گزینه باز

تصمیم.
توالی محاسبه در متن تنظیم شده است، نتایج در جدول ارائه شده است. با ساخت ردیف جفت جفت مقادیر، به آنها از طریق X (سفتی آب در درجه) و از طریق Y (مقدار کلسیم در آب در mg / l) اشاره شده است.

سختی آب (در درجهها)	مقدار کلسیم در آب (در mg / l)	d H.	د	d x x d	d x 2.	d y 2
4 8 11 27 34 37	28 56 77 191 241 262	-16 -12 -9 +7 +14 +16	-114 -86 -66 +48 +98 +120	1824 1032 594 336 1372 1920	256 144 81 49 196 256	12996 7396 4356 2304 9604 14400
m x \u003d σ x / n	m y \u003d σ y / n			σ d x \u200b\u200bx d y \u003d 7078	σ d x \u200b\u200b2 \u003d 982	σ d y 2 \u003d 51056
m x \u003d 120/6 \u003d 20	m y \u003d 852/6 \u003d 142

تعیین مقادیر متوسط \u200b\u200bM x تعدادی از گزینه "X" و M در تعدادی از گزینه "Y" توسط فرمول:
m x \u003d σх / n (نمودار 1) و
m y \u003d σu / n (نمودار 2)
انحراف (D X و D) از هر گزینه از مقدار میانگین محاسبه شده در سری "X" و در ردیف "Y" را پیدا کنید
d x \u003d x - m x (نمودار 3) و d y \u003d y - m y (graf4).
پیدا کردن یک محصول انحراف d x x d y و خلاصه آنها: Σ d x x d y (نمودار 5)
هر انحراف DX و D باید یک مربع را بسازند و مقادیر خود را برای یک سری از "X" و برای تعدادی از "Y" خلاصه می کنند: σ DX 2 \u003d 982 (نمودار 6) و σ dy 2 \u003d 51056 ( نمودار 7).
تعیین محصول Σ d x 2 x σ d y 2 و از این کار برای استخراج ریشه دوم
مقادیر به دست آمده σ (d x x d y) و √ (σd x 2 x Σd y 2) ما جایگزین فرمول برای محاسبه ضریب همبستگی می کنیم:

دقت ضریب همبستگی را تعیین کنید:
راه اول خطای ضریب همبستگی (MR XY) و معیار T با توجه به فرمول ها را پیدا کنید:

معیار t \u003d 14.1، که مربوط به احتمال پیش بینی بدون خطا P\u003e 99.9٪ است.

راه دوم دقت ضریب همبستگی در جدول "ضرایب همبستگی استاندارد" تخمین زده می شود (به ضمیمه 1 مراجعه کنید). هنگامی که درجه آزادی (n - 2) \u003d 6 - 2 \u003d 4، ضریب همبستگی تخمین زده شده R xu \u003d 0.99 بزرگتر از جدول است (R Tab \u003d 0.917 در P \u003d 99٪).

خروجی کلسیم بیشتر در آب، سخت تر (ارتباطات راست، قوی و قابل اعتماد: R Hu \u003d 0.99، P\u003e 99.9٪).

در استفاده از روش رتبه

وظیفه: ما جهت و قدرت رابطه بین تجربه کاری در سال ها و فرکانس صدمات را تعیین می کنیم اگر داده های زیر به دست آمده باشند:

توجیه انتخاب روش: برای حل این کار، تنها روش همبستگی رتبه را می توان انتخاب کرد، زیرا ردیف اول "تجربه کاری در سال ها" گزینه های باز (تجربه کاری تا 1 سال و 7 سال یا بیشتر) دارد، که اجازه نمی دهد از روش دقیق تر برای برقراری ارتباط بین ویژگی های مرتبط - روش مربع استفاده نکنید.

تصمیم. توالی محاسبه در متن تنظیم شده است، نتایج در جدول ارائه شده است. 2

جدول 2

تجربه کاری در سال ها	تعداد آسیب	شماره سفارش (رده)		تفاوت مسیر	تفاوت مربع رتبه
تجربه کاری در سال ها	تعداد آسیب	ایکس.	Y.	d (x-y)	d 2
تا 1 سال	24	1	5	-4	16
1-2	16	2	4	-2	4
3-4	12	3	2,5	+0,5	0,25
5-6	12	4	2,5	+1,5	2,25
7 یا بیشتر	6	5	1	+4	16
					σ d 2 \u003d 38.5

ضرایب همبستگی استاندارد که قابل اعتماد هستند (توسط L.S. Kaminsky)

تعداد درجه آزادی - 2	سطح احتمال P (٪)
تعداد درجه آزادی - 2	95%	98%	99%
1	0,997	0,999	0,999
2	0,950	0,980	0,990
3	0,878	0,934	0,959
4	0,811	0,882	0,917
5	0,754	0,833	0,874
6	0,707	0,789	0,834
7	0,666	0,750	0,798
8	0,632	0,716	0,765
9	0,602	0,885	0,735
10	0,576	0,858	0,708
11	0,553	0,634	0,684
12	0,532	0,612	0,661
13	0,514	0,592	0,641
14	0,497	0,574	0,623
15	0,482	0,558	0,606
16	0,468	0,542	0,590
17	0,456	0,528	0,575
18	0,444	0,516	0,561
19	0,433	0,503	0,549
20	0,423	0,492	0,537
25	0,381	0,445	0,487
30	0,349	0,409	0,449

Vlasov v.V. همهگیرشناسی. - m: gootar-honey، 2004. - 464 p.
lisitsyn yu.p. بهداشت عمومی و بهداشت و درمان. کتاب درسی برای دانشگاه ها. - m: goeotar-honey، 2007. - 512 p.
Medica V.A.، Yuriev V.K. دوره سلامت عمومی و سخنرانی های بهداشتی: قسمت 1. سلامت عمومی. - متر: پزشکی، 2003. - 368 پ.
Minaev v.A.، Vishnyakov N.I. و دیگران. سازمان پزشکی و سازمان بهداشت اجتماعی (دستورالعمل ها در 2 جلد). - سنت پترزبورگ، 1998. -528 پ.
Kucherenko V.Z.، Agarkov N.M. و سایر سازمان های بهداشت اجتماعی و مراقبت های بهداشتی ( تدبیر) - مسکو، 2000. - 432 پ.
S. Glanz. آمار پزشکی و بیولوژیکی. در هر انگلیسی - M.، تمرین، 1998. - 459 p.

ضریب همبستگی نشان دهنده میزان ارتباط بین دو شاخص است. همیشه یک مقدار از -1 به 1 طول می کشد اگر ضریب در حدود 0 قرار دارد، آنها می گویند که هیچ ارتباطی بین متغیرها وجود ندارد.

اگر مقدار نزدیک به یک (از 0.9، به عنوان مثال)، یک رابطه مستقیم مستقیم بین اشیاء مشاهده شده وجود دارد. اگر ضریب نزدیک به دیگری باشد نقطه عطفی محدوده (-1)، پس از آن یک رابطه معکوس قوی بین متغیرها وجود دارد. هنگامی که ارزش جایی در وسط از 0 تا 1 یا 0 تا 1 است، این یک اتصال ضعیف (مستقیم یا معکوس) است. این رابطه معمولا به حساب نمی آید: اعتقاد بر این است که این نیست.

محاسبه ضریب همبستگی در اکسل

در مورد روش های نمونه ای برای محاسبه ضریب همبستگی، ویژگی های رابطه مستقیم و معکوس بین متغیرها را در نظر بگیرید.

مقادیر X و Y شاخص ها:

y متغیر مستقل، وابسته به X است. لازم است که قدرت (قوی / ضعیف) و جهت (مستقیم / معکوس) ارتباط بین آنها را پیدا کنید. فرمول ضریب همبستگی به نظر می رسد این است:

برای ساده سازی درک آن، ما به چند عنصر ساده تقسیم می کنیم.

اتصال مستقیم مستقیم بین متغیرها تعیین می شود.

عملکرد Correla ساخته شده از محاسبات پیچیده اجتناب می کند. ضریب همبستگی جفتی در اکسل را با کمک آن محاسبه کنید. تماس با توابع توابع. ما یکی را پیدا می کنیم. استدلال عملکرد - آرایه ای از مقادیر Y و مجموعه ای از ارزش های X:

نمایش مقادیر متغیرها بر روی برنامه:

یک پیوند قوی بین Y و X قابل مشاهده است، زیرا خطوط تقریبا موازی با یکدیگر هستند. رابطه مستقیم است: رشد Y - رشد X، Y کاهش می یابد - کاهش x.

ماتریس ضرایب همبستگی زوجی در اکسل

ماتریس همبستگی یک جدول است، در تقاطع ردیف ها و ستون هایی که ضرایب همبستگی بین مقادیر مربوطه هستند. این منطقی است که آن را برای چندین متغیر ساخت.

ماتریس ضرایب همبستگی در اکسل با استفاده از ابزار "همبستگی" از بسته تجزیه و تحلیل داده ها ساخته شده است.

بین مقادیر Y و X1، یک رابطه مستقیم قوی شناسایی شد. بین X1 و X2 بازخورد قوی وجود دارد. ارتباط با مقادیر در ستون X3 عملا وجود ندارد.

توجه داشته باشید! تصمیم خود را وظیفه خاص به نظر می رسد همانند این مثال، از جمله تمام جداول و متون توضیحی که در زیر ارائه شده است، اما با توجه به اطلاعات منبع شما ...

یک وظیفه:
یک نمونه بافتنی از 26 جفت مقادیر (x k، y k) وجود دارد:

k.	1	2	3	4	5	6	7	8	9	10
*x k.*	25.20000	26.40000	26.00000	25.80000	24.90000	25.70000	25.70000	25.70000	26.10000	25.80000
*y k.*	30.80000	29.40000	30.20000	30.50000	31.40000	30.30000	30.40000	30.50000	29.90000	30.40000

k.	11	12	13	14	15	16	17	18	19	20
*x k.*	25.90000	26.20000	25.60000	25.40000	26.60000	26.20000	26.00000	22.10000	25.90000	25.80000
*y k.*	30.30000	30.50000	30.60000	31.00000	29.60000	30.40000	30.70000	31.60000	30.50000	30.60000

k.	21	22	23	24	25	26
*x k.*	25.90000	26.30000	26.10000	26.00000	26.40000	25.80000
*y k.*	30.70000	30.10000	30.60000	30.50000	30.70000	30.80000

لازم است محاسبه / ساخت:
- ضریب همبستگی؛
- فرضیه وابستگی متغیرهای تصادفی X و Y را در سطح اهمیت α \u003d 0.05 بررسی کنید.
- ضرایب معادله رگرسیون خطی؛
- نمودار پراکندگی (میدان همبستگی) و برنامه خط رگرسیون؛

تصمیم گیری:

1. ضریب همبستگی را محاسبه کنید.

ضریب همبستگی شاخصی از تأثیر احتمال متقابل دو متغیر تصادفی است. ضریب همبستگی R. می تواند ارزش ها را از -1 قبل از +1 . اگر ارزش مطلق نزدیک تر باشد 1 ، پس این شواهدی از ارتباط قوی بین مقادیر است، و اگر نزدیک تر باشد 0 - این، از یک اتصال ضعیف یا غیبت آن صحبت می کند. اگر ارزش مطلق باشد R. برابر با یک، ما می توانیم در مورد اتصال عملکردی بین مقادیر صحبت کنیم، یعنی یک مقدار را می توان از طریق یک تابع ریاضی بیان کرد.

ضریب همبستگی را در فرمول های زیر محاسبه کنید:

k \u003d 1.

(x k -m x) 2، σ y 2 =

m x.

k \u003d 1.

x k

m y.

یا فرمول

r x، y

m xy - m x m y

s x s y

(1.4)، جایی که:

m x.

k \u003d 1.

x k

m y.

k \u003d 1.

y k

m xy

k \u003d 1.

x k y k (1.5)

s x 2

k \u003d 1.

x k 2 - m x 2،

S Y 2

k \u003d 1.

y K 2 - M Y 2 (1.6)

در عمل، فرمول (1.4) اغلب برای محاسبه ضریب همبستگی استفاده می شود. این نیاز به محاسبات کمتری دارد. با این حال، اگر کوواریانس قبلا محاسبه شده بود cOV (X، Y)، استفاده از فرمول (1.1) سودمندتر است، زیرا علاوه بر کوواریانس واقعی، می توانید از نتایج محاسبات متوسط \u200b\u200bاستفاده کنید.

1.1 ضریب همبستگی را با فرمول (1.4) محاسبه کنیدبرای انجام این کار، مقادیر X K 2، Y K 2 و X K Y K را محاسبه کنید و آنها را به جدول 1 برسانید.

میز 1

k.	*x k.*	*y k.*	x k. 2	y k. 2	*x k.y k.*
1	2	3	4	5	6
1	25.2	30.8	635.04000	948.64000	776.16000
2	26.4	29.4	696.96000	864.36000	776.16000
3	26.0	30.2	676.00000	912.04000	785.20000
4	25.8	30.5	665.64000	930.25000	786.90000
5	24.9	31.4	620.01000	985.96000	781.86000
6	25.7	30.3	660.49000	918.09000	778.71000
7	25.7	30.4	660.49000	924.16000	781.28000
8	25.7	30.5	660.49000	930.25000	783.85000
9	26.1	29.9	681.21000	894.01000	780.39000
10	25.8	30.4	665.64000	924.16000	784.32000
11	25.9	30.3	670.81000	918.09000	784.77000
12	26.2	30.5	686.44000	930.25000	799.10000
13	25.6	30.6	655.36000	936.36000	783.36000
14	25.4	31	645.16000	961.00000	787.40000
15	26.6	29.6	707.56000	876.16000	787.36000
16	26.2	30.4	686.44000	924.16000	796.48000
17	26	30.7	676.00000	942.49000	798.20000
18	22.1	31.6	488.41000	998.56000	698.36000
19	25.9	30.5	670.81000	930.25000	789.95000
20	25.8	30.6	665.64000	936.36000	789.48000
21	25.9	30.7	670.81000	942.49000	795.13000
22	26.3	30.1	691.69000	906.01000	791.63000
23	26.1	30.6	681.21000	936.36000	798.66000
24	26	30.5	676.00000	930.25000	793.00000
25	26.4	30.7	696.96000	942.49000	810.48000
26	25.8	30.8	665.64000	948.64000	794.64000

1.2 محاسبه M x با توجه به فرمول (1.5).

1.2.1. x k.

x 1 + x 2 + ... + x 26 \u003d 25.20000 + 26.40000 + ... + 25.80000 \u003d 669.500000

1.2.2.

669.50000 / 26 = 25.75000

m x \u003d 25.750000

1.3. به طور مشابه، محاسبه M y.

1.3.1. مخلوط کردن به طور مداوم تمام عناصر y k.

y 1 + y 2 + ... + y 26 \u003d 30.80000 + 29.40000 + ... + 30.80000 \u003d 793.000000

1.3.2. ما مقدار دریافت شده توسط تعداد عناصر نمونه گیری را تقسیم می کنیم

793.00000 / 26 = 30.50000

m y \u003d 30.500000

1.4 به طور مشابه محاسبه M xy.

1.4.1. مخلوط کردن به طور مداوم تمام عناصر ستون 6 جدول 1

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. ما مقدار دریافت شده توسط تعداد اقلام را تقسیم می کنیم

20412.83000 / 26 = 785.10885

m xy \u003d 785.108846

1.5. مقدار S x 2 را با فرمول (1.6) محاسبه کنید.

1.5.1. حرکت به صورت متوالی تمام عناصر ستون چهارم جدول 1

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. ما مقدار دریافت شده توسط تعداد اقلام را تقسیم می کنیم

17256.91000 / 26 = 663.72731

1.5.3. اشتراک از آخرین شماره مربع مقدار m x برای S x 2 بدست می آید

s x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6 محاسبه مقدار S Y 2 توسط فرمول (1.6.).

1.6.1. تمام عناصر ستون پنجم جدول را ترتیب دهید

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. ما مقدار دریافت شده توسط تعداد اقلام را تقسیم می کنیم

24191.84000 / 26 = 930.45538

1.6.3. محاسبه شده از آخرین شماره مربع مقدار m y برای S y 2 به دست می آید

S Y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7 محاسبه محصول مقادیر S x 2 و S y 2.

S X 2 S Y 2 \u003d 0.66481 0.20538 \u003d 0.136541

1.8. از بین بردن آخرین شماره مربع ریشه، ما مقدار S X S را دریافت می کنیم.

s x s y \u003d 0.36951

1.9. مقدار ضریب همبستگی را با فرمول (1.4) محاسبه کنید.

R \u003d (785.10885 - 25.75000 30.50000) / 0.36951 \u003d (785.10885 - 785.37500) / 0.36951 \u003d -0.72028

پاسخ: R x، y \u003d -0.720279

2. اهمیت ضریب همبستگی را بررسی کنید (ما فرضیه وابستگی را بررسی می کنیم).

از آنجا که ارزیابی ضریب همبستگی بر روی نمونه نهایی محاسبه می شود و بنابراین ممکن است از ارزش کلی آن جدا شود، لازم است که اهمیت ضریب همبستگی را مورد آزمایش قرار دهیم. بررسی با استفاده از معیارهای T انجام می شود:

t \u003d.

r x، y


√	n - 2


√	1 - R 2 X، Y

(2.1)

مقدار تصادفی t. این به دنبال توزیع T دانش آموز و توزیع جدول T است، لازم است که ارزش بحرانی معیار (T K.α) را در یک سطح معین اهمیت α پیدا کنید. اگر فرمول محاسبه شده توسط فرمول (2.1) T بر روی ماژول کمتر از T KR.α باشد، سپس رابطه بین مقادیر تصادفی x و y نه در غیر این صورت، داده های تجربی با فرضیه وابستگی متغیرهای تصادفی مخالف نیستند.

2.1. محاسبه مقدار معیارهای T توسط فرمول (2.1) ما به دست آمده:

t \u003d.

-0.72028


√	26 - 2


√	1 - (-0.72028) 2

= -5.08680

2.2. ما در جدول توزیع T تعریف می کنیم، ارزش بحرانی پارامتر T KR.α

T مورد نظر T K KR.α در تقاطع رشته مربوط به تعداد درجه آزادی و ستون سطح مربوط به اهمیت α قرار دارد.
در مورد ما، تعداد درجه آزادی N - 2 \u003d 26 - 2 \u003d 24 و α \u003d 0.05 چه چیزی مربوط به ارزش بحرانی معیار T KR.α \u003d 2.064 (جدول 2 را ببینید)

جدول 2 توزیع T

تعداد درجه آزادی (n - 2)	α \u003d 0.1.	α \u003d 0.05	α \u003d 0.02	α \u003d 0.01	α \u003d 0.002.	α \u003d 0.001
1	6.314	12.706	31.821	63.657	318.31	636.62
2	2.920	4.303	6.965	9.925	22.327	31.598
3	2.353	3.182	4.541	5.841	10.214	12.924
4	2.132	2.776	3.747	4.604	7.173	8.610
5	2.015	2.571	3.365	4.032	5.893	6.869
6	1.943	2.447	3.143	3.707	5.208	5.959
7	1.895	2.365	2.998	3.499	4.785	5.408
8	1.860	2.306	2.896	3.355	4.501	5.041
9	1.833	2.262	2.821	3.250	4.297	4.781
10	1.812	2.228	2.764	3.169	4.144	4.587
11	1.796	2.201	2.718	3.106	4.025	4.437
12	1.782	2.179	2.681	3.055	3.930	4.318
13	1.771	2.160	2.650	3.012	3.852	4.221
14	1.761	2.145	2.624	2.977	3.787	4.140
15	1.753	2.131	2.602	2.947	3.733	4.073
16	1.746	2.120	2.583	2.921	3.686	4.015
17	1.740	2.110	2.567	2.898	3.646	3.965
18	1.734	2.101	2.552	2.878	3.610	3.922
19	1.729	2.093	2.539	2.861	3.579	3.883
20	1.725	2.086	2.528	2.845	3.552	3.850
21	1.721	2.080	2.518	2.831	3.527	3.819
22	1.717	2.074	2.508	2.819	3.505	3.792
23	1.714	2.069	2.500	2.807	3.485	3.767
24	1.711	2.064	2.492	2.797	3.467	3.745
25	1.708	2.060	2.485	2.787	3.450	3.725
26	1.706	2.056	2.479	2.779	3.435	3.707
27	1.703	2.052	2.473	2.771	3.421	3.690
28	1.701	2.048	2.467	2.763	3.408	3.674
29	1.699	2.045	2.462	2.756	3.396	3.659
30	1.697	2.042	2.457	2.750	3.385	3.646
40	1.684	2.021	2.423	2.704	3.307	3.551
60	1.671	2.000	2.390	2.660	3.232	3.460
120	1.658	1.980	2.358	2.617	3.160	3.373
∞	1.645	1.960	2.326	2.576	3.090	3.291

2.2. مقدار مطلق معیارهای T و T K.α را مقایسه کنید

مقدار مطلق معیارهای T کمتر از حد مجاز T \u003d 5.08680، T KR.α \u003d 2.064 نیست، بنابراین داده های تجربی، با احتمال 0.95 (1 - α)، با فرضیه مخالف نیست بر وابستگی متغیرهای تصادفی X و Y.

3. ضرایب معادله رگرسیون خطی را محاسبه کنید.

معادله رگرسیون خطی معادله یک وابستگی مستقیم، تقریبی (تقریبا توصیف شده) بین مقادیر تصادفی X و Y است. اگر فرض کنیم مقدار x آزاد است و Y وابسته به X است، سپس معادله رگرسیون به صورت زیر ثبت می شود

y \u003d a + b x (3.1)، جایی که:

b \u003d.

r x، y

Σ y

σ X.

r x، y

s y

s x.

(3.2),

a \u003d m y - b m x (3.3)

محاسبه شده توسط ضریب فرمول (3.2) ب ضریب رگرسیون خطی نامیده می شود. در برخی منابع آ. به عنوان یک ضریب رگرسیون ثابت و ب بر این اساس، متغیرها.

خطاهای پیش بینی Y در مقدار مشخصی از x توسط فرمول ها محاسبه می شود:

مقدار σ y / x (فرمول 3.4) نیز نامیده می شود میانگین تخریب درجه دوم باقی ماندهاین مراقبت از Y را از خط رگرسیون توصیف شده توسط معادله (3.1)، با مقدار ثابت (مشخص شده) X مشخص می کند.

S Y 2 / S X 2 \u003d 0.20538 / 0.66481 \u003d 0.30894. از بین بردن آخرین شماره مربع مربع - ما دریافت می کنیم:
s y / s x \u003d 0.55582

3.3 ضریب B را محاسبه کنید توسط فرمول (3.2)

ب = -0.72028 0.55582 = -0.40035

3.4 ضریب a را محاسبه کنید توسط فرمول (3.3)

آ. = 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 خطای معادله رگرسیون را تعیین کنید.

3.5.1 از بین بردن ریشه S Y 2 مربع ما دریافت می کنیم:

= 0.31437
3.5.4 ما خطای نسبی را در فرمول محاسبه می کنیم (3.5)

Δ y / x \u003d (0.31437 / 30.50000) 100٪ \u003d 1.03073٪

4. ساخت نمودار پراکندگی (میدان همبستگی) و نمودار خط رگرسیون.

نمودار پراکندگی است تصویر گرافیکی جفت های مرتبط (X K، Y K) در قالب نقاط هواپیما، در مختصات مستطیلی با محورهای X و Y. میدان همبستگی یکی از نمایندگی های گرافیکی نمونه مرتبط (جفت) است. در همان سیستم مختصات، برنامه خط رگرسیون نیز ساخته شده است. شما باید به دقت مقیاس را انتخاب کنید و نقاط شروع به محورها را به طوری که نمودار تا حد ممکن روشن است.

4.1. ما حداقل و حداکثر عنصر نمونه گیری x عناصر 18 و 15 را پیدا می کنیم، به ترتیب x min \u003d 22.10000 و x max \u003d 26.60000.

4.2. ما حداقل و حداکثر عنصر نمونه گیری Y، عناصر دوم و 18 را پیدا می کنیم، به ترتیب، y min \u003d 29.40000 و y max \u003d 31.60000.

4.3. در محور Abscissa، نقطه شروع را انتخاب کنید کمی نقطه X 18 \u003d 22.1000، و چنین مقیاس را به طوری که نقطه X 15 \u003d 26.60000 را می توان روی محور قرار داد و نقاط دیگر متمایز می شود.

4.4. در محور دستورالعمل، نقطه شروع را انتخاب می کنیم کمی نقطه ی 2 \u200b\u200b\u003d 29.40000 را ترک کردیم، و چنین مقیاس به طوری که نقطه Y 18 \u003d 31.60000 را می توان در محور قرار داد و نقاط دیگر متمایز می شود.

4.5. در محور Abscissa، ما مقادیر x k را قرار می دهیم، و مقادیر Y K در محور، هماهنگی هستند.

4.6. اعمال (x 1، y 1)، (x 2، y 2)، ...، (x 26، y 26) در هواپیما مختصات. ما نمودار پراکندگی (میدان همبستگی) را در شکل زیر نشان می دهیم.

4.7. خط رگرسیون ویژگی

برای انجام این کار، دو نقطه مختلف را با مختصات (X R1، Y R1) و (X R2، Y R2) معادله رضایت بخش (3.6) پیدا می کنیم، ما آنها را به هواپیما مختصات اعمال می کنیم و به طور مستقیم از طریق آنها صرف می کنیم. به عنوان Abscissa از نقطه اول، ارزش x min \u003d 22.10،000. ما مقدار x min را به معادله (3.6) جایگزین می کنیم، ما سفارش اول را دریافت می کنیم. بنابراین، ما یک نقطه با مختصات (22.10،000، 31.96127) داریم. به طور مشابه، ما مختصات نقطه دوم را به دست می آوریم، قرار دادن x max \u003d 26.60000 به عنوان Abscissa. نقطه دوم خواهد بود: (26.60000، 30.15970).

خط رگرسیون در شکل زیر در قرمز نشان داده شده است

توجه داشته باشید که خط رگرسیون همیشه از طریق مقادیر میانگین مقادیر x و y عبور می کند، I.E. مختصات (m x، m y).

06.06.2018 16 235 0 Igor

روانشناسی و جامعه

همه چیز در جهان ارتباط دارد. هر فرد در سطح شهود در تلاش است تا رابطه بین پدیده ها را پیدا کند تا بتواند آنها را تحت تأثیر قرار دهد و آنها را مدیریت کند. مفهومی که این رابطه را نشان می دهد، همبستگی نامیده می شود. معنی کلمات ساده چیست؟

محتوا:

مفهوم همبستگی

همبستگی (از نسبت لاتین "correlalatio" - نسبت، رابطه) - یک اصطلاح ریاضی، که به معنی اندازه گیری وابستگی احتمالی آماری بین مقادیر تصادفی (متغیرها) است.

مثال: دو نوع اتصال را بگیرید:

اولین - قلم در دست انسان. به چه شیوه ای دست حرکت می کند، به همان شیوه و دسته. اگر دست در حالت استراحت باشد، دسته نمی نویسد. اگر فرد به سختی به او بچسبد، ردیابی بر روی کاغذ غنی خواهد بود. این نوع رابطه نشان دهنده وابستگی شدید است و همبستگی ندارد. این رابطه کاربردی است.
دیدگاه دوم - وابستگی بین سطوح تشکیل انسان و ادبیات خواندن. این در پیشبرد شناخته شده نیست که از مردم بیشتر بخواند: با آموزش عالی یا بدون آن. این رابطه تصادفی یا تصادفی است، علم آماری آن مورد مطالعه قرار گرفته است که تنها با پدیده های توده ای مشغول به کار است. اگر محاسبه آماری شما را به اثبات پیوند همبستگی بین سطح تحصیلات و خواندن ادبیات به اثبات برساند، فرصتی برای پیش بینی پیش بینی رویداد احتمالی فراهم می کند. در این مثال، با احتمال زیادی، ممکن است بگوییم افرادی که دارای آموزش عالی هستند خواندن کتاب های خواندن بیشتر، کسانی که تحصیلات بیشتری دارند. اما از آنجا که اتصال بین این پارامترها عملکردی نیست، ما می توانیم اشتباه کنیم. شما همیشه می توانید احتمال چنین خطایی را محاسبه کنید، که به طور یکنواخت کوچک خواهد بود و سطح آماری معنی دار (P) نامیده می شود.

نمونه هایی از اتصالات بین هر یک پدیده های طبیعی هستند: زنجیره تغذیه در طبیعت، بدن انسان، که شامل سیستم های اندام، ارتباطات و عملکرد به طور کلی است.

هر روز ما با وابستگی همبستگی مواجه هستیم زندگی روزمره: بین آب و هوا و حال خوب، اصطلاحات مناسب اهداف و دستاورد آنها، نگرش مثبت و شانس، احساس خوشبختی و رفاه مالی. اما ما به دنبال ارتباطات هستیم، با تکیه بر محاسبات ریاضی، بلکه در اسطوره ها، شهود، خرافات و خرافات. این پدیده ها بسیار دشوار است برای ترجمه به زبان ریاضی، اکسپرس در اعداد، اندازه گیری. چیز دیگری این است که ما پدیده هایی را که می توانید محاسبه کنید، تجزیه و تحلیل کنید، به صورت اعداد ارسال کنید. در این مورد، ما می توانیم با استفاده از ضریب همبستگی (R) همبستگی را تعیین کنیم، که منعکس کننده قدرت، درجه، تنگی و جهت همبستگی بین متغیرهای تصادفی است.

همبستگی قوی بین مقادیر تصادفی - گواهی حضور برخی از ارتباط آماری به طور خاص بین این پدیده ها، اما این ارتباط را نمی توان به پدیده های مشابه منتقل کرد، اما برای یک وضعیت دیگر. اغلب محققان، با افزایش همبستگی معنی داری بین دو متغیر در محاسبات، بر اساس سادگی تجزیه و تحلیل همبستگی، مفروضات بصری دروغین در مورد وجود روابط علی بین نشانه ها، فراموش می کنند که ضریب همبستگی احتمال احتمالی است.

مثال: تعداد مجروح شده در طول یخ و تعداد حوادث در میان وسایل نقلیه. این مقادیر در میان خود همبستگی خواهد داشت، هرچند که آنها کاملا مرتبط نیستند، اما تنها ارتباط با دلیلی برای این موارد دارند رویدادهای تصادفی - HoliTy اگر تجزیه و تحلیل رابطه همبستگی بین پدیده ها را نشان نداد، این هنوز شواهدی از عدم ارتباط بین آنها نیست، که می تواند یک غیر خطی پیچیده باشد، با استفاده از محاسبات همبستگی شناسایی نشده است.

اولین کسی که مفهوم همبستگی را در گردش علمی معرفی کرد، فرانسوی بود پالنولوژیست Georges Kuwier. در قرن هجدهم، او همبستگی قانون قطعات و اندام های موجودات زنده را به ارمغان آورد، به این معنا که امکان بازگرداندن پایه ای از کل موجودات فسیلی، یک حیوان در قسمت های یافت شده بدن (باقی مانده) است. در آمار، اصطلاح همبستگی ابتدا یک دانشمند انگلیسی را در سال 1886 اعمال کرد فرانسیس گالتون. اما او نمیتواند فرمول دقیق را برای محاسبه ضریب همبستگی حذف کند، اما این کار توسط دانش آموزش انجام شد معروف ترین ریاضیدان و متخصص زیست شناسی کارل پیرسون.

انواع همبستگی

در اهمیت - بسیار ارزشمند، معنی دار و ناچیز.

نمایش	r.
ریسک بالا	r مربوط به سطح آماری معنیداری P است<=0,01
معنی دار	r مربوط به P.<=0,05
ناچیز	r به P\u003e 0.1 نمی رسد

منفی (کاهش ارزش یک متغیر منجر به افزایش سطح دیگر می شود: بیشتر فتنه های انسانی، کمتر احتمال دارد که موقعیت راهنمایی را بپذیرید) و مثبت (اگر رشد یک مقدار مستلزم افزایش سطح آن باشد دیگر: عصبی تر، بیشتر احتمال دارد که بیمار شود). اگر هیچ ارتباطی بین متغیرها وجود نداشته باشد، چنین همبستگی صفر نامیده می شود.

خطی (هنگامی که یک مقدار افزایش یا کاهش می یابد، دوم نیز افزایش یا کاهش می یابد) و غیر خطی (زمانی که، زمانی که یک تغییر در یک مقدار، ماهیت تغییر دوم را نمی توان با استفاده از وابستگی خطی توصیف کرد، سپس سایر قوانین ریاضی اعمال می شود - چندجملهای، هیپربولیک اعتیاد).

توسط قدرت.

عوامل

بسته به کدام مقیاس شامل متغیرهای مورد مطالعه، انواع مختلف ضرایب همبستگی محاسبه می شود:

ضریب همبستگی پیرسون، ضریب همبستگی خطی جفت یا همبستگی نقاط آثار برای متغیرها از مقیاس اندازه گیری و اندازه گیری کمی محاسبه می شود.
ضریب همبستگی رتبه روح یا Kendalla - زمانی که حداقل یکی از مقادیر دارای مقیاس توالی است یا طبیعی نیست.
نقطه ضریب همبستگی نقطه ای (ضریب همبستگی علائم Fechner) اگر یکی از دو مقدار دوگانگی باشد.
ضریب همبستگی چهار فله (ضریب همبستگی چندگانه (همبستگی) - اگر دو متغیر دوجانبه باشند.

ضریب پیرسون به شاخص های همبستگی پارامتری اشاره دارد، همه دیگران - به غیر پارامتری.

ضریب همبستگی ارزش از -1 تا 1/1 است. با همبستگی مثبت کامل، r \u003d +1، با یک منفی کامل - r \u003d -1.

فرمول و محاسبه

مثال ها

لازم است تعیین رابطه دو متغیر: سطح توسعه فکری (بر اساس تست) و تعداد بیابان ها برای ماه (با توجه به سوابق در مجله آموزشی) از دانش آموزان.

داده های اولیه در جدول ارائه شده است:

№	داده های IQ (x)	داده های مربوط به تعداد بیابان ها (Y)










مجموع	1122
میانگین	112,2

برای فعال کردن تفسیر صحیح شاخص نتیجه، ضریب همبستگی ضریب همبستگی (+ یا -) و مقدار مطلق آن (ماژول) ضروری است.

با توجه به جدول طبقه بندی، ضریب همبستگی نیروی ما نتیجه می گیریم که Rxy \u003d -0.827 یک وابستگی همبستگی منفی قوی است. بنابراین، تعداد دانش آموزان دیرپایی دارای وابستگی بسیار قوی به سطح توسعه فکری خود هستند. می توان گفت که دانش آموزان با سطح بالا IQ کمتر احتمال دارد که از دانش آموزان با IQ کم اشغال کنند.

ضریب همبستگی را می توان به عنوان دانشمندان برای تایید یا رد فرض از وابستگی دو مقدار یا پدیده مورد استفاده قرار داد و قدرت، اهمیت و دانش آموزان را برای مطالعات تجربی و آماری بر روی موضوعات مختلف اندازه گیری کرد. باید به یاد داشته باشید که این شاخص یک ابزار ایده آل نیست، فقط برای اندازه گیری قدرت وابستگی خطی محاسبه می شود و همیشه یک مقدار احتمالی است که یک خطای خاص دارد.

تجزیه و تحلیل همبستگی در زمینه های زیر اعمال می شود:

علوم اقتصادی؛
فیزیک نجومی؛
علوم اجتماعی (جامعه شناسی، روانشناسی، آموزش و پرورش)؛
agrochemistry؛
مطالعات فلزی؛
صنعت (برای کنترل کیفیت)؛
هیدروبیولوژی؛
بیومتریک و غیره

علل محبوبیت روش تحلیل همبستگی:

سادگی نسبی محاسبه ضرایب همبستگی ضروری نیست آموزش ریاضی خاص.
به شما امکان می دهد رابطه بین مقادیر تصادفی توده ای که به علم آماری مورد استفاده قرار می گیرند محاسبه کنید. در این راستا، این روش در زمینه مطالعات آماری گسترده شده است.

امیدوارم اکنون بتوانید رابطه عملکردی را از همبستگی متمایز کنید و شما می دانید زمانی که شما در تلویزیون می شنوید یا در یک فشار همبستگی خواندید، پس تحت آن به معنای وابستگی مثبت و به اندازه کافی قابل توجه بین دو پدیده است.

در آمار ضریب همبستگی (انگلیسی ضریب همبستگی.) مورد استفاده برای آزمون فرضیه در مورد وجود رابطه بین دو مقادیر تصادفی، و همچنین به ما اجازه می دهد تا قدرت خود را ارزیابی کنیم. در یک نظریه نمونه کارها، این شاخص معمولا برای تعیین ماهیت و نیروی وابستگی بین سودآوری امنیت (دارایی) و عملکرد نمونه کارها استفاده می شود. اگر توزیع این متغیرها طبیعی یا نزدیک به حالت عادی باشد، باید از آن استفاده کنید ضریب همبستگی پیرسونکه توسط فرمول زیر محاسبه می شود:

انحراف معیار سودآوری سهام شرکت A 0.6398 خواهد بود، سهام شرکت B 0.5241 و نمونه کارها 0.5668. ( چگونه می توان انحراف استاندارد را محاسبه کرد)

ضریب همبستگی سودآوری شرکت A و سودآوری نمونه کارها -0.864 و سهام شرکت B 0.816 خواهد بود.

r a \u003d -0.313 / (0،6389 * 0،5668) \u003d -0،864

r b \u003d 0.242 / (0،5241 * 0،5668) \u003d 0،816

این می تواند در مورد وجود رابطه نسبتا قوی بین عملکرد نمونه کارها و سودآوری شرکت شرکت A و شرکت B نتیجه گیری شود. در عین حال، سودآوری سهام شرکت یک جنبش چند جانبه را با عملکرد نمونه کارها نشان می دهد و سودآوری سهام شرکت B حرکت یک طرفه.