7 ضریب همبستگی. معیارهای همبستگی پینسون

در هنگام مطالعه بهداشت عمومی و مراقبت های بهداشتی در اهداف علمی و عملی، محقق اغلب باید تجزیه و تحلیل آماری از رابطه بین عامل ها و نشانه های موثر آمار آماری (رابطه علی) را انجام دهد یا تعیین وابستگی تغییرات موازی در چندین نشانه از این موارد کل از هر مقدار سوم (از کل علت آنها). لازم است که بتوانیم ویژگی های این اتصال را مطالعه کنیم تا اندازه و جهت آن را تعیین کنیم، و همچنین دقت آن را ارزیابی کنیم. این از روش های همبستگی استفاده می کند.

  1. انواع تظاهرات ارتباطات کمی بین نشانه ها
    • ارتباطات عملکردی
    • همبستگی
  2. تعاریف عملکرد و همبستگی

    ارتباطات عملکردی - این نوع رابطه بین دو نشانه، زمانی که هر مقدار از یکی از آنها مربوط به یک مقدار دقیق تعریف شده از دیگر (منطقه دایره بستگی به شعاع دایره، و غیره). ارتباطات کاربردی مشخصه فرایندهای فیزیکی و ریاضی است.

    همبستگی - چنین ارتباطی، که در آن هر مقدار خاصی از یک ویژگی مربوط به چند مقدار دیگر از ویژگی های متصل شده با آن است (رابطه بین رشد و وزن بدن بدن انسان؛ رابطه بین دمای بدن و میزان پالس ، و غیره.). پیوند همبستگی مشخصه فرایندهای پزشکی و بیولوژیکی است.

  3. اهمیت عملی ایجاد همبستگی. تشخیص علت بین عامل و ویژگی های موثر (در ارزیابی توسعه فیزیکی، تعیین رابطه بین شرایط کاری، زندگی و سلامت، در تعیین وابستگی فرکانس موارد بیماری از سن، تجربه، دسترسی به نظرات صنعتی و غیره)

    وابستگی تغییرات موازی چندین نشانه از مقدار سوم. به عنوان مثال، تحت تاثیر دمای بالا در کارگاه، تغییرات وجود دارد فشار خون، ویسکوزیته خون، فرکانس پالس، و غیره

  4. مقدار که جهت و قدرت ارتباط بین نشانه ها را مشخص می کند. ضریب همبستگی، که در یک عدد، ایده ای از جهت و قدرت اتصال بین نشانه ها (پدیده)، محدودیت های نوسانات آن از 0 تا ± 1 را ارائه می دهد
  5. روش ها برای ارائه همبستگی
    • برنامه (نمودار پراکندگی)
    • ضریب همبستگی
  6. جهت همبستگی
    • سر راست
    • ابطال
  7. نیروی همبستگی
    • قوی: ± 0.7 تا ± 1
    • میانگین: ± 0.3 تا ± 0.699
    • ضعیف: 0 تا ± 0.299
  8. روش های تعیین ضریب همبستگی و فرمول
    • روش مربع (روش پیرسون)
    • روش محدوده (روش اسپیرمن)
  9. الزامات روشنی برای استفاده از ضریب همبستگی
    • اندازه گیری ارتباط تنها در ترکیبات همگن با کیفیت بالا امکان پذیر است (به عنوان مثال، اندازه گیری ارتباط بین رشد و وزن در دانه ها، همگن توسط جنس و سن)
    • محاسبه را می توان با استفاده از مقادیر مطلق یا مشتق شده انجام داد
    • برای محاسبه ضریب همبستگی گروه بندی نشده است ردیف های تنوع (این الزام تنها زمانی اعمال می شود که محاسبه ضریب همبستگی با روش مربع ها)
    • تعداد مشاهدات حداقل 30
  10. توصیه هایی برای استفاده از روش همبستگی حلقه ها (روش اسپیرمن)
    • هنگامی که نیازی به برقراری ارتباط دقیق برق وجود ندارد و داده های نسبتا نشان داده شده است
    • هنگامی که نشانه ها نه تنها کمی، بلکه ارزش را نیز ارائه می دهند
    • هنگامی که ردیف توزیع علائم گزینه های باز (به عنوان مثال، تجربه کاری تا 1 سال و غیره)
  11. توصیه هایی برای استفاده از روش مربعات (روش پیرسون)
    • هنگامی که استقرار دقیق نیروی اتصال بین نشانه ها مورد نیاز است
    • هنگامی که علائم تنها یک بیان کمی دارند
  12. روش شناسی و روش محاسبه ضریب همبستگی

    1) روش مربع

    2) روش رتبه

  13. طرح ارزیابی همبستگی برای ضریب همبستگی
  14. محاسبه خطا ضریب همبستگی
  15. ارزیابی صحت ضریب همبستگی به دست آمده از همبستگی رتبه و روش مربعات

    روش 1
    دقت توسط فرمول تعیین می شود:

    معیار T در جدول مقادیر T برآورد شده است، با توجه به تعداد درجه آزادی (n-2)، که N تعداد گزینه زوج است. معیار T باید برابر یا بیشتر جدول های مربوط به احتمال P ≥99٪ باشد.

    روش 2
    قابلیت اطمینان بر روی یک جدول خاص از ضرایب همبستگی استاندارد تخمین زده می شود. در عین حال، چنین ضریب همبستگی قابل اعتماد است، زمانی که با تعداد مشخصی از درجه های آزادی (N-2) قابل اعتماد است، برابر با یک جدول بیشتر، مربوط به درجه پیش بینی بدون خطا P ≥95٪ .

برای اعمال روش مربع

وظیفه: ضریب همبستگی را محاسبه کنید، جهت و مقاومت ارتباط بین مقدار کلسیم در آب و سفتی آب را تعیین کنید، اگر داده های زیر شناخته شده باشند (جدول 1). دقت ارتباطات را ارزیابی کنید. نتیجه گیری کنید

میز 1

توجیه انتخاب روش. برای حل مشکل، روش مربع انتخاب شده است (پیرسون)، زیرا هر یک از علائم (استحکام آب و مقدار کلسیم) دارای بیان عددی است؛ بدون گزینه باز

تصمیم.
توالی محاسبه در متن تنظیم شده است، نتایج در جدول ارائه شده است. با ساخت ردیف جفت جفت مقادیر، به آنها از طریق X (سفتی آب در درجه) و از طریق Y (مقدار کلسیم در آب در mg / l) اشاره شده است.

سختی آب
(در درجهها)
مقدار کلسیم در آب
(در mg / l)
d H. د d x x d d x 2. d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
m x \u003d σ x / n m y \u003d σ y / n σ d x \u200b\u200bx d y \u003d 7078 σ d x \u200b\u200b2 \u003d 982 σ d y 2 \u003d 51056
m x \u003d 120/6 \u003d 20 m y \u003d 852/6 \u003d 142
  1. تعیین مقادیر متوسط \u200b\u200bM x تعدادی از گزینه "X" و M در تعدادی از گزینه "Y" توسط فرمول:
    m x \u003d σх / n (نمودار 1) و
    m y \u003d σu / n (نمودار 2)
  2. انحراف (D X و D) از هر گزینه از مقدار میانگین محاسبه شده در سری "X" و در ردیف "Y" را پیدا کنید
    d x \u003d x - m x (نمودار 3) و d y \u003d y - m y (graf4).
  3. پیدا کردن یک محصول انحراف d x x d y و خلاصه آنها: Σ d x x d y (نمودار 5)
  4. هر انحراف DX و D باید یک مربع را بسازند و مقادیر خود را برای یک سری از "X" و برای تعدادی از "Y" خلاصه می کنند: σ DX 2 \u003d 982 (نمودار 6) و σ dy 2 \u003d 51056 ( نمودار 7).
  5. تعیین محصول Σ d x 2 x σ d y 2 و از این کار برای استخراج ریشه دوم
  6. مقادیر به دست آمده σ (d x x d y) و √ (σd x 2 x Σd y 2) ما جایگزین فرمول برای محاسبه ضریب همبستگی می کنیم:
  7. دقت ضریب همبستگی را تعیین کنید:
    راه اول خطای ضریب همبستگی (MR XY) و معیار T با توجه به فرمول ها را پیدا کنید:

    معیار t \u003d 14.1، که مربوط به احتمال پیش بینی بدون خطا P\u003e 99.9٪ است.

    راه دوم دقت ضریب همبستگی در جدول "ضرایب همبستگی استاندارد" تخمین زده می شود (به ضمیمه 1 مراجعه کنید). هنگامی که درجه آزادی (n - 2) \u003d 6 - 2 \u003d 4، ضریب همبستگی تخمین زده شده R xu \u003d 0.99 بزرگتر از جدول است (R Tab \u003d 0.917 در P \u003d 99٪).

    خروجی کلسیم بیشتر در آب، سخت تر (ارتباطات راست، قوی و قابل اعتماد: R Hu \u003d 0.99، P\u003e 99.9٪).

    در استفاده از روش رتبه

    وظیفه: ما جهت و قدرت رابطه بین تجربه کاری در سال ها و فرکانس صدمات را تعیین می کنیم اگر داده های زیر به دست آمده باشند:

    توجیه انتخاب روش: برای حل این کار، تنها روش همبستگی رتبه را می توان انتخاب کرد، زیرا ردیف اول "تجربه کاری در سال ها" گزینه های باز (تجربه کاری تا 1 سال و 7 سال یا بیشتر) دارد، که اجازه نمی دهد از روش دقیق تر برای برقراری ارتباط بین ویژگی های مرتبط - روش مربع استفاده نکنید.

    تصمیم. توالی محاسبه در متن تنظیم شده است، نتایج در جدول ارائه شده است. 2

    جدول 2

    تجربه کاری در سال ها تعداد آسیب شماره سفارش (رده) تفاوت مسیر تفاوت مربع رتبه
    ایکس. Y. d (x-y) d 2
    تا 1 سال 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 یا بیشتر 6 5 1 +4 16
    σ d 2 \u003d 38.5

    ضرایب همبستگی استاندارد که قابل اعتماد هستند (توسط L.S. Kaminsky)

    تعداد درجه آزادی - 2 سطح احتمال P (٪)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov v.V. همهگیرشناسی. - m: gootar-honey، 2004. - 464 p.
    2. lisitsyn yu.p. بهداشت عمومی و بهداشت و درمان. کتاب درسی برای دانشگاه ها. - m: goeotar-honey، 2007. - 512 p.
    3. Medica V.A.، Yuriev V.K. دوره سلامت عمومی و سخنرانی های بهداشتی: قسمت 1. سلامت عمومی. - متر: پزشکی، 2003. - 368 پ.
    4. Minaev v.A.، Vishnyakov N.I. و دیگران. سازمان پزشکی و سازمان بهداشت اجتماعی (دستورالعمل ها در 2 جلد). - سنت پترزبورگ، 1998. -528 پ.
    5. Kucherenko V.Z.، Agarkov N.M. و سایر سازمان های بهداشت اجتماعی و مراقبت های بهداشتی ( تدبیر) - مسکو، 2000. - 432 پ.
    6. S. Glanz. آمار پزشکی و بیولوژیکی. در هر انگلیسی - M.، تمرین، 1998. - 459 p.

ضریب همبستگی نشان دهنده میزان ارتباط بین دو شاخص است. همیشه یک مقدار از -1 به 1 طول می کشد اگر ضریب در حدود 0 قرار دارد، آنها می گویند که هیچ ارتباطی بین متغیرها وجود ندارد.

اگر مقدار نزدیک به یک (از 0.9، به عنوان مثال)، یک رابطه مستقیم مستقیم بین اشیاء مشاهده شده وجود دارد. اگر ضریب نزدیک به دیگری باشد نقطه عطفی محدوده (-1)، پس از آن یک رابطه معکوس قوی بین متغیرها وجود دارد. هنگامی که ارزش جایی در وسط از 0 تا 1 یا 0 تا 1 است، این یک اتصال ضعیف (مستقیم یا معکوس) است. این رابطه معمولا به حساب نمی آید: اعتقاد بر این است که این نیست.

محاسبه ضریب همبستگی در اکسل

در مورد روش های نمونه ای برای محاسبه ضریب همبستگی، ویژگی های رابطه مستقیم و معکوس بین متغیرها را در نظر بگیرید.

مقادیر X و Y شاخص ها:

y متغیر مستقل، وابسته به X است. لازم است که قدرت (قوی / ضعیف) و جهت (مستقیم / معکوس) ارتباط بین آنها را پیدا کنید. فرمول ضریب همبستگی به نظر می رسد این است:


برای ساده سازی درک آن، ما به چند عنصر ساده تقسیم می کنیم.

اتصال مستقیم مستقیم بین متغیرها تعیین می شود.

عملکرد Correla ساخته شده از محاسبات پیچیده اجتناب می کند. ضریب همبستگی جفتی در اکسل را با کمک آن محاسبه کنید. تماس با توابع توابع. ما یکی را پیدا می کنیم. استدلال عملکرد - آرایه ای از مقادیر Y و مجموعه ای از ارزش های X:

نمایش مقادیر متغیرها بر روی برنامه:


یک پیوند قوی بین Y و X قابل مشاهده است، زیرا خطوط تقریبا موازی با یکدیگر هستند. رابطه مستقیم است: رشد Y - رشد X، Y کاهش می یابد - کاهش x.



ماتریس ضرایب همبستگی زوجی در اکسل

ماتریس همبستگی یک جدول است، در تقاطع ردیف ها و ستون هایی که ضرایب همبستگی بین مقادیر مربوطه هستند. این منطقی است که آن را برای چندین متغیر ساخت.

ماتریس ضرایب همبستگی در اکسل با استفاده از ابزار "همبستگی" از بسته تجزیه و تحلیل داده ها ساخته شده است.


بین مقادیر Y و X1، یک رابطه مستقیم قوی شناسایی شد. بین X1 و X2 بازخورد قوی وجود دارد. ارتباط با مقادیر در ستون X3 عملا وجود ندارد.

توجه داشته باشید! تصمیم خود را وظیفه خاص به نظر می رسد همانند این مثال، از جمله تمام جداول و متون توضیحی که در زیر ارائه شده است، اما با توجه به اطلاعات منبع شما ...

یک وظیفه:
یک نمونه بافتنی از 26 جفت مقادیر (x k، y k) وجود دارد:

k. 1 2 3 4 5 6 7 8 9 10
x k. 25.20000 26.40000 26.00000 25.80000 24.90000 25.70000 25.70000 25.70000 26.10000 25.80000
y k. 30.80000 29.40000 30.20000 30.50000 31.40000 30.30000 30.40000 30.50000 29.90000 30.40000

k. 11 12 13 14 15 16 17 18 19 20
x k. 25.90000 26.20000 25.60000 25.40000 26.60000 26.20000 26.00000 22.10000 25.90000 25.80000
y k. 30.30000 30.50000 30.60000 31.00000 29.60000 30.40000 30.70000 31.60000 30.50000 30.60000

k. 21 22 23 24 25 26
x k. 25.90000 26.30000 26.10000 26.00000 26.40000 25.80000
y k. 30.70000 30.10000 30.60000 30.50000 30.70000 30.80000

لازم است محاسبه / ساخت:
- ضریب همبستگی؛
- فرضیه وابستگی متغیرهای تصادفی X و Y را در سطح اهمیت α \u003d 0.05 بررسی کنید.
- ضرایب معادله رگرسیون خطی؛
- نمودار پراکندگی (میدان همبستگی) و برنامه خط رگرسیون؛

تصمیم گیری:

1. ضریب همبستگی را محاسبه کنید.

ضریب همبستگی شاخصی از تأثیر احتمال متقابل دو متغیر تصادفی است. ضریب همبستگی R. می تواند ارزش ها را از -1 قبل از +1 . اگر ارزش مطلق نزدیک تر باشد 1 ، پس این شواهدی از ارتباط قوی بین مقادیر است، و اگر نزدیک تر باشد 0 - این، از یک اتصال ضعیف یا غیبت آن صحبت می کند. اگر ارزش مطلق باشد R. برابر با یک، ما می توانیم در مورد اتصال عملکردی بین مقادیر صحبت کنیم، یعنی یک مقدار را می توان از طریق یک تابع ریاضی بیان کرد.


ضریب همبستگی را در فرمول های زیر محاسبه کنید:
n.
Σ
k \u003d 1.
(x k -m x) 2، σ y 2 =
m x. =
1
n.
n.
Σ
k \u003d 1.
x k m y. =

یا فرمول

r x، y =
m xy - m x m y
s x s y
(1.4)، جایی که:
m x. =
1
n.
n.
Σ
k \u003d 1.
x k m y. =
1
n.
n.
Σ
k \u003d 1.
y k m xy =
1
n.
n.
Σ
k \u003d 1.
x k y k (1.5)
s x 2 =
1
n.
n.
Σ
k \u003d 1.
x k 2 - m x 2، S Y 2 =
1
n.
n.
Σ
k \u003d 1.
y K 2 - M Y 2 (1.6)

در عمل، فرمول (1.4) اغلب برای محاسبه ضریب همبستگی استفاده می شود. این نیاز به محاسبات کمتری دارد. با این حال، اگر کوواریانس قبلا محاسبه شده بود cOV (X، Y)، استفاده از فرمول (1.1) سودمندتر است، زیرا علاوه بر کوواریانس واقعی، می توانید از نتایج محاسبات متوسط \u200b\u200bاستفاده کنید.

1.1 ضریب همبستگی را با فرمول (1.4) محاسبه کنیدبرای انجام این کار، مقادیر X K 2، Y K 2 و X K Y K را محاسبه کنید و آنها را به جدول 1 برسانید.

میز 1


k.
x k. y k. x k. 2 y k. 2 x k.y k.
1 2 3 4 5 6
1 25.2 30.8 635.04000 948.64000 776.16000
2 26.4 29.4 696.96000 864.36000 776.16000
3 26.0 30.2 676.00000 912.04000 785.20000
4 25.8 30.5 665.64000 930.25000 786.90000
5 24.9 31.4 620.01000 985.96000 781.86000
6 25.7 30.3 660.49000 918.09000 778.71000
7 25.7 30.4 660.49000 924.16000 781.28000
8 25.7 30.5 660.49000 930.25000 783.85000
9 26.1 29.9 681.21000 894.01000 780.39000
10 25.8 30.4 665.64000 924.16000 784.32000
11 25.9 30.3 670.81000 918.09000 784.77000
12 26.2 30.5 686.44000 930.25000 799.10000
13 25.6 30.6 655.36000 936.36000 783.36000
14 25.4 31 645.16000 961.00000 787.40000
15 26.6 29.6 707.56000 876.16000 787.36000
16 26.2 30.4 686.44000 924.16000 796.48000
17 26 30.7 676.00000 942.49000 798.20000
18 22.1 31.6 488.41000 998.56000 698.36000
19 25.9 30.5 670.81000 930.25000 789.95000
20 25.8 30.6 665.64000 936.36000 789.48000
21 25.9 30.7 670.81000 942.49000 795.13000
22 26.3 30.1 691.69000 906.01000 791.63000
23 26.1 30.6 681.21000 936.36000 798.66000
24 26 30.5 676.00000 930.25000 793.00000
25 26.4 30.7 696.96000 942.49000 810.48000
26 25.8 30.8 665.64000 948.64000 794.64000


1.2 محاسبه M x با توجه به فرمول (1.5).

1.2.1. x k.

x 1 + x 2 + ... + x 26 \u003d 25.20000 + 26.40000 + ... + 25.80000 \u003d 669.500000

1.2.2.

669.50000 / 26 = 25.75000

m x \u003d 25.750000

1.3. به طور مشابه، محاسبه M y.

1.3.1. مخلوط کردن به طور مداوم تمام عناصر y k.

y 1 + y 2 + ... + y 26 \u003d 30.80000 + 29.40000 + ... + 30.80000 \u003d 793.000000

1.3.2. ما مقدار دریافت شده توسط تعداد عناصر نمونه گیری را تقسیم می کنیم

793.00000 / 26 = 30.50000

m y \u003d 30.500000

1.4 به طور مشابه محاسبه M xy.

1.4.1. مخلوط کردن به طور مداوم تمام عناصر ستون 6 جدول 1

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. ما مقدار دریافت شده توسط تعداد اقلام را تقسیم می کنیم

20412.83000 / 26 = 785.10885

m xy \u003d 785.108846

1.5. مقدار S x 2 را با فرمول (1.6) محاسبه کنید.

1.5.1. حرکت به صورت متوالی تمام عناصر ستون چهارم جدول 1

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. ما مقدار دریافت شده توسط تعداد اقلام را تقسیم می کنیم

17256.91000 / 26 = 663.72731

1.5.3. اشتراک از آخرین شماره مربع مقدار m x برای S x 2 بدست می آید

s x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6 محاسبه مقدار S Y 2 توسط فرمول (1.6.).

1.6.1. تمام عناصر ستون پنجم جدول را ترتیب دهید

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. ما مقدار دریافت شده توسط تعداد اقلام را تقسیم می کنیم

24191.84000 / 26 = 930.45538

1.6.3. محاسبه شده از آخرین شماره مربع مقدار m y برای S y 2 به دست می آید

S Y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7 محاسبه محصول مقادیر S x 2 و S y 2.

S X 2 S Y 2 \u003d 0.66481 0.20538 \u003d 0.136541

1.8. از بین بردن آخرین شماره مربع ریشه، ما مقدار S X S را دریافت می کنیم.

s x s y \u003d 0.36951

1.9. مقدار ضریب همبستگی را با فرمول (1.4) محاسبه کنید.

R \u003d (785.10885 - 25.75000 30.50000) / 0.36951 \u003d (785.10885 - 785.37500) / 0.36951 \u003d -0.72028

پاسخ: R x، y \u003d -0.720279

2. اهمیت ضریب همبستگی را بررسی کنید (ما فرضیه وابستگی را بررسی می کنیم).

از آنجا که ارزیابی ضریب همبستگی بر روی نمونه نهایی محاسبه می شود و بنابراین ممکن است از ارزش کلی آن جدا شود، لازم است که اهمیت ضریب همبستگی را مورد آزمایش قرار دهیم. بررسی با استفاده از معیارهای T انجام می شود:

t \u003d.
r x، y
n - 2
1 - R 2 X، Y
(2.1)

مقدار تصادفی t. این به دنبال توزیع T دانش آموز و توزیع جدول T است، لازم است که ارزش بحرانی معیار (T K.α) را در یک سطح معین اهمیت α پیدا کنید. اگر فرمول محاسبه شده توسط فرمول (2.1) T بر روی ماژول کمتر از T KR.α باشد، سپس رابطه بین مقادیر تصادفی x و y نه در غیر این صورت، داده های تجربی با فرضیه وابستگی متغیرهای تصادفی مخالف نیستند.


2.1. محاسبه مقدار معیارهای T توسط فرمول (2.1) ما به دست آمده:
t \u003d.
-0.72028
26 - 2
1 - (-0.72028) 2
= -5.08680

2.2. ما در جدول توزیع T تعریف می کنیم، ارزش بحرانی پارامتر T KR.α

T مورد نظر T K KR.α در تقاطع رشته مربوط به تعداد درجه آزادی و ستون سطح مربوط به اهمیت α قرار دارد.
در مورد ما، تعداد درجه آزادی N - 2 \u003d 26 - 2 \u003d 24 و α \u003d 0.05 چه چیزی مربوط به ارزش بحرانی معیار T KR.α \u003d 2.064 (جدول 2 را ببینید)

جدول 2 توزیع T

تعداد درجه آزادی
(n - 2)
α \u003d 0.1. α \u003d 0.05 α \u003d 0.02 α \u003d 0.01 α \u003d 0.002. α \u003d 0.001
1 6.314 12.706 31.821 63.657 318.31 636.62
2 2.920 4.303 6.965 9.925 22.327 31.598
3 2.353 3.182 4.541 5.841 10.214 12.924
4 2.132 2.776 3.747 4.604 7.173 8.610
5 2.015 2.571 3.365 4.032 5.893 6.869
6 1.943 2.447 3.143 3.707 5.208 5.959
7 1.895 2.365 2.998 3.499 4.785 5.408
8 1.860 2.306 2.896 3.355 4.501 5.041
9 1.833 2.262 2.821 3.250 4.297 4.781
10 1.812 2.228 2.764 3.169 4.144 4.587
11 1.796 2.201 2.718 3.106 4.025 4.437
12 1.782 2.179 2.681 3.055 3.930 4.318
13 1.771 2.160 2.650 3.012 3.852 4.221
14 1.761 2.145 2.624 2.977 3.787 4.140
15 1.753 2.131 2.602 2.947 3.733 4.073
16 1.746 2.120 2.583 2.921 3.686 4.015
17 1.740 2.110 2.567 2.898 3.646 3.965
18 1.734 2.101 2.552 2.878 3.610 3.922
19 1.729 2.093 2.539 2.861 3.579 3.883
20 1.725 2.086 2.528 2.845 3.552 3.850
21 1.721 2.080 2.518 2.831 3.527 3.819
22 1.717 2.074 2.508 2.819 3.505 3.792
23 1.714 2.069 2.500 2.807 3.485 3.767
24 1.711 2.064 2.492 2.797 3.467 3.745
25 1.708 2.060 2.485 2.787 3.450 3.725
26 1.706 2.056 2.479 2.779 3.435 3.707
27 1.703 2.052 2.473 2.771 3.421 3.690
28 1.701 2.048 2.467 2.763 3.408 3.674
29 1.699 2.045 2.462 2.756 3.396 3.659
30 1.697 2.042 2.457 2.750 3.385 3.646
40 1.684 2.021 2.423 2.704 3.307 3.551
60 1.671 2.000 2.390 2.660 3.232 3.460
120 1.658 1.980 2.358 2.617 3.160 3.373
1.645 1.960 2.326 2.576 3.090 3.291


2.2. مقدار مطلق معیارهای T و T K.α را مقایسه کنید

مقدار مطلق معیارهای T کمتر از حد مجاز T \u003d 5.08680، T KR.α \u003d 2.064 نیست، بنابراین داده های تجربی، با احتمال 0.95 (1 - α)، با فرضیه مخالف نیست بر وابستگی متغیرهای تصادفی X و Y.

3. ضرایب معادله رگرسیون خطی را محاسبه کنید.

معادله رگرسیون خطی معادله یک وابستگی مستقیم، تقریبی (تقریبا توصیف شده) بین مقادیر تصادفی X و Y است. اگر فرض کنیم مقدار x آزاد است و Y وابسته به X است، سپس معادله رگرسیون به صورت زیر ثبت می شود


y \u003d a + b x (3.1)، جایی که:

b \u003d.r x، y
Σ y
σ X.
= r x، y
s y
s x.
(3.2),
a \u003d m y - b m x (3.3)

محاسبه شده توسط ضریب فرمول (3.2) ب ضریب رگرسیون خطی نامیده می شود. در برخی منابع آ. به عنوان یک ضریب رگرسیون ثابت و ب بر این اساس، متغیرها.

خطاهای پیش بینی Y در مقدار مشخصی از x توسط فرمول ها محاسبه می شود:

مقدار σ y / x (فرمول 3.4) نیز نامیده می شود میانگین تخریب درجه دوم باقی ماندهاین مراقبت از Y را از خط رگرسیون توصیف شده توسط معادله (3.1)، با مقدار ثابت (مشخص شده) X مشخص می کند.

.
S Y 2 / S X 2 \u003d 0.20538 / 0.66481 \u003d 0.30894. از بین بردن آخرین شماره مربع مربع - ما دریافت می کنیم:
s y / s x \u003d 0.55582

3.3 ضریب B را محاسبه کنید توسط فرمول (3.2)

ب = -0.72028 0.55582 = -0.40035

3.4 ضریب a را محاسبه کنید توسط فرمول (3.3)

آ. = 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 خطای معادله رگرسیون را تعیین کنید.

3.5.1 از بین بردن ریشه S Y 2 مربع ما دریافت می کنیم:

= 0.31437
3.5.4 ما خطای نسبی را در فرمول محاسبه می کنیم (3.5)

Δ y / x \u003d (0.31437 / 30.50000) 100٪ \u003d 1.03073٪

4. ساخت نمودار پراکندگی (میدان همبستگی) و نمودار خط رگرسیون.

نمودار پراکندگی است تصویر گرافیکی جفت های مرتبط (X K، Y K) در قالب نقاط هواپیما، در مختصات مستطیلی با محورهای X و Y. میدان همبستگی یکی از نمایندگی های گرافیکی نمونه مرتبط (جفت) است. در همان سیستم مختصات، برنامه خط رگرسیون نیز ساخته شده است. شما باید به دقت مقیاس را انتخاب کنید و نقاط شروع به محورها را به طوری که نمودار تا حد ممکن روشن است.

4.1. ما حداقل و حداکثر عنصر نمونه گیری x عناصر 18 و 15 را پیدا می کنیم، به ترتیب x min \u003d 22.10000 و x max \u003d 26.60000.

4.2. ما حداقل و حداکثر عنصر نمونه گیری Y، عناصر دوم و 18 را پیدا می کنیم، به ترتیب، y min \u003d 29.40000 و y max \u003d 31.60000.

4.3. در محور Abscissa، نقطه شروع را انتخاب کنید کمی نقطه X 18 \u003d 22.1000، و چنین مقیاس را به طوری که نقطه X 15 \u003d 26.60000 را می توان روی محور قرار داد و نقاط دیگر متمایز می شود.

4.4. در محور دستورالعمل، نقطه شروع را انتخاب می کنیم کمی نقطه ی 2 \u200b\u200b\u003d 29.40000 را ترک کردیم، و چنین مقیاس به طوری که نقطه Y 18 \u003d 31.60000 را می توان در محور قرار داد و نقاط دیگر متمایز می شود.

4.5. در محور Abscissa، ما مقادیر x k را قرار می دهیم، و مقادیر Y K در محور، هماهنگی هستند.

4.6. اعمال (x 1، y 1)، (x 2، y 2)، ...، (x 26، y 26) در هواپیما مختصات. ما نمودار پراکندگی (میدان همبستگی) را در شکل زیر نشان می دهیم.

4.7. خط رگرسیون ویژگی

برای انجام این کار، دو نقطه مختلف را با مختصات (X R1، Y R1) و (X R2، Y R2) معادله رضایت بخش (3.6) پیدا می کنیم، ما آنها را به هواپیما مختصات اعمال می کنیم و به طور مستقیم از طریق آنها صرف می کنیم. به عنوان Abscissa از نقطه اول، ارزش x min \u003d 22.10،000. ما مقدار x min را به معادله (3.6) جایگزین می کنیم، ما سفارش اول را دریافت می کنیم. بنابراین، ما یک نقطه با مختصات (22.10،000، 31.96127) داریم. به طور مشابه، ما مختصات نقطه دوم را به دست می آوریم، قرار دادن x max \u003d 26.60000 به عنوان Abscissa. نقطه دوم خواهد بود: (26.60000، 30.15970).

خط رگرسیون در شکل زیر در قرمز نشان داده شده است

توجه داشته باشید که خط رگرسیون همیشه از طریق مقادیر میانگین مقادیر x و y عبور می کند، I.E. مختصات (m x، m y).

06.06.2018 16 235 0 Igor

روانشناسی و جامعه

همه چیز در جهان ارتباط دارد. هر فرد در سطح شهود در تلاش است تا رابطه بین پدیده ها را پیدا کند تا بتواند آنها را تحت تأثیر قرار دهد و آنها را مدیریت کند. مفهومی که این رابطه را نشان می دهد، همبستگی نامیده می شود. معنی کلمات ساده چیست؟

محتوا:

مفهوم همبستگی

همبستگی (از نسبت لاتین "correlalatio" - نسبت، رابطه) - یک اصطلاح ریاضی، که به معنی اندازه گیری وابستگی احتمالی آماری بین مقادیر تصادفی (متغیرها) است.



مثال: دو نوع اتصال را بگیرید:

  1. اولین - قلم در دست انسان. به چه شیوه ای دست حرکت می کند، به همان شیوه و دسته. اگر دست در حالت استراحت باشد، دسته نمی نویسد. اگر فرد به سختی به او بچسبد، ردیابی بر روی کاغذ غنی خواهد بود. این نوع رابطه نشان دهنده وابستگی شدید است و همبستگی ندارد. این رابطه کاربردی است.
  2. دیدگاه دوم - وابستگی بین سطوح تشکیل انسان و ادبیات خواندن. این در پیشبرد شناخته شده نیست که از مردم بیشتر بخواند: با آموزش عالی یا بدون آن. این رابطه تصادفی یا تصادفی است، علم آماری آن مورد مطالعه قرار گرفته است که تنها با پدیده های توده ای مشغول به کار است. اگر محاسبه آماری شما را به اثبات پیوند همبستگی بین سطح تحصیلات و خواندن ادبیات به اثبات برساند، فرصتی برای پیش بینی پیش بینی رویداد احتمالی فراهم می کند. در این مثال، با احتمال زیادی، ممکن است بگوییم افرادی که دارای آموزش عالی هستند خواندن کتاب های خواندن بیشتر، کسانی که تحصیلات بیشتری دارند. اما از آنجا که اتصال بین این پارامترها عملکردی نیست، ما می توانیم اشتباه کنیم. شما همیشه می توانید احتمال چنین خطایی را محاسبه کنید، که به طور یکنواخت کوچک خواهد بود و سطح آماری معنی دار (P) نامیده می شود.

نمونه هایی از اتصالات بین هر یک پدیده های طبیعی هستند: زنجیره تغذیه در طبیعت، بدن انسان، که شامل سیستم های اندام، ارتباطات و عملکرد به طور کلی است.

هر روز ما با وابستگی همبستگی مواجه هستیم زندگی روزمره: بین آب و هوا و حال خوب، اصطلاحات مناسب اهداف و دستاورد آنها، نگرش مثبت و شانس، احساس خوشبختی و رفاه مالی. اما ما به دنبال ارتباطات هستیم، با تکیه بر محاسبات ریاضی، بلکه در اسطوره ها، شهود، خرافات و خرافات. این پدیده ها بسیار دشوار است برای ترجمه به زبان ریاضی، اکسپرس در اعداد، اندازه گیری. چیز دیگری این است که ما پدیده هایی را که می توانید محاسبه کنید، تجزیه و تحلیل کنید، به صورت اعداد ارسال کنید. در این مورد، ما می توانیم با استفاده از ضریب همبستگی (R) همبستگی را تعیین کنیم، که منعکس کننده قدرت، درجه، تنگی و جهت همبستگی بین متغیرهای تصادفی است.

همبستگی قوی بین مقادیر تصادفی - گواهی حضور برخی از ارتباط آماری به طور خاص بین این پدیده ها، اما این ارتباط را نمی توان به پدیده های مشابه منتقل کرد، اما برای یک وضعیت دیگر. اغلب محققان، با افزایش همبستگی معنی داری بین دو متغیر در محاسبات، بر اساس سادگی تجزیه و تحلیل همبستگی، مفروضات بصری دروغین در مورد وجود روابط علی بین نشانه ها، فراموش می کنند که ضریب همبستگی احتمال احتمالی است.

مثال: تعداد مجروح شده در طول یخ و تعداد حوادث در میان وسایل نقلیه. این مقادیر در میان خود همبستگی خواهد داشت، هرچند که آنها کاملا مرتبط نیستند، اما تنها ارتباط با دلیلی برای این موارد دارند رویدادهای تصادفی - HoliTy اگر تجزیه و تحلیل رابطه همبستگی بین پدیده ها را نشان نداد، این هنوز شواهدی از عدم ارتباط بین آنها نیست، که می تواند یک غیر خطی پیچیده باشد، با استفاده از محاسبات همبستگی شناسایی نشده است.




اولین کسی که مفهوم همبستگی را در گردش علمی معرفی کرد، فرانسوی بود پالنولوژیست Georges Kuwier. در قرن هجدهم، او همبستگی قانون قطعات و اندام های موجودات زنده را به ارمغان آورد، به این معنا که امکان بازگرداندن پایه ای از کل موجودات فسیلی، یک حیوان در قسمت های یافت شده بدن (باقی مانده) است. در آمار، اصطلاح همبستگی ابتدا یک دانشمند انگلیسی را در سال 1886 اعمال کرد فرانسیس گالتون. اما او نمیتواند فرمول دقیق را برای محاسبه ضریب همبستگی حذف کند، اما این کار توسط دانش آموزش انجام شد معروف ترین ریاضیدان و متخصص زیست شناسی کارل پیرسون.

انواع همبستگی

در اهمیت - بسیار ارزشمند، معنی دار و ناچیز.

نمایش

r.

ریسک بالا

r مربوط به سطح آماری معنیداری P است<=0,01

معنی دار

r مربوط به P.<=0,05

ناچیز

r به P\u003e 0.1 نمی رسد

منفی (کاهش ارزش یک متغیر منجر به افزایش سطح دیگر می شود: بیشتر فتنه های انسانی، کمتر احتمال دارد که موقعیت راهنمایی را بپذیرید) و مثبت (اگر رشد یک مقدار مستلزم افزایش سطح آن باشد دیگر: عصبی تر، بیشتر احتمال دارد که بیمار شود). اگر هیچ ارتباطی بین متغیرها وجود نداشته باشد، چنین همبستگی صفر نامیده می شود.

خطی (هنگامی که یک مقدار افزایش یا کاهش می یابد، دوم نیز افزایش یا کاهش می یابد) و غیر خطی (زمانی که، زمانی که یک تغییر در یک مقدار، ماهیت تغییر دوم را نمی توان با استفاده از وابستگی خطی توصیف کرد، سپس سایر قوانین ریاضی اعمال می شود - چندجملهای، هیپربولیک اعتیاد).

توسط قدرت.

عوامل




بسته به کدام مقیاس شامل متغیرهای مورد مطالعه، انواع مختلف ضرایب همبستگی محاسبه می شود:

  1. ضریب همبستگی پیرسون، ضریب همبستگی خطی جفت یا همبستگی نقاط آثار برای متغیرها از مقیاس اندازه گیری و اندازه گیری کمی محاسبه می شود.
  2. ضریب همبستگی رتبه روح یا Kendalla - زمانی که حداقل یکی از مقادیر دارای مقیاس توالی است یا طبیعی نیست.
  3. نقطه ضریب همبستگی نقطه ای (ضریب همبستگی علائم Fechner) اگر یکی از دو مقدار دوگانگی باشد.
  4. ضریب همبستگی چهار فله (ضریب همبستگی چندگانه (همبستگی) - اگر دو متغیر دوجانبه باشند.

ضریب پیرسون به شاخص های همبستگی پارامتری اشاره دارد، همه دیگران - به غیر پارامتری.

ضریب همبستگی ارزش از -1 تا 1/1 است. با همبستگی مثبت کامل، r \u003d +1، با یک منفی کامل - r \u003d -1.

فرمول و محاسبه





مثال ها

لازم است تعیین رابطه دو متغیر: سطح توسعه فکری (بر اساس تست) و تعداد بیابان ها برای ماه (با توجه به سوابق در مجله آموزشی) از دانش آموزان.

داده های اولیه در جدول ارائه شده است:

داده های IQ (x)

داده های مربوط به تعداد بیابان ها (Y)

مجموع

1122

میانگین

112,2


برای فعال کردن تفسیر صحیح شاخص نتیجه، ضریب همبستگی ضریب همبستگی (+ یا -) و مقدار مطلق آن (ماژول) ضروری است.

با توجه به جدول طبقه بندی، ضریب همبستگی نیروی ما نتیجه می گیریم که Rxy \u003d -0.827 یک وابستگی همبستگی منفی قوی است. بنابراین، تعداد دانش آموزان دیرپایی دارای وابستگی بسیار قوی به سطح توسعه فکری خود هستند. می توان گفت که دانش آموزان با سطح بالا IQ کمتر احتمال دارد که از دانش آموزان با IQ کم اشغال کنند.



ضریب همبستگی را می توان به عنوان دانشمندان برای تایید یا رد فرض از وابستگی دو مقدار یا پدیده مورد استفاده قرار داد و قدرت، اهمیت و دانش آموزان را برای مطالعات تجربی و آماری بر روی موضوعات مختلف اندازه گیری کرد. باید به یاد داشته باشید که این شاخص یک ابزار ایده آل نیست، فقط برای اندازه گیری قدرت وابستگی خطی محاسبه می شود و همیشه یک مقدار احتمالی است که یک خطای خاص دارد.

تجزیه و تحلیل همبستگی در زمینه های زیر اعمال می شود:

  • علوم اقتصادی؛
  • فیزیک نجومی؛
  • علوم اجتماعی (جامعه شناسی، روانشناسی، آموزش و پرورش)؛
  • agrochemistry؛
  • مطالعات فلزی؛
  • صنعت (برای کنترل کیفیت)؛
  • هیدروبیولوژی؛
  • بیومتریک و غیره

علل محبوبیت روش تحلیل همبستگی:

  1. سادگی نسبی محاسبه ضرایب همبستگی ضروری نیست آموزش ریاضی خاص.
  2. به شما امکان می دهد رابطه بین مقادیر تصادفی توده ای که به علم آماری مورد استفاده قرار می گیرند محاسبه کنید. در این راستا، این روش در زمینه مطالعات آماری گسترده شده است.

امیدوارم اکنون بتوانید رابطه عملکردی را از همبستگی متمایز کنید و شما می دانید زمانی که شما در تلویزیون می شنوید یا در یک فشار همبستگی خواندید، پس تحت آن به معنای وابستگی مثبت و به اندازه کافی قابل توجه بین دو پدیده است.

در آمار ضریب همبستگی (انگلیسی ضریب همبستگی.) مورد استفاده برای آزمون فرضیه در مورد وجود رابطه بین دو مقادیر تصادفی، و همچنین به ما اجازه می دهد تا قدرت خود را ارزیابی کنیم. در یک نظریه نمونه کارها، این شاخص معمولا برای تعیین ماهیت و نیروی وابستگی بین سودآوری امنیت (دارایی) و عملکرد نمونه کارها استفاده می شود. اگر توزیع این متغیرها طبیعی یا نزدیک به حالت عادی باشد، باید از آن استفاده کنید ضریب همبستگی پیرسونکه توسط فرمول زیر محاسبه می شود:

انحراف معیار سودآوری سهام شرکت A 0.6398 خواهد بود، سهام شرکت B 0.5241 و نمونه کارها 0.5668. ( چگونه می توان انحراف استاندارد را محاسبه کرد)

ضریب همبستگی سودآوری شرکت A و سودآوری نمونه کارها -0.864 و سهام شرکت B 0.816 خواهد بود.

r a \u003d -0.313 / (0،6389 * 0،5668) \u003d -0،864

r b \u003d 0.242 / (0،5241 * 0،5668) \u003d 0،816

این می تواند در مورد وجود رابطه نسبتا قوی بین عملکرد نمونه کارها و سودآوری شرکت شرکت A و شرکت B نتیجه گیری شود. در عین حال، سودآوری سهام شرکت یک جنبش چند جانبه را با عملکرد نمونه کارها نشان می دهد و سودآوری سهام شرکت B حرکت یک طرفه.

با دوستان خود به اشتراک بگذارید یا خودتان را ذخیره کنید:

بارگذاری...