ضریب همبستگی برابر با 1 به معنای. نحوه محاسبه ضریب همبستگی خطی

تجزیه و تحلیل رگرسیون به شما امکان می دهد ارزیابی کنید که چگونه یک متغیر به متغیر دیگر بستگی دارد و میزان گسترش مقادیر متغیر وابسته در اطراف خط مستقیمی که رابطه را تعریف می کند چقدر است. این تخمین ها و فواصل اطمینان مربوطه امکان پیش بینی مقدار متغیر وابسته و تعیین صحت این پیش بینی را فراهم می کند.

نتایج تجزیه و تحلیل رگرسیونرا می توان تنها به صورت دیجیتالی یا گرافیکی نسبتاً پیچیده نشان داد. با این حال، ما اغلب علاقه مندیم که ارزش یک متغیر را از مقدار متغیر دیگر پیش بینی نکنیم، بلکه صرفاً به مشخص کردن تنگی (استحکام) رابطه بین آنها، در حالی که به صورت یک عدد بیان می شود، علاقه مندیم.

این مشخصه ضریب همبستگی نامیده می شود، معمولاً با حرف r نشان داده می شود. ضریب همبستگی می تواند باشد.

می تواند مقادیری از -1 تا +1 بگیرد. علامت ضریب همبستگی جهت اتصال (مستقیم یا معکوس) و قدر مطلق نزدیک بودن اتصال را نشان می دهد. ضریب برابر با 1- همان اتصال صلب را برابر با 1 تعیین می کند. در صورت عدم وجود اتصال، ضریب همبستگی صفر است.

روی انجیر 8.10 نمونه هایی از وابستگی ها و مقادیر مربوط به r آنها را نشان می دهد. ما دو ضریب همبستگی را در نظر خواهیم گرفت.

ضریب همبستگی پیرسون برای توصیف در نظر گرفته شده است اتصال خطیعلائم کمی؛ مانند رگرسیون
تجزیه و تحلیل یونی، نیاز به توزیع نرمال دارد. وقتی مردم فقط در مورد "ضریب همبستگی" صحبت می کنند تقریباً همیشه منظورشان ضریب همبستگی پیرسون است، و این دقیقاً همان کاری است که ما انجام خواهیم داد.

ضریب همبستگی رتبه اسپیرمن را می توان زمانی که رابطه غیر خطی است - و نه تنها برای کمی، بلکه برای ویژگی های ترتیبی - استفاده کرد. این یک روش ناپارامتریک است و به نوع خاصی از توزیع نیاز ندارد.

ما قبلاً در مورد ویژگی های کمی، کیفی و ترتیبی در فصل صحبت کرده ایم. 5. نشانه های کمی داده های عددی معمولی هستند، مانند قد، وزن، دما. مقادیر یک صفت کمی را می توان با یکدیگر مقایسه کرد و گفت که کدام یک از آنها، به میزان و چند برابر بیشتر است. به عنوان مثال، اگر وزن یکی از مریخی ها 15 گرم و دیگری 10 گرم باشد، اولین بار از دومی و یک و نیم بار و 5 گرم چند بار سنگین تر است. در پزشکی، علائم ترتیبی بسیار رایج است. به عنوان مثال، نتایج آزمایش پاپ واژینال در مقیاس زیر ارزیابی می شود: 1) طبیعی، 2) دیسپلازی خفیف، 3) دیسپلازی متوسط، 4) دیسپلازی شدید، 5) سرطان در محل. هر دو علائم کمی و ترتیبی را می توان به ترتیب ترتیب داد - در این مورد اموال عمومیبر اساس گروه بزرگی از معیارهای ناپارامتریک که شامل ضریب همبستگی رتبه اسپیرمن است. در فصل با معیارهای ناپارامتریک دیگر آشنا می شویم. 10.

ضریب همبستگی پیرسون

و با این حال، چرا نمی توان از تحلیل رگرسیون برای توصیف تنگی رابطه استفاده کرد؟ انحراف استاندارد باقیمانده می تواند به عنوان معیاری برای نزدیکی رابطه استفاده شود. با این حال، اگر متغیرهای وابسته و مستقل را مبادله کنید، انحراف استاندارد باقیمانده، مانند سایر شاخص‌های تحلیل رگرسیون، متفاوت خواهد بود.

بیایید به انجیر نگاه کنیم. 8.11. بر اساس یک نمونه از 10 مریخی شناخته شده برای ما، دو خط رگرسیون ساخته شد. در یک مورد وزن متغیر وابسته و در حالت دوم متغیر مستقل است. خطوط رگرسیون به طور قابل توجهی متفاوت است



20

اگر x و y را مبادله کنید، معادله رگرسیون متفاوت خواهد بود، اما ضریب همبستگی ثابت می ماند.

امید. معلوم می شود که رابطه قد با وزن یکی است و وزن با قد رابطه دیگر. عدم تقارن تحلیل رگرسیون چیزی است که مانع از استفاده مستقیم آن برای مشخص کردن قدرت یک رابطه می شود. ضریب همبستگی، اگرچه ایده آن از تحلیل رگرسیون نشات می‌گیرد، اما عاری از این نقص است. ما فرمول را ارائه می دهیم.

rY(X - X) (Y - Y)

&((- X) S(y - Y)2"

که در آن X و Y مقادیر متوسط ​​متغیرهای X و Y هستند. عبارت r "متقارن" است - با تعویض X و Y، مقدار یکسانی را دریافت می کنیم. ضریب همبستگی مقادیری از -1 تا +1 می گیرد. هر چه این رابطه نزدیکتر باشد، مقدار مطلق ضریب همبستگی بیشتر است. علامت جهت اتصال را نشان می دهد. برای r > 0، ما از یک همبستگی مستقیم صحبت می کنیم (با افزایش یک متغیر، متغیر دیگر نیز افزایش می یابد)، برای r مثالی را با 10 مریخ می زنیم، که قبلاً از نقطه نظر تحلیل رگرسیون در نظر گرفته ایم. بیایید ضریب همبستگی را محاسبه کنیم. داده های اولیه و نتایج میانی محاسبات در جدول آورده شده است. 8.3. اندازه نمونه n = 10، ارتفاع متوسط

X = £ X/n = 369/10 = 36.9 و وزن Y = £ Y/n = 103.8/10 = 10.38.

ما Shch-X)(Y-Y) = 99.9، Shch-X)2 = 224.8، £(Y - Y)2 = 51.9 پیدا می کنیم.

بیایید مقادیر به دست آمده را با فرمول ضریب همبستگی جایگزین کنیم:

224.8 x 51.9 اینچ

مقدار r نزدیک به 1 است که نشان دهنده رابطه نزدیک بین قد و وزن است. برای درک بهتر اینکه کدام ضریب همبستگی را باید بزرگ و کدام را ناچیز در نظر گرفت، نگاهی به

جدول 8.3. محاسبه ضریب همبستگی
ایکس Y X-X Y-Y (X-X) (Y-Y) (X-X)2 (Y-Y) 2
31 7,8 -5,9 -2,6 15,3 34,8 6,8
32 8,3 -4,9 -2,1 10,3 24,0 4,4
33 7,6 -3,9 -2,8 10,9 15,2 7,8
34 9,1 -2,9 -1,3 3,8 8,4 1,7
35 9,6 -1,9 -0,8 1,5 3,6 0,6
35 9,8 -1,9 -0,6 1,1 3,6 0,4
40 11,8 3,1 1,4 4,3 9,6 2,0
41 12,1 4,1 1,7 7,0 16,8 2,9
42 14,7 5,1 4,3 22,0 26,0 18,5
46 13,0 9,1 2,6 23,7 82,8 6,8
369 103,8 0,0 0,2 99,9 224,8 51,9


کسانی که روی میز هستند 8.4 - ضرایب همبستگی را برای مثال هایی که قبلا تحلیل کردیم را نشان می دهد.

رابطه بین رگرسیون و همبستگی

ما در ابتدا از تمام نمونه های ضرایب همبستگی (جدول 8.4) برای ساخت خطوط رگرسیون استفاده کردیم. در واقع، رابطه نزدیکی بین ضریب همبستگی و پارامترهای تحلیل رگرسیون وجود دارد که اکنون نشان خواهیم داد. روش های مختلف ارائه ضریب همبستگی، که در این مورد به دست می آوریم، به ما امکان می دهد معنای این شاخص را بهتر درک کنیم.

به یاد داشته باشید که معادله رگرسیون به گونه ای ساخته شده است که مجموع انحرافات مجذور از خط رگرسیون را به حداقل برساند.


این حداقل مجموع مربع ها را با S نشان می دهیم (به این مقدار مجموع مربعات باقیمانده می گویند). مجموع مجذور انحرافات مقادیر متغیر وابسته Y از میانگین Y با S^ نشان داده می شود. سپس:

مقدار r2 ضریب تعیین نامیده می شود - این به سادگی مجذور ضریب همبستگی است. ضریب تعیین قدرت اتصال را نشان می دهد، اما جهت آن را نشان نمی دهد.

از فرمول بالا می توان دریافت که اگر مقادیر متغیر وابسته روی رگرسیون مستقیم قرار داشته باشد، S = 0، و بنابراین r = +1 یا r = -1، یعنی یک رابطه خطی بین متغیر وابسته و مستقل هر مقدار از متغیر مستقل می تواند به طور دقیق مقدار متغیر وابسته را پیش بینی کند. برعکس، اگر متغیرها اصلاً مرتبط نباشند، Soci = SofSisi سپس r = 0.

همچنین می توان دید که ضریب تعیین برابر با آن سهم از کل واریانس S^ است که توسط رگرسیون خطی ایجاد می شود یا به قول خودشان توضیح داده می شود.

مجموع باقیمانده مربعات S به واریانس باقیمانده s2y\x با رابطه Socj = (n - 2) s^ و مجموع مجموع مربعات S^ به واریانس s2 با رابطه S^ = (n - 1) مرتبط است. )s2. در این مورد

r2 = 1 _ n _ 2 sy\x n _1 sy

این فرمول قضاوت در مورد وابستگی ضریب همبستگی به سهم واریانس باقیمانده در واریانس کل را ممکن می سازد.

six/s2y هر چه این نسبت کوچکتر باشد، ضریب همبستگی (در مقدار مطلق) بیشتر است و بالعکس.

دیدیم که ضریب همبستگی منعکس کننده تنگی رابطه خطی متغیرها است. با این حال، وقتی نوبت به پیش‌بینی مقدار یک متغیر از مقدار متغیر دیگر می‌رسد،
ضریب همبستگی نباید بیش از حد مورد اعتماد قرار گیرد. به عنوان مثال، داده های شکل. 8.7 مربوط به ضریب همبستگی بسیار بالایی است (r = 0.92)، اما عرض منطقه اطمینان نشان می دهد که عدم قطعیت پیش بینی کاملاً قابل توجه است. بنابراین، حتی با یک ضریب همبستگی زیاد، مطمئن شوید که محدوده اطمینان را محاسبه کنید.


و در پایان نسبت ضریب همبستگی و ضریب شیب رگرسیون مستقیم b را می‌دهیم:

جایی که b شیب خط رگرسیون است، sx و sY انحراف معیار متغیرها هستند.

اگر حالت sx = 0 را در نظر نگیریم، ضریب همبستگی برابر با صفر است اگر و فقط اگر b = 0 باشد. اکنون از این واقعیت برای تخمین معناداری آماری همبستگی استفاده خواهیم کرد.

معنی داری آماری همبستگی

از آنجایی که b = 0 دلالت بر r = 0 دارد، فرضیه عدم همبستگی معادل با فرضیه شیب صفر رگرسیون مستقیم است. بنابراین، برای ارزیابی معنی‌داری آماری همبستگی، می‌توانیم از فرمولی که قبلاً برای ارزیابی اهمیت آماری تفاوت بین b و صفر شناخته شده است استفاده کنیم:

در اینجا تعداد درجات آزادی v = n - 2 است. با این حال، اگر ضریب همبستگی قبلا محاسبه شده باشد، استفاده از فرمول راحت تر است:

تعداد درجات آزادی در اینجا نیز v = n - 2 است.

با عدم تشابه ظاهری دو فرمول برای t، آنها یکسان هستند. راستی از چی


r 2 _ 1 - n_ 2 Sy]x_

جایگزینی مقدار sy^x در فرمول خطای استاندارد

چربی حیوانی و سرطان سینه

در آزمایشات روی حیوانات آزمایشگاهی نشان داده شده است که محتوای بالای چربی حیوانی در رژیم غذایی خطر ابتلا به سرطان سینه را افزایش می دهد. آیا این وابستگی در انسان مشاهده می شود؟ K. Carroll داده هایی را در مورد مصرف چربی های حیوانی و مرگ و میر ناشی از سرطان سینه در 39 کشور جمع آوری کرد. نتیجه در شکل نشان داده شده است. 8.12A. ضریب همبستگی بین مصرف چربی های حیوانی و مرگ و میر ناشی از سرطان سینه 90/0 به دست آمد. اجازه دهید اهمیت آماری همبستگی را تخمین بزنیم.

0,90 1 - 0,902 39 - 2

مقدار بحرانی t برای تعداد درجات آزادی v = 39 - 2 = 37 برابر با 3.574 است که کمتر از مقدار به دست آمده توسط ما است. بنابراین در سطح معنی داری 001/0 می توان استدلال کرد که بین مصرف چربی حیوانی و مرگ و میر ناشی از سرطان سینه همبستگی وجود دارد.

حال بیایید بررسی کنیم که آیا مرگ و میر با مصرف چربی های گیاهی مرتبط است؟ داده های مربوطه در شکل نشان داده شده است. 8.12B. ضریب همبستگی 0.15 است. سپس

1 - 0,152 39 - 2

حتی در سطح معنی داری 0.10، مقدار محاسبه شده t کمتر از مقدار بحرانی است. همبستگی از نظر آماری معنی دار نیست.

ضریب همبستگی میزان ارتباط بین دو متغیر است. محاسبه آن ایده ای از وجود رابطه بین دو مجموعه داده را می دهد. بر خلاف رگرسیون، همبستگی اجازه پیش بینی مقادیر را نمی دهد. با این حال، محاسبه ضریب یک مرحله مهم در مقدماتی است تحلیل آماری. به عنوان مثال، ما دریافتیم که ضریب همبستگی بین سطح سرمایه گذاری مستقیم خارجی و رشد تولید ناخالص داخلی بالا است. این به ما این ایده را می دهد که برای اطمینان از رونق، لازم است فضای مساعدی به طور خاص برای کارآفرینان خارجی ایجاد شود. نتیجه گیری نه چندان واضح در نگاه اول!

همبستگی و علیت

شاید حتی یک حوزه آماری وجود نداشته باشد که اینقدر محکم در زندگی ما تثبیت شود. ضریب همبستگی در همه حوزه های دانش عمومی استفاده می شود. خطر اصلی آن در این واقعیت نهفته است که اغلب ارزش های بالای آن به منظور متقاعد کردن مردم و باور آنها به برخی نتیجه گیری ها حدس زده می شود. با این حال، در واقع، یک همبستگی قوی به هیچ وجه نشان دهنده رابطه علی بین کمیت ها نیست.

ضریب همبستگی: فرمول پیرسون و اسپیرمن

چندین شاخص اصلی وجود دارد که رابطه بین دو متغیر را مشخص می کند. از نظر تاریخی، اولین ضریب همبستگی خطی پیرسون است. در مدرسه تصویب می شود. این توسط K. Pearson و J. Yule بر اساس کار Fr. گالتون. این نسبت به شما اجازه می دهد تا رابطه بین اعداد گویاکه به طور عقلانی تغییر می کنند. همیشه بزرگتر از 1- و کمتر از 1 است. عدد منفی نشان دهنده رابطه معکوس نسبت است. اگر ضریب صفر باشد، هیچ رابطه ای بین متغیرها وجود ندارد. کلاغ سیاه عدد مثبت- به طور مستقیم انجام می شود وابستگی متناسببین مقادیر مورد مطالعه ضریب همبستگی رتبه اسپیرمن با ایجاد سلسله مراتبی از مقادیر متغیر، محاسبات را ساده می کند.

روابط بین متغیرها

همبستگی به پاسخ به دو سوال کمک می کند. اول اینکه رابطه بین متغیرها مثبت است یا منفی. دوم اینکه اعتیاد چقدر قوی است. تجزیه و تحلیل همبستگی ابزار قدرتمندی برای به دست آوردن این اطلاعات مهم است. به راحتی می توان دریافت که درآمدها و هزینه های خانوار به طور متناسب افزایش و کاهش می یابد. چنین رابطه ای مثبت تلقی می شود. برعکس، زمانی که قیمت یک محصول افزایش می یابد، تقاضا برای آن کاهش می یابد. به چنین رابطه ای منفی می گویند. مقادیر ضریب همبستگی بین -1 و 1 است. صفر به این معنی است که بین مقادیر مورد مطالعه رابطه وجود ندارد. هر چه شاخص به مقادیر شدید نزدیکتر باشد، رابطه قوی تر (منفی یا مثبت) است. عدم وابستگی با ضریب 0.1- تا 0.1 مشهود است. باید درک کرد که چنین مقداری فقط نشان دهنده عدم وجود رابطه خطی است.

ویژگی های برنامه

استفاده از هر دو شاخص منوط به مفروضات خاصی است. اول، وجود یک رابطه قوی این واقعیت را تعیین نمی کند که یک ارزش دیگری را تعیین می کند. ممکن است کمیت سومی وجود داشته باشد که هر یک از آنها را تعریف کند. ثانیاً ضریب همبستگی پیرسون بالا نشان دهنده رابطه علی بین متغیرهای مورد مطالعه نیست. ثالثاً یک رابطه منحصراً خطی را نشان می دهد. از همبستگی می توان برای ارزیابی داده های کمی معنی دار استفاده کرد (به عنوان مثال، فشار جو، دمای هوا)، و نه دسته بندی هایی مانند جنسیت یا رنگ مورد علاقه.

ضریب همبستگی چندگانه

پیرسون و اسپیرمن رابطه بین دو متغیر را بررسی کردند. اما اگر سه یا حتی بیشتر از آنها وجود داشته باشد چه باید کرد. اینجاست که ضریب همبستگی چندگانه وارد می شود. به عنوان مثال، تولید ناخالص ملی نه تنها تحت تأثیر سرمایه گذاری مستقیم خارجی، بلکه تحت تأثیر سیاست های پولی و مالی دولت و همچنین سطح صادرات قرار می گیرد. نرخ رشد و حجم تولید ناخالص داخلی نتیجه تعامل تعدادی از عوامل است. با این حال، باید درک کرد که مدل همبستگی چندگانه مبتنی بر تعدادی ساده‌سازی و مفروضات است. اول، چند خطی بودن بین کمیت ها حذف می شود. دوم، رابطه بین متغیر وابسته و متغیرهایی که بر آن تأثیر می گذارند، خطی فرض می شود.

زمینه های استفاده از تحلیل همبستگی و رگرسیون

این روش برای یافتن رابطه بین کمیت ها به طور گسترده در آمار استفاده می شود. اغلب در سه مورد اصلی به آن متوسل می شود:

  1. برای آزمایش روابط علی بین مقادیر دو متغیر. در نتیجه، محقق امیدوار است که یک رابطه خطی پیدا کند و فرمولی را استخراج کند که این روابط بین کمیت ها را توصیف کند. واحدهای اندازه گیری آنها ممکن است متفاوت باشد.
  2. برای بررسی رابطه بین مقادیر. در این مورد، هیچ کس تعیین نمی کند که کدام متغیر وابسته است. ممکن است معلوم شود که مقدار هر دو کمیت عامل دیگری را تعیین می کند.
  3. برای استخراج یک معادله در این حالت می توانید به سادگی اعداد را جایگزین آن کنید و مقادیر متغیر مجهول را پیدا کنید.

مردی که در جستجوی رابطه علت و معلولی است

هشیاری به گونه ای تنظیم شده است که ما قطعاً نیاز به توضیح رویدادهایی داریم که در اطراف اتفاق می افتد. انسان همیشه به دنبال ارتباطی بین تصویر دنیایی که در آن زندگی می کند و اطلاعاتی که دریافت می کند است. اغلب مغز از هرج و مرج نظم ایجاد می کند. او به راحتی می تواند یک رابطه علّی را در جایی که وجود ندارد ببیند. دانشمندان باید به طور خاص یاد بگیرند که بر این روند غلبه کنند. توانایی ارزیابی روابط بین داده ها به طور عینی در یک حرفه دانشگاهی ضروری است.

تعصب رسانه ای

در نظر بگیرید که چگونه وجود یک همبستگی می تواند به اشتباه تفسیر شود. گروه دانشجویان بریتانیاییاز کودکان با رفتار بد پرسیده شد که آیا والدین آنها سیگار می کشند یا خیر. سپس آزمون در روزنامه چاپ شد. نتایج نشان داد که بین مصرف سیگار والدین و بزهکاری فرزندانشان همبستگی قوی وجود دارد. پروفسوری که این مطالعه را انجام داد حتی پیشنهاد کرد که در این مورد هشداری روی پاکت سیگار بگذارند. با این حال، تعدادی از مشکلات در این نتیجه وجود دارد. اولاً، همبستگی نشان نمی‌دهد که کدام یک از کمیت‌ها مستقل است. بنابراین، کاملاً می توان فرض کرد که عادت زیانبار والدین ناشی از نافرمانی فرزندان است. ثانیاً نمی توان با قاطعیت گفت که هر دو مشکل به دلیل عامل سومی به وجود نیامده اند. مثلا خانواده های کم درآمد. باید به جنبه عاطفی نتیجه گیری اولیه استادی که مطالعه را انجام داد توجه داشت. او از مخالفان سرسخت سیگار بود. بنابراین جای تعجب نیست که او نتایج مطالعه خود را این گونه تفسیر کرده است.

نتیجه گیری

تعبیر نادرست همبستگی به عنوان رابطه علی بین دو متغیر می تواند منجر به خطاهای تحقیقاتی شرم آور شود. مشکل این است که در هسته آگاهی انسان نهفته است. بسیاری از ترفندهای بازاریابی مبتنی بر این ویژگی است. درک تفاوت بین علیت و همبستگی به شما امکان می دهد تا اطلاعات را به صورت منطقی تجزیه و تحلیل کنید زندگی روزمرهو همچنین در مشاغل حرفه ای.

ضریب همبستگیمقداری است که می تواند از 1+ تا 1- متغیر باشد. در صورت همبستگی مثبت کامل، این ضریب برابر با 1 است (می گویند با افزایش مقدار یک متغیر، مقدار متغیر دیگر افزایش می یابد) و با یک همبستگی منفی کامل - منهای 1 (بازخورد را نشان می دهد. یعنی با افزایش مقادیر یک متغیر، مقادیر متغیر دیگر کاهش می یابد).

مثال 1:

نمودار وابستگی کمرویی و افسردگی. همانطور که می بینید، نقطه ها (موضوعات) به طور تصادفی قرار نمی گیرند، بلکه در یک خط قرار می گیرند و با نگاهی به این خط می توان گفت که هر چه خجالتی بودن در فرد بیشتر باشد، افسردگی یعنی این پدیده ها بیشتر می شود. به هم مرتبط هستند.

مثال 2: نمودار برای کمرویی و جامعه پذیری. می بینیم که با افزایش خجالتی بودن، جامعه پذیری کاهش می یابد. ضریب همبستگی آنها 0.43- است. بنابراین، ضریب همبستگی بزرگتر از 0 به 1 نشان دهنده یک رابطه مستقیم است (هر چه بیشتر ... بیشتر ...) و ضریب همبستگی از 1- تا 0 نشان دهنده یک رابطه معکوس متناسب است (هر چه بیشتر ... کمتر. ..)

اگر ضریب همبستگی صفر باشد، هر دو متغیر کاملاً مستقل از یکدیگر هستند.

همبستگی- این رابطه ای است که در آن تأثیر عوامل فردی تنها به عنوان یک روند (به طور متوسط) با مشاهده انبوه داده های واقعی ظاهر می شود. نمونه هایی از وابستگی همبستگی می تواند وابستگی بین اندازه دارایی های بانک و میزان سود بانک، رشد بهره وری نیروی کار و طول خدمت کارکنان باشد.

دو سیستم طبقه بندی همبستگی ها بر اساس قدرت آنها استفاده می شود: عمومی و خاص.

طبقه بندی کلی همبستگی ها: 1) قوی، یا نزدیک با ضریب همبستگی r> 0.70؛ 2) متوسط ​​در 0.500.70، و نه فقط یک همبستگی سطح بالااهمیت

در جدول زیر نام ضرایب همبستگی برای انواع مختلف مقیاس ها آمده است.

مقیاس دوگانه (1/0) مقیاس رتبه ای (ترتیبی).
مقیاس دوگانه (1/0) ضریب ارتباط پیرسون، ضریب صرف چهار سلولی پیرسون. همبستگی دو سریال
مقیاس رتبه ای (ترتیبی). همبستگی رتبه-دوسری. ضریب همبستگی رتبه اسپیرمن یا کندال.
مقیاس فاصله و مطلق همبستگی دو سریال مقادیر مقیاس فاصله به رتبه تبدیل شده و از ضریب رتبه استفاده می شود ضریب همبستگی پیرسون (ضریب همبستگی خطی)

در r=0 همبستگی خطی وجود ندارد در این حالت میانگین گروهی متغیرها با میانگین کلی آنها منطبق است و خطوط رگرسیون موازی با محورهای مختصات هستند.

برابری r=0 فقط از عدم وجود وابستگی همبستگی خطی (متغیرهای همبسته) صحبت می کند، اما نه به طور کلی در مورد عدم وجود یک همبستگی، و حتی بیشتر از آن، یک وابستگی آماری.

گاهی اوقات نتیجه گیری که همبستگی وجود ندارد مهمتر از وجود یک همبستگی قوی است. همبستگی صفر بین دو متغیر ممکن است نشان دهد که هیچ تأثیری از یک متغیر بر دیگری وجود ندارد، مشروط بر اینکه به نتایج اندازه‌گیری‌ها اعتماد کنیم.

در SPSS: 11.3.2 ضرایب همبستگی

تا به حال، ما فقط به حقیقت وجود رابطه آماری بین دو ویژگی پی برده ایم. در ادامه سعی خواهیم کرد دریابیم که چه نتایجی در مورد قوت یا ضعف این وابستگی و همچنین در مورد شکل و جهت آن می توان گرفت. معیارهای کمی کردن رابطه بین متغیرها ضرایب همبستگی یا معیارهای ارتباط نامیده می شوند. اگر یک رابطه مستقیم و یک طرفه بین آنها وجود داشته باشد، دو متغیر دارای همبستگی مثبت هستند. در یک رابطه یک طرفه، مقادیر کوچک یک متغیر با مقادیر کوچک متغیر دیگر مطابقت دارد، مقادیر بزرگ مربوط به مقادیر بزرگ است. دو متغیر در صورتی که رابطه معکوس بین آنها وجود داشته باشد همبستگی منفی دارند. با یک رابطه چند جهته، مقادیر کوچک یک متغیر با مقادیر بزرگ متغیر دیگر مطابقت دارد و بالعکس. مقادیر ضرایب همبستگی همیشه در محدوده 1- تا 1+ است.

ضریب اسپیرمن به عنوان ضریب همبستگی بین متغیرهای متعلق به مقیاس ترتیبی و ضریب همبستگی پیرسون (محصولات) برای متغیرهای متعلق به مقیاس فاصله ای استفاده می شود. در این مورد باید توجه داشت که هر متغیر دوگانه، یعنی متغیری متعلق به مقیاس اسمی و دارای دو دسته، می تواند ترتیبی در نظر گرفته شود.

ابتدا بررسی خواهیم کرد که آیا بین متغیرهای جنسیت و روان از فایل studium.sav همبستگی وجود دارد یا خیر. در انجام این کار، ما در نظر می گیریم که متغیر دوگانه جنس را می توان یک متغیر ترتیبی در نظر گرفت. موارد زیر را انجام دهید:

از منوی فرمان آنالیز (تجزیه و تحلیل) آمار توصیفی (آمار توصیفی) Crosstabs... (جدول اقتضایی) را انتخاب کنید.

· متغیر جنسیت را به لیستی از ردیف ها و متغیر روانی را به لیستی از ستون ها منتقل کنید.

· روی دکمه Statistics... کلیک کنید. در گفتگوی Crosstabs: Statistics، کادر Correlations را علامت بزنید. انتخاب خود را با دکمه Continue تایید کنید.

· در گفتگوی Crosstabs، با علامت زدن چک باکس Supress tables، نمایش جداول را متوقف کنید. روی دکمه OK کلیک کنید.

ضرایب همبستگی اسپیرمن و پیرسون محاسبه خواهد شد و اهمیت آنها مورد آزمایش قرار خواهد گرفت:

/ SPSS 10

کار شماره 10 تجزیه و تحلیل همبستگی

مفهوم همبستگی

همبستگی یا ضریب همبستگی یک شاخص آماری است احتمالیروابط بین دو متغیر در مقیاس های کمی اندازه گیری می شود. برخلاف اتصال تابعی که در آن هر مقدار یک متغیر مربوط به به شدت تعریف شده استمقدار متغیر دیگر، ارتباط احتمالیبا این واقعیت مشخص می شود که هر مقدار یک متغیر با آن مطابقت دارد مجموعه ای از ارزش هامتغیر دیگر، مثالی از یک رابطه احتمالی، رابطه بین قد و وزن افراد است. واضح است که افراد با وزن های مختلف می توانند قد یکسانی داشته باشند و بالعکس.

همبستگی مقداری بین -1 و +1 است و با حرف r نشان داده می شود. علاوه بر این، اگر مقدار به 1 نزدیکتر باشد، این به معنای وجود یک اتصال قوی است و اگر نزدیکتر به 0 باشد، یک اتصال ضعیف است. مقدار همبستگی کمتر از 0.2 به عنوان همبستگی ضعیف، بیش از 0.5 - بالا در نظر گرفته می شود. اگر ضریب همبستگی منفی باشد، به این معنی است که یک رابطه معکوس وجود دارد: هر چه مقدار یک متغیر بیشتر باشد، مقدار متغیر دیگر کمتر است.

بسته به مقادیر پذیرفته شده ضریب r، انواع مختلفی از همبستگی قابل تشخیص است:

همبستگی مثبت قویبا مقدار r=1 تعیین می شود. اصطلاح "سخت" به این معنی است که مقدار یک متغیر به طور منحصر به فرد توسط مقادیر متغیر دیگر تعیین می شود و اصطلاح " مثبت" -که با افزایش مقادیر یک متغیر ارزشمتغیر دیگر نیز افزایش می یابد.

همبستگی قوی است انتزاع ریاضیو تقریباً هرگز در مطالعات واقعی یافت نشد.

همبستگی مثبتبا مقادیر 0 مطابقت دارد

عدم همبستگیبا مقدار r=0 تعیین می شود. ضریب همبستگی صفر نشان می دهد که مقادیر متغیرها به هیچ وجه با یکدیگر مرتبط نیستند.

عدم همبستگی اچ o : 0 r xy =0 به عنوان یک بازتاب فرموله شده است خالیفرضیه ها در تحلیل همبستگی

همبستگی منفی: -1

همبستگی منفی قویبا مقدار r= -1 تعیین می شود. مانند یک همبستگی مثبت شدید، انتزاعی است و در تحقیقات عملی بیان نمی شود.

میز 1

انواع همبستگی و تعاریف آنها

روش محاسبه ضریب همبستگی بستگی به نوع مقیاسی دارد که مقادیر متغیر در آن اندازه گیری می شود.

ضریب همبستگی rپیرسوناصلی است و می تواند برای متغیرهایی با مقیاس های فاصله ای اسمی و جزئی مرتب شده استفاده شود، توزیع مقادیر بر روی آنها با نرمال (همبستگی لحظه های محصول) مطابقت دارد. ضریب همبستگی پیرسون نتایج نسبتاً دقیقی را در موارد توزیع غیرعادی نیز ارائه می دهد.

برای توزیع هایی که نرمال نیستند، ترجیحاً از ضرایب همبستگی رتبه اسپیرمن و کندال استفاده شود. آنها رتبه بندی می شوند زیرا برنامه متغیرهای همبسته را از قبل رتبه بندی می کند.

برنامه SPSS همبستگی r-Spearman را به صورت زیر محاسبه می کند: ابتدا متغیرها به رتبه تبدیل می شوند و سپس فرمول پیرسون برای رتبه ها اعمال می شود.

همبستگی پیشنهاد شده توسط M. Kendall بر این ایده است که جهت ارتباط را می توان با مقایسه موضوعات به صورت جفت قضاوت کرد. اگر برای یک جفت آزمودنی، تغییر در X در جهت با تغییر در Y منطبق باشد، این نشان دهنده یک رابطه مثبت است. اگر مطابقت ندارد، در مورد یک رابطه منفی است. این ضریب عمدتاً توسط روانشناسانی که با نمونه های کوچک کار می کنند استفاده می شود. از آنجایی که جامعه‌شناسان با آرایه‌های داده‌ای بزرگ کار می‌کنند، مرتب‌سازی از طریق جفت‌ها، شناسایی تفاوت در بسامدهای نسبی و وارونگی همه جفت‌های موضوع در نمونه دشوار است. رایج ترین ضریب است. پیرسون.

از آنجایی که ضریب همبستگی rPearson اصلی است و می توان از آن (با مقداری خطا بسته به نوع مقیاس و میزان ناهنجاری در توزیع) برای همه متغیرهای اندازه گیری شده در مقیاس های کمی استفاده کرد، نمونه هایی از کاربرد آن را در نظر می گیریم و با هم مقایسه می کنیم. نتایج به دست آمده با نتایج اندازه گیری با استفاده از سایر ضرایب همبستگی.

فرمول محاسبه ضریب r- پیرسون:

r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙

کجا: Xi، Yi- مقادیر دو متغیر؛

Xav، Yav - مقادیر متوسط ​​دو متغیر؛

σ x، σ y انحرافات استاندارد هستند،

N تعداد مشاهدات است.

همبستگی های زوجی

به عنوان مثال، ما می خواهیم دریابیم که چگونه پاسخ های بین انواع مختلفارزش های سنتی در ایده های دانش آموزان در مورد محل کار ایده آل (متغیرهای: a9.1، a9.3، a9.5، a9.7)، و سپس در مورد نسبت ارزش های لیبرال (a9.2، a9) .4. a9.6، a9. 8). این متغیرها در مقیاس های مرتب شده 5 ترم اندازه گیری می شوند.

ما از روش استفاده می کنیم: "تحلیل"،  "همبستگی ها"،  "جفت شده". به طور پیش فرض، ضریب پیرسون در کادر محاوره ای تنظیم شده است. از ضریب استفاده می کنیم پیرسون

متغیرهای آزمایش شده به پنجره انتخاب منتقل می شوند: a9.1، a9.3، a9.5، a9.7

با فشار دادن OK، محاسبه را دریافت می کنیم:

همبستگی ها

a9.1.t. داشتن زمان کافی برای زندگی خانوادگی و شخصی چقدر مهم است؟

همبستگی پیرسون

ارزش (دو طرفه)

a9.3.t. چقدر مهم است که از از دست دادن شغل خود نترسید؟

همبستگی پیرسون

ارزش (دو طرفه)

a9.5.t. داشتن چنین رئیسی که هنگام تصمیم گیری این یا آن تصمیم با شما مشورت کند چقدر مهم است؟

همبستگی پیرسون

ارزش (دو طرفه)

a9.7.t. چقدر مهم است که در یک تیم هماهنگ کار کنید و احساس کنید که بخشی از آن هستید؟

همبستگی پیرسون

ارزش (دو طرفه)

** همبستگی در سطح 01/0 (دو طرفه) معنادار است.

جدول مقادیر کمی ماتریس همبستگی ساخته شده

همبستگی های جزئی:

ابتدا، اجازه دهید یک همبستگی زوجی بین این دو متغیر ایجاد کنیم:

همبستگی ها

ج8. با کسانی که در نزدیکی شما زندگی می کنند، همسایه ها احساس نزدیکی کنید

همبستگی پیرسون

ارزش (دو طرفه)

c12. با خانواده خود احساس نزدیکی کنند

همبستگی پیرسون

ارزش (دو طرفه)

**. همبستگی در سطح 0.01 (دو طرفه) معنی دار است.

سپس از رویه ساخت یک همبستگی جزئی استفاده می کنیم: "تحلیل"،  "همبستگی ها"،  "جزئی".

فرض کنید مقدار "مهم است که به طور مستقل ترتیب کار خود را تعیین و تغییر دهید" در رابطه با متغیرهای مشخص شده عامل تعیین کننده ای خواهد بود که تحت تأثیر آن رابطه شناسایی شده قبلی از بین می رود یا اهمیت کمی دارد. .

همبستگی ها

متغیرهای حذف شده

ج8. با کسانی که در نزدیکی شما زندگی می کنند، همسایه ها احساس نزدیکی کنید

c12. با خانواده خود احساس نزدیکی کنند

c16. با افرادی که ثروتی مشابه شما دارند احساس نزدیکی کنید

ج8. با کسانی که در نزدیکی شما زندگی می کنند، همسایه ها احساس نزدیکی کنید

همبستگی

اهمیت (دو طرفه)

c12. با خانواده خود احساس نزدیکی کنند

همبستگی

اهمیت (دو طرفه)

همانطور که از جدول مشاهده می شود، تحت تأثیر متغیر کنترل، رابطه اندکی کاهش یافت: از 0.120 به 0.102. به اندازه کافی بالا باقی می ماند و به فرد اجازه می دهد که فرضیه صفر را با خطای صفر رد کند.

ضریب همبستگی

دقیق ترین راه برای تعیین تنگی و ماهیت همبستگی، یافتن ضریب همبستگی است. ضریب همبستگی عددی است که با فرمول تعیین می شود:


جایی که r xy ضریب همبستگی است.

x i - مقادیر ویژگی اول؛

i - مقادیر ویژگی دوم؛

متوسط مقادیر حسابیاولین علامت

میانگین حسابی مقادیر ویژگی دوم

برای استفاده از فرمول (32) جدولی می سازیم که توالی لازم را در تهیه اعداد برای یافتن صورت و مخرج ضریب همبستگی ارائه می دهد.

همانطور که از فرمول (32) مشاهده می شود، دنباله اعمال به این صورت است: میانگین حسابی هر دو علامت x و y را پیدا می کنیم، تفاوت بین مقادیر علامت و میانگین آن را می یابیم (х i - ) و yi -)، سپس حاصل ضرب آنها (х i - ) ( y i - ) را پیدا می کنیم - حاصل جمع دومی عدد ضریب همبستگی را می دهد. برای یافتن مخرج آن، باید اختلافات (x i - ) و (y i - ) را مجذور کرد، مجموع آنها را پیدا کرد و جذر حاصلضرب آنها را استخراج کرد.

بنابراین برای مثال 31، یافتن ضریب همبستگی مطابق با فرمول (32) را می توان به صورت زیر نشان داد (جدول 50).

عدد حاصل از ضریب همبستگی امکان برقراری حضور، نزدیکی و ماهیت رابطه را فراهم می کند.

1. اگر ضریب همبستگی صفر باشد، هیچ رابطه ای بین ویژگی ها وجود ندارد.

2. اگر ضریب همبستگی برابر با یک باشد، رابطه بین ویژگی ها آنقدر زیاد است که به یک رابطه کاربردی تبدیل می شود.

3. مقدار مطلق ضریب همبستگی از فاصله صفر تا یک فراتر نمی رود:

این امکان تمرکز بر تنگی اتصال را فراهم می‌کند: هر چه ضریب به صفر نزدیک‌تر باشد، اتصال ضعیف‌تر و هر چه به وحدت نزدیک‌تر باشد، اتصال نزدیک‌تر است.

4. علامت ضریب همبستگی «بعلاوه» به معنای همبستگی مستقیم است، علامت «منها» به معنای مخالف است.

جدول 50

x i من (х i - ) (y من - ) (x i - )(y i - ) (х i - )2 (y i - )2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


بنابراین، ضریب همبستگی محاسبه شده در مثال 31 r xy = 0.9 است. به ما اجازه می دهد تا نتایج زیر را بگیریم: بین میزان قدرت عضلانی دست راست و چپ در دانش آموزان مورد مطالعه رابطه وجود دارد (ضریب r xy \u003d + 0.9 غیر صفر است)، این رابطه بسیار نزدیک است (ضریب r xy \u003d + 0.9 نزدیک به وحدت است)، همبستگی مستقیم است (ضریب r xy = + 0.9 مثبت است)، یعنی با افزایش قدرت عضلانی یکی از دست ها، قدرت دست دیگر افزایش می یابد.

هنگام محاسبه ضریب همبستگی و استفاده از ویژگی‌های آن، باید در نظر گرفت که نتایج زمانی که ویژگی‌ها به طور معمول توزیع می‌شوند و زمانی که رابطه بین تعداد زیادی از مقادیر هر دو ویژگی در نظر گرفته می‌شود، نتایج صحیحی به دست می‌دهد.

در مثال در نظر گرفته شده 31، تنها 7 مقدار از هر دو ویژگی مورد تجزیه و تحلیل قرار گرفت که البته برای چنین مطالعاتی کافی نیست. در اینجا مجددا یادآوری می کنیم که مثال ها در این کتاب به طور کلی و در این فصل به طور خاص، ماهیت روش های تصویری است و ارائه تفصیلی هیچ یک از آنها نیست. آزمایش های علمی. در نتیجه، تعداد کمی از مقادیر ویژگی در نظر گرفته می شود، اندازه گیری ها گرد می شوند - همه اینها به منظور مبهم نشدن ایده روش با محاسبات دست و پاگیر انجام می شود.

توجه ویژه باید به ماهیت رابطه مورد بررسی شود. اگر تجزیه و تحلیل رابطه بین ویژگی ها به طور رسمی انجام شود، ضریب همبستگی نمی تواند به نتایج صحیح مطالعه منجر شود. بیایید به مثال 31 برگردیم. هر دو علامت در نظر گرفته شده مقادیر قدرت عضلانی دست راست و چپ بود. بیایید تصور کنیم که منظور از ویژگی xi در مثال 31 (14.0؛ 14.2؛ 14.9... ...18.1) طول ماهی های صید شده تصادفی بر حسب سانتی متر است و منظور از ویژگی y i (12.1؛ 13.8؛ 14.2 ... ... 17.4) - وزن ابزار در آزمایشگاه به کیلوگرم. پس از استفاده رسمی از دستگاه محاسبات برای یافتن ضریب همبستگی و در این مورد نیز r xy =+0>9 به دست آمد، باید به این نتیجه می رسیدیم که رابطه مستقیمی بین طول ماهی و وزن ماهی وجود دارد. سازها پوچ بودن چنین نتیجه ای آشکار است.

برای اجتناب از رویکرد رسمی به استفاده از ضریب همبستگی، باید از هر روش دیگری - ریاضی، منطقی، تجربی، نظری - برای شناسایی امکان همبستگی بین نشانه‌ها، یعنی تشخیص وحدت ارگانیک نشانه‌ها استفاده کرد. تنها در این صورت است که می توان از تحلیل همبستگی استفاده کرد و بزرگی و ماهیت رابطه را تعیین کرد.

در آمار ریاضی نیز این مفهوم وجود دارد همبستگی چندگانه- روابط بین سه یا چند ویژگی. در این موارد، از یک ضریب همبستگی چندگانه استفاده می شود که شامل ضرایب همبستگی زوجی است که در بالا توضیح داده شد.

به عنوان مثال، ضریب همبستگی سه علامت - x і , y і , z і - است:

که در آن R xyz -ضریب همبستگی چندگانه نشان می دهد که چگونه ویژگی x i به ویژگی های y i و z i بستگی دارد.

r xy -ضریب همبستگی بین ویژگی های x i و y i ;

r xz - ضریب همبستگی بین ویژگی های Xi و Zi.

r yz - ضریب همبستگی بین ویژگی های y i, z i

تحلیل همبستگی عبارت است از:

تجزیه و تحلیل همبستگی

همبستگی- رابطه آماری دو یا چند متغیر تصادفی (یا متغیرهایی که می توان با دقت قابل قبولی چنین در نظر گرفت). در عین حال، تغییرات در یک یا چند مورد از این کمیت ها منجر به تغییر سیستماتیک در دیگر یا مقادیر دیگر می شود. ضریب همبستگی به عنوان یک معیار ریاضی برای همبستگی دو متغیر تصادفی عمل می کند.

همبستگی می تواند مثبت و منفی باشد (همچنین ممکن است هیچ رابطه آماری وجود نداشته باشد - به عنوان مثال، برای متغیرهای تصادفی مستقل). همبستگی منفی - همبستگی که در آن افزایش یک متغیر با کاهش متغیر دیگر همراه است در حالی که ضریب همبستگی منفی است. همبستگی مثبت - همبستگی که در آن افزایش یک متغیر با افزایش متغیر دیگر همراه است در حالی که ضریب همبستگی مثبت است.

خود همبستگی - رابطه آماری بین متغیرهای تصادفی از همان سری، اما با تغییر، به عنوان مثال، برای یک فرآیند تصادفی - با تغییر در زمان.

روش پردازش داده های آماری که شامل مطالعه ضرایب (همبستگی) بین متغیرها است، نامیده می شود. تجزیه و تحلیل همبستگی.

ضریب همبستگی

ضریب همبستگییا ضریب همبستگی جفتیدر تئوری احتمال و آمار، این نشانگر ماهیت تغییر در دو متغیر تصادفی است. ضریب همبستگی با حرف لاتین R نشان داده می شود و می تواند مقادیری بین -1 و +1 داشته باشد. اگر مقدار مدول به 1 نزدیکتر باشد، این به معنای وجود یک اتصال قوی (با ضریب همبستگی) است. برابر با یکاز یک اتصال عملکردی صحبت کنید)، و اگر نزدیک به 0 باشد، ضعیف است.

ضریب همبستگی پیرسون

برای مقادیر متریک از ضریب همبستگی پیرسون استفاده می شود که فرمول دقیق آن توسط فرانسیس گالتون معرفی شده است:

بگذار باشد ایکس,Y- دو متغیر تصادفی تعریف شده در فضای احتمال یکسان. سپس ضریب همبستگی آنها با فرمول به دست می آید:

,

که در آن cov کوواریانس و D واریانس یا معادل آن است،

,

جایی که نماد نشان دهنده انتظارات ریاضی است.

برای نمایش گرافیکی چنین رابطه ای، می توانید از یک سیستم مختصات مستطیلی با محورهایی که با هر دو متغیر مطابقت دارند استفاده کنید. هر جفت مقادیر با یک نماد خاص مشخص شده است. به چنین طرحی «نقشه پراکنده» می گویند.

روش محاسبه ضریب همبستگی بستگی به نوع مقیاسی دارد که متغیرها به آن اشاره دارند. بنابراین برای اندازه‌گیری متغیرها با مقیاس فاصله‌ای و کمی، باید از ضریب همبستگی پیرسون (همبستگی گشتاورهای محصول) استفاده کرد. اگر حداقل یکی از دو متغیر دارای مقیاس ترتیبی باشد یا بطور معمول توزیع نشده باشد، باید از همبستگی رتبه اسپیرمن یا τ کندال (tau) استفاده شود. در صورتی که یکی از دو متغیر دوگانه باشد از همبستگی دو سری نقطه ای و اگر هر دو متغیر دوگانه باشند از همبستگی چهار میدانی استفاده می شود. محاسبه ضریب همبستگی بین دو متغیر غیر دوگانه تنها در صورتی معنا دارد که رابطه بین آنها خطی (یک جهته) باشد.

ضریب همبستگی کندل

برای اندازه گیری اختلال متقابل استفاده می شود.

ضریب همبستگی اسپیرمن

ویژگی های ضریب همبستگی

  • نابرابری کوشی - بونیاکوفسکی:
اگر کوواریانس را به عنوان حاصل ضرب اسکالر دو متغیر تصادفی در نظر بگیریم، هنجار است متغیر تصادفیبرابر خواهد بود و پیامد نابرابری کوشی-بنیاکوفسکی خواهد بود: . ، جایی که . علاوه بر این، در این مورد علائم و کهمخوانی داشتن: .

تجزیه و تحلیل همبستگی

تجزیه و تحلیل همبستگی- روش پردازش داده های آماری که شامل مطالعه ضرایب ( همبستگی ها) بین متغیرها در این مورد، ضرایب همبستگی بین یک جفت یا چند جفت ویژگی مقایسه می شود تا روابط آماری بین آنها برقرار شود.

هدف تجزیه و تحلیل همبستگی- اطلاعاتی در مورد یک متغیر با کمک متغیر دیگر ارائه دهید. در مواردی که امکان دستیابی به هدف وجود دارد، می گوییم که متغیرها همبستگی. در بسیار نمای کلیپذیرش فرضیه وجود همبستگی به این معنی است که تغییر در مقدار متغیر A همزمان با تغییر متناسب در مقدار B رخ می دهد: اگر هر دو متغیر افزایش پیدا کنند، آنگاه همبستگی مثبت استاگر یک متغیر افزایش و دیگری کاهش یابد، همبستگی منفی است.

همبستگی فقط وابستگی خطی کمیت ها را منعکس می کند، اما ارتباط عملکردی آنها را منعکس نمی کند. مثلاً اگر ضریب همبستگی بین مقادیر را محاسبه کنیم آ = سمنn(ایکس) و ب = جoس(ایکس، آنگاه نزدیک به صفر خواهد بود، یعنی هیچ وابستگی بین کمیت ها وجود ندارد. در همین حال، کمیت های A و B به وضوح مطابق قانون از نظر عملکردی مرتبط هستند سمنn 2(ایکس) + جoس 2(ایکس) = 1.

محدودیت های تحلیل همبستگی



نمودارهای توزیع جفت (x,y) با ضرایب همبستگی x و y متناظر برای هر یک از آنها. توجه داشته باشید که ضریب همبستگی یک رابطه خطی (ردیف بالا) را منعکس می کند، اما منحنی رابطه (ردیف میانی) را توصیف نمی کند و برای توصیف روابط پیچیده و غیر خطی (ردیف پایین) اصلا مناسب نیست.
  1. اگر تعداد موارد کافی برای مطالعه وجود داشته باشد، امکان پذیر است: برای نوع خاصی از ضریب همبستگی، بین 25 تا 100 جفت مشاهدات متغیر است.
  2. محدودیت دوم از فرضیه تحلیل همبستگی ناشی می شود که شامل وابستگی خطی متغیرها. در بسیاری از موارد، زمانی که به طور قابل اعتماد مشخص شود که رابطه وجود دارد، تجزیه و تحلیل همبستگی ممکن است به این دلیل که رابطه غیرخطی نیست (مثلاً به صورت سهمی بیان می‌شود) نتایجی به دست نیاورد.
  3. واقعیت همبستگی به خودی خود زمینه ای را برای اثبات اینکه کدام یک از متغیرها مقدم است یا باعث تغییرات می شود، نمی دهد، یا اینکه متغیرها به طور کلی با یکدیگر مرتبط هستند، مثلاً به دلیل عمل عامل سوم.

منطقه برنامه

این روش پردازش داده های آماری در اقتصاد بسیار محبوب است و علوم اجتماعی(به ویژه در روانشناسی و جامعه شناسی)، اگرچه دامنه ضرایب همبستگی گسترده است: کنترل کیفیت محصولات صنعتی، متالورژی، شیمی کشاورزی، هیدروبیولوژی، بیومتریک و غیره.

محبوبیت این روش به دلیل دو نکته است: محاسبه ضرایب همبستگی نسبتاً آسان است، کاربرد آنها به آموزش ریاضی خاصی نیاز ندارد. همراه با سهولت در تفسیر، سهولت کاربرد ضریب منجر به استفاده گسترده از آن در زمینه تجزیه و تحلیل داده های آماری شده است.

همبستگی کاذب

سادگی اغلب وسوسه‌انگیز یک مطالعه همبستگی، محقق را تشویق می‌کند تا نتایج شهودی نادرستی در مورد وجود یک رابطه علی بین جفت صفات بگیرد، در حالی که ضرایب همبستگی فقط روابط آماری را ایجاد می‌کنند.

در روش شناسی کمی مدرن علوم اجتماعی، در واقع، تلاش برای ایجاد روابط علی بین متغیرهای مشاهده شده کنار گذاشته شده است. روش های تجربی. بنابراین، هنگامی که محققان علوم اجتماعی در مورد ایجاد روابط بین متغیرهایی که مورد مطالعه قرار می دهند صحبت می کنند، یا یک فرض نظری کلی یا یک وابستگی آماری القا می شود.

را نیز ببینید

  • تابع همبستگی خودکار
  • تابع همبستگی متقابل
  • کوواریانس
  • ضریب تعیین
  • تجزیه و تحلیل رگرسیون

بنیاد ویکی مدیا 2010.

همبستگی درجه ارتباط بین 2 یا چند پدیده مستقل است.

همبستگی می تواند مثبت یا منفی باشد.

همبستگی مثبت (مستقیم)زمانی اتفاق می افتد که 2 متغیر به طور همزمان در یک جهت (مثبت یا منفی) تغییر کنند. به عنوان مثال، رابطه بین تعداد کاربرانی که از نتایج جستجو به سایت می آیند و بار روی سرور: هر چه تعداد کاربران بیشتر باشد، بارگذاری بیشتر می شود.

همبستگی منفی است (معکوس)اگر تغییر در یک کمیت باعث تغییر معکوس در کمیت دیگر شود. به عنوان مثال، با افزایش بار مالیاتی شرکت ها، سود آنها کاهش می یابد. هر چه مالیات بیشتر باشد، پول برای توسعه کمتر است.

اثربخشی همبستگی به عنوان یک ابزار آماری در توانایی بیان رابطه بین دو متغیر با استفاده از ضریب همبستگی نهفته است.

ضریب همبستگی (CC) در محدوده اعداد 1- تا 1 است.

هنگامی که مقدار QC برابر با 1 است، باید درک کرد که با هر تغییر در متغیر 1، یک تغییر معادل در متغیر 2 در همان جهت رخ می دهد.


اگر مقدار QC -1 باشد، با هر تغییر یک تغییر معادل در متغیر دوم در جهت مخالف ایجاد می‌شود.


هر چه همبستگی به 1- یا 1 نزدیکتر باشد، رابطه بین متغیرها قوی تر است. در مقدار صفر (یا نزدیک به 0)، هیچ رابطه معنی داری بین 2 متغیر یا بسیار حداقل وجود ندارد.

این روش پردازش اطلاعات آماری به دلیل سادگی محاسبه QC، سهولت در تفسیر نتایج و عدم نیاز به ریاضیات سطح بالا، در علوم اقتصادی، فنی، اجتماعی و سایر علوم رایج است.

همبستگی فقط رابطه بین متغیرها را منعکس می کند و از علیت صحبت نمی کند: همبستگی مثبت یا منفی بین 2 متغیر لزوماً به این معنی نیست که تغییر در یک متغیر باعث تغییر در متغیر دیگر شود.

به عنوان مثال، بین افزایش حقوق مدیران فروش و کیفیت کار با مشتریان (بهبود کیفیت خدمات، کار با مخالفت، آگاهی) همبستگی مثبت وجود دارد. ویژگی های مثبتمحصول در مقایسه با رقبا) با انگیزه مناسب کارکنان. افزایش حجم فروش و به تبع آن حقوق مدیران به هیچ وجه به این معنا نیست که مدیران کیفیت کار با مشتریان را ارتقا داده اند. این احتمال وجود دارد که سفارشات بزرگ به طور تصادفی رسیده و ارسال شده باشند، یا بخش بازاریابی بودجه تبلیغات را افزایش داده است، یا اتفاق دیگری افتاده است.

شاید متغیر سومی وجود داشته باشد که بر دلیل وجود یا عدم وجود همبستگی تأثیر بگذارد.

ضریب همبستگی محاسبه نمی شود:

  • هنگامی که رابطه بین دو متغیر خطی نیست، مانند درجه دوم.
  • بیش از 1 مشاهده برای هر مورد در داده ها وجود دارد.
  • مشاهدات غیرعادی وجود دارد (غیرطبیعی، "مرغد").
  • داده ها شامل زیر گروه های مجزا از مشاهدات است.

کار دوره

موضوع: تحلیل همبستگی

معرفی

1. تحلیل همبستگی

1.1 مفهوم همبستگی

1.2 طبقه بندی کلی همبستگی ها

1.3 زمینه های همبستگی و هدف از ساخت آنها

1.4 مراحل تحلیل همبستگی

1.5 ضرایب همبستگی

1.6 ضریب همبستگی Bravais-Pearson نرمال شده

1.7 ضریب همبستگی رتبه اسپیرمن

1.8 ویژگی های اساسی ضرایب همبستگی

1.9 بررسی اهمیت ضرایب همبستگی

1.10 مقادیر بحرانی ضریب همبستگی جفت

2. برنامه ریزی یک آزمایش چند متغیره

2.1 وضعیت مشکل

2.2 تعیین مرکز پلان (سطح اصلی) و سطح تنوع عوامل

2.3 ساخت ماتریس برنامه ریزی

2.4 بررسی همگنی پراکندگی و دقت برابر اندازه گیری ها در سری های مختلف

2.5 ضرایب معادله رگرسیون

2.6 پراکندگی تکرارپذیری

2.7 بررسی معناداری ضرایب معادله رگرسیون

2.8 بررسی کفایت معادله رگرسیون

نتیجه

کتابشناسی - فهرست کتب

معرفی

برنامه ریزی آزمایشی یک رشته ریاضی و آماری است که به مطالعه روش های سازماندهی منطقی می پردازد مطالعات تجربی- از انتخاب بهینه عوامل مورد مطالعه و تعیین طرح واقعی آزمایش مطابق با هدف آن تا روش های تجزیه و تحلیل نتایج. آغاز برنامه‌ریزی آزمایش توسط آماردان انگلیسی R. Fisher (1935) آغاز شد، که تأکید کرد برنامه‌ریزی منطقی آزمایش سود کمتری نسبت به پردازش بهینه نتایج اندازه‌گیری در دقت تخمین‌ها ندارد. در دهه 60 قرن بیستم وجود داشت نظریه مدرنبرنامه ریزی آزمایش روش های آن ارتباط نزدیکی با تئوری تقریب توابع و برنامه ریزی ریاضی دارد. پلان های بهینه ساخته می شوند و خواص آنها برای کلاس وسیعی از مدل ها بررسی می شود.

برنامه ریزی آزمایشی انتخاب یک طرح آزمایشی است که الزامات مشخص شده را برآورده می کند، مجموعه ای از اقدامات با هدف توسعه یک استراتژی آزمایش (از به دست آوردن اطلاعات پیشینی تا به دست آوردن یک مدل ریاضی قابل اجرا یا تعیین شرایط بهینه). این یک کنترل هدفمند آزمایش است که در شرایط دانش ناقص از مکانیسم پدیده مورد مطالعه اجرا می شود.

در فرآیند اندازه گیری، پردازش بعدی داده ها و همچنین رسمی شدن نتایج در قالب یک مدل ریاضی، خطاهایی رخ می دهد و بخشی از اطلاعات موجود در داده های اصلی از بین می رود. استفاده از روش های برنامه ریزی آزمایشی امکان تعیین خطای مدل ریاضی و قضاوت در مورد کفایت آن را فراهم می کند. اگر دقت مدل کافی نباشد، استفاده از روش‌های برنامه‌ریزی آزمایشی، نوسازی مدل ریاضی را با آزمایش‌های اضافی بدون از دست دادن اطلاعات قبلی و با حداقل هزینه ممکن می‌سازد.

هدف از برنامه‌ریزی آزمایش، یافتن شرایط و قوانینی برای انجام آزمایش‌ها است که تحت آن امکان دست‌یابی به اطلاعات موثق و قابل اعتماد در مورد شیء با کمترین هزینه کار و همچنین ارائه این اطلاعات به شکل فشرده و مناسب با کمیت وجود داشته باشد. ارزیابی دقت

از جمله روش های اصلی برنامه ریزی مورد استفاده در مراحل مختلفکاربردهای تحقیقاتی:

برنامه ریزی یک آزمایش غربالگری که معنای اصلی آن انتخاب گروهی از عوامل مهم از مجموع عواملی است که در معرض بیشتر قرار دارند. مطالعه دقیق;

طراحی آزمایشی برای تحلیل واریانس، یعنی. تهیه نقشه برای اشیاء با عوامل کیفی؛

برنامه ریزی یک آزمایش رگرسیون که به شما امکان می دهد مدل های رگرسیون (چند جمله ای و غیره) را بدست آورید.

برنامه ریزی یک آزمایش شدید، که در آن وظیفه اصلی بهینه سازی تجربی موضوع مطالعه است.

برنامه ریزی در مطالعه فرآیندهای پویا و غیره

هدف از مطالعه این رشته، آماده سازی دانشجویان برای فعالیت های تولیدی و فنی در تخصص با استفاده از روش های تئوری برنامه ریزی و مدرن است. فناوری اطلاعات.

اهداف رشته: مطالعه روش های مدرنبرنامه ریزی، سازماندهی و بهینه سازی آزمایشات علمی و صنعتی، انجام آزمایشات و پردازش نتایج.

1. تحلیل همبستگی

1.1 مفهوم همبستگی

محقق اغلب به چگونگی ارتباط دو یا چند متغیر با یکدیگر در یک یا چند نمونه مورد مطالعه علاقه مند است. به عنوان مثال، آیا قد می تواند بر وزن افراد تأثیر بگذارد یا فشار می تواند بر کیفیت محصول تأثیر بگذارد؟

این نوع رابطه بین متغیرها همبستگی یا همبستگی نامیده می شود. همبستگی یک تغییر ثابت در دو ویژگی است که منعکس کننده این واقعیت است که تغییرپذیری یک ویژگی با تغییرپذیری دیگری مطابقت دارد.

به عنوان مثال مشخص است که به طور متوسط ​​بین قد افراد و وزن آنها رابطه مثبت وجود دارد و به این ترتیب که هر چه قد بیشتر باشد وزن فرد نیز بیشتر می شود. با این حال، استثناهایی از این قاعده وجود دارد که مردم پاییناضافه وزن دارند و برعکس آستنیک ها با رشد زیاد وزن سبکی دارند. دلیل چنین حذف‌هایی این است که هر صفت بیولوژیکی، فیزیولوژیکی یا روان‌شناختی تحت تأثیر عوامل متعددی تعیین می‌شود: محیطی، ژنتیکی، اجتماعی، اکولوژیکی و غیره.

همبستگی ها تغییرات احتمالی هستند که فقط بر روی نمونه های معرف با روش ها قابل مطالعه هستند آمار ریاضی. هر دو اصطلاح - همبستگی و وابستگی همبستگی - اغلب به جای هم استفاده می شوند. وابستگی به معنای نفوذ، ارتباط - هر تغییر هماهنگی است که با صدها دلیل قابل توضیح است. همبستگی ها را نمی توان به عنوان شواهدی از یک رابطه علی در نظر گرفت، آنها فقط نشان می دهند که تغییرات در یک ویژگی، به عنوان یک قاعده، با تغییرات خاصی در ویژگی دیگر همراه است.

وابستگی همبستگی - تغییراتی هستند که مقادیر یک ویژگی در احتمال وقوع ایجاد می کند ارزش های مختلفنشانه دیگری

وظیفه تحلیل همبستگی به تعیین جهت (مثبت یا منفی) و شکل (خطی، غیر خطی) رابطه بین ویژگی های مختلف، اندازه گیری تنگی آن، و در نهایت، بررسی سطح معنی داری ضرایب همبستگی به دست آمده کاهش می یابد. .

همبستگی ها در شکل، جهت و درجه (قدرت) متفاوت است. .

شکل همبستگی می تواند مستطیل یا منحنی باشد. به عنوان مثال، رابطه بین تعداد جلسات آموزشی در شبیه ساز و تعداد مسائل به درستی حل شده در جلسه کنترل می تواند ساده باشد. منحنی می تواند به عنوان مثال، رابطه بین سطح انگیزه و اثربخشی کار باشد (شکل 1). با افزایش انگیزه، ابتدا کارایی کار افزایش می یابد، سپس به سطح بهینه انگیزه می رسد که مطابق با حداکثر کارایی کار است. افزایش بیشتر انگیزه با کاهش کارایی همراه است.

شکل 1- رابطه بین اثربخشی حل مسئله و قدرت گرایش انگیزشی

در جهت، همبستگی می تواند مثبت ("مستقیم") و منفی ("معکوس") باشد. با یک همبستگی مستقیم مثبت، مقادیر بالاتر یک ویژگی با تعداد بیشتری مطابقت دارد ارزش های بالادیگری، و مقادیر پایین تر یک ویژگی - مقادیر پایین دیگری (شکل 2). با یک همبستگی منفی، نسبت ها معکوس می شوند (شکل 3). با یک همبستگی مثبت، ضریب همبستگی دارای علامت مثبت است، با یک همبستگی منفی - یک علامت منفی.

شکل 2 - همبستگی مستقیم

شکل 3 - همبستگی معکوس


شکل 4 - بدون همبستگی

درجه، قدرت یا سفتی همبستگی با مقدار ضریب همبستگی تعیین می شود. قدرت اتصال به جهت آن بستگی ندارد و با مقدار مطلق ضریب همبستگی تعیین می شود.

1.2 طبقه بندی کلی همبستگی ها

بسته به ضریب همبستگی، همبستگی های زیر متمایز می شوند:

قوی یا نزدیک با ضریب همبستگی r>0.70;

متوسط ​​(در 0.50

متوسط ​​(در 0.30

ضعیف (در 0.20

بسیار ضعیف (در r<0,19).

1.3 زمینه های همبستگی و هدف از ساخت آنها

همبستگی بر اساس داده های تجربی، که مقادیر اندازه گیری شده (xi، y i) دو ویژگی است، مورد مطالعه قرار می گیرد. اگر داده های تجربی کمی وجود داشته باشد، توزیع تجربی دو بعدی به صورت یک سری دوگانه از مقادیر x i و y i نشان داده می شود. در این مورد، همبستگی بین ویژگی ها را می توان به روش های مختلف توصیف کرد. مطابقت بین یک آرگومان و یک تابع را می توان با یک جدول، فرمول، نمودار و غیره نشان داد.

تجزیه و تحلیل همبستگی، مانند سایر روش های آماری، مبتنی بر استفاده از مدل های احتمالی است که رفتار ویژگی های مورد مطالعه را در یک جمعیت عمومی خاص توصیف می کند، که از آنها مقادیر تجربی x i و y i به دست می آید. هنگامی که همبستگی بین ویژگی های کمی، که مقادیر آن را می توان به طور دقیق در واحدهای مقیاس متریک (متر، ثانیه، کیلوگرم، و غیره) اندازه گیری کرد، بررسی می شود، مدل یک جمعیت عمومی دو بعدی به طور معمول توزیع شده است. به تصویب رسید. چنین مدلی رابطه بین متغیرهای x i و y i را به صورت گرافیکی به عنوان منبع نقاط در یک سیستم مختصات مستطیلی نمایش می دهد. به این وابستگی گرافیکی، نمودار پراکندگی یا میدان همبستگی نیز می گویند.
این مدل از یک توزیع نرمال دو بعدی (میدان همبستگی) به شما امکان می دهد یک تفسیر گرافیکی بصری از ضریب همبستگی ارائه دهید، زیرا توزیع در مجموع به پنج پارامتر بستگی دارد: μ x، μ y - مقادیر متوسط ​​(انتظارات ریاضی). σ x , σ y انحراف معیار متغیرهای تصادفی X و Y و p ضریب همبستگی است که معیاری از رابطه بین متغیرهای تصادفی X و Y است.
اگر p \u003d 0 باشد، مقادیر x i، y i که از یک مجموعه نرمال دو بعدی به دست می‌آیند، روی نمودار در مختصات x، y در ناحیه محدود شده توسط یک دایره قرار دارند (شکل 5، a). در این حالت بین متغیرهای تصادفی X و Y همبستگی وجود ندارد و آنها را ناهمبسته می نامند. برای توزیع نرمال دو بعدی، عدم همبستگی به معنای استقلال متغیرهای تصادفی X و Y است.

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...