- مفهومی کلی از ضریب همبستگی در ذهن داشته باشند.
- وقتی جایی در گزارشی میخوانند که دو متغیر با هم ضریب همبستگی مثبت یا منفی دارند، منظور کلی نویسنده یا محقق را درک کنند.
- مراقب باشند که ضریب همبستگی را با رابطهی بین علت و معلول اشتباه نگیرند.
- در موارد ساده، با استفاده از نرم افزار اکسل، بتوانند ضریب همبستگی را محاسبه کنند.
ضريب همبستگي و انواع آن در تحليل آماري
در اين مقاله به بررسي موضوع ضريب همبستگي يا correlation coefficient که يکي از مفاهيم بنيادي در علم آمار است خواهيم پرداخت و به نقش آن در مدل سازي معادلات ساختاري اشاره خواهيم نمود.
1- انواع ضرایب همبستگی
سر فرانسیس گالتون همبستگی و رگرسیون را برای وارسی کواریانس در دو یا تعداد بیشتری از خصیصه ها مفهوم سازی کرد و کارل پیرسون (1896) براساس نظریه گالتون فرمول آماری برای ضریب همبستگی و رگرسیون ارائه داد(1986).به مدت کوتاهی پس از آن چارلز اسپیرمن(1904) روش همبستگی را برای روش تحلیل عاملی به کار برد. تکنیک های همبستگی ،رگرسیون و تحلیل عاملی برای دهه های متمادی پایه و اساس تهیه ی آزمون ها و تعریف سازه ها را شکل داده اند . .
ضریب همبستگی پیرسون پایه ای را برای ارائه و آزمون مدل ها در میان متغیرهای اندازه گیری شده و پنهان مهیا می کند. علاوه برآن همبستگی های تفکیکی و نیمه تفکیکی تعریف خاصی از روابط دو متغیره را بین متغیرها امکان پذیر می سازند که در آن واریانس صرفاً مشترک بین دو متغیر، در حالی که نفوذ سایر متغیرها کنترل شده است، تبیین می شود. همبستگی هایتفکیکی و نیمه تفکیکی نیز همچون ضریب همبستگی پیرسون می توانند مورد آزمون معناداری قرار گیرند.
در کنار ضریب همبستگی پیرسون که تأثیرات فراوانی بر علم آمار دارد سایر ضرایب همبستگی نیز بسته به سطح سنجش متغیرها معرفی شده اند.استیونز(1968) انواعی از مقیاس های اندازه گیری را معرفی کرده است که به عنوان مقیاس های اسمی، ترتیبی، فاصله ای و نسبی شناخته شده اند. انواع ضرایب همبستگی توسعه یافته برای این سطوح اندازه گیری در جدول زیر مشخص شده اند.
در ادامه با توجه به نقش با اهمیتی که همبستگی(واریانس مشترک) در مدل سازی معادله ساختاری بازی می کند، عواملی را طرح می کنیم که بر ضرایب همبستگی اثر می گذارند.
2- عوامل موثر بر ضرایب همبستگی
عوامل اصلی در این رابطه عبارتند از: سطح اندازه گیری، محدودیت دامنه تغییرات مقادیر(تغییر پذیری، چولگی و کشیدگی)، داد های از دست رفته، غیر خطی بودن، مقادیر دورافتاده ، تصحیح تضعیف و موارد مرتبط با تغییر نمونه گیری، فاصله اطمینان، حجم اثر، معناداری و توان بیان شده در برآوردهای خودگردان.
1-2. سطح اندازه گیری و دامنه تغییرات مقادیر
چهار نوع یا سطح اندازه گیری برای مقیاس های سنجش متغیرهای اسمی ، ترتیبی، فاصله ای و نسبی تعریف شده است (استیونز 1968).در مدل سازی معادله ساختاری هر یک از انواع چهارگانه ی مذکور را می توان در ضریب همبستگی-مثال ساخت مدل مشارکت داد. مدل سازی معادله ساختاری به متغیرهای اندازه گیری شده در سطح فاصله ای یا نسبی نیاز داشته و لذا ضرایب همبستگی گشتاوری پیرسون دررگرسیون، تحلیل مسیر، تحلیل عاملی و مدل سازی معادله ساختاری مورد استفاده قرار می گیرد.همچنین لازم است که مقادیر متغیرهای فاصله ای و نسبی برای محاسبه واریانس دارای دامنه تغییرات به اندازه کافی بزرگ باشند.اگر دامنه تغییرات نمرات محدود باشد شدت همبستگی کاهش می یابد.
نکته ی دیگری که در مورد همبستگی بین مقادیر بایستی بدان اهمیت داده شود این است که اگر توزیع متغیرها به طور گسترده ای واگرا هستند، همبستگی می تواند تحت تأثیر قرار گیرد.برای جلوگیری از این موضوع تغییر شکل هایی مانند تبدیل ریشه دوم، تبدیل لگاریتمی، تبدبل معکوس و …پیشنهاد می شود.
2-2. غیر خطی بودن
ضریب همبستگی پیرسون نشان دهنده ی درجه رابطه خطی بین دو متغیر است.بنابراین ممکن است دو متغیری که دارای رابطه ی غیر خطی با یکدیگر هستند براساس این ضریب رابطه ای را نشان ندهند. در اینجا از ضریب اتا به عنوان شاخصی برای رابطه غیرخطی بین دو متغیر و با آزمون اثرات خطی ، درجه دوم و درجه سوم استفاده می شود.
3-2. داده های از دست رفته
در یک ماتریس همبستگی با چندین متغیر، ضرایب همبستگی متفاوتی برای حجم نمونه های متفاوت می توانند محاسبه شوند.حذف انفرادی یا زوجی آزمودنی ها منجر به تفاوت در حجم نمونه برای ضرایب همبستگی موجود در ماتریس همبستگی می شود.
یک رویکرد مقدماتی در برخورد با داده های از دست رفته ، حذف هر مورد مشاهده شده ای است که دارای داده ی از دست رفته باشد. اما این روش توصیه نمی شود چراکه باعث از دست رفتن اطلاعات برای سایر متغیرها خواهد شد.روش دیگرحذف زوجی می باشد، این رویکرد داده ها را تنها هنگامی کنار می گذارد که آن ها برای دو متغیر از متغیرهای گزینش شده در تحلیل دارای داده از دست رفته باشند. سومین رویکرد که جایگزین کردن داده ها است، مقادیر از دست رفته را با یک برآورد جایگزین میکند. به عنوان مثال میانگین یک متغیر برای داده های موجود، با مقادیر از دست رفته برای کلیه موارد داده های فاقد داده همان متغیر جایگزین می شود.
4-2. مقادیر دور افتاده
ضریب همبستگی پیرسون به طور قابل توجهی به وسیله ی یک داده ی دورافتاده منفرد چه برای X و چه برای Y تحت تأثیر قرار می گیرد. در پژوهش های بسیاری این موضوع به دقت مورد بررسی قرار گرفته است که چگونه داده های دور افتاده متفاوت برای x یا Y یا هردو روبط همبستگی را تحت تأثیر قرار می دهند و چگونه می توان با استفاده از آماره های استوارار به تحلیل بهتری دست یافت.
5-2. تصحیح تضعیف
یک مفروضه ی اصلی در نظریه اندازه گیری این است که داده های مشاهده شده دارای خطای سنجش هستند. یک ضریب همبستگی پیرسون بسته به اینکه آیا آن ضریب با نمرات مشاهده شده (دارای خطا) یا نمرات واقعی(هنگامی که خطای سنجش را کنار گذاشته ایم) محاسبه شود مقادیر متفاوتی را نشان می دهد. ضریب همبستگی پیرسون می تواند برای خطاهای سنجش تضعیف کننده و ناپایدار در نمرات، تصحیح شده و به این ترتیب به یک مقدار واقعی از ضریب دست یابیم.در عین حال ضریب تصحیح شده می تواند مقداری بیش از 1 را نیز به خود بگیرد. پایین بودن قابلیت اعتماد در متغیرهای مستقل یا وابسته همراه با یک همبستگی بالا بین متغیر مستقل و وابسته می تواند ضریب همبستگی را به بالاتر از مقدار 1 برساند.
6-2. ماتریس های معین غیر مثبت
ضرایب همبستگی بالاتر از مقدار1 در یک ماتریس همبستگی باعث معین و غیر مثبت شدن ماتریس همبستگی می شود.در اینصورت حل معادله مجاز نبوده و برآورد پارامترها قابل محاسبه نمی باشد.
ماتریس کواریانس معین غیر مثبت هنگامی رخ می دهد که دترمینان ماتریس صفر است و یا اینکه محاسبه معکوس ماتریس ممکن نیست. عواملی که چنین وضعیتی را بوجود می آورند عبارتند از ضریب همبستگی بزرگتر از 1، وابستگی خطی در میان متغیرهای مشاهده شده، همخطی در میان متغیرهای مشاهده شده، وجود وتغیری که ترکیب خطی از سایر متغیرها است، حجم نمونه کمتر از تعداد متغیرها، وجود واریانس صفر یا منفی، واریانس-کواریانس(همبستگی) خارج از دامنه تغییرات مجاز(∓1) و مقدار شروع کننده نامناسب در مدل هایی که توسط کاربر تعریف شده اند.
راه حل های ممکن برای حل چنین خطایی عبارتند از : کاهش میزان اشتراک یا تثبیت آن به مقدار کمتر از1، بیرون کشیدن تعدادی از عامل ها، تعریف مقیاس جدید برای متغیرهای مشاهده شده.
7-2. حجم نمونه
در مدل سازی معادله ساختاری، محقق اغلب به حجم نمونه ضریب همبستگی-مثال بسیار بزرگتری از حد معمول نیاز دارد تا با حفظ توان لازم به برآوردهای باثبات تری از پارامترها و خطاهای استاندارد دست یابد. همچنین بخشی از نیاز به حجم نمونه به وجود متغیرهای پنهان مربوط است. علاوه برمقادیر مختلفی که برای حجم نمونه پیشنهاد شده است، برخی از قاعده سرانگشتی به ازای هر ضریب همبستگی-مثال متغیر 10 واحد نمونه یا به ازای هر متغیر 20 واحد نمونه استفاده کنند. با این حال باید توجه داشت که هرچه حجم نمونه بزرگتر باشد احتمالاً باعث می شود که فرد بتواند با استفاده از روش دو نیمه کردن به اعتبار بیشتری برای مدل ها دست یابد.
منبع: مقدمه ای بر مدل سازی معادله ساختاری ، انتشارات جامعه شناسان. نویسندگان : رندال ای ، شوماخر و ریچارد جی لومکس. ترجمه : دکتر وحید قاسمی.
براي مشاهده ساير مقاله هاي تحليل آماري اين وب سايت بر لينک زير کليک نماييد: صفحه مقاله هاي تحليل آماري
3- مدل سازي معادلات ساختاري چيست؟
پژوهشگر گرامي، چنانچه مايليد در خصوص مدل سازي معادلات ساختاري بيشتر بدانيد، پيشنهاد مي شود به وب سايت ويژه مدل سازي معادله ساختاري با نرم افزار اسمارت پي ال اس (Smart Pls) این شرکت آماری مراجعه نماييد: مدل سازي معادلات ساختاري با نرم افزار اسمارت پي ال اس
ساير منابع مرتبط با نکات تحليلي آماري
در خصوص موضوعات مختلف تحليل آماري مي توانيد از مطالب وب سايت ديگر اين شرکت آماری نيز استفاده نماييد: مقاله و موضوعات تحليل آماري
ضریب همبستگی: فرمول ها ، محاسبه ، تفسیر ، مثال
ضریب همبستگی در آمار ، این شاخصی است که گرایش دو متغیر کمی X و Y را برای داشتن یک رابطه خطی یا متناسب بین آنها اندازه گیری می کند.
به طور کلی ، جفت متغیرهای X و Y دو ویژگی یک جمعیت هستند. به عنوان مثال ، X می تواند قد فرد و Y وزن او باشد.
در این حالت ، ضریب همبستگی نشان می دهد که آیا روشی به رابطه متناسب بین قد و وزن در یک جمعیت معین وجود دارد یا خیر.
ضریب همبستگی خطی پیرسون با حرف مشخص می شود ر حروف کوچک و حداقل و حداکثر مقادیر آن به ترتیب -1 و +1 می باشد.
مقدار r = 1 نشان می دهد که مجموعه ای از جفت ها (X ، Y) کاملاً تراز هستند و وقتی X رشد می کند ، Y نیز به همان نسبت رشد می کند. از طرف دیگر ، اگر اتفاق می افتد که r = -1 ، مجموعه جفت ها نیز کاملاً تراز می شوند ، اما در این حالت وقتی X افزایش می یابد ، Y به همان نسبت کاهش می یابد.
از طرف دیگر ، مقدار r = 0 نشان می دهد که هیچ همبستگی خطی بین متغیرهای X و Y وجود ندارد. در حالی که مقدار r = +0.8 نشان می دهد که جفت ها (X ، Y) تمایل دارند از یک طرف جمع شوند و دیگری از یک خط خاص
فرمول محاسبه ضریب همبستگی r به شرح زیر ضریب همبستگی-مثال است:
چگونه ضریب همبستگی را محاسبه کنیم؟
ضریب همبستگی خطی کمیت آماری است که در ماشین حسابهای علمی ، بیشتر صفحات گسترده و برنامه های آماری تعبیه شده است.
با این حال ، راحت است که بدانید فرمولی که آن را تعریف می کند چگونه اعمال می شود ، و برای این منظور یک محاسبه دقیق در یک مجموعه داده کوچک نشان داده می شود.
و همانطور که در بخش قبلی بیان شد ، ضریب همبستگی کوواریانس Sxy است که بر حاصل از انحراف استاندارد Sx برای متغیرهای X و Sy برای متغیر Y تقسیم می شود.
کوواریانس و واریانس
کواریانس Sxy به شرح زیر است:
Sxy = [Σ (Xi - ) (یی - )] / (N-1)
جایی که مجموع از 1 به N جفت داده می رسد (Xi ، Yi). و به ترتیب محاسبات داده های Xi و Yi هستند.
به نوبه خود ، انحراف استاندارد برای متغیر X ریشه مربع واریانس مجموعه داده های Xi است ، با i از 1 تا N:
Sx = √ [Σ (Xi - ) ^ 2) / (N-1)]
به طور مشابه ، انحراف استاندارد برای متغیر Y ریشه مربع واریانس مجموعه داده Yi است ، با i از 1 تا N:
Sy = √ [Σ (یی - ) 2 ) / (N-1)]
مورد مصور
به منظور نشان دادن جزئیات نحوه محاسبه ضریب همبستگی ، مجموعه چهار جفت داده زیر را خواهیم گرفت
ابتدا میانگین محاسبه را برای X و Y محاسبه می کنیم ، به شرح زیر:
= (1 + 2 + 3 + 4) / 4 = 2.5
= (1 + 3 + 6 + 7) / 4 = 4.25
سپس پارامترهای باقیمانده محاسبه می شوند:
کوواریانس سکسی
Sxy = [(1 - 2.5) (1 - 4.25) + (2 - 2.5) (3 - 4.25) + (3 - 2.5) (6 - 4.25) + …. (4 - 2.5) (7 - 4.25)] / (4-1)
Sxy = [(-1.5) (- 3.25) + (-0.5) (- 1.25) + (0.5) (1.75) +
….(1.5)(2.75) ] / (3) = 10.5 / 3 = 3.5
انحراف استاندارد Sx
Sx = √ [(-1.5) 2 + (-0.5) 2 + (0.5) 2 + (1.5) 2 ) / (4-1)] = √[5/3] = 1.29
انحراف استاندارد
Sx = √ [(-3.25) 2 + (-1.25) 2 + (1.75) 2 + (2.75) 2 ) / (4-1)] =
√[22.75/3] = 2.75
ضریب همبستگی r
r = 3.5 / (1.29 * 2.75) = 0.98
تفسیر
در مجموعه داده های مورد قبلی ، یک همبستگی خطی قوی بین متغیرهای X و Y مشاهده می شود ، که هم در نمودار پراکندگی (در شکل 1 نشان داده شده است) و هم در ضریب همبستگی آشکار می شود ، که یک ارزش کاملاً نزدیک به وحدت است.
تا آنجا که ضریب همبستگی به 1 یا -1 نزدیکتر باشد ، منطبق تر بودن داده ها در یک خط ، نتیجه رگرسیون خطی است.
رگرسیون خطی
خط رگرسیون خطی از بدست می آید روش حداقل مربعات.که در آن پارامترهای خط رگرسیون از به حداقل رساندن مجموع مربع اختلاف بین مقدار Y برآورد شده و Yi داده N بدست می آیند.
از طرف دیگر ، پارامترهای a و b خط رگرسیون y = a + bx که با استفاده از روش حداقل مربعات بدست آمده اند ، عبارتند از:
* b = Sxy / (Sx 2 ) برای شیب
* a = - ب برای تقاطع خط رگرسیون با محور Y.
به یاد بیاورید که Sxy کوواریانس تعریف شده در بالا و Sx است 2 واریانس یا مربع انحراف استاندارد تعریف شده در بالا است. و به ترتیب محاسبات داده های X و Y هستند.
مثال
برای تعیین وجود همبستگی خطی بین دو متغیر از ضریب همبستگی استفاده می شود. وقتی متغیرهای مورد مطالعه کمی باشند قابل اجرا است و علاوه بر این ، فرض بر این است ضریب همبستگی-مثال که آنها از یک توزیع نوع طبیعی پیروی می کنند.
ما یک مثال گویا در زیر داریم: معیاری برای میزان چاقی ، شاخص توده بدن است که با تقسیم وزن فرد بر کیلوگرم به قد مربع همان در واحد متر مربع بدست می آید.
شما می خواهید بدانید که آیا بین شاخص توده بدن و غلظت کلسترول HDL در خون ، اندازه گیری شده بر حسب میلی مول بر لیتر ، ارتباط زیادی وجود دارد یا خیر. برای این منظور ، یک مطالعه با 533 نفر انجام شده است که در نمودار زیر خلاصه شده است ، که در آن هر نقطه داده های یک نفر را نشان می دهد.
مشاهده دقیق نمودار نشان می دهد که بین غلظت کلسترول HDL و شاخص توده بدنی روند خطی خاصی وجود دارد (خیلی مشخص نیست). معیار کمی این روند ضریب همبستگی است که برای این مورد معادل r = -0.276 است.
مفهوم ضریب همبستگی چیست و چه کاربردی دارد؟
- مفهومی کلی از ضریب همبستگی در ذهن داشته باشند.
- وقتی جایی در گزارشی میخوانند که دو متغیر با هم ضریب همبستگی مثبت یا منفی دارند، منظور کلی نویسنده یا محقق را درک کنند.
- مراقب باشند که ضریب همبستگی را با رابطهی بین علت و معلول اشتباه نگیرند.
- در موارد ساده، با استفاده از نرم افزار اکسل، بتوانند ضریب همبستگی را محاسبه کنند.
بحث ضریب همبستگی بحث بسیار گستردهای است که دامنهی آن از فلسفه تا آمار و از نیوتون تا هایزنبرگ گسترده است.
طبیعتاً قصد ما در این درس، این نیست که شما را درگیر پیچیدگیهای این موضوع کنیم.
اما میخواهیم چند نکتهی ساده دربارهی همبستگی را مطرح کنیم تا در درسهای دیگر بتوانیم به آن ارجاع دهیم.
در ابتدای این درس، یک توضیح غیردقیق و سادهشده از ضریب همبستگی ارائه میکنیم که برای بسیاری از درسهای متمم کافی است. در ادامه (بخش پایانی) توضیحات کاملتری دربارهی ضریب همبستگی ارائه شده است.
اگر قرار نیست کارهای مطالعاتی و تحقیقاتی پیچیده انجام دهید و فقط میخواهید در هنگام مطالعهی متنهای عمومی مدیریتی، درک درستی از ضریب همبستگی داشته باشید، احتمالاً توضیحات زیر برای شما کافی خواهد بود:
- اگر ضریب همبستگی دو پارامتر با یکدیگر مثبت باشد، به این معناست که در فضایی که مطالعه و بررسی انجام شده، افزایش یک پارامتر با افزایش پارامتر دیگر و نیز کاهش آن پارامتر با کاهش پارامتر دیگر همراه است.
- اگر ضریب همبستگی دو پارامتر با یکدیگر منفی باشد، به این معناست که در فضایی که مطالعه و بررسی انجام شده، افزایش یک پارامتربا کاهش پارامتر دیگر و کاهش آن پارامتربا افزایش پارامتر دیگر همراه است.
- صفر بودن ضریب همبستگی به این معناست که دو پارامتر – در فضایی که مورد بررسی قرار گرفته – مستقل از یکدیگر بودهاند و بر اساس اطلاعات موجود ازکاهش یا افزایش یکی، نمیتوان در مورد کاهش یا افزایش دیگری اظهار نظر کرد.
- ضریب همبستگی بین منفی یک و مثبت یک است. هر چه این ضریب از صفر دورتر شود (و به مثبت یا منفی یک نزدیکتر شود) میتوان نتیجه گرفت که روند هم جهت بودن یا مخالف بودن دو پارامتر مورد بررسی، جدیتر است.
- ضریب همبستگی هیچ ارتباطی با رابطهی علت و معلول ندارد. احتمال دارد در یک جامعهی آماری، بین حجم موتور ماشین و درآمد مالک ماشین، ضریب همبستگی مثبت وجود داشته باشد. اما این بدان معنی نیست که اگر ماشینی بخرید که حجم موتور بالاتری دارد، ثروتمندتر میشوید یا اگر سپردهی بانکی شما افزایش یابد، حجم موتور ماشین شما رشد خواهد کرد. این بحث را میتوانید به شکل دقیقتر در درس نظریه علمی یا واقعیت آماری مطالعه کنید.
بعضی از بحثهای متمم که به نوعی با ضریب همبستگی رابطه دارند:
بسته به هدفی که دارید و جامعهی آماری که مد نظر شماست، شیوههای متعددی برای محاسبهی ضریب همبستگی یا Correlation Coefficient وجود دارد.
برای اینکه با یکی از شیوههای محاسبهی ضریب همبستگی آشنا شویم، ما در اینجا ضریب همبستگی-مثال ضریب همبستگی پیرسون را به عنوان نمونه انتخاب کردهایم. این ضریب در مقالات تحقیقاتی معمولاً با نماد r نمایش داده میشود.
همانطور که در درس نظریه علمی یا واقعیت آماری اشاره شد، مهمترین نکتهای که باید در مورد ضریب همبستگی به خاطر داشته باشیم این است که ضریب همبستگی، به رابطهی علت با معلول اشاره نمیکند و صرفاً مشخص میکند که بین دو متغیر رابطه خطی وجود دارد.
به عنوان مثال، تحقیقات نشان میدهند که ضریب همبستگی بین تعداد سیگارهایی که یک نفر در طول زندگی کشیده و عمر او، منفی است.
اما از این تحقیق نمیتوان نتیجه گرفت که سیگار کشیدن، عمر را کوتاه میکند.
ممکن است این دو متغیر، تابع متغیر سومی به نام سختیهای زندگی باشند.
به این معنی که با افزایش سختیهای زندگی، تنش افزایش یافته و با افزایش تنش، ضمن اینکه تعداد سیگارهای مصرفی افزایش مییابد، عمر نیز کاهش یابد.
اگر چه در این مثال خاص، تحقیقات متعدد دیگر نشان دادهاند که مصرف سیگار میتواند علت مستقیم کاهش عمر باشد، اما این نتیجه را نمیتوان صرفاً از منفی بودن ضریب همبستگی استخراج کرد.
ضریب همبستگی چیست و چه کاربردی دارد؟
در دنیای کسبوکار پیش میآید که تصمیمگیر به رابطه بین دو متغیر علاقهمند است. در آمار، از کوواریانس (Covariance) و همبستگی (Correlation) برای کمّی کردن رابطه بین متغیرها بهره میبرند. در این مقاله به تعاریف ریاضی این مفاهیم میپردازم. علاوه بر این با یک مثال در حوزه مدیریت کیفیت و اجرای آن در زبان R، کاربرد این مفهوم را در تصمیمگیری نشان خواهم داد.
کوواریانس نمونه آماری
کوواریانس یک شاخص توصیفی است که وجود رابطه خطی بین دو متغیر را سنجش میکند. اگر نمونهای آماری از متغیرهای و دارای مشاهده باشد، آنگاه کوواریانس بین این دو متغیر از رابطه زیر محاسبه میشود:
در فرمول بالا ابتدا فاصله هریک از مقادیر متغیرهای و از میانگین آن محاسبه میشود. این انحرافها از میانگین برای مقادیر متناظر و در هم ضرب و مجموع آن محاسبه شده؛ سپس این مقدار بر تقسیم میگردد.
همبستگی نمونه آماری
واحد کوواریانس تابع واحد متغیرهای و است. به همین دلیل مقایسه این شاخص برای سنجیدن شدت رابطه بین متغیرها دشوار میشود. با تقسیم کوواریانس بر حاصلضرب انحراف معیار متغیرهای و ضریب همبستگی پیرسون (Pearson Correlation Coefficient) به دست میآید که تحت تأثیر واحد متغیرها نیست:
ضریب همبستگی همواره عددی بین ۱ و ۱- است. این ضریب دو بخش دارد: مقدار عددی و علامت. مقدار عددی نشان میدهد چقدر رابطه خطی بین دو متغیر قدرتمند است. علامت نشان میدهد جهت این رابطه مثبت است یا منفی.
اگر ضریب همبستگی مثبت باشد، به این مفهوم است که افزایش در مقادیر یک متغیر با افزایش در مقادیر متغیر دیگر همراه است. همینطور کاهش در مقادیر یک متغیر با کاهش در مقادیر متغیر دیگر همراه است. در این حالت اگر نمودار پراکندگی دو متغیر رسم شود، میتوان خطی با شیب مثبت را از بین نقاط برازش داد (شکل-۱). به همین ترتیب اگر ضریب همبستگی منفی باشد، میتوان خطی با شیب منفی را از بین نقاط برازش داد (شکل-۱).
هرچه مقدار مطلق ضریب همبستگی (صرفنظر از علامت) به ۱ نزدیک باشد، نشان میدهد شدت رابطه خطی بین دو متغیر قویتر است. در مقابل ضریب همبستگی نزدیک صفر نشان میدهد که رابطه خطی بسیار ضعیفی بین متغیرهای و برقرار است. در این حالت اگر نمودار پراکندگی دو متغیر رسم شود، اینطور به نظر میرسد نقاط به شکل تصادفی در صفحه رسم شدهاند (شکل-۱).
شکل-۱
اگر بین دو متغیر رابطه غیرخطی برقرار باشد، همچنان این امکان وجود دارد ضریب همبستگی نزدیک صفر باشد که نشاندهنده نبود رابطه خطی بین دو آن است (شکل-۲). به همین دلیل در هنگام تحلیل بهتر است نمودار پراکندگی بین متغیرها رسم شود تا به وجود این روابط پی برد.
شکل-۲
باید توجه کرد که اگر بین دو متغیر همبستگی دیده شود لزوماً به این معنی نیست که یکی دلیل وجود دیگری است. این امکان وجود دارد این همبستگی جعلی (Spurious Correlations) باشد به این معنی که متغیر پنهان سومی روی هر دو متغیر اثر میگذارد و یا اینکه همبستگی کاملاً تصادفی است.
در نرمافزار اکسل (Excel) از تابع ()CORREL برای محاسبه ضریب همبستگی استفاده میشود. در شکل-۳ در خانه C12 از فرمول زیر برای محاسبه ضریب همبستگی بین متغیرهای X و Y استفاده شده است:
شکل-۳
یک مثال در حوزه مدیریت کیفیت
این مثال مربوط به خط تولید یک نوع ارهبرقی است که در آن از پرچ برای متصل کردن دو قطعه به یکدیگر استفاده میشود. یکی از شاخصهایی که جهت کنترل کیفیت در این خط تولید سنجیده میشود ارتفاع بیرونزدگی سر پرچ است. فرض کنید بهعنوان مدیر خط تولید، با بررسی روند موجود در نمودارهای کنترل کیفیت پی بردید که بهزودی ممکن است این ارتفاع از محدوده استاندارد خارج شود. در جلسهای که با تیم بهبود کیفیت خود دارید، یکی از اعضا پیشنهاد میدهد واریانس مشاهدهشده در فرآیند تولید، به علت ضخامت رنگی است که دور سوراخ پرچ مینشیند. رنگ زدن قطعات قبل از فرآیند پرچ اتفاق میافتد و بعد از آن ارتفاع پرچ سنجش میشود. با جمعآوری نمونه تصمیم میگیرید این فرضیه را بیازمایید که آیا بین ارتفاع پرچ (Rivet Height) و ضخامت رنگ (Paint Thickness) همبستگی وجود دارد یا خیر.
این مثال را در زبان R اجرا کردم. در ابتدا دادهها وارد و نمودار پراکندگی و خط رگرسیون رسم شده است (شکل-۴).
ضریب همبستگی + مثال سهام خودرویی
ضریب همبستگی یک معیار آماری از قدرت رابطه بین حرکات نسبی دو متغیر است. از این ضریب در بورس، برای مقایسه سهام و یا شاخص های مختلف بسیار استفاده می شود. در این مقاله به صورت کاربردی و همراه با مثال این ضریب را برای شما تشریح کرده ایم.
مقادیر ضریب همبستگی بین ۱/۰- تا ۱/۰+ است. اگر عدد محاسبه شده بزرگتر از ۱/۰+ یا کمتر از۱/۰- به این معنی است که در اندازه گیری همبستگی خطایی رخ داده است. همبستگی ۱/۰- یک همبستگی منفی کامل را نشان می دهد، در حالی که همبستگی ۱/۰+ یک همبستگی مثبت کامل را نشان می دهد. همبستگی ۰/۰ هیچ رابطه خطی بین دو متغییر نشان نمی دهد.
از آمار همبستگی می توان در امور مالی و سرمایه گذاری استفاده کرد. به عنوان مثال، می توان ضریب همبستگی را برای تعیین سطح همبستگی بین قیمت نفت خام و قیمت سهام یک شرکت تولید کننده نفت محاسبه کرد. از آنجا که شرکت های نفتی با افزایش قیمت نفت سود بیشتری می کنند، همبستگی بین دو متغیر بسیار مثبت است.
درک ضریب همبستگی
چندین نوع ضریب همبستگی وجود دارد، اما یکی از رایج ترین آنها ضریب همبستگی پیرسون است. این امر قدرت و جهت رابطه خطی بین دو متغیر را اندازه گیری می کند. نمی تواند روابط غیر خطی بین دو متغییر را ثبت کند و نمی تواند بین متغیر های وابسته و مستقل تفاوت قائل شود.
میزان رابطه بر حسب میزان ضریب همبستگی در درجه متفاوت است. به عنوان مثال، مقدار۲/۰ نشان می دهد که بین دو متغیر همبستگی مثبت وجود دارد، اما ضعیف است و احتمالا بی اهمیت است. تحلیلگران برخی از زمینه های مطالعاتی تا زمانی که مقدار حداقل ۸/۰ فراتر نرود، همبستگی را مهم نمی دانند. با این حال، ضریب همبستگی با مقدار مطلق ۹/۰ یا بیشتر نشان دهنده ی یک رابطه بسیار قوی است.
سرمایه گذاران می توانند از تغییرات در آمار همبستگی برای شناسایی روندهای جدید در بازارهای مالی، اقتصاد و قیمت سهام استفاده کنند.
آمار همبستگی و سرمایه گذاری
همبستگی بین دو متغیر هنگام سرمایه گذاری در بازار های مالی بسیار مفید است. برای مثال، یک همبستگی می تواند در تعیین میزان عملکرد یک صندوق سرمایه گذاری نسبت به شاخص معیار خود، یا صندوق یا کلاس دارایی دیگر مفید باشد. با افزودن صندوق سرمایه گذاری متقابل کم یا وابسته منفی به سبد موجود، سرمایه گذار از مزایای تنوع برخوردار می شود.
به عبارت دیگر، سرمایه گذاران می توانند از دارایی ها یا اوراق بهادار همبسته منفی برای پرتفوی خود و کاهش ریسک بازار به دلیل نوسانات یا نوسانات شدید قیمت استفاده کنند. بسیاری از سرمایه گذاران ریسک قیمت یک پرتفوی را تحت پوشش قرار می دهند، که به طور موثر هر گونه سود یا زیان سرمایه ای را کاهش می دهد زیرا آنها سود سهام یا اوراق بهادار را می خواهند.
آمار همبستگی همچنین به سرمایه گذاران این امکان را می دهد که زمان تغییر همبستگی بین دو متغییر را تعیین کنند. به عنوان مثال، سهام بانک ها به طور معمول با نرخ های بهره همبستگی بالایی دارند زیرا نرخ های وام اغلب بر اساس نرخ های سود بازار محاسبه می شود.
اگر قیمت سهام یک بانک در حال ضریب همبستگی-مثال افزایش باشد در حالی که نرخ بهره در حال افزایش است، سرمایه گذاران می توانند بدانند که چیزی ناخواسته است. اگر قیمت سهام بانک های مشابه در این بخش نیز در حال افزایش است، سرمایه گذاران می توانند نتیجه بگیرند که کاهش سهام بانک به دلیل نرخ بهره نیست. در عوض، این بانک با عملکرد ضعیف به احتمال زیاد با یک مسئله داخلی و اساسی برخورد می کنند.
معادله ضریب همبستگی
برای محاسبه همبستگی محصول- لحظه پیرسون، ابتدا باید کوواریانس دو متغیر مورد نظر را تعیین کرد. در مرحله بعد، باید انحراف معیار هر متغییر را محاسبه کرد. ضریب همبستگی با تقسیم کوواریانس بر حاصلضرب انحراف استداندارد دو متغییر تعیین می شود.
xi: متغیر ایکس i ام
yi: متغیر وای i ام
x: میانگین متغیر x
y: میانگین متغیر y
منظور از ضریب همبستگی چیست؟
ضریب همبستگی نحوه حرکت یک متغیر در رابطه با دیگری را توصیف می کند. یک همبستگی مثبت نشان می دهد که این دو در یک جهت حرکت می کنند، هنگامی که آنها پشت سر هم حرکت کنند ۱/۰+ همبستگی دارند. ضریب همبستگی منفی به شما می گویند که آنها در جهت خلاف هم حرکت می کنند. همبستگی صفر نشان می دهد که هیچ ارتباطی وجود ندارد.
چگونه از ضریب همبستگی در سرمایه گذاری استفاده می شود؟
ضرایب همبستگی یک معیار آماری پرکاربرد در سرمایه گذاری است. آنها نقش بسیار مهمی در زمینه هایی مانند ترکیب سبد سهام، معاملات کمی و ارزیابی عملکرد ایفا می کنند. به عنوان مثال، برخی از مدیران سبد سهام بر ضرایب همبستگی دارایی های جداگانه در پرتفوی خود نظارت می کنند تا اطمینان حاصل شود که نوسان کلی سبد سهام آنها در محدوده قابل قبول حفظ می شود.
به طور مشابه، تحلیلگران گاهی از ضرایب همبستگی استفاده می کنند تا پیش بینی کنند که چگونه دارایی خاص تحت تاثیر یک عامل خارجی، مانند قیمت کالا یا نرخ بهره، تحت تاثیر قرار می گیرد.
در تمام بازار های دنیا این نکته حائز اهمیت است که وقتی می خواهیم سهمی را بخریم، باید وضعیت این سهم روبه رشد باشد تا ریسک معاملاتمان پایین تر بیاید.
برای بررسی این موضوع ابتدا نمودار شاخص کل را چک می کنیم که ببینیم در گذشته چه اصلاح هایی داشته است.
سپس قسمتی را که اصلاح شاخص شروع شده تا قسمتی که اصلاح به پایان رسیده مشخص می کنیم.
بعد بررسی می کنیم که آیا در زمانی که شاخص کل اصلاح داشته صنعت های مختلف نیز اصلاح داشته اند یا خیر. صنعت هایی که اصلاح کمتری نسبت به شاخص داشته اند می توانند حائز اهمیت باشند. برای تفکیک این صنعت ها بر روی گزینه compare (مقایسه) کلیک می کنیم.
با انتخاب این گزینه یک پنجره برایمان باز می شود در این پنجره شما می توانید به دلخواه یک حرف تایپ کنید. با تایپ حرف مورد نظر گزینه های متفاوتی بر روی صفحه نمایش داده می شود که با انتخاب گزینه شاخص تمامی شاخص ها را نشان می دهد.
شاخص ها را یک به یک با همین روش انتخاب می کنیم و نمودار آنها نمایش داده می شود. در بین این صنعت ها ۳ الی ۴ صنعت برای ما بیشتر اهمیت ندارد.
صنعت هایی را که نمودار آنها خیلی پایین تر از نمودار شاخص است پاک می کنیم. صنعت هایی را هم که خیلی بالاتر از نمودار شاخص هستند را نیز پاک می کنیم زیرا امکان دارد یک همبستگی منفی با شاخص داشته باشد. یعنی موقعی که شاخص بالا برود این ها نیز بالا بروند. پس ما به صنعت هایی که خیلی بالاتر از نمودار شاخص کل هستند اعتماد زیادی نمی کنیم، پس آنها را نیز پاک می کنیم.
صنایعی که پایین تر از نمودار شاخص هستند امکان دارد از لحاظ بنیادی ضعیف باشند چرا که تا شاخص منفی شده است این صنعت ها دو برابر منفی شده اند. نهایتا هدف شناسایی صنعت هایی است که نمودار آنها به نمودار شاخص نزدیک است.
برای مثال ما در این مقاله صنعت خودرو را بررسی می کنبم.
برای پیدا کردن سهام های موجود در صنعت خودر ابتدا وارد سایت tsetmc.com می شویم.
در آنجا در سمت چپ بالای صفحه بر روی دیدبان بازار کلیک می کنیم. در آنجا تمامی صنعت ها و همه ی سهام های موجود در آن صنعت نمایش داده می شود .
سپس تک تک سهم های خودرویی را بر روی نمودار compare می آورم. با کلیک روی گزینه compare اسم سهام مورد نظر را وارد می کنیم و در دسته بندی بالای آن گزینه سهام را انتخاب می کنیم تا نمودار سهام مورد نظر نمایش داده شود. با نمایش تمامی سهام خودرویی آنهایی را که نمودارشان بالاتر و پایین تر است حذف می کنیم تا ۱ الی ۲ سهم باقی بماند.
سپس بررسی می کنیم که تا به امروز چند درصد سود داده اند. انتخاب ما سهام هایی است که از شاخص کل بورس بیشتر سود داده اند. هدف ما از این کار، پیدا کردن بهترین صنعت و بهترین سهام موجود در آن صنعت از طریق ضریب همبستگی شاخص است.
سوالات متداول
در ادامه سوالاتی که امکان دارد برای شما در رابطه با موضوع «ضریب همبستگی» به وجود بیاید، آماده کرده ایم:
ضریب همبستگی چیست؟
ضریب همبستگی یک معیار آماری از قدرت رابطه بین حرکات نسبی دو متغیر است. مقادیر بین ۱/۰- تا ۱/۰+ است.
کاربرد ضریب همبستگی چیست؟
سرمایه گذاران می توانند از تغییرات در آمار همبستگی برای شناسایی روندهای جدید در بازارهای مالی، اقتصاد و قیمت سهام استفاده کنند.
فرمول ضریب همبستگی پیرسون چیست؟
برای محاسبه همبستگی محصول- لحظه پیرسون، ابتدا باید کوواریانس دو متغیر مورد نظر را تعیین کرد. در مرحله بعد، باید انحراف معیار هر متغیر را محاسبه کرد. ضریب همبستگی با تقسیم کوواریانس بر حاصلضرب انحراف استداندارد دو متغییر تعیین می شود.
برای ارتقای هرچه بیشتر مقالات رینگ اسپرت ، به خصوص مقالات بازارچک ، می توانید نظرات و سوالات خود را زیر این پست برای ما کامنت کنید.
دیدگاه شما