شروط استخدام معامل الارتباط بيرسون
تستخدم معاملات الارتباط في لإحصاء لقياس مدى قوة العلاقة بين متغيرين على سبيل المثال إذا كنت تحاول أن تجد وجود علاقة أو ارتباط بين نظام غذائي عالي السعرات الحرارية ومرض السكري فأنت تحتاج لطريقة علمية لعمل ذلك، وتلك الطريقة تتمثل في استخدام أحد معاملات الارتباط المعروفة لتحليل نتائج التجارب التي تجريها على عينة من المرضى ، وهناك أنواع مختلفة من معاملات الارتباط، لكن أكثر أنواع معاملات الارتباط شيوعًا هي معامل ارتباط بيرسون، وهو معامل ارتباط شائع الاستخدام في الانحدار الخطي أي عندما يكون هناك علاقة أو ارتباط بين المتغيرين وهذه العلاقة يمكن تمثيلها باستخدام خط مستقيم.[1]
معامل الارتباط في الإحصاء
تنقسم أنواع الارتباط في الإحصاء لثلاثة أنواع هي (ارتباط طردي- ارتباط عكسي- ارتباط صفري).
تستخدم صيغ معامل الارتباط لإيجاد مدى قوة علاقة بين البيانات، وتتراوح قيمة معامل الارتباط بين -1 و1، بحيث :
- إذا كانت قيمة معامل الارتباط 1 فهذا يشير لعلاقة إيجابية قوية
- إذا كانت قيمة معامل الارتباط تساوي -1 فهذا يشير لعلاقة سلبية قوية.
- إذا كانت قيمة معامل الارتباط تساوي 0 فهذا يدل على عدم وجود علاقة على الإطلاق.
ومعنى هذا أن:
معامل الارتباط 1 يعني أنه لكل زيادة موجبة في متغير واحد ، هناك زيادة موجبة لنسبة ثابتة في الآخر، على سبيل المثال ، تزداد أحجام الأحذية في ارتباط كامل (تقريبًا) كلما زاد طول القدم.
معامل الارتباط -1 يعني أنه مقابل كل زيادة موجبة في متغير واحد ، هناك انخفاض سلبي لنسبة ثابتة في الآخر، على سبيل المثال ، تقل كمية الغاز في الخزان (تقريبا) بشكل مثالي كلما زادت السرعة.
صفر يعني أنه لا توجد زيادة إيجابية أو سلبية مقابل كل زيادة، أي أن الاثنان فقط غير مرتبطين.
تعطينا القيمة المطلقة لمعامل الارتباط قوة العلاقة. كلما زاد العدد ، كانت العلاقة أقوى، على سبيل المثال ، فإن قيمة معامل الارتباط المطلقة | -750. | = 0.75، تعبر عن علاقة أقوى من 0.65 .
وهناك أربعة أنواع مختلفة من معاملات الارتباط ، وهي:
- معامل ارتباط بيرسون.
- معامل ارتباط سبيرمان.
- معامل ارتباط فاي.
- معامل الارتباط الخطي الجزئي.
معامل ارتباط بيرسون
يعتبر الارتباط بين مجموعات البيانات مقياسًا لمدى ارتباطها، والمقياس الأكثر شيوعًا للارتباط في الإحصائيات هو ارتباط بيرسون، والاسم الكامل له هو ارتباط Pearson Product Moment “PPMC” وهو يظهر العلاقة ؤ، أو بعبارة بسيطة ، إنه يجيب على السؤال ، هل يمكنني رسم منحنى بياني خطي لتمثيل البيانات؟ ، وعادة ما يتم استخدام حرفين لتمثيل ارتباط بيرسون: الحرف اليوناني( ρ) للتعبير عن حجم السكان الكامل والحرف “r” للتعبير عن حجم العينة.
ويتم استخدام ارتباط بيرسون في الآلاف من مواقف الحياة الحقيقية، حولنا على سبيل المثال ، أراد العلماء في الصين معرفة ما إذا كانت هناك علاقة بين كيفية اختلاف مجموعات الأرز العشبي وراثيًا، وكان الهدف هو معرفة الإمكانات التطورية للأرز، تم تحليل علاقة بيرسون بين المجموعتين، وقد أظهرت النتائج ارتباطًا إيجابيًا يقع بين 0.783 و 0.895 لمجموعات الأرز العشبية، وهذا الرقم مرتفع للغاية ، مما يشير إلى وجود علاقة قوية إلى حد ما بين المجموعتين، لكن هذه القيمة لا تعبر عن طبيعة العلاقة لكنها تشير فقط لوجود ارتباط.
معادلة معامل الارتباط لبيرسون
يتم حساب معامل ارتباط بيرسون من خلال الصيغة التالية:
حيث X و Y هما متغيرين يتم قياس الارتباط بينهما.
شروط استخدام معامل ارتباط بيرسون
قبل تحليل بياناتك باستخدام معامل ارتباط بيرسون يجب أن تتأكد من تحقق شروط استخدام هذا الاختبار الإحصائي على العينة المختارة، لأنه بدون توافر تلك الشروط على العينة والبيانات التي قمت بتجميعها، لن تحصل على نتائج صحيحة، وفي كثير من الحالات قد لا يكون معامل بيرسون هو الاختبار الصحيح لقياس مدى ارتباط نتائج العينات التي لديك، وهذه الشروط هي:[2]
القياس على متغيرين مستمرين
يجب أن يتم قياس المتغيرين على مقياس مستمر، وأمثلة على المتغيرات المستمرة الذكاء الذي يقاس باستخدام مقياس IQ أو قياس مستوى الأداء في الامتحان الذي يقاس بدرجة ما تقع بين 0-100 درجة.
إقران متغيرين مستمرين
على سبيل المثال يمكن جمع قيم بيانات أوقات المراجعة (التي تقاس بالساعات) مع قيم نتائج الامتحانات التي تقاس بدرجة من (0 إلى 100) ، وحجم العينة يكون 100 طالب يتم اختيارهم بشكل عشوائي من إحدى الجامعات.
أن تكون هناك حالات مستقلة
وهذا يعني أن الملاحظتين الذين يتم قياس الارتباط بينهما يكونا لحالة واحدة ، على سبيل المثال إذا كنا نقيس معامل الارتباط بين درجات المراجعة ومدة الامتحان لطالب واحد فقط، فيجب أن تكون القيمتين بالنسبة للطالب الواحد مستقلة عن نتائج باقي الطلاب الآخرين الذين حضروا نفس الامتحان، أما إذا كانت النتائج الخاصة بالطالب غير مستقلة عن نتائج باقي الطلاب، فإن معامل ارتباط بيرسون لا يصلح للاستخدام في تلك الحالة.
أن تكون هناك علاقة خطية بين متغيرين مستمرين
إذا كنت تريد أن تعرف إذا كانت العلاقة بين المتغيرين المراد قياس العلاقة بينهما خطية أما لا، فعليك رسمهما على منحنى بياني، وفحص الشكل الناتج، إذا كان على هيئة خط، فإن العلاقة بين المتغيرين خطية، إذا لم تكن العلاقة خطية فلا يجب أن تستخدم معامل بيرسون في تلك الحالة.
أن يتبع كلا المتغيرين توزيع طبيعي ثنائي المتغير
إذا كان أحد المتغيرين لا يتبع التوزيع الطبيعي للعينة، فلا يجب أن نستخدم معامل بيرسون في تلك الحالة.
تساوي التباين
وهذا يعني أنه يجب أن يكون لكلا المتغيرين نفس التباين على طول الخط.
عدم وجود قيم شاذة
يجب ألا يكون هناك قيم شاذة أحادية المتغير أو متعددة المتغيرات على طول الخط، والانحراف هو ملاحظة داخل عينتك لا تتبع نمطًا مشابهًا لبقية بياناتك
يمكن أن نتأكد من أن البيانات تلبي شروط معامل بيرسون من خلال عدة أنواع من برامج حزم البيانات مثل MINITAB.
الفرق بين معامل ارتباط بيرسون ومعامل ارتباط سبيرمان
الفرق بين معامل ارتباط بيرسون وسبيرمان
، إن كلا المعاملين يستخدمان لقياس وجود علاقة بين متغيرين، وتتراوح قيمتهما بين رقمي(-1 و1)، لكن معامل بيرسون يستخدم لقياس علاقة خطية بين متغيرين.[3]
أي يمكن التعبير عنها على منحنى باستخدام خط مستقيم، وتكون العلاقة خطية إذا كانت العلاقة بين متغيرين مستمرين، وقيمة الزيادة أو النقصان في أحدهما يقابلها زيادة أو نقصان في المتغير الأخر، على سبيل المثال ، يمكنك استخدام ارتباط بيرسون لتقييم ما إذا كانت الزيادات في درجة الحرارة في منشأة الإنتاج لديك مرتبطة بتناقص سماكة الطلاء البني لجدران المصنع.
أما معامل ارتباط سبيرمان يستخدم لقياس العلاقة بين بيانات متغيرين مرتبة، ويتم تمثيل البيانات بترتيبها داخل العلاقة، على سبيل المثال يمكنك استخدام معامل سبيرمان لقياس العلاقة بين إذا ما كان الترتيب الذي ينهي به الموظفون اختبار ما في العمل مرتبط بتاريخ التحاقهم بهذه الوظيفة أم غير مرتبط.
إذا كانت العلاقة بين أي متغيرين منعدمة، فإن نتيجة معامل بيرسون ستكون صفر، ونتيجة معامل سبيرمان أيضًا ستكون صفر. [3]