ما هي القيمة المتطرفة ؟.. وأمثلة عليها


القيمة المتطرفة هي


هي القيم الموجودة في الأطراف القصوى لمجموعة البيانات ، وتمثل بعض القيم المتطرفة القيم الحقيقية من التباين الطبيعي في السكان ، وقد تنتج القيم المتطرفة الأخرى عن إدخال بيانات غير صحيح أو أعطال في المعدات أو أخطاء قياس أخرى .


لا يعتبر الاستثناء دائمًا شكلاً من أشكال البيانات الغير الصحيحة ، لذلك يجب الحذر أثناء تنقية البيانات.[1]


القيم المتطرفة تكون


القيم المتطرفة



تكون بعيدة عن بقية القيم

.


القيم المتطرفة في الجدول هي

557 494 483 283 409
454 428 420 420 385

يمكن معرفة القيم المتطرفة من خلال الطريقة التالية:


الربيع الأدنى = 420


الربيع الأعلى = 483


المدى الربيعي = 483 – 420 – 63


المدى الربيعي × 1,5 = 94.5 نطرح 94.5 من الربيع الأدنى = 420 – 94.5 = 325.5 نضيف 94.5 إلى الربيع الأعلى = 483 + 94.5 = 577.5 لا يوجد قيمة أكبر من 577.5 إذن لا يوجد قيم متطرفة في الجدول.


القيم المتطرفة في البيانات تكون


في حالة كانت البيانات كتالي 17 ، 15 ، 31 ، 4 ، 14 ، 19 ، 20


يمكن أن نقول أن القيم المتطرفة هي 4، 31 لأنها تختلف عن المعتاد


كيف تؤثر القيمة المتطرفة في المتوسط الحسابي


في الإحصاء المتوسط الحسابي في ​​مجموعة البيانات هو متوسط ​​القيمة ، ومن المفيد أن يتم التعرف عليها لأنها تعطي فكرة عن مكان “مركز” مجموعة البيانات ، يتم حسابه باستخدام الصيغة البسيطة التالية:


= (مجموع الملاحظات) / (عدد الملاحظات)


على سبيل المثال ، افترض أن لدينا مجموعة البيانات التالية:


[1 ، 4 ، 5 ، 6 ، 7]


متوسط ​​مجموعة البيانات


هو (1 + 4 + 5 + 6 + 7) / (5) = 4.6


ولكن في حين أن المتوسط ​​مفيد ويسهل حسابه ، إلا أن له عيبًا واحدًا ، يمكن أن يتأثر بالقيم المتطرفة ،

وبشكل خاص كلما كانت مجموعة البيانات أصغر ، زاد تأثير العناصر الخارجية على المتوسط.


لتوضيح ذلك نطرح المثال التالي:


عشرة رجال يجلسون في مطهك. متوسط ​​دخل العشرة رجال 50.000 دولار، فجأة خرج رجل واحد ودخل بيل جيتس اعني أغنياء العالم ، الآن متوسط ​​دخل الرجال العشرة في الحانة 40 مليون دولار.


يوضح هذا المثال كيف يمكن لشخص غريب (بيل جيتس) أن يؤثر بشكل كبير على المتوسط.


مثال على القيمة المتطرفة


في الغالب ما يتم تحديد نقطة البيانات لتكون متقطعة إذا كان النطاق الربعي أكبر بمقدار 1.5 مرة من الربع الثالث أو 1.5 مرة النطاق الربيعي الأقل من الربع الأول لمجموعة البيانات.


ملاحظة : النطاق الربيعي هو الفرق بين الربع الثالث (75 بالمائة) والربيع الأول (25 بالمائة) في مجموعة البيانات ، وفيما


يلى أمثلة من الحياة الواقعية على القيمة المتطرفة


مثال 1: القيم المتطرفة في الدخل


أحد السيناريوهات الواقعية التي تظهر فيها القيم المتطرفة هو توزيع الدخل.


على سبيل المثال ، قد تكون النسبة المئوية الخامسة والعشرون (الربع الأول) من الدخل السنوي في بلد معين 15000 دولار في السنة ، وقد تكون النسبة المئوية الخامسة والسبعون (الربع الثالث) 120 ألف دولار في السنة.


سيتم حساب النطاق الربيعي (IQR) على أنه 120000 دولار – 15000 دولار = 105000 دولار.


هذا يعني أن أي شخص لديه دخل خارج الحدود التالية سيعتبر خارجًا:


الحد الأدنى : الربع الأول – 1.5 * النطاق الربيعي = 15000 دولار – 1.5 * 105000 دولار = – 142500 دولار


الحد العلوي : Q3 + 1.5 * IQR = 120.000 دولار + 1.5 * 105.000 دولار =


277500


دولار


شخص ما مثل إيلون ماسك الذي تبلغ ثروته بمليارات الدولارات سيُعتبر نازعًا من حيث الدخل السنوي.


ملحوظة : قيمة القيم المتطرفة التي تتجاوز الحد الأدنى لن تكون منطقية دائمًا مثلاً ، ليس من الممكن كسب دخل سنوي سلبي.


مثال 2: القيم المتطرفة في حبس النفس


النسبة المئوية الخامسة والعشرون (Q1) للمدة التي يمكن للأفراد حبس أنفاسهم فيها حوالي 15 ثانية بينما تبلغ النسبة المئوية 75 (Q3) حوالي 75 ثانية.


سيتم حساب النطاق الربيعي (IQR) على أنه 75-15 = 60.


هذا يعني أن أي شخص قادر على حبس أنفاسه خارج الحدود التالية سيعتبر غريبًا:


الحد السفلي : Q1 – 1.5 * IQR = 15 – 1.5 * 60 = -75 ثانية


الحد العلوي : Q3 + 1.5 * IQR = 75 + 1.5 * 60 = 165 ثانية


سيتم اعتبار أي محررين يمكنهم حبس أنفاسهم لمدة 10 دقائق أو أكثر من القيم المتطرفة لأنهم يستطيعون حبس أنفاسهم لفترة أطول من


165 ثانية


.


مثال 3: القيم المتطرفة في ارتفاع الحيوان


تبلغ النسبة المئوية الخامسة والعشرون (Q1) من ارتفاع الحصان حوالي 5 أقدام بينما تبلغ النسبة المئوية الخامسة والسبعون (Q3) حوالي 5.5 قدم.


سيتم حساب النطاق الربيعي (IQR) على أنه 5.5 – 5 = 0.5 قدم.


هذا يعني أن أي حصان يبلغ ارتفاعه خارج الحدود التالية سيعتبر خارجًا:


الحد السفلي : Q1 – 1.5 * IQR = 5 – 1.5 * 0.5 = 4.25 قدم


الحد العلوي : Q3 + 1.5 * IQR = 5 + 1.5 * 0.5 = 5.75 قدم


وفقًا لموسوعة جينيس للأرقام القياسية ، فإن الرقم القياسي لأطول حصان على الإطلاق يزيد قليلاً عن 7 أقدام ، نظرًا لأن هذا أعلى من الحد الأعلى البالغ 5.75 قدمًا ، فمن الواضح أن هذا الحصان سيعتبر خارجًا.


مثال 4: القيم المتطرفة في مبيعات تذاكر الفيلم


تبلغ النسبة المئوية الخامسة والعشرون (الربع الأول) من إجمالي مبيعات التذاكر للأفلام حوالي 2 مليون دولار ، بينما تبلغ النسبة المئوية الخامسة والسبعون (الربع الثالث) حوالي 15 مليون دولار.


سيتم حساب النطاق الربيعي (IQR) على أنه 15 مليون دولار – 2 مليون دولار = 13 مليون دولار.


هذا يعني أن أي فيلم بمبيعات إجمالية خارج الحدود التالية سيعتبر خارجًا:


الحد الأدنى : الربع الأول – 1.5 * النطاق الربيعي = 2 مليون دولار – 1.5 * 13 مليون دولار = – 17.5 مليون دولار


الحد الأعلى : Q3 + 1.5 * IQR = 15 مليون دولار + 1.5 * 13 مليون دولار = 34.5 مليون دولار


حققت معظم أفلام Star Wars أكثر من 34.5 مليون دولار ، مما يجعلها ذات قيمة متطرفة من حيث مبيعات التذاكر.


مثال 5: القيم المتطرفة في النقاط المسجلة لكل لعبة


النسبة المئوية الخامسة والعشرون (Q1) التي سجلها لاعبو الدوري الاميركي للمحترفين هي حوالي 5 نقاط لكل لعبة والمئين الخامس والسبعين (Q3) هو حوالي 15 نقطة لكل لعبة.


سيتم حساب النطاق الربيعي (IQR) على أنه 15-5 = 10 نقاط.


هذا يعني أن أي لاعب يبلغ متوسطه خارج الحدود التالية سيعتبر مستبعدًا:


الحد الأدنى : Q1 – 1.5 * IQR = 5 – 1.5 * 10 = -10 نقاط


الحد العلوي : Q3 + 1.5 * IQR = 15 + 1.5 * 10 = 30 نقطة


خلال العديد من مواسم الدوري الاميركي للمحترفين ، عادةً ما يبلغ متوسط ​​اللاعب الأعلى نقاطًا ما يزيد قليلاً عن 30 نقطة في المباراة الواحدة مما يجعلها خارجة عن المألوف ويصبح متطرف القيم.[2]