ماهو التباين في الإحصاء وخصائصه
ماهو التباين في الإحصاء
التباين هو مقياس لتوزيع نقاط البيانات من المتوسط، يشير التباين المنخفض إلى أن نقاط البيانات متشابهة بشكل عام و لا تختلف كثيرًا عن المتوسط، يشير التباين الأعلى إلى أن قيم البيانات لها تباين أكبر و يتم توزيعها على نطاق أوسع من المتوسط،اذ تتوفر حاسبة التباين و التي تعثر على التباين و الانحراف المعياري و حجم العينة n و المتوسط و مجموع المربعات، يمكنك أيضًا عرض العمل المنظم للحساب فقط أدخل مجموعة بيانات بقيم مفصولة بمسافات أو فواصل أو فواصل أسطر، يمكنك نسخ و لصق بياناتك من مستند أو جدول بيانات، وهو ما يمكن ملاحظته عن معرفة
مميزات وعيوب التباين
يعد التحكم في التباين أمرًا ضروريًا للإنتاج و الجودة لأن تقليل تباين العملية يزيد من الدقة و يقلل من عدد العيوب، على سبيل المثال ، ينتج المصنع مسامير أعمال خشبية بطول 50 مم و المسمار يلبي المواصفات إذا كان في حدود 2 مم من القيمة المستهدفة بطول 50 مم، يستخدم المصنع نوعين من الآلات لإنتاج المسامير، تنتج كلتا الآلتين مسامير بطول متوسط يبلغ 50 مم بأطوال موزعة بشكل طبيعي.
و مع ذلك ، فإن مسامير كل آلة لها اختلافات مختلفة: تنتج الماكينة أ مع توزيع خط مستقيم على النحو التالي مسامير متباينة مقاس 9 مم 2 و الآلة ب مع خطوط منقطة موزعة على النحو التالي ، و المسامير ذات الفروق 1 مم 2 مصنوعة بحدود مواصفات علوية و سفلية كل آلة، يتم تطبيق توزيعات طول الظفر:
طول الظفر من الآلة أ له تباين أكبر من طول الظفر من الآلة ب، لذلك ، فإن أي مسمار من الآلة أ يكون على الأرجح خارج المواصفات من مسمار من الآلة ب.[1]
خصائص التباين بالامثلة
التباين هو إحصاء يستخدم لقياس انحراف التوزيع الاحتمالي، الانحراف هو ميل النتائج إلى الاختلاف عن القيمة المتوقعة، تسمح دراسة التباين للفرد بقياس التباين في توزيع الاحتمالات، سيكون للتوزيعات الاحتمالية ذات النتائج المتباينة اختلافًا كبيرًا، التجارب المحتملة ذات النتائج القريبة من بعضها البعض سيكون لها اختلاف بسيط، يختلف التباين الذي تم فحصه في هذه الصفحة عن تباين العينة ، و هو التباين في عينة البيانات.
تتوافق خصائص التباين التالية مع العديد من خصائص القيمة المتوقعة ، و مع ذلك ، فإن بعض هذه الخصائص لها نتائج مختلفة
من أجل ثابت c
Var [c] = 0.
نحن لدينا
Var[c]=E[(c−E[c]) 2 ]=E[(c−c) 2 ]=0.
للمتغير العشوائي XX و أي ثابت c
Var[cX]=c 2 Var[X]. 2
بخصائص التوقع E[cX]=cE[X]=cμ. ثم
Var[cX] =E [(cX−cμ) 2]
=E[c 2(X−μ) 2]
=c 2E[(X−μ) 2]
=c 2 Var[X].
للمتغير العشوائي XX وأي ثابت c
Var[X+c]=Var[X].
Var[X+c]
=E[(X+c) 2]−(μ+c) 2
=E[X 2+2cX+c 2]−(μ 2+2cμ+c 2)
=E[X 2]+2cE[X]+(c 2−μ 2−2cμ−c 2)
=E[X 2 ]−μ 2=Var[X].
توضح النظريتان المذكورتان أعلاه كيف أن ترجمة أو قياس المتغير العشوائي بواسطة ثابت يغير التباين، توضح النظرية الأولى أن قياس قيم متغير عشوائي بواسطة ثابتجج يقيس التباين حسب c ^ 2c
هذا منطقي بشكل حدسي لأن التباين يتم تعريفه من خلال مربع الاختلافات عن المتوسط، توضح النظرية الثانية أن ترجمة جميع المتغيرات بواسطة ثابت لا يغير التباين، يعتبر هذا أيضًا منطقيًا ، نظرًا لأن ترجمة جميع المتغيرات بواسطة ثابت يترجم أيضًا القيمة المتوقعة ، و يظل انتشار القيم المترجمة حول القيمة المتوقعة المترجمة دون تغيير.
من الخاصية الخطية للقيمة المتوقعة ، لأي متغيرين عشوائيينXX و Y
E (X + Y) = E (X) + E (Y).E ( X+Y )= E ( X )+ E ( Y ) .
و مع ذلك ، هذا لا ينطبق على التباين بشكل عام. إحدى الحالات الخاصة التي ينطبق عليها هذا هي ما يلي:
دع XX و Y تكون متغيرات عشوائية مستقلة ثم
Var(X+Y)=Var(X)+Var(Y)
نحن لدينا
Var(X+Y)=E((X+Y) 2 )−(E(X+Y)) 2
=E(X 2 +2XY+Y 2 )−(E(X)+E(Y)) 2
=E(X 2 )+2E(XY)+E(Y 2 )−(E(X) 2+2E(X)E(Y)+E(Y) 2)
=E(X 2 )+2E(X)E(Y)+E(Y 2 )−E(X) 2−2E(X)E(Y)−E(Y) 2
=E(X 2 )−E(X) 2 +E(Y 2 )−E(Y) 2
=Var(X)+Var(Y),
حيث الحساب E(XY)=E(X)E(Y) في السطر الرابع يتبع استقلالية المتغيرات العشوائية XX و Y: فيما يلي تعميم للنظرية أعلاه.
X 1,X 2,…,X k
تكون المتغيرات العشوائية المستقلة الزوجية. ثم
Var(X 1+X 2+⋯+X k
)=Var(X 1)+Var(X 2)+⋯+Var(X k).
للمتغيرات العشوائية غير المستقلة XX و ص
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y).
نحن لدينا
Var(X+Y)=Cov(X+Y,X+Y)
=Cov(X,X)+Cov(Y,Y)+2Cov(X,Y)
=Var(X)+Var(Y)+2Cov(X,Y).
[2]
خطوات حساب التباين
عادةً ما يتم حساب التباين تلقائيًا بواسطة البرنامج الذي تستخدمه لتحليلك الإحصائي، و مع ذلك ، يمكنك إجراء الحساب يدويًا للحصول على فهم أفضل لكيفية عمل الصيغة، هناك خمس خطوات رئيسية لإيجاد التباين يدويًا، سنستخدم مجموعة بيانات صغيرة من 6 خطوات لتصفح الخطوات.
مجموعة البيانات 46 69 32 60 52 41
الخطوة 1
- ابحث عن السيارة
- اجمع كل الدرجات لإيجاد المتوسط ثم قسّمه على عدد النقاط.
- متوسط (x̅)
- X̅ = (46 + 69 + 32 + 60 + 52 + 41) 6 = 50
الخطوة 2
- ابحث عن انحراف كل درجة عن المتوسط
- اطرح المتوسط من كل درجة للحصول على الانحرافات عن المتوسط.
- بما أن x̅ = 50 ، اطرح 50 من كل درجة.
- سجل هدفًا للخروج عن المتوسط
- 46 46-50 = -4
- 69-50 = 19
- 32 32-50 = -18
- 60 60-50 = 10
- 52 52-50 = 2
- 41 41-50 = -9
الخطوة 3
- قم بتربيع كل انحراف عن المتوسط
- اضرب كل انحراف عن المتوسط في حد ذاته، سيؤدي هذا إلى أرقام موجبة.
- مربع الانحرافات عن الوسط
- (-4) 2 = 4 × 4 = 16
- 19 2 = 19 × 19 = 361
- (-18) 2 = -18 × -18 = 324
- 10 2 = 10 × 10 = 100
- 2 2 = 2 × 2 = 4
- (-9) 2 = -9 × -9 = 81
الخطوة 4
- أوجد مجموع المربعات
- أضف كل الانحرافات المربعة. هذا يسمى مجموع المربعات.
- مجموع المربعات
- 16 + 361 + 324 + 100 + 4 + 81 = 886
الخطوة 5
- قسّم مجموع المربعات على n – 1 أو N.
- قسّم مجموع المربعات على n – 1 (على سبيل المثال) أو N (على سبيل المثال).
- نظرًا لأننا نعمل على مثال ، سنستخدم n – 1 ، حيث n = 6.
- فرق
- 886 ÷ (6-1) = 886 5 = 177.2[3]
كيفية عمل التباين
يتم حساب التباين من خلال إيجاد مربع الانحراف المعياري للمتغير وتغاير المتغير مع نفسه ، كما تمثله الوظيفة:
σ2 = ∑ (x- μ) / 2 ن
- في الصيغة أعلاه ، u هو متوسط نقاط البيانات ، و x هي قيمة نقطة البيانات الفردية ، و N هو العدد الإجمالي لنقاط البيانات
- من المهم ملاحظة أنه نظرًا لأن الصيغة تعمل مع مربع الانحرافات
- فسيكون التباين دائمًا رقمًا موجبًا أو صفرًا، إذا كان التباين صفرًا ، فمن المحتمل أن يكون لجميع الإدخالات نفس القيمة.
- و المثل ، يشير التباين الكبير إلى أن الأرقام في المجموعة بعيدة عن المتوسط و عن بعضها البعض.
- بالإضافة إلى ذلك ، يمكن تعديل معادلة التباين بحيث إذا تم قياس قيم مجموعة البيانات بواسطة ثابت ، على سبيل المثال ، عندئذٍ يتم قياس التباين بمربع ذلك الثابت.
- غالبًا ما يستخدم التباين في الإحصائيات كطريقة لفهم توزيع مجموعة البيانات بشكل أفضل.
- من عيوب التباين أنه يركز على القيم بعيدة المدى (بعيدًا عن المتوسط) ، و يمكن لمربع هذه الأرقام أن يحرف الاستنتاجات حول البيانات.
- و مع ذلك ، نظرًا لمبدأ التغاير غير السلبي ، سيتمكن المرء دائمًا من تفسير التباين ، حيث يتم حساب جميع الانحرافات عن المتوسط بالتساوي ، بغض النظر عن الاتجاه.[4]