قوانين الاحصاء الوصفي
يوجد ثلاثة جوانب مهمة تتعلق بالإحصاءات بوجه عام من حيث مفهوم المتغيرات والأهمية والجوانب العملية المتعلقة بالإحصاءات الوصفية والقضايا المتعلقة بأخذ العينات وأنواع أخذ العينات وتقدير حجم العينة. فما هي الإحصائيات الوصفية وكيف يمكن الاستفادة منها في المشروعات البحثية المختلفة؟
ويتم استخدام
الاحصاء الوصفي
لتقديم الأوصاف الكمية في شكل يمكن التحكم فيه، وتساعدنا الإحصائيات الوصفية على تبسيط كميات كبيرة من البيانات بطريقة معقولة، وكل إحصائية وصفية تقلل الكثير من البيانات في ملخص أبسط، وبكلمات بسيطة ، هذا يعني ما هو أو ما تعرضه البيانات من خلال وصف السمات الأساسية للمحتوى في الدراسة.
وتمثل جميع الإحصائيات الوصفية مقياس التباين أو قياس الاتجاه المركزي للمساعدة في فهم معنى البيانات التي تم تحليلها للناس من خلال الجداول والمناقشة العامة والرسوم البيانية، وهناك غرضان مفيدان عند إجراء إحصائيات وصفية وهم:
-
الأول هو تسليط الضوء على العلاقة المحتملة بين المتغيرات.
-
والثانية هي المعلومات الأساسية حول المتغيرات في مجموعة البيانات.
-
كما تشرح الإحصاءات الوصفية ملخصًا بسيطًا حول عينات متنوعة ومجموعة بيانات وما إلى ذلك. [1]
ما هي الإحصائيات الوصفية
الإحصائيات الوصفية هي معاملات وصفية موجزة تلخص مجموعة بيانات معينة ، والتي يمكن أن تكون إما تمثيلًا لكامل أو عينة من السكان، ويتم تقسيم الإحصاءات الوصفية إلى مقاييس الاتجاه المركزي ومقاييس التقلب (الانتشار)، وتشمل مقاييس الاتجاه المركزي المتوسط والوسيط والوضع، بينما تشمل مقاييس التباين الانحراف المعياري والتباين والمتغيرات الدنيا والقصوى والتفرطح والانحراف.
أهمية الإحصاء الوصفي
إن فهم الإحصائيات الوصفية تساعد الإحصائيات الوصفية ، باختصار ، على وصف ميزات مجموعة بيانات محددة وفهمها من خلال تقديم ملخصات قصيرة حول العينة ومقاييس البيانات.
وأكثر أنواع الإحصائيات الوصفية المعترف بها هي مقاييس المركز: الوسط ، والوسيط ، والوضع ، والتي يتم استخدامها على جميع مستويات الرياضيات والإحصاءات تقريبًا.
ويتم حساب المتوسط أو المتوسط عن طريق إضافة كافة الأشكال الموجودة في مجموعة البيانات ثم القسمة على عدد الأشكال داخل المجموعة،
فعلى سبيل المثال ، مجموع مجموعة البيانات التالية هو 20: (2 ، 3 ، 4 ، 5 ، 6). المتوسط هو 4 (20/5).
إن وضع مجموعة البيانات هو القيمة التي تظهر في أغلب الأحيان ، والوسيط هو الشكل الموجود في منتصف مجموعة البيانات، وهو الرقم الذي يفصل بين الأرقام الأعلى والأرقام السفلية ضمن مجموعة بيانات.
ومع ذلك ، هناك أنواع أقل شيوعًا من الإحصائيات الوصفية التي لا تزال مهمة للغاية، حيث يستخدم الأشخاص إحصاءات وصفية لإعادة استخدام رؤى كمية يصعب فهمها عبر مجموعة كبيرة من البيانات في أوصاف صغيرة، فعلى سبيل المثال ، يوفر متوسط درجات الطالب (GPA) فهمًا جيدًا للإحصاءات الوصفية.
كما تتمثل فكرة المعدل التراكمي في أنه يأخذ نقاط بيانات من مجموعة واسعة من الاختبارات والفصول والدرجات ، ويحسبها معًا لتوفير فهم عام للقدرات الأكاديمية العامة للطالب، ويعكس المعدل الشخصي للطالب أداءه الأكاديمي المتوسط. [2]
الفرق بين الإحصاء الوصفي والاستدلالي
تتضمن الإحصائيات الوصفية تلخيص وتنظيم البيانات حتى يمكن فهمها بسهولة، والإحصائيات الوصفية ، على عكس الإحصائيات الاستدلالية ، تسعى إلى وصف البيانات ، لكنها لا تحاول استنتاج العينة من جميع السكان.
نحن عادة وصف البيانات في عينة، والعينة هي الجزء المختار من المجتمع ، والذي يتم اختياره غالبًا من خلال عملية عشوائية (مثل أخذ العينات العشوائية البسيطة ، أو نهج أخذ العينات العشوائية الطبقية الأكثر تعقيدًا)، ويتكون السكان من تلك الكيانات أو الأفراد أو الأشياء ذات الاهتمام. على سبيل المثال ، قد نشعر بالقلق حيال قياس قطر صنوبر اللوبولي (شجرة صنوبرية شائعة في ولاية كارولينا الشمالية) في منطقة غابة في غابة ديوك – يشمل السكان المعنيون فصيصات اللوبولي في منطقة الغابات ، في حين أن العينة ستكون تلك الأشجار تم اختياره للقياس.
وقد تكون البيانات التي نجمعها إما نوعية (قد تسمى أيضًا فئوية أو اسمية) أو كمية (رقمية)، الجنس ، تركيز MEM ، دولة المنشأ كلها مقاييس نوعية أو فئوية ، في حين أن الطول ، المسافة ، عدد الطلاب في الفصل هي كمية، ولا يوجد ترتيب طبيعي في البيانات الفئوية ، مجرد فئات مميزة يمكن من خلالها وضع فرد / كائن، و
قد تكون البيانات الكمية إما منفصلة (مثل تعداد الأنواع التي تحدث في قطعة الأرض) أو مستمرة (مثل الارتفاع). [3]
المقاييس الوصفية في علم الإحصاء
تنقسم المقاييس الوصفية إلى نوعان وهم:
- مقاييس النزعة المركزية (Measures of Central Tendency): وهي تتضمن عدد من المقاييس وهي ( الوسط الحسابي – الوسيط – و المنوال)
- مقاييس التشتت (Measures of Dispersion): وهي تتضمن عدد من المقاييس وهي (المدى – والانحراف المعياري).
مقاييس النزعة المركزية (Measures of Central Tendency)
وتمثل القيمة المركزية أو كما تعرف باللغة الإنجليزية (Central Value) حيث نجد أن البيانات في الغالب تتمركز حول قيمة محددة، و في هذه الحالة، نقوم باستخدام المقاييس المركزية لتمثيل وشرح البيانات ومن أهم المقاييس الخاصة بالنزعة المركزية ما يلي:
-
الوسط الحسابي (Mean) :
ونحصل عليه من خلال قسمة مجموع البيانات الموجوده أمامنا على عددها.
مثال:
لدينا عشرون أسرة و نريد معرفة ما هو الوسط الحسابي لعدد الأفراد داخل الأسرة، لذا نقوم بجمع كل عدد الأفراد في كافة الأسر ومن ثم نقوم بتقسيمها على 20 وهو العدد المخصص للأسر المحدد في عينة الدراسة. -
الوسيط (Median):
وهو ذلك القيمة المركزية الخاصة بمجموعة البيانات، ونحصل عليه من خلال القيام أولاً بترتيب البيانات تصاعدياً أو ترتيباً تنازلياً، فمثلاً:
إذا كان إجمالي عدد المشاهدات رقماً فرديًا: فإن الوسيط هنا يكون هو القيمة الوسطى.
وإذا كان عدد المشاهدات رقماً زوجيًا: فإن الوسيط هنا يكون هو الوسط الحسابي للقيمتين الموجودتين في المنتصف. -
المنوال (Mode):
وهو ذلك القيمة الشائعة أو القيمة الأكثر تكرارًا بين كافة البيانات أو كل ما يتاح لنا من المشاهدات. [4]
مقاييس التشتت (Measures of Dispersion)
أما في بعض الأحيان نجد أن البيانات تكون قريبة جداً من القيمة المركزية (Central Value) و أحيانًا نجد أن البيانات تكون منتشرة ولكن في مدى أوسع من حولها، وحتى نتمكن من قياس مدى قرب أو بعد البيانات عن تلك القيمة المركزية فإننا نستخدم ما يعرف بمقاييس التشتت، ومن أشهر وأهم مقاييس التشتت ما يلي:
-
المدى (Range):
والمقصود به هو الفرق بين القيمة الأكبر في البيانات والقيمة الأصغر، ومثال ذلك:لدينا مثلاً درجات الطلاب، وحساب المدى لذا نقوم بطرح القيمة الأعلى من بين درجات الطالب في المجموعة ولتكن أفتراضاً (77) وما بين أقل درجة من بين درجات الطالب في المجموعة ولتكن أفتراضاً (50) ، فتكون قيمة المدى تساوي 77 – 50 = 27 . -
الانحراف المعياري (Standard Deviation):
ويعد الانحراف المعياري من أهم وأبرز مقاييس التشتت بل أكثرها استخداماً وانتشارًا، لانه يعتمد في كافة استدلالاته على جميع القيم والبيانات الناتجة من العينة المتاحة، وتحديداً الانحرافات الخاصة بالمشاهدات الخاصة بالوسط الحسابي ولكن الصعوبة في أن تطبيق حساب الانحراف المعياري يتطلب إلمام ومعرفة بكافة العمليات الرياضية الأخرى، ولكنها تصبح تلك العملية معقدة جداً كلما كان الحجم الخاص بالعينة كبيراً، لذا فاللجوء إلى حسابه بشكل إلكتروني عن طريق استخدام الدالات الحسابية جاهزة بل وأكثر صحة من حسابه بشكل يدوي.
قوانين الإحصاء الوصفي
الموقع والتشتت
الحاجة الإحصائية الأساسية هي تلك التي تصف مجموعة من الملاحظات من حيث عدد قليل من الكميات المحسوبة – الإحصائيات الوصفية – التي تعبر بشكل مضغوط عن أهم السمات البارزة لمواد المراقبة.
بعض الإحصائيات الوصفية الشائعة هي متوسط العينة والمتوسط والانحراف المعياري ومعامل الارتباط. وبالطبع ، فإن المرء مهتم أيضًا بالكميات الوصفية المقابلة للسكان الأساسيين الذين تم استخلاص عينة الملاحظات منهم ؛ عادة ما يُنظر إلى هذه الإحصاءات الوصفية السكانية على أنها عينات وصفية عينة لعينات افتراضية كبيرة جدًا ، كبيرة جدًا بحيث يصبح تباين العينات ضئيلًا.
الوسيط أو المتوسط المعمم
معظم الإحصائيات الوصفية للموقع ، وإن لم يكن جميعها ، تتعامل مع متوسط معمم – أي أن بعض وظائف الملاحظات التي تفي بالقيود الحدسية من النوع التالي: (ب) يجب أن تكون دون تغيير بموجب إعادة ترتيب الملاحظات ؛ (ج) إذا كانت جميع الملاحظات متساوية ، فيجب أن يكون للوسط المعمم قيمتهما المشتركة. هناك العديد من الوسائل المعممة المحتملة ؛ أولئك الذين تم اختيارهم للمناقشة هنا لديهم تفسيرات مفيدة ومعقولة من الناحية الحسابية ولديهم تقاليد في الاستخدام.
لأن الإحصائيات الوصفية لتوزيع التشتت توفر معلومات حول تشتت الملاحظات الفردية، وعادة ما يتم إنشاء هذه الإحصائيات بحيث تصبح أكبر حيث تصبح العينة أقل تجانسًا.
تمثل عائلة مهمة من مقاييس الموقع ما يسمى الاتجاه المركزي لمجموعة من الملاحظات في إحدى الحواس المختلفة، افترض أن الملاحظات تشير إلى xl ، X2 ، … ، xn. ثم المتوسط العادي أو المتوسط الحسابي ومع ذلك ، إذا تم تحديد دالة ، f ، وتم النظر في متوسط f (x-i) ، فسيتم تحديد المتوسط المعمم المرتبط ، M ، بواسطة يكون الجمع من 1 إلى n ، و f لها نفس المعنى على جانبي المعادلة المحددة.
المتوسط الحسابي
بالنسبة للمتوسط الحسابي ، f هي دالة الهوية. بالنسبة للمتوسط الهندسي (عندما تكون جميع قيم x موجبة) ، فإن f هي دالة اللوغاريتم – أي log M = (1 / n) 2 logx¡ ، بحيث لكي يكون هذا الإجراء منطقيًا ، يجب أن توفر f علاقة رأس برأس بين القيم المحتملة لـ Xi والقيم المحتملة لـ f (x¡).
في بعض الأحيان تكون الاتفاقيات الخاصة ضرورية. بالنسبة لأي من هذه الوسائل المعممة ، فإن القيود الحدسية الثلاثة المذكورة سابقًا تكون راضية بشكل واضح عندما تزداد f رتيبة، وبالإضافة إلى ذلك ، فإن أي تغيير في أي علامة x واحدة ، مع إصلاح الآخرين ، يغير قيمة M، وأربعة من الوسائل المعممة العديدة التي تحتوي على هذه الخصائص مدرجة في الجدول بشكل عام. [5]
التوزيع الطبيعي
في بعض الأحيان تعرض مجموعة البيانات شكلًا معينًا يتم توزيعه بالتساوي حول المتوسط. يسمى هذا التوزيع التوزيع الطبيعي، ويمكن أن يطلق عليه أيضًا التوزيع الغوسي أو منحنى الجرس. على الرغم من أن درجات الامتحان لا يتم توزيعها دائمًا بهذه الطريقة ، فإن عبارة “التقدير على منحنى” تأتي من ممارسة تعيين الدرجات بناءً على منحنى الجرس الموزع بشكل طبيعي.
فإن متوسط درجة الاختبار (61) سيحصل عادةً على D-minus – وليس درجة جيدة جدًا! ومع ذلك ، يمكن استخدام التوزيع الطبيعي من أجل “التقدير على منحنى” بحيث يحصل الطلاب في مركز التوزيع على درجة أفضل مثل C ، في حين يتم تعديل درجات الطلاب المتبقين أيضًا بناءً على بعدهم النسبي من المتوسط . [6]