أنواع البيانات والمتغيرات الإحصائية والفرق بينها

ما هي البيانات الإحصائية

تشير كلمة بيانات إلى الملاحظات والقياسات التي تم جمعها بطريقة ما غالبا من خلال البحث، وهي أجزاء فردية من المعلومات الواقعية المسجلة والمستخدمة لغرض التحليل، فهي المعلومات الأولية التي يتم من خلالها إنشاء الإحصائيات.

ما هي المتغيرات الإحصائية

المتغيرات هي الخصائص أو السمات التي تراقبها وتقوم بـ قياسها وتسجيلها، والمتغير الإحصائية هو متغير له قيم منفصلة تختلف من خلال أسباب عشوائية وعندما يتم ترتيبها بالترتيب تشكل توزيع أو مصفوفة إحصائية.[5]


أنواع البيانات الإحصائية


تعتبر أنواع البيانات مفاهيم مهمة في الإحصاء، فهي تمكننا من تطبيق القياسات الإحصائية بشكل صحيح على البيانات وتساعد في استنتاج بعض الافتراضات بشكل صحيح حولها، ويعد الحصول على فهم كافٍ لأنواع البيانات المختلفة أمراً ضرورياً بشكل كبير لإجراء تحليل البيانات الاستكشافية، حيث يمكن استخدام بعض القياسات الواقعية لأنواع بيانات معينة فقط، لذلك تحتاج إلى معرفة تحليل البيانات ونوعه الذي تعمل عليه لتحديد أسلوب الإدراك الصحيح، ويمكن اعتبار أنواع البيانات بمثابة نهج لترتيب أنواع مختلفة من المتغيرات، وهناك فئتان فقط من البيانات في الإحصاء، وهما البيانات النوعية والكمية وسوف يتم شرح النوعين فيما يلي بالتفصيل:


البيانات النوعية


وهي عبارة عن مجموعة من المعلومات التي لا يمكن قياسها في شكل أرقام، وتُعرف أيضاً باسم البيانات الفئوية، وتقدم معلومات حول صفات الأشياء في البيانات، ويمكن أن تأتي نتيجة تحليل البيانات النوعية في نوع عرض الكلمات الرئيسية واستخراج البيانات وصياغة الأفكار،


وهي تنقسم إلى نوعين وهما:


  • البيانات الاسمية


تُستخدم البيانات الاسمية لتسمية المتغيرات حيث لا توجد قيمة كمية وليس لها ترتيب، وتقوم فقط بتسمية شيء ما دون التقدم بطلب للحصول على أي ترتيب معين، لذلك إذا قمت بتغيير ترتيب

القيم

ة فسيظل المعنى كما هو، وبالتالي يتم ملاحظة البيانات الاسمية ولكن لا يتم قياسها وهي غير مرتبة، وغير متساوية البعد، وليس لها صفر ذو معنى.


أمثلة على البيانات الاسمية:


  • الجنس (النساء والرجال).

  • لون الشعر (أشقر، بني، أسمر، أحمر، إلخ).

  • الحالة الاجتماعية (متزوج، أعزب، أرمل).

  • ما اللغات التي تتحدثها؟ (إنجليزي، ألماني، فرنسي).

  • ما هي جنسيتك؟ (أمريكي، هندي، ياباني، ألماني).


كما في الأمثلة السابقة لا يوجد ترتيب جوهري للمتغيرات، فلون العين هو متغير اسمي له مستويات أو فئات قليلة مثل

الأزرق

والأخضر والبني وما إلى ذلك، ولا توجد طريقة ممكنة لترتيب هذه الفئات بطريقة مرتبة، أي من الأعلى إلى الأدنى أو العكس، فلا يمكنك تنظيم البيانات الاسمية لذلك لا يمكنك فرزها، وجدير بالذكر أنك لن تكون قادر على القيام بأي مهام رقمية حيث يتم حفظها للبيانات الرقمية باستخدام البيانات الاسمية، حيث يمكنك

حساب

التكرارات والنسب والنسب المئوية والنقاط المركزية.


  • البيانات الترتيبية


البيانات الترتيبية هي نفسها البيانات الاسمية تقريباً ولكن ليس في حالة الترتيب حيث يمكن ترتيب فئاتها مثل الأول والثاني وما إلى ذلك، ومع ذلك لا توجد استمرارية في المسافات النسبية بين الفئات المتجاورة، ويتم ملاحظة البيانات الترتيبية ولكن لا يتم قياسها، وهي مرتبة ولكنها ليست متساوية البعد، وليس لها صفر ذي معنى، وتستخدم المقاييس الترتيبية دائماً لقياس

السعادة

والرضا وما إلى ذلك.


باستخدام البيانات الترتيبية وبالمثل مع البيانات الاسمية يمكن تجميع المعلومات من خلال تقييم ما إذا كانت مكافئة أو غير عادية، وعندما يتم ترتيب البيانات الترتيبية يمكن ترتيبها عن طريق إجراء مقارنات أساسية بين الفئات، على سبيل المثال أكبر أو أقل من، أعلى أو أقل، وهكذا، ولا يمكن القيام بأي أنشطة عددية باستخدام البيانات الترتيبية.


باستخدام البيانات الترتيبية يمكن حساب نفس الأشياء مثل البيانات الاسمية مثل الترددات والنسب والنسبة المئوية والنقطة المركزية ولكن هناك نقطة أخرى مضافة في البيانات الترتيبية وهي إحصائيات موجزة وإحصاءات بايزية بالمثل.


أمثلة على البيانات الترتيبية:


  • ترتيب المستخدمين في المسابقة: الأول والثاني والثالث، إلخ.

  • تصنيف المنتج الذي اتخذته الشركة على مقياس من 1-10.

  • الوضع الاقتصادي: منخفض ومتوسط ​​وعالي.[1]


البيانات الكمية


البيانات الكمية هي مجموعة من المعلومات التي تم جمعها من مجموعة من الأفراد وتتضمن تحليل البيانات الإحصائية، وهي تعطي معلومات حول كميات العناصر في البيانات والعناصر التي يمكن تقديرها، ويمكن صياغتها بدلالة الأعداد،


وهي تنقسم إلى:


  • بيانات فاصلة


يتم قياس بيانات الفاصل الزمني وترتيبها باستخدام أقرب العناصر ولكن ليس لها صفر ذي معنى، وتكون النقطة المركزية لمقياس الفاصل الزمني هي أن كلمة “الفاصل الزمني” تشير إلى “المسافة بين”، وهو الشيء المهم الذي يجب تذكره، فالمقاييس الفاصلة لا تعلمنا بالترتيب فحسب، بل تعلِّمنا أيضاً القيمة بين كل عنصر.


ويمكن أن تكون بيانات الفاصل الزمني سالبة، على الرغم من أن بيانات النسبة لا يمكن أن تكون، على الرغم من أن بيانات الفاصل الزمني يمكن أن تظهر بشكل أساسي مثل بيانات النسبة، فإن الشيء المهم هو في نقاط الصفر المميزة، إذا تم اختيار نقطة الصفر في المقياس بشكل شخصي، فلا يمكن أن تكون البيانات في هذه المرحلة بيانات نسبة ويجب أن تكون بيانات فاصلة.


وبالتالي باستخدام بيانات الفاصل الزمني، يمكن بسهولة ربط درجات البيانات وأيضاً يمكنك إضافة القيم أو طرحها، هناك بعض الإحصائيات الوصفية التي يمكن حسابها لبيانات الفاصل الزمني وهي النقطة المركزية (المتوسط ​، الوسيط، الوضع)، النطاق (الحد الأدنى، الحد الأقصى)، والانتشار (النسب المئوية، النطاق الربيعي، والانحراف المعياري)، بالإضافة إلى ذلك يمكن استخدام تقنيات تحليل البيانات الإحصائية الأخرى المماثلة لمزيد من التحليل.


  • بيانات النسبة


النسبة يتم قياس البيانات وترتيبها باستخدام عناصر متساوية البعد وصفر ذو مغزى ولا تكون أبداً سلبية مثل بيانات الفاصل الزمني، من الأمثلة البارزة لبيانات النسبة قياس الارتفاعات، يمكن قياسه بالسنتيمتر أو البوصة أو الأمتار أو القدمين وليس من الممكن عملياً أن يكون ارتفاعه سالباً.


توضح بيانات النسبة ما يتعلق بترتيب المتغيرات، والتناقضات فيما بينها، ولديها صفر تماماً، يسمح بمجموعة واسعة من التقديرات والتخمينات ليتم إجراؤها واستخلاصها، بيانات النسبة هي في الأساس نفس بيانات الفاصل الزمني، وبصرف

النظر

عن الصفر يعني لا شيء، في الإحصاء الوصفي الذي يمكن حساب لبيانات نسبة هي نفس البيانات الفاصلة التي هي النقطة المركزية (الوسط الحسابي والوسيط، واسطة)، ومجموعة (الحد الأدنى، الحد الأقصى)، وانتشار (النسب المئوية، ومجموعة الشرائح الربعية، والانحراف المعياري).


أمثلة على بيانات النسبة:



  • العمر

    (من 0 سنة إلى 100+).

  • درجة الحرارة (بالكلفن، ولكن ليس درجة مئوية أو فهرنهايت).

  • المسافة (مقاسة بمسطرة أو أي جهاز تقييم آخر).

  • الفاصل الزمني (يقاس بساعة توقف أو ما شابه).


لذلك بالنسبة لهذه الأمثلة لبيانات النسبة هناك نقطة صفر فعلية وذات مغزى مثل عمر الشخص، والصفر المطلق، والمسافة المحسوبة من نقطة أو وقت محدد جميعها بها أصفار حقيقية.


  • بيانات منعزلة


يُظهر العدد الذي يتضمن أعداداً صحيحة فقط ولا يمكننا تقسيم القيم المنفصلة إلى أجزاء، على سبيل المثال عدد الطلاب في الفصل هو مثال على البيانات، يمكن أن تأخذ البيانات المنفصلة قيماً معينة فقط ولا يمكن تقسيم متغيرات البيانات إلى أجزاء أصغر، وتحتوي البيانات المنعزلة على عدد محدود من القيم المحتملة مثل أيام الشهر، مثل


عدد العاملين في الشركة و


عدد أسئلة الاختبار التي أجبت عليها بشكل صحيح.


  • البيانات المستمرة


تمثل البيانات المستمرة القياسات وبالتالي لا يمكن حساب قيمها ولكن يمكن قياسها، مثال على ذلك هو ارتفاع الشخص والذي يمكنك وصفه باستخدام الفواصل الزمنية على خط الأعداد الحقيقي.


أمثلة على البيانات المستمرة:


أنواع المتغيرات الإحصائية


المتغير الإحصائي هو مصطلح جبري يشير إلى القيمة غير المعروفة التي ليست قيمة ثابتة في تنسيق رقمي، يتم تنفيذ مثل هذه الأنواع من المتغيرات لأنواع عديدة من البحث لإجراء عمليات حسابية سهلة، لذلك هناك العديد من الأنواع المختلفة من المتغيرات المتاحة التي يمكن تطبيقها في مجالات متنوعة، وقد تم مناقشة العديد من المتغيرات الأخرى في الحد الأدنى وهي مدرجة في قائمة المتغيرات النشطة التي يقيمها الباحث، المتغير الذي يحدث قبل المتغير المستقل يسمى متغير سابق، وهناك عدد كبير من المتغيرات الإحصائية، وهي:



  • المتغير الفئوي

    : المتغيرات التي يمكن تصنيفها في فئات، على سبيل المثال قد تحتوي فئة “ماركات معجون الأسنان” على المتغيرات Colgate و Aquafresh.


  • متغير محير

    : متغيرات إضافية لها تأثير خفي على نتائج التجربة.


  • المتغير المستمر

    : متغير له عدد لا نهائي من القيم، مثل “الوقت” أو “الوزن”.[3]


  • متغير التحكم

    : عامل في التجربة يجب أن يظل ثابتاً، على سبيل المثال في تجربة لتحديد ما إذا كان الضوء يجعل النباتات تنمو بشكل أسرع، سيكون عليك التحكم في جودة التربة والمياه.


  • المتغير التابع

    : نتيجة التجربة أثناء قيامك بتغيير المتغير المستقل، ستراقب ما يحدث للمتغير التابع.


  • المتغير المنفصل

    : متغير يمكنه أن يأخذ فقط عدداً معيناً من القيم، على سبيل المثال “عدد السيارات في ساحة انتظار” منفصل لأن موقف السيارات يمكنه استيعاب عدد كبير من السيارات فقط.


  • المتغير المستقل

    : متغير لا يتأثر بأي شيء تفعله أنت الباحث، يتم رسمها عادةً على المحور السيني.


  • المتغير الكامن

    : متغير “مخفي” يؤثر على العلاقة بين المتغير المستقل والمتغير التابع.


  • المتغير الاسمي

    : اسم آخر لمتغير فئوي.


  • المتغير الترتيبي

    : يشبه المتغير الفئوي، لكن هناك ترتيب واضح، على سبيل المثال يمكن اعتبار مستويات الدخل المنخفضة والمتوسطة والمرتفعة ترتيبية.


  • المتغير النوعي

    : فئة واسعة لأي متغير لا يمكن حسابه (أي ليس له قيمة عددية)، تندرج المتغيرات الاسمية والترتيبية تحت هذا المصطلح الشامل.


  • المتغير الكمي

    : فئة واسعة تشمل أي متغير يمكن عده أو له قيمة عددية مرتبطة به، تتضمن أمثلة المتغيرات التي تقع في هذه الفئة المتغيرات المنفصلة ومتغيرات النسبة.


  • متغيرات النسبة

    : تشبه متغيرات الفاصل الزمني، ولكنها تحتوي على صفر ذي مغزى.[4]


الفرق بين أنواع البيانات والمتغيرات الإحصائية

  • البيانات هي مجموعة من القيم للمتغيرات النوعية أو الكمية، بينما المتغير هو كمية أو خاصية يمكن أن تختلف من فرد لأخر.
  • البيانات عبارة عن الملاحظات والقياسات التي تم جمعها بطريقة ما غالباً من خلال البحث، بينما المتغيرات هي الخصائص أو السمات التي تراقبها وتقوم بـ قياسها وتسجيلها.
  • البيانات والمتغيرات ليست دقيقة ولكنها تستخدم بشكل متكرر كمرادفات.
  • تنقسم أنواع البيانات إلى بيانات نوعية وبيانات كمية، بينما المتغيرات تنقسم إلى متغيرات كمية و فئوية و ترتيبية و متغيرات الفاصل الزمني.
  • يتم إجراء أغلب عمليات التحليل الإحصائي على المتغيرات.[3]