الإحصاء الوصفي
ما هو الإحصاء الوصفي؟
يُعرف الإحصاء الوصفي بملخص يصف المعلومات والبيانات التي تم استخراجها من دراسة معينة، كما يعتبر أساس للتحليل الكمي للبيانات.
مفهوم الإحصاء الوصفي
يُساعد الإحصاء الوصفي في تلخيص البيانات على فهمها بشكل جيد، من خلال تقديم وصف بسيط يلخص أهمية، وميزات هذه البيانات، وغالباً ما يُستخدم عند وجود كمية كبيرة من البيانات، والتي تحتاج إلى تفسير شامل يلخصها، فعلى سبيل المثال، يُستخدم الإحصاء الوصفي في حساب المعدل التراكمي لدرجات الطلاب، والذي يُرمز له بـ (GPA)، حيث يُلخص هذا المعدل جميع درجات الطلاب في الاختبارات، والفصول، ويضعها على شكل رقم واحد، كتلخيص لأداء الطالب الأكاديمي طوال الفترة التي يقضيها في المدرسة، أو الجامعة.
أنواع الإحصاء الوصفي
تتعدد أنواع الإحصائيات الوصفية، حيث تُقسم إلى قسمين رئيسين، أحدهما يقيس مقدار تشتت البيانات، أو يقيس التباين ، والآخر يقيس الاتجاه المركزي للبيانات، وفيما يلي أنواع الإحصاء الوصفي:
مقياس النزعة المركزية أو Central Tendency
يُركز مقياس النزعة المركزية على القيم المتوسطة للبيانات، وذلك من خلال تحديد أماكن تكرار كل نقطة من البيانات، ووصفها باستخدام المتوسط، أو الوسيط، أو المنوال، وتحليل البيانات على هذا الأساس، ثم يتم عرض البيانات على شكل رسوم بيانية، أو جداول، أو مناقشات، للمساعدة على فهم الاستنتاج الكلي منها.
مقاييس التباين أو Measures of Variability
تُحدد مقاييس التباين، أو مقاييس الانتشار، كيف يتشتت توزيع مجموعة من البيانات، ويختلف هذا النوع عن مقاييس النزعة المركزية، حيث يُظهر كيفية تم توزيع البيانات داخل المجموعة، على عكس النزعة المركزية التي تظهر متوسط البيانات فقط، فعلى سبيل المثال، كان متوسط درجات الطلاب لامتحان العلوم من 65 من 100، فهنا يظهر مقياس النزعة المركزية، ولكنه لا يظهر البيانات التي بين 1 و 100، بالإضافة إلى ذلك، يعتبر المدى، والانحراف المطلق، من أنواع مقاييس التباين.
التوزيع أو الـ Distribution
يُركز التوزيع في الإحصاء الوصفي على شرح كيف تم توزيع البيانات، ووضعها في جداول أو رسوم بيانية ، كما يساعد توزيع البيانات في معرفة تكرار كل قيمة في المتغيرات، فعلى سبيل المثال، إذا كان هناك دراسة عن ظاهرة ما، وكان الاستبيان موزع على ذكور وإناث، فسيظهر التوزيع عدد الذكور الذين شاركوا في الدراسة مقارنةً بعدد الإناث.
أنواع مقياس النزعة المركزية
يُقسم مقياس النزعة المركزية إلى ثلاثة أنواع رئيسية، وتشمل التالي:
المتوسط الحسابي أو Mean
يُعرف المتوسط الحسابي بالرقم الذي تنتشر حوله البيانات، ويتم حسابه عن طريق جمع كل البيانات وتقسيمها على عددها.
الوسيط أو Median
يُعرف الوسيط بالنقطة التي تقع في الوسط، أي النقطة التي تقسم البيانات إلى نصفين متساويين، ويتم حسابه عن طريق ترتيب البيانات بشكل تصاعدي أو تنازلي، فإذا كان عدد البيانات فردي، فيتم أخذ القيمة التي في الوسط مباشرة، أما إذا كان عدد البيانات زوجي، فيؤخذ مجموع القيمتين التان في الوسط وتقسيمهم على 2.
المنوال أو Mode
يُعرف المنوال بالقيمة أو الرقم الأكثر تكراراً بين مجموعة البيانات، وفي حال وجود قيمة واحدة فقط متكررة، يُسمى بـ Uni-modal، أما إذا كان هناك قيمتين تتكرران بنفس عدد التكرارات فيسمى بـ Bi-modal، أما إذا كان هناك أكثر من قيمتين تتكرر بنفس عدد التكرارت فيسمى بـ Multi-modal.
أنواع مقياس التباين
يوجد أربعة أنواع لمقاييس التباين أو التشتت، والتي تشمل التالي:
المدى أو Range
يُحسب المدى عن طريق إيجاد الفرق بين القيمة الأصغر والقيمة الأكبر في البيانات.
التباين أو Variance
يُحسب التباين عن طريق أخذ ناتج طرح المتوسط الحسابي لجميع القيم مربعة من المتوسط تربيع، وتعتبر هذه الطريقة هي الأكثر شيوعاً.
الانحراف المعياري أو Standard deviation
يُحسب الانحراف المعياري عن طريق حساب الجذر التربيعي للتباين.
معامل التجانف أو Skewness
يُعرف معامل التجانف باتجاه عدم التناسق في توزيع البيانات عند رسمها في رسم بياني، حيث يمكن تحديده عن طريق أن يكون موجباً، أو سالباً، أو غير محدد، ويعرف الانحراف الإيجابي عندما يكون الذيل على الجانب الأيمن من المنحنى أكبر، وفي هذه الحالة يكون المتوسط أكبر من المنوال، أما في حالة الانحراف السلبي، فيكون الذيل على الجانب الأيسر من المنحنى أكبر، وعندها يكون المتوسط أصغر من المنوال، أما إذا كان صفر، أو غير محدد، فعندها يكون توزيع البيانات متماثلاً.