شرح الإحصاء
تعريف علم الإحصاء
يعرف علم الإحصاء (بالإنجليزية: Statistics) بأنه علم جمع البيانات وتحليلها ومن ثم عرضها وتفسيرها، ومن الممكن أن تكون البيانات كمية؛ أي بيانات معتمدة على مقدار معين، ونوعية؛ أي تعتمد على التسميات لفئات عناصر مثل بيانات معتمدة على الجنس أو الحالة الاجتماعية، وتُصدر فيه نتائج تحليل البيانات على شكل جداول أو رسوم بيانية أو مقاييس عددية، ويمكن الاستفادة من علم الإحصاء في التنبؤات والتصنيفات وعمل الأبحاث المختلفة.
أنواع الإحصاء
يُقسم الإحصاء إلى قسمين رئيسيين؛ الإحصاء الوصفي، والإحصاء الاستنتاجي أوالاستدلالي، إذ تساعد أنواع الإحصاء على جمع البيانات حول عدد معين من العناصر والوصول للاستنتاجات وتمثيلها، وفيما يأتي توضيح لأنواع الإحصاء:
الإحصاء الوصفي
يُعرف الإحصاء الوصفي بأنه العلم القائم على النزعة المركزية والتشتت والتوزيع لبيانات عينة محددة، كما ويوضح الاختلافات في خصائص العينة الواحدة، ويهدف لوصف أو تلخيص مجموعة بيانات، مثل متوسط الانحراف المعياري أو التباين لاختبار الفرضيات وعمل التنبؤات.
مقاييس النزعة المركزية
وفيما يأتي أبرز مقاييس النزعة المركزية الخاصة بالإحصاء الوصفي:
- الوسط الحسابي: (بالإنجليزية: Mean) وهو معدل البيانات المتوفرة، والذي يُحتسب من مجموع عناصر البيانات مقسومة على عددها، فعلى فرض أن فئة تتكون من العناصر (ع1، ع2، ع3، ع4، ........)، فإن:
الوسط الحسابي = (ع1 ع2 ع3 ع4 ......) / عدد العناصر
- الوسيط: (بالإنجليزية: Median) وهو العدد أو العنصر الذي يتوسط البيانات في حال ترتيبها تصاعديًا أو تنازليًا، فعلى فرض أن هناك مجموعة بيانات كالآتي: (ع1، ع2، ع3، ع4، ع5) مرتبًة تصاعديًا، فإن الوسيط:
- إذا كان عدد البيانات فرديًا: هو العدد الذي يتوسط البيانات بعد ترتيبها أي (ع3).
- إذا كان عدد البيانات زوجيًا: فإن الوسيط = مجموع العنصرين الوسطيين /2.
- المنوال: (بالإنجليزية: Mode) وهو العنصر الأكثر تكرارًا في مجموعة من البيانات، فعلى فرض أن لدينا البيانات الآتية: (ع1، ع2، ع3، ع1، ع2، ع1،ع5)، فإن:
المنوال هو العنصر الأكثر تكرارًا وهو (ع1).
مقاييس التشتت
وفيما يأتي مقاييس التشتت الخاصة بالإحصاء الوصفي:
- المدى: (بالإنجليزية: Range) وهو الفرق بين أعلى قيمة من البيانات المتوفرة وأصغر قيمة، وقيمته تعطي مؤشرًا على مدى تقارب أو تباعد البيانات، ويعطى المدى بالعلاقة الآتية:
المدى = القيمة الأعلى - القيمة الأصغر
- الانحراف المعياري ( σ ): (بالإنجليزية:Standard Deviation) مقياس يوضح مدى تقارب أو تباعد البيانات عن متوسطها الحسابي، وهو يساوي الجذر التربيعي لمربع مجموع الفرق بين كل عنصر في البيانات والمتوسط الحسابي لها مقسومًا على عدد العناصر في المجموعة، وعلى فرض أن البيانات تمثلت كالآتي، (ع1، ع2، ع3)، وأن الوسط الحسابي (م)، فإن:
- الانحراف المعياري للعينة= (((ع1- م) (ع2- م) (ع3- م)) / عدد العناصر)
- الانحراف المعياري للمجتمع الإحصائي= (((ع1- م) (ع2- م) (ع3- م)) / (عدد العناصر -1)).
- التباين (σ): (بالإنجليزية: Variance) وهو مربع الانحراف المعياري.
- معامل التشتتت: (بالإنجليزية: Dispersion Coefficient) هو الفرق بين أكبر قيمة من بين البيانات وأصغر قيمة مقسومةً على مجموع كلا القيمتين، ويعطى معامل التشتت بالعلاقة الآتية:
معامل التشتت= (القيمة الأكبر-القيمة الأصغر)/ (القيمة الأكبر القيمة الأصغر)
يُعرف الإحصاء الوصفي بأنه العلم القائم على النزعة المركزية والتشتت والتوزيع لبيانات عينة محددة، وتقسم مقاييس النزعة المركزية إلى؛ الوسط، والوسيط، والمنوال، أما مقاييس التشتت فهي؛ المدى، والانحراف المعياري، والتباين، ومعامل التشتت، ولكل منها قانون خاص وفائدة معينة في مجال الإحصاء.
الإحصاء الاستدلالي
يُعرف الإحصاء الاستدلالي بأنه الأدوات التي تُستخدم لاستخلاص استنتاجات حول العينات كبيرة العدد، وذلك بالاعتماد على خصائص هذه العينات وربط المتغيرات في مجموعة البيانات مع بعضها البعض مثل؛ تقدير القيمة الواحدة، واختبار الفرضية، والتنبؤ، وتقدير الفاصل الزمني، وإصدار النتائج والاستنتاجات الصحيحة اعتمادًا على الاحتماليات المتوقعة، إذ يوفر الصورة الدقيقة للمخرجات الإحصائية النهائية، مثل تقدير متوسط الطلب على منتج معين من خلال مسح عينات من عادات الشراء لدى المستهلكين. وفيما يأتي تفصيل لأبرز مبادئه:
تقدير القيمة الواحدة
وهو إيجاد قيمة واحدة تقريبية لمجموعة بيانات وذلك باستخدام أحد أساليب الإحصاء الوصفي كالوسط الحسابي، إذ تزداد مقدار دقتها في حال زيادة عدد العناصر في العينة الواحدة.
تقدير الفاصل الزمني
وهو تقدير الفترة أو الفاصل الزمني الذي تقع فيه مجموعة من البيانات في عينة عشوائية معينة، ويُطلق عليها فاصل الثقة.
اختبار الفرضية
وهو اختبار قائم على التحقق من صحة فرضية مسبقة من خلال التحليل لعينة إحصائية.
التنبؤ
استخلاص النتائج والتنبؤ بها بناءً على مقاييس وصف البيانات وجمعها وتحليلها.
يُعرف الإحصاء الاستدلالي بأنه الأدوات التي تُستخدم لاستخلاص استنتاجات حول العينات كبيرة العدد، وله عدة مبادئ هي، تقدير القيمة الواحدة، وتقدير الفاصل الزمني، بالإضافة إلى اختبار الفرضيات والتنبؤ.
أمثلة على الإحصاء
يُمكن فهم مقاييس الإحصاء المختلفة بإدراج أمثلة متنوعة تُقرب التصور الرياضي الخاص بها، والآتي يوضح ذلك:
أمثلة على مقاييس النزعة المركزية
إذا علمت أن العلامات النهائية لطالب في مناهجه الدراسية كالآتي: 97، 85، 93، 91، 90، 88، 90، جد الوسط الحسابي والوسيط والمنوال لعلامات الطالب.
الحل:
- الوسط الحسابي = مجموع العلامات/ عددها
- الوسط الحسابي = (ع1 ع2 ع3 ع4 ع5 ع6 ع7) / 7
- الوسط الحسابي = (97 85 93 91 90 88 90)/ 7
- الوسط الحسابي = 634/ 7
- الوسط الحسابي = 90.57
- الوسيط = العلامة التي تتوسط علامات الطالب بعد ترتيبها تصاعديًا
- ترتيب علامات الطالب تصاعديًا: 85، 88، 90، 90، 91، 93، 97.
- الوسيط= 90.
- المنوال = العلامة الأكثر تكرارًا بين علامات الطالب.
- المنوال= 90.
أمثلة على مقاييس التشتت
إذا علمت أن درجات الحرارة في منطقة ما خلال أسبوع تتباين على النحو الآتي: 20، 30، 35، 40، 25، 15، جد المدى والانحراف المعياري والتباين ومعامل التشتت.
الحل:
- المدى = درجة الحرارة الأعلى - درجة الحرارة الأصغر
- المدى = 40-15
- المدى = 25
- الانحراف المعياري: حساب الوسط الحسابي (م) أولًا:
- الوسط الحسابي = (ع1 ع2 ع3 ع4 ع5 ع6) / عدد العناصر
- م = (20 30 35 40 25 15)/ 6
- م = 165/ 6
- م = 27.5
- الانحراف المعياري = (((ع1-م) (ع2-م) (ع3-م) (ع4-م) (ع5-م) (ع6-م)) / (عدد العناصر))
- الانحراف المعياري = (((20-27.5) (30-27.5) (35-27.5) (40-27.5) (25-27.5) (15-27.5)) / (6-1))
- الانحراف المعياري = (((56.25 6.25 56.25 156.25 6.25 156.25) / 6)
- الانحراف المعياري = (437.5/ 6)
- الانحراف المعياري = 72.9
- الانحراف المعياري = 8.538
- الوسط الحسابي = (ع1 ع2 ع3 ع4 ع5 ع6) / عدد العناصر
- التباين (σ) = مربع الانحراف المعياري.
- التباين = (8.538)
- التباين = 72.9
- معامل التشتت = (القيمة الأكبر-القيمة الأصغر)/ (القيمة الأكبر القيمة الأصغر)
- ترتيب البيانات تصاعديًا: 15، 20، 25، 30، 35، 40
- معامل التشتت = (40-15)/ (40 15)
- معامل التشتت = 25/ 55
- معامل التشتت = 0.455