إحصائيات التعلم ، من العرض التقديمي إلى مقاييس توزيع البيانات

الإحصاء هو علم رياضي يدرس جمع البيانات ومعالجتها وتحليلها وعرضها. تُستخدم الإحصائيات على نطاق واسع في شركات التأمين ، ومن بينها تحديد مبلغ قسط التأمين في بوليصة التأمين. يُطلب من كل صاحب تأمين دفع مساهمة تسمى قسطًا. القسط المدفوع يتوافق مع التغطية التأمينية التي يحصل عليها.

هنا ، تستخدم شركة التأمين الإحصائيات بحيث يكون مبلغ القسط وفقًا لمقدار التغطية التي يمكن توفيرها لصاحب التأمين. بهذه الطريقة ، يستفيد كلا الطرفين منها.

كما ذكرنا سابقًا ، فإن الإحصائيات لا تقوم فقط بجمع البيانات ومعالجتها ، ولكنها تقدم أيضًا البيانات. تستخدم الإحصائيات أيضًا العديد من مقاييس توزيع البيانات في معالجة البيانات. سنناقش اليوم أنواع العرض بالإضافة إلى حجم انتشار البيانات في الإحصاء.

أنواع عرض البيانات

تشمل أنواع عرض البيانات في الإحصائيات جداول توزيع التردد ، والمدرج التكراري ، والمضلعات ، و ogives.

يتمثل الشكل الأول لعرض البيانات في استخدام جدول توزيع التردد. كما يوحي الاسم ، نستخدم الجداول لعرض نوع وكمية البيانات التي تم الحصول عليها. يحتوي جدول توزيع التردد أيضًا على عدة أنواع ، وهي جدول توزيع التردد للبيانات الفردية وبيانات المجموعة.

(اقرأ أيضًا: اثنان من بيانات القياس في الإحصاء)

يتم استخدام جدول توزيع تردد البيانات الفردي لتقديم كميات صغيرة من البيانات ، على الأقل أقل من 30 بيانات. فيما يلي مثال على تقديم البيانات باستخدام جدول توزيع تردد بيانات واحد.

البيانات الواردة أدناه هي درجات الاختبار لـ 30 طالبًا. تخدم في جدول توزيع تردد بيانات واحد!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

إذا انتبهنا ، فإن أدنى درجة تم الحصول عليها في الاختبار هي 3 ، بينما أعلى درجة هي 10. ثم من هذه الدرجات ، احسب عدد الطلاب الذين حصلوا عليها. للحصول على درجة 3 ، على سبيل المثال ، طالب واحد فقط. بالنسبة للصف الرابع ، هناك 4 طلاب ، وهكذا. ثم يتم عرض هذا الرقم في جدول مثل التالي.

توربينات على أرض مزرعة الرياح البحرية

النوع التالي من جدول توزيع التردد هو جدول توزيع تردد بيانات المجموعة. يستخدم هذا الجدول لتقديم الكثير من البيانات ، والتي تزيد عن 30 بيانات. لنلق نظرة على المثال أدناه.

فيما يلي ارتفاع نباتات الفلفل الحار (بالمليمترات) في مزرعة الفلفل الحار. قدم البيانات في جدول توزيع البيانات المجمعة!

12311120128126124125122

12112612412121220125126

123123134125126128135

120126124133126127123126

1221251212321241332128124

على عكس البيانات الفردية ، يتعين علينا هنا حساب عدد الفئات وأطوال الصفوف التي سيتم عرضها في الجدول. باستخدام البيانات أعلاه ، ها هي الحسابات.

الكثير من البيانات (ن) = 40

أقصى ارتفاع (x الحد الأقصى ) = 135

الحد الأدنى للارتفاع (× دقيقة ) = 120

المدى (J) = x max  - x min = 135-120 = 15

عدد الفئات (k) = 1 + 3،3logn = 1 + 3،3 log40 = 6،2868… ≈ k = 6

طول الفصل (ج) = J / k = 15/6 = 2.5 ≈ c = 3

من هذه النتائج ، يمكننا عرض جدول توزيع بيانات المجموعة على النحو التالي.

توربينات على أرض مزرعة الرياح البحرية

بعد ذلك ، سنناقش الأنواع الأخرى من عرض البيانات المجمعة ، وبالتحديد في شكل الرسوم البيانية ومضلعات التردد و ogives. ألق نظرة على جدول التردد أدناه ، والذي يحتوي على معلومات الوزن لـ 80 من أعضاء النادي الرياضي.

توربينات على أرض مزرعة الرياح البحرية

لتقديم البيانات باستخدام رسم بياني مدرج تكراري ، نقوم أولاً ببناء مخطط ديكارتي. يُظهر المحور x الحدود العليا والسفلى لكل فئة ، بينما يُظهر المحور y التردد.

الإحصائيات 4 (1)

على عكس المدرج التكراري ، يأخذ مخطط مضلع التردد القيمة المتوسطة لفاصل الفصل ويعرضها بخطوط وفقًا للتردد.

الإحصائيات 5 (1)

أخيرًا ، عرض البيانات باستخدام منحنى تردد تراكمي موجب أو سلبي. أولاً ، قم بتمييز قيم التردد التراكمية لكل فئة فاصل زمني على المحور y. بعد ذلك ، حدد إحداثيات النقاط وفقًا لأزواج الحد الأعلى لفئة الفاصل الزمني والتردد التراكمي. قم بتوصيل النقاط في منحنى سلس.

حجم انتشار البيانات

في الإحصاء ، هناك نوعان من قياس البيانات ، وهما حجم تركيز البيانات وحجم توزيع البيانات. ما هو الشرح والفرق؟

حجم مركز البيانات هو قيمة تمثل موقع البيانات. في القياس المتمحور حول البيانات ، هناك متوسط ​​، ووضع ، ومتوسط.

المتوسط ​​أو المتوسط ​​هو الحاصل بين مجموع جميع البيانات المرصودة مع عدد كبير من البيانات. يمكننا صياغة المتوسط ​​على النحو التالي.

المتوسط ​​= (مجموع كل البيانات) / (الكثير من البيانات)

من أجل فهم أفضل ، دعنا نعمل على مشكلة المثال التالي. عدد الساعات في الأسبوع التي يحتاجها 5 أشخاص للأنشطة الاجتماعية في بيئتهم هي 10 و 7 و 13 و 20 و 15 ساعة. حدد متوسط ​​عدد الساعات التي يقضونها في الأسبوع في الأنشطة الاجتماعية!

بناءً على المشكلات المذكورة أعلاه ، يمكننا إدخال الأرقام في الصيغة على النحو التالي.

المتوسط ​​= (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

هذا يعني أن متوسط ​​عدد الساعات التي يقضونها في الأنشطة الاجتماعية هو 13 ساعة.

بصرف النظر عن المتوسط ​​أو المتوسط ​​، هناك أيضًا أوضاع. الوضع هو القيمة التي تحدث غالبًا في البيانات. لنلقِ نظرة على مثال للمشكلة التالية.

يوجد أدناه بيانات الوزن (بالكيلوجرام) لبعض طلاب الصف 7. حدد وضع البيانات!

32 ، 35 ، 33 ، 32 ، 34 ، 31 ، 35 ، 35 ، 31 ، 34 ، 35 ، 3

بادئ ذي بدء ، يجب أن نحسب عدد المرات التي تظهر فيها كل قيمة في البيانات. بناءً على هذه البيانات ، نحصل على 31 (x3) و 32 (x2) و 33 (x1) و 34 (x2) و 35 (x4). نظرًا لحدوث 35 في أغلب الأحيان ، فإن وضع البيانات أعلاه هو 35.

النوع الأخير من قياس التمركز هو الوسيط. يقسم الوسيط البيانات إلى جزأين متساويين ، وبالتالي فإن الوسيط هو القيمة المتوسطة للبيانات التي تم فرزها.

لتحديد الوسيط ، يتعين علينا أولاً فرز جميع البيانات بترتيب تنازلي أو تصاعدي. ثانيًا ، حدد الكثير من البيانات ورمز إليها بالحرف "n". إذا كان n فرديًا ، فإن الصيغة التي نستخدمها هي كما يلي.

الوسيط = رقم البيانات - ((ن + 1) / 2)

في غضون ذلك ، إذا كانت n تساوي عددًا زوجيًا ، فسنستخدم الصيغة أدناه.

الوسيط = (البيانات ith (n / 2) + البيانات ith (n / 2 + 1)) / 2

القياس الثاني للبيانات في الإحصاء هو قياس انتشار البيانات. حجم انتشار البيانات هو قيمة توضح مدى بُعد البيانات عن مركز البيانات. يتكون حجم توزيع البيانات من النطاق والربيع والمدى الربيعي.

النطاق هو الفرق بين أكبر قيمة للبيانات وأصغر قيمة للبيانات. يمكننا الوصول عن طريق طرح أكبر البيانات من أصغر البيانات. على سبيل المثال ، إذا كان في فصل واحد ، يبلغ ارتفاع أطول طالب 160 سم وأقصر طالب يبلغ ارتفاعه 143 سم ، فسنصل إلى 23 سم.

وفي الوقت نفسه ، فإن الربع هو تجميع البيانات الإحصائية في أربعة أجزاء متساوية. ينقسم الحجم الربعي إلى 3 ، أي الربع السفلي (Q 1 ) ، والربيع الأوسط (Q 2 أو الوسيط) ، والربيع الأعلى (Q 3 ). لتحديد كل ربع ، هناك عدة خطوات يجب أن نتخذها.

أولاً ، قم بفرز البيانات بترتيب تصاعدي أو تنازلي. ثانيًا ، حدد القيمة المتوسطة أو المتوسطة للبيانات. ثالثًا ، حدد الربع الأدنى (Q 1 ) ، وهو متوسط ​​قيمة مجموعة البيانات التي تقع تحت الوسيط (Q 2) . أخيرًا ، حدد الربع العلوي (Q 3 ) ، وهو القيمة المتوسطة لمجموعة البيانات فوق الوسيط (Q 2) .

النوع الأخير من قياس انتشار البيانات هو المدى بين الشرائح الربعية. النطاق الربيعي هو الفرق بين الربيعين العلوي والسفلي. الصيغة على النحو التالي.

س د = س 3 - س 1