Lý thuyết Toán lớp 7 Bài 1: Thu thập và phân loại dữ liệu
Lý thuyết Thu thập và phân loại dữ liệu
1. Thu thập dữ liệu
Ta có thể thu thập dữ liệu từ những nguồn văn bản, bảng biểu, hình ảnh trong thực tiễn.
Ví dụ: Hình ảnh trên bản tin thời tiết tại TP Hồ Chí Minh:
Từ hình ảnh trên ta có bảng thống kê sau:
2. Phân loại dữ liệu theo các tiêu chí
– Các dữ liệu là số được gọi là dữ liệu định lượng.
– Các dữ liệu không phải số gọi là dữ liệu định tính.
– Để thuận tiện trong mô tả và xử lý, người ta thường phải phân loại dữ liệu:
+ Dữ liệu định lượng được biểu diễn bằng số thực.
+ Dữ liệu định tính được biểu diễn bằng từ, chữ, kí hiệu,…
Ví dụ: Phân loại các dãy dữ liệu sau dựa trên các tiêu chí định tính và định lượng.
a) Cân nặng (đơn vị kilôgam) của 4 bạn học sinh trong lớp 7A: 45; 51; 41; 47.
b) Kết quả đánh giá xếp loại của học sinh có các mức: Xuất sắc, Tốt, Khá, Trung bình.
Hướng dẫn giải
a) Cân nặng (đơn vị kilôgam: 45; 51; 41; 47) là dữ liệu định lượng.
b) Kết quả đánh giá xếp loại (Xuất sắc, Tốt, Khá, Trung bình) là dữ liệu định tính.
3. Tính hợp lý của dữ liệu
Để đảm bảo tính hợp lý, dữ liệu cần phải đáp ứng các tiêu chí toán học đơn giản, chẳng hạn như:
– Tổng tỉ lệ phần trăm của tất cả các thành phần phải bằng 100%.
– Số lượng của bộ phận phải nhỏ hơn số lượng của toàn thể; …
– Phải có tính đại diện đối với vấn đề cần thống kê.
Ví dụ:
a) Bảng dữ liệu thống kê học sinh của ba lớp 7 tham gia chạy việt dã như sau:
Trong bảng trên ta thấy số lượng học sinh tham gia chạy việt dã ở lớp 7A3 là 40 vượt quá sĩ số của lớp là 32.Vậy dữ liệu này chưa hợp lý.
b) Bảng dữ liệu xếp loại kết quả học tập của học sinh lớp 7A.
Dữ liệu ở bảng thống kê trên không hợp lý ở tỉ lệ phần trăm học sinh xếp loại tốt không thể vượt quá 100% và tổng tỉ lệ phần trăm của các loại phải đúng bằng 100%.
c) Kết quả tìm hiểu sở thích với môn bóng đá của các bạn học sinh lớp 7A được cho bởi bảng thống kê sau :
Trong bảng thống kê trên, dữ liệu không đại diện được cho sở thích đối với môn bóng đá của tất cả học sinh lớp 7A vì còn thiếu dữ liệu về học sinh nữ của lớp.
Vậy dữ liệu này chưa có tính đại diện cho vấn đề cần thống kê.
Bài tập Thu thập và phân loại dữ liệu
Bài 1: Phân loại các dãy dữ liệu sau dựa trên các tiêu chí định tính và định lượng.
a) Thời gian chạy 100 m (tính theo giây) của các học sinh lớp 7 là : 16 ; 17 ; 18 ; 19.
b) Danh sách các môn học yêu thích của một bạn học sinh là: toán , vật lý, tiếng anh, âm nhạc, mĩ thuật.
c) Các giải thưởng thi học sinh giỏi môn Toán cấp tỉnh là : giải nhất, giải nhì, giải ba, giải khuyến khích.
Hướng dẫn giải
a) Dữ liệu thời gian chạy được biểu diễn bằng số thực (tính theo giây: 16; 17; 18; 19) nên nó là dữ liệu định lượng.
b) Dữ liệu môn học yêu thích được biểu diễn bằng từ (toán , vật lý, tiếng anh, âm nhạc, mĩ thuật ) nên nó là dữ liệu định tính.
c) Dữ liệu các giải thưởng được biểu diễn bằng từ (giải nhất, giải nhì, giải ba, giải khuyến khích) nên nó là dữ liệu định tính.
Bài 2: Kết quả tìm hiểu về khả năng đá bóng của các bạn học sinh lớp 7C được cho bởi bảng thống kê sau :
a) Hãy phân loại các dữ liệu cho trong bảng trên dựa trên tiêu chí định tính và định lượng.
b) Dữ liệu trên có đại diện được cho khả năng đá bóng của các bạn học sinh lớp 7C được hay không ?
Hướng dẫn giải
a)
– Số bạn nữ được biểu diễn bằng số thực (3; 5; 10; 4) nên nó là dữ liệu định lượng.
– Khả năng đá bóng được biểu diễn bằng từ (không đạt, đạt, giỏi, xuất sắc) nên nó là dữ liệu định tính.
b) Dữ liệu trên không đại diện được cho khả năng đá bóng của tất cả các bạn học sinh lớp 7C vì thiếu dữ liệu của các bạn học sinh nam.
Bài 3: Tìm điểm chưa hợp lý của dữ liệu trong bảng sau
Hướng dẫn giải
Ta có: 40% + 20% + 15% + 35% = 110%
Vậy điểm chưa hợp lý của dữ liệu trong bảng là tổng tỉ lệ phần trăm của các loại sách lớn hơn 100%.
====== ****&**** =====