CÁC SỐ ĐẶC TRUNG ĐO MỨC ĐỘ PHÂN TÁN CHO MẪU SỐ LIỆU KHÔNG GHÉP NHÓM – SBT Toán 10 Cánh Diều Tập 2
CÁC SỐ ĐẶC TRUNG ĐO MỨC ĐỘ PHÂN TÁN CHO MẪU SỐ LIỆU KHÔNG GHÉP NHÓM
A. KIẾN THỨC CẦN NHỚ
Khoảng biến thiên. Khoảng tứ phân vị
Trong một mẫu số liệu, khoảng biến thiên là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của mẫu số liệu đó.
Ta có thể tính khoảng biến thiên $R$ của mẫu số liệu theo công thức sau:
$R={{x}_{\text{max}}}-{{x}_{\text{min }\!\!~\!\!\text{ }}}\text{, }\!\!~\!\!\text{ }$
trong đó ${{x}_{\text{max}}}$ là giá trị lớn nhất, ${{x}_{\text{min}}}$ là giá trị nhỏ nhất của mẫu số liệu đó.
Giả sử ${{Q}_{1}},{{Q}_{2}},{{Q}_{3}}$ là tứ phân vi của mẫu số liệu. Ta gọi hiệu
${{\text{ }\!\!\Delta\!\!\text{ }}_{Q}}={{Q}_{3}}-{{Q}_{1}}$
là khoảng tứ phân vị của mẫu số liệu đó.
Phưong sai
Cho mẫu số liệu thống kê có $n$ giá trị ${{x}_{1}},{{x}_{2}},\ldots ,{{x}_{n}}$ và số trung bình cộng là $\overline{x}\,$.
Ta gọi số ${{s}^{2}}=\frac{{{\left( {{x}_{1}}-\overline{x}\, \right)}^{2}}+{{\left( {{x}_{2}}-\overline{x}\, \right)}^{2}}+\ldots +{{\left( {{x}_{n}}-\overline{x}\, \right)}^{2}}}{n}$ làphurong sai của mẫu số liệu trên.
Ngoài ra, phương sai có thể tính theo các công thức sau:
$\cdot {{s}^{2}}=\frac{{{n}_{1}}{{\left( {{x}_{1}}-\overline{x}\, \right)}^{2}}+{{n}_{2}}{{\left( {{x}_{2}}-\overline{x}\, \right)}^{2}}+\ldots +{{n}_{k}}{{\left( {{x}_{k}}-\overline{x}\, \right)}^{2}}}{n}$, trong đó, ${{n}_{1}},{{n}_{2}},\ldots ,{{n}_{k}}$ lần lượt là tần số của các số liệu ${{x}_{1}},{{x}_{2}},\ldots ,{{x}_{k}}$ và $n={{n}_{1}}+{{n}_{2}}+\ldots +{{n}_{k}}$. – ${{s}^{2}}={{f}_{1}}{{\left( {{x}_{1}}-\overline{x}\, \right)}^{2}}+{{f}_{2}}{{\left( {{x}_{2}}-\overline{x}\, \right)}^{2}}+\ldots +{{f}_{k}}{{\left( {{x}_{k}}-\overline{x}\, \right)}^{2}}$, trong đó, ${{f}_{1}},{{f}_{2}},\ldots ,{{f}_{k}}$ lần lượt là tần số tương đối của các số liệu ${{x}_{1}},{{x}_{2}},\ldots ,{{x}_{k}}$.
3. Độ lệch chuẩn
Căn bậc hai (số học) của phương sai gọi là độ lệch chuẩn của mẫu số liệu thống kê.
Tính hợp lí của số liệu thống kê
Ta có thể sử dụng khoảng tứ phân vị để xác định số liệu bất thường của mẫu số liệu như sau:
Giả sử ${{Q}_{1}},{{Q}_{2}},{{Q}_{3}}$ là tứ phân vị của mẫu số liệu và hiệu $\text{ }\!\!\Delta\!\!\text{ }Q={{Q}_{3}}-{{Q}_{1}}$ là khoảng tứ phân vị của mẫu số liệu đó. Một giá trị trong mẫu số liệu được coi là một giá trị bất thường nếu nó nhỏ hơn ${{Q}_{1}}-\frac{3}{2}{{\text{ }\!\!\Delta\!\!\text{ }}_{Q}}$ hoặc lớn hơn ${{Q}_{3}}+\frac{3}{2}{{\text{ }\!\!\Delta\!\!\text{ }}_{Q}}$.
B. ví DU
Vấn đề 1. Xác định khoảng biến thiên của mẫu số liệu
Vi dụ 1 Mẫu số liệu thống kê tiền lương (đơn vị: triệu đồng/tháng) của 8 cán bộ trong một tổ của công ty là:
8 8,5 10 9 10,5 9,5 11 12
Tìm khoảng biến thiên của mẫu số liệu trên.
Giải
Trong mẫu số liệu trên, số lớn nhất là 12 và số nhỏ nhất là 8 . Vậy khoảng biến thiên của mẫu số liệu trên là: $R={{x}_{\text{max}}}-{{x}_{\text{min }\!\!~\!\!\text{ }}}=12-8=4$ (triệu đồng/tháng).
Vấn đề 2 . Xác định khoảng tứ phân vị của mẫu số liệu
Vi dụ 2 Mẫu số liệu thống kê chiều cao (đơn vị: mét) của 12 cây thông là:
30,5 31 30,1 33,2 30,7 34,8 35 34,5 31,6 32,8 31,5 34,9
Tìm khoảng tứ phân vị của mẫu số liệu trên.
Giải
Sắp xếp mẫu số liệu trên theo thứ tự không giảm, ta được:
30,1 30,5 30,7 31 31,5 31,6 32,8 33,2 34,5 34,8 34,9 35
Trung vị của mẫu số liệu trên là: $\frac{31,6+32,8}{2}=32,2$. Trung vị của dãy 30,$1;30,5;30,7;31;31,5;31,6$ là: $\frac{30,7+31}{2}=30,85$.
Trung vị của dãy 32,$8;33,2;34,5;34,8;34,9;35$ là: $\frac{34,5+34,8}{2}=34,65$.
Vậy ${{Q}_{1}}=30,85,{{Q}_{2}}=32,2,{{Q}_{3}}=34$,65. Do đó khoảng tứ phân vị của mẫu số liệu trên là: ${{\text{ }\!\!\Delta\!\!\text{ }}_{Q}}={{Q}_{3}}-{{Q}_{1}}=34,65-30,85=3,8\left( \text{ }\!\!~\!\!\text{ m} \right)$.
Vấn đề 3. Xác định phương sai và độ lệch chuẩn của mẫu số liệu
Vi dụ 3 Kết quả 5 lần nhảy xa (đơn vị: mét) của bạn Huy và bạn Tùng cho ở bảng sau:
Huy | 2,2 | 2,5 | 2,4 | 2,6 | 2,3 |
Tùng | 2,0 | 2,8 | 2,5 | 2,4 | 2,3 |
a) Kết quả trung bình của hai bạn có bằng nhau hay không?
b) Tính phương sai và độ lệch chuẩn của mẫu số liệu thống kê kết quả 5 lần nhảy xa của mỗi bạn. Từ đó cho biết bạn nào có kết quả nhảy xa ổn định hơn?
Giải
a) Gọi kết quả trung bình của bạn Huy và bạn Tùng lẩn lượt là ${{\overline{x}\,}_{H}},{{\overline{x}\,}_{T}}$. Ta có:
$\begin{array}{*{35}{r}}{} & {{\overline{x}\,}_{H}}=\frac{2,2+2,5+2,4+2,6+2,3}{5}=2,4\left( \text{ }\!\!~\!\!\text{ m} \right); \\{} & {{\overline{x}\,}_{T}}=\frac{2,0+2,8+2,5+2,4+2,3}{5}=2,4\left( \text{ }\!\!~\!\!\text{ m} \right). \\\end{array}$
Vậy kết quả trung binh của hai bạn bằng nhau.
b) Gọi phương sai tương ứng với mẫu số liệu thống kê kết quả 5 lần nhảy của Huy và Tùng lần lượt là: $s_{H}^{2},s_{T}^{2}$. Ta có:
$\begin{array}{*{35}{r}}s_{H}^{2} & ~=\frac{{{(2,2-2,4)}^{2}}+{{(2,5-2,4)}^{2}}+{{(2,4-2,4)}^{2}}+{{(2,6-2,4)}^{2}}+{{(2,3-2,4)}^{2}}}{5} \\{} & ~=0,02; \\s_{T}^{2} & ~=\frac{{{(2,0-2,4)}^{2}}+{{(2,8-2,4)}^{2}}+{{(2,5-2,4)}^{2}}+{{(2,4-2,4)}^{2}}+{{(2,3-2,4)}^{2}}}{5} \\{} & ~=0,068. \\\end{array}$
Ta cũng có độ lệch chuẩn của mẫu số liệu thống kê kết quả 5 lần nhảy của Huy và Tùng lần lượt là:
${{s}_{H}}=\sqrt{s_{H}^{2}}=\sqrt{0,02}\left( \text{ }\!\!~\!\!\text{ m} \right);{{s}_{T}}=\sqrt{s_{T}^{2}}=\sqrt{0,068}\left( \text{ }\!\!~\!\!\text{ m} \right).$
Do $s_{H}^{2}=0,02<s_{T}^{2}=0,068$ nên bạn Huy có kết quả nhảy xa ổn định hơn bạn Tùng.
Vấn đề 4. Xác định giá trị bất thường của mẫu số liệu
Ví dụ Nêu các giá trị bất thường của mẫu số liệu thống kê sau:
0 1 13 16 17 18 19 20 21 22 23 24 28 37 38
Giải
Mẫu số liệu trên có tứ phân vị là ${{Q}_{1}}=16;{{Q}_{2}}=20;{{Q}_{3}}=24$. Suy ra
${{\text{ }\!\!\Delta\!\!\text{ }}_{Q}}={{Q}_{3}}-{{Q}_{1}}=24-16=8.\text{ }\!\!~\!\!\text{ }$
Các giá trị 0,1 (nhỏ hơn ${{Q}_{1}}-\frac{3}{2}{{\text{ }\!\!\Delta\!\!\text{ }}_{Q}}=16-\frac{3}{2}\cdot 8=4$ ) và các giá trị 37,38 (lớn hơn ${{Q}_{3}}+\frac{3}{2}{{\text{ }\!\!\Delta\!\!\text{ }}_{Q}}=24+\frac{3}{2}\cdot 8=36$ ) là các giá trị bất thường của mẩu số liệu đã cho.
Vấn đề 5 . Xác định mẫu số liệu từ biểu đồ và tính các số đạc trưng cho mấu số liệu đó
Vi dụ: Biểu đồ đoạn thẳng ở Hinh 1 Tốc độ tăng trương GDP biễu diễn tốc độ tăng trưởng GDP của Việt Nam giai đoạn 2012-2019.
a) Viết mẫu số liệu thống kê tốc độ tăng trưởng GDP nhận được từ biểu đồ ở Hinh 1.
b) Tìm khoảng biến thiên của mẫu số liệu đó.
c) Tìm khoảng tứ phân vị của mẫu số liệu đó.
d) Tính phương sai và độ lệch chuẩn
(Nguồn https://gso.govvn) Hinh 1 của mẫu số liệu đó.
Giải
a) Mẫu số liệu thống kê tốc độ tăng trưởng GDP nhận được từ biểu đồ trên là:
5,25 5,42 5,98 6,68 6,21 6,81 7,08 7,02
b) Trong mẫu số liệu trên, số lớn nhất là 7,08 và số nhỏ nhất là 5,25 . Vậy khoảng biến thiên của mẫu số liệu đó là:
$R={{x}_{\text{max}}}-{{x}_{\text{min}}}=7,08-5,25=1,83\left( \text{ }\!\!%\!\!\text{ }\right).$
c) Sắp xếp mẫu số liệu trên theo thứ tự tăng dần, ta được:
5,25 5,42 5,98 6,21 6,68 6,81 7,02 7,08
Vậy ta có tứ phân vị của mẫu số liệu đó là:
$\begin{array}{*{35}{r}}{{Q}_{1}} & ~=\frac{5,42+5,98}{2}=5,7\left( \text{ }\!\!%\!\!\text{ } \right),\text{ }\!\!~\!\!\text{ }{{Q}_{2}}=\frac{6,21+6,68}{2}=6,445\left( \text{ }\!\!%\!\!\text{ } \right), \\{{Q}_{3}} & ~=\frac{6,81+7,02}{2}=6,915\left( \text{ }\!\!%\!\!\text{ } \right). \\\end{array}$
Do đó khoảng tứ phân vị của mẫu số liệu đó là:
${{\text{ }\!\!\Delta\!\!\text{ }}_{Q}}={{Q}_{3}}-{{Q}_{1}}=6,915-5,7=1,215\left( \text{ }\!\!%\!\!\text{ } \right).$
d) Số trung bình cộng của mẫu số liệu trên là:
$\overline{x}\,=\frac{5,25+5,42+5,98+6,68+6,21+6,81+7,08+7,02}{8}=6,30625\left( \text{ }\!\!%\!\!\text{ } \right)\text{. }\!\!~\!\!\text{ }$
Ta có:
$\begin{array}{*{35}{r}}{} & ~{{(5,25-6,30625)}^{2}}+{{(5,42-6,30625)}^{2}}+{{(5,98-6,30625)}^{2}}+{{(6,68-6,30625)}^{2}} \\+ & ~{{(6,21-6,30625)}^{2}}+{{(6,81-6,30625)}^{2}}+{{(7,08-6,30625)}^{2}}+{{(7,02-6,30625)}^{2}} \\= & 3,5183875. \\\end{array}$
Phương sai của mẫu số liệu trên là: ${{s}^{2}}=\frac{3,5183875}{8}\approx 0,44$.
Độ lệch chuẩn của mẫu số liệu trên là: $s\approx \sqrt{0,44}\approx 0,66$ (%).
BÀl TÂP
Cho mẫu số liệu: $21\text{ }\!\!~\!\!\text{ }22\text{ }\!\!~\!\!\text{ }23\text{ }\!\!~\!\!\text{ }24\text{ }\!\!~\!\!\text{ }25$
a) Khoảng biến thiên của mẫu số liệu trên là:
1 .
B. 2 .
C. 3 .
D. 4 .
b) Khoảng tứ phân vị của mẫu số liệu trên là:
1 .
B. 2 .
C. 3 .
D. 4 .
c) Phương sai của mẫu số liệu trên là:
A. 1 .
B. 2 .
C. 3 .
D. 4 .
d) Độ lệch chuẩn của mẫu số liệu trên là:
A. 1 .
B. $\sqrt{2}$.
C. $\sqrt{3}$.
D. 4 . 15. Biễu đồ đoạn thẳng ở Hinh 2 biễu diễn thu nhập binh quân đầu người/năm của Việt Nam ở một số năm trong giai đoạn từ 1986 đến 2020.
Mẫu số liệu nhận được từ biễu đồ ở Hinh 2 có khoảng biến thiên là bao nhiêu?
A. 71 .
B. 85 .
C. 1180 .
D. 2648 .
Hinh 2
Biễu đồ đoạn thẳng ở Hinh 3 biễu diễn số lượt khách vào một cửa hàng trong ngày đầu khai trương tại một số mốc thời gian.
Mẫu số liệu nhận được từ biễu đồ ở Hinh 3 có khoảng tứ phân vị là bao nhiêu?
A. 10 .
B. 15 .
C. 20 .
D. 5 .
Hinh 3
(h)
a) Tìm khoảng biến thiên của mẫu số liệu trên.
b) Tìm khoảng tứ phân vị của mẫu số liệu trên.
c) Tính phương sai và độ lệch chuẩn của mẫu số liệu trên.
d) Tìm giá trị bất thường của mẫu số liệu trên.
Kết quả dự báo nhiệt độ cao nhất trong 10 ngày liên tiếp ở Nghệ An cuối tháng 01 năm 2022 được cho ở bảng sau:
Ngày | $22$ | $23$ | $24$ | $25$ | $26$ | $27$ | $28$ | $29$ | $30$ | $31$ |
Nhiệt độ $\left( {{~}^{\circ }}\text{C} \right)$ | 23 | 25 | 26 | 27 | 27 | 27 | 27 | 21 | 19 | 18 |
(Nguổn: https://nchmf.gov:rw)
a) Viết mẫu số liệu thống kê nhiệt độ nhận được từ bảng trên.
b) Tính số trung bình cộng, phương sai và độ lệch chuẩn của mẫu số liệu đó. 19. Biễu đồ đoạn thẳng ở Hinh 4 cho biết kết quả thi Ngoại ngữ ở câu lạc bộ của Dũng (đường nét liền) và Hoàng (đường nét đứt đậm) qua 9 lần kiểm tra.
a) Viết mẫu số liệu thống kê kết quả thi ngoại ngữ của Dũng và Hoàng nhận được từ biểu đồ ở Hình 4 .
b) Tìm khoảng biến thiên và khoảng tứ phân vị của mỗi mẫu số liệu đó.
c) Tính phương sai và độ lệch chuẫn của hai mẫu số liệu đó. Cho biết kết
Hinh 4 quả thi của bạn nào ổn định hơn?