
Các Thước Đo Thống Kê Cơ Bản
Trung Bình Cộng (Mean)
x̄ = (x₁ + x₂ + ... + xₙ) / n = Σxᵢ / n Ưu điểm: Dùng tất cả dữ liệu, dễ tính
Nhược điểm: Bị ảnh hưởng bởi giá trị cực đoan
Trung Vị (Median)
Giá trị nằm giữa khi sắp xếp theo thứ tự:
- n lẻ: Phần tử ở vị trí (n+1)/2
- n chẵn: Trung bình 2 phần tử ở vị trí n/2 và n/2+1
Ưu điểm: Ít bị ảnh hưởng bởi ngoại lệ
Dùng cho: Thu nhập, giá nhà, dữ liệu lệch
Yếu Vị (Mode)
Giá trị xuất hiện nhiều nhất. Có thể có nhiều mode (bimodal, multimodal).
Dùng cho: Dữ liệu danh nghĩa (màu sắc ưa thích, size giày bán chạy)
Ví Dụ Tính
Dữ liệu: 2, 4, 4, 6, 8, 10, 10, 10, 20
| Chỉ số | Tính | Kết quả |
|---|---|---|
| Trung bình | (2+4+4+6+8+10+10+10+20)/9 | 8.22 |
| Trung vị | Phần tử thứ 5 (đã sắp xếp) | 8 |
| Yếu vị | Xuất hiện nhiều nhất | 10 (3 lần) |
| Min | 2 | |
| Max | 20 | |
| Phạm vi | Max − Min | 18 |
Phương Sai Và Độ Lệch Chuẩn
Phương sai (σ²) = Σ(xᵢ − x̄)² / n
Độ lệch chuẩn (σ) = √σ² Ý nghĩa của độ lệch chuẩn:
Với phân phối chuẩn:
- x̄ ± 1σ: chứa ~68% dữ liệu
- x̄ ± 2σ: chứa ~95% dữ liệu
- x̄ ± 3σ: chứa ~99.7% dữ liệu
Ứng Dụng Thực Tế
- Giáo dục: Tính điểm trung bình học kỳ
- Tài chính: Biến động (volatility) của cổ phiếu = độ lệch chuẩn lợi suất
- Kiểm soát chất lượng: Six Sigma dùng 6σ làm tiêu chuẩn
- Y tế: Chỉ số bình thường là trung bình ± 2 độ lệch chuẩn của quần thể