Biểu đồ tần suất
Mục đích chính của biểu đồ tần suất (Histogram)
Biểu đồ tần suất chủ yếu được sử dụng để:
- Ước tính khả năng của quá trình (Process Capability): Giúp xác định khả năng kiểm soát quá trình sản xuất.
- Tính tỷ lệ sản phẩm không đạt yêu cầu (Defect Rate): Đo lường mức độ lỗi trong sản phẩm.
- Điều tra sự pha trộn của nhiều nhóm khác nhau: Phát hiện sự hiện diện của nhiều nhóm dữ liệu khác nhau trong cùng một bộ dữ liệu.
- Phát hiện dữ liệu giả (Fake Data): Kiểm tra xem có sự xuất hiện của dữ liệu không hợp lệ hay không.
- Kiểm tra tính phù hợp của giới hạn kiểm soát thiết kế đối với quá trình thực tế: Đánh giá sự phù hợp giữa các giới hạn kiểm soát được thiết kế với quá trình sản xuất thực tế.
- Thiết lập giới hạn đặc tả và so sánh với giá trị tiêu chuẩn: Đưa ra các quy định và giới hạn đặc tả, sau đó so sánh với giá trị tiêu chuẩn.
Biểu đồ tần suất cơ bản là một dạng bảng phân phối tần suất. Dọc theo trục hoành (trục x), các nhóm được phân chia bởi các ranh giới nhóm (group boundary) và khoảng nhóm (bin width) được sử dụng làm đáy. Tần suất của mỗi nhóm được sử dụng làm chiều cao, vẽ thành các hình chữ nhật có chiều cao tương ứng với tần suất của mỗi nhóm.
Khác biệt giữa biểu đồ cột (Bar Chart) và biểu đồ tần suất (Histogram)
Mặc dù một số người phân biệt rõ ràng giữa biểu đồ cột (các cột không liền kề nhau) và biểu đồ tần suất (các cột liền kề nhau), cá nhân tôi cho rằng sự khác biệt về khoảng cách giữa các cột không quá quan trọng. Những người ủng hộ quan điểm này cho rằng sự khác biệt lớn nhất là:
- Biểu đồ cột: Các cột có thể được sắp xếp theo bất kỳ thứ tự nào, chẳng hạn như số liệu dân số theo khu vực sinh sống hoặc dữ liệu giới tính, thường là dữ liệu không liên tục.
- Biểu đồ tần suất: Các cột phải được sắp xếp theo thứ tự ban đầu, thường đại diện cho dữ liệu liên tục, như số liệu chiều cao trong lớp học.
Tuy nhiên, không nhiều người có thể phân biệt rõ ràng như vậy. Ví dụ, số liệu bán hàng và hiệu suất kinh doanh thuộc biểu đồ cột hay biểu đồ tần suất? Nếu là dữ liệu liên tục, thì nên thuộc về biểu đồ tần suất, nhưng lại không hoàn toàn giống. Có lẽ quan điểm về vấn đề này có thể khác nhau tuỳ thuộc vào từng người.
Kỹ thuật vẽ biểu đồ tần suất
Thực tế, biểu đồ tần suất là một trong những loại biểu đồ thống kê xuất hiện phổ biến nhất trong cuộc sống hàng ngày của chúng ta. Ví dụ, phân bố điểm số trong lớp, phân bố điểm thi, phân bố độ tuổi, hầu hết đều được biểu diễn bằng biểu đồ tần suất. Trong thống kê, biểu đồ tần suất biểu thị số liệu theo kích thước hoặc trọng lượng nhất định; khi số liệu đủ lớn, biểu đồ sẽ xuất hiện phân bố chuẩn (normal distribution).
Bây giờ, chúng ta hãy xem cách tạo biểu đồ tần suất từ dữ liệu.
- Thu thập dữ liệu: Đảm bảo dữ liệu đủ lớn để tạo biểu đồ tần suất có ý nghĩa.
- Chọn kích thước nhóm (bin size): Xác định số nhóm cần thiết để biểu diễn dữ liệu một cách rõ ràng.
- Phân chia dữ liệu thành các nhóm: Sắp xếp dữ liệu vào các nhóm đã chọn.
- Vẽ biểu đồ: Trục x biểu thị các nhóm, trục y biểu thị tần suất, sử dụng các hình chữ nhật để biểu diễn tần suất của từng nhóm.
Nhờ vào sự hỗ trợ của máy tính và phần mềm như Excel, việc tạo ra biểu đồ tần suất ngày nay trở nên dễ dàng hơn nhiều.
Cách Vẽ Biểu Đồ Tần Suất (Histogram) Bằng Excel
Giả sử chúng ta có 200 mẫu dữ liệu về độ dày của đầu Type C (đơn vị: mm), chúng ta có thể sử dụng Excel để vẽ biểu đồ tần suất để xem phân bố dữ liệu.
| 8.8 | 8.8 | 8.4 | 8.2 | 8.3 | 9.3 | 8.6 | 8.4 | 9.0 | 9.7 |
| 8.4 | 8.5 | 9.0 | 8.7 | 9.4 | 8.9 | 8.7 | 8.7 | 8.6 | 8.7 |
| 8.4 | 8.4 | 8.5 | 8.8 | 8.9 | 9.6 | 8.4 | 7.9 | 8.1 | 8.4 |
| 8.8 | 8.3 | 8.4 | 8.5 | 9.3 | 8.1 | 8.7 | 8.3 | 8.9 | 8.7 |
| 8.1 | 9.1 | 9.0 | 8.6 | 8.3 | 9.0 | 8.7 | 9.0 | 8.6 | 8.6 |
| 7.8 | 9.2 | 9.8 | 7.4 | 8.8 | 8.1 | 9.0 | 7.8 | 8.6 | 8.7 |
| 8.8 | 9.4 | 9.0 | 8.8 | 8.5 | 8.7 | 9.0 | 7.8 | 9.2 | 8.7 |
| 8.8 | 7.9 | 8.0 | 8.0 | 7.9 | 8.2 | 8.6 | 8.4 | 8.6 | 8.3 |
| 9.0 | 9.0 | 8.3 | 8.4 | 9.5 | 8.4 | 9.7 | 8.9 | 9.2 | 9.0 |
| 8.4 | 8.1 | 8.4 | 9.9 | 9.9 | 8.6 | 8.5 | 7.9 | 8.7 | 7.8 |
| 9.3 | 8.4 | 8.8 | 8.5 | 9.1 | 8.9 | 8.4 | 8.8 | 8.9 | 9.7 |
| 8.3 | 9.0 | 9.3 | 8.7 | 9.0 | 9.2 | 9.1 | 7.0 | 7.9 | 7.3 |
| 9.7 | 8.9 | 7.8 | 8.3 | 8.7 | 9.0 | 8.4 | 7.6 | 8.1 | 8.2 |
| 8.5 | 8.5 | 8.1 | 8.3 | 7.6 | 7.7 | 9.0 | 7.9 | 8.3 | 9.0 |
| 8.9 | 8.6 | 8.4 | 8.9 | 8.3 | 8.0 | 8.0 | 8.0 | 8.9 | 8.3 |
| 9.0 | 7.7 | 7.9 | 8.3 | 8.5 | 8.5 | 8.9 | 8.4 | 8.3 | 9.5 |
| 8.8 | 8.7 | 8.1 | 9.1 | 8.9 | 8.4 | 7.9 | 8.6 | 7.8 | 8.9 |
| 8.1 | 7.7 | 7.3 | 8.5 | 8.0 | 7.7 | 7.8 | 8.3 | 7.5 | 8.3 |
| 9.4 | 7.0 | 7.5 | 7.7 | 8.3 | 7.9 | 8.6 | 8.9 | 8.4 | 9.9 |
| 8.3 | 9.4 | 8.4 | 9.3 | 8.5 | 7.9 | 8.4 | 8.8 | 8.3 | 8.0 |
Sử Dụng Excel Để Tính Toán và Vẽ Biểu Đồ Tần Suất
1. Sử dụng hàm Min() để tính giá trị nhỏ nhất = 7.02
2. Sử dụng hàm Max() để tính giá trị lớn nhất = 9.9
Thông thường, chúng ta nên chia thành khoảng 10 nhóm. Do đó, khoảng cách sẽ được tính bằng công thức: (giá trị lớn nhất - giá trị nhỏ nhất) / 10. Cuối cùng, ta được khoảng cách là (9.9-7.0)/9 = 0.29, làm tròn thành 0.3. Các giá trị trung tâm của mỗi nhóm sẽ là: 7.15, 7.45, 7.75, 8.05, 8.35, 8.65, 8.95, 9.25, 9.55, 9.85.3
3. Sử dụng hàm COUNTIFS() để tính và thống kê số lần xuất hiện của mỗi nhóm, chúng ta có bảng sau: