Ở phần trước, chúng ta đã nói về "độ lệch chuẩn"  như một tiêu chuẩn để đánh giá chất lượng sản phẩm và cũng là một chỉ số mà nhiều ngành công nghiệp hiện nay muốn đạt được để làm hài lòng khách hàng. Nhưng độ lệch chuẩn được tính như thế nào? Bây giờ chúng ta sẽ cùng thảo luận về vấn đề này.

Thực ra, cơ sở lý thuyết để tính độ lệch chuẩn là giả định rằng dữ liệu thống kê có dạng "phân phối chuẩn" (như hình vẽ, nó giống như một đỉnh núi, nhưng tỷ lệ có thể bị méo mó một chút, mong được thông cảm! Người ta cũng gọi nó là "hình chuông", giống như chiếc chuông trong chùa).

Ví dụ, khi thống kê chiều cao của học sinh trong một lớp tiểu học, sau khi tính toán, chúng ta sẽ thấy rằng hầu hết chiều cao của các em học sinh gần như tương đồng nhau, nghĩa là chiều cao của đa số học sinh tập trung quanh một giá trị trung bình. Trong khi đó, một số ít học sinh còn lại có chiều cao phân bố ở hai đầu của đường cong, tức là có một số rất ít học sinh có chiều cao đặc biệt cao, và cũng có một số rất ít học sinh có chiều cao đặc biệt thấp. Đây chính là phân phối chuẩn.

Tuy nhiên, có thể có người sẽ nói rằng chiều cao của lớp mình không có phân bố như vậy. Thực ra, có một điều mà tôi quên giải thích, đó là đường cong phân phối chuẩn thường chỉ xuất hiện rõ ràng khi có đủ dữ liệu. Nếu bạn thấy chiều cao của lớp mình không có phân bố chuẩn, thì rất có thể là do số lượng học sinh trong lớp quá ít, không thể đại diện cho chiều cao của toàn bộ nhóm. Trong trường hợp này, bạn nên mở rộng đối tượng thống kê ra toàn bộ học sinh cùng khối trong trường hoặc toàn bộ học sinh cùng khối trong huyện, thành phố. Khi đó, chắc chắn sẽ xuất hiện biểu đồ phân phối chuẩn.

Trong biểu đồ phân phối chuẩn thống kê chiều cao ở trên, trục X sẽ là "đơn vị thống kê", ở đây là chiều cao, ví dụ như 140-142cm; trục Y thường là "số lượng", ở đây là "số học sinh", ví dụ có bao nhiêu học sinh cao từ 140cm-142cm? Có bao nhiêu học sinh cao từ 142cm~144cm?

Độ lệch chuẩn được tính bằng cách lấy giá trị của mỗi cá thể trong phân phối chuẩn trừ đi giá trị trung bình, sau đó bình phương kết quả, cộng lại, chia cho tổng số lượng, cuối cùng lấy căn bậc hai, ta được σ (độ lệch chuẩn).

Nghe có vẻ phức tạp, nhưng về cơ bản nó giống như việc tính toán "độ phân tán". Số này càng nhỏ, cho thấy sự khác biệt giữa các giá trị cá thể với giá trị trung bình càng nhỏ, nghĩa là các giá trị cá thể càng gần giống nhau, và phân phối chuẩn càng hẹp. Ngược lại, số này càng lớn, cho thấy sự khác biệt giữa các giá trị cá thể càng lớn, phân phối chuẩn sẽ càng rộng.

Công thức tính như sau:




Công thức độ lệch chuẩn
N: Tổng số mẫu được tính toán
-x: Giá trị trung bình của mẫu
χi: Giá trị của từng cá thể

Với sự phát triển của phần mềm máy tính ngày nay, việc tính độ lệch chuẩn không quá khó khăn. Chỉ cần nhập giá trị vào MS-Excel và sử dụng công thức 【STDEV()】là có thể tính được. Cái khó là làm sao để đặt ra được tiêu chuẩn đo lường, tức là cần phải lượng hóa. Bởi vì tính độ lệch chuẩn cần có số liệu, nhưng không phải tất cả các tiêu chuẩn đo lường đều có thể biểu thị bằng số. Ví dụ, làm sao để đo lường mức độ hài lòng của khách hàng? Lúc này cần sự sáng suốt của mọi người để biến nó thành tiêu chuẩn có thể đo lường bằng số.

Cuối cùng, sáu sigma chỉ là một khái niệm tổng quát về mục tiêu chất lượng. Bởi vì dù chúng ta có thể tính được giá trị độ lệch chuẩn, nhưng không thể biết chất lượng sản phẩm hay quy trình của chúng ta hiện tại đạt được bao nhiêu sigma. Tốt nhất là nên kết hợp thêm khái niệm Cpk (chính xác), đảm bảo cả Cp (độ chính xác) và Ck (độ đúng đắn) để thực sự đạt được sáu sigma.