Lần đầu tiên mình cầm 1 quyển sách thống kê lên đọc thì ở trang đầu có hàng chữ này: “There are three kinds of lies: lies, damned lies, and statistics.” Tạm dịch là, có ba loại nói dối: nói dối, nói dối thậm tệ, và thống kê.
Đó là điều đầu tiên mà những người học thống kê phải nhớ trước khi bắt đầu bước vào con đường sử dụng số liệu để đưa ra các nhận định. Nó nhấn mạnh rằng, số liệu thống kê, nếu không phân tích và diễn giải đúng thì rất nguy hiểm.
Hãy lấy một ví dụ, một bạn đưa ra số liệu và kết luận thế này: “Về tham nhũng thì VN đứng thứ 117/180 nước trong bảng xếp hạng của Transparency International, thuộc nhóm trung bình.” Và sử dụng nó để nói rằng nhiều người hiểu sai về VN và đó là một trong những lý do khiến họ ra đi. Và bạn ấy hàm ý rằng, lý do ra đi như thế là không đúng, vì tham nhũng ở VN cũng không đến nỗi phải ra đi. Mình sẽ diễn giải qua các sai sót trong việc phân tích và diễn dịch số liệu từ các sai sót dễ nhận diện cho đến các sai sót khó nhận diện nhất:
- 117/180 thì là nằm vào (180-117)/180= 35% cuối bảng xếp hạng, khó có thể nói là trung bình được. Nếu trong lớp có 100 người, bạn xếp hạng 65 thì khó có thể nói là trung bình được.
- Có sự lầm lẫn giữa xếp hạng và mức độ. Xếp hạng là ordinal, mức độ là interval. Ví dụ nhé: A có 1 triệu, B có 5 đồng, C có 3 đồng, D có 1 đồng. Nếu xếp hạng thì A hạng 1, B hạng 2, C hạng 3, D hạng 4. Bạn không thể nói B hạng 2 nên B trên trung bình được. Do đó bạn không thể nói tham nhũng VN xếp hạng 117/180 thì là tham nhũng trung bình được. Khoảng cách VN (33 điểm) đến nước cao nhất là 88-33 là 55 điểm, nhiều hơn gấp đôi từ VN đến nước thấp nhất, 33-10= 23 điểm. Như vậy về mức độ, VN nằm ở 23/(23+55) = 29% cuối bảng các nước được đánh giá, thấp hơn con số 35% ở trên nữa. 29% chắc chắn không phải trung bình. Bạn hình dung thế này, nếu người cao nhất được 10 điểm, bạn chỉ có 2.9 điểm, rồi bạn nói rằng bạn có điểm số trung bình thì có được không? Vâng 2.9/10 chắc chắn không phải trung bình mà là kém.
- Vấn đề thứ ba còn nghiêm trọng hơn nữa, đó là cách diễn giải số liệu để ra quyết định. Hãy hình dung thế này, tham nhũng như là cái lỗ thủng của con thuyền làm nước tràn vô con tàu. Mức thu lợi của các dự án công (ROI) là cái máy bơm nước ra. Việc quyết định ở lại con tàu hay phải ra đi không nằm ở cái lỗ thủng xếp hạng mấy, mà nằm ở chỗ cái máy bơm có mạnh hơn cái lỗ thủng hay không? Nếu lỗ thủng lớn hơn công suất máy bơm thì kiểu gì tàu cũng chìm. “Ra đi” không phải là vấn đề nên hay không, mà là vấn đề khi nào và như thế nào. Tương tự như vậy, khi tham nhũng vượt qua ngưỡng ROI thì càng làm càng lỗ. Cái lỗ đó đi vô nợ công, môi trường tàn phá, cạn kiệt tài nguyên (kể cả tài nguyên nhân sự). Do đó, nơi nào tham nhũng cao hơn ROI là không nên sống vì không có tương lai. Vì vậy, để xác định liệu tham nhũng có phải là lý do chính đáng khiến một người phải ra đi hay không thì phải phân tích tương quan giữa tham nhũng và suất thu lợi đầu tư công chứ không phải xếp hạng của tham nhũng. Cách sử dụng số liệu như thế này là tuỳ tiện và không đúng.
Các bạn thấy đấy, sử dụng số liệu phải cẩn thận, không thôi thì rất dễ dẫn đến sai lầm.
by Nga Ho-Dac
Please ‘like’ the Facebook page or subscribe to the mailing list to receive notifications of new posts.
Please click on the tags below to find similar articles.