Tổng thể, mẫu, trung bình, tham số và thống kê

Mai hỏi Parker:
*”Giả sử sau khi ra trường, anh muốn tìm hiểu về mức lương của các công ty để biết đường nộp hồ sơ xin việc, như Panko chẳng hạn.

Những công ty này quá lớn, có trụ sở từ Á sang Âu,…; anh không có đủ thời gian để tìm hiểu xem tất cả mọi người trong công ty có lương là bao nhiêu.

Do đó, anh muốn chọn ngẫu nhiên một số người và tìm hiểu xem họ có mức lương là bao nhiêu!”*

Parker thắc mắc:
“Sao lại phải chọn ngẫu nhiên?”

Mai giải thích:
*”Nếu anh chỉ tìm hiểu về một vài người làm chung một nhóm thì cũng không ổn, vì lương mỗi người là khác nhau.

Lương giám đốc, trưởng phòng, nhân viên khác nhau rất nhiều!”*

Parker:
“?!”

Mai tiếp tục:
*”Khi anh tìm hiểu được mức lương của những người anh đã ngẫu nhiên chọn ra, thì anh có một bộ dữ liệu, gọi là mẫu (sample), và phương pháp này được gọi là lấy mẫu ngẫu nhiên!

Mỗi điểm dữ liệu chúng ta quan sát được thì gọi là quan trắc (observation) hoặc quan sát!

Còn cái rộng hơn mà anh đang muốn tìm hiểu về gọi là tổng thể (population)!

Mình có thể hiểu việc lấy mẫu ngẫu nhiên cũng hơi giống đi bầu cử!

Các quan trắc trong mẫu ngẫu nhiên thì giống cử tri.

Người ta đi bầu để cử tri đại diện cho tiếng nói của mình!

Trong thống kê cũng tương tự, ta tìm cách lấy dữ liệu sao cho các quan sát trong mẫu đại diện cho tất cả mọi thứ trong tổng thể.

Nhưng ta không biết giá trị của tất cả các quan sát trong tổng thể, nên ta lấy mẫu ngẫu nhiên và hy vọng nó sẽ phản ánh toàn bộ tổng thể!

Hiểu không?”*

Parker… ngáp:
“Hiểu!”

🤣 Mai thấy anh chàng này mới học đã ngáp, liền tức giận trong lòng nhưng vẫn tiếp tục:
*”Lấy một ví dụ nữa nhé!

Muốn tìm hiểu độ tuổi trung bình của bạn gái trong đời của anh, thì tôi sẽ chọn một số người ngẫu nhiên và hỏi tuổi của họ thôi, vì anh có nhiều bạn gái quá rồi, nếu tìm hiểu hết thì … tôi không có thời gian ngủ!

Như vậy, tuổi các bạn gái của anh trong suốt cuộc đờitổng thể (population).

Còn tuổi của những cô nàng tôi đã chọn ngẫu nhiênmẫu (sample)!


The concept of population and sample

📌 The population refers to the entire group of individuals or items that we are interested in studying, which can vary widely in size and complexity, from all the residents of a country to every manufactured product in a factory. In contrast, a sample is a subset of the population, carefully selected to represent the larger group. This selection process is essential because studying an entire population can be impractical, time-consuming, and costly. By analyzing a well-chosen sample, researchers can make inferences about the population as a whole.


Parker cười tinh nghịch:
“?!”

Mai tiếp tục:
*”Độ tuổi trung bình của bạn gái trong đời của anh, tức là cái tôi muốn tìm hiểu là tham số (parameter),

Còn cái mà tôi ước lượng bằng cách sử dụng dữ liệu có được là một thống kê (statistic).

Tôi muốn tìm hiểu độ tuổi trung bình các bạn gái trong đời của anh, tức là đang tìm hiểu về trung bình tổng thể (population mean).

Nhưng trong tương lai, anh thế nào cũng có một đống bạn gái khác, mà tôi muốn tìm hiểu về cái đó bây giờ,

Nên tôi sẽ lấy trung bình độ tuổi các bạn gái của anh trong mẫu tôi thu thập được để ước lượng cái trung bình tổng thể đó.

Cái đó gọi là trung bình mẫu (sample mean). Hiểu không?”*

Giả sử tuổi các bạn gái của anh trong mẫu mà tôi thu thập được là:
$10, 18, 20, 25, 30, 27, 35, 52$

Thì tôi đo lường trung bình tổng thể, tức là độ tuổi trung bình của các bạn gái trong đời anh, bằng trung bình mẫu:


Parker chọc Mai thêm một chút:

🤣 Parker cười tiếp, rồi nháy mắt:
*”Hiểu! Nhưng cô tìm hiểu độ tuổi trung bình của bạn gái tôi để làm gì? Hay là cô cũng muốn xem liệu mình có thể lọt vào đội tuyển?

Mai lè lưỡi, nhăn mặt:
“Hả?! Ai thèm hẹn hò với anh!”


Tổng thể & mẫu trong thống kê

Tổng thể (population):
toàn bộ nhóm đối tượng mà chúng ta quan tâm nghiên cứu,
Có thể rất đa dạng về quy mô và độ phức tạp, từ toàn bộ cư dân của một quốc gia đến mọi sản phẩm được sản xuất trong một nhà máy.

Mẫu (sample):
một tập hợp con của tổng thể, được chọn lựa cẩn thận để đại diện cho tổng thể.

Tại sao lấy mẫu quan trọng?
Bởi vì nghiên cứu toàn bộ tổng thể có thể không khả thi, tốn thời gian và tốn kém.

📌 By analyzing a well-chosen sample, researchers can make inferences about the population as a whole.


Tham số & Thống kê

Tham số (parameter):
một mô tả bằng số về đặc điểm của tổng thể.
Chúng ta không biết chính xác tham số đó là gì.

Thống kê (statistic):
giá trị đo lường mà chúng ta có thể thu được từ mẫu, dùng để ước lượng tham số của tổng thể.

📌 A parameter is a numerical description of a characteristic of the population. We don’t know exactly what it is. So, we approximate them by using a statistic, which is an estimate that we can obtain from our sample.


Discover more from Science Comics

Subscribe to get the latest posts sent to your email.

Leave a Reply

error: Content is protected !!