Các biện pháp xu hướng trung tâm cho dữ liệu được nhóm
các các biện pháp của xu hướng trung tâm của dữ liệu được nhóm chúng được sử dụng trong các số liệu thống kê để mô tả các hành vi nhất định của một nhóm dữ liệu được cung cấp, chẳng hạn như những gì chúng gần với, mức trung bình của dữ liệu được thu thập, trong số các hành vi khác.
Khi một lượng lớn dữ liệu được lấy, sẽ rất hữu ích khi nhóm chúng để có thứ tự tốt hơn và do đó có thể tính toán các biện pháp nhất định của xu hướng trung tâm.
Trong số các biện pháp của xu hướng trung tâm được sử dụng nhiều nhất là trung bình số học, trung vị và chế độ. Những con số này cho biết những phẩm chất nhất định về dữ liệu được thu thập trong một thử nghiệm nhất định.
Để sử dụng các biện pháp này, trước tiên cần biết cách nhóm một nhóm dữ liệu.
Dữ liệu được nhóm
Để nhóm dữ liệu trước tiên, bạn phải tính toán phạm vi của dữ liệu, thu được bằng cách trừ giá trị cao nhất trừ đi giá trị thấp nhất của dữ liệu.
Sau đó chọn một số "k", đó là số lớp bạn muốn nhóm dữ liệu.
Chúng tôi tiến hành phân chia phạm vi giữa "k" để thu được biên độ của các lớp được nhóm. Số này là C = R / k.
Cuối cùng, việc nhóm được bắt đầu, trong đó một số nhỏ hơn giá trị nhỏ nhất của dữ liệu thu được được chọn..
Con số này sẽ là giới hạn dưới của lớp đầu tiên. Thêm vào đây C. Giá trị thu được sẽ là giới hạn trên của lớp đầu tiên.
Sau đó, C được thêm vào giá trị này và thu được giới hạn trên của lớp thứ hai. Theo cách này, bạn tiến hành cho đến khi bạn đạt được giới hạn trên của lớp cuối cùng.
Sau khi dữ liệu được nhóm, bạn có thể tiến hành tính giá trị trung bình, trung bình và thời trang.
Để minh họa ý nghĩa số học, trung bình và chế độ được tính toán, chúng tôi sẽ tiến hành với một ví dụ.
Ví dụ
Do đó, khi nhóm dữ liệu, bạn sẽ nhận được một bảng như sau:
3 biện pháp trung tâm chính
Bây giờ chúng ta sẽ tiến hành tính toán trung bình số học, trung vị và chế độ. Ví dụ trên sẽ được sử dụng để minh họa thủ tục này.
1- Trung bình số học
Trung bình số học bao gồm nhân mỗi tần số với trung bình của khoảng. Sau đó, tất cả các kết quả này được thêm vào, và cuối cùng được chia cho tổng dữ liệu.
Sử dụng ví dụ trước, chúng ta sẽ có được rằng trung bình số học bằng:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,1111
Điều này chỉ ra rằng giá trị trung bình của dữ liệu trong bảng là 5.11111.
2- Trung bình
Để tính trung bình của một tập dữ liệu, đầu tiên tất cả dữ liệu được sắp xếp từ ít nhất đến lớn nhất. Hai trường hợp có thể được trình bày:
- Nếu số dữ liệu là số lẻ, thì trung vị là dữ liệu ở ngay giữa.
- Nếu số dữ liệu là số chẵn thì trung bình là trung bình của hai dữ liệu còn lại ở trung tâm.
Khi nói đến dữ liệu được nhóm lại, việc tính toán trung vị được thực hiện theo cách sau:
- N / 2 được tính toán, trong đó N là tổng dữ liệu.
- Khoảng đầu tiên được tìm kiếm trong đó tần số tích lũy (tổng tần số) lớn hơn N / 2 và giới hạn dưới của khoảng này, được gọi là Li, được chọn..
Trung vị được cho theo công thức sau:
Me = Li + (Ls-Li) * (N / 2 - Tần số tích lũy trước Li) / Tần số của [Li, Ls)
Ls là giới hạn trên của phạm vi được đề cập ở trên.
Nếu bảng dữ liệu trên được sử dụng, chúng ta có N / 2 = 18/2 = 9. Tần số tích lũy là 4, 8, 14 và 18 (một cho mỗi hàng của bảng).
Do đó, nên chọn khoảng thứ ba, vì tần số tích lũy lớn hơn N / 2 = 9.
Vậy Li = 5 và Ls = 7. Áp dụng công thức được mô tả ở trên, bạn phải:
Tôi = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.33333.
3- Thời trang
Thời trang là giá trị có tần suất lớn nhất trong số tất cả các dữ liệu được nhóm; đó là giá trị được lặp lại nhiều lần nhất trong tập dữ liệu ban đầu.
Khi bạn có một lượng dữ liệu rất lớn, công thức sau đây được sử dụng để tính toán chế độ của dữ liệu được nhóm:
Mo = Li + (Ls-Li) * (Tần số Li - Tần số L (i-1)) / ((Tần số tần số Li của L (i-1)) + (Tần số tần số Li của L (i-1) i + 1)))
Khoảng [Li, Ls) là khoảng thời gian tìm thấy tần số cao nhất. Đối với ví dụ được thực hiện trong bài viết này, chúng ta có thời trang được đưa ra bởi:
Mơ = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Một công thức khác được sử dụng để đạt được giá trị gần đúng với thời trang là:
Mo = Li + (Ls-Li) * (tần số L (i + 1)) / (tần số L (i-1) + tần số L (i + 1)).
Với công thức này, các tài khoản như sau:
Mơ = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Tài liệu tham khảo
- Bellhouse, D. R. (2011). Abraham De Moivre: Thiết lập giai đoạn cho xác suất cổ điển và các ứng dụng của nó. Báo chí CRC.
- Cifuentes, J. F. (2002). Giới thiệu lý thuyết xác suất. Đại học quốc gia Colombia.
- Daston, L. (1995). Xác suất cổ điển trong thời kỳ khai sáng. Nhà xuất bản Đại học Princeton.
- Larson, H. J. (1978). Giới thiệu về lý thuyết xác suất và suy luận thống kê. Biên tập Limusa.
- Martel, P. J., & Vegas, F. J. (1996). Xác suất và thống kê toán học: ứng dụng trong thực hành lâm sàng và quản lý sức khỏe. Ediciones Díaz de Santos.
- Vázquez, A. L., & Ortiz, F. J. (2005). Phương pháp thống kê để đo lường, mô tả và kiểm soát sự biến đổi. Ed. Đại học Cantabria.
- Vázquez, S. G. (2009). Hướng dẫn toán học để truy cập vào trường đại học. Trung tâm biên tập nghiên cứu Ramon Areces SA.