Đánh dấu lớp cho những gì nó phục vụ, cách thức thực hiện và ví dụ
các thương hiệu đẳng cấp, còn được gọi là điểm giữa, là giá trị nằm ở trung tâm của một lớp, đại diện cho tất cả các giá trị nằm trong danh mục đó. Về cơ bản, nhãn hiệu lớp được sử dụng để tính toán các tham số nhất định, chẳng hạn như trung bình số học hoặc độ lệch chuẩn.
Sau đó, dấu lớp là trung điểm của bất kỳ khoảng nào. Giá trị này cũng rất hữu ích để tìm phương sai của một tập hợp dữ liệu đã được nhóm trong các lớp, điều này cho phép chúng ta hiểu được cách xa trung tâm những dữ liệu được xác định này tìm thấy.
Chỉ số
- 1 phân phối tần số
- 1.1 Có bao nhiêu lớp để xem xét?
- 2 Làm thế nào để bạn có được?
- 2.1 Ví dụ
- 3 Nó dùng để làm gì??
- 3.1 Ví dụ
- 4 tài liệu tham khảo
Phân phối tần số
Để hiểu thương hiệu của các lớp là gì, khái niệm phân phối tần số là cần thiết. Cho một tập dữ liệu, phân phối tần số là một bảng phân chia dữ liệu đó thành một số loại được gọi là các lớp.
Bảng này cho biết số lượng phần tử thuộc về mỗi lớp là gì; cái sau được gọi là tần số.
Trong bảng này, một phần thông tin chúng ta thu được từ dữ liệu bị hy sinh, vì thay vì có giá trị riêng của từng phần tử, chúng ta chỉ biết rằng nó thuộc về lớp đã nói.
Mặt khác, chúng ta hiểu rõ hơn về tập dữ liệu, vì theo cách này, việc đánh giá các mẫu đã thiết lập sẽ dễ dàng hơn, tạo điều kiện thuận lợi cho việc thao tác dữ liệu nói..
Có bao nhiêu lớp để xem xét?
Để phân phối tần suất, trước tiên chúng ta phải xác định số lượng lớp mà chúng ta muốn thực hiện và chọn giới hạn lớp của chúng.
Việc lựa chọn bao nhiêu lớp sẽ thuận tiện, có tính đến việc một số lượng nhỏ các lớp có thể ẩn thông tin về dữ liệu chúng ta muốn nghiên cứu và một lớp rất lớn có thể tạo ra quá nhiều chi tiết không nhất thiết phải hữu ích.
Các yếu tố mà chúng ta phải tính đến khi chọn có bao nhiêu lớp là vài lớp, nhưng trong số hai yếu tố này nổi bật: đầu tiên là phải tính đến số lượng dữ liệu chúng ta phải xem xét; thứ hai là để biết kích thước của phạm vi phân phối là bao nhiêu (nghĩa là sự khác biệt giữa quan sát lớn nhất và nhỏ nhất).
Sau khi đã xác định được các lớp, chúng tôi tiến hành đếm xem có bao nhiêu dữ liệu tồn tại trong mỗi lớp. Số này được gọi là tần số lớp và được ký hiệu là fi.
Như chúng tôi đã nói trước đây, chúng tôi có phân phối tần số làm mất thông tin riêng lẻ từ mỗi dữ liệu hoặc quan sát. Do đó, một giá trị được tìm kiếm đại diện cho toàn bộ lớp mà nó thuộc về; giá trị này là thương hiệu của các lớp.
Làm thế nào để bạn nhận được?
Dấu hiệu lớp là giá trị trung tâm mà một lớp đại diện. Nó có được bằng cách thêm các giới hạn của khoảng và chia giá trị này cho hai. Điều này chúng ta có thể diễn đạt bằng toán học như sau:
xtôi= (Giới hạn dưới + Giới hạn trên) / 2.
Trong biểu thức này xtôi biểu thị dấu hiệu của lớp thứ i.
Ví dụ
Cho tập dữ liệu sau, đưa ra phân phối tần số đại diện và nhận được phân loại tương ứng.
Vì dữ liệu có giá trị số cao nhất là 391 và nhỏ nhất là 221, nên chúng tôi có phạm vi là 391 -221 = 170.
Chúng tôi sẽ chọn 5 lớp, tất cả đều có cùng kích thước. Một cách để chọn các lớp như sau:
Lưu ý rằng mỗi dữ liệu nằm trong một lớp, chúng tách rời nhau và có cùng giá trị. Một cách khác để chọn các lớp là coi dữ liệu là một phần của biến liên tục, có thể đạt tới bất kỳ giá trị thực nào. Trong trường hợp này, chúng ta có thể xem xét các lớp có dạng:
205-245, 245-285, 285-325, 325-365, 365-405
Tuy nhiên, cách phân nhóm dữ liệu này có thể thể hiện sự mơ hồ nhất định với đường viền. Ví dụ, trong trường hợp của 245, câu hỏi được đặt ra: nó thuộc về lớp nào, thuộc lớp thứ nhất hay thứ hai??
Để tránh những nhầm lẫn này, một quy ước về các điểm cực đoan được thực hiện. Theo cách này, lớp đầu tiên sẽ là khoảng (205,245), lớp thứ hai (245,285), v.v..
Khi các lớp được định nghĩa, chúng ta tiến hành tính tần số và chúng ta có bảng sau:
Sau khi có được phân phối tần số của dữ liệu, chúng tôi tiến hành tìm các dấu hiệu lớp của từng khoảng. Trong thực tế, chúng ta phải:
x1= (205+ 245) / 2 = 225
x2= (245+ 285) / 2 = 265
x3= (285 + 325) / 2 = 305
x4= (325+ 365) / 2 = 345
x5= (365+ 405) / 2 = 385
Chúng ta có thể thể hiện điều này bằng đồ họa sau:
Nó dùng để làm gì??
Như đã đề cập trước đây, nhãn hiệu lớp rất có chức năng tìm trung bình số học và phương sai của một nhóm dữ liệu đã được nhóm thành các lớp khác nhau.
Chúng ta có thể định nghĩa trung bình số học là tổng của các quan sát thu được giữa kích thước mẫu. Từ quan điểm vật lý, giải thích của nó giống như điểm cân bằng của một tập dữ liệu.
Xác định toàn bộ tập hợp dữ liệu bằng một số duy nhất có thể có rủi ro, vì vậy chúng ta cũng phải tính đến sự khác biệt giữa điểm cân bằng này và dữ liệu thực. Các giá trị này được gọi là độ lệch so với trung bình số học và với các giá trị này, chúng tôi tìm cách xác định mức trung bình số học của dữ liệu thay đổi bao nhiêu.
Cách phổ biến nhất để tìm giá trị này là theo phương sai, là trung bình của bình phương của độ lệch so với trung bình số học.
Để tính trung bình số học và phương sai của một tập hợp dữ liệu được nhóm trong một lớp, chúng tôi sử dụng các công thức sau, tương ứng:
Trong các biểu thức xtôi là thương hiệu hạng i, ftôi đại diện cho tần số tương ứng và k số lượng các lớp trong đó dữ liệu được nhóm.
Ví dụ
Sử dụng dữ liệu được đưa ra trong ví dụ trước, chúng ta có thể mở rộng dữ liệu của bảng phân phối tần suất thêm một chút. Bạn nhận được như sau:
Sau đó, khi thay thế dữ liệu trong công thức, chúng ta đã để lại rằng trung bình số học là:
Phương sai và độ lệch chuẩn của nó là:
Từ đó, chúng ta có thể kết luận rằng dữ liệu gốc có trung bình số học là 306,6 và độ lệch chuẩn là 39,56.
Tài liệu tham khảo
- Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Thống kê mô tả. Biên tập Esic.
- Jhonson Richard A.Miller và Freund Xác suất và Chính khách cho các kỹ sư.Pearson Education.
- Miller I & Freund J. Xác suất và Statesmen cho các kỹ sư. TUYỆT VỜI.
- Sarabia A. Jose Maria, Pascual Marta. Khóa học thống kê cơ bản cho các công ty
- Llinás S. Humberto, Rojas A. Carlos Thống kê mô tả và phân phối xác suất.Universidad del Norte Biên tập