Quy tắc Sturges Giải thích, Ứng dụng và Ví dụ



các Quy tắc Sturges là một tiêu chí được sử dụng để xác định số lượng các lớp hoặc khoảng cần thiết để biểu thị bằng đồ họa một tập hợp dữ liệu thống kê. Quy tắc này được ban hành vào năm 1926 bởi nhà toán học người Đức Herbert Sturges.

Sturges đã đề xuất một phương pháp đơn giản, dựa trên số lượng mẫu x cho phép tìm số lượng lớp và biên độ phạm vi của chúng. Quy tắc Sturges được sử dụng rộng rãi, đặc biệt là trong lĩnh vực thống kê, đặc biệt là để xây dựng biểu đồ tần số.

Chỉ số

  • 1 giải thích
  • 2 ứng dụng
  • 3 ví dụ
  • 4 tài liệu tham khảo

Giải thích

Quy tắc Sturges là một phương pháp thực nghiệm được sử dụng rộng rãi trong thống kê mô tả để xác định số lượng các lớp phải tồn tại trong biểu đồ tần số, để phân loại một tập hợp dữ liệu đại diện cho một mẫu hoặc dân số.

Về cơ bản, quy tắc này xác định chiều rộng của các thùng chứa đồ họa, biểu đồ tần số.

Để thiết lập quy tắc của mình, Herbert Sturges đã xem xét một sơ đồ tần số lý tưởng, bao gồm các khoảng K, trong đó khoảng thứ i chứa một số mẫu nhất định (i = 0, ... k - 1), được biểu thị như sau:

Số lượng mẫu được đưa ra bằng số cách có thể trích xuất một tập hợp con của tập hợp; đó là, bằng hệ số nhị thức, được biểu thị như sau:

Để đơn giản hóa biểu thức, ông đã áp dụng các thuộc tính của logarit trong cả hai phần của phương trình:

Do đó, Sturges xác định rằng số k tối ưu được cho bởi biểu thức:

Nó cũng có thể được thể hiện như sau:

Trong biểu thức này:

- k là số lớp.

- N là tổng số quan sát của mẫu.

- Nhật ký là logarit chung của cơ sở 10.

Ví dụ: để tạo biểu đồ tần số biểu thị một mẫu ngẫu nhiên về chiều cao của 142 con, số lượng khoảng hoặc các lớp mà phân phối sẽ có là:

k = 1 + 3,322 * đăng nhập10 (N)

k = 1 + 3,322* nhật ký (142)

k = 1 + 3,322* 2,1523

k = 8,14 8

Do đó, phân phối sẽ trong 8 khoảng.

Số lượng các khoảng phải luôn luôn được đại diện bởi số nguyên. Trong trường hợp giá trị là số thập phân, phải thực hiện xấp xỉ với toàn bộ số gần nhất.

Ứng dụng

Quy tắc Sturges được áp dụng chủ yếu trong thống kê, vì nó cho phép phân phối tần số thông qua việc tính toán số lượng lớp (k), cũng như độ dài của mỗi lớp, còn được gọi là biên độ.

Biên độ là sự khác biệt giữa giới hạn trên và dưới của lớp, chia cho số lượng lớp và được biểu thị:

Có nhiều quy tắc thực nghiệm cho phép phân phối tần số được thực hiện. Tuy nhiên, quy tắc Sturges thường được sử dụng vì nó xấp xỉ số lượng các lớp, thường nằm trong khoảng từ 5 đến 15.

Theo cách này, hãy xem xét một giá trị đại diện đầy đủ cho một mẫu hoặc dân số; nghĩa là, phép tính gần đúng không biểu thị các nhóm cực trị, cũng không hoạt động với số lượng lớp quá mức không cho phép tóm tắt mẫu.

Ví dụ

Cần thực hiện biểu đồ tần số theo dữ liệu đã cho, tương ứng với độ tuổi thu được trong một cuộc khảo sát về những người đàn ông tập thể dục trong phòng tập thể dục địa phương.

Để xác định các khoảng thời gian bạn phải biết kích thước của mẫu hoặc số lượng quan sát; trong trường hợp này, bạn có 30.

Sau đó, quy tắc Sturges được áp dụng:

k = 1 + 3,322 * đăng nhập10 (N)

k = 1 + 3,322* nhật ký (30)

k = 1 + 3,322* 1.4771

k = 5,90 6 khoảng.

Từ số lượng khoảng, biên độ mà chúng sẽ có thể được tính toán; có nghĩa là, chiều rộng của mỗi thanh được biểu thị trong biểu đồ tần số:

Giới hạn dưới được coi là giá trị thấp nhất của dữ liệu và giới hạn trên là giá trị cao nhất. Sự khác biệt giữa giới hạn trên và dưới được gọi là phạm vi hoặc đường dẫn của biến (R).

Từ bảng ta có giới hạn trên là 46 và giới hạn dưới 13; theo cách đó, biên độ của mỗi lớp sẽ là:

Các khoảng sẽ bao gồm một giới hạn trên và dưới. Để xác định các khoảng này, bắt đầu đếm từ giới hạn dưới, thêm vào đó biên độ được xác định theo quy tắc (6), như sau:

Sau đó, tần số tuyệt đối được tính để xác định số lượng nam giới tương ứng với mỗi khoảng; trong trường hợp này là:

- Khoảng 1: 13 - 18 = 9

- Khoảng 2: 19 - 24 = 9

- Khoảng 3: 25 - 30 = 5

- Khoảng 4: 31 - 36 = 2

- Khoảng 5: 37 - 42 = 2

- Khoảng 6: 43 - 48 = 3

Khi thêm tần số tuyệt đối của mỗi lớp, giá trị này phải bằng tổng số mẫu; trong trường hợp này, 30.

Sau đó, tần số tương đối của mỗi khoảng được tính toán, chia tần số tuyệt đối của khoảng này cho tổng số quan sát:

- Khoảng 1: fi = 9 30 = 0,30

- Khoảng 2: fi = 9 30 = 0,30

- Khoảng 3: fi = 5 30 = 0.1666

- Khoảng 4: fi = 2 30 = 0,0666

- Khoảng 5: fi = 2 30 = 0,0666

- Khoảng 4: fi = 3 30 = 0.10

Sau đó, bạn có thể tạo một bảng phản ánh dữ liệu và sơ đồ từ tần số tương đối liên quan đến các khoảng thu được, như có thể thấy trong các hình ảnh sau:

Theo cách này, quy tắc Sturges cho phép xác định số lượng lớp hoặc khoảng thời gian mà một mẫu có thể được phân chia, để tóm tắt một mẫu dữ liệu thông qua việc chuẩn bị các bảng và biểu đồ.

Tài liệu tham khảo

  1. Alfonso Urquía, M. V. (2013). Mô hình hóa và mô phỏng các sự kiện rời rạc. UNED,.
  2. Altman Naomi, M. K. (2015). "Hồi quy tuyến tính đơn giản." Phương pháp tự nhiên .
  3. Antúnez, R. J. (2014). Thống kê trong giáo dục. UNID kỹ thuật số.
  4. Cáo, J. (1997.). Phân tích hồi quy ứng dụng, mô hình tuyến tính và các phương pháp liên quan. Ấn phẩm SAGE.
  5. Humberto Llinás Solano, C. R. (2005). Thống kê mô tả và phân phối xác suất. Đại học phía bắc.
  6. Panteleeva, O. V. (2005). Nguyên tắc cơ bản của xác suất và thống kê.
  7. O. Kuehl, M. O. (2001). Thiết kế các thí nghiệm: Nguyên tắc thống kê của thiết kế và phân tích nghiên cứu. Biên tập viên Thomson.