Nhiều phương pháp hồi quy tuyến tính, phương pháp và công dụng



các hồi quy tuyến tính đa là một công cụ tính toán điều tra các mối quan hệ nguyên nhân của các đối tượng nghiên cứu và kiểm tra các giả thuyết phức tạp.

Nó được sử dụng trong toán học và thống kê. Kiểu hồi quy tuyến tính này yêu cầu các biến phụ thuộc (nói cách khác là kết quả) và biến độc lập (nghĩa là nguyên nhân) tuân theo thứ tự phân cấp, ngoài các yếu tố khác vốn có cho các lĩnh vực nghiên cứu khác nhau..

Thông thường, hồi quy tuyến tính là một hồi quy được biểu diễn bởi hàm tuyến tính được tính từ hai biến phụ thuộc. Đây là trường hợp quan trọng nhất của nó trong đó hiện tượng được nghiên cứu có một đường hồi quy thẳng.

Trong một tập hợp dữ liệu nhất định (x1, y1) (xn, yn) và của các giá trị tương ứng với một cặp biến ngẫu nhiên trong tương quan trực tiếp với nhau, đường hồi quy có thể bắt đầu, dưới dạng phương trình, như y = a · x + b .

Cơ sở lý thuyết của tính toán trong hồi quy tuyến tính đa

Bất kỳ phép tính nào sử dụng hồi quy tuyến tính đa biến sẽ phụ thuộc rất nhiều vào đối tượng nghiên cứu và lĩnh vực nghiên cứu, chẳng hạn như kinh tế học, vì các biến làm cho các công thức được sử dụng có độ phức tạp khác nhau tùy theo trường hợp.

Điều này có nghĩa là câu hỏi càng phức tạp thì càng phải tính đến nhiều yếu tố, càng phải thu thập dữ liệu và do đó, khối lượng các yếu tố được đưa vào tính toán càng lớn, điều này sẽ làm cho công thức lớn hơn..

Tuy nhiên, điểm chung trong tất cả các công thức này là có một trục dọc (một trong các tọa độ hoặc trục Y) và trục ngang (một trong các abscissas hoặc trục X) mà sau khi được tính toán được biểu thị bằng đồ họa của hệ thống Cartesian.

Từ đó, việc giải thích dữ liệu được đưa ra (xem phần tiếp theo) và kết luận hoặc dự đoán được đưa ra. Trong mọi trường hợp, tiền đề thống kê trước có thể được sử dụng để cân nhắc các biến, chẳng hạn như sau:

1- Ngoại sinh yếu

Điều đó có nghĩa là biến sẽ phải được giả định với một giá trị cố định mà khó có thể tự cho vay để thay đổi trong mô hình của nó do nguyên nhân bên ngoài.

2- Ký tự tuyến tính

Nó ngụ ý rằng các giá trị của các biến, cũng như các tham số và hệ số dự đoán khác, phải được hiển thị dưới dạng kết hợp tuyến tính của các yếu tố có thể được biểu thị trong biểu đồ, trong hệ thống Cartesian.

3- Homocedastic

Điều này phải là hằng số. Ở đây có nghĩa là, bất kể các biến dự đoán, phải có cùng phương sai của các lỗi đối với từng biến phản ứng khác nhau.

4- Độc lập

Điều này chỉ áp dụng cho các lỗi của các biến trả lời, phải được hiển thị một cách cô lập và không phải là một nhóm các lỗi đại diện cho một mẫu xác định.

5- Sự vắng mặt của đa cộng đồng

Nó được sử dụng cho các biến độc lập. Nó xảy ra khi bạn cố gắng nghiên cứu một cái gì đó nhưng có rất ít thông tin có sẵn, do đó có thể có nhiều câu trả lời và do đó các giá trị có thể có nhiều cách hiểu, cuối cùng không giải quyết được vấn đề đặt ra.

Có những tiền đề khác được tính đến, nhưng những tiền đề được trình bày ở trên cho thấy rõ rằng hồi quy tuyến tính đòi hỏi nhiều thông tin không chỉ để có một sự nghiêm ngặt hơn, đầy đủ hơn và không có sai lệch, mà còn là giải pháp cho câu hỏi đề nghị cụ thể.

Điều đó có nghĩa là, nó phải đi đến điểm với một cái gì đó rất cụ thể, cụ thể, không cho vay mơ hồ và ở mức độ thấp hơn có thể nó sẽ phát sinh lỗi.

Hãy nhớ rằng nhiều hồi quy tuyến tính là không thể sai lầm và có thể dễ bị lỗi và không chính xác trong tính toán. Đây không phải là quá nhiều do những người thực hiện nghiên cứu, nhưng bởi vì một hiện tượng đặc biệt của tự nhiên không hoàn toàn có thể dự đoán được hoặc nhất thiết là sản phẩm của một nguyên nhân cụ thể.

Nó thường xảy ra rằng bất kỳ đối tượng nào cũng có thể thay đổi đột ngột hoặc một sự kiện phát sinh từ hành động (hoặc không hành động) của nhiều yếu tố tương tác với nhau.

Giải thích đồ họa

Khi dữ liệu đã được tính toán theo các mô hình được thiết kế trong các giai đoạn trước của nghiên cứu, các công thức sẽ mang lại các giá trị có thể được biểu thị trong biểu đồ.

Theo thứ tự các ý tưởng này, hệ thống Cartesian sẽ hiển thị nhiều điểm tương ứng với các biến được tính toán. Một số sẽ nhiều hơn trong trục của các tọa độ, trong khi những người khác sẽ nhiều hơn trong trục của các abscissas. Một số sẽ được nhóm lại nhiều hơn, trong khi một số khác sẽ bị cô lập hơn.

Để nhận thấy sự phức tạp liên quan đến việc diễn giải dữ liệu của các biểu đồ, chúng ta có thể quan sát, ví dụ, Bộ tứ Ascombe. Trong bộ tứ này, bốn bộ dữ liệu khác nhau được xử lý và mỗi bộ trong số chúng nằm trong một biểu đồ riêng, do đó, xứng đáng được phân tích riêng.

Tính tuyến tính vẫn còn, nhưng các điểm trong hệ thống Cartesian phải được xem xét rất cẩn thận trước khi biết các mảnh ghép kết hợp với nhau như thế nào. Sau đó, các kết luận có liên quan có thể được rút ra.

Tất nhiên, có một số phương tiện để các phần này khớp với nhau, mặc dù theo các phương pháp khác nhau được mô tả trong hướng dẫn tính toán chuyên dụng..

Hồi quy tuyến tính, như đã nói, phụ thuộc vào nhiều biến số tùy thuộc vào đối tượng nghiên cứu và lĩnh vực mà nó được áp dụng, do đó các quy trình trong kinh tế học không giống như trong y học hoặc trong khoa học máy tính. Trong tất cả, có, một ước tính được thực hiện, một giả thuyết sau đó được kiểm tra ở cuối.

Phần mở rộng của hồi quy tuyến tính bội

Có một số loại hồi quy tuyến tính, chẳng hạn như đơn giản và tổng quát, nhưng cũng có một số khía cạnh của hồi quy bội thích ứng với các đối tượng nghiên cứu khác nhau và do đó, theo nhu cầu của khoa học..

Chúng thường xử lý một số lượng lớn các biến, vì vậy bạn thường có thể thấy các mô hình như đa biến hoặc đa cấp. Mỗi người sử dụng các định đề và công thức có độ phức tạp đa dạng, do đó việc giải thích kết quả của họ có xu hướng có tầm quan trọng lớn hơn..

Phương pháp ước tính

Có một loạt các thủ tục để ước tính dữ liệu thu được trong hồi quy tuyến tính bội.

Một lần nữa, mọi thứ ở đây sẽ phụ thuộc vào độ rắn của mô hình được sử dụng, các công thức tính toán, số lượng biến, các định đề lý thuyết đã được tính đến, lĩnh vực nghiên cứu, các thuật toán được lập trình trong các chương trình máy tính chuyên dụng và , mệnh xuất sắc, độ phức tạp của đối tượng, hiện tượng hoặc sự kiện đang được phân tích.

Mỗi phương pháp ước tính sử dụng các công thức hoàn toàn khác nhau. Không có gì là hoàn hảo, nhưng nó có những đức tính độc đáo nên được sử dụng theo nghiên cứu thống kê được thực hiện.

Có tất cả các loại: biến công cụ, bình phương tối thiểu tổng quát, hồi quy tuyến tính Bayes, mô hình hỗn hợp, chính quy Tyjonov, hồi quy lượng tử, ước lượng Theil-Sen và một danh sách dài các công cụ mà dữ liệu có thể được nghiên cứu với độ chính xác cao hơn. 

Sử dụng thực tế

Hồi quy tuyến tính đa được sử dụng trong các lĩnh vực nghiên cứu khác nhau và trong nhiều trường hợp cần có sự hỗ trợ của các chương trình máy tính để có được dữ liệu chính xác hơn.

Theo cách này, biên độ sai số có thể phát sinh từ các tính toán thủ công đã giảm (do sự hiện diện của nhiều biến độc lập và phụ thuộc, không có gì đáng ngạc nhiên khi loại hồi quy tuyến tính này tự cho mình mắc lỗi, vì có nhiều dữ liệu và yếu tố đã xử lý).

Ví dụ, trong phân tích xu hướng thị trường, nó được kiểm tra xem có dữ liệu nào như giá của sản phẩm tăng và giảm hay không, nhưng trên hết là khi nào và tại sao.

Thời điểm được phân tích chỉ khi có các biến thể quan trọng của các con số trong một khoảng thời gian nhất định, chủ yếu là nếu những thay đổi là bất ngờ. Tại sao bạn tìm kiếm các yếu tố chính xác hoặc có thể xảy ra mà sản phẩm đó tăng, giảm hoặc giữ giá bán lẻ?.

Tương tự như vậy, các ngành khoa học sức khỏe (y học, phân tích sinh học, dược phẩm, dịch tễ học, trong số những ngành khác) được hưởng lợi từ nhiều hồi quy tuyến tính, qua đó họ nghiên cứu các chỉ số sức khỏe như tỷ lệ tử vong, tỷ lệ mắc bệnh và tỷ lệ sinh..

Trong những trường hợp này, chúng ta có thể bắt đầu từ một nghiên cứu bắt đầu bằng quan sát, mặc dù sau đó, một mô hình được thực hiện để xác định xem sự biến đổi của một số chỉ số nói là do một số nguyên nhân cụ thể, khi nào và tại sao.

Tài chính cũng sử dụng nhiều hồi quy tuyến tính để điều tra những lợi thế và bất lợi của việc thực hiện các khoản đầu tư nhất định. Ở đây luôn cần phải biết khi nào các giao dịch tài chính được thực hiện, với ai và lợi ích mong đợi là gì.

Các mức rủi ro sẽ cao hơn hoặc thấp hơn theo các yếu tố khác nhau được tính đến khi đánh giá chất lượng của các khoản đầu tư này, cũng xem xét khối lượng trao đổi tiền tệ.

Tuy nhiên, đó là trong nền kinh tế nơi công cụ tính toán này được sử dụng nhiều nhất. Do đó, trong khoa học này, hồi quy tuyến tính nhiều được sử dụng với mục tiêu dự đoán chi tiêu tiêu dùng, chi phí đầu tư, mua, xuất khẩu, nhập khẩu, tài sản, nhu cầu lao động, cung cấp công việc và nhiều yếu tố khác..

Tất cả chúng đều liên quan đến kinh tế vĩ mô và kinh tế vi mô, là nơi đầu tiên có các biến phân tích dữ liệu phong phú hơn vì chúng được đặt trên toàn cầu..

Tài liệu tham khảo

  1. Hói, Aurelio (1967). Mặt phẳng và hình học không gian, với phần giới thiệu về lượng giác. Caracas: Biên tập Cultura Venezolana, S.A..
  2. Bệnh viện Đại học Ramón y Cajal (2017). Mô hình hồi quy tuyến tính đa biến. Madrid, Tây Ban Nha: HRC, Cộng đồng Madrid. Lấy từ www.hrc.es.
  3. Pedhazur, Elazar J. (1982). Hồi quy bội trong nghiên cứu hành vi: Giải thích và dự đoán, tái bản lần 2. New York: Holt, Rinehart & Winston.
  4. Rojo Abuín, J.M. (2007). Hồi quy tuyến tính bội Madrid, Tây Ban Nha: Trung tâm Khoa học Xã hội và Con người. Được phục hồi từ humanities.cchs.csic.es.
  5. Đại học tự trị Madrid (2008). Hồi quy tuyến tính bội Madrid, Tây Ban Nha: UAM. Được phục hồi từ web.uam.es.
  6. Đại học A Coruña (2017). Mô hình hồi quy tuyến tính đa biến; Tương quan La Coruña, Tây Ban Nha: UDC, Khoa Toán học. Phục hồi từ dm.udc.es.
  7. Uriel, E. (2017). Hồi quy tuyến tính bội: ước lượng và tính chất. Valencia, Tây Ban Nha: Đại học Valencia. Phục hồi từ www.uv.es.
  8. Barrio Castro, Tomás del; Clar López, Miquel và Suriñach Caral, Jordi (2002). Nhiều mô hình hồi quy tuyến tính: đặc điểm kỹ thuật, ước tính và độ tương phản. Catalonia: Biên tập UOC.