Những điều cần biết về hiện tượng đa cộng tuyến

Hiện tượng đa cộng tuyến là gì? Nguyên nhân, dấu hiệu nhận biết đa cộng tuyến như thế nào? Hậu quả của đa cộng tuyến và các giải pháp khắc phục đối với hiện tượng này là gì? Tất cả những câu hỏi của bạn sẽ được Luận Văn Việt chuyên dịch vụ spss giải đáp trong bài viết ngắn này.

Những điều cần biết về hiện tượng đa cộng tuyến
Những điều cần biết về hiện tượng đa cộng tuyến

1. Khái niệm đa cộng tuyến

Đa cộng tuyến là hiện tượng các biến độc lập có mối tương quan mạnh với nhau. Đó là hiện tượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện được dưới dạng hàm số. Ví dụ có hai biến độc lập A và B, khi A tăng thì B tăng, A giảm thì B giảm…. thì đó là một dấu hiệu của đa cộng tuyến.

Hiện tượng đa cộng tuyến vi phạm giả định của mô hình hồi quy tuyến tính cổ điển là các biến độc lập không có mối quan hệ tuyến tính với nhau.

2. Nguyên nhân

  • Khi chọn các biến độc lập mối quan có quan hệ nhân quả hay có tương quan cao vì đồng thời phụ thuộc vào một điều kiện khác.
  • Cách thu thập mẫu: mẫu không đặc trưng cho tổng thể
  • Chọn biến độc lập có độ biến thiên nhỏ.

3. Dấu hiệu nhận biết

Có hai cách: dựa vào hệ số phóng đại phương sai VIF, hoặc dựa vào ma trận hệ số tương quan. Tuy nhiên cách dùng ma trận hệ số tương quan ít được sử dụng, chủ yếu sử dụng cách nhận xét chỉ số VIF.

Cách 1 

Dựa vào VIF ,khi thực hiện hồi quy đa biến, ta nhấn vào nút Statistics, xong check vào Collinearity diagnostics.

đa cộng tuyến (1)
đa cộng tuyến (1)

Kết quả ra như sau:

đa cộng tuyến (2)
đa cộng tuyến (2)

Nếu hệ số phóng đại phương sai VIF (variance inflation factor) > 2 thì có dấu hiệu đa cộng tuyến, đây là điều không mong muốn. Nếu VIF > 10 thì chắc chắn có đa cộng tuyến. Nếu VIF <2: không bị đa cộng tuyến.

Ta cũng có thể xem xét giá trị Tolerance bằng công thức Tolerance=1/VIF . Hệ số này nằm cột bên trái của hệ số VIF. Tương ứng là: nếu hệ số Tolerance bé hơn 0.5 thì có dấu hiệu đa cộng tuyến, đây là điều không mong muốn. Nếu giá trị Tolerance bé hơn 0.1 thì chắc chắn có đa cộng tuyến.

Cách 2

Nhận dạng Multicollinearity dựa vào hệ số tương quan,có hay không tương quan tuyến tính mạnh giữa các biến độc lập. Cách làm: xây dựng ma trận hệ số tương quan cặp giữa các biến độc lập và quan sát để nhận diện độ mạnh của các tương quan giữa từng cặp biến số độc lập. Cũng có thể nhìn vào kết quả hồi quy, ta thấy R2 cao( tầm trên 0.8) và thống kê t thấp. Tuy nhiên như đã nói thì ít khi sử dụng cách hai này. Vì nó dựa vào phán đoán chủ quan hơn là công thức như cách 1.

Ngoài dịch vụ viết luận văn tốt nghiệp của Luận Văn Việt, bạn có thể tham khảo dịch vụ làm báo cáo thuê , dịch vụ chỉnh sửa luận văn , viết luận văn bằng tiếng anhgiá thuê viết tiểu luận

4. Hậu quả

Sai số chuẩn của các hệ số sẽ lớn. Khoảng tin cậy lớn và thống kê t ít ý nghĩa. Các ước lượng không thật chính xác. Do đó chúng ta dễ đi đến không có cơ sở bác bỏ giả thiết “không” và điều này có thể không đúng.

5. Các giải pháp khắc phục

Giải pháp 1: Bổ sung dữ liệu hoặc tìm dữ liệu mới,tìm mẫu dữ liệu khác hoặc gia tăng cỡ mẫu. Tuy nhiên nếu mẫu lớn hơn mà vẫn còn multicollinearity thì vẫn có giá trị vì mẫu lớn hơn sẽ làm cho phương sai nhỏ hơn và hệ số ước lượng chính xác hơn so với mẫu nhỏ.

Giải pháp 2: Bỏ bớt biến độc lập (điều này xảy ra với giả định rằng không có mối quan hệ giữa biến phụ thuộc và biến độc lập bị loại bỏ mô hình).

Giải pháp 3: Thay đổi dạng mô hình,mô hình kinh tế lượng có nhiều dạng hàm khác nhau. Thay đổi dạng mô hình cũng có nghĩa là tái cấu trúc mô hình. Điều này thật sự là điều không mong muốn, thì lúc đó bạn phải thay đổi mô hình nghiên cứu.

Nguồn: luanvanviet.com

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments

Bài viết liên quan

0915686999
Zalo: 0915 686 999