Hướng Dẫn Đọc Kết Quả Phân Tích Hồi Quy Đa Biến Trong SPSS Update 2022

4/5 - (1 bình chọn)

Phân tích hồi quy đa biến trong spss là bước rất quan trọng khi bạn phân tích dữ liệu. Vậy ở bước này, bạn cần làm những gì? Cách chạy hồi quy đa biến trong spss như thế nào? Cách đọc kết quả ra sao để không xảy ra sai sót? Mặc dù nó không hề khó, những các bước nếu bạn nắm không kỹ rất dễ xảy ra nhầm lẫn. Vì vậy hôm nay, Luận Văn Việt sẽ hướng dẫn chi tiết cách chạy và đọc kết quả. Phương pháp được cập nhật mới nhất cho bản 2022. 

1. Định nghĩa về hồi quy đa biến trong SPSS

Định nghĩa về hồi quy đa biến trong SPSS
Định nghĩa về hồi quy đa biến trong SPSS

Đầu tiên là một số thông tin, khái niệm bạn cần nắm rõ về phân tích hồi quy đa biến trong spss.

Định nghĩa

  • Phân tích hồi quy đa biến là gì? Hồi quy đa biến một phần mở rộng của hồi quy tuyến tính đơn giản. 

Mục đích sử dụng

  • Nó được sử dụng khi chúng ta muốn dự đoán giá trị của một biến dựa trên giá trị của hai hoặc nhiều biến khác. Biến chúng ta muốn dự đoán được gọi là biến phụ thuộc. Các biến chúng ta đang sử dụng để dự đoán giá trị của biến phụ thuộc được gọi là biến độc lập. 
  • Hồi quy đa biến cũng cho phép bạn xác định mức độ đóng góp nhiều, ít, không đóng góp… của từng nhân tố vào sự thay đổi của biến phụ thuộc.

Phương trình 

– Phương trình hồi quy đơn biến: Y = β0 + β1X + e

– Phương trình hồi quy bội: Y = β0 + β1X1 + β2X2 + … + βnXn + e

Trong đó:

    • Y: biến phụ thuộc, là biến chịu tác động của biến khác.
    • X, X1, X2,… Xn: biến độc lập, là biến tác động lên biến khác.
    • β0: hằng số hồi quy, hay còn được gọi là hệ số chặn. Đây là chỉ số nói lên giá trị của Y sẽ là bao nhiêu nếu tất cả X cùng bằng 0. Nói cách khác, chỉ số này cho chúng ta biết giá trị của Y là bao nhiêu nếu không có các X. Khi biểu diễn trên đồ thị Oxy, β0 là điểm trên trục Oy mà đường hồi quy cắt qua.
    • β1, β2,… βn: hệ số hồi quy, hay còn được gọi là hệ số góc. Chỉ số này cho chúng ta biết về mức thay đổi của Y gây ra bởi X tương ứng. Nói cách khác, chỉ số này nói lên có bao nhiêu đơn vị Y sẽ thay đổi nếu X tăng hoặc giảm một đơn vị.

Ví dụ 

Trong một nghiên cứu của công ty, ban giám đốc muốn dự đoán chỉ số về số lượng công việc và mức thu nhập của nhân viên, lấy tên là X. Nếu như cách bình thường, họ sẽ gửi khảo sát đến các phòng ban nhân viên. Tuy nhiên như vậy sẽ rườm rà, lâu có kết quả. Do đó, họ thiết lập một nghiên cứu và được chia ra theo các yếu tố: tuổi, phòng ban, vị trí. 

Khi đó: 

Biến phụ thuộc sẽ là: X (số lượng công việc và mức thu nhập của nhân viên)

Biến độc lập bao gồm: tuổi, phòng ban, vị trí. 

2. Ý nghĩa của 4 trị số trong phân tích hồi quy đa biến nhất định phải nhớ

Trong phân tích hồi quy tuyến tính đa biến. Bạn cần phải biết mức độ ảnh hưởng của từng yếu tố lên biến kết cục y. Muốn biết mức độ ảnh hưởng bạn cần lưu ý đến các trị số sau:

2.1. Hệ số tương quan R

Coefficient of correlation: yếu tố nào có R càng lớn thì ảnh hưởng càng nhiều

2.2. Bình phương của R

R square: yếu tố nào có R bình phương càng lớn thì mối quan hệ giữa yếu tố đó và biến y càng chặt chẽ.

2.3. Hệ số hồi quy Beta

Regression coefficient: yếu tố nào có Beta cao thì ảnh hưởng nhiều hơn. Tuy nhiên các yếu tố có đơn vị khác nhau (tuổi, mmol/L, mmHg….). Nên không thể so sánh mức ảnh hưởng giữa các yếu tố. 

Nếu muốn so sánh phải đổi các yếu tố có cùng đơn vị là độ lệch chuẩn. Lúc đó ta có hệ số hồi quy chuẩn hóa: 

Hệ số hồi quy Beta

Với Sx là độ lệch chuẩn của x tương ứng và Sy là độ lệch chuẩn của y.

2.4. Trị số p

 P value: Giá trị của trị số này càng nhỏ thì mức ảnh hưởng càng mạnh.

3. Phân tích hồi quy đa biến trong SPSS từ A đến Z 

Đầu tiên là các bước thực hành phân tích hồi quy tuyến tính đa biến trong spss. Bao gồm 3 bước như sau: 

Bước 1: Analyze > Regression > Linear…

 

Bước 2: Chuyển biến phụ thuộc vào ô Dependent; Chuyển các biến độc lập vào ô Independents bằng cách chọn và nhấn vào nút mũi tên.

Phân tích hồi quy đa biến trong SPSS từ A đến Z

 

Bước 3: Chọn Statistics > Collinearity diagnostics (để tính ra hệ số VIF – hệ số phóng đại phương sai- để đánh giá hiện tượng đa cộng tuyến). Sau đó bấm OK, bạn sẽ được một bảng kết quả. 

Phân tích hồi quy đa biến trong SPSS từ A đến Z

Sau đó bạn sẽ có bảng kết quả bao gồm 3 bảng tương tự dưới đây. Bạn cần đối chiếu để nhận xét và đưa ra kết luận phù hợp. 

Bảng kết quả Phân tích hồi quy đa biến trong SPSS

Dưới đây là hướng dẫn cách đọc bảng kết quả của phân tích hồi quy tuyến tính đa biến: 

3.1. Bảng ANOVA

Đây là bảng thứ 2 ở trong kết quả phân tích. Đây là bảng phân tích phương sai. Cách đọc bảng ANOVA như sau: 

Chúng ta cần đánh giá độ phù hợp mô hình một cách chính xác qua kiểm định giả thuyết. 

Để kiểm định độ phù hợp mô hình hồi quy, chúng ta đặt giả thuyết H0: R2 = 0. Phép kiểm định F được sử dụng để kiểm định giả thuyết này. Kết quả kiểm định như sau:

  • Nếu giá trị Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là R2 ≠ 0 một cách có ý nghĩa thống kê, mô hình hồi quy là phù hợp.
  • Nếu giá trị Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là R2 = 0 một cách có ý nghĩa thống kê, mô hình hồi quy không phù hợp.

Bảng kết quả ANOVA Phân tích hồi quy đa biến trong SPSS

Trong SPSS, các số liệu của kiểm định F được lấy từ bảng phân tích phương sai ANOVA.

Bảng ANOVA cho chúng ta kết quả kiểm định F để đánh giá giả thuyết sự phù hợp của mô hình hồi quy. Giá trị sig kiểm định F bằng 0.000 < 0.05, do đó, mô hình hồi quy là phù hợp.

3.2. Bảng Model Summary

Các điểm dữ liệu luôn luôn có xu hướng phân tán. Và có tạo thành dạng một đường thẳng. Nhưng không phải là một đường thẳng hoàn toàn. Do đó, hầu như không có đường thẳng nào có thể đi qua toàn bộ tất cả các điểm dữ liệu. Chúng ta sẽ cần tính toán được mức độ sai lệch đó cũng như mức độ phù hợp của mô hình hồi quy tuyến tính với tập dữ liệu. 

Bảng kết quả Model Summary Phân tích hồi quy đa biến trong SPSS

Một thước đo sự phù hợp của mô hình hồi quy tuyến tính thường dùng là hệ số xác định R^2. 

R^2 có mức dao động trong đoạn từ 0 đến 1. Nếu R^2 càng tiến về 1, các biến độc lập giải thích càng nhiều cho biến phụ thuộc. Và ngược lại, R^2 càng tiến về 0, các biến độc lập giải thích càng ít cho biến phụ thuộc. 

Trong ví dụ ở trên, bảng Model Summary cho chúng ta kết quả R bình phương (R Square) và R bình phương hiệu chỉnh (Adjusted R Square) để đánh giá mức độ phù hợp của mô hình. 

Giá trị R bình phương hiệu chỉnh bằng 0.695 cho thấy các biến độc lập đưa vào phân tích hồi quy ảnh hưởng 69.5% sự biến thiên của biến phụ thuộc, còn lại 31.4% là do các biến ngoài mô hình và sai số ngẫu nhiên. 

3.3. Bảng Coefficients

Chúng ta sẽ đánh giá hệ số hồi quy của mỗi biến độc lập có ý nghĩa trong mô hình hay không dựa vào kiểm định t (student) với giả thuyết H0: Hệ số hồi quy của biến độc lập Xi = 0. 

Mô hình hồi quy có bao nhiêu biến độc lập, chúng ta sẽ đi kiểm tra bấy nhiêu giả thuyết H0. Kết quả kiểm định:

  • Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi khác 0 một cách có ý nghĩa thống kê, biến X1 có tác động lên biến phụ thuộc.
  • Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi bằng 0 một cách có ý nghĩa thống kê, biến Xi không tác động lên biến phụ thuộc.

Bảng kết quả Coefficients Phân tích hồi quy đa biến trong SPSS

Khi xem xét mức độ tác động giữa các biến độc lập lên biến phụ thuộc. Chúng ta sẽ dựa vào trị tuyệt đối hệ số Beta. Giá trị tuyệt đối Beta càng lớn, biến độc lập tác động càng mạnh lên biến phụ thuộc. 

Trong SPSS, các số liệu của kiểm định t được lấy từ bảng hệ số hồi quy Coefficients. Nếu một biến độc lập không có ý nghĩa thống kê trong kết quả hồi quy, chúng ta sẽ kết luận biến độc lập đó không có sự tác động lên biến phụ thuộc mà không cần thực hiện loại biến và phân tích lại hồi quy.

Trên đây là toàn bộ các bước thực hành cũng như hướng dẫn vô cùng chi tiết về phân tích hồi quy đa biến. Hy vọng rằng với những chia sẻ của chúng tôi. Bạn sẽ hiểu rõ cũng như có thêm tài liệu học tập. Từ đó phân tích dữ liệu chính xác để làm báo cáo. 

3/5 (2 Reviews)
Theo dõi
Thông báo của
guest
0 Comments
Phản hồi nội tuyến
Xem tất cả bình luận

Bài viết liên quan

0915686999