Hồi quy logistic là gì? Phân Tích Hồi Quy Logistic Trong SPSS

5/5 - (1 bình chọn)

Bạn đang tìm hiểu về cách thực hiện Hồi quy Logistic trong SPSS? Bài viết này sẽ hướng dẫn bạn từng bước chạy hồi quy logistic đơn biến và đa biến, cung cấp ví dụ cụ thể và phân tích kết quả. Khám phá cách áp dụng phân tích này trong các lĩnh vực thực tế và biết cách sử dụng mô hình để đưa ra các dự đoán chính xác. Đừng bỏ lỡ cơ hội nâng cao khả năng phân tích dữ liệu của bạn cùng Luận văn Việt!

Hồi quy logistic trong SPSS

1. Hồi quy logistic là gì?

Hồi quy Logistic là một phương pháp phân tích thống kê mà chúng ta sử dụng khi biến phụ thuộc là biến nhị phân (có hai giá trị duy nhất, chẳng hạn như 0 và 1). 

Mục đích: Hồi quy Logistic giúp chúng ta hiểu mối quan hệ giữa các biến độc lập và xác suất xảy ra của biến phụ thuộc. 

Phân loại: Trong SPSS, hồi quy logistic có thể được thực hiện cho cả

  • Đơn biến
  • Đa biến

2. Hồi quy logistic đơn biến trong SPSS

Sau đây hãy cùng Luận Văn Việt sẽ đi sâu vào cách thực hiện Hồi quy Logistic đơn biến:

2.1. 5 bước chạy hồi quy logistic đơn biến

Bước 1: Chuẩn bị dữ liệu và mục tiêu phân tích: Đầu tiên, bạn cần chuẩn bị dữ liệu và xác định biến phụ thuộc và các biến độc lập.

Bước 2: Lựa chọn biến độc lập và phân loại: Xác định biến độc lập có thể ảnh hưởng đến biến phụ thuộc và phân loại chúng.

Bước 3: Chạy hồi quy logistic: Tiến hành chạy mô hình hồi quy logistic trong SPSS.

Bước 4: Đọc và hiểu kết quả: Đọc và hiểu các thông số ước tính, giá trị p và ý nghĩa thống kê của chúng.

Bước 5: Đánh giá mô hình và tối ưu hóa: Đánh giá hiệu suất của mô hình và tối ưu hóa các biến độc lập nếu cần.

2.2. Ví dụ cách chạy cụ thể

Tên tình huống: Cần tìm hiểu về mối quan hệ giữa nồng độ procalcitonin trong huyết thanh và tiên lượng tử vong trong tình trạng nhiễm trùng huyết. Dữ liệu nghiên cứu đã được thu thập từ 20 bệnh nhân tham gia. Mục tiêu trong bài nghiên cứu này là tính toán giá trị p, đại diện cho xác suất dự đoán tử vong trong trường hợp nghiên cứu này.

Dữ liệu bước chạy hồi quy logistic đơn biến

Các bước chạy cụ thể:

Các giai đoạn thực hiện cụ thể như sau:

Bước 1: Truy cập vào menu, chọn Analyze → Regression → Binary Logistic

Bước 1 chạy hồi quy logistic đơn biến

Bước 2: Khởi tạo hộp thoại Logistic Regression. Đưa biến DEATH (nhị phân) vào ô Dependent và biến PROCALCITONIN (biến số liên tục) vào ô Covariates

Bước 2 chạy hồi quy logistic đơn biến

Bước 3: Bấm nút Save, mở hộp thoại Save, chọn Predicted Values (đây là xác suất dự đoán tử vong) bằng cách đánh dấu ô tương ứng. Sau đó, bấm Continue.

Bước 3 chạy hồi quy logistic đơn biến

Bước 4: Bấm nút Options, mở hộp thoại Options, đánh dấu ô CI for exp (B) [khoảng tin cậy của hệ số B, tương đương với tỉ số odds]. 

Bước 4 chạy hồi quy logistic đơn biến

Bước 5: Bấm Continue, sau đó bấm OK.

2.3.  Phân tích và đọc kết quả

Trong tệp dữ liệu, đã được thêm một cột mới là PRE-1, đại diện cho xác suất tiên đoán tử vong trên trục tung (y).

Kết quả 1 chạy hồi quy logistic đơn biến

Sau khi đã có giá trị p, chúng ta sẽ tạo biểu đồ để thể hiện mối quan hệ giữa biến x (procalcitonin) và biến y (xác suất dự đoán tử vong p).

Kết quả 2 chạy hồi quy logistic đơn biến

Điều này cho thấy có mối quan hệ tuyến tính giữa nồng độ procalcitonin (trục x) và xác suất dự đoán tử vong p (trục y).

Kết quả 3 chạy hồi quy logistic đơn biến

Từ bảng kết quả, chúng ta có thể xây dựng phương trình hồi qui logistic như sau: 

Log (pp-1)= -3,079+ 5.037 * procalcitonin

Điều này có nghĩa rằng, với mỗi 1 đơn vị tăng của procalcitonin, logarit tỉ lệ xác suất tử vong/sống tăng lên 5.037 lần.

Lúc này ta có thể diễn dịch, cứ procalcitonin tăng lên 1 ng/ml thì nguy cơ tử vong tăng lên 154 lần (kết quả exp (B) ở bảng 1, với e5.037 =153,988) hoặc đúng hơn là cứ procalcitonin tăng thêm 0,1 ng/ml thì nguy cơ tử vong tăng lên 15,4 lần.

Hồi quy Logistic là một công cụ mạnh mẽ trong SPSS. Dịch vụ chạy SPSS có thể giúp bạn thực hiện các bước từ chuẩn bị dữ liệu, lựa chọn biến đến phân tích kết quả, giúp phát huy tối đa công dụng của các chức năng đặc biệt như hồi quy logistic. 

3. Hồi quy logistic đa biến trong SPSS

Tiếp theo, Luận Văn Việt sẽ tiếp tục phân tích cách thực hiện Hồi quy Logistic đa biến, từ việc chuẩn bị dữ liệu đến phân tích kết quả và ứng dụng thực tế.

3.1. 5 bước chạy hồi quy logistic đa biến

5 bước chạy hồi quy logistic đa biến:

Bước 1: Chuẩn bị dữ liệu và mục tiêu phân tích: Tương tự như hồi quy logistic đơn biến, nhưng có thêm nhiều biến độc lập.

Bước 2: Lựa chọn biến độc lập và phân loại: Lựa chọn các biến độc lập mà có thể có ảnh hưởng đến biến phụ thuộc và phân loại chúng vào các nhóm tương ứng.

Bước 3: Thực hiện hồi quy logistic đa biến: Tạo một mô hình hồi quy logistic sử dụng nhiều biến độc lập.

Bước 4: Đọc và hiểu kết quả: Đọc và hiểu các thông số ước tính, giá trị p và ý nghĩa thống kê của các biến độc lập.

Bước 5: Đánh giá và tối ưu hóa: Đánh giá mô hình, xem xét cách tối ưu hóa biến độc lập để cải thiện mô hình.

3.2. Ví dụ cách chạy cụ thể

Tên tình huống: “Phân tích dữ liệu 30 bệnh nhân nhiễm trùng huyết”

Dữ liệu này bao gồm 5 cột: ID (mã số), Age (tuổi), Hypotension (hạ huyết áp), Procalcitonin (ng/ml), và Death (tử vong).

Dữ liệu các bước chạy hồi quy đa biến

Các bước chạy cụ thể:

Bước 1: Truy cập vào menu: Analyze > Regression > Binary Logistic.

Bước 1 chạy hồi quy logistic đa biến

Bước 2: Mở hộp thoại Logistic Regression, chọn biến DEATH và đặt nó vào ô Dependent. Đồng thời, chọn biến AGE, HYPOTENSION và PROCALCITONIN và đặt chúng vào ô Covariates.

Bước 2 chạy hồi quy logistic đa biến

Bước 3: Bấm vào nút Categorical để khai báo biến HYPOTENSION là biến phân loại (hoặc nhị phân), và khai báo giá trị tham khảo của HYPOTENSION là 1 (đại diện cho trạng thái có hạ huyết áp). Đặt Reference Category là First và sau đó bấm Continue.

Bước 3 chạy hồi quy logistic đa biến

Bước 4: Tiếp theo, bấm vào nút Options, mở hộp thoại Options, đánh dấu vào ô Cl for Exp(B) để hiển thị tỉ số odds và khoảng tin cậy 95% của tỉ số odds.

Bước 4 chạy hồi quy logistic đa biến

Bước 5: Bấm Continue và sau đó bấm OK để hoàn thành quá trình cài đặt và thực hiện hồi quy logistic đa biến.

3.3. Phân tích và đọc kết quả

Kết quả phân tích như sau:

Kết quả 1 chạy hồi quy logistic đa biến

Chỉ lấy 3 bảng cuối cùng và được diễn dịch như sau: 

Trị số -2 Log likelihood đo độ phù hợp của mô hình. Trị số này càng nhỏ thì mô hình càng phù hợp với dữ liệu. Trong trường hợp này, với -2 Log likelihood = 14.627, trị số này không quá cao, cho thấy mô hình có mức độ phù hợp khá tốt với dữ liệu tổng thể.

Dựa trên kết quả này, mô hình hồi quy logistic có thể được mô tả như sau:

Log(pp-1) = -3,232 + 0,137*PROCALCITONIN + 0,013*AGE + 4.915*HYPOTENSION 

Ta có thể tóm tắt trong bảng sau: 

Yếu tốOdds ratio (OR)Khoảng tin cậy 95%Ý nghĩa thống kê p
Procalcitonin1,140,03 – 45,200,94
Tuổi1,010,90 – 1,130,82
Hạ huyết áp1363 – 64470,01 

Kết luận: Dựa trên kết quả của mô hình hồi qui logistic, chỉ có yếu tố hạ huyết áp được xác định là yếu tố độc lập có ảnh hưởng đến tử vong ở bệnh nhân mắc nhiễm trùng huyết, với tỉ số odds (OR) là 136 (95% khoảng tin cậy: 3 – 6447) và giá trị p=0,01.

4. Ứng dụng hồi quy Logistic đơn biến

Hồi quy Logistic có thể được áp dụng vào nhiều ngành khác nhau. Dưới đây là một số ví dụ về ngành và ứng dụng của hồi quy Logistic đơn biến và đa biến:

  • Y tế
  • Tài chính
  • Tiếp thị
  • Tuyển dụng
  • Giáo dục
  • Giao thông
  • Hàng không

Lưu ý: 

Cả hồi quy Logistic đơn biến và đa biến đều có thể được áp dụng trong các ngành được liệt kê ở trên. Tuy nhiên, sự lựa chọn giữa hồi quy Logistic đơn biến và đa biến sẽ phụ thuộc vào tình huống cụ thể và mục tiêu nghiên cứu.

Hồi quy Logistic trong SPSS là một công cụ mạnh để dự đoán xác suất xảy ra của biến nhị phân dựa trên các biến độc lập. Hãy khám phá sức mạnh của Hồi quy Logistic trong SPSS để nâng cao khả năng phân tích dữ liệu của bạn. Hy vọng bài chia sẻ trên của Luận Văn Việt đã mang đến cho bạn đọc nhiều kiến thức hay để tiếp tục đồng hành cùng chúng tôi trong những bài viết tiếp theo.

5/5 (1 Review)
Theo dõi
Thông báo của
guest
0 Comments
Phản hồi nội tuyến
Xem tất cả bình luận

Bài viết liên quan