“ Nghiên cứu các yếu tố ảnh hưởng đến thu nhập của cá nhân” (sử dụng phân tích tương quan và hồi quy để kiểm định mô hình)

• Sau khi thực hiện phân tích thông kê với 6 biến động lập income91, sie,agwed,age,degree và edu với biến phụ thuộc rincome 91 thì kết quả cho thấy mô hình đưa ra chưa phù hợp. Chỉ có 2 biến độc lập incom91 va sie giải thích được 50% biến độc lập rincome91. Các biến còn lại có tác động rất nhỏ • Cần thực hiên nghiên cứu khám phá để đưa ra mô hình phù hợp hơn.

pdf48 trang | Chia sẻ: lylyngoc | Lượt xem: 4459 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu “ Nghiên cứu các yếu tố ảnh hưởng đến thu nhập của cá nhân” (sử dụng phân tích tương quan và hồi quy để kiểm định mô hình), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Đề tài: “ Nghiên cứu các yếu tố ảnh hưởng đến thu nhập của cá nhân” (sử dụng phân tích tương quan và hồi quy để kiểm định mô hình) • Giảng viên: TS. Trần Quang Trung • SVTH: Nhóm 5 1. Nguyễn Thanh Quế Anh 5. Phan Văn Thuộc 9. Hà Văn Thiện 2. Phạm Thị Hòa 6.Lê Minh Chính 10. Lê Thanh Điệp 3. Nguyễn Thị Thảo 7. Nguyễn Thị Thúy 11. Cao thị Thanh Thương 4. Trần Thị Thanh Vân 8. Nguyễn Thị Thanh Mai 12 Phạm Minh Tuấn I. Đặt vấn đề - Mục tiêu nghiên cứu • Thu nhập của người dân ở mọi nơi đều thu hút sự quan tâm của các nhà nghiên cứu cho dù các quốc gia giàu mạnh, nghèo đói hay những địa phương nhỏ. Vì thu nhập cá nhân là chỉ báo quan trọng có ý nghĩa kinh tế để đánh giá mức độ phát triển của một quốc gia, mức sống của một khu vực địa lý. Thu nhập có thể khác nhau giữa các khu vực, giữa thành thị và nông thôn. Riêng trong khu vực thành thị, thu nhập cũng khác nhau giữa các cá nhân và có sự chênh lệch lớn tạo nên bất bình đẳng xã hội tại khu vực đô thị. Việc gia tăng thu nhập cá nhân, cải thiện mức sống người dân và giảm bất bình đẳng xã hội là một vấn đề đang được chỉnh phủ các nước quan tâm. • Nhằm đưa ra những thông tin cần thiết để thực hiện cải thiện mức thu nhập của người dân, nhóm thực hiện nghiên cứu “ Các yếu tố tác động đến thu nhập của cá nhân” I. Đặt vấn đề - Mục tiêu nghiên cứu (tt) II. Các giả thuyết nghiên cứu • H1: Tổng thu nhập của gia đình có tác động đến thu nhập cá nhân (Total family income) • H2: Chỉ số kinh tế xã hội của cá nhân tác động đến thu nhập cá nhân (Respondent socieconomic index) • H3: Tuổi cho lần kết hôn đầu tác động đến thu nhập cá nhân (Age when first maried) II. Các giả thuyết nghiên cứu (tt) • H4: Tuổi của cá nhân có tác động đến thu nhập cá nhân (Respondent Age) • H5: Tổng số năm đi học tác động đến thu nhập cá nhân (Highest year of school completed) • H6: Trình độ học vấn có tác động đến thu nhập cá nhân (R’s highest degree) III. Phương Pháp và công cụ nghiên cứu Chọn Mẫu: Dựa vào cơ sở dữ liệu GSS93. Kích thước mẫu 1500 • Công cụ • + Sử dụng công cụ phân tích tương quan để kiểm tra mối tương quan giữa các biến độc lập với biến phụ thuộc (Respondent’s Income) • + Sử dụng cụ phân tích hồi quy để tìm ra mối quan hệ tuyến tính giữa các biến và kiểm định mức độ phù hợp của mô hình. IV. PHÂN TÍCH TƯƠNG QUAN BẰNG SPSS 4.1 TƯƠNG QUAN 2 BIẾN (BIVARIATE CORRELATION) Giả thuyết H0i: “ Biến i và biến rincom91 không có mối quan hệ tuyến tính, tức hệ số tương quan bằng 0” Trong đó: i lần lượt là income91, sei, degree, educ, agewed, age Xử lý bằng SPSS cho từng cặp biến: + Các bước thực hiện: Analyze Correlate Bivariate đưa 2 biến cần xét tương quan vào module Variables, chọn hệ số tương quan, chọn loại kiểm định (2 phía hoặc 1 phía) OK  Nhận kết quả ở file Output Vd: Xét tương quan giữa 2 biến income91 & rincom91 Kết quả:  Xử lý bằng SPSS cho toàn bộ các biến: Kết quả: Nhận xét:  **: mức ý nghĩa được chọn là 0,01 (tức là xác suất chấp nhận giả thuyết sai là 1%)  Sig < mức ý nghĩa bác bỏ giả thuyết Ho 2 biến đang xét có tương quan  Sig > mức ý nghĩa  chấp nhận giả thuyết Ho  2 biến đang xét không có tương quan  Xét các giá trị Pearson Correlation, Sig., N của từng cặp biến đang xét, ta thấy: + income91 & rincom91 có tương quan thuận với hệ số là 0,707 Gia đình càng khá giả thì R có thu nhập càng cao + sei & rincom91 có tương quan nghịch với hệ số là 0.425  Cá nhân có chỉ số kinh tế xã hội càng cao thì thu nhập càng cao + degree& rincom91 có tương quan thuận với hệ số là 0,353 Cá nhân học vấn càng cao thì thu nhập càng cao + educ & rincom91 có tương quan thuận với hệ số là 0,342 cá nhân có số năm đi học càng nhiều thì thu nhập càng cao + agewed & rincom91 có tương quan thuận với hệ số là 0,120 càng cưới trễ thì thu nhập càng cao + age & rincom91 có tương quan thuận với hệ số là 0,189 cá nhân có tuổi càng lớn thì thu nhập càng cao. 4.2 TƯƠNG QUAN RIÊNG PHẦN (PARTIAL CORRELATION) Mục đích sử dụng: kiểm tra mối quan hệ tuyến tính của hai biến khi loại trừ ảnh hưởng của yếu tố khác. Từ bảng tương quan 2 biến trên, ta thấy biến degree có tương quan thuận với biến educ với hệ số tương quan là 0.864, tức là thời gian học càng dài (số năm học cao) thì trình độ học vấn càng cao Như vậy ta thử loại bỏ tác động của biến educ khi xét mối tương quan của degree với rincom91 Kết quả: Nhận xét: Sau khi đưa biến edu làm biến control thì hệ số tương quan của biến degree và rincom91 sẽ giảm từ 0,352 xuống còn 0,114 nhưng sig=0.000  Như vậy có tác động của biến educ trong mối tương quan này, tuy nhiên ta vẫn kết luận được rằng giữa 2 biến degree & rincome91 có tương quan với nhau. V. HỒI QUY ĐƠN BIẾN TUYẾN TÍNH 1. Mô tả các bước thực hiện trên SPSS 16.0. a) Mô hình hồi quy đơn biến. b) Vẽ biểu đồ. 2. Kết quả mô hình hồi quy đơn biến tuyến tính. 1. Mô tả các bước thực hiện trên SPSS 16.0. a) Mô hình hồi quy đơn biến. • Bước 1: Vào Menu Analyze -> Regression -> Liner • Bước 2: Đưa biến vào Ô Dependent, Independent. Rồi nhấn vào Save => Continue => Ok. 2. Kết quả mô hình hồi quy đơn biến tuyến tính. • Giả thuyết H0: Không có tương quan tuyến tính giữa 2 biến Respondent’s Income và Total Family Incom. • Biến phụ thuộc: Respondent’s Income. • Biến độc lập: Total Family Income. Kết quả như sau Model R R Square Adjusted R Square Std. Error of the Estimate 1 ,707a ,500 ,499 3,939 Model Summaryb a. Predictors: (Constant), Total Family Income b. Dependent Variable: Respondent's Income • R square = 0,500 cho thấy biến Total Family Income giải thích được 50% biến Respondent’s Income. Tỷ lệ phương sai giải thích được là 0,500 có nghĩa là Thu nhập của gia đình (Total Family Income) giải thích được 50% cho sự biến thiên của thu nhập của người được phỏng vấn (Respondent’s Income). • Tổng bình phương phần hồi qui (Regression) giữa hai biến = 15141,713 • Tổng bình phương phần dư (Residual) trong hai biến = 15157,551 • Trung bình bình phương hồi qui: 15141,713/ 1 = 15141,713 • Trung bình bình phương phần dư: 15157,551/ 977= 115,514 • F= 234,752/1,212 = 193,643 và p<0,000 • R 2 = = = 0,500. Với sig = 0,00 suy ra bác bỏ giả thuyết Ho, tức là có sự tương quan giữa 02 biến trên. Model Sum of Squares df Mean Square F Sig. Regression 15141,713 1 15141,713 975,979 ,000a Residual 15157,551 977 15,514 Total 30299,265 978 ANOVAb a. Predictors: (Constant), Total Family Income b. Dependent Variable: Respondent's Income Model Unstandardized Coefficients Standardized Coefficients t Sig.B Std. Error Beta (Constant) -,667 ,451 -1,480 ,139 Total Family Income ,848 ,027 ,707 31,241 ,000 Coefficientsa a. Dependent Variable: Respondent's Income • Trong bảng này ta nhận thấy: số 0,848 mang dấu dương, có nghĩa là tổng thu nhập của gia đình (Total family income) có tương quan thuận với Thu nhập của người được phỏng vấn (Respondent’s Income). Từ đây ta có thể viết được phương trình hồi quy đơn như sau: Respondent’s Income = - 0,667 + 0,848 * Total family income. Minimum Maximum Mean Std. Deviation N Predicted Value ,18 17,98 12,86 3,935 979 Residual -15,286 9,105 ,000 3,937 979 Std. Predicted Value -3,222 1,302 ,000 1,000 979 Std. Residual -3,881 2,312 ,000 ,999 979 Std. Residual -3,881 2,312 ,000 ,999 979 Residuals Statisticsa a. Dependent Variable: Respondent's Income Biểu đồ thể hiện Sử dụng công cụ phân tích hồi quy bội đối với các biến tiếp theo là : 2. Biến phụ thuộc là Respondent’s Incom và biến độc lập là Highest Year of School Competed. 3. Biến phụ thuộc là Respondent’s Incom và biến độc lập là R’s highest Degree. 4.Biến phụ thuộc là Respondent’s Incom và biến độc lập là Agre of Respondent. 5. Biến phụ thuộc là Respondent’s Incom và biến độc lập là Agre When first Married. 6. Biến phụ thuộc là Respondent’s Incom và biến độc lập là Respondent Socieconomic Index. • Sau khi thực hiện phân tích hồi quy đơn bội nhận thấy: • + Biến độc lập income91 (total family income) giải thích được biến phụ thuộc rincome91 nhiều nhất với r square là 0.500 ~ 50% • + Biến agewed (age when first maried) giải thích được biến rincome91 thấp nhất với r square là 0.014 ~ 1,4% có thể loại biến này ra khỏi mô hình VI. HỒI QUI BỘI 6.1 HỒI QUY BỘI – PHƯƠNG PHÁP ENTER • Giá trị Standarized Coefficients của Respondent Socioeconomic Index > Age When First Married nên biến này sẽ đóng góp vào mô hình nhiều hơn 6.1 HỒI QUY BỘI – PHƯƠNG PHÁP ENTER(TT) • Nhìn vào phần thứ 2 của bảng biểu Coefficients chỉ ra rằng có thể có vấn đề với đa cộng tuyến. 6. 1 HỒI QUY BỘI – PHƯƠNG PHÁP ENTER(TT) • Hầu hết các biến khác có Partital & Part đều rất nhỏ so với Zero-order, nhưng biến Total Family Income la các giá trị này gần bằng nhau. Đều này có nghỉa là nhiều biến nào được giải thích bởi Total Family Income thì cũng được giải thích bằng những biến khác. HỒI QUY BỘI – PHƯƠNG PHÁP ENTER(TT) • Tolerance là % của một biến mà không được giải thích bằng biến khác. 6.1 HỒI QUY BỘI – PHƯƠNG PHÁP ENTER(TT) • Khi tolerance gần bằng 0 thì đa cộng tuyến tăng và standard error của coefficients bị thổi phồng lên. 6.1 HỒI QUY BỘI – PHƯƠNG PHÁP ENTER(TT) • Collinearity Diagnostics chỉ ra rằng có nhiều vấn đề về cộng tuyến. HỒI QUY BỘI – PHƯƠNG PHÁP ENTER(TT • Eigenvalue có nhiều giá trị gần bằng 0 chỉ ra rằng các biến độc lập có quan hệ liên quan cao và một sự thay đổi nhỏ về giá trị dẫn đến sự thay đổi lớn trong sự ước lượng Coefficent. 6.1 HỒI QUY BỘI – PHƯƠNG PHÁP ENTER(TT) • Những giá trị lớn hơn 15 là có thể cộng tuyến. Những giá trị lớn 30 là nghiêm trọng. 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Eigenvalue không có giá trị gần bằng 0 • Tất cả Condition Index nhỏ hơn 15. • => Sử dụng Stepwise không bị cộng tuyến 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Adjusted R Square của hai phương pháp gần bằng nhau 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Stepwise chọn giá biến Total Family Income và Respondent Socioeconomic Index. 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Cả hai đều ảnh hưởng thuận. Nghĩa là Thu nhập gia đình càng cao thì thu nhập người được phỏng vấn càng tăng 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Tương tự, chỉ số Kinh tế xã hội càng cao thì thu nhập càng tăng. 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Family’s total income được chọn trước bởi vì nó tương quan cao nhất với Respondent’s Income 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Beta In cho biêt biến nào nếu được chọn kế tiếp. Beta in càng lớn thì càng ưu tiên hơn. 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Những biến độc lập có Sig < 0.05 là thích hợp nếu nó được đưa vào mô hình. 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Để chọn biến độc lập tốt nhất đưa vào mô hình thì dựa vào biến nào có Partial Correlation cao nhất. 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Sau khi đưa biến Respondent Socioeconomic Index vào mô hình thì không còn biến nào có Sig nhỏ hơn 0.05 => Không còn biến nào có thể đưa vào mô hình. 6.2 HỒI QUY BỘI – PHƯƠNG PHÁP STEPWISE • Sau khi đưa biến Respondent Socioeconomic Index vào mô hình thì không còn biến nào có Sig nhỏ hơn 0.05 => Không còn biến nào có thể đưa vào mô hình. Kết Luận • Sau khi thực hiện phân tích thông kê với 6 biến động lập income91, sie,agwed,age,degree và edu với biến phụ thuộc rincome 91 thì kết quả cho thấy mô hình đưa ra chưa phù hợp. Chỉ có 2 biến độc lập incom91 va sie giải thích được 50% biến độc lập rincome91. Các biến còn lại có tác động rất nhỏ • Cần thực hiên nghiên cứu khám phá để đưa ra mô hình phù hợp hơn. NHÓM 5 XIN CHÂN THÀNH CẢM ƠN THẦY VÀ CÁC BẠN ĐÃ QUAN TÂM

Các file đính kèm theo tài liệu này:

  • pdfquy_4121.pdf