“ Nghiên cứu các yếu tố ảnh hưởng đến thu nhập của cá nhân” (sử dụng phân tích tương quan và hồi quy để kiểm định mô hình)
• Sau khi thực hiện phân tích thông kê với 6 biến
động lập income91, sie,agwed,age,degree và edu
với biến phụ thuộc rincome 91 thì kết quả cho
thấy mô hình đưa ra chưa phù hợp. Chỉ có 2 biến
độc lập incom91 va sie giải thích được 50% biến
độc lập rincome91. Các biến còn lại có tác động
rất nhỏ
• Cần thực hiên nghiên cứu khám phá để đưa ra
mô hình phù hợp hơn.
48 trang |
Chia sẻ: lylyngoc | Lượt xem: 4497 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu “ Nghiên cứu các yếu tố ảnh hưởng đến thu nhập của cá nhân” (sử dụng phân tích tương quan và hồi quy để kiểm định mô hình), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Đề tài: “ Nghiên cứu các yếu tố ảnh
hưởng đến thu nhập của cá nhân”
(sử dụng phân tích tương quan và hồi quy
để kiểm định mô hình)
• Giảng viên: TS. Trần Quang Trung
• SVTH: Nhóm 5
1. Nguyễn Thanh Quế Anh 5. Phan Văn Thuộc 9. Hà Văn Thiện
2. Phạm Thị Hòa 6.Lê Minh Chính 10. Lê Thanh Điệp
3. Nguyễn Thị Thảo 7. Nguyễn Thị Thúy 11. Cao thị Thanh Thương
4. Trần Thị Thanh Vân 8. Nguyễn Thị Thanh Mai
12 Phạm Minh Tuấn
I. Đặt vấn đề - Mục tiêu nghiên cứu
• Thu nhập của người dân ở mọi nơi đều thu hút sự quan tâm của các
nhà nghiên cứu cho dù các quốc gia giàu mạnh, nghèo đói hay
những địa phương nhỏ. Vì thu nhập cá nhân là chỉ báo quan trọng
có ý nghĩa kinh tế để đánh giá mức độ phát triển của một quốc gia,
mức sống của một khu vực địa lý. Thu nhập có thể khác nhau giữa
các khu vực, giữa thành thị và nông thôn. Riêng trong khu vực
thành thị, thu nhập cũng khác nhau giữa các cá nhân và có sự chênh
lệch lớn tạo nên bất bình đẳng xã hội tại khu vực đô thị. Việc gia
tăng thu nhập cá nhân, cải thiện mức sống người dân và giảm bất
bình đẳng xã hội là một vấn đề đang được chỉnh phủ các nước quan
tâm.
• Nhằm đưa ra những thông tin cần thiết để thực hiện
cải thiện mức thu nhập của người dân, nhóm thực
hiện nghiên cứu “ Các yếu tố tác động đến thu
nhập của cá nhân”
I. Đặt vấn đề - Mục tiêu nghiên cứu (tt)
II. Các giả thuyết nghiên cứu
• H1: Tổng thu nhập của gia đình có tác động đến thu
nhập cá nhân (Total family income)
• H2: Chỉ số kinh tế xã hội của cá nhân tác động đến thu
nhập cá nhân (Respondent socieconomic index)
• H3: Tuổi cho lần kết hôn đầu tác động đến thu nhập cá
nhân (Age when first maried)
II. Các giả thuyết nghiên cứu (tt)
• H4: Tuổi của cá nhân có tác động đến thu nhập cá
nhân (Respondent Age)
• H5: Tổng số năm đi học tác động đến thu nhập cá
nhân (Highest year of school completed)
• H6: Trình độ học vấn có tác động đến thu nhập cá
nhân (R’s highest degree)
III. Phương Pháp và công cụ nghiên cứu
Chọn Mẫu: Dựa vào cơ sở dữ liệu GSS93. Kích
thước mẫu 1500
• Công cụ
• + Sử dụng công cụ phân tích tương quan để
kiểm tra mối tương quan giữa các biến độc lập
với biến phụ thuộc (Respondent’s Income)
• + Sử dụng cụ phân tích hồi quy để tìm ra mối
quan hệ tuyến tính giữa các biến và kiểm định
mức độ phù hợp của mô hình.
IV. PHÂN TÍCH TƯƠNG QUAN BẰNG SPSS
4.1 TƯƠNG QUAN 2 BIẾN (BIVARIATE CORRELATION)
Giả thuyết H0i: “ Biến i và biến rincom91 không có mối quan hệ
tuyến tính, tức hệ số tương quan bằng 0”
Trong đó: i lần lượt là income91, sei, degree, educ, agewed, age
Xử lý bằng SPSS cho từng cặp biến:
+ Các bước thực hiện: Analyze Correlate Bivariate
đưa 2 biến cần xét tương quan vào module Variables,
chọn hệ số tương quan, chọn loại kiểm định (2 phía hoặc 1
phía) OK Nhận kết quả ở file Output
Vd: Xét tương
quan giữa 2 biến
income91 &
rincom91
Kết quả:
Xử lý bằng SPSS cho toàn bộ các biến:
Kết quả:
Nhận xét:
**: mức ý nghĩa được chọn là 0,01 (tức là xác suất chấp nhận giả thuyết sai là
1%)
Sig < mức ý nghĩa bác bỏ giả thuyết Ho 2 biến đang xét có tương quan
Sig > mức ý nghĩa chấp nhận giả thuyết Ho 2 biến đang xét không có
tương quan
Xét các giá trị Pearson Correlation, Sig., N của từng cặp biến đang xét, ta
thấy:
+ income91 & rincom91 có tương quan thuận với hệ số là 0,707 Gia đình càng
khá giả thì R có thu nhập càng cao
+ sei & rincom91 có tương quan nghịch với hệ số là 0.425 Cá nhân có chỉ số
kinh tế xã hội càng cao thì thu nhập càng cao
+ degree& rincom91 có tương quan thuận với hệ số là 0,353 Cá nhân học vấn
càng cao thì thu nhập càng cao
+ educ & rincom91 có tương quan thuận với hệ số là 0,342 cá nhân có số năm
đi học càng nhiều thì thu nhập càng cao
+ agewed & rincom91 có tương quan thuận với hệ số là 0,120 càng cưới trễ thì
thu nhập càng cao
+ age & rincom91 có tương quan thuận với hệ số là 0,189 cá nhân có tuổi càng
lớn thì thu nhập càng cao.
4.2 TƯƠNG QUAN RIÊNG PHẦN (PARTIAL CORRELATION)
Mục đích sử dụng: kiểm tra mối quan hệ tuyến tính của hai
biến khi loại trừ ảnh hưởng của yếu tố khác.
Từ bảng tương quan 2 biến trên, ta thấy biến degree có tương quan
thuận với biến educ với hệ số tương quan là 0.864, tức là thời gian
học càng dài (số năm học cao) thì trình độ học vấn càng cao Như
vậy ta thử loại bỏ tác động của biến educ khi xét mối tương quan của
degree với rincom91
Kết quả:
Nhận xét: Sau khi đưa biến edu làm biến control thì hệ số tương
quan của biến degree và rincom91 sẽ giảm từ 0,352 xuống còn 0,114
nhưng sig=0.000 Như vậy có tác động của biến educ trong mối
tương quan này, tuy nhiên ta vẫn kết luận được rằng giữa 2 biến
degree & rincome91 có tương quan với nhau.
V. HỒI QUY ĐƠN BIẾN TUYẾN TÍNH
1. Mô tả các bước thực hiện trên SPSS 16.0.
a) Mô hình hồi quy đơn biến.
b) Vẽ biểu đồ.
2. Kết quả mô hình hồi quy đơn biến tuyến tính.
1. Mô tả các bước thực hiện trên SPSS
16.0.
a) Mô hình hồi quy đơn biến.
• Bước 1: Vào Menu Analyze -> Regression -> Liner
• Bước 2: Đưa biến vào Ô Dependent, Independent.
Rồi nhấn vào Save => Continue => Ok.
2. Kết quả mô hình hồi quy đơn biến
tuyến tính.
• Giả thuyết H0: Không có tương quan tuyến tính giữa
2 biến Respondent’s Income và Total Family Incom.
• Biến phụ thuộc: Respondent’s Income.
• Biến độc lập: Total Family Income.
Kết quả như sau
Model R R Square
Adjusted R
Square
Std. Error
of the
Estimate
1 ,707a ,500 ,499 3,939
Model Summaryb
a. Predictors: (Constant), Total Family Income
b. Dependent Variable: Respondent's Income
• R square = 0,500 cho thấy biến Total Family Income giải
thích được 50% biến Respondent’s Income. Tỷ lệ phương
sai giải thích được là 0,500 có nghĩa là Thu nhập của gia
đình (Total Family Income) giải thích được 50% cho sự
biến thiên của thu nhập của người được phỏng vấn
(Respondent’s Income).
• Tổng bình phương phần hồi qui (Regression) giữa hai biến =
15141,713
• Tổng bình phương phần dư (Residual) trong hai biến =
15157,551
• Trung bình bình phương hồi qui: 15141,713/ 1 = 15141,713
• Trung bình bình phương phần dư: 15157,551/ 977= 115,514
• F= 234,752/1,212 = 193,643 và p<0,000
• R 2 = = = 0,500. Với sig = 0,00 suy ra bác bỏ giả thuyết
Ho, tức là có sự tương quan giữa 02 biến trên.
Model
Sum of
Squares df
Mean
Square F Sig.
Regression 15141,713 1 15141,713 975,979 ,000a
Residual 15157,551 977 15,514
Total 30299,265 978
ANOVAb
a. Predictors: (Constant), Total Family Income
b. Dependent Variable: Respondent's Income
Model Unstandardized
Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
(Constant) -,667 ,451 -1,480 ,139
Total Family
Income
,848 ,027 ,707 31,241 ,000
Coefficientsa
a. Dependent Variable: Respondent's Income
• Trong bảng này ta nhận thấy: số 0,848 mang dấu
dương, có nghĩa là tổng thu nhập của gia đình (Total
family income) có tương quan thuận với Thu nhập
của người được phỏng vấn (Respondent’s Income).
Từ đây ta có thể viết được phương trình hồi quy đơn
như sau: Respondent’s Income = - 0,667 + 0,848 *
Total family income.
Minimum Maximum Mean
Std.
Deviation N
Predicted Value ,18 17,98 12,86 3,935 979
Residual -15,286 9,105 ,000 3,937 979
Std. Predicted
Value
-3,222 1,302 ,000 1,000 979
Std. Residual -3,881 2,312 ,000 ,999 979
Std. Residual -3,881 2,312 ,000 ,999 979
Residuals Statisticsa
a. Dependent Variable: Respondent's Income
Biểu đồ thể hiện
Sử dụng công cụ phân tích hồi quy bội đối với các
biến tiếp theo là :
2. Biến phụ thuộc là Respondent’s Incom và biến
độc lập là Highest Year of School Competed.
3. Biến phụ thuộc là Respondent’s Incom và biến
độc lập là R’s highest Degree.
4.Biến phụ thuộc là Respondent’s Incom và biến
độc lập là Agre of Respondent.
5. Biến phụ thuộc là Respondent’s Incom và biến độc
lập là Agre When first Married.
6. Biến phụ thuộc là Respondent’s Incom và biến độc
lập là Respondent Socieconomic Index.
• Sau khi thực hiện phân tích hồi quy đơn bội nhận
thấy:
• + Biến độc lập income91 (total family income)
giải thích được biến phụ thuộc rincome91 nhiều
nhất với r square là 0.500 ~ 50%
• + Biến agewed (age when first maried) giải thích
được biến rincome91 thấp nhất với r square là
0.014 ~ 1,4% có thể loại biến này ra khỏi mô hình
VI. HỒI QUI BỘI
6.1 HỒI QUY BỘI – PHƯƠNG PHÁP ENTER
• Giá trị Standarized Coefficients của Respondent
Socioeconomic Index > Age When First Married
nên biến này sẽ đóng góp vào mô hình nhiều hơn
6.1 HỒI QUY BỘI – PHƯƠNG PHÁP
ENTER(TT)
• Nhìn vào phần thứ 2 của bảng biểu Coefficients
chỉ ra rằng có thể có vấn đề với đa cộng tuyến.
6. 1 HỒI QUY BỘI – PHƯƠNG PHÁP
ENTER(TT)
• Hầu hết các biến khác có Partital & Part đều rất nhỏ so
với Zero-order, nhưng biến Total Family Income la các
giá trị này gần bằng nhau. Đều này có nghỉa là nhiều biến
nào được giải thích bởi Total Family Income thì cũng
được giải thích bằng những biến khác.
HỒI QUY BỘI – PHƯƠNG PHÁP
ENTER(TT)
• Tolerance là % của một biến mà không được giải
thích bằng biến khác.
6.1 HỒI QUY BỘI – PHƯƠNG PHÁP
ENTER(TT)
• Khi tolerance gần bằng 0 thì đa cộng tuyến tăng
và standard error của coefficients bị thổi phồng
lên.
6.1 HỒI QUY BỘI – PHƯƠNG PHÁP
ENTER(TT)
• Collinearity Diagnostics chỉ ra rằng có nhiều vấn
đề về cộng tuyến.
HỒI QUY BỘI – PHƯƠNG PHÁP
ENTER(TT
• Eigenvalue có nhiều giá trị gần bằng 0 chỉ ra rằng
các biến độc lập có quan hệ liên quan cao và một
sự thay đổi nhỏ về giá trị dẫn đến sự thay đổi lớn
trong sự ước lượng Coefficent.
6.1 HỒI QUY BỘI – PHƯƠNG PHÁP
ENTER(TT)
• Những giá trị lớn hơn 15 là có thể cộng tuyến.
Những giá trị lớn 30 là nghiêm trọng.
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Eigenvalue không có giá trị gần bằng 0
• Tất cả Condition Index nhỏ hơn 15.
• => Sử dụng Stepwise không bị cộng tuyến
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Adjusted R Square của hai phương pháp gần
bằng nhau
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Stepwise chọn giá biến Total Family Income và
Respondent Socioeconomic Index.
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Cả hai đều ảnh hưởng thuận. Nghĩa là Thu nhập
gia đình càng cao thì thu nhập người được phỏng
vấn càng tăng
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Tương tự, chỉ số Kinh tế xã hội càng cao thì thu
nhập càng tăng.
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Family’s total income được chọn trước bởi vì nó
tương quan cao nhất với Respondent’s Income
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Beta In cho biêt biến nào nếu được chọn kế tiếp.
Beta in càng lớn thì càng ưu tiên hơn.
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Những biến độc lập có Sig < 0.05 là thích hợp
nếu nó được đưa vào mô hình.
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Để chọn biến độc lập tốt nhất đưa vào mô hình
thì dựa vào biến nào có Partial Correlation cao
nhất.
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Sau khi đưa biến Respondent Socioeconomic
Index vào mô hình thì không còn biến nào có Sig
nhỏ hơn 0.05 => Không còn biến nào có thể đưa
vào mô hình.
6.2 HỒI QUY BỘI – PHƯƠNG PHÁP
STEPWISE
• Sau khi đưa biến Respondent Socioeconomic
Index vào mô hình thì không còn biến nào có Sig
nhỏ hơn 0.05 => Không còn biến nào có thể đưa
vào mô hình.
Kết Luận
• Sau khi thực hiện phân tích thông kê với 6 biến
động lập income91, sie,agwed,age,degree và edu
với biến phụ thuộc rincome 91 thì kết quả cho
thấy mô hình đưa ra chưa phù hợp. Chỉ có 2 biến
độc lập incom91 va sie giải thích được 50% biến
độc lập rincome91. Các biến còn lại có tác động
rất nhỏ
• Cần thực hiên nghiên cứu khám phá để đưa ra
mô hình phù hợp hơn.
NHÓM 5 XIN CHÂN THÀNH
CẢM ƠN THẦY VÀ CÁC BẠN
ĐÃ QUAN TÂM
Các file đính kèm theo tài liệu này:
- quy_4121.pdf