Mô hình hội quy giải thích sự khác biệt về tuổi thọ của phụ nữ trên thế giới
Phương pháp xây dựng mô hình hồi quy tuyến tính đơn biến và đa biến cho cái nhìn kh ái quát về sự
liên hệ giữa các biến n guyên nhân và kết quả, nhưn g trong thực tế xã hội, khoa học hay kinh tế một
vấn đề nào đó ít khi chỉ chịu một ảnh hưởng duy nhất mà thông thường nó bị ảnh hưởng bởi rất nhiều
tác nhân bên ngoài, đó là mối liên hệ chằn g chéo, đôi khi các tác nhân cho một vấn đề nào đó lại có sự
liên hệ, chúng tương tác nhau giữa các biến nguyên nhân làm cho sự liên kết trở nên phức tạp không
lường.
18 trang |
Chia sẻ: lylyngoc | Lượt xem: 2982 | Lượt tải: 5
Bạn đang xem nội dung tài liệu Mô hình hội quy giải thích sự khác biệt về tuổi thọ của phụ nữ trên thế giới, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Bài tập Phân tích định lượng MBA-08
1
TRƯỜNG Đ ẠI HỌC MỞ TP.HCM
LỚP CAO HỌC QUẢN TRỊ KINH DOANH KHÓA 8
TIỂU LUẬN MÔN HỌC:
PHÂN TÍCH ĐỊNH LƯỢNG
ĐỀ TÀI TIỂU LUẬN:
NHÓM THỰC HIỆN:
Đào Hùng Anh.
Võ Phương Hồng Cúc.
Lê Trọng Đoan
Cao Văn Tuấn.
TP. Hồ Chí Minh, tháng 2 năm 2009
Bài tập Phân tích định lượng MBA-08
2
ĐẠI HỌC MỞ TP. HỐ CHÍ MINH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh ph úc
------------- -------------------
ĐỀ KIỂM TRA
MÔN: PHÂN TÍCH ĐỊNH LƯỢNG
LỚP: MBA8
Ghi chú: Sinh viên làm bài theo nhóm
Yêu cầu:
Sử dụng dữ liệu trong file World 95 Tieng Viet.sav đính kèm, bạn hãy tự xây dựng cho mình một mô
hình hồi quy giải thích sự khác biệt về tuổi thọ ph ụ nữ giữa các quốc gia trên thế giới.
Bạn được tự do lựa chọn các biến giải thích để đưa vào m ô hình cũng như tự quyết định dạng thức
của các liên hệ giữa biến giải thích và biến kết quả.
Hãy mô tả chi tiết quá trình xây dựng mô hình của bạn và tăng tính thuyết phục của mô hình này bằng
các công cụ chẩn đoán và đánh giá mô hình. Giải thích ý ngh ĩa các kết quả của mô hình rút ra.
Sản phẩm nộp:
1. Bài làm dạng fi le Word (có ghi tên các thành viên của nhóm ở trang đầu)
2. File output SP SS
Cả 2 file được đặt tên như sau MBA8_KT_nhomX (X là số thứ tự nhóm )
Hình thức:
File Word định dạng khổ giấy A4 (canh lề 2cm mỗi phía),
font chữ Time New Roman, cỡ 12 points
Cách đoạn (Spacin g before) 6 points, giãn dòng ( line spacing) 1.2
Chúc thành công!
Bài tập Phân tích định lượng MBA-08
3
Lời nói đầu:
Phân tích định lượng là môn học nhằm trang bị kiến thức và phương pháp trong việc xây dựng mô
hình, thu thập thông tin về thị t rường và đời sống xã hộ i, phân t ích số liệu, đánh giá số liệu nhằm khái
quát hóa các vấn đề nghiên cứu trong mô hình đã xây dựng. Đằng sau nhữn g kiến thức đó cần có kiến
thức về thống kê toánvà các kỹ năng sử dụng các loại phần mềm ch uyên n gh iệp cho bộ môn này như
SPSS, EVIEW S hay Excel. Qua đó ta thấy đây là một lĩnh vực rộng lớn cần có sự trau dồi và tích lũy
kiến thức lâu dài cũng như sự yêu nghề để đạt được sự hiểu biết tường tận và thực hiện tốt công việc
này.
Trong hệ thống kiến thức rộng lớn đó kỹ thuật hồi quy tuyến tính là một kỹ thuật hay mô hình quan
trọng để tìm ra sự tương quan của các biến nguyên nhân và kết quả để ta có thể hình dung tương đối
mối liên kết đó, giúp ta có thể ứng dụng mô hình trong thực tế đời sống xã hộ i hay kinh tế. Trong tiểu
luận chúng ta đi nghiên cứu t uổi thọ của phụ nữ kh ác nhau như thế nào trên thế giới thông qua các
biến nguyên nhân như GDP, học vấn hay số lượng sinh sản… sau đó đánh giá mô hình thông qua các
chỉ số liên k ết, các ch ỉ số v ề sự chính xác và tương quan của các biến n ghiên cứu.
Nhóm xin chân thành biết ơn và cảm tạ thầy Hoàng Trọng, đã hết lòng truyền thụ kiến thức và chia sẻ
những kinh nghiệm quý báu trong quá trình hướng dẫn lớp MBA-08 môn học phân tích định lượng.
Kính chúc thầy nhiều sức khỏe để tiếp tục truyền th ụ sự hiểu biết cho các khóa đàn em mai sau.
Bài tập Phân tích định lượng MBA-08
4
MỤC LỤC
I. Lý thuyết về hồi quy tuyến tính.
1. Hệ số tương quan đơn.
2. Xây dựng ph ương trình hồi quy tuyến tính.
3. Đánh giá sự phù hợp của mô hình.
4. Kiểm định giả thuyết về độ phù hợp của mô hình và ý nghĩa của h ệ số hồi quy.
5. Hồi quy bội, những vấn đề cần quan tâm khi thực hiện.
II. Ứng dụng Hồi quy tuyến tính vào để xây dựng một mô hình hồi quy giải thích sự khác biệt về tuổi
thọ phụ nữ giữa các quốc gia trên thế giới.
1. Xác định biến nguyên nhân và k ết quả.
2. Xây dựng mô hình hồi quy t uyến tính.
3. Đánh giá sự phù hợp và kiểm định mô hình.
4. Mô hình đa biến, chọn lựa biến nguyên nhân, xây dựng và đánh giá.
Kết luận
Bài tập Phân tích định lượng MBA-08
5
I.Lý thuyết tổng quát về hồi quy đơn biến.
1. Hệ số tương quan.( correlation coefficient)
- Hệ số tương quan r nhằm nói lên sự liên kết chặt chẽ giữa hai biến nào đó.
- Hệ số tương quan cho mẫu là ước lượng của hệ số tương quan r để đo lường mối liên kết tuyến chặt
chẽ giữa các biến của mẫu.
- Hệ số này không có đơn vị.
- Hệ số này có giá trị biến thiên từ -1 đến 1.
- Khi có giá trị âm hệ hai biến có tương quan nghịch biến.
- Khi có giá trị dương hệ hai biến có tương quan đồng biến.
- Khi gía trị này bằng khôn g thì hai biến khôn g có liên k ết.
- Côn g thức tính toán hệ số tương quan mẫu:
Trong đó:
r: hệ số tương quan, X : gía trị hệ số nguyên nhân, Y: giá trị hệ số kết quả, X: hệ số trung bình biến
nguyên nhân, Y: giá trị trung bình biến kết quả, n : độ lớn mẫu.
- Giá trị r giữa hai biến có thể là r ất thấp nhưng chưa hẳn hai biến đó hoàn toàn không có mối liên hệ,
có thể nó lại có dạng liên quan khác như liên hệ phi tuyến.
- Giá trị r có thể là rất cao có khi gần bằng 1 nhưng thực tế không có sự liên quan nào, người ta gọi là
sự tương quan giả, ví dụ như người ta nghiên cứu số lượng trẻ sơ sinh phụ thuộc vào dân số của thành
phố HCM có sự tương quan rất cao vào năm 200x nhưng thực tế hai biến này có sự tương quan giả,
do khoản thời gian đó k inh tế suy giảm các n ăm gần đó tỷ lệ sinh giảm, nhưng đặc biệt năm đó là năm
Nghịch biến Đồng biến Không có mối liên hệ.
Bài tập Phân tích định lượng MBA-08
6
may mắn nên các gia đình quyết định sinh con nhiều. Như vậy t a thất ở đây tương quan thật phải là số
lượng trẻ sơ sinh và năm tốt.
- Như vậy h ệ số tương quan ch ỉ được coi là một chỉ số nói lên sự chặt chẽ giữa các biến.
2.Xây d ựng phương trình hồi quy tuyến tính:
Sau khi đã nghiên cứu hệ số tương quan r, ta thấy rằng có thể hai biến có hệ số tương quan chặt chẽ
một cách tuyến tính nhưng thực tế thì không có sự liên hệ nào về thực chất, do vậy để xây dựng
phương trình hồi quy tuyến tính của các biến với nhau thì xem như ta đã nghiên cứu thấu đáo về sự
liên quan giữa chúng trong thực tế, và có xét đến hệ số tương quan cần thiết khá cao.
Sau đó ta t iến hành xây dựng mô hình. Lý thuyết thông thường người ta đặt biến Y là biến kết quả và
biết X nguyên nhân, X được đặt trên trục hoành và Y đặt trên trục tung. Trong phần nghiên cứu của
tiểu luận ta chi đi khảo sát mối liên quan tuyến tính theo đường thẳng đố i với mối liên hệ theo các
hình khác như parabol hay hình gấp khúc không được đề cập.
Phương trình hồi quy tuyến tính của tổng thể và mẫu có dạng đường thẳng như sau:
Yi = 0 + 1Xi + , Yi = B0 + B1Xi +
Trong đó Y là biến kết quả dự đoán thứ i, Xi là biến nguyên nhân thứ i, B0 hệ số tương quan tung độ
góc là giá trị của Y khi X bằng không, B1 là hệ số tương quan độ dốc của đường thẳng biểu diễn mô
hình hồi quy, là gía trị khác biệt giữa hồi quy và giá trị thực tế.
Ý nghĩa của các hệ số :
- B0 nói lên giá trị của biến dự đoán kh i gía trị nguyên nh ân bằng không.
- B1 độ dốc của đường hồi quy nhằm nói lên rằng khi giá trị X thay đổi một đơn vị thì giá trị Y sẽ thay
đổi X.B1 đơn v ị.
- nói lên sự khác biệt giữa giá trị hồ i quy v à gía trị thực tế, ví dụ một biến kết quả có thể ảnh hưởng
bởi rất nhiều biến nguyên nhân nh ưng ta lại chỉ khảo sát một biến n guyên nhân duy nhất, điều này đưa
đến sự có giá trị khác biệt này, khi giá trị càng nhỏ thì sự ảnh hưởng của biến n guyên nhân đó càng
lớn và càng có sự chính xác kh i áp dụng mô hình hồi quy.
- Ví dụ khi ta khảo sát chiều cao của của đứa trẻ 8 tuổi theo chế độ dinh dưỡng thì ta có gía trị lớn,
thì có nghỉa rằng chiều cao của đứa trẻ phụ thuộc vào dinh dưỡng v à còn phụ thuộc vào các biến khác
như chiều cao của cha mẹ, nơi ăn chốn ở hay cách chăm sóc… hay nói cách khác gía trị nhằm nói
đến sự sai lệch do ta ch ưa khảo sát hết tất cả các biến ảnh hưởng đến biến phụ thuộc mà ta đang khảo
sát.
- Sau khi có được mô hình hồi quy tuyến tính ta có thể t ính gía trị biến phụ thuộc thông qua giá trị
biến không phụ thuộc với một giá trị chênh lệch nào đó mà ta chưa biết, nhưng giá trị đó nhỏ hơn
Bài tập Phân tích định lượng MBA-08
7
giá trị sai biệt khi ta chỉ t ính trị trung bình so với giá trị thực tế cần khảo sát. Để hiểu hơn ta có thể đi
đến mục sau: Đánh giá sự phù hợp của mô hình hồi quy tuyến tính.
3.Đánh giá sự phù hợp của mô hình:
Vấn đề quan trọng tron g các mô hình hồi quy là phải chứng minh được sự phù hợp của mô hình mà ta
đang khảo sát, hầu như không có đường thẳng hồi quy nào đều hoàn toàn phù hợp với tập dữ liệu
khảo sát và luôn có gía trị sai lệch giữa các trị dự báo từ hồi quy và giá trị thực tế, sự sai lệch này thể
hiện qua phần dư . Do vậy người ta phải nghỉ đến một thước đo nào đó để chỉ ra mức độ phù hợp
của mô hình.
Thông thường thước đo cho mô hình tuyến tính được dùng là hệ số xác định R2. R2 được tính theo
công thức:
Trong đó SSR được xem như là giá trị sai lệch giữa gía t rị dự đoán theo hồi quy so với giá trị trung
bình của tập dữ liệu, nó nói lên ph ần giá trị mà ta có thể ước lượng gần với thực tế hơn khi có phương
pháp hồi quy so với khi ta chỉ t ính giá trị t rung bình của tổng thể tập mẫu.
Ví dụ khi ta t ính thu nhập theo đầu người của thành phố HCM thì giá trị là 5 triệu đồng/người như
vậy khi một gia đình có 3 người đi làm thì ta có thể hiểu là gia đình này thu nhập là 15 triệu đồng.
Nhưng ta đã biết lương bổng thì phụ thuộc vào rất nhiều vấn đề như trình độ học thức, năm kinh
nghiệm, loại công ty hay sự quan h ệ vớ i cấp trên… như vậy khi ta dùng mô hình hồi quy để tính
lương của một người theo trình độ học vấn thì ta có thể tính như sau:
Lương = B0 + B1*trình độ = 1 + 2.5*trình độ, khi xét đến một người có học vị đại học anh ta có gía
trị trình độ là 3 thì Lương =1+2.5*3=8.5 triệu. Như vậy khoản chênh lệch 3.5 triệu giữa giá trị trung
bình và giá trị tính theo hồi là SSR.
Giá trị SST được định nghĩa khá đơn giản là giá trị sai lệch giữa giá trị trung bình của tập khảo sát và
giá thị thực tế của một giá trị thực tế nào đó.
Như vậy từ công thức ta có thể thấy giá trị R2 sẽ nằm trong khoảng từ 0 đến 1 khi R2 càng gần 0 thì
mô hình không phù hợp do mô hình hồi quy không có tác dụng làm sai lệch nhỏ đi mà nó cũng giống
như tính trung bình mà thôi. Khi R2 càng gần về 1 thì mô hình càng phù hợp do mô hình hồi quy, làm
gía trị dự đoán hầu như ch ính xác với gía trị thực tế.
Ngoài SST và SSR người ta còn có SSE là giá trị chênh lệch giữa giá trị thực tế và giá trị hồi quy, giá
trị này chính là sai số .
Bài tập Phân tích định lượng MBA-08
8
Vậy SST = SSE +SSR hay sai lệch tổng = sai lệch ngoài + sai lệch hồi quy. Để hiểu rỏ hơn ta xem
hình vẽ sau:
4.Kiểm định giả thuyết về độ phù hợp của mô hình và ý nghĩa của hệ số hồi quy.
a. Kiểm định giả thuyết về độ phù hợp của m ô hình hay phân tích ph ương sai:
Khi xây dựng xong mô hình hồi quy tuyến tính vấn đề quan trọng ta ph ải đi kiểm định về độ phù hợp
mô hình hồi quy đó, do trong khi đánh giá sự phù hợp của mô hình bằng ch ỉ số Rsquare ch ỉ cho ta cái
nhìn của tập mẫu nhưng không hẳn tổng thể có giá trị ph ù hợp tương ứng.
Từ đó ta đi kiểm định, để k iểm định độ phù hợp của mô hình hồi quy tổng thể ta đặt giả thuyết
H0 : Rpop = 0 sau khi t iến hành bài toán kiểm định giả thuyết H0 bị bác bỏ thì đây là bước đầu thành
công cho việc kiểm định sự ph ù hợp của mô hình.
Đại lượng F được dùng để kiểm định, nếu xác suất F nhỏ thì ta có thể bác bỏ giả định H0, F có công
thức sau :
2
1
2
1
ˆ( ) /
( ) /( 1)
N
i
i
N
i
i
Y Y p
F
Y Y N p
b. kiểm định giả thuyết về hệ số hồ i quy của tổng thể:
Kiểm định thường được thực hiện chính là độ dốc của mô hình tổng thể, ý nghĩa của v iệc phải đi kiểm
định này là do cho dù ta đã có độ dốc của mẫu là B1 khác 0 nhưng ta khôn g thể chắc rằng độ dốc của
tổng thể 1 là khác 0.
Như vậy cũng tương tự nh ư kiểm định giả thuyết về độ phù hợp của mô hình tổng thể ta đặt giả thuyết
H0: 1 = 0 . ta kỳ vọng giả thuyết này sẽ bị bác bỏ thì mô hình có sự liên hệ của ha i biến n guyên nhân
và kết quả, hay mô hình hồi quy có quan hệ thật chứ không là quan hệ giả.
Đường thẳng hồ i quy
Gía trị trung bình
Bài tập Phân tích định lượng MBA-08
9
Trị thống kê dùng để kiểm định giả thuyết là : t = B1/SB1
Ta cũng có thể đi k iểm định B0 giống như kiểm định B1 với trị thống kê là: t = B0/SB0
5. Hồi quy bội , những vấn đề cần quan tâm khi thực hiện.
Hồi quy bội có quá trình xây dựng giống như hồi quy đơn nhưn g ở đây ta có nhiều biến n guyên nhân
và chỉ một biến kết quả. Ví dụ như xét đến sự hao phí nhiên liệu cho một động cơ đốt trong thì có thể
có một số biến nguyên nhân là: độ nặng của xe, dung tích cylinder, số cylinder hay t ỉ số nén, khoảng
cách từ tử điểm trên đến tử điểm dưới…
Mô hình hồi quy bộ i có dạng: Y = 0+1 X1+2X2+…+p Xp+e
Y: là biến kết quả, k là các hệ số hồi quy riêng phần, Xk là các biến nguyên nhân, e là sai số.
Các ưu điểm của hồi quy bội so với hồ i quy đơn:
- Hồi quy bội cho ta đường hồi quy chính xác hơn so với hồi quy đơn kh i ta chọn được các
biến nguyên nhân chính xác.
- Giúp ta hiểu rõ hơn về vấn đề đang nhiên cứu, do mọi vấn đề hay hiện tượng trong tự
nhiên hay trong kinh tế, xã hội đều có nhiều n guyên nhân gây r a chứ không phải ch ỉ một
nguyên nhân ảnh hưỡng duy nhất.
- Sai số e là nhỏ so với hồi quy đơn, khi các biến được chọn phù h ợp.
Nhược đ iểm :
- Có quy trình khảo sát và thu thập dữ liệu khó.
- Có hiện tượng đa cộng tuyến xảy ra khi n ghiên cứu các biến nguyên nhân. Điều này xảy ra
khi các biến nguyên nh ân ảnh hưởng lẫn nhau.
- Có mối liên hệ giả giửa biến n guyên nhân và biến kết quả.
Xây dựng m ô hình:
Bước đầu t iên khi xây dựng mô hình thì ta phải đi xem xét các mối tương quan tuyến tính giửa các
biến bằng cách xây dựng ma trận tương quan giữa các biến, từ đó ta có thể đánh giá sự tương quan
của các biến nguyên nhân với nhau hay sự tác động đến biến kết quả.
Để đánh giá độ phù hợp của mô hình hồi quy tuyến tính bội: ta cũng quan sát hệ số R2, khi ta đưa vào
mô hình càng nhiều biến nguyên nhân thì hệ số R2 cang tăng, nhưng thực tế cho thấy khi số biến
nguyên nhân tăng thì không hẳn mô hình càng ph ù hợp. Do đó đối với mô hình hồi quy tuyến tính bội
người ta xét độ phù hợp của mô hình thông qua giá trị Rsquare adjust. Giá trị Rsquare điều ch ỉnh này
không nhất thiết tăng cao gần một khi ta thêm vào mô hình nhiều biến hơn vì nó không phụ thuộc vào
độ lệch phóng đại của R2, R2 điều ch ỉnh được tính như sau:
Ra
2
=R2-p(1-R2)/(N-p-1)
P là biến số độc lập trong phương trình ( trong mô hình hồi quy đơn biến thì p = 1).
Kiểm định độ phù hợp của mô hình:
Cũng giống như phần hồi quy đơn biến thì ta phải đi kiểm định độ phù h ợp của tổng thể, kiểm định F
được sử dụng, ý tưởng của kiểm định này là xem xét tất cả các biến nguyên nhân có liên hệ với biến
kết quả hay không thôn g qua kiểm định giả thuyết H0: 0=1 =2=0, và khi giả thuyết H0 bị bác bỏ thì
ta kết luận độ phù hợp tron g mô hình giải thích được biến khảo sát.
Bài tập Phân tích định lượng MBA-08
10
Xét hệ số beta riêng phần cho mô hình:
Hệ số này nói lên sự tác động riêng của một biến nguyên nhân n ào đó vào biến kết quả khi các biến
nguyên nhân còn lại không có sự thay đổi, hệ số này còn được k iểm định thông qua mức ý ngh ĩa sig.
khi mức ý ngh ĩa càng nhỏ thì ta đánh giá biến nguyên nhân đó có tác động đến mô hình, ngược lại khi
giá trị của mức ý n ghĩa lớn hơn 0.05 chẵng hạn thì không có sự tác động lớn của biến n guyên nhân đó
đến mô hình.
II. Ứng dụng Hồi quy đơn biến tuyến tính vào để xây dựng m ột mô hình hồi quy giải thích sự
khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới.
1.Xác đ ịnh biến nguyên nhân và kết quả.
Để x ác định biến thì ta dùng SPSS tìm hệ số tương quan r giữa các biến so v ới biến tuổi thọ phụ nữ,
trong đó có ba điều kiện cần xem xét:
- Các điểm trên đồ thị Scatter phải tương đối tuyến tính theo đường thẳng do ta khảo sát mô hình hôi
quy tuyến tính đơn.
- Hệ số tương quan càn g gần 1 càng tốt.
- Có sự xem xét thực tế là biến n guyên nhân đó có thật sự tương quan ảnh hưởng đến biến kết quả là
tuổi thọ phụ nữ.
Ta lần lược chạy vẽ đồ thị Scatter và tính hệ số tương quan r giữa tuổi thọ phụ nữ và các biến nguyên
nhân, sau đó sẽ chọn biến nào có ảnh hưởng đến t uổi thọ phụ nữ theo ba tiêu ch í nêu trên.
- Tuổi thọ phụ nữ theo tỷ lệ dân biết chữ.
Ty le d an biet chu(%)
120100806040200
T
u
o
i t
h
o
t
ru
n
g
b
in
h
P
h
u
N
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed).
T uoåi
tho ï TB
phuï nöõ
T æ leä
daân bieát
chöõ (%)
T uoåi thoï TB
phuï nöõ
Pearson
Correlation
1 .865(**)
Sig. (2-tailed) . .000
N 109 107
T æ leä daân
bieát chöõ (%)
Pearson
Correlation
.865(**) 1
Sig. (2-tailed) .000 .
N 107 107
Bài tập Phân tích định lượng MBA-08
11
- Tuổi thọ phụ nữ theo mật độ dân số:
Ma t do dan so ( nguoi/km2)
6000500040003000200010000-1000
Tu
o
i t
h
o
p
h
u
n
u
90
80
70
60
50
40
- Tuổi thọ phụ nữ theo tỷ lệ dân sống ở thành thị:
Ty le dan song o thanh thi (%)
120100806040200
T
u
oi
t
h
o
p
h
u
nu
90
80
70
60
50
40
- Tuổi thọ phụ nữ theo tốc độ tăng dân số:
Toc do tang dan so
6543210-1
T
u
o
i
th
o
p
h
u
n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed).
- Tuổi thọ của phụ nữ theo GDP tính trên đầu người:
GDP tinh theo dau nguoi (USD)
3 000020 00010 0000- 10000
T
u
o
i t
h
o
p
h
u
n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed).
T uoåi
thoï T B
phuï nöõ
Maät ñoä
daân soá
(ngöôøi/km
2)
T uoåi thoï TB phuï
nöõ
Pearson
Correlation 1 .128
Sig. (2-tai led) . .186
N 109 109
Maät ñoä daân s oá
(ngöôøi/km2)
Pearson
Correlation .128 1
Sig. (2-tai led) .186 .
N 109 109
Tuoåi thoï
T B phuï nöõ
T æ leä daân
soáng ôû
vuøng ñoâ
thò (%)
T uoåi thoï T B phuï
nöõ
Pearson Correlation 1 .743(**)
Sig. (2-tailed) . .000
N 109 108
T æ leä daân soáng
ôû vuøng ñoâ thò
(%)
Pearson Correlation .743(** ) 1
Sig. (2-tailed) .000 .
N 108 108
T uoåi
tho ï TB
phuï nöõ
T oác ñoä
taêng
daân soá
(%/naêm)
Tuoåi tho ï TB phuï
nöõ
Pearson Correlation 1 -.579(** )
Sig. (2-tai led) . .000
N 109 109
Toác ñoä taêng
daân soá (%/naêm)
Pearson Correlation -.579(**) 1
Sig. (2-tai led) .000 .
N 109 109
T uoåi
tho ï TB
phuï nöõ
GDP tính
treân ñaàu
ngöôøi
(USD)
T uoåi thoï TB phuï
nöõ
Pearson Correlation 1 .642(** )
Sig. (2-tai led) . .000
N 109 109
GDP tính treân
ñaàu ngöôøi (USD)
Pearson Correlation .642(** ) 1
Sig. (2-tai led) .000 .
N 109 109
Bài tập Phân tích định lượng MBA-08
12
- Tuổi thọ phụ nữ theo tôn giáo:
Ton giao
76543210
T
uo
i t
h
o
p
hu
n
u
9 0
8 0
7 0
6 0
5 0
4 0
** Correlati on is s igni ficant at the 0.01 level (2-tailed).
- Tuổi thọ phụ nữ theo calogi nạp vào hằng n gày theo từng n gười:
Calogi nap vao h ang ngay
40003000200010 00
T
u
o
i t
h
o
p
h
u
n
u
90
80
70
60
50
40
- Tuổi thọ phụ nữ tính theo số con trung bình :
So con trung binh cua phu nu
987654321
T
u
o
i
th
o
p
h
u
n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed).
- Tuổi thọ phụ nữ theo tỷ lệ biết chữ của phụ nữ:
T y le phu nu biet chu( %)
120100806 040200
T
u
o
i t
h
o
p
h
u
n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed).
T uoåi
tho ï TB
phuï nöõ
Region or
ec onomic
group
Tuoåi tho ï TB phuï
nöõ
Pearson Correla tion 1 -.321(** )
Sig. (2-tai led) . .001
N 109 109
Region or economic
group
Pearson Correla tion -.321(**) 1
Sig. (2-tai led) .001 .
N 109 109
T uoåi thoï
TB phuï
nöõ
Calori na ïp
haøng
ngaøy TB
1 ngöôøi
T uoåi thoï T B
phuï nöõ
Pearson
Correlati on 1 .775(** )
Sig. (2-tai led) . .000
N 109 75
Calori naïp haøng
ngaøy TB 1
ngöôøi
Pearson
Correlati on .775(** ) 1
Sig. (2-tai led) .000 .
N 75 75
Tuoåi thoï
T B phuï
nöõ
Soá con TB
cuûa 1 phuï
nöõ
Tuoåi thoï T B phuï
nöõ
Pearson Correlation 1 -.838(**)
Sig. (2-tai led) . .000
N 109 107
Soá c on T B cuûa 1
phuï nöõ
Pearson Correlation -.838(**) 1
Sig. (2-tai led) .000 .
N 107 107
T uoåi thoï
T B phuï
nöõ
Tæ leä nöõ
giôùi bieát
chöõ (%)
T uoåi thoï TB phuï
nöõ
Pearson Correlation 1 .819(**)
Sig. (2-tai led) . .000
N 109 85
T æ leä nöõ giôùi
bieát c höõ (%)
Pearson Correlation .819(**) 1
Sig. (2-tai led) .000 .
N 85 85
Bài tập Phân tích định lượng MBA-08
13
- Tuổi thọ phụ nữ tính theo khí hậu:
Kh i hau chinh
1086420
T
u
o
i
th
o
p
h
u
n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed).
Sau khi dùng SPSS để vẽ đồ thị điểm và tính hệ số tương quan r ta thấy có các biến sau có thể dùng
làm biến nguyên nhân là:
- Tỷ lệ dân biết chữ có r = 0.865 và đồ thị các điểm tuyến tính theo đường thẳng.
- Tỷ lệ dân sống ở thành thị có r = 0.743 và đồ thị các điểm tuyến tính theo đường thẳng.
- Theo lượng calogi nạp vào hằng n gày cho từng n gười r = 0.775 và đồ thị các điểm tuyến tính theo
đường thẳng.
- Số con trung bình r = -0.838 và đồ thị các điểm tuyến tính theo đường thẳng nghịch biến.
- Tỷ lệ biết chữ của phụ nữ r = 0.819 và đồ thị các điểm tuyến tính theo đường thẳng.
Theo các tiêu chí nói trên ta chọn một biến làm biến nguyên nhân. Ta chọn tỷ lệ phụ nữ biết chữ do
nếu chọn theo tỷ lệ dân biết chữ nó có hệ số tương quan tốt nhất nhưng khi xét đến biết chữ thì lại có
tính cả đàn ông và trẻ con.
2. Xây d ựng mô hình hồi quy tuyến tính.
Dùng SPSS chạy hồi quy cho biến nguyên nhân là tỷ lệ ph ụ nữ biết chữ và biến kết quả là tuổi thọ
phụ nữ ta có các bảng sau:
Variables Entered/Removed(b)
Model
Variables
Entered
Variables
Removed Method
1
T æ leä nöõ
giôùi bieát
chöõ (%)(a)
. Enter
a Al l requested variables entered.
b Dependent Variable: Tuoåi thoï T B phuï nöõ
Model Summary
Model R R S quare
Adjusted R
Square
Std. Error of the
Esti mate
1 .819(a) .670 .666 6.195
a Predictors : (Constant), T æ leä nöõ giôùi bieát chöõ (%)
ANOVA(b)
T uoåi thoï
TB phuï
nöõ
Khí
haäu
chính
T uoåi thoï T B
phuï nöõ
Pearson
Correlation 1
.337(**
)
Sig. (2-tai led) . .000
N 109 107
Khí haäu chính Pearson
Correlation .337(** ) 1
Sig. (2-tai led) .000 .
N 107 107
Bài tập Phân tích định lượng MBA-08
14
Model
Sum of
Squares df Mean Square F Sig.
1 Regressio
n
6475.177 1 6475.177 168.698 .000(a)
Residual 3185.811 83 38.383
T otal 9660.988 84
a Predictors : (Constant), T æ leä nöõ giôùi bieát chöõ (%)
b Dependent Variable: Tuoåi thoï T B phuï nöõ
Coefficients(a)
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t Sig. B Std. Error Beta
1 (Constant) 47.170 1.726 27.337 .000
T æ leä nöõ giôùi
bieát c höõ (%)
.307 .024 .819 12.988 .000
a Dependent Variable: Tuoåi thoï T B phuï nöõ
Từ bảng kết quả ta có phương trình hồi quy với các hệ số B cho ở bản cuối cùng Coeficients:
ˆ 47.17 0.307i iY X hay
47.17 0.307i iY X
3. Đánh giá sự phù hợp và kiểm định mô hình
a. Đánh giá sự phù hợp của m ô hình:
Như đã thể hiện trong phần I thông qua giá t rị Rsquare ta có thể đánh giá độ ph ù hợp của mô hình
giá trị Rsquare được SP SS tính trong bảng sau:
Model Summary
Model R
R
Square
Adjusted
R Square
Std. Error
of the
Estimate
1 .819(a) .670 .666 6.195
a Predictors: (Constant), Tæ leä nöõ giôùi bieát chöõ (%)
Rsquare =0.67 có giá trị tương đố i lớn hơn trung bình nhưng không quá gần 1 điều này cho thấy m ô
hình có sự phù hợp tương đố i và có nghĩa là các điểm trên đồ thị scatter khá rời rạc và không trùng
nhiều trên đường hồi quy. Điều này cho ta kết luận rằng tuổ i thọ phụ nữ không chỉ phụ thuộc vào việc
biết chữ m à còn phụ thuộc vào các vấn đề khác như số con sinh, lượng calogi nạp vào hay GDP tính
trên đầu người…Như vậy để có thể có mô hình tốt hơn ta phải tìm hiểu và phân tích tuổi thọ phụ nữ
qua mô hình hồi quy đa biến.
Rsquare
Bài tập Phân tích định lượng MBA-08
15
T y le phu nu biet chu( %)
120100806 040200
T
u
o
i t
h
o
p
h
u
n
u
90
80
70
60
50
40
b. Đánh giá sự phù hợp của m ô hình cho tổng thể:
Như đã nêu trong phần lý thuyết tuy ta đã có giá trị Rsquar gần 1 và có kết luận là mô hình phù hợp
nhưng đó chỉ là đánh giá trên mẫu, nhưng không ch ắc tổng thể có được Rsquare gần 1. Để xác định
vấn đề này ta đi kiểm định giả thuyết Ho: Rsquare pop =0, nếu k ết quả kiểm định bác bỏ giả thuyết
Ho thì ta có thể kết luận là mô hình hồi quy tổng thể phù hợp.
SPSS cho ta kết quả kiểm định ch ỉ số F trong bản sau:
ANOVA(b)
Model
Sum of
Squares df Mean Square F Sig.
1 Regressio
n
6475.177 1 6475.177
168.698 .000(a)
Residual 3185.811 83 38.383
T otal 9660.988 84
a Predictors : (Constant), T æ leä nöõ giôùi bieát chöõ (%)
b Dependent Variable: Tuoåi thoï T B phuï nöõ
Theo kết quả với mức ý nghĩa quan sát rất nhỏ 0.0001 nên ta có thể hòan toàn bác bỏ giả thuyết Ho
hay ta có thể nói mô hình hồi quy t uyến tính của tổng thể có sự phù hợp.
c.kiểm định giả thuyết về hệ số hồi quy của tổng thể:
Như đã đề cập ở phần lý thuyết tuy ta có các giá trị hệ số của mô hình hồi quy của mô hình mẫu là B1
là khác không nhưng ta không chắc là độ dốc của mô hình tổng thể cũng khác không, do đó ta phải
tiến hành kiểm định độ dốc tổng thể qua sự bác bỏ giả thuyết Ho: 1 = 0.
Dùng SPSS chạy kiểm định cho ta giá trị t như sau:
Coefficients(a)
Các đường thẳng phân bố khá rời rạc chứ
không trùng nhiều vào đường thẳng hồi
quy.
Giá trị F và mức ý nghĩa quan sát được Sig
Bài tập Phân tích định lượng MBA-08
16
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t Sig.
B Std. Error Beta
1 (Constant) 47.170 1.726 27.337 .000
T æ leä nöõ giôùi
bieát c höõ (%)
.307 .024 .819 12.988 .000
a Dependent Variable: Tuoåi thoï T B phuï nöõ
Theo kết quả với mức ý nghĩa quan sát rất nhỏ 0.0001 nên ta có thể hòan toàn bác bỏ giả thuyết Ho
hay ta có thể nói mô hình hồi quy t uyến tính của tổng thể có độ dốc 1 khác không.
4. Mô hình đa biến, chọn lựa biến nguyên nhân, xây dựng và đánh giá.
Chọ lựa biến nguyên nhân:
Sau khi dùng SPSS chạy lần lượt nhiều biến nguyên nhân thì nhận thấy có các biến phù hợp nhất để
cho ra mô hình hồi quy bội với biến k ết quả là tuổ i thọ phụ nữ. đó là các biến n guyên nhân sau:
- Tỷ lệ phần trăm dân số biết chử.
- Số lượng lần sinh con.
- Lượng clogi nạp vào.
Lập ma trận tương quan giữa các biến trên với b iến kết quả tuổ i thọ phụ nữ bằng SPSS:
Correlations
T uoåi thoï
T B phuï
nöõ
T æ leä daân
bieát chöõ
(%)
Soá c on T B
cuûa 1 phuï
nöõ
Calori naïp
haøng
ngaøy TB 1
ngöôøi
Tuoåi thoï T B phuï
nöõ
Pearson Correlation 1 .865(**) -.838(**) .775(**)
Sig. (2-tai led) . .000 .000 .000
N 109 107 107 75
Tæ leä daân bieát
chöõ (%)
Pearson Correlation .865(**) 1 -.866(**) .682(**)
Sig. (2-tai led) .000 . .000 .000
N 107 107 105 74
Soá c on T B cuûa 1
phuï nöõ
Pearson Correlation -.838(**) -.866(**) 1 -.696(**)
Sig. (2-tai led) .000 .000 . .000
N 107 105 107 75
Calori naïp haøng
ngaøy T B 1 ngöôøi
Pearson Correlation .775(**) .682(**) -.696(**) 1
Sig. (2-tai led) .000 .000 .000 .
N 75 74 75 75
** Correlati on is s igni ficant at the 0.01 level (2-tailed).
Ta thấy các hệ số tương quan R là khá cao so với các biến nguyên nhân với biến kết quả, đây là tính
hiệu lạc quan cho v iệc đi phân tích hồi quy bội theo ba biến nguyên nhân trên.
Đồn g thời cũng có sự tương quang lớn giữa các biến nguyên nhân với nhau, điều này rất dể xãy là
hiện tượng đa cộng tuyến nhưng không là chắc chắn, do đó ta tiếp tục khảo sát ở phần xây dựng mô
hình và kiểm định mô hình.
Xây dựng mô hình hồi quy bội:
Sử dụng SP SS chạy hồi quy bội t uyến tính ta có bảng kết quả sau:
Variables Entered/Removed(b)
Giá trị t và mức ý nghĩa quan sát được.
Các giá trị R tương
quang giữa biến nguyên
nhân và biến kết quả khá
lớn
Bài tập Phân tích định lượng MBA-08
17
Model
Variables
Entered
Variables
Removed Method
1
Calori naïp
haøng ngaøy
T B 1 ngöôøi,
T æ leä daân
bieát chöõ
(%), Soá c on
T B cuûa 1
phuï nöõ(a)
. Enter
a Al l requested variables entered.
b Dependent Variable: Tuoåi thoï T B phuï nöõ
Model Summary
Model R R S quare
Adjusted R
Square
Std. Error of the
Esti mate
1 .912(a) .832 .825 4.789
a Predictors : (Constant), Calori na ïp haøng ngaøy TB 1 ngöôøi , Tæ leä daân bieát chöõ (%), Soá c on T B cuûa 1 phuï nöõ
ANOVA(b)
Model
Sum of
Squares df Mean Square F Sig.
1 Regressio
n
7962.254 3 2654.085 115.740 .000(a)
Residual 1605.205 70 22.932
T otal 9567.459 73
a Predictors : (Constant), Calori na ïp haøng ngaøy TB 1 ngöôøi , Tæ leä daân bieát chöõ (%), Soá c on T B cuûa 1 phuï nöõ
b Dependent Variable: Tuoåi thoï T B phuï nöõ
Coefficients(a)
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t Sig. B Std. E rror Beta
1 (Constant) 40.498 6.700 6.044 .000
T æ leä daân bieát
chöõ (%)
.227 .049 .458 4.599 .000
Soá c on T B cuûa
1 phuï nöõ
-1.430 .594 -.243 -2.407 .019
Calori naïp haøng
ngaøy TB 1
ngöôøi
.006 .001 .296 4.244 .000
a Dependent Variable: Tuoåi thoï T B phuï nöõ
Theo kết quả ta xây dựng được mô hình hồi quy bội theo các biến n guyên nhân đó như sau:
Y = 40.498 + 0.227X1 – 1.430 X2 + 0.006X3 + e
Kiểm tra độ phù hợp của m ô hình:
Model R R S quare
Adjusted R
Square
Std. Error of the
Esti mate
1 .912(a) .832 .825 4.789
Ta thấy mô hình có độ phù hợp cao do Rsquare điều chỉnh cao 0.825
Kiểm định F cho m ô hình,
Bác bỏ giả thuyết H0: 0=1=2 =3=0, nếu giả thuyết H0 bị bác bỏ lúc này ta sẽ kết luận rằng có sự
phù hợp của mô hình cho tổng thể giửa các biến nguyên nhân và biến k ết quả.
Bài tập Phân tích định lượng MBA-08
18
Model
Sum of
Squares df Mean Square F
Sig.
1 Regressio
n
7962.254 3 2654.085 115.740
.000(a)
Residual 1605.205 70 22.932
T otal 9567.459 73
Kiểm tra hệ số riêng phần:
Ta thấy từ kết quả chạy SPSS thì các hệ số riêng ph ân có mức ý nhĩa đều r ất nhỏ và có hệ số tác
động riêng phần đến biến kết quả đều lớn việc này cho thấy các biến nguyên nhân đã chọn đều có ý
nghĩa trong mô hình.
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t
Sig.
B Std. E rror Beta
1 (Constant) 40.498 6.700 6.044 .000
T æ leä daân bieát
chöõ (%) .227 .049
.458
4.599
.000
Soá c on T B cuûa
1 phuï nöõ
-1.430 .594
-.243
-2.407 .019
Calori naïp haøng
ngaøy TB 1
ngöôøi
.006 .001
.296
4.244 .000
Kết luận:
Phương pháp xây dựng mô hình hồi quy tuyến tính đơn biến và đa biến cho cái nhìn khái quát về sự
liên hệ giữa các biến nguyên nhân và kết quả, nhưng trong thực tế xã hội, khoa học hay kinh tế một
vấn đề nào đó ít khi chỉ ch ịu một ảnh hưởng duy nhất mà thông thường nó bị ảnh hưởng bởi rất nhiều
tác nhân bên ngòai, đó là mối liên hệ chằng chéo, đôi khi các tác nhân cho một vấn đề nào đó lại có sự
liên hệ, chúng tương tác nhau giữa các biến nguyên nhân làm cho sự liên kết trở nên phức tạp không
lường.
Do vậy mô hình hồi quy t uyến tính đơn biến có tính chất học thuật nhằm tạo cho người nghiên cứu
một cái nhìn phổ quát về phương pháp hồ i quy sau đó t iếp tục n ghiên cứu các mô hình phức tạp hơn,
như mô hình đa biến. Mô đa biến có tính thực tế hơn, gần gũi với tự nhiên hơn. Do vậy nghiên cứu
mô hình đa biến là cần thiết, nhưng không được nghiên cứu sâu sắc trong tiểu luận này do đây là
bước đầ u làm quen với các cách sử dụng SPSS trong định lượng nói chung.
Giả thuyết H0 bị bác bỏ do
mức ý nghĩa cua kiểm định F
rất nhỏ.
Mức ý n ghĩa cho
kiểm định là rất
nhỏ
Các hệ số beta
riêng phần lớn.
Các file đính kèm theo tài liệu này:
- giai_thich_mo_hinh_8434.pdf