Mô hình hội quy giải thích sự khác biệt về tuổi thọ của phụ nữ trên thế giới
          
        
            
               
            
 
            
                
                    Phương pháp xây dựng mô hình hồi quy tuyến tính đơn biến và đa biến cho cái nhìn kh ái quát về sự 
liên hệ giữa các biến n guyên nhân và kết quả, nhưn g trong thực tế xã hội, khoa học hay kinh tế một 
vấn đề nào đó ít khi chỉ chịu một ảnh hưởng duy nhất mà thông thường nó bị ảnh hưởng bởi rất nhiều 
tác nhân bên ngoài, đó là mối liên hệ chằn g chéo, đôi khi các tác nhân cho một vấn đề nào đó lại có sự 
liên hệ, chúng tương tác nhau giữa các biến nguyên nhân làm cho sự liên kết trở nên phức tạp không 
lường.
                
              
                                            
                                
            
 
            
                 18 trang
18 trang | 
Chia sẻ: lylyngoc | Lượt xem: 3179 | Lượt tải: 5 
              
            Bạn đang xem nội dung tài liệu Mô hình hội quy giải thích sự khác biệt về tuổi thọ của phụ nữ trên thế giới, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Bài tập Phân tích định lượng MBA-08 
1 
TRƯỜNG Đ ẠI HỌC MỞ TP.HCM 
LỚP CAO HỌC QUẢN TRỊ KINH DOANH KHÓA 8 
TIỂU LUẬN MÔN HỌC: 
PHÂN TÍCH ĐỊNH LƯỢNG 
ĐỀ TÀI TIỂU LUẬN: 
NHÓM THỰC HIỆN: 
Đào Hùng Anh. 
Võ Phương Hồng Cúc. 
Lê Trọng Đoan 
Cao Văn Tuấn. 
TP. Hồ Chí Minh, tháng 2 năm 2009 
Bài tập Phân tích định lượng MBA-08 
2 
ĐẠI HỌC MỞ TP. HỐ CHÍ MINH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM 
 Độc lập – Tự do – Hạnh ph úc 
 ------------- ------------------- 
ĐỀ KIỂM TRA 
MÔN: PHÂN TÍCH ĐỊNH LƯỢNG 
LỚP: MBA8 
Ghi chú: Sinh viên làm bài theo nhóm 
Yêu cầu: 
Sử dụng dữ liệu trong file World 95 Tieng Viet.sav đính kèm, bạn hãy tự xây dựng cho mình một mô 
hình hồi quy giải thích sự khác biệt về tuổi thọ ph ụ nữ giữa các quốc gia trên thế giới. 
Bạn được tự do lựa chọn các biến giải thích để đưa vào m ô hình cũng như tự quyết định dạng thức 
của các liên hệ giữa biến giải thích và biến kết quả. 
Hãy mô tả chi tiết quá trình xây dựng mô hình của bạn và tăng tính thuyết phục của mô hình này bằng 
các công cụ chẩn đoán và đánh giá mô hình. Giải thích ý ngh ĩa các kết quả của mô hình rút ra. 
Sản phẩm nộp: 
1. Bài làm dạng fi le Word (có ghi tên các thành viên của nhóm ở trang đầu) 
2. File output SP SS 
Cả 2 file được đặt tên như sau MBA8_KT_nhomX (X là số thứ tự nhóm ) 
Hình thức: 
File Word định dạng khổ giấy A4 (canh lề 2cm mỗi phía), 
font chữ Time New Roman, cỡ 12 points 
Cách đoạn (Spacin g before) 6 points, giãn dòng ( line spacing) 1.2 
Chúc thành công! 
Bài tập Phân tích định lượng MBA-08 
3 
Lời nói đầu: 
Phân tích định lượng là môn học nhằm trang bị kiến thức và phương pháp trong việc xây dựng mô 
hình, thu thập thông tin về thị t rường và đời sống xã hộ i, phân t ích số liệu, đánh giá số liệu nhằm khái 
quát hóa các vấn đề nghiên cứu trong mô hình đã xây dựng. Đằng sau nhữn g kiến thức đó cần có kiến 
thức về thống kê toánvà các kỹ năng sử dụng các loại phần mềm ch uyên n gh iệp cho bộ môn này như 
SPSS, EVIEW S hay Excel. Qua đó ta thấy đây là một lĩnh vực rộng lớn cần có sự trau dồi và tích lũy 
kiến thức lâu dài cũng như sự yêu nghề để đạt được sự hiểu biết tường tận và thực hiện tốt công việc 
này. 
Trong hệ thống kiến thức rộng lớn đó kỹ thuật hồi quy tuyến tính là một kỹ thuật hay mô hình quan 
trọng để tìm ra sự tương quan của các biến nguyên nhân và kết quả để ta có thể hình dung tương đối 
mối liên kết đó, giúp ta có thể ứng dụng mô hình trong thực tế đời sống xã hộ i hay kinh tế. Trong tiểu 
luận chúng ta đi nghiên cứu t uổi thọ của phụ nữ kh ác nhau như thế nào trên thế giới thông qua các 
biến nguyên nhân như GDP, học vấn hay số lượng sinh sản… sau đó đánh giá mô hình thông qua các 
chỉ số liên k ết, các ch ỉ số v ề sự chính xác và tương quan của các biến n ghiên cứu. 
Nhóm xin chân thành biết ơn và cảm tạ thầy Hoàng Trọng, đã hết lòng truyền thụ kiến thức và chia sẻ 
những kinh nghiệm quý báu trong quá trình hướng dẫn lớp MBA-08 môn học phân tích định lượng. 
Kính chúc thầy nhiều sức khỏe để tiếp tục truyền th ụ sự hiểu biết cho các khóa đàn em mai sau. 
Bài tập Phân tích định lượng MBA-08 
4 
MỤC LỤC 
I. Lý thuyết về hồi quy tuyến tính. 
1. Hệ số tương quan đơn. 
2. Xây dựng ph ương trình hồi quy tuyến tính. 
3. Đánh giá sự phù hợp của mô hình. 
4. Kiểm định giả thuyết về độ phù hợp của mô hình và ý nghĩa của h ệ số hồi quy. 
5. Hồi quy bội, những vấn đề cần quan tâm khi thực hiện. 
II. Ứng dụng Hồi quy tuyến tính vào để xây dựng một mô hình hồi quy giải thích sự khác biệt về tuổi 
thọ phụ nữ giữa các quốc gia trên thế giới. 
1. Xác định biến nguyên nhân và k ết quả. 
2. Xây dựng mô hình hồi quy t uyến tính. 
3. Đánh giá sự phù hợp và kiểm định mô hình. 
4. Mô hình đa biến, chọn lựa biến nguyên nhân, xây dựng và đánh giá. 
Kết luận 
Bài tập Phân tích định lượng MBA-08 
5 
I.Lý thuyết tổng quát về hồi quy đơn biến. 
1. Hệ số tương quan.( correlation coefficient) 
- Hệ số tương quan r nhằm nói lên sự liên kết chặt chẽ giữa hai biến nào đó. 
- Hệ số tương quan cho mẫu là ước lượng của hệ số tương quan r để đo lường mối liên kết tuyến chặt 
chẽ giữa các biến của mẫu. 
- Hệ số này không có đơn vị. 
- Hệ số này có giá trị biến thiên từ -1 đến 1. 
- Khi có giá trị âm hệ hai biến có tương quan nghịch biến. 
- Khi có giá trị dương hệ hai biến có tương quan đồng biến. 
- Khi gía trị này bằng khôn g thì hai biến khôn g có liên k ết. 
- Côn g thức tính toán hệ số tương quan mẫu: 
Trong đó: 
r: hệ số tương quan, X : gía trị hệ số nguyên nhân, Y: giá trị hệ số kết quả, X: hệ số trung bình biến 
nguyên nhân, Y: giá trị trung bình biến kết quả, n : độ lớn mẫu. 
- Giá trị r giữa hai biến có thể là r ất thấp nhưng chưa hẳn hai biến đó hoàn toàn không có mối liên hệ, 
có thể nó lại có dạng liên quan khác như liên hệ phi tuyến. 
- Giá trị r có thể là rất cao có khi gần bằng 1 nhưng thực tế không có sự liên quan nào, người ta gọi là 
sự tương quan giả, ví dụ như người ta nghiên cứu số lượng trẻ sơ sinh phụ thuộc vào dân số của thành 
phố HCM có sự tương quan rất cao vào năm 200x nhưng thực tế hai biến này có sự tương quan giả, 
do khoản thời gian đó k inh tế suy giảm các n ăm gần đó tỷ lệ sinh giảm, nhưng đặc biệt năm đó là năm 
Nghịch biến Đồng biến Không có mối liên hệ. 
Bài tập Phân tích định lượng MBA-08 
6 
may mắn nên các gia đình quyết định sinh con nhiều. Như vậy t a thất ở đây tương quan thật phải là số 
lượng trẻ sơ sinh và năm tốt. 
- Như vậy h ệ số tương quan ch ỉ được coi là một chỉ số nói lên sự chặt chẽ giữa các biến. 
2.Xây d ựng phương trình hồi quy tuyến tính: 
Sau khi đã nghiên cứu hệ số tương quan r, ta thấy rằng có thể hai biến có hệ số tương quan chặt chẽ 
một cách tuyến tính nhưng thực tế thì không có sự liên hệ nào về thực chất, do vậy để xây dựng 
phương trình hồi quy tuyến tính của các biến với nhau thì xem như ta đã nghiên cứu thấu đáo về sự 
liên quan giữa chúng trong thực tế, và có xét đến hệ số tương quan cần thiết khá cao. 
Sau đó ta t iến hành xây dựng mô hình. Lý thuyết thông thường người ta đặt biến Y là biến kết quả và 
biết X nguyên nhân, X được đặt trên trục hoành và Y đặt trên trục tung. Trong phần nghiên cứu của 
tiểu luận ta chi đi khảo sát mối liên quan tuyến tính theo đường thẳng đố i với mối liên hệ theo các 
hình khác như parabol hay hình gấp khúc không được đề cập. 
Phương trình hồi quy tuyến tính của tổng thể và mẫu có dạng đường thẳng như sau: 
Yi = 0 + 1Xi + , Yi = B0 + B1Xi +  
Trong đó Y là biến kết quả dự đoán thứ i, Xi là biến nguyên nhân thứ i, B0 hệ số tương quan tung độ 
góc là giá trị của Y khi X bằng không, B1 là hệ số tương quan độ dốc của đường thẳng biểu diễn mô 
hình hồi quy,  là gía trị khác biệt giữa hồi quy và giá trị thực tế. 
Ý nghĩa của các hệ số : 
- B0 nói lên giá trị của biến dự đoán kh i gía trị nguyên nh ân bằng không. 
- B1 độ dốc của đường hồi quy nhằm nói lên rằng khi giá trị X thay đổi một đơn vị thì giá trị Y sẽ thay 
đổi X.B1 đơn v ị. 
-  nói lên sự khác biệt giữa giá trị hồ i quy v à gía trị thực tế, ví dụ một biến kết quả có thể ảnh hưởng 
bởi rất nhiều biến nguyên nhân nh ưng ta lại chỉ khảo sát một biến n guyên nhân duy nhất, điều này đưa 
đến sự có giá trị khác biệt này, khi giá trị  càng nhỏ thì sự ảnh hưởng của biến n guyên nhân đó càng 
lớn và càng có sự chính xác kh i áp dụng mô hình hồi quy. 
- Ví dụ khi ta khảo sát chiều cao của của đứa trẻ 8 tuổi theo chế độ dinh dưỡng thì ta có gía trị  lớn, 
thì có nghỉa rằng chiều cao của đứa trẻ phụ thuộc vào dinh dưỡng v à còn phụ thuộc vào các biến khác 
như chiều cao của cha mẹ, nơi ăn chốn ở hay cách chăm sóc… hay nói cách khác gía trị  nhằm nói 
đến sự sai lệch do ta ch ưa khảo sát hết tất cả các biến ảnh hưởng đến biến phụ thuộc mà ta đang khảo 
sát. 
- Sau khi có được mô hình hồi quy tuyến tính ta có thể t ính gía trị biến phụ thuộc thông qua giá trị 
biến không phụ thuộc với một giá trị chênh lệch  nào đó mà ta chưa biết, nhưng giá trị đó nhỏ hơn 
Bài tập Phân tích định lượng MBA-08 
7 
giá trị sai biệt khi ta chỉ t ính trị trung bình so với giá trị thực tế cần khảo sát. Để hiểu hơn ta có thể đi 
đến mục sau: Đánh giá sự phù hợp của mô hình hồi quy tuyến tính. 
3.Đánh giá sự phù hợp của mô hình: 
Vấn đề quan trọng tron g các mô hình hồi quy là phải chứng minh được sự phù hợp của mô hình mà ta 
đang khảo sát, hầu như không có đường thẳng hồi quy nào đều hoàn toàn phù hợp với tập dữ liệu 
khảo sát và luôn có gía trị sai lệch giữa các trị dự báo từ hồi quy và giá trị thực tế, sự sai lệch này thể 
hiện qua phần dư . Do vậy người ta phải nghỉ đến một thước đo nào đó để chỉ ra mức độ phù hợp 
của mô hình. 
Thông thường thước đo cho mô hình tuyến tính được dùng là hệ số xác định R2. R2 được tính theo 
công thức: 
Trong đó SSR được xem như là giá trị sai lệch giữa gía t rị dự đoán theo hồi quy so với giá trị trung 
bình của tập dữ liệu, nó nói lên ph ần giá trị mà ta có thể ước lượng gần với thực tế hơn khi có phương 
pháp hồi quy so với khi ta chỉ t ính giá trị t rung bình của tổng thể tập mẫu. 
Ví dụ khi ta t ính thu nhập theo đầu người của thành phố HCM thì giá trị là 5 triệu đồng/người như 
vậy khi một gia đình có 3 người đi làm thì ta có thể hiểu là gia đình này thu nhập là 15 triệu đồng. 
Nhưng ta đã biết lương bổng thì phụ thuộc vào rất nhiều vấn đề như trình độ học thức, năm kinh 
nghiệm, loại công ty hay sự quan h ệ vớ i cấp trên… như vậy khi ta dùng mô hình hồi quy để tính 
lương của một người theo trình độ học vấn thì ta có thể tính như sau: 
Lương = B0 + B1*trình độ = 1 + 2.5*trình độ, khi xét đến một người có học vị đại học anh ta có gía 
trị trình độ là 3 thì Lương =1+2.5*3=8.5 triệu. Như vậy khoản chênh lệch 3.5 triệu giữa giá trị trung 
bình và giá trị tính theo hồi là SSR. 
Giá trị SST được định nghĩa khá đơn giản là giá trị sai lệch giữa giá trị trung bình của tập khảo sát và 
giá thị thực tế của một giá trị thực tế nào đó. 
Như vậy từ công thức ta có thể thấy giá trị R2 sẽ nằm trong khoảng từ 0 đến 1 khi R2 càng gần 0 thì 
mô hình không phù hợp do mô hình hồi quy không có tác dụng làm sai lệch nhỏ đi mà nó cũng giống 
như tính trung bình mà thôi. Khi R2 càng gần về 1 thì mô hình càng phù hợp do mô hình hồi quy, làm 
gía trị dự đoán hầu như ch ính xác với gía trị thực tế. 
Ngoài SST và SSR người ta còn có SSE là giá trị chênh lệch giữa giá trị thực tế và giá trị hồi quy, giá 
trị này chính là sai số . 
Bài tập Phân tích định lượng MBA-08 
8 
Vậy SST = SSE +SSR hay sai lệch tổng = sai lệch ngoài + sai lệch hồi quy. Để hiểu rỏ hơn ta xem 
hình vẽ sau: 
4.Kiểm định giả thuyết về độ phù hợp của mô hình và ý nghĩa của hệ số hồi quy. 
a. Kiểm định giả thuyết về độ phù hợp của m ô hình hay phân tích ph ương sai: 
Khi xây dựng xong mô hình hồi quy tuyến tính vấn đề quan trọng ta ph ải đi kiểm định về độ phù hợp 
mô hình hồi quy đó, do trong khi đánh giá sự phù hợp của mô hình bằng ch ỉ số Rsquare ch ỉ cho ta cái 
nhìn của tập mẫu nhưng không hẳn tổng thể có giá trị ph ù hợp tương ứng. 
Từ đó ta đi kiểm định, để k iểm định độ phù hợp của mô hình hồi quy tổng thể ta đặt giả thuyết 
H0 : Rpop = 0 sau khi t iến hành bài toán kiểm định giả thuyết H0 bị bác bỏ thì đây là bước đầu thành 
công cho việc kiểm định sự ph ù hợp của mô hình. 
Đại lượng F được dùng để kiểm định, nếu xác suất F nhỏ thì ta có thể bác bỏ giả định H0, F có công 
thức sau :
2
1
2
1
ˆ( ) /
( ) /( 1)
N
i
i
N
i
i
Y Y p
F
Y Y N p
  
b. kiểm định giả thuyết về hệ số hồ i quy của tổng thể: 
Kiểm định thường được thực hiện chính là độ dốc của mô hình tổng thể, ý nghĩa của v iệc phải đi kiểm 
định này là do cho dù ta đã có độ dốc của mẫu là B1 khác 0 nhưng ta khôn g thể chắc rằng độ dốc của 
tổng thể 1 là khác 0. 
Như vậy cũng tương tự nh ư kiểm định giả thuyết về độ phù hợp của mô hình tổng thể ta đặt giả thuyết 
H0: 1 = 0 . ta kỳ vọng giả thuyết này sẽ bị bác bỏ thì mô hình có sự liên hệ của ha i biến n guyên nhân 
và kết quả, hay mô hình hồi quy có quan hệ thật chứ không là quan hệ giả. 
Đường thẳng hồ i quy 
Gía trị trung bình 
Bài tập Phân tích định lượng MBA-08 
9 
Trị thống kê dùng để kiểm định giả thuyết là : t = B1/SB1 
Ta cũng có thể đi k iểm định B0 giống như kiểm định B1 với trị thống kê là: t = B0/SB0 
5. Hồi quy bội , những vấn đề cần quan tâm khi thực hiện. 
Hồi quy bội có quá trình xây dựng giống như hồi quy đơn nhưn g ở đây ta có nhiều biến n guyên nhân 
và chỉ một biến kết quả. Ví dụ như xét đến sự hao phí nhiên liệu cho một động cơ đốt trong thì có thể 
có một số biến nguyên nhân là: độ nặng của xe, dung tích cylinder, số cylinder hay t ỉ số nén, khoảng 
cách từ tử điểm trên đến tử điểm dưới… 
Mô hình hồi quy bộ i có dạng: Y = 0+1 X1+2X2+…+p Xp+e 
Y: là biến kết quả, k là các hệ số hồi quy riêng phần, Xk là các biến nguyên nhân, e là sai số. 
Các ưu điểm của hồi quy bội so với hồ i quy đơn: 
- Hồi quy bội cho ta đường hồi quy chính xác hơn so với hồi quy đơn kh i ta chọn được các 
biến nguyên nhân chính xác. 
- Giúp ta hiểu rõ hơn về vấn đề đang nhiên cứu, do mọi vấn đề hay hiện tượng trong tự 
nhiên hay trong kinh tế, xã hội đều có nhiều n guyên nhân gây r a chứ không phải ch ỉ một 
nguyên nhân ảnh hưỡng duy nhất. 
- Sai số e là nhỏ so với hồi quy đơn, khi các biến được chọn phù h ợp. 
Nhược đ iểm : 
- Có quy trình khảo sát và thu thập dữ liệu khó. 
- Có hiện tượng đa cộng tuyến xảy ra khi n ghiên cứu các biến nguyên nhân. Điều này xảy ra 
khi các biến nguyên nh ân ảnh hưởng lẫn nhau. 
- Có mối liên hệ giả giửa biến n guyên nhân và biến kết quả. 
Xây dựng m ô hình: 
Bước đầu t iên khi xây dựng mô hình thì ta phải đi xem xét các mối tương quan tuyến tính giửa các 
biến bằng cách xây dựng ma trận tương quan giữa các biến, từ đó ta có thể đánh giá sự tương quan 
của các biến nguyên nhân với nhau hay sự tác động đến biến kết quả. 
Để đánh giá độ phù hợp của mô hình hồi quy tuyến tính bội: ta cũng quan sát hệ số R2, khi ta đưa vào 
mô hình càng nhiều biến nguyên nhân thì hệ số R2 cang tăng, nhưng thực tế cho thấy khi số biến 
nguyên nhân tăng thì không hẳn mô hình càng ph ù hợp. Do đó đối với mô hình hồi quy tuyến tính bội 
người ta xét độ phù hợp của mô hình thông qua giá trị Rsquare adjust. Giá trị Rsquare điều ch ỉnh này 
không nhất thiết tăng cao gần một khi ta thêm vào mô hình nhiều biến hơn vì nó không phụ thuộc vào 
độ lệch phóng đại của R2, R2 điều ch ỉnh được tính như sau: 
Ra
2
=R2-p(1-R2)/(N-p-1) 
P là biến số độc lập trong phương trình ( trong mô hình hồi quy đơn biến thì p = 1). 
 Kiểm định độ phù hợp của mô hình: 
Cũng giống như phần hồi quy đơn biến thì ta phải đi kiểm định độ phù h ợp của tổng thể, kiểm định F 
được sử dụng, ý tưởng của kiểm định này là xem xét tất cả các biến nguyên nhân có liên hệ với biến 
kết quả hay không thôn g qua kiểm định giả thuyết H0: 0=1 =2=0, và khi giả thuyết H0 bị bác bỏ thì 
ta kết luận độ phù hợp tron g mô hình giải thích được biến khảo sát. 
Bài tập Phân tích định lượng MBA-08 
10 
Xét hệ số beta riêng phần cho mô hình: 
Hệ số này nói lên sự tác động riêng của một biến nguyên nhân n ào đó vào biến kết quả khi các biến 
nguyên nhân còn lại không có sự thay đổi, hệ số này còn được k iểm định thông qua mức ý ngh ĩa sig. 
khi mức ý ngh ĩa càng nhỏ thì ta đánh giá biến nguyên nhân đó có tác động đến mô hình, ngược lại khi 
giá trị của mức ý n ghĩa lớn hơn 0.05 chẵng hạn thì không có sự tác động lớn của biến n guyên nhân đó 
đến mô hình. 
II. Ứng dụng Hồi quy đơn biến tuyến tính vào để xây dựng m ột mô hình hồi quy giải thích sự 
khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới. 
1.Xác đ ịnh biến nguyên nhân và kết quả. 
Để x ác định biến thì ta dùng SPSS tìm hệ số tương quan r giữa các biến so v ới biến tuổi thọ phụ nữ, 
trong đó có ba điều kiện cần xem xét: 
- Các điểm trên đồ thị Scatter phải tương đối tuyến tính theo đường thẳng do ta khảo sát mô hình hôi 
quy tuyến tính đơn. 
- Hệ số tương quan càn g gần 1 càng tốt. 
- Có sự xem xét thực tế là biến n guyên nhân đó có thật sự tương quan ảnh hưởng đến biến kết quả là 
tuổi thọ phụ nữ. 
Ta lần lược chạy vẽ đồ thị Scatter và tính hệ số tương quan r giữa tuổi thọ phụ nữ và các biến nguyên 
nhân, sau đó sẽ chọn biến nào có ảnh hưởng đến t uổi thọ phụ nữ theo ba tiêu ch í nêu trên. 
- Tuổi thọ phụ nữ theo tỷ lệ dân biết chữ. 
Ty le d an biet chu(%)
120100806040200
T
u
o
i t
h
o
 t
ru
n
g
 b
in
h
 P
h
u
 N
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed). 
T uoåi 
tho ï TB 
phuï nöõ 
T æ leä 
daân bieát 
chöõ (%) 
T uoåi thoï TB 
phuï nöõ 
Pearson 
Correlation 
1 .865(**) 
Sig. (2-tailed) . .000 
N 109 107 
T æ leä daân 
bieát chöõ (%) 
Pearson 
Correlation 
.865(**) 1 
Sig. (2-tailed) .000 . 
N 107 107 
Bài tập Phân tích định lượng MBA-08 
11 
- Tuổi thọ phụ nữ theo mật độ dân số: 
Ma t do dan so ( nguoi/km2)
6000500040003000200010000-1000
Tu
o
i t
h
o
 p
h
u
 n
u
90
80
70
60
50
40
- Tuổi thọ phụ nữ theo tỷ lệ dân sống ở thành thị: 
Ty le dan song o thanh thi (%)
120100806040200
T
u
oi
 t
h
o
 p
h
u 
nu
90
80
70
60
50
40
- Tuổi thọ phụ nữ theo tốc độ tăng dân số: 
Toc do tang dan so
6543210-1
T
u
o
i 
th
o
 p
h
u
 n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed). 
- Tuổi thọ của phụ nữ theo GDP tính trên đầu người: 
GDP tinh theo dau nguoi (USD)
3 000020 00010 0000- 10000
T
u
o
i t
h
o 
p
h
u
 n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed). 
T uoåi 
thoï T B 
phuï nöõ 
Maät ñoä 
daân soá 
(ngöôøi/km
2) 
T uoåi thoï TB phuï 
nöõ 
Pearson 
Correlation 1 .128 
Sig. (2-tai led) . .186 
N 109 109 
Maät ñoä daân s oá 
(ngöôøi/km2) 
Pearson 
Correlation .128 1 
Sig. (2-tai led) .186 . 
N 109 109 
Tuoåi thoï 
T B phuï nöõ 
T æ leä daân 
soáng ôû 
vuøng ñoâ 
thò (%) 
T uoåi thoï T B phuï 
nöõ 
Pearson Correlation 1 .743(**) 
Sig. (2-tailed) . .000 
N 109 108 
T æ leä daân soáng 
ôû vuøng ñoâ thò 
(%) 
Pearson Correlation .743(** ) 1 
Sig. (2-tailed) .000 . 
N 108 108 
T uoåi 
tho ï TB 
phuï nöõ 
T oác ñoä 
taêng 
daân soá 
(%/naêm) 
Tuoåi tho ï TB phuï 
nöõ 
Pearson Correlation 1 -.579(** ) 
Sig. (2-tai led) . .000 
N 109 109 
Toác ñoä taêng 
daân soá (%/naêm) 
Pearson Correlation -.579(**) 1 
Sig. (2-tai led) .000 . 
N 109 109 
T uoåi 
tho ï TB 
phuï nöõ 
GDP tính 
treân ñaàu 
ngöôøi 
(USD) 
T uoåi thoï TB phuï 
nöõ 
Pearson Correlation 1 .642(** ) 
Sig. (2-tai led) . .000 
N 109 109 
GDP tính treân 
ñaàu ngöôøi (USD) 
Pearson Correlation .642(** ) 1 
Sig. (2-tai led) .000 . 
N 109 109 
Bài tập Phân tích định lượng MBA-08 
12 
- Tuổi thọ phụ nữ theo tôn giáo: 
Ton giao
76543210
T
uo
i t
h
o 
p
hu
 n
u
9 0
8 0
7 0
6 0
5 0
4 0
** Correlati on is s igni ficant at the 0.01 level (2-tailed). 
- Tuổi thọ phụ nữ theo calogi nạp vào hằng n gày theo từng n gười: 
Calogi nap vao h ang ngay
40003000200010 00
T
u
o
i t
h
o
 p
h
u
 n
u
90
80
70
60
50
40
- Tuổi thọ phụ nữ tính theo số con trung bình : 
So con trung binh cua phu nu
987654321
T
u
o
i 
th
o
 p
h
u
 n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed). 
- Tuổi thọ phụ nữ theo tỷ lệ biết chữ của phụ nữ: 
T y le phu nu biet chu( %)
120100806 040200
T
u
o
i t
h
o
 p
h
u
 n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed). 
T uoåi 
tho ï TB 
phuï nöõ 
Region or 
ec onomic 
group 
Tuoåi tho ï TB phuï 
nöõ 
Pearson Correla tion 1 -.321(** ) 
Sig. (2-tai led) . .001 
N 109 109 
Region or economic 
group 
Pearson Correla tion -.321(**) 1 
Sig. (2-tai led) .001 . 
N 109 109 
T uoåi thoï 
TB phuï 
nöõ 
Calori na ïp 
haøng 
ngaøy TB 
1 ngöôøi 
T uoåi thoï T B 
phuï nöõ 
Pearson 
Correlati on 1 .775(** ) 
Sig. (2-tai led) . .000 
N 109 75 
Calori naïp haøng 
ngaøy TB 1 
ngöôøi 
Pearson 
Correlati on .775(** ) 1 
Sig. (2-tai led) .000 . 
N 75 75 
Tuoåi thoï 
T B phuï 
nöõ 
Soá con TB 
cuûa 1 phuï 
nöõ 
Tuoåi thoï T B phuï 
nöõ 
Pearson Correlation 1 -.838(**) 
Sig. (2-tai led) . .000 
N 109 107 
Soá c on T B cuûa 1 
phuï nöõ 
Pearson Correlation -.838(**) 1 
Sig. (2-tai led) .000 . 
N 107 107 
T uoåi thoï 
T B phuï 
nöõ 
Tæ leä nöõ 
giôùi bieát 
chöõ (%) 
T uoåi thoï TB phuï 
nöõ 
Pearson Correlation 1 .819(**) 
Sig. (2-tai led) . .000 
N 109 85 
T æ leä nöõ giôùi 
bieát c höõ (%) 
Pearson Correlation .819(**) 1 
Sig. (2-tai led) .000 . 
N 85 85 
Bài tập Phân tích định lượng MBA-08 
13 
- Tuổi thọ phụ nữ tính theo khí hậu: 
Kh i hau chinh
1086420
T
u
o
i 
th
o
 p
h
u
 n
u
90
80
70
60
50
40
** Correlati on is s igni ficant at the 0.01 level (2-tailed). 
Sau khi dùng SPSS để vẽ đồ thị điểm và tính hệ số tương quan r ta thấy có các biến sau có thể dùng 
làm biến nguyên nhân là: 
- Tỷ lệ dân biết chữ có r = 0.865 và đồ thị các điểm tuyến tính theo đường thẳng. 
- Tỷ lệ dân sống ở thành thị có r = 0.743 và đồ thị các điểm tuyến tính theo đường thẳng. 
- Theo lượng calogi nạp vào hằng n gày cho từng n gười r = 0.775 và đồ thị các điểm tuyến tính theo 
đường thẳng. 
- Số con trung bình r = -0.838 và đồ thị các điểm tuyến tính theo đường thẳng nghịch biến. 
- Tỷ lệ biết chữ của phụ nữ r = 0.819 và đồ thị các điểm tuyến tính theo đường thẳng. 
Theo các tiêu chí nói trên ta chọn một biến làm biến nguyên nhân. Ta chọn tỷ lệ phụ nữ biết chữ do 
nếu chọn theo tỷ lệ dân biết chữ nó có hệ số tương quan tốt nhất nhưng khi xét đến biết chữ thì lại có 
tính cả đàn ông và trẻ con. 
2. Xây d ựng mô hình hồi quy tuyến tính. 
Dùng SPSS chạy hồi quy cho biến nguyên nhân là tỷ lệ ph ụ nữ biết chữ và biến kết quả là tuổi thọ 
phụ nữ ta có các bảng sau: 
 Variables Entered/Removed(b) 
Model 
Variables 
Entered 
Variables 
Removed Method 
1 
T æ leä nöõ 
giôùi bieát 
chöõ (%)(a) 
. Enter 
a Al l requested variables entered. 
b Dependent Variable: Tuoåi thoï T B phuï nöõ 
 Model Summary 
Model R R S quare 
Adjusted R 
Square 
Std. Error of the 
Esti mate 
1 .819(a) .670 .666 6.195 
a Predictors : (Constant), T æ leä nöõ giôùi bieát chöõ (%) 
ANOVA(b) 
T uoåi thoï 
TB phuï 
nöõ 
Khí 
haäu 
chính 
T uoåi thoï T B 
phuï nöõ 
Pearson 
Correlation 1 
.337(**
) 
Sig. (2-tai led) . .000 
N 109 107 
Khí haäu chính Pearson 
Correlation .337(** ) 1 
Sig. (2-tai led) .000 . 
N 107 107 
Bài tập Phân tích định lượng MBA-08 
14 
Model 
Sum of 
Squares df Mean Square F Sig. 
1 Regressio
n 
6475.177 1 6475.177 168.698 .000(a) 
Residual 3185.811 83 38.383 
T otal 9660.988 84 
a Predictors : (Constant), T æ leä nöõ giôùi bieát chöõ (%) 
b Dependent Variable: Tuoåi thoï T B phuï nöõ 
 Coefficients(a) 
Model 
Unstandardi zed 
Coefficients 
Standardized 
Coefficients 
t Sig. B Std. Error Beta 
1 (Constant) 47.170 1.726 27.337 .000 
T æ leä nöõ giôùi 
bieát c höõ (%) 
.307 .024 .819 12.988 .000 
a Dependent Variable: Tuoåi thoï T B phuï nöõ 
Từ bảng kết quả ta có phương trình hồi quy với các hệ số B cho ở bản cuối cùng Coeficients: 
ˆ 47.17 0.307i iY X  hay 
47.17 0.307i iY X    
3. Đánh giá sự phù hợp và kiểm định mô hình 
a. Đánh giá sự phù hợp của m ô hình: 
 Như đã thể hiện trong phần I thông qua giá t rị Rsquare ta có thể đánh giá độ ph ù hợp của mô hình 
giá trị Rsquare được SP SS tính trong bảng sau: 
 Model Summary 
Model R 
R 
Square 
Adjusted 
R Square 
Std. Error 
of the 
Estimate 
1 .819(a) .670 .666 6.195 
a Predictors: (Constant), Tæ leä nöõ giôùi bieát chöõ (%) 
Rsquare =0.67 có giá trị tương đố i lớn hơn trung bình nhưng không quá gần 1 điều này cho thấy m ô 
hình có sự phù hợp tương đố i và có nghĩa là các điểm trên đồ thị scatter khá rời rạc và không trùng 
nhiều trên đường hồi quy. Điều này cho ta kết luận rằng tuổ i thọ phụ nữ không chỉ phụ thuộc vào việc 
biết chữ m à còn phụ thuộc vào các vấn đề khác như số con sinh, lượng calogi nạp vào hay GDP tính 
trên đầu người…Như vậy để có thể có mô hình tốt hơn ta phải tìm hiểu và phân tích tuổi thọ phụ nữ 
qua mô hình hồi quy đa biến. 
Rsquare 
Bài tập Phân tích định lượng MBA-08 
15 
T y le phu nu biet chu( %)
120100806 040200
T
u
o
i t
h
o 
p
h
u
 n
u
90
80
70
60
50
40
b. Đánh giá sự phù hợp của m ô hình cho tổng thể: 
Như đã nêu trong phần lý thuyết tuy ta đã có giá trị Rsquar gần 1 và có kết luận là mô hình phù hợp 
nhưng đó chỉ là đánh giá trên mẫu, nhưng không ch ắc tổng thể có được Rsquare gần 1. Để xác định 
vấn đề này ta đi kiểm định giả thuyết Ho: Rsquare pop =0, nếu k ết quả kiểm định bác bỏ giả thuyết 
Ho thì ta có thể kết luận là mô hình hồi quy tổng thể phù hợp. 
SPSS cho ta kết quả kiểm định ch ỉ số F trong bản sau: 
 ANOVA(b) 
Model 
Sum of 
Squares df Mean Square F Sig. 
1 Regressio
n 
6475.177 1 6475.177 
168.698 .000(a) 
Residual 3185.811 83 38.383 
T otal 9660.988 84 
a Predictors : (Constant), T æ leä nöõ giôùi bieát chöõ (%) 
b Dependent Variable: Tuoåi thoï T B phuï nöõ 
Theo kết quả với mức ý nghĩa quan sát rất nhỏ 0.0001 nên ta có thể hòan toàn bác bỏ giả thuyết Ho 
hay ta có thể nói mô hình hồi quy t uyến tính của tổng thể có sự phù hợp. 
c.kiểm định giả thuyết về hệ số hồi quy của tổng thể: 
Như đã đề cập ở phần lý thuyết tuy ta có các giá trị hệ số của mô hình hồi quy của mô hình mẫu là B1 
là khác không nhưng ta không chắc là độ dốc của mô hình tổng thể cũng khác không, do đó ta phải 
tiến hành kiểm định độ dốc tổng thể qua sự bác bỏ giả thuyết Ho: 1 = 0. 
Dùng SPSS chạy kiểm định cho ta giá trị t như sau: 
 Coefficients(a) 
Các đường thẳng phân bố khá rời rạc chứ 
không trùng nhiều vào đường thẳng hồi 
quy. 
Giá trị F và mức ý nghĩa quan sát được Sig 
Bài tập Phân tích định lượng MBA-08 
16 
Model 
Unstandardi zed 
Coefficients 
Standardized 
Coefficients 
t Sig. 
B Std. Error Beta 
1 (Constant) 47.170 1.726 27.337 .000 
T æ leä nöõ giôùi 
bieát c höõ (%) 
.307 .024 .819 12.988 .000 
a Dependent Variable: Tuoåi thoï T B phuï nöõ 
Theo kết quả với mức ý nghĩa quan sát rất nhỏ 0.0001 nên ta có thể hòan toàn bác bỏ giả thuyết Ho 
hay ta có thể nói mô hình hồi quy t uyến tính của tổng thể có độ dốc 1 khác không. 
4. Mô hình đa biến, chọn lựa biến nguyên nhân, xây dựng và đánh giá. 
Chọ lựa biến nguyên nhân: 
Sau khi dùng SPSS chạy lần lượt nhiều biến nguyên nhân thì nhận thấy có các biến phù hợp nhất để 
cho ra mô hình hồi quy bội với biến k ết quả là tuổ i thọ phụ nữ. đó là các biến n guyên nhân sau: 
- Tỷ lệ phần trăm dân số biết chử. 
- Số lượng lần sinh con. 
- Lượng clogi nạp vào. 
Lập ma trận tương quan giữa các biến trên với b iến kết quả tuổ i thọ phụ nữ bằng SPSS: 
 Correlations 
T uoåi thoï 
T B phuï 
nöõ 
T æ leä daân 
bieát chöõ 
(%) 
Soá c on T B 
cuûa 1 phuï 
nöõ 
Calori naïp 
haøng 
ngaøy TB 1 
ngöôøi 
Tuoåi thoï T B phuï 
nöõ 
Pearson Correlation 1 .865(**) -.838(**) .775(**) 
Sig. (2-tai led) . .000 .000 .000 
N 109 107 107 75 
Tæ leä daân bieát 
chöõ (%) 
Pearson Correlation .865(**) 1 -.866(**) .682(**) 
Sig. (2-tai led) .000 . .000 .000 
N 107 107 105 74 
Soá c on T B cuûa 1 
phuï nöõ 
Pearson Correlation -.838(**) -.866(**) 1 -.696(**) 
Sig. (2-tai led) .000 .000 . .000 
N 107 105 107 75 
Calori naïp haøng 
ngaøy T B 1 ngöôøi 
Pearson Correlation .775(**) .682(**) -.696(**) 1 
Sig. (2-tai led) .000 .000 .000 . 
N 75 74 75 75 
** Correlati on is s igni ficant at the 0.01 level (2-tailed). 
Ta thấy các hệ số tương quan R là khá cao so với các biến nguyên nhân với biến kết quả, đây là tính 
hiệu lạc quan cho v iệc đi phân tích hồi quy bội theo ba biến nguyên nhân trên. 
Đồn g thời cũng có sự tương quang lớn giữa các biến nguyên nhân với nhau, điều này rất dể xãy là 
hiện tượng đa cộng tuyến nhưng không là chắc chắn, do đó ta tiếp tục khảo sát ở phần xây dựng mô 
hình và kiểm định mô hình. 
Xây dựng mô hình hồi quy bội: 
Sử dụng SP SS chạy hồi quy bội t uyến tính ta có bảng kết quả sau: 
 Variables Entered/Removed(b) 
Giá trị t và mức ý nghĩa quan sát được. 
Các giá trị R tương 
quang giữa biến nguyên 
nhân và biến kết quả khá 
lớn 
Bài tập Phân tích định lượng MBA-08 
17 
Model 
Variables 
Entered 
Variables 
Removed Method 
1 
Calori naïp 
haøng ngaøy 
T B 1 ngöôøi, 
T æ leä daân 
bieát chöõ 
(%), Soá c on 
T B cuûa 1 
phuï nöõ(a) 
. Enter 
a Al l requested variables entered. 
b Dependent Variable: Tuoåi thoï T B phuï nöõ 
 Model Summary 
Model R R S quare 
Adjusted R 
Square 
Std. Error of the 
Esti mate 
1 .912(a) .832 .825 4.789 
a Predictors : (Constant), Calori na ïp haøng ngaøy TB 1 ngöôøi , Tæ leä daân bieát chöõ (%), Soá c on T B cuûa 1 phuï nöõ 
 ANOVA(b) 
Model 
Sum of 
Squares df Mean Square F Sig. 
1 Regressio
n 
7962.254 3 2654.085 115.740 .000(a) 
Residual 1605.205 70 22.932 
T otal 9567.459 73 
a Predictors : (Constant), Calori na ïp haøng ngaøy TB 1 ngöôøi , Tæ leä daân bieát chöõ (%), Soá c on T B cuûa 1 phuï nöõ 
b Dependent Variable: Tuoåi thoï T B phuï nöõ 
 Coefficients(a) 
Model 
Unstandardi zed 
Coefficients 
Standardized 
Coefficients 
t Sig. B Std. E rror Beta 
1 (Constant) 40.498 6.700 6.044 .000 
T æ leä daân bieát 
chöõ (%) 
.227 .049 .458 4.599 .000 
Soá c on T B cuûa 
1 phuï nöõ 
-1.430 .594 -.243 -2.407 .019 
Calori naïp haøng 
ngaøy TB 1 
ngöôøi 
.006 .001 .296 4.244 .000 
a Dependent Variable: Tuoåi thoï T B phuï nöõ 
Theo kết quả ta xây dựng được mô hình hồi quy bội theo các biến n guyên nhân đó như sau: 
Y = 40.498 + 0.227X1 – 1.430 X2 + 0.006X3 + e 
Kiểm tra độ phù hợp của m ô hình: 
Model R R S quare 
Adjusted R 
Square 
Std. Error of the 
Esti mate 
1 .912(a) .832 .825 4.789 
Ta thấy mô hình có độ phù hợp cao do Rsquare điều chỉnh cao 0.825 
Kiểm định F cho m ô hình, 
Bác bỏ giả thuyết H0: 0=1=2 =3=0, nếu giả thuyết H0 bị bác bỏ lúc này ta sẽ kết luận rằng có sự 
phù hợp của mô hình cho tổng thể giửa các biến nguyên nhân và biến k ết quả. 
Bài tập Phân tích định lượng MBA-08 
18 
Model 
Sum of 
Squares df Mean Square F 
Sig. 
1 Regressio
n 
7962.254 3 2654.085 115.740 
.000(a) 
Residual 1605.205 70 22.932 
T otal 9567.459 73 
Kiểm tra hệ số  riêng phần: 
Ta thấy từ kết quả chạy SPSS thì các hệ số riêng ph ân có mức ý nhĩa đều r ất nhỏ và có hệ số  tác 
động riêng phần đến biến kết quả đều lớn việc này cho thấy các biến nguyên nhân đã chọn đều có ý 
nghĩa trong mô hình. 
Model 
Unstandardi zed 
Coefficients 
Standardized 
Coefficients 
t 
Sig. 
B Std. E rror Beta 
1 (Constant) 40.498 6.700 6.044 .000 
T æ leä daân bieát 
chöõ (%) .227 .049 
.458 
4.599 
.000 
Soá c on T B cuûa 
1 phuï nöõ 
-1.430 .594 
-.243 
-2.407 .019 
Calori naïp haøng 
ngaøy TB 1 
ngöôøi 
.006 .001 
.296 
4.244 .000 
Kết luận: 
Phương pháp xây dựng mô hình hồi quy tuyến tính đơn biến và đa biến cho cái nhìn khái quát về sự 
liên hệ giữa các biến nguyên nhân và kết quả, nhưng trong thực tế xã hội, khoa học hay kinh tế một 
vấn đề nào đó ít khi chỉ ch ịu một ảnh hưởng duy nhất mà thông thường nó bị ảnh hưởng bởi rất nhiều 
tác nhân bên ngòai, đó là mối liên hệ chằng chéo, đôi khi các tác nhân cho một vấn đề nào đó lại có sự 
liên hệ, chúng tương tác nhau giữa các biến nguyên nhân làm cho sự liên kết trở nên phức tạp không 
lường. 
Do vậy mô hình hồi quy t uyến tính đơn biến có tính chất học thuật nhằm tạo cho người nghiên cứu 
một cái nhìn phổ quát về phương pháp hồ i quy sau đó t iếp tục n ghiên cứu các mô hình phức tạp hơn, 
như mô hình đa biến. Mô đa biến có tính thực tế hơn, gần gũi với tự nhiên hơn. Do vậy nghiên cứu 
mô hình đa biến là cần thiết, nhưng không được nghiên cứu sâu sắc trong tiểu luận này do đây là 
bước đầ u làm quen với các cách sử dụng SPSS trong định lượng nói chung. 
Giả thuyết H0 bị bác bỏ do 
mức ý nghĩa cua kiểm định F 
rất nhỏ. 
Mức ý n ghĩa cho 
kiểm định là rất 
nhỏ 
Các hệ số beta 
riêng phần lớn. 
            Các file đính kèm theo tài liệu này:
 giai_thich_mo_hinh_8434.pdf giai_thich_mo_hinh_8434.pdf