Mô hình hội quy giải thích sự khác biệt về tuổi thọ của phụ nữ trên thế giới

Phương pháp xây dựng mô hình hồi quy tuyến tính đơn biến và đa biến cho cái nhìn kh ái quát về sự liên hệ giữa các biến n guyên nhân và kết quả, nhưn g trong thực tế xã hội, khoa học hay kinh tế một vấn đề nào đó ít khi chỉ chịu một ảnh hưởng duy nhất mà thông thường nó bị ảnh hưởng bởi rất nhiều tác nhân bên ngoài, đó là mối liên hệ chằn g chéo, đôi khi các tác nhân cho một vấn đề nào đó lại có sự liên hệ, chúng tương tác nhau giữa các biến nguyên nhân làm cho sự liên kết trở nên phức tạp không lường.

pdf18 trang | Chia sẻ: lylyngoc | Lượt xem: 3002 | Lượt tải: 5download
Bạn đang xem nội dung tài liệu Mô hình hội quy giải thích sự khác biệt về tuổi thọ của phụ nữ trên thế giới, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Bài tập Phân tích định lượng MBA-08 1 TRƯỜNG Đ ẠI HỌC MỞ TP.HCM LỚP CAO HỌC QUẢN TRỊ KINH DOANH KHÓA 8 TIỂU LUẬN MÔN HỌC: PHÂN TÍCH ĐỊNH LƯỢNG ĐỀ TÀI TIỂU LUẬN: NHÓM THỰC HIỆN: Đào Hùng Anh. Võ Phương Hồng Cúc. Lê Trọng Đoan Cao Văn Tuấn. TP. Hồ Chí Minh, tháng 2 năm 2009 Bài tập Phân tích định lượng MBA-08 2 ĐẠI HỌC MỞ TP. HỐ CHÍ MINH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh ph úc ------------- ------------------- ĐỀ KIỂM TRA MÔN: PHÂN TÍCH ĐỊNH LƯỢNG LỚP: MBA8 Ghi chú: Sinh viên làm bài theo nhóm Yêu cầu: Sử dụng dữ liệu trong file World 95 Tieng Viet.sav đính kèm, bạn hãy tự xây dựng cho mình một mô hình hồi quy giải thích sự khác biệt về tuổi thọ ph ụ nữ giữa các quốc gia trên thế giới. Bạn được tự do lựa chọn các biến giải thích để đưa vào m ô hình cũng như tự quyết định dạng thức của các liên hệ giữa biến giải thích và biến kết quả. Hãy mô tả chi tiết quá trình xây dựng mô hình của bạn và tăng tính thuyết phục của mô hình này bằng các công cụ chẩn đoán và đánh giá mô hình. Giải thích ý ngh ĩa các kết quả của mô hình rút ra. Sản phẩm nộp: 1. Bài làm dạng fi le Word (có ghi tên các thành viên của nhóm ở trang đầu) 2. File output SP SS Cả 2 file được đặt tên như sau MBA8_KT_nhomX (X là số thứ tự nhóm ) Hình thức: File Word định dạng khổ giấy A4 (canh lề 2cm mỗi phía), font chữ Time New Roman, cỡ 12 points Cách đoạn (Spacin g before) 6 points, giãn dòng ( line spacing) 1.2 Chúc thành công! Bài tập Phân tích định lượng MBA-08 3 Lời nói đầu: Phân tích định lượng là môn học nhằm trang bị kiến thức và phương pháp trong việc xây dựng mô hình, thu thập thông tin về thị t rường và đời sống xã hộ i, phân t ích số liệu, đánh giá số liệu nhằm khái quát hóa các vấn đề nghiên cứu trong mô hình đã xây dựng. Đằng sau nhữn g kiến thức đó cần có kiến thức về thống kê toánvà các kỹ năng sử dụng các loại phần mềm ch uyên n gh iệp cho bộ môn này như SPSS, EVIEW S hay Excel. Qua đó ta thấy đây là một lĩnh vực rộng lớn cần có sự trau dồi và tích lũy kiến thức lâu dài cũng như sự yêu nghề để đạt được sự hiểu biết tường tận và thực hiện tốt công việc này. Trong hệ thống kiến thức rộng lớn đó kỹ thuật hồi quy tuyến tính là một kỹ thuật hay mô hình quan trọng để tìm ra sự tương quan của các biến nguyên nhân và kết quả để ta có thể hình dung tương đối mối liên kết đó, giúp ta có thể ứng dụng mô hình trong thực tế đời sống xã hộ i hay kinh tế. Trong tiểu luận chúng ta đi nghiên cứu t uổi thọ của phụ nữ kh ác nhau như thế nào trên thế giới thông qua các biến nguyên nhân như GDP, học vấn hay số lượng sinh sản… sau đó đánh giá mô hình thông qua các chỉ số liên k ết, các ch ỉ số v ề sự chính xác và tương quan của các biến n ghiên cứu. Nhóm xin chân thành biết ơn và cảm tạ thầy Hoàng Trọng, đã hết lòng truyền thụ kiến thức và chia sẻ những kinh nghiệm quý báu trong quá trình hướng dẫn lớp MBA-08 môn học phân tích định lượng. Kính chúc thầy nhiều sức khỏe để tiếp tục truyền th ụ sự hiểu biết cho các khóa đàn em mai sau. Bài tập Phân tích định lượng MBA-08 4 MỤC LỤC I. Lý thuyết về hồi quy tuyến tính. 1. Hệ số tương quan đơn. 2. Xây dựng ph ương trình hồi quy tuyến tính. 3. Đánh giá sự phù hợp của mô hình. 4. Kiểm định giả thuyết về độ phù hợp của mô hình và ý nghĩa của h ệ số hồi quy. 5. Hồi quy bội, những vấn đề cần quan tâm khi thực hiện. II. Ứng dụng Hồi quy tuyến tính vào để xây dựng một mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới. 1. Xác định biến nguyên nhân và k ết quả. 2. Xây dựng mô hình hồi quy t uyến tính. 3. Đánh giá sự phù hợp và kiểm định mô hình. 4. Mô hình đa biến, chọn lựa biến nguyên nhân, xây dựng và đánh giá. Kết luận Bài tập Phân tích định lượng MBA-08 5 I.Lý thuyết tổng quát về hồi quy đơn biến. 1. Hệ số tương quan.( correlation coefficient) - Hệ số tương quan r nhằm nói lên sự liên kết chặt chẽ giữa hai biến nào đó. - Hệ số tương quan cho mẫu là ước lượng của hệ số tương quan r để đo lường mối liên kết tuyến chặt chẽ giữa các biến của mẫu. - Hệ số này không có đơn vị. - Hệ số này có giá trị biến thiên từ -1 đến 1. - Khi có giá trị âm hệ hai biến có tương quan nghịch biến. - Khi có giá trị dương hệ hai biến có tương quan đồng biến. - Khi gía trị này bằng khôn g thì hai biến khôn g có liên k ết. - Côn g thức tính toán hệ số tương quan mẫu: Trong đó: r: hệ số tương quan, X : gía trị hệ số nguyên nhân, Y: giá trị hệ số kết quả, X: hệ số trung bình biến nguyên nhân, Y: giá trị trung bình biến kết quả, n : độ lớn mẫu. - Giá trị r giữa hai biến có thể là r ất thấp nhưng chưa hẳn hai biến đó hoàn toàn không có mối liên hệ, có thể nó lại có dạng liên quan khác như liên hệ phi tuyến. - Giá trị r có thể là rất cao có khi gần bằng 1 nhưng thực tế không có sự liên quan nào, người ta gọi là sự tương quan giả, ví dụ như người ta nghiên cứu số lượng trẻ sơ sinh phụ thuộc vào dân số của thành phố HCM có sự tương quan rất cao vào năm 200x nhưng thực tế hai biến này có sự tương quan giả, do khoản thời gian đó k inh tế suy giảm các n ăm gần đó tỷ lệ sinh giảm, nhưng đặc biệt năm đó là năm Nghịch biến Đồng biến Không có mối liên hệ. Bài tập Phân tích định lượng MBA-08 6 may mắn nên các gia đình quyết định sinh con nhiều. Như vậy t a thất ở đây tương quan thật phải là số lượng trẻ sơ sinh và năm tốt. - Như vậy h ệ số tương quan ch ỉ được coi là một chỉ số nói lên sự chặt chẽ giữa các biến. 2.Xây d ựng phương trình hồi quy tuyến tính: Sau khi đã nghiên cứu hệ số tương quan r, ta thấy rằng có thể hai biến có hệ số tương quan chặt chẽ một cách tuyến tính nhưng thực tế thì không có sự liên hệ nào về thực chất, do vậy để xây dựng phương trình hồi quy tuyến tính của các biến với nhau thì xem như ta đã nghiên cứu thấu đáo về sự liên quan giữa chúng trong thực tế, và có xét đến hệ số tương quan cần thiết khá cao. Sau đó ta t iến hành xây dựng mô hình. Lý thuyết thông thường người ta đặt biến Y là biến kết quả và biết X nguyên nhân, X được đặt trên trục hoành và Y đặt trên trục tung. Trong phần nghiên cứu của tiểu luận ta chi đi khảo sát mối liên quan tuyến tính theo đường thẳng đố i với mối liên hệ theo các hình khác như parabol hay hình gấp khúc không được đề cập. Phương trình hồi quy tuyến tính của tổng thể và mẫu có dạng đường thẳng như sau: Yi = 0 + 1Xi + , Yi = B0 + B1Xi +  Trong đó Y là biến kết quả dự đoán thứ i, Xi là biến nguyên nhân thứ i, B0 hệ số tương quan tung độ góc là giá trị của Y khi X bằng không, B1 là hệ số tương quan độ dốc của đường thẳng biểu diễn mô hình hồi quy,  là gía trị khác biệt giữa hồi quy và giá trị thực tế. Ý nghĩa của các hệ số : - B0 nói lên giá trị của biến dự đoán kh i gía trị nguyên nh ân bằng không. - B1 độ dốc của đường hồi quy nhằm nói lên rằng khi giá trị X thay đổi một đơn vị thì giá trị Y sẽ thay đổi X.B1 đơn v ị. -  nói lên sự khác biệt giữa giá trị hồ i quy v à gía trị thực tế, ví dụ một biến kết quả có thể ảnh hưởng bởi rất nhiều biến nguyên nhân nh ưng ta lại chỉ khảo sát một biến n guyên nhân duy nhất, điều này đưa đến sự có giá trị khác biệt này, khi giá trị  càng nhỏ thì sự ảnh hưởng của biến n guyên nhân đó càng lớn và càng có sự chính xác kh i áp dụng mô hình hồi quy. - Ví dụ khi ta khảo sát chiều cao của của đứa trẻ 8 tuổi theo chế độ dinh dưỡng thì ta có gía trị  lớn, thì có nghỉa rằng chiều cao của đứa trẻ phụ thuộc vào dinh dưỡng v à còn phụ thuộc vào các biến khác như chiều cao của cha mẹ, nơi ăn chốn ở hay cách chăm sóc… hay nói cách khác gía trị  nhằm nói đến sự sai lệch do ta ch ưa khảo sát hết tất cả các biến ảnh hưởng đến biến phụ thuộc mà ta đang khảo sát. - Sau khi có được mô hình hồi quy tuyến tính ta có thể t ính gía trị biến phụ thuộc thông qua giá trị biến không phụ thuộc với một giá trị chênh lệch  nào đó mà ta chưa biết, nhưng giá trị đó nhỏ hơn Bài tập Phân tích định lượng MBA-08 7 giá trị sai biệt khi ta chỉ t ính trị trung bình so với giá trị thực tế cần khảo sát. Để hiểu hơn ta có thể đi đến mục sau: Đánh giá sự phù hợp của mô hình hồi quy tuyến tính. 3.Đánh giá sự phù hợp của mô hình: Vấn đề quan trọng tron g các mô hình hồi quy là phải chứng minh được sự phù hợp của mô hình mà ta đang khảo sát, hầu như không có đường thẳng hồi quy nào đều hoàn toàn phù hợp với tập dữ liệu khảo sát và luôn có gía trị sai lệch giữa các trị dự báo từ hồi quy và giá trị thực tế, sự sai lệch này thể hiện qua phần dư . Do vậy người ta phải nghỉ đến một thước đo nào đó để chỉ ra mức độ phù hợp của mô hình. Thông thường thước đo cho mô hình tuyến tính được dùng là hệ số xác định R2. R2 được tính theo công thức: Trong đó SSR được xem như là giá trị sai lệch giữa gía t rị dự đoán theo hồi quy so với giá trị trung bình của tập dữ liệu, nó nói lên ph ần giá trị mà ta có thể ước lượng gần với thực tế hơn khi có phương pháp hồi quy so với khi ta chỉ t ính giá trị t rung bình của tổng thể tập mẫu. Ví dụ khi ta t ính thu nhập theo đầu người của thành phố HCM thì giá trị là 5 triệu đồng/người như vậy khi một gia đình có 3 người đi làm thì ta có thể hiểu là gia đình này thu nhập là 15 triệu đồng. Nhưng ta đã biết lương bổng thì phụ thuộc vào rất nhiều vấn đề như trình độ học thức, năm kinh nghiệm, loại công ty hay sự quan h ệ vớ i cấp trên… như vậy khi ta dùng mô hình hồi quy để tính lương của một người theo trình độ học vấn thì ta có thể tính như sau: Lương = B0 + B1*trình độ = 1 + 2.5*trình độ, khi xét đến một người có học vị đại học anh ta có gía trị trình độ là 3 thì Lương =1+2.5*3=8.5 triệu. Như vậy khoản chênh lệch 3.5 triệu giữa giá trị trung bình và giá trị tính theo hồi là SSR. Giá trị SST được định nghĩa khá đơn giản là giá trị sai lệch giữa giá trị trung bình của tập khảo sát và giá thị thực tế của một giá trị thực tế nào đó. Như vậy từ công thức ta có thể thấy giá trị R2 sẽ nằm trong khoảng từ 0 đến 1 khi R2 càng gần 0 thì mô hình không phù hợp do mô hình hồi quy không có tác dụng làm sai lệch nhỏ đi mà nó cũng giống như tính trung bình mà thôi. Khi R2 càng gần về 1 thì mô hình càng phù hợp do mô hình hồi quy, làm gía trị dự đoán hầu như ch ính xác với gía trị thực tế. Ngoài SST và SSR người ta còn có SSE là giá trị chênh lệch giữa giá trị thực tế và giá trị hồi quy, giá trị này chính là sai số . Bài tập Phân tích định lượng MBA-08 8 Vậy SST = SSE +SSR hay sai lệch tổng = sai lệch ngoài + sai lệch hồi quy. Để hiểu rỏ hơn ta xem hình vẽ sau: 4.Kiểm định giả thuyết về độ phù hợp của mô hình và ý nghĩa của hệ số hồi quy. a. Kiểm định giả thuyết về độ phù hợp của m ô hình hay phân tích ph ương sai: Khi xây dựng xong mô hình hồi quy tuyến tính vấn đề quan trọng ta ph ải đi kiểm định về độ phù hợp mô hình hồi quy đó, do trong khi đánh giá sự phù hợp của mô hình bằng ch ỉ số Rsquare ch ỉ cho ta cái nhìn của tập mẫu nhưng không hẳn tổng thể có giá trị ph ù hợp tương ứng. Từ đó ta đi kiểm định, để k iểm định độ phù hợp của mô hình hồi quy tổng thể ta đặt giả thuyết H0 : Rpop = 0 sau khi t iến hành bài toán kiểm định giả thuyết H0 bị bác bỏ thì đây là bước đầu thành công cho việc kiểm định sự ph ù hợp của mô hình. Đại lượng F được dùng để kiểm định, nếu xác suất F nhỏ thì ta có thể bác bỏ giả định H0, F có công thức sau : 2 1 2 1 ˆ( ) / ( ) /( 1) N i i N i i Y Y p F Y Y N p          b. kiểm định giả thuyết về hệ số hồ i quy của tổng thể: Kiểm định thường được thực hiện chính là độ dốc của mô hình tổng thể, ý nghĩa của v iệc phải đi kiểm định này là do cho dù ta đã có độ dốc của mẫu là B1 khác 0 nhưng ta khôn g thể chắc rằng độ dốc của tổng thể 1 là khác 0. Như vậy cũng tương tự nh ư kiểm định giả thuyết về độ phù hợp của mô hình tổng thể ta đặt giả thuyết H0: 1 = 0 . ta kỳ vọng giả thuyết này sẽ bị bác bỏ thì mô hình có sự liên hệ của ha i biến n guyên nhân và kết quả, hay mô hình hồi quy có quan hệ thật chứ không là quan hệ giả. Đường thẳng hồ i quy Gía trị trung bình Bài tập Phân tích định lượng MBA-08 9 Trị thống kê dùng để kiểm định giả thuyết là : t = B1/SB1 Ta cũng có thể đi k iểm định B0 giống như kiểm định B1 với trị thống kê là: t = B0/SB0 5. Hồi quy bội , những vấn đề cần quan tâm khi thực hiện. Hồi quy bội có quá trình xây dựng giống như hồi quy đơn nhưn g ở đây ta có nhiều biến n guyên nhân và chỉ một biến kết quả. Ví dụ như xét đến sự hao phí nhiên liệu cho một động cơ đốt trong thì có thể có một số biến nguyên nhân là: độ nặng của xe, dung tích cylinder, số cylinder hay t ỉ số nén, khoảng cách từ tử điểm trên đến tử điểm dưới… Mô hình hồi quy bộ i có dạng: Y = 0+1 X1+2X2+…+p Xp+e Y: là biến kết quả, k là các hệ số hồi quy riêng phần, Xk là các biến nguyên nhân, e là sai số. Các ưu điểm của hồi quy bội so với hồ i quy đơn: - Hồi quy bội cho ta đường hồi quy chính xác hơn so với hồi quy đơn kh i ta chọn được các biến nguyên nhân chính xác. - Giúp ta hiểu rõ hơn về vấn đề đang nhiên cứu, do mọi vấn đề hay hiện tượng trong tự nhiên hay trong kinh tế, xã hội đều có nhiều n guyên nhân gây r a chứ không phải ch ỉ một nguyên nhân ảnh hưỡng duy nhất. - Sai số e là nhỏ so với hồi quy đơn, khi các biến được chọn phù h ợp. Nhược đ iểm : - Có quy trình khảo sát và thu thập dữ liệu khó. - Có hiện tượng đa cộng tuyến xảy ra khi n ghiên cứu các biến nguyên nhân. Điều này xảy ra khi các biến nguyên nh ân ảnh hưởng lẫn nhau. - Có mối liên hệ giả giửa biến n guyên nhân và biến kết quả. Xây dựng m ô hình: Bước đầu t iên khi xây dựng mô hình thì ta phải đi xem xét các mối tương quan tuyến tính giửa các biến bằng cách xây dựng ma trận tương quan giữa các biến, từ đó ta có thể đánh giá sự tương quan của các biến nguyên nhân với nhau hay sự tác động đến biến kết quả. Để đánh giá độ phù hợp của mô hình hồi quy tuyến tính bội: ta cũng quan sát hệ số R2, khi ta đưa vào mô hình càng nhiều biến nguyên nhân thì hệ số R2 cang tăng, nhưng thực tế cho thấy khi số biến nguyên nhân tăng thì không hẳn mô hình càng ph ù hợp. Do đó đối với mô hình hồi quy tuyến tính bội người ta xét độ phù hợp của mô hình thông qua giá trị Rsquare adjust. Giá trị Rsquare điều ch ỉnh này không nhất thiết tăng cao gần một khi ta thêm vào mô hình nhiều biến hơn vì nó không phụ thuộc vào độ lệch phóng đại của R2, R2 điều ch ỉnh được tính như sau: Ra 2 =R2-p(1-R2)/(N-p-1) P là biến số độc lập trong phương trình ( trong mô hình hồi quy đơn biến thì p = 1). Kiểm định độ phù hợp của mô hình: Cũng giống như phần hồi quy đơn biến thì ta phải đi kiểm định độ phù h ợp của tổng thể, kiểm định F được sử dụng, ý tưởng của kiểm định này là xem xét tất cả các biến nguyên nhân có liên hệ với biến kết quả hay không thôn g qua kiểm định giả thuyết H0: 0=1 =2=0, và khi giả thuyết H0 bị bác bỏ thì ta kết luận độ phù hợp tron g mô hình giải thích được biến khảo sát. Bài tập Phân tích định lượng MBA-08 10 Xét hệ số beta riêng phần cho mô hình: Hệ số này nói lên sự tác động riêng của một biến nguyên nhân n ào đó vào biến kết quả khi các biến nguyên nhân còn lại không có sự thay đổi, hệ số này còn được k iểm định thông qua mức ý ngh ĩa sig. khi mức ý ngh ĩa càng nhỏ thì ta đánh giá biến nguyên nhân đó có tác động đến mô hình, ngược lại khi giá trị của mức ý n ghĩa lớn hơn 0.05 chẵng hạn thì không có sự tác động lớn của biến n guyên nhân đó đến mô hình. II. Ứng dụng Hồi quy đơn biến tuyến tính vào để xây dựng m ột mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới. 1.Xác đ ịnh biến nguyên nhân và kết quả. Để x ác định biến thì ta dùng SPSS tìm hệ số tương quan r giữa các biến so v ới biến tuổi thọ phụ nữ, trong đó có ba điều kiện cần xem xét: - Các điểm trên đồ thị Scatter phải tương đối tuyến tính theo đường thẳng do ta khảo sát mô hình hôi quy tuyến tính đơn. - Hệ số tương quan càn g gần 1 càng tốt. - Có sự xem xét thực tế là biến n guyên nhân đó có thật sự tương quan ảnh hưởng đến biến kết quả là tuổi thọ phụ nữ. Ta lần lược chạy vẽ đồ thị Scatter và tính hệ số tương quan r giữa tuổi thọ phụ nữ và các biến nguyên nhân, sau đó sẽ chọn biến nào có ảnh hưởng đến t uổi thọ phụ nữ theo ba tiêu ch í nêu trên. - Tuổi thọ phụ nữ theo tỷ lệ dân biết chữ. Ty le d an biet chu(%) 120100806040200 T u o i t h o t ru n g b in h P h u N u 90 80 70 60 50 40 ** Correlati on is s igni ficant at the 0.01 level (2-tailed). T uoåi tho ï TB phuï nöõ T æ leä daân bieát chöõ (%) T uoåi thoï TB phuï nöõ Pearson Correlation 1 .865(**) Sig. (2-tailed) . .000 N 109 107 T æ leä daân bieát chöõ (%) Pearson Correlation .865(**) 1 Sig. (2-tailed) .000 . N 107 107 Bài tập Phân tích định lượng MBA-08 11 - Tuổi thọ phụ nữ theo mật độ dân số: Ma t do dan so ( nguoi/km2) 6000500040003000200010000-1000 Tu o i t h o p h u n u 90 80 70 60 50 40 - Tuổi thọ phụ nữ theo tỷ lệ dân sống ở thành thị: Ty le dan song o thanh thi (%) 120100806040200 T u oi t h o p h u nu 90 80 70 60 50 40 - Tuổi thọ phụ nữ theo tốc độ tăng dân số: Toc do tang dan so 6543210-1 T u o i th o p h u n u 90 80 70 60 50 40 ** Correlati on is s igni ficant at the 0.01 level (2-tailed). - Tuổi thọ của phụ nữ theo GDP tính trên đầu người: GDP tinh theo dau nguoi (USD) 3 000020 00010 0000- 10000 T u o i t h o p h u n u 90 80 70 60 50 40 ** Correlati on is s igni ficant at the 0.01 level (2-tailed). T uoåi thoï T B phuï nöõ Maät ñoä daân soá (ngöôøi/km 2) T uoåi thoï TB phuï nöõ Pearson Correlation 1 .128 Sig. (2-tai led) . .186 N 109 109 Maät ñoä daân s oá (ngöôøi/km2) Pearson Correlation .128 1 Sig. (2-tai led) .186 . N 109 109 Tuoåi thoï T B phuï nöõ T æ leä daân soáng ôû vuøng ñoâ thò (%) T uoåi thoï T B phuï nöõ Pearson Correlation 1 .743(**) Sig. (2-tailed) . .000 N 109 108 T æ leä daân soáng ôû vuøng ñoâ thò (%) Pearson Correlation .743(** ) 1 Sig. (2-tailed) .000 . N 108 108 T uoåi tho ï TB phuï nöõ T oác ñoä taêng daân soá (%/naêm) Tuoåi tho ï TB phuï nöõ Pearson Correlation 1 -.579(** ) Sig. (2-tai led) . .000 N 109 109 Toác ñoä taêng daân soá (%/naêm) Pearson Correlation -.579(**) 1 Sig. (2-tai led) .000 . N 109 109 T uoåi tho ï TB phuï nöõ GDP tính treân ñaàu ngöôøi (USD) T uoåi thoï TB phuï nöõ Pearson Correlation 1 .642(** ) Sig. (2-tai led) . .000 N 109 109 GDP tính treân ñaàu ngöôøi (USD) Pearson Correlation .642(** ) 1 Sig. (2-tai led) .000 . N 109 109 Bài tập Phân tích định lượng MBA-08 12 - Tuổi thọ phụ nữ theo tôn giáo: Ton giao 76543210 T uo i t h o p hu n u 9 0 8 0 7 0 6 0 5 0 4 0 ** Correlati on is s igni ficant at the 0.01 level (2-tailed). - Tuổi thọ phụ nữ theo calogi nạp vào hằng n gày theo từng n gười: Calogi nap vao h ang ngay 40003000200010 00 T u o i t h o p h u n u 90 80 70 60 50 40 - Tuổi thọ phụ nữ tính theo số con trung bình : So con trung binh cua phu nu 987654321 T u o i th o p h u n u 90 80 70 60 50 40 ** Correlati on is s igni ficant at the 0.01 level (2-tailed). - Tuổi thọ phụ nữ theo tỷ lệ biết chữ của phụ nữ: T y le phu nu biet chu( %) 120100806 040200 T u o i t h o p h u n u 90 80 70 60 50 40 ** Correlati on is s igni ficant at the 0.01 level (2-tailed). T uoåi tho ï TB phuï nöõ Region or ec onomic group Tuoåi tho ï TB phuï nöõ Pearson Correla tion 1 -.321(** ) Sig. (2-tai led) . .001 N 109 109 Region or economic group Pearson Correla tion -.321(**) 1 Sig. (2-tai led) .001 . N 109 109 T uoåi thoï TB phuï nöõ Calori na ïp haøng ngaøy TB 1 ngöôøi T uoåi thoï T B phuï nöõ Pearson Correlati on 1 .775(** ) Sig. (2-tai led) . .000 N 109 75 Calori naïp haøng ngaøy TB 1 ngöôøi Pearson Correlati on .775(** ) 1 Sig. (2-tai led) .000 . N 75 75 Tuoåi thoï T B phuï nöõ Soá con TB cuûa 1 phuï nöõ Tuoåi thoï T B phuï nöõ Pearson Correlation 1 -.838(**) Sig. (2-tai led) . .000 N 109 107 Soá c on T B cuûa 1 phuï nöõ Pearson Correlation -.838(**) 1 Sig. (2-tai led) .000 . N 107 107 T uoåi thoï T B phuï nöõ Tæ leä nöõ giôùi bieát chöõ (%) T uoåi thoï TB phuï nöõ Pearson Correlation 1 .819(**) Sig. (2-tai led) . .000 N 109 85 T æ leä nöõ giôùi bieát c höõ (%) Pearson Correlation .819(**) 1 Sig. (2-tai led) .000 . N 85 85 Bài tập Phân tích định lượng MBA-08 13 - Tuổi thọ phụ nữ tính theo khí hậu: Kh i hau chinh 1086420 T u o i th o p h u n u 90 80 70 60 50 40 ** Correlati on is s igni ficant at the 0.01 level (2-tailed). Sau khi dùng SPSS để vẽ đồ thị điểm và tính hệ số tương quan r ta thấy có các biến sau có thể dùng làm biến nguyên nhân là: - Tỷ lệ dân biết chữ có r = 0.865 và đồ thị các điểm tuyến tính theo đường thẳng. - Tỷ lệ dân sống ở thành thị có r = 0.743 và đồ thị các điểm tuyến tính theo đường thẳng. - Theo lượng calogi nạp vào hằng n gày cho từng n gười r = 0.775 và đồ thị các điểm tuyến tính theo đường thẳng. - Số con trung bình r = -0.838 và đồ thị các điểm tuyến tính theo đường thẳng nghịch biến. - Tỷ lệ biết chữ của phụ nữ r = 0.819 và đồ thị các điểm tuyến tính theo đường thẳng. Theo các tiêu chí nói trên ta chọn một biến làm biến nguyên nhân. Ta chọn tỷ lệ phụ nữ biết chữ do nếu chọn theo tỷ lệ dân biết chữ nó có hệ số tương quan tốt nhất nhưng khi xét đến biết chữ thì lại có tính cả đàn ông và trẻ con. 2. Xây d ựng mô hình hồi quy tuyến tính. Dùng SPSS chạy hồi quy cho biến nguyên nhân là tỷ lệ ph ụ nữ biết chữ và biến kết quả là tuổi thọ phụ nữ ta có các bảng sau: Variables Entered/Removed(b) Model Variables Entered Variables Removed Method 1 T æ leä nöõ giôùi bieát chöõ (%)(a) . Enter a Al l requested variables entered. b Dependent Variable: Tuoåi thoï T B phuï nöõ Model Summary Model R R S quare Adjusted R Square Std. Error of the Esti mate 1 .819(a) .670 .666 6.195 a Predictors : (Constant), T æ leä nöõ giôùi bieát chöõ (%) ANOVA(b) T uoåi thoï TB phuï nöõ Khí haäu chính T uoåi thoï T B phuï nöõ Pearson Correlation 1 .337(** ) Sig. (2-tai led) . .000 N 109 107 Khí haäu chính Pearson Correlation .337(** ) 1 Sig. (2-tai led) .000 . N 107 107 Bài tập Phân tích định lượng MBA-08 14 Model Sum of Squares df Mean Square F Sig. 1 Regressio n 6475.177 1 6475.177 168.698 .000(a) Residual 3185.811 83 38.383 T otal 9660.988 84 a Predictors : (Constant), T æ leä nöõ giôùi bieát chöõ (%) b Dependent Variable: Tuoåi thoï T B phuï nöõ Coefficients(a) Model Unstandardi zed Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) 47.170 1.726 27.337 .000 T æ leä nöõ giôùi bieát c höõ (%) .307 .024 .819 12.988 .000 a Dependent Variable: Tuoåi thoï T B phuï nöõ Từ bảng kết quả ta có phương trình hồi quy với các hệ số B cho ở bản cuối cùng Coeficients: ˆ 47.17 0.307i iY X  hay 47.17 0.307i iY X    3. Đánh giá sự phù hợp và kiểm định mô hình a. Đánh giá sự phù hợp của m ô hình: Như đã thể hiện trong phần I thông qua giá t rị Rsquare ta có thể đánh giá độ ph ù hợp của mô hình giá trị Rsquare được SP SS tính trong bảng sau: Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 .819(a) .670 .666 6.195 a Predictors: (Constant), Tæ leä nöõ giôùi bieát chöõ (%) Rsquare =0.67 có giá trị tương đố i lớn hơn trung bình nhưng không quá gần 1 điều này cho thấy m ô hình có sự phù hợp tương đố i và có nghĩa là các điểm trên đồ thị scatter khá rời rạc và không trùng nhiều trên đường hồi quy. Điều này cho ta kết luận rằng tuổ i thọ phụ nữ không chỉ phụ thuộc vào việc biết chữ m à còn phụ thuộc vào các vấn đề khác như số con sinh, lượng calogi nạp vào hay GDP tính trên đầu người…Như vậy để có thể có mô hình tốt hơn ta phải tìm hiểu và phân tích tuổi thọ phụ nữ qua mô hình hồi quy đa biến. Rsquare Bài tập Phân tích định lượng MBA-08 15 T y le phu nu biet chu( %) 120100806 040200 T u o i t h o p h u n u 90 80 70 60 50 40 b. Đánh giá sự phù hợp của m ô hình cho tổng thể: Như đã nêu trong phần lý thuyết tuy ta đã có giá trị Rsquar gần 1 và có kết luận là mô hình phù hợp nhưng đó chỉ là đánh giá trên mẫu, nhưng không ch ắc tổng thể có được Rsquare gần 1. Để xác định vấn đề này ta đi kiểm định giả thuyết Ho: Rsquare pop =0, nếu k ết quả kiểm định bác bỏ giả thuyết Ho thì ta có thể kết luận là mô hình hồi quy tổng thể phù hợp. SPSS cho ta kết quả kiểm định ch ỉ số F trong bản sau: ANOVA(b) Model Sum of Squares df Mean Square F Sig. 1 Regressio n 6475.177 1 6475.177 168.698 .000(a) Residual 3185.811 83 38.383 T otal 9660.988 84 a Predictors : (Constant), T æ leä nöõ giôùi bieát chöõ (%) b Dependent Variable: Tuoåi thoï T B phuï nöõ Theo kết quả với mức ý nghĩa quan sát rất nhỏ 0.0001 nên ta có thể hòan toàn bác bỏ giả thuyết Ho hay ta có thể nói mô hình hồi quy t uyến tính của tổng thể có sự phù hợp. c.kiểm định giả thuyết về hệ số hồi quy của tổng thể: Như đã đề cập ở phần lý thuyết tuy ta có các giá trị hệ số của mô hình hồi quy của mô hình mẫu là B1 là khác không nhưng ta không chắc là độ dốc của mô hình tổng thể cũng khác không, do đó ta phải tiến hành kiểm định độ dốc tổng thể qua sự bác bỏ giả thuyết Ho: 1 = 0. Dùng SPSS chạy kiểm định cho ta giá trị t như sau: Coefficients(a) Các đường thẳng phân bố khá rời rạc chứ không trùng nhiều vào đường thẳng hồi quy. Giá trị F và mức ý nghĩa quan sát được Sig Bài tập Phân tích định lượng MBA-08 16 Model Unstandardi zed Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) 47.170 1.726 27.337 .000 T æ leä nöõ giôùi bieát c höõ (%) .307 .024 .819 12.988 .000 a Dependent Variable: Tuoåi thoï T B phuï nöõ Theo kết quả với mức ý nghĩa quan sát rất nhỏ 0.0001 nên ta có thể hòan toàn bác bỏ giả thuyết Ho hay ta có thể nói mô hình hồi quy t uyến tính của tổng thể có độ dốc 1 khác không. 4. Mô hình đa biến, chọn lựa biến nguyên nhân, xây dựng và đánh giá. Chọ lựa biến nguyên nhân: Sau khi dùng SPSS chạy lần lượt nhiều biến nguyên nhân thì nhận thấy có các biến phù hợp nhất để cho ra mô hình hồi quy bội với biến k ết quả là tuổ i thọ phụ nữ. đó là các biến n guyên nhân sau: - Tỷ lệ phần trăm dân số biết chử. - Số lượng lần sinh con. - Lượng clogi nạp vào. Lập ma trận tương quan giữa các biến trên với b iến kết quả tuổ i thọ phụ nữ bằng SPSS: Correlations T uoåi thoï T B phuï nöõ T æ leä daân bieát chöõ (%) Soá c on T B cuûa 1 phuï nöõ Calori naïp haøng ngaøy TB 1 ngöôøi Tuoåi thoï T B phuï nöõ Pearson Correlation 1 .865(**) -.838(**) .775(**) Sig. (2-tai led) . .000 .000 .000 N 109 107 107 75 Tæ leä daân bieát chöõ (%) Pearson Correlation .865(**) 1 -.866(**) .682(**) Sig. (2-tai led) .000 . .000 .000 N 107 107 105 74 Soá c on T B cuûa 1 phuï nöõ Pearson Correlation -.838(**) -.866(**) 1 -.696(**) Sig. (2-tai led) .000 .000 . .000 N 107 105 107 75 Calori naïp haøng ngaøy T B 1 ngöôøi Pearson Correlation .775(**) .682(**) -.696(**) 1 Sig. (2-tai led) .000 .000 .000 . N 75 74 75 75 ** Correlati on is s igni ficant at the 0.01 level (2-tailed). Ta thấy các hệ số tương quan R là khá cao so với các biến nguyên nhân với biến kết quả, đây là tính hiệu lạc quan cho v iệc đi phân tích hồi quy bội theo ba biến nguyên nhân trên. Đồn g thời cũng có sự tương quang lớn giữa các biến nguyên nhân với nhau, điều này rất dể xãy là hiện tượng đa cộng tuyến nhưng không là chắc chắn, do đó ta tiếp tục khảo sát ở phần xây dựng mô hình và kiểm định mô hình. Xây dựng mô hình hồi quy bội: Sử dụng SP SS chạy hồi quy bội t uyến tính ta có bảng kết quả sau: Variables Entered/Removed(b) Giá trị t và mức ý nghĩa quan sát được. Các giá trị R tương quang giữa biến nguyên nhân và biến kết quả khá lớn Bài tập Phân tích định lượng MBA-08 17 Model Variables Entered Variables Removed Method 1 Calori naïp haøng ngaøy T B 1 ngöôøi, T æ leä daân bieát chöõ (%), Soá c on T B cuûa 1 phuï nöõ(a) . Enter a Al l requested variables entered. b Dependent Variable: Tuoåi thoï T B phuï nöõ Model Summary Model R R S quare Adjusted R Square Std. Error of the Esti mate 1 .912(a) .832 .825 4.789 a Predictors : (Constant), Calori na ïp haøng ngaøy TB 1 ngöôøi , Tæ leä daân bieát chöõ (%), Soá c on T B cuûa 1 phuï nöõ ANOVA(b) Model Sum of Squares df Mean Square F Sig. 1 Regressio n 7962.254 3 2654.085 115.740 .000(a) Residual 1605.205 70 22.932 T otal 9567.459 73 a Predictors : (Constant), Calori na ïp haøng ngaøy TB 1 ngöôøi , Tæ leä daân bieát chöõ (%), Soá c on T B cuûa 1 phuï nöõ b Dependent Variable: Tuoåi thoï T B phuï nöõ Coefficients(a) Model Unstandardi zed Coefficients Standardized Coefficients t Sig. B Std. E rror Beta 1 (Constant) 40.498 6.700 6.044 .000 T æ leä daân bieát chöõ (%) .227 .049 .458 4.599 .000 Soá c on T B cuûa 1 phuï nöõ -1.430 .594 -.243 -2.407 .019 Calori naïp haøng ngaøy TB 1 ngöôøi .006 .001 .296 4.244 .000 a Dependent Variable: Tuoåi thoï T B phuï nöõ Theo kết quả ta xây dựng được mô hình hồi quy bội theo các biến n guyên nhân đó như sau: Y = 40.498 + 0.227X1 – 1.430 X2 + 0.006X3 + e Kiểm tra độ phù hợp của m ô hình: Model R R S quare Adjusted R Square Std. Error of the Esti mate 1 .912(a) .832 .825 4.789 Ta thấy mô hình có độ phù hợp cao do Rsquare điều chỉnh cao 0.825 Kiểm định F cho m ô hình, Bác bỏ giả thuyết H0: 0=1=2 =3=0, nếu giả thuyết H0 bị bác bỏ lúc này ta sẽ kết luận rằng có sự phù hợp của mô hình cho tổng thể giửa các biến nguyên nhân và biến k ết quả. Bài tập Phân tích định lượng MBA-08 18 Model Sum of Squares df Mean Square F Sig. 1 Regressio n 7962.254 3 2654.085 115.740 .000(a) Residual 1605.205 70 22.932 T otal 9567.459 73 Kiểm tra hệ số  riêng phần: Ta thấy từ kết quả chạy SPSS thì các hệ số riêng ph ân có mức ý nhĩa đều r ất nhỏ và có hệ số  tác động riêng phần đến biến kết quả đều lớn việc này cho thấy các biến nguyên nhân đã chọn đều có ý nghĩa trong mô hình. Model Unstandardi zed Coefficients Standardized Coefficients t Sig. B Std. E rror Beta 1 (Constant) 40.498 6.700 6.044 .000 T æ leä daân bieát chöõ (%) .227 .049 .458 4.599 .000 Soá c on T B cuûa 1 phuï nöõ -1.430 .594 -.243 -2.407 .019 Calori naïp haøng ngaøy TB 1 ngöôøi .006 .001 .296 4.244 .000 Kết luận: Phương pháp xây dựng mô hình hồi quy tuyến tính đơn biến và đa biến cho cái nhìn khái quát về sự liên hệ giữa các biến nguyên nhân và kết quả, nhưng trong thực tế xã hội, khoa học hay kinh tế một vấn đề nào đó ít khi chỉ ch ịu một ảnh hưởng duy nhất mà thông thường nó bị ảnh hưởng bởi rất nhiều tác nhân bên ngòai, đó là mối liên hệ chằng chéo, đôi khi các tác nhân cho một vấn đề nào đó lại có sự liên hệ, chúng tương tác nhau giữa các biến nguyên nhân làm cho sự liên kết trở nên phức tạp không lường. Do vậy mô hình hồi quy t uyến tính đơn biến có tính chất học thuật nhằm tạo cho người nghiên cứu một cái nhìn phổ quát về phương pháp hồ i quy sau đó t iếp tục n ghiên cứu các mô hình phức tạp hơn, như mô hình đa biến. Mô đa biến có tính thực tế hơn, gần gũi với tự nhiên hơn. Do vậy nghiên cứu mô hình đa biến là cần thiết, nhưng không được nghiên cứu sâu sắc trong tiểu luận này do đây là bước đầ u làm quen với các cách sử dụng SPSS trong định lượng nói chung. Giả thuyết H0 bị bác bỏ do mức ý nghĩa cua kiểm định F rất nhỏ. Mức ý n ghĩa cho kiểm định là rất nhỏ Các hệ số beta riêng phần lớn.

Các file đính kèm theo tài liệu này:

  • pdfgiai_thich_mo_hinh_8434.pdf
Luận văn liên quan