Với ∆ biểu thị thay ñổi (nhỏ). Nếu ∆ ñủ nhỏ, ta có thể thay thế
/ Y X ∆ ∆ bởi dạng ñạo hàm, dY/dX. Bây giờ ñối với mô hình tuyến
tính (3.6), ước lượng của hệsố ñộdốc ñược tính bởi hệsố ước lượng
2
β , trong hàm cầu cà phê là -0,4795. Như(3.7) biểu thị, ñểtính ñộ
co giãn, ta phải nhân hệsố ñộdốc này với tỷlệ(X/Y), tức là giá cả
chia cho sốlượng. Nhưng ta chọn giá trịnào của X và Y? NhưBảng
3.2 biểu thị, có 11 cặp giá trịgiá cả(X) và sốlượng (Y). Nếu ta sử
dụng tất cảcác giá trịnày, ta sẽcó 11 ước lượng của ñộco giãn giá
cả.
Tuy nhiên trên thực tế, hệsốco giãn ñược tính bằng giá trịtrung bình
hay bình quân của Yvà X. Tức là, ta có một ước lượng vềhệsốco
giãn trung bình.
13 trang |
Chia sẻ: aquilety | Lượt xem: 3072 | Lượt tải: 4
Bạn đang xem nội dung tài liệu Luận văn Tóm tắt Mở rộng mô hình hồi quy tuyến tính hai biến, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
HUỲNH NGỌC TUẤN
MỞ RỘNG MÔ HÌNH HỒI QUY
TUYẾN TÍNH HAI BIẾN
Chuyên ngành : PHƯƠNG PHÁP TOÁN SƠ CẤP
Mã số: 60.46.40
TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC
Đà Nẵng - Năm 2012
2
Công trình ñược hoàn thành tại
ĐẠI HỌC ĐÀ NẴNG
Người hướng dẫn khoa học: TS. CAO VĂN NUÔI
Phản biện 1: TS. NGUYỄN DUY THÁI SƠN
Phản biện 2: GS.TS. LÊ VĂN THUYẾT
Luận văn ñược bảo vệ tại Hội ñồng chấm luận văn tốt nghiệp
Thạc sĩ khoa học họp tại Đại học Đà Nẵng vào ngày 02
tháng 02 năm 2012.
* Có thể tìm hiểu luận văn tại:
- Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng
- Thư viện trường Đại học Sư phạm, Đại học Đà Nẵng
3
MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Việc xác ñịnh một cách ñịnh lượng trong kinh tế ñược khảo sát khá
kỹ trong bộ môn kinh tế lượng. Bộ môn này, ra ñời vào những năm
1930 của thế kỷ XX, cho ñến nay môn khoa học này ñã ñem lại cho
các nhà kinh tế một công cụ sắc bén, nhất là trong ước lượng, kiểm
ñịnh các quan hệ kinh tế, dự báo các thay ñổi kinh tế vĩ mô quan
trọng như lãi suất, tỉ lệ lạm phát, GDP…các mô hình kinh tế như:
Hồi quy tuyến tính, mô hình log tuyến tính, mô hình nửa log
(semilog),....
Hiện nay giáo trình và tài liệu trình bày một cách có hệ thống kiến
thức về mở rộng mô hình hồi quy tuyến tính tổng quát trong kinh tế
lượng bằng ngôn ngữ toán học vẫn còn hạn chế. Vì vậy, tôi chọn ñề
tài “MỞ RỘNG MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI
BIẾN” ñể làm luận văn tốt nghiệp của mình.
2. MỤC ĐÍCH NGHIÊN CỨU
Tác giả rất hi vọng ñây sẽ là tài liệu tham khảo bổ ích về mở rộng
mô hình hồi quy tuyến tính hai biến và áp dụng của nó trong thực tế.
3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
3.1. Đối tượng: Áp dụng mô hình hồi quy trong kinh tế lượng.
3.2. Phạm vi nghiên cứu: Mô hình hồi quy tuyến tính hai biến và
mở rộng mô hình hồi quy tuyến tính hai biến.
4. PHƯƠNG PHÁP NGHIÊN CỨU
Tham khảo, phân tích, tổng hợp, hệ thống các tài liệu chuyên khảo
và các bài báo trên internet khác nhau có liên quan ñến hồi quy tuyến
tính và ứng dụng trong một số vấn ñề kinh tế. Từ ñó trình bày một
4
cách có hệ thống với các ví dụ minh họa ñầy ñủ cho phần lý thuyết
ñã trình bày.
5. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI
5.1. Ý nghĩa khoa học: Hệ thống kiến thức về “mở rộng mô hình hồi
quy tuyến tính hai biến” và ứng dụng vào giải một số bài toán kinh tế
lượng dựa trên số liệu thực tế.
5.2. Ý nghĩa thực tiễn: Đề tài hoàn thành trở thành tài liệu tham
khảo cho giáo viên, sinh viên ở các trường ñại học và cao ñẳng, các
bạn yêu toán và các ứng dụng của toán trong kinh tế, ñặc biệt là kinh
tế lượng.
6. CẤU TRÚC LUẬN VĂN
Luận văn gồm 3 chương:
CHƯƠNG 1. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN
Định nghĩa mô hình hồi quy tuyến tính cơ bản và các tích chất liên
quan.
CHƯƠNG 2. CÁC MỞ RỘNG CỦA HỒI QUY TUYẾN TÍNH
HAI BIẾN
Trình bày sự mở rộng về hồi quy tuyến tính hai biến.
CHƯƠNG 3. MỘT SỐ ÁP DỤNG CỦA CÁC MÔ HÌNH MỞ
RỘNG TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN
Trình bày một số áp dụng của mô hình hồi quy tuyến tính hai biến
mở rộng.
5
CHƯƠNG 1. MÔ HÌNH HỒI QUY TUYẾN TÍNH
CỔ ĐIỂN
1.1. KHÁI NIỆM HÀM HỒI QUY ĐÁM ĐÔNG
Giả thiết rằng một cụm dân cư có 60 hộ dân. Giả sử rằng chúng ta
chỉ quan tâm ñến việc nghiên cứu mối quan hệ giữa ñại lượng Y tiêu
dùng hàng tuần và ñại lượng X khả năng thu nhập khả dụng của mỗi
gia ñình.
Giả sử chúng ta chia 60 gia ñình này thành 10 nhóm có thu nhập xấp
xỉ nhau và ñánh giá thu chi của các gia ñình này trong từng nhóm thu
nhập. Số liệu ñược cho bởi bảng sau:
Bảng 1.1. Số liệu thu nhập của 60 gia ñình
X →
Y ↓ 80 100 120 140 160 180 200 220 240 260
55 65 79 102 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 135 145 157 175 180
- 88 -- 113 125 140 - 160 189 185
Chi tiêu
tiêu
dùng
gia ñình
hàng
tuần Y,
$ - - - 115 - - - 162 - 191
Tổng
cộng
325 462 445 707 678 750 685 1043 966 1211
Bảng 1.1, các giá trị trung bình của Y tăng khi X tăng. Nếu chúng
ta tập trung vào các ñiểm có kích thước lớn ñể thể hiện các giá trị
trung bình của Y thì các trung bình có ñiều kiện này nằm trên một
ñường thẳng với một ñộ dốc dương. Đường thẳng này ñược gọi là
ñường hồi quy tổng thể.
6
Từ bảng trên ta tính ñược:
Bảng 1.2. Các thông số về xác suất và trung bình
X →
( )| ip Y X ↓
80 100 120 140 160 180 200 220 240 260
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
- 1/6 - 1/7 1/6 1/6 - 1/7 1/6 1/7
Xác suất có
ñiều kiện
( )| ip Y X
- - - 1/7 - - - 1/7 - 1/7
Trung bình
có ñiều kiện
của Y
65 77 89 101 113 125 137 149 161 173
Bảng 1.2 ñược thể hiện qua các hình sau:
Hình 1.1. Phân phối có ñiều kiện của chi tiêu ñối với
mức ñộ thu nhập khác nhau của Bảng 1.1
7
Hình 1.2. Đường hồi quy tổng thể của Bảng 1.2
Từ hình 1.1 và 1.2, ta nhận thấy rằng mỗi trung bình có ñiều kiện
E(Y|Xi) là một hàm của iX . Kí hiệu:
( ) ( )| , 1,i iE Y X f X i n= = (1.1)
trong ñó, ( )if X là hàm của biến giải thích iX , phương trình (1.1)
ñược gọi là hàm hồi quy tổng thể hai biến (Population Regression
Function - PRF) hay ngắn gọn hơn là hồi quy tổng thể (Population
Regression - PR). Theo Keynes, hàm tiêu dùng Y theo thu nhập X
như sau:
( ) 1 2| i iE Y X Xβ β= + (1.2)
trong ñó, 1 2,β β gọi là hệ số hồi quy.
Phương trình (1.2) ñược gọi là hàm hồi quy tổng thể tuyến tính.
1.2. Ý NGHĨA CỦA THUẬT NGỮ “TUYẾN TÍNH”
1.2.1. Sự tuyến tính theo các biến số
Đó là kỳ vọng có ñiều kiện của Y là một hàm tuyến tính của iX .
Về mặt hình học, ñường cong tuyến tính trong trường hợp này là
ñường thẳng.
8
1.2.2. Sự tuyến tính theo các tham số
Đó là kỳ vọng có ñiều kiện của Y, ( )| iE Y X là một hàm tuyến
tính theo các tham số β của nó. Theo các hiểu này thì nó có thể
tuyến tính hoặc không tuyến tính theo biến X.
1.3. SAI SỐ NGẪU NHIÊN
Từ hình 1.1, nhận thấy rằng với một mức thu nhập iX , mức chi
tiêu của một hộ gia ñình có thể nằm xung quanh giá trị trung bình của
các hộ gia ñình có thu nhập iX . Điều này ta có thể diễn tả ñộ lệch của
iY xung quanh giá trị kỳ vọng của nó:
( )|i i iY E T X u= + (1.3)
trong ñó, ñộ lệch iu là biến số ngẫu nhiên không thể quan sát.
Về thuật ngữ chuyên môn, ta gọi iu là số hạng nhiễu ngẫu nhiên hay
số hạng sai số ngẫu nhiên. Công thức (1.3) có thể cho chúng ta biết
rằng chi tiêu của một gia ñình khi biết mức thu nhập của họ:
(1) ( )| iE T X chi tiêu trung bình của tất cả các gia ñình có cùng thu
nhập (yếu tố này tất yếu).
(2) iu yếu tố ngẫu nhiên hay không hệ thống.
1.4. HÀM HỒI QUY MẪU
Chúng ta cần phải tính PRF trên cơ sở thông tin mẫu. Giả thiết
rằng ta không có thông tin gì về Bảng 1.1 và ta chỉ có thông tin ngẫu
nhiên tương ứng các giá trị Y với X (ñược cho ở bảng sau).
Bảng 1.3. Mẫu ngẫu nhiên từ tổng thể bảng 1.1 (1)
Y X Y X
70 80 115 180
65 100 120 200
90 120 140 220
95 140 155 140
110 160 150 260
9
Từ Bảng 1.3 ta có thể dự ñoán ñược chi tiêu trung bình hàng tuần Y
trong tổng thể tương ứng X ñược chọn không? Hay ta có thể tính
ñược PRF từ bảng dữ liệu mẫu hay không? Việc tính này cũng ñặt ra
nghi vấn không tính chính xác ñược PRF bởi vì có sự dao ñộng trong
việc lấy mẫu. Giả sử ta lấy ngẫu nhiên một mẫu ngẫu nhiên khác từ
bảng 1.1.
Bảng 1.4. Mẫu ngẫu nhiên từ tổng thể bảng 1.1 (2)
Y X Y X
55 80 120 180
88 100 145 200
90 120 125 220
80 140 145 240
118 160 175 260
Từ bảng 1.3 và 1.4, chúng ta ñược ñồ thị phân tán như sau:
Hình 1.3. Đường hồi quy mẫu của 2 mẫu bảng 1.3 và 1.4
Biểu thức tương ứng với (1.2) có thể ñược viết lại:
1 2
ˆ ˆˆ
i iY Xβ β= + (1.8)
10
Tóm lại, mục tiêu chính của ta trong phân tích hồi quy là tính PRF
1 2i i iY X uβ β= + + (1.4)
Trên cơ sở của SRF
1 2
ˆ ˆˆ
ˆi i iY X uβ β= + + (1.9)
1.5. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN
1.5.1. Ước lượng các hệ số của mô hình hồi quy bằng phương
pháp bình phương tối thiểu thông thường OLS (Ordinary Least
Square)
1.5.1.1. Các giả ñịnh của mô hình hồi quy tuyến tính cổ ñiển
1.5.1.2. Phương pháp bình phương tối thiểu thông thường
Từ hàm hồi quy (1.9): 1 2ˆ ˆi i iu Y Xβ β= − −
vậy ( )22 1 2
1 1
ˆ ˆ
n n
i i i
i i
u Y Xβ β
= =
= − −∑ ∑ (1.10)
Điều kiện ñể (1.10) ñạt cực trị là:
XˆYˆ 21 β−=β (1.15)
1
2
2
1
ˆ
n
i i
i
n
i
i
y x
x
β =
=
=
∑
∑
(1.17)
với XXx ii −= và YYy ii −= .
1.5.1.3. Tính chất của hàm hồi quy mẫu theo OLS
Tính chất của ước lượng tham số:
(1) 1ˆβ và 2ˆβ là duy nhất ứng với một mẫu xác ñịnh gồm n quan sát
(Xi,Yi).
(2) 1ˆβ và 2ˆβ là các ước lượng ñiểm của β1 và β2. Giá trị của 1ˆβ và
2
ˆβ thay ñổi theo mẫu dùng ñể ước lượng.
11
Tính chất của hàm hồi quy mẫu:
(1) Hàm hồi quy mẫu ñi qua giá trị trung bình của dữ liệu.
(2) Giá trị trung bình của ước lượng bằng giá trị trung bình của quan
sát ñối với biến phụ thuộc
^
E Y Y =
.
(3) Giá trị trung bình của phần dư bằng 0: ( ) 0iE u = .
(4) Các phần dư iu và iY không tương quan với nhau:
1
0
n
i i
i
u Y
=
=∑ .
(5) Các phần dư iu và iX không tương quan với nhau:
1
0
n
i i
i
u X
=
=∑ .
1.5.1.4. Phân phối của 1ˆβ và 2ˆβ
1
ˆβ 2ˆβ
Kỳ vọng ( ) 11ˆE β=β ( ) 22ˆE β=β
Phương
sai
( ) 2
n
1i
2
i
n
1i
2
i
1
xn
X
ˆvar σ=β
∑
∑
=
=
( )
∑
=
σ
=β
n
1i
2
i
2
2
x
ˆvar
Sai số
chuẩn
σ=σ
∑
∑
=
=
β n
1i
2
i
n
1i
2
i
ˆ
xn
X
1
∑
=
β
σ
=σ
n
1i
2
i
ˆ
x
2
Phân
phối
σββ
∑
∑
=
= 2
n
1i
2
i
n
1i
2
i
11
xn
X
,N~ˆ
σββ
∑
=
n
1i
2
i
2
22
x
,N~ˆ
1.5.2. Khoản tin cậy và kiểm ñịnh giả thiết các hệ số hồi quy
1.5.2.1. Khoản tin cậy của các hệ số hồi quy
Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa α như sau:
12
)ˆ(setˆ)ˆ(setˆ 1)2/1,2n(111)2/1,2n(1 β+β≤β≤β−β α−−α−− (1.24)
)ˆ(setˆ)ˆ(setˆ 2)2/1,2n(222)2/1,2n(2 β+β≤β≤β−β α−−α−− (1.25)
1.5.2.2. Kiểm ñịnh giả thiết về hệ số hồi quy
Giả thiết:
*
21
*
20
2
2
:H
:H
β≠β
β=β
mệnh ñề xác suất: α−=
≤β
β−β
≤ α−−α− 1t)ˆ(se
ˆ
tP )2/1,2n(
2
22
)2/,2n(
ñiều kiện quyết ñịnh:
(1)Nếu )2/,2n(
2
*
22 t
)ˆ(se
ˆ
α−<β
β−β
hoặc )2/1,2n(
2
*
22 t
)ˆ(se
ˆ
α−−>β
β−β
thì bác bỏ 0H .
(1) Nếu )2/1,2n(
2
*
22
)2/,2n( t)ˆ(se
ˆ
t α−−α− ≤β
β−β
≤ thì ta không thể bác bỏ 0H
1.5.3. Độ thích hợp của hàm hồi quy - 2R
1.5.3.1 Hệ số xác ñịnh 2R
2
Y,Xn
1i
2
i
n
1i
2
i
2
n
1i
ii
2 r
yx
yx
R =
=
∑∑
∑
==
=
(1.35)
1.5.3.2 Ý nghĩa của hệ số xác ñịnh 2R
(1) Đo tỷ lệ hay số phần trăm của toàn bộ sai lệch của Y với giá trị
trung bình của chúng ñược giải thích bằng mô hình.
(2) Hệ số 2R ñược sử dụng ñể ño mức ñộ phù hợp của hàm hồi quy.
1.5.3.3 Tính chất của hệ số xác ñịnh 2R
(1) 20 1R≤ ≤ . Với 2 0R = thể hiện X và Y ñộc lập thống kê. 2 1R =
thể hiện X và Y phụ thuộc tuyến tính hoàn hảo.
13
Nếu 2 1R → thì mô hình hồi quy càng thích hợp.
Nếu 2 0R → thì mô hình hồi quy ít thích hợp.
(2) 2R không xét ñến quan hệ nhân quả.
1.5.4. Dự báo bằng mô hình hồi quy hai biến
Khoảng tin cậy cho dự báo: )Yˆ(setYˆ o)2/1,2n(o α−−±
Nhận xét: 0X càng lệch ra khỏi giá trị trung bình thì sai số dự báo
càng lớn.
1.6. ĐỊNH LÝ GAUSS – MARKOV
Nội dung của ñịnh lý này ñược phát biểu: “Cho trước các giả
thuyết của mô hình hồi quy tuyến tính cổ ñiển, các hàm ước lượng
bình phương tối thiểu, trong nhóm các hàm ước lượng tuyến tính
không chệch, có phương sai nhỏ nhất, chúng là các hàm ước lượng
không chệch tuyến tính tốt nhất”.
CHƯƠNG 2. CÁC MỞ RỘNG CỦA HỒI QUY
TUYẾN TÍNH HAI BIẾN
2.1. HỒI QUY QUA GỐC
Xét hàm hồi quy tổng thể (PRF) hai biến có dạng sau:
2i iY X uβ= + (2.1)
Trong mô hình này, tung ñộ gốc không có hay bằng 0 và ñược gọi là
mô hình hồi quy qua gốc.
Làm sao chúng ta ước lượng các mô hình như (2.1) và mô hình này
ñưa ra các vấn ñề ñặc biệt như thế nào? Để trả lời câu hỏi này, ta viết
mô hình hồi quy mẫu (SRF) của (2.1) là:
2
ˆ
ˆi i iY X uβ= + (2.5)
14
1
2
2
1
ˆ
n
i i
i
n
i
i
X Y
X
β =
=
=
∑
∑
(2.6)
( ) 22
2
1
ˆar
n
i
i
v
X
σβ
=
=
∑
(2.7)
So sánh các công thức với các công thức khi có tung ñộ gốc trong mô
hình:
1
2
2
1
ˆ
n
i i
i
n
i
i
x y
x
β =
=
=
∑
∑
; ( ) 22
2
1
ˆar
n
i
i
v
x
σβ
=
=
∑
;
2
1
2
ˆ
ˆ
2
n
i
i
u
n
σ ==
−
∑
Sự khác biệt giữa các công thức rất rõ ràng:
(1) Trong mô hình không có tung ñộ gốc, ta sử dụng tổng bình
phương và tích chéo thô nhưng trong mô hình có tung ñộ gốc, ta sử
dụng tổng bình phương và tích chéo hiệu chỉnh.
(2) Số bậc tự do ñể tính 2σˆ trong hai trường hợp lần lượt là ( )1n − và
( )2n −
Mặc dù trong mô hình không có tung ñộ gốc hay tung ñộ gốc bằng
không có thể thích hợp trong một số trường hợp, tuy nhiên khi sử
dụng mô hình này ta cần chú ý:
(a)
1
ˆ
n
i
i
u
=
∑ , luôn bằng 0 trong mô hình có tung ñộ gốc (mô hình quy
ước) nhưng không cần phải bằng 0 trong trường hợp không có tung
ñộ gốc. Nói một cách ngắn gọn,
1
ˆ
n
i
i
u
=
∑ không nhất thiết bằng 0 với
mô hình hồi quy qua gốc.
15
(b) 2r , hệ số xác ñịnh luôn không âm với mô hình quy ước
Do các ñặc ñiểm của mô hình, ta cần rất cẩn thận khi sử dụng mô
hình hồi quy qua gốc tọa ñộ bằng 0. Trừ khi chúng ta có một tiên
nghiệm rất mạnh, ta cần phải sử dụng mô hình quy ước có tung ñộ
gốc.
Điều này có lợi thế kép:
(1) Thứ nhất: Nếu số hạng tung ñộ gốc ñưa vào mô hình nhưng nó trở
nên không có ý nghĩa về mặt thống kê, ta có một mô hình hồi quy
qua gốc tọa ñộ(3).
(2) Thứ hai: nếu thật sự có tung ñộ gốc nhưng ta khẳng ñịnh rằng ñó
là hồi quy qua gốc tọa ñộ thì ta sẽ phạm sai số ñặc trưng, và như vậy
ta sẽ vi phạm giả thuyết của mô hình hồi quy tuyến tính cổ ñiển.
2.2. TỶ LỆ VÀ ĐƠN VỊ ĐO
Việc chuyển ñổi tỉ lệ không tác ñộng tới những tính chất của ước
lượng OLS.
2.3. MÔ HÌNH LOG TUYẾN TÍNH
Xem xét mô hình sau với tên gọi là mô hình hồi quy mũ:
2
1
iu
i iY X e
ββ= (2.34)
Phương trình có thể ñược biểu diễn dưới dạng sau:
1 2ln ln lni i iY X uβ β= + + (2.35)
với ln là logarit tự nhiên nghĩa là logarit với cơ số e ( )2,718e =
Nếu ta viết (2.34) dưới dạng:
2ln lni i iY X uα β= + + (2.36)
với 1lnα β= , mô hình này tuyến tính theo các thông số α và 2β ,
tuyến tính theo lôgarit của các biến Y và X. Mô hình có thể ñược ước
(3)
Henri Theil chỉ ra rằng nếu tung ñộ gốc thật sự không có, hệ số ñộ dốc có thể
ñược ước lượng với ñộ chính xác lớn hơn rất nhiều so với trường hợp có tung ñộ
gốc. Xem Introduction to Economertrics của Henri Theil, Prentice – Hall,
Englewood Cliffs, N.J., 1978, trang 76.
16
lượng bằng hồi quy OLS. Do tính chất tuyến tính này, các mô hình
như thế ñược gọi là mô hình log-log, log kép, hay tuyến tính log.
Trong mô hình hai biến, cách ñơn giản nhất ñể quyết ñịnh xem mô
hình tuyến tính lôgarit có thích hợp với số liệu hay không là vẽ lên ñồ
thị phân tán biểu diễn lnYi theo lnXi và xem xem nếu các ñiểm phân
tán nằm gần ñúng theo một ñường thẳng.
2.4. MÔ HÌNH NỬA LOG
2.4.1. Mô hình log – lin
Ta có bảng số liệu sau:
Bảng 2.2.(6) Tổng sản phẩm nội ñịa tính theo giá năm 1987
của Hoa Kỳ, 1972 – 1991
Năm GDP Năm GDP Năm GDP
1972 3107.1 1979 3796.8 1986 4404.5
1973 3268.6 1980 3776.3 1987 4539.9
1974 3248.1 1981 3843.1 1988 4718.6
1975 3221.7 1982 3760.3 1989 4838
1976 3380.8 1983 3906.6 1990 4877.5
1977 3533.3 1984 4148.5 1991 4821
1978 3703.5 1985 4279.8 -- --
Giả sử ta muốn tìm tốc ñộ tăng trưởng GDP thực trong giai ñoạn
này. Đặt Yt = GDP thực (RGDP) vào thời ñiểm t và Y0 = giá trị ban
ñầu (năm 1972) của GDP thực. Bây giờ nhớ lại công thức tính lãi
suất gộp nổi tiếng về tiền tệ, tài chính và ngân hàng.
0 (1 )ttY Y r= + (2.38)
(6)
Nguồn: Báo cáo của Tổng thống, tháng 1 năm 1993, bảng B-1 và B-2 trang 348 -
349
17
với r là tốc ñộ tăng trưởng gộp (theo thời gian) của Y. Lấy lôgarit tự
nhiên (ln) của (2.38), ta có:
0ln ln ln(1 )tY Y t r= + + (2.39)
bây giờ ñặt:
1 0lnYβ = (2.40)
2 ln(1 )rβ = + (2.41)
ta có thể viết (2.39) dưới dạng:
1 2ln tY tβ β= + (2.42)
cộng thêm yếu tố nhiễu vào (2.42), ta có:(7)
1 2ln t tY t uβ β= + + (2.43)
Mô hình này giống mọi mô hình tuyến tính khác ở chỗ các thông
số 1β và 2β là tuyến tính. Sự khác nhau duy nhất là biến hồi quy phụ
thuộc vào lôgarit của Y và biến hồi quy ñộc lập là “thời gian”, lấy giá
trị 1,2,3,...
Các mô hình như (2.43) ñược gọi là mô hình bán lôgarit (semilog)
do chỉ có một biến (trong trường hợp này là biến hồi quy phụ thuộc)
xuất hiện dưới dạng lôgarit. Đối với các mục ñích mô tả, một mô
hình trong ñó biến hồi quy phụ thuộc ñược lôgarit hóa sẽ ñược gọi là
mô hình log-lin.
2.4.2. Mô hình Lin – log
Ta có bảng số liệu sau:
Bảng 2.3.(9) GNP và lượng cung tiền Hoa Kỳ năm 1973 – 1987
Năm GNP ( tỷ USD) M2 Năm
GNP
( tỷ USD) M2
1973 1359.3 861.0 1981 3052.6 1795.5
1974 1472.8 908.5 1982 3166.0 1954.0
1975 1598.4 1023.2 1983 3405.7 2185.2
(7)
Ta ñưa thêm sai số vào vì công thức lãi suất gộp sẽ không thảo mãn chính xác.
(9)
Nguồn báo cáo kinh tế của Tổng thống, 1989, số liệu GNP lấy từ bảng B-1 trang
308 và M2 từ bảng B-67 trang 385
18
1976 1782.8 1163.7 1984 3772.2 2363.6
1977 1990.5 1286.7 1985 4014.9 2562.6
1978 2249.7 1389.0 1986 4240.3 2807.7
1979 2508.2 1500.2 1987 4526.7 2901.0
1980 2723.0 1633.1 -- -- --
Lưu ý: Các số liệu GNP là số liệu hàng quý trên cơ sở tốc ñộ hàng
năm ñã hiệu chỉnh theo mùa.
M2 = tiền mặt + tiền gửi không kỳ hạn + séc du lịch + các loại tiền
gửi ñược rút séc khác + hợp ñồng mua lại chứng khoán (RP) 1 ngày
ñêm và Eurodollar + số dư MMMF (quỹ hỗ tương trên thị trường tiền
tệ) + MMDAs (các tài khoản tiền gửi trên thị trường tiền tệ) + tiết
kiệm và tiền gửi nhỏ.
Giả sử ta có số liệu như trong bảng 2.3, với Y là GNP và X là lượng
cung tiền. Tiếp theo, giả sử ta quan tâm ñến việc tìm xem GNP tăng
lên bao nhiêu (về giá trị tuyệt ñối) nếu lượng cung tiền tăng lên 1%.
Không giống mô hình tăng trưởng vừa thảo luận trong ñó ta quan
tâm ñến việc tìm xem gia tăng phần trăm của Y khi X tăng lên 1 ñơn
vị, bây giờ ta quan tâm ñến việc tìm sự thay ñổi tuyệt ñối của Y khi X
thay ñổi ñi 1%. Một mô hình phục vụ mục tiêu này có thể ñược viết
như sau:
1 2 lni i iY X uβ β= + + (2.45)
Với các mục ñích mô tả, mô hình như vậy là mô hình lin – log.
2.5. MÔ HÌNH NGHỊCH ĐẢO
Các mô hình có dạng sau ñược gọi là mô hình nghịch ñảo.
1 2
1
i i
i
Y u
X
β β = + +
(2.48)
19
Mặc dù mô hình này là phi tuyến theo biến X bởi vì biến X có dạng
nghịch ñảo, mô hình có dạng tuyến tính theo 1β và 2β và do vậy mô
hình là mô hình hồi quy tuyến tính.(11)
Mô hình này có các ñặc ñiểm: khi X tiến dần tới vô cùng, số hạng
2 (1 / )Xβ dần tới không (lưu ý: 2β không ñổi) và Y tiến tới giá trị giới
hạn hay tiệm cận 1β . Do vậy, các mô hình như (2.48) tạo nên một giá
trị tiệm cận hay giới hạn mà biến phụ thuộc sẽ nhận khi giá trị của
biến X dần tới vô cùng.
Bảng tóm tắt các ñặc trưng nổi bật các mô hình vừa trình bày ở trên:
Bảng 2.4. Tóm tắt các hệ số co giãn cho các mô hình
Mô hình Phương trình Độ dốc Độ co giãn
Tuyến tính 1 2Y Xβ β= + 2β 2 *XYβ
Tuyến tính
log hay
log-log
1 2 lnLnY Xβ β= + 2 YXβ
2β
Log-lin 1 2lnY Xβ β= + 2 ( )Yβ 2 ( )*Xβ
Lin-log 1 2 lnY Xβ β= + 2 1Xβ
2
1
*
Y
β
Nghịch
ñảo
1 2
1Y
X
β β = +
2 2
1
X
β −
2
1
*
XY
β −
(11)
Nếu ta gọi ( )* 1 /i iX X= (2.48) có các thông số và các biến iY và *iX tuyến
tính.
20
CHƯƠNG 3. MỘT SỐ ÁP DỤNG CỦA CÁC
MÔ HÌNH MỞ RỘNG TỪ MÔ HÌNH HỒI QUY
TUYẾN TÍNH
3.1. MỘT ÁP DỤNG CỦA MÔ HÌNH HỒI QUY TUYẾN TÍNH
CỔ ĐIỂN: ĐƯỜNG ĐẶC TÍNH CỦA LÝ THUYẾT CƠ CẤU
ĐẦU TƯ CHỨNG KHOÁN
Ta có bảng số liệu về suất sinh lợi hàng năm (%) của Afuture Fund:
Bảng 3.1. Suất sinh lợi trung bình của Afuture Fund
và của chỉ số Fisher (cơ cấu chứng khoán thị trường), 1971 – 1980(14)
Năm Suất sinh lợi của
Afuture Fund (%)
Y
Suất sinh lợi dựa trên
chỉ số Fisher (%)
X
1971 37.5 19.5
1972 19.2 8.5
1973 -35.2 -29.3
1974 -42.0 -26.5
1975 63.7 62.9
1976 19.3 45.5
1977 3.6 9.5
1978 20.0 14.0
1979 40.3 35.3
1980 37.5 31.0
Đường ñặc tính của phân tích ñầu tư có thể biểu diễn như sau:
i i i i iY X uα β= + + (3.1)
Trong một số kết quả thực nghiệm ñã cho thấy iα dương và có ý
nghĩa thống kê và một số khác lại cho thấy nó không khác 0 và
trường hợp sau có thể viết lại mô hình dưới dạng:
i i i iY X uβ= + (3.2)
(14)
Nguồn: Haim Levy & Marshall Sarnat, Portfolio and Investment Selection:
Theory and Practive, Prentice – Hall, Engwood Cliffs, N.J., 1984, trang 730 & 738.
Số liệu này ñược thu thập bởi các tác giả từ Weisenberg Investment Sevice,
Investment Companies, lần xuất bản 1981.
21
Nếu quyết ñịnh sử dụng mô hình (2.1), ta có kết quả hồi quy sau(15):
ˆ 1.0899i iY X=
2
r thô 0.7825= (3.3)
( )5.6884t =
Chạy mô hình hồi quy (3.1) và sử dụng bảng số liệu 2.1, ta có kết quả
sau:
( ) ( )
1
2
ˆ 1.2797 1.0691
0.1664 4.4860 0.7155
iY X
t r
= +
= + =
(3.4)
Từ những kết quả này ta không thể bác bỏ giả thuyết cho rằng giá trị
ñúng của tung ñộ gốc bằng 0, do vậy ta xác nhận việc sử dụng (3.2),
tức là hồi quy qua gốc tọa ñộ.
3.2. MỘT ÁP DỤNG CỦA MÔ HÌNH LOG TUYẾN TÍNH: SỰ
TIÊU THỤ CAFÉ (CÀ PHÊ) Ở HOA KỲ NĂM 1970 – 1980
Xét dữ liệu ñã cho trong bảng 3.2
Bảng 3.2. Tiêu thụ Coffee ở Hoa Kỳ (Y) trong tương quan
với giá bán lẻ thực tế trung bình (X), 1970 – 1980(16).
Năm
Y
(Số ly 01 người
uống mỗi ngày)
X
(Giá bán lẽ trung
bình mỗi ly)
1970 2.57 0.77
1971 2.50 0.74
1972 2.35 0.72
1973 2.30 0.73
1974 2.25 0.76
(15)
Kết quả in ra của SAS trong phụ lục 3A, mục 3A.1
(16)
Lưu ý: giá danh nghĩa ñược lấy từ chỉ số tiêu dùng (CPI) cho thực phẩm và ñồ
uống, 1967 = 100
Nguồn: Dữ liệu Y lấy từ tóm lược của công trình nghiên cứu Quốc gia về uống Café,
Nhóm dữ liệu Elkins Park, Peen., 1981 và dữ liệu về X danh nghĩa (nghĩa là X tính
theo giá hiện tại) lấy từ Niealsen Food Index A.C.Nielsen, New York, 1981.
22
1975 2.20 0.75
1976 2.11 1.08
1977 1.94 1.81
1978 1.97 1.39
1979 2.06 1.20
1980 2.02 1.17
Sau ñó ta dùng mô hình tuyến tính hai biến ñể làm thích hợp với dữ
liệu ñã cho trong bảng 3.2, ta thu ñược các kết quả như sau(17):
( ) ( )
( ) ( )
1 1
2
2 2
2
ˆ 2.6911 0.4795
ˆ ˆ0.0148; 0.1216
ˆ ˆ
ˆ0.0129; 0.01140; 0.01656
0.6628
t tY X
var se
var se
r
β β
β β σ
= −
= =
= = =
=
(3.5)
Thực hiện tính toán, ta thu ñược các kết quả sau:
lnY
= 0,7774 – 0,2530 lnXt
r
2
= 0,7448 (3.6)
F1,9 = 26,27
Với Yt = tiêu dùng cà phê, ly/người/ngày, và Xt = giá thực của cà phê,
USD/pao.
Từ các kết quả này, ta thấy hệ số co giãn giá cả là -0,25, có nghĩa là
với 1% gia tăng mức giá thực của 1 pao cà phê, mức cầu cà phê (tính
bằng số ly cà phê tiêu dùng một ngày) bình quân giảm ñi 0,25%. Do
giá trị hệ số co giãn giá cả là 0,25 nhỏ hơn 1 về giá trị tuyệt ñối, ta có
thể nói rằng cầu cà phê không có tính co giãn về giá cả.
Bây giờ, một cách ñể ta có thể so sánh hai mô hình là tính một ñại
lượng gần ñúng của hệ số co giãn giá cả cho mô hình (3.5). Điều ñó
có thể ñược thực hiện như sau:
(17)
Kết quả in ra của SAS trong phụ lục 3A, mục 3A.2
23
Hệ số co giãn E của biến Y (ví dụ lượng cầu) ñối với một biến khác X
ñược ñịnh nghĩa là:
% Thay ñổi của Y
E =
% Thay ñổi của X
=
( / ) 100
( / ) 100
Y Y
X X
∆ ⋅
∆ ⋅
(3.7)
=
Y X
X Y
∆
⋅
∆
= (hệ số ñộ dốc)(X/Y)
Với ∆ biểu thị thay ñổi (nhỏ). Nếu ∆ ñủ nhỏ, ta có thể thay thế
/Y X∆ ∆ bởi dạng ñạo hàm, dY/dX. Bây giờ ñối với mô hình tuyến
tính (3.6), ước lượng của hệ số ñộ dốc ñược tính bởi hệ số ước lượng
2β , trong hàm cầu cà phê là -0,4795. Như (3.7) biểu thị, ñể tính ñộ
co giãn, ta phải nhân hệ số ñộ dốc này với tỷ lệ (X/Y), tức là giá cả
chia cho số lượng. Nhưng ta chọn giá trị nào của X và Y? Như Bảng
3.2 biểu thị, có 11 cặp giá trị giá cả (X) và số lượng (Y). Nếu ta sử
dụng tất cả các giá trị này, ta sẽ có 11 ước lượng của ñộ co giãn giá
cả.
Tuy nhiên trên thực tế, hệ số co giãn ñược tính bằng giá trị trung bình
hay bình quân của Y và X. Tức là, ta có một ước lượng về hệ số co
giãn trung bình.
3.3. MỘT ÁP DỤNG CỦA MÔ HÌNH NỬA LOG
Quay lại với số liệu trong Bảng 2.3, ta có các kết quả hồi quy như
sau:
24
( ) ( )
( ) ( )
2
* *
ˆ 16329.0 2584.8
23.494 27.549 0.9832
Giá tri = 0.0000 0.0000
t tY X
t r
p
= − +
= − =
* là giá trị rất nhỏ.
Giải thích theo cách vừa trình bày, hệ số ñộ dốc khoảng 2585 có
nghĩa là trong khoảng thời gian của mẫu, lượng cung tiền tăng lên
1%, bình quân, kéo theo sự gia tăng GNP khoảng 25,85 tỷ USD.
Trước khi tiếp tục, lưu ý rằng nếu muốn tính hệ số co giãn cho các
mô hình log-lin hay lin-log, ta có thể thực hiện từ ñịnh nghĩa hệ số co
giãn ở trên, cụ thể, (dY/dX)(X/Y). Trên thực tế, khi biết dạng hàm số
của mô hình, ta có thể tính các hệ số co giãn bằng cách áp dụng ñịnh
nghĩa ở trên.
3.4. MỘT ÁP DỤNG CỦA MÔ HÌNH NGHỊCH ĐẢO: ĐƯỜNG
CONG PHILLIPS CỦA ANH QUỐC, 1950-1966
Ta có bảng số liệu sau:
Bảng 3.3. Tỷ lệ tăng lương hàng năm và tỷ lệ thất nghiệp,
Anh Quốc, 1950-1966
Năm
Tăng lương hàng
năm, %
Y
Thất nghiệp, %
X
1950 1,8 1,4
1951 8,5 1,1
1952 8,4 1,5
1953 4,5 1,5
1954 4,3 1,2
1955 6,9 1,0
1956 8,0 1,1
1957 5,0 1,3
1958 3,6 1,8
1959 2,6 1,9
25
1960 2,6 1,5
1961 4,2 1,4
1962 3,6 1,8
1963 3,7 2,1
1964 4,8 1,5
1965 4,3 1,3
1966 4,6 1,4
Việc xây dựng một mô hình nghịch ñảo (2.48) thích hợp với chuỗi số
liệu cho ta các kết quả sau:(19)
( )1,4282 8,2743 1/t tY X= − + 2 0,3849r = (3.8)
Hình 3.1. Đường cong Philips của Anh Quốc, 1950 – 1966
Đường hồi quy ước lượng ñược biểu diễn trong Hình 3.1. Từ hình
này ta thấy rõ rằng giới hạn bên dưới của tốc ñộ thay ñổi mức lương
là -1,43, tức là khi X tăng lên vô hạn, tỷ lệ phần trăm giảm sút của
mức lương sẽ không lớn hơn 1,43%/năm.
(19)
Kết quả in ra của SAS trong phụ lục 3A, mục 3A.3
26
KẾT LUẬN VÀ KIẾN NGHỊ
Sau gần một năm nghiên cứu ñề tài “Mở rộng mô hình hồi quy
tuyến tính hai biến”, tác giả nhân thấy ñây là ñề tài rất hay, rất bổ ích.
Hiện chưa có giáo trình, tài liệu chính thức nào bằng tiếng việt ñể
mọi người tham khảo. Điểm hạn chế của ñề tài này là tác giả mới tiếp
cận với các mô hình thông qua hai biến việc này dẫn ñến các mô hình
nhiều hơn hai biến chưa ñược nghiên cứu hết. Nếu có ñiều kiện tác
giả sẽ tiếp tục nghiên cứu và bổ sung ñể luận văn ñược hoàn chỉnh
hơn.
Các file đính kèm theo tài liệu này:
- mo_rong_mo_hinh_hoi_quy_tuyen_tinh_hai_bien_773.pdf