Trong những năm gần đây, cùng với chức năng khai thác có tính chất tác
nghiệp, việc khai thác các cơ sở dữ liệu phục vụ các yêu cầu trợ giúp quyết
định ngày càng có ý nghĩa quan trọng và là nhu cầu to lớn trong mọi lĩnh vực
hoạt động kinh doanh, quản lý kinh tế cũng như nghiên cứu khoa học, thống
kê tình hình phát triển xã hội, dân số v.v Dữ liệu được lưu trữ và thu thập
ngày càng nhiều nhưng người ra quyết định trong quản lý, kinh doanh lại cần
những thông tin dưới dạng “tri thức” rút ra từ những nguồn dữ liệu đó hơn là
chính những dữ liệu đó cho việc ra quyết định.
Quá trình ra quyết định cần có nhiều phương pháp hỗ trợ, trong số những
phương pháp đó thì Dự báo là một phương pháp được sử dụng rất phổ biến và
kết quả dự báo chính là đầu vào rất cần thiết trong quá trình đưa ra ý kiến chủ
quan chung sau khi thảo luận.
Việc ứng dụng các hệ hỗ trợ ra quyết định dựa trên các mô hình dự báo
giúp các doanh nghiệp xây dựng chiến lược phát triển sản xuất kinh doanh
đúng đắn của mình trong tương lai, mang lại hiệu quả to lớn cho doanh
nghiệp, tổ chức, v.v .
TÓM TẮT NỘI DUNG:
Chương 1 - LÝ THUYẾT HỆ HỖ TRỢ RA QUYẾT ĐỊNH
1.1. Lý thuyết ra quyết định
1.1.1. Quyết định là gì?
1.1.2. Ra quyết định là gì?
1.1.3. Tại sao cần hỗ trợ ra quyết định?
1.1.4. Bản chất của hỗ trợ ra quyết định
1.1.5. Các yếu tố ảnh hưởng đến ra quyết định
1.1.6. Người ra quyết định
1.1.7. Thách thức đối với ra quyết định quản lý
1.2. Quá trình ra quyết định
1.2.1. Phân loại quyết định
1.2.2. Các giai đoạn của quá trình ra quyết định
1.3. Hệ hỗ trợ ra quyết định
1.3.1. Khái niệm
1.3.2. Các thành phần của Hệ hỗ trợ ra quyết định
1.3.3. Phân loại Hệ hỗ trợ ra quyết định
1.3.3.1. Theo DSS- Glossary:
1.3.3.2. Theo Holsapple và Whinston (1996):
Chương 2 - TỔNG QUAN VỀ DỰ BÁO VÀ NGHIÊN CỨU MỘT SỐ MÔ HÌNH DỰ BÁO
2.1. Vai trò và ứng dụng của dự báo
2.2. Các qui trình dự báo
2.3. Các kĩ thuật dự báo
2.3.1. Dự báo định tính
2.3.1.1. Lấy ý kiến của ban điều hành
2.3.1.2. Lấy ý kiến của các nhà phân phối
2.3.1.3. Phương pháp điều tra người tiêu dùng
2.3.2. Dự báo định lượng
2.3.3. Dự báo bằng phương pháp chuyên gia
2.4. Nghiên cứu một số phương pháp định lượng
2.4.1. Phương pháp dự báo dựa trên mô hình hồi qui tuyến tính bội
2.4.1.1. Mô hình cơ bản
2.4.1.2. Phương pháp bình phương tối thiểu
2.4.1.3. Các giả thiết của phương pháp bình phương tối thiểu
2.4.1.4. Phương sai và sai số chuẩn của các ước lượng
2.4.1.5. Hệ số xác định và Hệ số tương quan
2.4.1.6. Phân phối xác xuất của các ước lượng
2.4.1.7. Các sai số đặc trưng
2.4.1.8. Các tiêu chuẩn chung để chọn mô hình
2.4.2. Phương pháp dự báo chuỗi thời gian
2.4.2.1. Các mô hình tự hồi quy
2.4.2.2. Các mô hình trung bình trượt
2.4.2.3. Các mô hình ARMA
2.4.2.4. Mô hình ARIMA
2.5. Đánh giá các mô hình
70 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 5206 | Lượt tải: 3
Bạn đang xem trước 20 trang tài liệu Mô hình dự báo kinh tế - Hệ hỗ trợ ra quyết định trong doanh nghiệp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
thuật hoặc sản xuất dựa trên việc xử lý có hệ thống các đánh
giá của chuyên gia.
Phương pháp này phải giải quyết được các vấn đề chính sau đây:
a. Lựa chọn và thành lập nhóm chuyên gia dự đoán và nhóm các nhà
phân tích:
Nhóm chuyên gia dự báo sẽ đưa ra những đánh giá dự báo về đối tượng
cần dự báo. Đây là các chuyên gia có trình độ hiểu biết chung tương đối cao
ngoài lĩnh vực hẹp của mình, có kiến thức chuyên môn sâu về lĩnh vực dự
báo, có lập trường khoa học và có khả năng tiên đoán thể hiện ở sự phản ánh
nhất quán xu thế phát triển của đối tượng dự báo và có định hướng và suy
nghĩ về tương lai trong lĩnh vực mình quan tâm.
Nhóm chuyên gia phân tích còn gọi là nhóm các nhà quản lý bao gồm:
những người có cương vị lãnh đạo, những người có quyền quyết định chọn
phương pháp dự báo. Đây cũng là các chuyên gia có trình độ chuyên môn cao
về vấn đề cần dự báo, có kiến thức về dự báo và chuyên gia phân tích còn
phải có lòng kiên nhẫn, tính lịch thiệp do quá trình tiếp xúc và hợp tác với các
chuyên gia là một quá trình phức tạp.
b. Trưng cầu ý kiến của các chuyên gia
Trưng cầu ý kiến chuyên gia là một giai đoạn của phương pháp chuyên
gia. Tuỳ theo đặc điểm thu nhận và xử lý thong tin mà chọn những phương
pháp trưng cầu cơ bản như: trưng cầu ý kiến theo nhóm và cá nhân; trưng cầu
vắng mặt và có mặt và trưng cầu trực tiếp hay gián tiếp.
c. Xử lý ý kiến chuyên gia
Sau khi thu thập ý kiến của các chuyên gia, cần phải tiến hành một loạt
các biện pháp xử ký các ý kiến này. Đây là bước quan trọng để đưa ra kết quả
dự báo. Có hai dạng vấn đề cần giải quyết khi xử lý ý kiến chuyên gia:
- Đánh giá thời gian hoàn thành sự kiện, thời gian xuất hiện quá trình
mới. Ví dụ: trong lĩnh vực quy hoạch phát triển công nghiệp ô tô Việt
Nam…., dự báo thời gian nào giá xe ô tô của các hãng trên thế giới tăng cao
và ảnh hưởng đến chính sách nhập khẩu ô tô của Việt Nam.
- Đánh giá tầm quan trọng tương đối giữa các sự kiện. Ví dụ: đánh giá
vai trò quan trọng của các yếu tố đầu vào (mức thu nhập bình quân đầu người,
cơ sở hạ tầng đường xá, v.v…) ảnh hưởng đến số lượng ô tô thêm mới trong
một tỉnh/thành phố.
2.4. Nghiên cứu một số phương pháp định lượng
Trong phần này luận văn tập trung nghiên cứu hai phương pháp dự báo
mang tính định lượng:
Dự báo kinh tế lượng dựa trên mô hình hồi quy tuyến tính để nối kết
một hoặc một vài biến phụ thuộc với một (hay một số) biến độc lập. Phương
pháp này rất phổ biến do có khả năng giải thích các thay đổi ở các biến phụ
thuộc theo sự thay đổi của các biến kinh tế hay các biến động thái khác - đặc
biệt là những thay đổi trong các biến về chính sách.
Dự báo chuỗi thời gian chủ yếu dựa trên những nỗ lực để dự đoán các
giá trị của một biến căn cứ vào những giá trị trong quá khứ của chính biến đó.
Hai nhóm phương pháp này rất rộng và ranh giới giữa chúng là không
rõ ràng. Ví dụ, trong khi một số mô hình kinh tế lượng được thiết lập chỉ dựa
trên các giá trị quá khứ của biến phụ thuộc, thì một số mô hình chuỗi thời
gian thuần túy (phi kinh tế lượng) lại kết nối một biến với các giá trị của các
biến khác. Phương pháp chuỗi thời gian thường được xem là trội hơn
phương pháp kinh tế lượng khi dự báo ngắn hạn. Các mô hình kinh tế lượng
sẽ thích hợp hơn trong trường hợp mô hình hóa các ảnh hưởng dài hạn. Sự
kết hợp cả hai nhóm phương pháp dự báo tạo ra tiềm năng cải thiện các dự
báo cả dài hạn lẫn ngắn hạn.
2.4.1. Phương pháp dự báo dựa trên mô hình hồi qui tuyến tính bội
2.4.1.1. Mô hình cơ bản
Trước khi xét đến mô hình hồi qui tuyến tính bội, chúng ta khái quát qua
về mô hình hồi qui tuyến tính đơn. Mô hình hồi qui tuyến tính đơn là mô hình
thể hiện mối quan hệ tuyến tính giữa một biến phụ thuộc và một biến độc lập.
Tính tuyến tính của mô hình:
Yt = α + βXt + ut
Trong đó:
Xt và Yt là quan sát thứ t (t = 1 đến n) của biến độc lập X và biến phụ
thuộc Y
α và β là các tham số chưa biết và sẽ được ước lượng, gọi là hệ số hồi
qui
ut là số hạng sai số không quan sát được và được giả định là biến ngẫu
nhiên với một số đặc tính nhất định.
Thuật ngữ đơn trong mô hình hồi qui tuyến tính đơn được sử dụng để chỉ
rằng có duy nhất một biến giải thích (X) được sử dụng trong mô hình. Thuật
ngữ hồi qui xuât phát từ Fraccis Galton (1886), người đặt ra mối liên hệ giữa
chiều cao của nam giới với chiều cao của người cha và quan sát thực nghiệm
cho thấy có một xu hướng giữa chiều cao trung bình của nam giới với chiều
cao của những người cha của họ để "hồi qui" (hoặc di chuyển) cho chiều cao
trung bình của toàn bộ tổng thể, α + βXb gọi là phần xác định của mô hình và
là trung bình có điều kiện của Y theo X, đó là E(Yt⎢Xt) = α + βXt. Thuật
ngữ tuyến tính để chỉ là bản chất các thông số của tổng thể α và β là tuyến
tính (bậc nhất) chứ không phải Xt là tuyến tính.
Nhưng trong thực tế, có nhiều ví dụ không thể giải thích bằng mô hình
hồi qui tuyến tính đơn do mối quan hệ giữa các sự vật hiện tượng là rất đa
đạng, một sự vật hiện tượng xảy ra không đơn giản chỉ phụ thuộc vào một mà
phụ thuộc vào rất nhiều các yếu tố khác. Ví dụ:
- Lượng cầu một loại hàng hoá phụ thuộc vào giá, thu nhập người mua,
giá các hàng hoá khác v.v…
- Sản lượng phụ thuộc vào giá, các nhập lượng ban đầu, các nhập lượng
trung gian, công nghệ v.v…
- Đầu tư nước ngoài (FDI) phụ thuộc vào suất sinh lợi của đầu tư, tiền
lương, tham nhũng, tính minh bạch v.v…
Khi chúng ta có một tập hợp dữ liệu có chứa các biến giải thích, trường
hợp phổ biến là tất cả các biến này cùng thay đổi, điều đó làm chúng ta không
thể cố định ảnh hưởng của một biến giải thích nào đó đến biến phụ thuộc.
Việc xét đến các tác động riêng biệt của nhiều nhân tố có thể được giải
thích bằng mô hình hồi qui tuyến tính bội (mô hình hồi qui đa biến)
Hàm hồi qui tổng thể:
Mô hình: liên hệ biến phụ thuộc Y cho trước với nhiều biến độc lập: X1,
X2, …, Xk
ttkkttt uXXXY +++++= ββββ ...33221 (2.9)
[ ] [ ]sX'...' 33221 itkktti EXXXsXYE εββββ +++++= (2.10)
Ảnh hưởng của thay đổi trong Yt khi chỉ có Xti thay đổi được xác định
bởi: [ ] k
k
i
X
sXYE β=
∂
∂ ' (2.11)
Vì vậy ý nghĩa của hệ số hồi qui βi là giữ giá trị của tất cả các biến khác
không đổi, nếu Xti thay đổi một đơn vị thì Yt kỳ vọng thay đổi, trung bình là,
βi đơn vị. Vì vậy, phân tích hồi qui bội giúp chúng ta kiểm soát được một tập
hợp con các biến giải thích và kiểm tra ảnh hưởng của một biến độc lập đã
chọn
2.4.1.2. Phương pháp bình phương tối thiểu
Trong mô hình hồi qui bội, chúng ta sẽ sử dụng các dữ liệu Y và Xti và
tìm kiếm ước lượng "tốt nhất" của các tham số của tổng thể là kβββ ,...,, 21 . Ta
có thủ tục ước lượng phổ biến nhất là phương pháp bình phương tối thiểu .
Phương pháp này thường được gọi là bình phương tối thiểu thông thường
(OLS – Original Least Square), để phân biệt với những phương pháp bình
phương tối thiểu khác. Ký hiệu ước lượng của kβββ ,...,, 21 là kβββ
)))
,...,, 21 , phần
dư ước lượng thì bằng:
tkkttt XXYu βββ
))))
−−−−= ...221
Tiêu chuẩn tối ưu được sử dụng bởi phương pháp bình phương tối thiểu
là cực tiểu hóa hàm mục tiêu:
ESS = ( )∑∑
==
−−−−=
n
t
tkktt
n
t
t XXYu
1
2
221
1
2 ... βββ )))) (2.12)
với các tham số chưa biết là kβββ
)))
,...,, 21 . ESS là tổng các phần dư bình
phương và phương pháp OLS cực tiểu tổng các phần dư bình phương. Chú ý
rằng ESS là khoảng cách bình phương được đo lường từ đường hồi qui. Sử
dụng khoảng cách đo lường này, có thể nói rằng phương pháp OLS là tìm
đường thẳng gần nhất với dữ liệu trên đồ thị.
Trực quan hơn, giả sử ta chọn một tập hợp những giá trị kβββ
)))
,...,, 21 , đó
là một đường thẳng tkkt XX βββ
)))
−−− ...221 . Có thể tính được độ lệch của Yt từ
đường thẳng được chọn theo phần dư ước lượng tkkttt XXYu βββ
))))
−−−−= ...221 .
Sau đó bình phương giá trị này và cộng tất cả các giá trị bình phương của toàn
bộ mẫu quan sát. Tổng các phần dư bình phương của các trị quan sát do đó sẽ
bằng ∑ 2tu) . Tương ứng với một điểm trên đồ thị sẽ có một trị tổng bình
phương sai số. Phương pháp bình phương tối thiểu chọn những giá trị
kβββ
)))
,...,, 21 sao cho ESS là nhỏ nhất.
Việc bình phương sai số đạt được hai điều sau. Thứ nhất, bình phương
giúp loại bỏ dấu của sai số và do đó xem sai số dương và sai số âm là như
nhau. Thứ hai, bình phương tạo ra sự bất lợi cho sai số lớn một cách đáng kể.
Ví dụ, giả sử phần dư của mẫu là 1, 2, -1 và -2 của hệ số hồi qui chọn trước trị
kβββ
)))
,...,, 21 . So sánh các giá trị này với một mẫu khác có phần dư là -1, -1, -1
và 3. Tổng giá trị sai số tuyệt đối ở cả hai trường hợp là như nhau. Mặc dù
mẫu chọn thứ hai có sai số tuyệt đối thấp hơn từ 2 đến 1, điều này dẫn đến sai
số lớn không mong muốn là 3. Nếu ta tính ESS cho cả hai trường hợp thì ESS
của trường hợp đầu là (12 + 22 + (-1)2 + (-2)2) = 10. ESS cho trường hợp sau là
((-1)2 + (-1)2 + (-1)2 + 32) = 12. Phương pháp bình phương tối thiểu áp đặt sự
bất lợi lớn cho sai số lớn và do đó đường thẳng trong trường hợp đầu sẽ được
chọn.
Thủ tục OLS cực tiểu tổng bình phương sai số ESS và cho ra k phương
trình chuẩn. Những phương trình này nói chung duy nhất được giải cho các hệ
số, với điều kiện là số quan sát lớn hơn k.
∑∑∑ +++= tkktt XXnY βββ ))) ...221
2
2
2221t2 ...X ttkkttt XXXXY ∑∑∑∑ +++= βββ )))
.........................
titkktittit XXXXXY ∑∑∑∑ +++= βββ ))) ...X 221ti
∑∑∑∑ +++= 2221tk ...X tkktkttkt XXXXY βββ )))
k phương trình chuẩn trên có thể giải được các nghiệm đơn β. Các
chương trình máy tính chuẩn thực hiện được mọi tính toán này khi nhập dữ
liệu vào và xác định các biến độc lập, biến phụ thuộc. Các tính chất trong hồi
qui đơn cũng đúng với hồi qui tuyến tính bội. Do đó ước lượng OLS là
BLUE, không thiên lệch, hiệu quả và nhất quán. Phần dư và các giá trị dự
đoán có được từ các liên hệ sau:
tkkttt XXYu βββ
))))
−−−−= ...221
tttkktt uYXXY
)))))
−=+++= βββ ...221
2.4.1.3. Các giả thiết của phương pháp bình phương tối thiểu
2.4.1.4. Phương sai và sai số chuẩn của các ước lượng
Từ lý thuyết xác suất ta biết rằng phương sai của một biến ngẫu nhiên đo
lường sự phân tán xung quanh giá trị trung bình. Phương sai càng bé, ở mức
trung bình, từng giá trị riêng biệt càng gần với giá trị trung bình. Tương tự,
khi đề cập đến khoảng tin cậy, ta biết rằng phương sai của biến ngẫu nhiên
càng nhỏ, khoảng tin cậy của các tham số càng bé. Như vậy, phương sai của
một ước lượng là thông số để chỉ độ chính xác của một ước lượng. Do đó việc
tính toán phương sai của kβββ
)))
,...,, 21 là luôn cần thiết.
Do kβββ
)))
,...,, 21 thuộc vào các giá trị Y, mà Y lại phụ thuộc vào các biến
ngẫu nhiên ut (t = 1 đến n) nên chúng cũng là biến ngẫu nhiên với phân phối
tương ứng. Ta có phương sai của 2β
)
:
[ ] ( )( ) ( ) 22322322
2
3
2R σβ ∑∑∑
∑
−
=
iiii
i
xxxx
x
VA
)
(2.13)
Các giá trị dự báo và sai số chuẩn
Cũng như trong mô hình hồi qui đơn biến, chúng ta quan tâm đến việc
tạo ra các dự báo có điều kiện của biến phụ thuộc với các giá trị cho trước của
các biến độc lập. Giả sử Xfi là giá trị cho trước của biến độc lập thứ i với i =
2,..., k và t = f, với các giá trị này chúng ta muốn dự báo i. Định nghĩa:
fkkf XX ββββ +++= ...221
Và fY
))
=β , định nghĩa trước đó t = f, và vì vậy dự báo cần có là giá trị
ước lượng của β, và sai số chuẩn tương ứng sẽ giúp chúng ta xây dựng một
khoảng tin cậy cho dự báo. Giải β1 từ phương trình trên và thay vào mô hình
ban đầu ta có:
ttkktfkkft uXXXXY ++++−−−= βββββ ...... 2222
Nhóm số hạng một cách thích hợp, ta có thể viết lại như sau:
ttkkt uZZ ++++= βββ ...22
với Zti = Xti – Xfi, cho i = 2,...,k. Việc viết lại công thức này chỉ ra các
bước sau để tiến hành dự báo
Bước 1: Với giá trị Xfi cho trước của biến độc lập thứ i và t = f, tạo một
biến mới Zti = Xti – Xfi với i = 2, ..., k
Bước 2: Hồi qui Yt theo một số hạng và các biến mới Zt2, ..., Ztk
Bước 3: Số hạng không đổi được ước lượng là một dự báo điểm cần có.
Khoảng tin cậy tương ứng được tính bằng ( ff stst *,* +− ββ
))
), với t* là
giá trị tới hạn của phân phối t với bậc tự do n-k và mức ý nghĩa cho
trước, và sf là sai số chuẩn của số hạng không đổi được ước lượng có
được từ bước 2.
2.4.1.5. Hệ số xác định và Hệ số tương quan
Ta có tổng bình phương sai số (ESS) hay tổng các bình phương phần dư
là ∑= 2tuSS )E . Sai số chuẩn của phần dư là ( )2-nSSE=σ) . Giá trị này đo
lường độ phân tán của sai số khi sử dụng tY
)
làm biến dự báo và thường được
so sánh với Yσ
) được cho ở trên để xem xét mức độ giảm xuống là bao nhiêu.
Bởi vì ESS càng nhỏ càng tốt, và mức độ giảm xuống càng nhiều.
Phương pháp này không hoàn toàn tốt lắm, tuy nhiên, bởi vì các sai số
chuẩn rất nhạy cảm đối với đơn vị đo lường Y nên rất cần có một thông số đo
lường khác không nhạy cảm với đơn vị đo lường.
Thông số đo lường tổng biến thiên của tY
)
so với Y (giá trị trung bình của
tY
)
) cho toàn mẫu là 2)( YYt −∑ ) . Được gọi là tổng bình phương hồi qui
(RSS).
( ) ( ) tfktkkftt uXXXXY +−++−+= βββ ...222
Ta có: ( ) ( ) ∑∑∑ +−=− 222 ttt uYYYY ))
Do đó TSS = RSS + ESS. Lưu ý rằng ( ) ( ) ttt uYYYY )) +−=−
Ta có:
TSS
SS1 E
TSS
RSS
−= được gọi là hệ số xác định đa biến và ký hiệu là R2
( ) TSS
RSSE
YY
u
R
t
t
=−=
−
−= ∑
∑
TSS
SS11
2
2
)
10 2 ≤≤ R (2.14)
rõ ràng R2 nằm giữa khoảng từ 0 đến 1. R2 không có thứ nguyên vì cả tử
số và mẫu số đều có cùng đơn vị. Điểm quan sát càng gần đường thẳng ước
lượng, "độ thích hợp" càng cao, nghĩa là ESS càng nhỏ và R2 càng lớn. Do
vậy, R2 là thông số đo lường độ thích hợp, R2 càng cao càng tốt. ESS còn
được gọi là biến thiên không giải thích được vì tu
) là ảnh hưởng của những
biến khác ngoài Xt và không có trong mô hình. RSS là biến giải thích được.
Như vậy, TSS là tổng biến thiên của Y, có thể phân thành hai thành phần: (1)
RSS, là thành phần giải thích được theo X; và (2) ESS, là thành phần không
giải thích được. Giá trị R2 nhỏ nghĩa là có sự biến thiên ở Y không thẻ giải
thích được bằng X. Ta cần phải thêm vào những biến khác có ảnh hưởng đến
Y.
Ngoài ý nghĩa là một tỷ lệ của tổng biến thiên của Y được giải thích qua
mô hình, R2 còn có một ý nghĩa khác. Đó là thông số đo lường mối tương
quan giữa giá trị quan sát Yt và giá trị dự báo ( )
ttYYt
rY )
)
. Ta có:
2
2
2
)()(
)( R
TSS
RSS
YVarYVar
YYCovr
tt
tt
YY === )
)
) (2.15)
Như vậy, bình phương hệ số tương quan giữa giá trị quan sát Yt và giá trị
dự báo tY
)
bằng phương trình hồi qui thì sẽ cho ra kết quả bằng với giá trị R2.
Có một thắc mắc phổ biến về độ thích hợp tổng thể, đó là “bằng cách
nào để xác định rằng R2 là cao hay thấp?”. Không có một qui định chuẩn hay
nhanh chóng để kết luận về R2 như thế nào là cao hay thấp. Với chuỗi dữ liệu
theo thời gian, kết quả R2 thường lớn bởi vì có nhiều biến theo thời gian chịu
ảnh hưởng xu hướng và tương quan với nhau rất nhiều. Do đó, giá trị quan sát
R2 thường lớn hơn 0,9. R2 bé hơn 0,6 và 0,7 được xem là thấp. Tuy nhiên với
dữ liệu chéo, đại diện cho dạng của một yếu tố thay đổi vào một thời điểm
nào đó, thì R2 thường thấp. Trong nhiều trường hợp, R2 bằng 0,6 hoặc 0,7 thì
chưa hẳn là xấu. Đây đơn giản chỉ là thông số đo lường về tính đầy đủ của mô
hình. Điều quan trọng hơn là nên đánh giá mô hình xem dấu của hệ số hồi qui
có phù hợp với các lý thuyết kinh tế, trực giác và kinh nghiệm của người
nghiên cứu hay không.
Ta xét bình phương hệ số tương quan giữa X2 và X3:
( )
( )( )∑∑
∑
= 2
3
2
2
2
322
23r
ii
ii
xx
xx
Biến đổi một chút chúng ta có phương sai của β2 như sau:
[ ] ( )( ) 2223222 1
1R σβ
rx
VA
i −
= ∑
)
2.4.1.6. Phân phối xác xuất của các ước lượng
Để có khả năng xây dựng các khoảng tin cậy đối với các tham số chưa
biết và kiểm định giả thuyết về chúng, chúng ta cần biết các phân phối xác
suất chọn mẫu của những ước lượng này.
Khi đề cập về phần phối chọn mẫu của các ước lượng, chúng ta cần biết
ba nội dung sau đây:
- Kỳ vọng toán học
- Phương sai
- Dạng hàm của phân phối chọn mẫu
Đầu tiên hãy xét kỳ vọng của ước lượng β2:
( )( ) ( )( )
( )( ) ( )2322322
323
2
32
2 ∑∑∑
∑∑∑∑
−
−
=
iiii
iiiiiii
xxxx
xxxyxxYβ)
Lưu ý rằng các chữ Y hoa đã thay thế cho các dạng độ lệch mà chúng ta
đã sử dụng. Ta thay thế:
iiii uxxY ++= 3322 ββ
vào trong biểu thức ước lượng và thực hiện vài biến đổi đại số chúng ta sẽ có:
( )( ) ( )( )
( )( ) ( )2322322
323
2
32
2 ∑∑∑
∑∑∑∑
−
−
=
iiii
iiiiiii
xxxx
xxxyxxYβ)
( )( ) ( )( )
( )( ) ( )2322322
323
2
32
2 ∑∑∑
∑∑∑∑
−
−
+=
iiii
iiiiiii
xxxx
xxxyxxYβ
Khi lấy giá trị kỳ vọng của biểu thức thứ hai, ta thấy ước lượng của
tham số là không chệch vì ta có kết quả sau đây:
⎣ ⎦ 22 ββ =)E
Chúng ta hầu như đã quen với cách trình bày phương sai của ước lượng.
Cuối cùng, rõ ràng từ biểu thức trên là mỗi ước lượng đều là một tổ hợp
tuyến tính của của các biến ngẫu nhiên có phân phối chuẩn, vì thế mỗi ước
lượng cũng đều có phân phối chuẩn.
Những kết quả suy luận nêu trên cũng đúng đối với hàm hồi qui bội có k
biến. Những ước lượng tham số là không chệch, và các phương sai của ước
lượng tham số đã biết, và chúng tuân theo phân phối chuẩn. Tuy vậy, trên
thực tế không thể biểu diễn được những kết quả này nếu không sử dụng công
cụ đại số ma trận.
2.4.1.7. Các sai số đặc trưng
Dựa vào các sai số đặc trưng, chúng ta sẽ có cách lựa chọn biến độc lập
và biến phụ thuộc cho mô hình dự báo.
Việc lựa chọn các biến độc lập và phụ thuộc trong mô hình kinh tế phải
được dựa trên lý thuyết kinh tế, kiến thức về các hành vi tiềm ẩn, và kinh
nghiệm quá khứ. Tuy nhiên, bản chất các quan hệ giữa các biến kinh tế là
không bao giờ biết và vì vậy chúng ta có thể mong đợi những sai số trong
việc xác định các đặc trưng của mô hình kinh tế lượng. Sai số đặc trưng xảy
ra nếu chúng ta xác định sai mô hình theo các loại như chọn biến, dạng hàm
số, hoặc cấu trúc sai số (nghĩa là số hạng ngẫu nhiên ut và các tính chất của
nó).
Khi chọn các biến độc lập của mô hình, ta có thể phạm phải hai loại sai
số sau: (1) bỏ qua một biến thuộc về mô hình và (2) đưa vào một biến không
liên quan. Trong hàm cầu, nếu chúng ta bỏ qua biến giá cả hàng hoá hoặc thu
nhập của hộ gia đình, chúng ta có thể gây ra trường hợp sai số đặc trưng loại
thứ nhất. Ngược lại, với ví dụ về bất động sản, giá một ngôi nhà phụ thuộc
vào diện tích sử dụng, số phòng ngủ, phòng tắm, nếu ta đưa vào các biến như
thiết bị sử dụng điện, khoảng cách từ nhà đến trường, loại mái lợp thì sẽ
không tác động đáng kể đến giá bán ngôi nhà. Như vậy chúng ta sẽ phạm phải
sai số đặc trưng loại thứ hai, nghĩa là đưa biến thừa vào mô hình.
Khi bỏ qua biến quan trọng:
Đầu tiên chúng ta khảo sát trường hợp trong đó một biến thuộc về mô
hình bị bỏ qua. Giả sử mô hình thật là: tttt uXXY +++= 33221 βββ
Nhưng chúng ta ước lượng mô hình: ttt vXY ++= 221 ββ
Nói cách khác, giá trị thật của β3 là khác 0, nhưng chúng ta lại giả định
rằng nó bằng 0 và vì vậy đã loại bỏ biến X3 ra khỏi mô hình. Các hệ quả của
loại sai số xác định này được tóm tắt qua tính chất sau:
a. Nếu một biến độc lập mà hệ số hồi qui thật của nó khác không bị
loại ra khỏi mô hình các giá trị ước lượng của tất cả các hệ số hồi qui
còn lại sẽ bị thiên lệch trừ phi biến bị loại ra không tương quan với mọi
biến được đưa vào.
b. Ngay cả khi điều kiện này được thoả mãn, số hạng hằng số được
ước lượng nói chung cũng bị thiên lệch, và vì vậy các giá trị dự báo cũng
bị thiên lệch.
c. Ước lượng phương sai của hệ số hồi qui của một biến được đưa vào
nói chung sẽ bị thiên lệch, và vì vậy các kiểm định giả thuyết sẽ không
có ý nghĩa.
Từ 3 tính chất trên ta thấy rằng việc bỏ qua một biến quan trọng là rất
nghiêm trọng. Các ước lượng và trị dự báo sẽ bị thiên lệch, và các kiểm định
giả thuyết sẽ không còn có ý nghĩa nữa. Nguyên nhân của sự thiên lệch (gọi là
thiên lệch biến bị bỏ sót) là dễ dàng nhận thấy.
Đưa vào mô hình một biến không liên quan:
Giả sử rằng mô hình thật là: ttt uXY ++= 221 ββ
Nhưng chúng ta thêm nhầm biến X3 và ước lượng được mô hình:
tttt vXXY +++= 33221 βββ
Các hệ quả của việc thêm vào biến không liên quan được tóm tắt qua các
tính chất sau:
a. Nếu một biến độc lập có giá trị hệ số hồi qui thật bằng không (nghĩa
là biến này là thừa) được đưa vào mô hình, các giá trị ước lượng của tất
cả các hệ số hồi qui khác vẫn sẽ không thiên lệch và nhất quán.
b. Tuy nhiên phương sai của chúng sẽ cao hơn các giá trị khi không có
biến không liên quan, và vì vậy các hệ số sẽ không hiệu quả.
c. Vì các phương sai ước lượng của các hệ số hồi qui là không thiên
lệch, các kiểu định quả thuyết vẫn có hiệu lực.
Như vậy hậu quả của việc đưa vào mô hình một biến không liên quan là
ít nghiêm trọng hơn so với trường hợp bỏ sót một biến quan trọng.
2.4.1.8. Các tiêu chuẩn chung để chọn mô hình
Chúng ta đã chứng minh trước đây bằng cách tăng số biến trong một mô
hình, tổng bình phương phần dư ∑ 2tu) sẽ giảm và R2 sẽ tăng, nhưng đổi lại bậc
tự do sẽ giảm. 2R và sai số chuẩn của phần dư, [ ] 21)(SS knE − , tính đến việc
đánh đổi giữa giảm ESS và giảm bậc tự do. Đây là những tiêu chuẩn thông
dụng nhất để so sánh các mô hình.
Nhìn chung, mô hình đơn giản hơn được ưa thích hơn vì hai lý do kỹ
thuật sau. Thứ nhất, đưa quá nhiều biến vào mô hình khiên cho độ chính xác
tương đối của riêng mỗi hệ số giảm. Thứ hai, việc giảm bậc tự do sẽ giảm
năng lực của kiểm định trên các hệ số. Vì vậy, xác suất của việc không bác bỏ
giả thuyết sai tăng khi bậc tự do giảm. Các mô hình đơn giản cũng dễ hiểu
hơn các mô hình phức tạp. Vì vây, lý tưởng nên thiết lập những tiêu chuẩn
hạn chế những mô hình lớn nhưng cũng không luôn luôn chọn mô hình đơn
giản.
Trong những năm gần đây, nhiều tiêu chuẩn chọn mô hình được đề nghị.
Tất cả những tiêu chuẩn này có dạng của tổng bình phương phần dư (ESS)
nhân với một nhân tốt bất lợi phụ thuộc vào mức độ phức tạp của mô hình.
Mô hình càng phức tạp ESS càng giảm nhưng lại tăng tính bất lợi. Các tiêu
chuẩn vì vậy phải cung cấp các loại đánh đổi khác giữa mức độ thích hợp và
độ phức tạp của mô hình. Một mô hình có trị thống kê tiêu chuẩn thấp được
ưa chuộng hơn.
Akaike (1970, 1974) xây dựng hai phương pháp, một được gọi là sai số
hoàn toàn xác định trước (FPE) và phương pháp thứ hai gọi là tiêu chuẩn
thông tin Akaike (AIC). Hannan và Quinn (1979) đề nghị một phương pháp
khác (được gọi là tiêu chuẩn HQ). Các tiêu chuẩn khác gồm của Schwarz
(1978), Shibata (1981), và Rice (1984), và phương pháp tính chính xác chéo
tổng quát (GCV) được Craven và Wahba (1979) phát triển và được Engle,
Graner, Rice, và Weiss (1986) sử dụng. Mỗi một trị thống kê này đều dựa trên
vài tính chất tối ưu, chi tiết về các phương pháp này được đề cập trong các bài
báo liệt kê trên. Bảng tiêu chuẩn chọn mô hình tóm tắt những tiêu chuẩn này
(n là số lần quan sát và k là số thông số ước lượng).
SGMASQ:
1
1
n
SS
−
⎟⎟⎠
⎞
⎜⎜⎝
⎛ ⎟⎠
⎞⎜⎝
⎛
−⎟⎠
⎞⎜⎝
⎛
n
kE HQ: ( ) nknE 2lnn
SS ⎟⎠
⎞⎜⎝
⎛
AIC: nkeE 2
n
SS ⎟⎠
⎞⎜⎝
⎛ RICE:
1
21
n
SS
−
⎟⎟⎠
⎞⎜⎜⎝
⎛ ⎟⎠
⎞⎜⎝
⎛
−⎟⎠
⎞⎜⎝
⎛
n
kE
FPE:
kn
knE
−
+⎟⎠
⎞⎜⎝
⎛
n
SS SCHWARZ: nknE ⎟⎠
⎞⎜⎝
⎛
n
SS
GVC:
2
1
n
SS
−
⎟⎟⎠
⎞⎜⎜⎝
⎛ ⎟⎠
⎞⎜⎝
⎛
−⎟⎠
⎞⎜⎝
⎛
n
kE SHIBATA: n
knE 2
n
SS +⎟⎠
⎞⎜⎝
⎛
Bảng: Các tiêu chuẩn chung chọn mô hình
Không cần thiết phải đưa 2R vào trong tiêu chuẩn vì 2R và SGMASQ
( )2σ) quan hệ nghịch, và vì vậy giá trị SGMASQ thấp cũng có nghĩa là 2R sẽ
có giá trị cao. 2R chỉ có ích khi xác định tỷ số của biến đổi trong Y được giải
thích bởi các biến X.
Một cách lý tưởng, chúng ta muốn có một mô hình có các giá trị của các
trị thống kê đều thấp, khi so sánh với một mô hình khác. Mặc dù có thể xếp
hạng một vài tiêu chuẩn này đối với một giá trị ESS, n, và k cho trước, thứ tự
này sẽ không còn ý nghĩa nữa bởi vì các mô hình đều có ESS và k khác nhau.
Trong những trường hợp đặc biệt, một số tiêu chuẩn trở nên dư thừa – nghĩa
là, một mô hình ưu việt hơn theo một tiêu chuẩn cũng sẽ ưu việt hơn xét theo
các tiêu chuẩn khác. Tuy nhiên, một cách tổng quát, có thể tìm được một mô
hình ưu việt theo một tiêu chuẩn nhưng lại không ưu việt theo tiêu chuẩn
khác. Ví dụ, tiêu chuẩn Schwarz coi trọng về tính phức tạp của mô hình hơn
là các yếu tốt khác và vì vậy có thể dẫn đến một kết luận khác. Một mô hình
tốt hơn một mô hình khác theo một số tiêu chuẩn sẽ được ưa chuộng hơn. Tuy
nhiên, tiêu chuẩn AIC là tiêu chuẩn được sử dụng phổ biến nhất trong phân
tích chuỗi thời gian.
2.4.2. Phương pháp dự báo chuỗi thời gian
Như phần trên đã trình bày, các mô hình kinh tế lượng chủ yếu dựa trên
một động thái rõ nét của các đối tượng có lien quan đến hệ thống kinh tế. Tuy
nhiên một họ các mô hình thay thế khác được sử dụng rộng rãi, đặc biệt trong
dự báo ngắn hạn, được gọi là các mô hình chuỗi thời gian. Chủ yếu, các mô
hình này nối kết một biến phụ thuộc với các giá trị của nó trong quá khứ và
với các sai số ngẫu nhiên mà có thể có tương quan theo chuỗi. Các mô hình
chuỗi thời gian không dựa trên bất kỳ một động thái kinh tế rõ nét nào. Cho
đên cách đây 30 năm, các mô hình chuỗi thời gian được sử dụng phổ biến
nhất trong kỹ thuật và các khoa học vật lý. Tuy nhiên, trong khoảng 2 thập
niên gần đây, các phương pháp chuỗi thời gian đã được sử dụng khá rộng rãi
trong kinh tế học, trong việc nghiên cứu sự biến đổi các thành phần trong sự
phát triển đời sống xã hội, đặc biệt với các dự báo ngắn hạn, trong đó các mô
hình chuỗi thời gian đã chứng tỏ là thích hợp hơn so với các mô hình kinh tế
lượng.
Chuỗi số thời gian là chuỗi các trị số của chỉ tiêu thống kê, dự báo,
nghiên cứu sự biến động, v.v… được sắp xếp theo thứ tự thời gian. Qua chuỗi
số thời gian có thể nghiên cứu các đặc điểm về sự biến động của hiện tượng,
vạch rõ xu hướng và tính quy luật của sự phát triển, đồng thời để dự đoán các
mức độ của hiện tượng trong tương lai.
Một chuỗi số thời gian có thể được cấu tạo bởi hai thành phần, đó là:
thời gian và chỉ tiêu về hiện tượng được nghiên cứu. Thời gian có thể là ngày,
tuần, tháng, năm, quý… Độ dài giữa hai thời điểm liền nhau được gọi là
khoảng cách thời gian. Chỉ tiêu về hiện tượng được nghiên cứu có thể là số
tuyệt đối, số tương đối, số bình quân. Trị số của chỉ tiêu gọi là mức độ của
chuỗi số.
Một cách tổng quát, các chuỗi thời gian thường được mô hình hoá dạng
tổng (hay tích) của 3 thành phần: (1) thành phần xu hướng, (2) thành phần
mùa và (3) thành phần ngẫu nhiên. Do đó ta có:
Yt = Tt + St + ut hay Yt = Tt * St * ut
Trong đó:
- Y là biến phụ thuộc
- T là thành phần xu hướng theo mùa
- S là thành phần mùa
- U là thành phần sai số ngẫu nhiên
Ví dụ về một xu hướng theo thời gian dạng tuyến tính đơn giản là:
Yt = α + βt
Và một số dạng đường xu hướng khác được sử dụng phổ biến:
(a) Đường thẳng: Yt = β1 + β2t + ut
(b) Bậc hai: Yt = β1 + β2t + β3t2 + ut
(c) Bậc ba: Yt = β1 + β2t + β3t2 + β4t3+ ut
(d) Log-tuyến tính: Yt = β1 + β2ln(t) + ut
(e) Nghịch đảo: Yt = β1 + β2(1/t) + ut
(f) Tuyến tính-log: ln(Yt) = β1 + β2t + ut ; Yt > 0
(g) Log-hai lần: ln(Yt) = β1 + β2ln(t) + ut ; Yt > 0
(h) Logistic: t
t
t ut
Y
Y
++=⎥⎦
⎤⎢⎣
⎡
−
211
ln ββ
Năm dạng đường xu hướng đầu tiên thì có Yt là biến phụ thuộc, hai dạng
đường tiếp theo thì ln(Yt) là biến phụ thuộc, và công thức cuối cùng có dạng
log hoá đối với Yt là biến phụ thuộc. Các giá trị của 2R chỉ so sánh được giữa
hai mô hình có cùng biến phụ thuộc. Hơn nữa, dạng log hoá đòi hỏi Yt và Yt/(1
– Yt) phải dương. Đường cong log là dạng hữu ích khi Yt ở giữa 0 và 1 hoặc
khi Yt là trị số phần trăm.
Thành phần mùa là thành phần do hiện tượng mùa vụ xảy ra thường
xuyên chẳng hạn như tháng, quý, tuần, ngày, giờ, các ngày nghỉ lễ, v.v…
Cấu trúc của các mô hình chuỗi thời gian:
2.4.2.1. Các mô hình tự hồi quy
(AR – Auto Regressive)
Mô hình chuỗi thời gian tự hồi quy hoàn toàn có cấu trúc như sau:
Yt = α1Yt-1 + α2Yt-2 + … + αpYt-p + ut (2.22)
Trong đó Yt là quan sát thứ t đối với biến phụ thuộc sau khi trừ đi giá trị
trung bình của chính nó, và ut là thành phần sai số có động thái tốt có trung
bình bằng 0 và phương sai không đổi và không tương quan với us nếu t ≠ s
(khái niệm này gọi là nhiễu trắng – white noise). Thành phần hằng số được
bỏ qua vì Yt được biểu diễn dạng độ thiên lệch khỏi giá trị trung bình. Nói
cách khác, Yt được mô hình hoá chỉ với quá khứ của nó mà không phải với
các biến độc lập khác. Đây là các mô hình tự hồi qui, AR và mô hình trong
phương trình (2.22) được gọi là mô hình AR(p), với p là bậc tự hồi qui.
2.4.2.2. Các mô hình trung bình trượt
(MA – Moving Average)
Mô hình sau đây gọi là mô hình trung bình trượt MA bậc q, kí hiệu là
MA (q)
Yt = νt – β1 νt-1 – β2 νt-2 – …– βq νt-q (2.23)
với νt là chuỗi sai số nhiễu trắng. Do đó, Yt là tổ hợp tuyến tính của các
biến ngẫu nhiên nhiễu trắng.
2.4.2.3. Các mô hình ARMA
(Auto Regressive Moving Average)
Phối hợp giữa các công thức tự hồi quy và trung bình trượt tạo ra mô
hình ARMA. Do đó mô hình ARMA (p, q) có dạng tổng quát:
Yt = α1Yt-1 + α2Yt-2 + … + αpYt-p + νt – β1 νt-1 – β2 νt-2 – …– βq νt-q (2.24)
Hàm tự tương quan:
Xét hệ số tương quan r(s) giữa ut và ut-s đối với những giá trị của s từ 0
đến t-1. Hàm này gọi là hàm tự tương quan. Định nghĩa hàm tự tương quan
như sau:
( ) ( )( )
( )
( )2
,
,)(
t
stt
t
stt
stt uE
uuE
uVar
uuCov
uuCovsr −−
−
=== (2.25)
nó có thể được ước lượng bằng hệ số tương quan của mẫu giữa ut và ut-s.
Đồ thị tương quan:
Là đồ thị của r(s) theo s, với s = 0, 1, …, t-1. Nó là một chỉ dẫn hữu ích
để xác định mức độ tương quan của thành phần sai số (ut) với các sai số trong
quá khứ ut-1, ut-2, …
Là một đồ thị hữu ích để giúp nhận ra các dạng thức trong mối tương
quan giữa các chuỗi
Tính dừng:
Ta xét trường hợp hàm tự tương quan r(s) là độc lập với t, thời đoạn mà
các tương quan của phần dư hiện tại và quá khứ được đo, và chỉ phụ thuộc
vào khoảng cách (s) giữa thời đoạn t và thời đoạn (t-s) để tính tương quan.
Hơn nữa ut được giả định là có phương sai hữu hạn. Đặc tính này được gọi là
tính dừng, và bất kỳ chuỗi thời gian nào tuân theo điều này sẽ được gọi là
chuỗi thời gian dừng. Do vậy quá trình tạo ra các nhiễu rối ngẫu nhiên là
không biến động theo thời gian. Không có tính dừng, Var (ut-s) và Var (ut) là
như nhau.
Các mô hình không dừng, sai phân hoá:
Ta thấy điểm dừng có đặc tính tương quan giữa một biến tại thời đoạn t
là (Yt) và giá trị của nó ở thời đoạn s là (Ys) chỉ phụ thuộc vào khoảng cách (t–
s) giữa hai thời đoạn. Một chuỗi dừng có giá trị trung bình là hằng số (không
nhất thiết = 0) và phương sai không đổi theo thời gian. Quá trình tạo ra chuỗi
này là không biến động theo thời gian. Tuy nhiên, hầu hết các chuỗi trong
kinh tế có tính không dừng vì chúng tăng trưởng dần theo thời gian. Chẳng
hạn, nếu Yt có xu hướng theo thời gian dạng tuyến tính hay lũy thừa thì nó sẽ
không dừng. Vậy, trong trường hợp đó ta phải làm thế nào? Hầu hết các chuỗi
thời gian không dừng đều có thể được chuyển thành dạng dừng nhờ quá trình
sai phân hoá. Xét một xu hướng tuyến tính có dạng Yt = α + βt. Sai phân
bậc nhất của Yt được định nghĩa là: ΔYt = Yt – Yt-1. Ta thấy:
ΔYt = α + βt - α - β(t-1) = β
Là hằng số và do đó nó có tính dừng. Do đó, xu hướng tuyến tính có thể
được loại bỏ bằng cách lấy sai phân một lần. Nếu một chuỗi tăng trưởng theo
luỹ thừa với mức tăng không đổi, ln(Yt) sẽ có xu hướng tuyến tính và có thể
lấy sai phân. Dễ dàng chứng minh được là xu hướng bậc 2 có thể được loại bỏ
bằng cách lấy sai phân 2 lần. Sai phân bậc hai (ký hiệu là Δ2Y) được định
nghĩa là sai phân bậc nhất của sai phân bậc nhất. Do đó:
Δ2Yt = (Yt – Yt-1) - (Yt-1 – Yt-2) = Yt – 2Yt-1 + Yt-2 (2.26)
Một dạng khác mà trong đó tính không dừng thường xuất hiện đó là tính
mùa. Tính không dừng trong các chuỗi theo tháng và theo quý thường có thể
được loại bỏ bằng cách lấy sai phân thích hợp: Δ4 = Yt – Yt-4 đối với dữ liệu
theo quý và Δ12 = Yt – Yt-12 đối với dữ liệu theo tháng.
2.4.2.4. Mô hình ARIMA
(Auto Regressive Intergrated Moving Average)
Giả sử rằng, một chuỗi thời gian không dừng có thể được chuyển thành
một chuỗi dừng bằng cách lấy sai phân d lần. Thì chuỗi đó được gọi là tích
hợp bậc d và được viết là I(d). Chuỗi dừng do sai phân sau đó sẽ có thể được
mô hình hoá theo ARMA (p, q). Trong trường hợp này quá trình tạo ra chuỗi
Yt được gọi là tự hồi qui tích hợp trung bình trượt, và mô hình đó là mô
hình ARIMA, kí hiệu ARIMA (p, d, q).
Ước lượng và dự báo với mô hình ARIMA
George Box và Gwilym Jenkins (1976) đã nghiên cứu mô hình ARIMA
và tên của họ thường được dùng để gọi tên các quá trình ARIMA tổng quát,
áp dụng vào việc phân tích và dự báo các chuỗi thời gian. Phương pháp Box-
Jenkins đề xuất một phương pháp cụ thể gồm 4 giai đoạn:
1. Nhận dạng, xác định p, d, q
2. Ước lượng, bao gồm việc ước lượng các tham số của phương trình
(2.22) trong đó vế trái là chuỗi được lấy sai phân d lần.
3. Kiểm tra chẩn đoán, bao gồm việc áp dụng các kiểm định khác nhau
để xem mô hình ước lượng có thích hợp với dữ liệu một cách thoả đáng hay
không. Nếu mô hình chưa thích hợp thì lặp lại quá trình.
4. Dự báo, thực hiện việc dự báo theo mô hình đã chọn.
NHẬN DẠNG: Bởi vì hầu hết các chuỗi thời gian thay đổi theo thời
gian một cách có hệ thống, bước đầu tiên của giai đoạn nhận dạng là chọn d,
số lần lấy sai phân để làm cho nó xấp xỉ dừng (thoả mãn tính dừng). Đồ thị vẽ
chuỗi theo thời gian thường cho thấy chứng cứ về bản chất của chuỗi. nếu
chuỗi biểu thị sự tăng trưởng theo luỹ thừa, thì đầu tiên hãy lấy logarit và vẽ
nó theo thời gian. Nếu rõ rang là có xu hướng tuyến tính, chung ta sẽ lấy sai
phân chuỗi (hay log của nó) một lần và vẽ chuỗi đã lấy sai phân. Nếu vẫn thể
hiện xu hướng, có thể phải lấy sai phân lần thứ hai. Chuỗi thời gian về kinh tế
hiếm khi phải lấy sai phân hơn hai lần.
Cách thứ hai để nhận ra xem có cần thiết phải lấy sai phân không là tính
hàm tự tương quan(ACF) đã được định nghĩa trước đây và vẽ đồ thị tương
quan. Đồ thị tương quan là đồ thị của các hệ số tương quan giữa một chuỗi và
các giá trị của nó trong quá khứ. Nếu đồ thị này giảm từ từ thì phải có chỉ
định phải lấy sai phân. Tiếp theo vẽ đồ thị tương quan của các sai phân bậc
nhất. Nếu đồ thị này tiếp tục giảm từ từ thì lại có chỉ định phải lấy sai phân
bậc hai.
Tính không dừng do các ảnh hưởng mùa được xử lý bằng cách tách mùa
cho chuỗi. Cách đơn giản để tách thành phần mùa trong một chuỗi dữ liệu
tháng là lấy sai phân Yt – Y t-12. Hoặc, ta lấy hồi quy Yt theo các biến giả theo
mùa và sau đó lấy phần dư của chương trình đã được thích hợp hoá, với các
ảnh hưởng mùa đã bị loại ra. Nếu các ảnh hưởng mùa xuất hiện, ACF sẽ có
đỉnh nhọn ở những khoảng đều đặn (xem hình minh hoạ 2.1 về dữ liệu tháng).
Hình 2.1. Đồ thị tương quan với dữ liệu doanh số theo tháng
Sai phân Yt – Yt-12 thường loại bỏ các ảnh hưởng mùa và xu hướng tuyến
tính.
Hình 2.2. Đồ thị tương quan đối với dữ liệu sai phân 12 tháng
Các chọn lựa ban đầu về bậc của tự hồi quy và các thành phần trung bình
trượt (p và q) thường được thực hiện đồng thời. Đối với những giá trị độ trễ
lớn (ký hiệu k), ACF lý thuyết của mô hình AR(p) sẽ xấp xỉ dạng Apk (với -
1<ρ<1). Nếu ρ là dương thì ACF sẽ giảm dần. nếu ρ là âm thì hàm số sẽ được
bao bởi một cặp đường cong như hình 2.22.
Hình 2.3. Đồ thị tương quan đối với AR(p)
Với mô hình MA(q) thì đồ thị tương quan về lý thuyết là bằng 0 đối với
các độ trễ lớn hơn q nhưng không có dạng cụ thể trước q (xem hình 2.23). Đồ
thị tương quan ước lượng có thể dung như một chỉ dẫn để chọn giá trị q. Nếu
đồ thị tương quan vẫn duy trì gần 0 sau một độ trễ cụ thể nào đó, thì độ trế đó
sẽ là lựa chọn tốt cho giá trị q.
Hình 2.4. Đồ thị tương quan đối với MA(q)
Để chọn giá trị ban đầu cho p, sử dụng một hàm khác gọi là hàm tự
tương quan riêng phần (PACF – Partial Auto Correlation Function) và đồ thị
đi kèm là đồ thị tương quan riêng phần. Giả sử chúng ta thích hợp hoá một
mô hình tự hồi quy bậc nhất có dạng: Yt = a11Yt-1 + ut và ước lượng a11 bằng
OLS (thành phần hằng số được bỏ qua bằng cách lấy Yt là độ lệch khỏi giá trị
trung bình của chuỗi). Tiếp theo chúng ta ước lượng mô hình AR(2) có dạng
Yt = a21Yt-1 + a22Yt-2 + ut
Và thu được 22a
) . Bằng cách tiến hành này chúng ta có thể thu được kka
) là
hệ số hồi qui ước lượng của Yt-k khi mô hình tự tương quan bậc k được ước
lượng. Đồ thị kka
) là đồ thị tương quan riêng phần. Nó là tương quan giữa Yt và
Yt-k sau khi ảnh hưởng của các Y khác đã được loại bỏ. Đồ thị tương quan
riêng phần về lý thuyết có đặc tính là nếu bậc của tự hồi quy là p thì akk = 0
với mọi k > p.
Do đó, đồ thị tương quan riêng phần được ước lượng có thể được sử
dụng như một chỉ dẫn để chọn giá trị p. Nếu đồ thị tự tương quan riêng phần
vẫn duy trì gần 0 sau một độ trễ cụ thể nào đó, thì độ trễ đó sẽ là lựa chọn tốt
cho p. Hướng dẫn để nhận dạng mô hình chuỗi thời gian sơ bộ có thể tóm tắt
như sau:
1. Nếu đồ thị tự tương quan còn lại gần bằng 0 sau một độ trễ nào đó, q
chẳng hạn, thì sự lựa chọn thích hợp cho bậc của MA là q.
2. Nếu đồ thị tương tương quan riêng phần còn lại gần 0 sau một độ trễ
nào đó, p chẳng hạn, thì sự lựa chọn thích hợp cho bậc của AR là p.
3. Nếu hai điều trên không xảy ra nhưng cả hai đồ thị rốt cục lại giảm tới
0, chúng ta có thể bắt đầu với một mô hình ARMA(1,1) đơn giản.
ƯỚC LƯỢNG: Quy trình ước lượng các tham số của mô hình chuỗi
thời gian khá phức tạp và gồm cả việc giải hệ phương trình phi tuyến. Có
nhiều chương trình máy tính có thể tính đồ thị tương quan và đồ thị tương
quan riêng phần được sử dụng để nhận dạng mô hình, và sau đó tự động thực
hiện quá trình ước lượng (EViews, FORECAST MASTER, FORECAST
PRO, TSP, MicroTSP, v.v…)
KIỂM TRA CHẨN ĐOÁN: Giai đoạn kiểm tra chẩn đoán bao gồm
việc cho mô hình ước lượng chịu các loại kiểm định khác nhau để đảm bảo là
nó thích hợp một cách thoả đáng với dữ liệu. Cách tốt nhất để khảo sát xem
một mô hình có thích hợp hay không với dữ liệu là tiến hành kiểm chứng hậu
mẫu, nghĩa là, để dành một phần của mẫu (không sử dụng để ước lượng) để
dự báo kiểm định và sau đó đem so sánh các giá trị dự báo với giá trị đã biết
của Y. Các trị thống kê tóm tắt thường được sử dụng là sai số bình phương
trung bình và tiêu chí thong tin Akaile. Cách đơn giản khác là làm thích hợp
mô hình quá mức, nghĩa là thích hợp hoá một mô hình có bậc hơi cao hơn và
sau đó kiểm định xem các tham số dôi thêm có khác 0 một cách đáng kể
không.
Trong mọi trường hợp, nếu mô hình thích hợp tốt với dữ liệu, thì phần
dư từ mô hình ( tυ
) ) sẽ là nhiễu trắng. Qui trình thông thường là tính phần dư
và hàm tự tương quan của chúng và sau đó khảo sát xem có phải là các phần
dư xấp xỉ một chuỗi nhiễu trắng không. Box và Pierce (1970) đã đề xuất một
kiểm định chính thức cho việc này. Qui trình là tính trị thống kê Box – Pierce.
∑=
=
=
Kk
k
krnQ
1
2 (2.26)
Với rk là tự tương quan bậc k của các phần dư ( tυ
) ), n là số quan sát, và k
là giá trị được chọn trước của các tự tương quan (chẳng hạn, 20 hay cao hơn).
Nếu chuỗi phần dư là nhiễu trắng, thì Q sẽ có phân phối chi-square, với k – p
– q bậc tự do. Nếu q lớn hơn giá trị chuẩn của chi-square, thì chúng ta kết
luận là chuỗi phần dư không là nhiễu trắng. Một kiểm định gần đây được sử
dụng phổ biến là Ljung & Box (1978). Trị thống kê kiểm định Ljung-Box
cho bởi:
∑=
=
⎥⎦
⎤⎢⎣
⎡
−
+=
Kk
k
k
kn
r
nnLJB
1
'
2
'' )2( (2.27)
Trong đó n’ = n – d là số các quan sát được sử dụng sau khi chuỗi được
lấy sai phân d lần. Dưới giả thiết không cho rằng các phần dư thực chất là
nhiễu trắng, LJB có phân phối chi-square với độ tự do là K-p-q. Tiêu chuẩn để
chấp nhận hay loại bỏ trong kiểm định tương tự như trong kiểm định Box-
Pierce.
DỰ BÁO: Bước cuối cùng là thực hiện việc dự báo thật. Chúng ta thấy
từ phương trình (2.3) rằng giá trị dự báo trước một thời đoạn được cho bởi
(cho vn+1 tiến đến 0):
qnqnnpnpnnn YYYY −+−−+−+ −−−−+++= 112111211 ...... υβυβυβααα )
))))))))) (2.28)
Nếu chuỗi phải được lấy sai phân để làm cho nó dừng thì trị dự báo là
nnn YYY
)))
−=Δ ++ 11 từ đó 1+nY
)
sẽ được tính ra là 1+Δ+ nn YY
))
. Nếu chuỗi được lấy sai
phân 2 lần, thì từ phương trình (2.4) ta có:
1
2
11 2 +−+ Δ+−= nnnn YYYY
))
TÓM TẮT
Một trong các ứng dụng chủ yếu của mô hình kinh tế lượng là để dự báo
hay dự đoán. Cả hai nhóm phương pháp dự báo: Kinh tế lượng và chuỗi thời
gian. Dự báo kinh tế lượng đặt cơ sở trên mô hình hồi quy để nối kết một (hay
nhiều) biến phụ thuộc với một số biến độc lập. Dự báo chuỗi thời gian nối kết
biến phụ thuộc với các giá trị của nó trong quá khứ và cố gắng sử dụng mối
quan hệ này để dự báo biến phụ thuộc.
Một môi trường dự báo bao gồm ba giai đoạn. Một người khảo sát sử
dụng một mẫu các quan sát và ước lượng mô hình. Các giá trị dự báo của biến
phụ thuộc trong thời kỳ trong mẫu này còn được gọi là các giá trị thích hợp
hoá. Các giá trị dự báo ngoài mẫu có thể là kiểm định hay tiên nghiệm. Dự
báo kiểm định là đối với giai đoạn mà trong đó các giá trị thực tế của biến phụ
thuộc và độc lập đều đã biết. Các giá trị dự báo như thế thường được so sánh
với giá trị thực tế để đánh giá năng lực dự báo của mô hình. Các dự báo tiên
nghiệm là dự báo cho tương lai với các giá trị của biến độc lập được dự báo từ
các mô hình khác.
Dự báo có thể là có điều kiện hoặc không điều kiện. Khi các giá trị của
các biến độc lập là biết trước thì ta có dự báo có điều kiện. Dự báo không điều
kiện được tạp ra khi các giá trị của các biến ngoại sinh không được biết trước
mà được tạo ra từ bản thân mô hình hay từ một mô hình hỗ trợ khác.
Việc đánh giá năng lực dự báo của một mô hình được thực hiện theo một
số cách. Đầu tiên, chúng ta lấy ra một phần của mẫu và không sử dụng chúng
cho mục đích ước lượng. Kế đến, chúng ta tạo ra các dự báo cho mẫu được
lấy ra (đây là dự báo kiểm định) và tính sai số dự báo và tổng bình phương
sai số dự báo (ESS). Giá trị này có thể được dùng để tính các trị thống kê để
lựa chọn mô hình được liệt kê trong bảng Tiêu chuẩn chọn mô hình. Một mô
hình có các giá trị thấp hơn ở hầu hết các trị thống kê tiêu chuẩn thì được xem
là trội hơn. Hơn nữa, chúng ta tiến hành hồi quy các giá trị dự báo theo một
hằng số và giá trị thực tế. Nếu dự báo là hoàn hảo, chúng ta sẽ kỳ vọng là
thành phần hằng số ước lượng sẽ gần bằng 0 và thành phần độ dốc ước lượng
gần bằng 1.
Làm thích hợp bằng đường xu hướng là một kỹ thuật được sử dụng phổ
biến để diễn tả biến phụ thuộc của một hàm chỉ theo thời gian. Dạng hàm
nhận được có thể là tuyến tính, bậc hai, log tuyến tính, nghịch đảo, tuyến tính
log, log-hai lần hay logistic.
Một nhà quan sát mà chỉ quuan tâm đến xu hướng rõ nét của một chuỗi
thời gian hơn là đến sự biến động xung quanh xu hướng đó thì có thể làm trơn
dữ liệu bằng cách sử dụng trị trung bình của một số các thành phần lien tiếp
nhau (gọi là trung bình trượt) hoặc làm trơn theo luỹ thừa, nghĩa là tạo ra một
trung bình có trọng số của các giá trị hiện tại và quá khứ của chuỗi, các trọng
số giảm dần theo luỹ thừa khi chúng ta lùi về quá khứ. Kỹ thuật này có thể
được sử dụng đối với các sai số dự báo để có được các dự báo thích nghi.
Khi nhiều phương án mô hình có dấu hiệu là tạo ra được các giá trị dự
báo khá tốt, thì tốt hơn ta nên kết hợp các dự báo hơn là chọn lấy một mô hình
tốt nhất và bỏ các mô hình khác. Phương pháp tối ưu để kết hợp dự báo là lấy
hồi quy (sử dụng dữ liệu của mẫu hay dữ liệu giai đoạn kiểm định) các giá trị
thực tế theo một hằng số và các trị dự báo được tạo ra từ các phương án mô
hình. Các hệ số ước lượng sau đó được dung như các trọng số đối với dự báo
kết hợp. Trong thời kỳ mẫu, trị dự báo kết hợp có tổng sai số bình phương
nhỏ nhất, với sai số dự báo bình phương bằng 0, ngay cả khi các dự báo riêng
lẻ bị thiên lệch.
Trong các mô hình kinh tế lượng, các giá trị dự báo được tạo ra bằng
cách thay các giá trị dự báo hay giả định cho các biến độc lập. Nếu có tương
quan chuỗi trong các phần dư, các sai số có thể được mô hình hoá với quá
trình tự hồi quy và thong tin được dung để thu được các dự báo có hiệu quả
hơn.
Các mô hình chuỗi thời gian nối kết một biến phụ thuộc với các giá trị
của nó trong quá khứ. Một chuỗi thời gian tự hồi quy hoàn toàn (mô hình AR)
sẽ nối kết biến phụ thuộc với các giá trị của nó trong quá khứ với các sai số
nhiễu trắng (white noise). Mô hình trung bình trượt (mô hình MA) nối kết một
biến phụ thuộc với một tổ hợp tuyến tính của các thành phần sai số nhiễu
trắng. Mô hình ARMA là tổ hợp các đặc tính của AR và MA vào trong một mô
hình.
Đồ thị tương quan là một đồ thị hữu ích để giúp nhận ra các dạng thức
trong mối tương quan giữa các chuỗi. Nó vẽ hàm tự tương quan, nghĩa là cho
hệ số tương quan giữa các giá trị của một chuỗi tại thời gian t và tại t-s với
các giá trị s khác nhau.
Đặc tính dừng có tính chất là chuỗi có trị trung bình và phương sai
không đổi theo thời gian, và tương quan giữa một biến tại thời gian t và tại s (t
≠ s) chỉ tuỳ thuộc vào khoảng cách t-s giữa 2 thời đoạn. Một chuỗi không
dừng thường có thể được lấy sai phân (bằng cách tính sự thay đổi giữa một
thời đoạn và thời đoạn kế tiếp) để làm cho nó dừng. Đôi khi có thể phải tiến
hành lấy sai phân nhiều lần hoặc chuyển sang dạng log trước khi lấy sai phân.
Một xu hướng tuyến tính có thể được loại bỏ bằng cách lấy sai biệt 1 lần, xu
hướng bậc hai có thể được loại bỏ bằng cách lấy sai phân 2 lần, v.v… Dữ liệu
theo quý và tháng thường biểu hiện các tác động mùa. Nó có thể được loại bỏ
bằng cách sai phân bậc 4 hay 12, nghĩa là Yt – Yt-4 hay Yt – Yt-n. Các mô hình
ARIMA là những mô hình được lấy sai phân bậc nhất nhiều lần để tạo ra tình
trạng dừng và sau đó lấy một mô hình ARMA để thích hợp chúng.
Việc ước lượng một mô hình chuỗi thời gian bao gồm 3 giai đoạn: (1)
Nhận dạng, (2) Ước lượng và (3) Kiểm định chẩn đoán. Nhận dạng là quá
trình xác định bậc của sai phân, của mô hình tự hồi quy và của mô hình trung
bình trượt. Các đồ thị tương quan và tương quan riêng phần được dung để
nhận dạng các mô hình. Kiểm định chẩn đoán là quá trình cho mô hình trải
qua kiểm định để xem nó có thích hợp một cách thoả đáng hay không? Hai
kiểm định tthwờng được dung ở đây là Box-Pierce và Ljung-Box. Một khi mô
hình đã được đánh giá là phù hợp, các dự báo sẽ được tạo ra từ mô hình được
ước lượng.
2.5. Đánh giá các mô hình
- Đánh giá độ chính xác và tính hợp lệ của mô hình dự báo.
- Thu nhặt dữ liệu để kiểm tra Mô hình
Dữ liệu thu được thường được xem như rất “đắt”. Thực tế, công nghệ
“làm mềm” chất xám, mà chúng ta trở nên tự tin hơn vào các phương sách;
hơn nữa, dữ liệu có thể tin cậy được cần thiết để kiểm tra một mô hình định
lượng. Các mô hình toán học, đôi khi thoát khỏi sự đánh giá của người ra
quyết định. Hay cách khác, một số người thường nghĩ theo phương pháp đại
số; những người khác lại nhìn theo phương pháp hình học. Khi dữ liệu là
phức tạp hay nhiều chiều, thì có nhiều lý do để làm việc với các công thức.
Quá trình mô hình trên được sử dụng để:
• hiểu được cơ chế ưu tiên tạo ra chuỗi thời gian. Bao gồm mô tả, giải
thích sự biến đổi, tính thời vụ, xu hướng vvv...
• dự đoán tương lai với điều kiện mọi chuyện sẽ đâu vào đấy
• điều khiển hệ thống, để thực hiện chuỗi sự kiện nếu xảy ra trong
tương lai.
Dự báo thống kê: Sự lựa chọn và thực hiện một phương pháp dự báo
chính xác luôn luôn là một kế hoạch quan trọng và điều khiển lợi nhuận đối
với hầu hết các hãng và các đại lý. Thông thường, tình trạng tài chính của
toàn bộ quá trình hoạt động đều dựa vào độ chính xác của dự báo vì những
thông tin này sẽ được sử dụng để tạo ra ngân sách tương quan và các quyết
định mang tính chất hệ thống trong các lĩnh vực quản lý nhân sự, lợi tức, thị
trường và quảng cáo, vốn tài chính, v.v….
Có hai hướng chính để dự báo. Cả dự đoán giá trị tương lai dựa trên
phân tích các yếu tố tin cậy ảnh hưởng đến giá trị tương lai, ví dụ như phương
pháp giải thích, đến dự đoán dựa trên một phương pháp học suy luận của dữ
liệu đã có trong quá khứ qua thời gian, ví dụ phương pháp ngoại suy.
Tự động tương quan: Tự tương quan là một chuỗi các tương quan của
chuỗi các khoảng cách thời gian bằng nhau giữa các thành phần. Không giống
như dữ liệu thống kê mà là các mẫu ngẫu nhiên cho phép ta thực hiện việc
phân tích thống kê, đưa ra khả năng dự đoán và dự báo. Ba công cụ để đánh
giá tự tương quan của một chuỗi thời gian là đồ thị chuỗi thời gian, và ít nhất
là các giá trị tự tương quan thứ nhất và thứ hai.
Tóm tắt các phương pháp Dự báo:
Một cách lý tưởng, các tổ chức mà đủ khả năng làm như vậy sẽ gán dự
báo quyết định tương ứng với các phòng ban và/hoặc các cá nhân là có chất
lượng tốt nhất và có nguồn nhân lực cần thiết để tạo ra những ước lượng dự
báo như vậy dưới các mô hình nhu cầu phức tạp. Rõ ràng, một hãng với hoạt
động đang phát triển liên tục và một đội ngũ nhân viên kỹ thuật cùng với các
nhà thống kê, nhà khoa học quản lý, nhà phân tích máy tính vvv, vào các vị trí
tốt hơn nhiều để lựa chọn và đưa ra cách sử dụng chính xác cho các kỹ thuật
dự báo phức tạp hơn là một công ty với nhiều nguồn nhân lực giới hạn.
Một chuỗi thời gian là một tập các năng lực có thứ tự trên một đặc điểm
định lượng của một hiện tượng tại mọi điểm khoảng cách thời gian bằng
nhau. Một trong số các đích chính của việc phân tích chuỗi thời gian là để dự
báo các giá trị tương lai của các chuỗi.
Các file đính kèm theo tài liệu này:
- Mô hình dự báo kinh tế - Hệ hỗ trợ ra quyết định trong doanh nghiệp.pdf