Kết quả dự báo cho thấy giá trị dự báo xấp xỉ với giá trị thực tế và khoản tin cậy
95% cũng chứa giá trị thực tế. Điều này chứng tỏ độ tin cậy của mô hình dự báo là khá
cao. Trong một vài phiên giao dịch do tác động của các yếu tố ngoại lai lớn như tâ m lý
nhà đầu tư, tác động của các thị trường chứng khoán khác, thông tin về sự thay đổi chính
sách.sẽ làm cho sai số dự báo tăng cao hơn. Do đó kết quả của mô hình vẫn chỉ mang
tính chất tham khảo nhiều hơn. Tuy nhiên có thể nói mô hình ARIMA là một mô h ình tốt
để dự báo trong ngắn hạn.
32 trang |
Chia sẻ: lylyngoc | Lượt xem: 2949 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Ứng dụng tin học trong dự báo và phân tích dữ liệu tài chính, chứng khoán, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN
LỚP CAO HỌC CNTT QUA MẠNG – KHĨA 6
BÀI THU HOẠCH
MƠN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC
ĐỀ TÀI:
ỨNG DỤNG TIN HỌC
TRONG DỰ BÁO VÀ PHÂN TÍCH
DỮ LIỆU TÀI CHÍNH, CHỨNG KHỐN
Giảng viên: GS TSKH Hồng Kiếm
Sinh viên thực hiện: Nguyễn Hồng Hạc
MSSV: CH1101081
TP. HCM, NĂM 2012
2
Mở đầu
Khoa học và cơng nghệ là đặc trưng của thời đại, nghiên cứu khoa học đã trở thành
hoạt động sơi nổi và rộng khắp trên phạm vi tồn cầu. các thành tựu của khoa học hiện đại
đã làm thay đổi bộ mặt thế giới. Khoa học và cơng nghệ đã trở thành động lực thúc đẩy sự
tiến bộ nhân loại. Cùng với nghiên cứu khoa học hiện đại, mọi người đang chú ý đến
phương pháp nhận thức khoa học, coi đĩ là nhân tố quan trọng để phát triển khoa học.
Theo Gaudin, chúng ta khơng thể bằng lịng với vốn kiến thức quá hạn hẹp thu
nhận được trong những năm ngồi trên ghế nhà trường, mà phải học suốt đời, phải cĩ đủ
vốn kiến thức về phương pháp để tự mình học tập suốt đời.
Kiến thức về phương pháp cĩ thể được tích lũy trong kinh nghiệm lao động hay
được tích lũy trong quá trình nghiên cứu các khoa học cụ thể, song bản thân phương pháp
cũng cĩ một hệ thống lý thuyết của riêng mình.
Trong phạm vi của bài thu hoạch nhỏ này, chúng em sẽ trình bày một số vấn đề về
phương pháp nghiên cứu khoa học nĩi chung và đặc biệt là trong ngành tin học. Qua đây,
chúng em cũng xin được gửi lời cảm ơn đến Giáo sư - Tiến sĩ Khoa học Hồng Kiếm,
người đã tận tâm truyền đạt những kiến thức nền tảng cơ bản cho chúng em về mơn học
“Phương pháp nhiên cứu khoa học trong tin học”. Bên cạnh đĩ cũng khơng thể khơng
nhắc đến cơng lao trợ giúp của các chuyên gia cố vấn qua mạng thuộc Trung tâm phát
triển CNTT – ĐH Quốc gia TP.HCM và tồn thể các bạn bè học viên trong lớp.
3
MỤC LỤC
Mở đầu ..................................................................................................... 2
PHẦN I: GIỚI THIỆU ............................................................................. 5
I. Cơ sở lý thuyết về dự báo bằng phương pháp định lượng ............................................ 5
I.1. Dự báo chuỗi thời gian ........................................................................................... 5
I.2. Dự báo mơ hình nhân quả ...................................................................................... 8
II. Ứng dụng phương pháp định lượng dự báo trên thị trường chứng khốn ................... 8
II.1. Dự báo chuỗi thời gian ......................................................................................... 9
II.2. Dự báo bằng mơ hình nhân quả ............................................................................ 9
II.3. Dự báo bằng mạng thần kinh (Neural Network) ................................................ 10
PHẦN II: MƠ HÌNH ARIMA ............................................................... 12
I. Mơ hình ARIMA ......................................................................................................... 12
I.1. Hàm tự tương quan ACF...................................................................................... 12
I.2. Hàm tự tương quan từng phần PACF .................................................................. 14
II. Mơ hình AR(p) ........................................................................................................... 17
III. Mơ hình MA(q) ......................................................................................................... 18
IV. Sai phân I(d) ............................................................................................................. 18
V. Mơ hình ARIMA ....................................................................................................... 19
VI. Các bước phát triển mơ hình ARIMA ...................................................................... 20
VI.1. Xác định mơ hình: ............................................................................................. 20
VI.2. Ước lượng tham số: ........................................................................................... 20
VI.3. Kiểm định độ chính xác: ................................................................................... 20
VI.4. Dự báo : ............................................................................................................. 21
4
PHẦN III: ÁP DỤNG MƠ HÌNH ARIMA VÀO BÀI TỐN PHÂN
TÍCH DỮ LIỆU CHỨNG KHỐN ..................................................... 22
I. Mơ hình ARIMA cho dự báo tài chính, chứng khốn ................................................ 22
I.1. Dữ liệu tài chính ................................................................................................... 22
I.2. Mơ hình ARIMA cho bài tốn dự báo tài chính .................................................. 22
I.3. Thiết kế mơ hình ARIMA cho dữ liệu ................................................................. 23
I.3.1 Chọn tham biến ........................................................................................................................23
I.3.2 Chuẩn bị dữ liệu .......................................................................................................................23
I.3.3 Xác định thành phần p, q trong mơ hình ARMA ......................................................................24
I.3.4 Ước lượng các thơng số của mơ hình và kiểm định mơ hình phù hợp nhất ............................24
I.3.5 Kiểm tra mơ hình phù hợp nhất ...............................................................................................24
I.3.6 Dự báo ngắn hạn mơ hình ........................................................................................................25
II. Áp dụng ...................................................................................................................... 25
II.1. Dữ liệu ................................................................................................................ 25
II.2. Nhận dạng mơ hình ............................................................................................. 26
II.3. Ước lượng và kiểm định với mơ hình ARIMA .................................................. 27
II.4. Thực hiện dự báo ................................................................................................ 30
II.5. Kết luận ............................................................................................................... 31
Tài liệu tham khảo: ........................................................................... 32
5
PHẦN I: GIỚI THIỆU
Dự báo giá cổ phiếu, biến động của thị trường là một chủ đề thú vị, thu hút được
sự quan tâm của nhiều nhà đầu tư, chuyên gia, nhà khoa học. Hiện nay, nhiều phương
pháp dự báo đã được phát triển để dự báo xu hướng biến động giá cổ phiếu, thị trường
hoặc tìm kiếm các cổ phiếu tiềm năng để đầu tư. Ở Việt Nam, phương pháp phân tích và
dự báo được nhiều người biết đến nhất là phân tích kỹ thuật và phân tích cơ bản. Bên
cạnh đĩ, phương pháp phân tích và dự báo bằng định lượng thơng quá các mơ hình tốn
học đang dần được quan tâm.
Trong tiểu luận này tơi giới thiệu những nguyên tắc cơ bản về phương pháp dự báo
định lượng. Tơi cho rằng đây là một phương pháp khá hiệu quả và giúp hạn chế những
khiếm khuyết của 2 phương pháp dự báo phổ biến phân tích kỹ thuật và phân tích cơ bản.
Dự báo thị trường bằng phương pháp định lượng được sử dụng một cách khá phổ biến
trên thế giới. Nhiều quỹ đầu tư đã thiết lập các hệ thống giao dịch tự động bằng phương
pháp định lượng (quantitative trading). Hiệu quả từ phương pháp này đã được chứng
minh tại rất nhiều thị trường. Ưu điểm của phương pháp dự báo định lượng là những tín
hiệu đưa khá khách quan, dựa vào tiêu chí của những chỉ tiêu thống kê từ mơ hình. Những
tín hiệu mua bán được đưa ra dựa trên những phân tích khách quan nên giảm thiểu sự sai
sĩt do yếu tố con người. Dù vậy, nếu lạm dụng quá mức phương pháp này thì cũng sẽ tạo
ra những hệ quả xấu.
I. Cơ sở lý thuyết về dự báo bằng phương pháp định lượng
Các phương pháp định lượng dùng để dự báo dựa trên các mơ hình tốn với giả
định rằng mối liên hệ giữa các yếu tố được thiết lập trong quá khứ sẽ lặp lại trong tương
lai. Nĩi cách khác phương pháp định lượng dựa trên dữ liệu quá khứ để phát hiện chiều
hướng vận động trong tương lai của các yếu tố theo một quy luật nào đĩ. Để dự báo diễn
biến trong tương lai của một biến, người ta cĩ thể sử dụng mơ hình chuỗi thời gian hoặc
sử dụng biến nhân quả. Ngồi ra, người ta cịn sử dụng phương pháp khá phức tạp là
Neural Network.
I.1. Dự báo chuỗi thời gian
Các mơ hình dự báo chuỗi thời gian là dự báo giá trị tương lai của một biến số nào
đĩ, bằng cách phân tích số liệu quá khứ và hiện tại của những biến số đĩ. Giả định của dự
báo chuỗi thời gian là sự vận động trong tương lại của biến dự báo sẽ giữ nguyên xu thế
vận động trong quá khứ và hiện tại. Như vậy, chỉ cĩ chuỗi ổn định mới đưa ra được
6
những dự báo tin cậy. Tính ổn định của chuỗi dữ liệu thể hiện qua tính “dừng”, đây là
điều kiện quan trọng để phân tích và dự báo chuỗi thời gian.
Dự báo quá khứ gọi là dự báo hậu nghiệm và dự báo các giai đoạn trong tương lai
gọi là dự báo tiền nghiệm.
Tồn bộ dự báo được phân chia làm 2 giai đoạn là dự báo hậu nghiệm (ex-post) và
dự báo tiền nghiệm (ex-ante).
- Giai đoạn dự báo hậu nghiệm: Là thời gian từ quan sát đầu tiên sau khi chấm dứt
giai đoạn mẫu Yn+1 tới quan sát mới nhất YN. Giai đoạn hậu nghiệm là giai đoạn kiểm
nghiệm sự chính xác tính dự báo của mơ hình. Nếu như mơ hình khơng đảm bảo độ chính
xác theo yêu cầu thì lúc đĩ người dự báo cần tìm các giải pháp khác như tìm kiếm mơ
hình thay thế hoặc mở rộng mẫu dự báo.
- Giai đoạn dự báo tiền nghiệm: Là giai đoạn dự báo tương lai. Đây chính là mục
tiêu của dự báo, nhưng vì chưa xảy ra nên khơng thể so sánh được. Tuy vậy, một số tiêu
chí thống kê sẽ cho chúng ta đánh giá được mức độ tin cậy của mơ hình.
Tồn bộ quá trình dự báo được tĩm tắt ở sơ đồ sau:
7
8
I.2. Dự báo mơ hình nhân quả
Mơ hình dự báo này dựa trên sự tác động qua lại giữa các yếu tố với nhau, trong đĩ
biến dự báo (biến phụ thuộc) cĩ quan hệ nhân quả với các biến khác (biến độc lập).
Để thực hiện được dự báo theo mơ hình nhân quả người làm dự báo dựa trên các lý
thuyết về kinh tế, tài chính, các nghiên cứu thực nghiệm cĩ liên quan, kinh nghiệm thực
tế. Trước khi xây dựng mơ hình người làm dự báo phải thiết lập các cơ sở lý thuyết, mối
liên hệ giữa biến phụ thuộc (biến dự báo) và biến số khác (biến độc lập). Sau khi xác định
các bước trên sẽ cần phải tiến hành thu thập dữ liệu, xây dựng, ước lượng mơ hình, kiểm
định giả thuyết và cuối cùng là thực hiện dự báo.
II. Ứng dụng phương pháp định lượng dự báo trên thị trường
chứng khốn
Chúng ta vừa tìm hiểu các nguyên lý chung nhất về dự báo kinh tế. Sự biến động
của thị trường chứng khốn phản ánh sức khỏe của nền kinh tế và kỳ vọng của nhà đầu tư.
9
Cơ sở lý thuyết cho việc dự báo biến động của thị trường chứng khốn đã được chứng
minh khá rộng rãi. Nhiệm vụ của nhà dự báo là thiết lập các mơ hình để cĩ thể dự báo
những xu thế thị trường trong tương lai.
Thực tế chúng ta phải chấp nhận rằng khơng cĩ một mơ hình nào là hồn hảo để
dự báo mọi sự biến động của thị trường. Việc dự báo bằng định lượng cĩ thể sai sĩt khi
gặp những cú sốc của các biến số ngồi mơ hình khiến thị trường đảo chiều một cách đột
ngột. Ngồi ra, nếu nguồn dữ liệu đầu vào khơng được thu thập một cách khoa học, chính
xác cũng cĩ thể làm cho tính dự báo thiếu chính xác.
Tại Việt Nam, nghiên cứu định lượng để dự báo thị trường chứng khốn xuất hiện
chưa nhiều. Nguyên nhân chính là lực lượng những người làm dự báo cĩ đủ trình độ
chuyên mơn để thực hiện những phép tốn phức tạp là khá ít. Ngồi ra, do số liệu về kinh
tế, doanh nghiệp và thị trường chưa đủ dài và độ tin cậy chưa cao nên việc thực hiện các
dự báo trở nên khĩ khăn hơn.
Dưới đây, Tơi xin đưa ra một số phương pháp dự báo như sau:
II.1. Dự báo chuỗi thời gian
Sử dụng chuỗi thời gian để dự báo giá cổ phiếu hoặc các chỉ số thị trường được sử
dụng khá nhiều. Phương pháp dự báo này cĩ ưu điểm là chỉ sử dụng số liệu theo chuỗi
thời gian nên khá phù hợp cho dự báo thị trường chứng khốn. Tuy nhiên, nhược điểm
của nĩ là khơng hiệu quả trong việc dự báo được xu thế dài hạn của thị trường.
Mơ hình chuỗi thời gian thường được sử dụng nhất là mơ hình ARIMA và phương
pháp Box-Jenkins. Mơ hình ARIMA (Autoregressive Integrated Moving Average - Tự
hồi qui tích hợp Trung bình trượt), được George Box và Gwilym Jenkins (1976) nghiên
cứu. Phương pháp Box-Jenkins bao gồm bốn bước: nhận dạng mơ hình thử nghiệm; ước
lượng; kiểm định bằng chẩn đốn; và dự báo.
Mơ hình sử dụng để dự báo rủi ro ARCH/GARCH. ARCH/GARCH được sử dụng
khá phổ biến trong ngành tài chính để dự báo rủi ro. Mơ hình này dùng để dự báo độ giao
động suất sinh lời của cổ phiếu theo thời gian. Mơ hình ARCH (Autogressive Conditional
Heteroskedasticity) do Robert Engle và Clive Granger phát triển năm 1982. Mơ hình
GARCH (Generalised Autogressive Conditional Heteroskedasticity) được Tim Bollerslev
đề xuất năm 1986 để khắc phục những hạn chế của ARCH. Ngày nay, GARCH được sử
dụng một cách phổ biến và phù hợp với số liệu chuỗi thời gian ngắn như giá cổ phiếu trên
thị trường.
II.2. Dự báo bằng mơ hình nhân quả
10
Mơ hình nhân quả thường sử dụng số liệu bảng. Trong dự báo chứng khốn, biến
phụ thuộc (biến cần dự báo) là suất sinh lời của cổ phiếu, thị trường hay giá cổ phiếu và
chỉ số thị trường. Trong khi đĩ, các biến độc lập là các biến số của nền kinh tế như lạm
phát, thất nghiệp, cung tiền, tăng trưởng cơng nghiệp, tăng trưởng bán lẻ, niềm tin tiêu
dùng … hoặc là các biến số liên quan đến doanh nghiệp như lợi nhuận, tăng trưởng, giá
hàng hĩa liên quan đến quá trình sản xuất của doanh nghiệp. Nĩi tĩm lại là bất kỳ yếu tố
nào tác động đến sự biến động của thị trường, giá cổ phiếu đều cĩ thể trở thành biến độc
lập sử dụng cho dự báo.
Phương pháp này sử dụng các mơ hình hồi quy để tìm mối liên hệ giữa biến phụ
thuộc và biến độc lập. Qua mơ hình hồi quy, chúng ta cĩ thể dự báo được xu thế và những
nhân tố tác động đến biến động của giá chứng khốn hay thị trường.
Ưu điểm của phương pháp này là cĩ thể dự báo một cách khá chính xác xu hướng
biến động dài hạn của giá cổ phiếu hay thị trường. Tuy nhiên, việc thu thập dữ liệu là một
cơng việc khĩ khăn và tốn nhiều chi phí. Đối với Việt Nam, do các dữ liệu về doanh
nghiệp và nền kinh tế cịn ít nên áp dụng phương pháp dự báo này càng trở nên khĩ khăn.
II.3. Dự báo bằng mạng thần kinh (Neural Network)
Lý thuyết Neural Network được phát triển từ những năm 1940 đến nay và đã được
ứng dụng rộng rãi trong nhiều lĩnh vực. Lý thuyết Neural Network nhanh chĩng trở thành
một hướng nghiên cứu triển vọng trong mục đích xây dựng các máy thơng minh tiến gần
tới trí tuệ con người. Đối với lĩnh vực chứng khốn, Neural Network được sử dụng để dự
báo thị trường, giá cổ phiếu. Neural Network được xây dựng xuất phát từ một thực tế là
bộ não con người. Cĩ thể coi bộ não là một máy tính hay một hệ thống xử lý thơng tin
song song, phi tuyến và cực kỳ phức tạp. Bộ não cĩ khả năng tự tổ chức các bộ phận cấu
thành của nĩ, như là các tế bào thần kinh (neural) hay các khớp nối thần kinh (synapse),
nhằm thực hiện một số tính tốn như nhận dạng mẫu và điều khiển vận động nhanh hơn
nhiều lần các máy tính nhanh nhất hiện nay. Sự mơ phỏng bộ não con người của mạng
neural được dựa trên cơ sở một số tính chất đặc thù rút ra từ các nghiên cứu về thần kinh
sinh học.
Dữ liệu đầu vào để thực hiện dự báo bằng Neural Network khá đa dạng và tùy
thuộc vào trình độ, kinh nghiệm, mục tiêu dự báo và những cơ sở dữ liệu mà người làm
dự báo cĩ. Thơng thường dữ liệu bao gồm các dữ liệu liên quan đến giao dịch cổ phiếu
trên thị trường như giá, khối lượng…. Ngồi ra, các dữ liệu trong nền kinh tế, dữ liệu của
doanh nghiệp cũng cĩ thể làm đầu vào cho quá trình dự báo. Các thơng tin đầu vào sẽ
được xử lý bằng những thuật tốn phức tạp thơng qua tiến trình mơ phỏng việc xử lý
thơng tin như bộ não con người.
11
Hiện nay, cĩ khá nhiều phần mền miễn phí về Neural Network được đăng tải trên
mạng Internet. Tuy nhiên việc vận dụng thành thạo để dự báo thị trường là một cơng việc
khơng dễ dàng. Để làm được điều này người dự báo cần phải cĩ hàng loạt các kiến thức
sâu rộng khác để bổ trợ.
Trên đây tơi vừa giới thiệu những cơ sở lý thuyết và một số phương thức phổ biến
sử dụng để dự báo trên thị trường chứng khốn. Ưu điểm của các phương pháp định
lượng này là phân tích số liệu để đưa ra được những dự báo khách quan, để giảm thiểu rủi
ro của việc phân tích cảm tính của con người. Tuy nhiên, áp dụng phương pháp định
lượng trong dự báo sẽ cĩ khơng ít thách thức và nĩ cũng khơng phải là phương pháp thay
thế hồn tồn trực giác trong đầu tư.
Tơi cho rằng đây là một hướng phát triển trong tương lai đối với cơng tác dự báo
với dự báo thị trường chứng khốn Việt Nam. Tuy vậy, đây là cơng việc khĩ khăn và
phức tạp, địi hỏi người làm cơng tác dự báo cần cĩ trình độ chuyên mơn về kinh tế, tài
chính, tốn học và kinh nghiệm dự báo.
Kết quả nghiên cứu bước đầu cho thấy phương pháp định lượng hồn tồn cĩ thể
áp dụng để dự báo đối với thị trường Việt Nam. Sử dụng phương pháp định lượng dự báo
thị trường khá hiệu quả và hiệu quả càng tăng lên khi kết hợp với các phương pháp dự
báo khác
12
PHẦN II: MƠ HÌNH ARIMA
I. Mơ hình ARIMA
I.1. Hàm tự tương quan ACF
Hàm tự tương quan đo lường phụ thuộc tuyến tính giữa các cặp quan sát y(t) và
y(t+k), ứng với thời đoạn k = 1, 2, …(k cịn gọi là độ trễ). Với mỗi độ trễ k, hàm tự tương
quan tại độ trễ k được xác định qua độ lệch giữa các biến ngẫu nhiên Yt. Yt+k so với các
giá trị trung bình, và được chuẩn hĩa qua phương sai.
Dưới đây, giả thiết rằng các biến ngẫu nhiên trong chuỗi dừng thay đổi quanh giá
trị trung bình với phương sai hằng số . Hàm tự tương quan tại các độ trễ khác nhau sẽ
cĩ giá trị khác nhau.
Trong thực tế, ta cĩ thể ước lượng hàm tự tương quan tại độ trễ thứ k qua
phép biến đổi trung bình của tất cả các cặp quan sát, phân biệt bằng các độ trễ k,
với giá trị trung bình mẫu là , được chuẩn hĩa bởi phương sai 2.Chẳng hạn, cho mỗi
chuỗi N điểm, giá trị rk của hàm tự tương quan tại độ trễ thứ k được tính như sau :
∑
với:
∑
∑
yt: chuỗi thời gian dừng tại thời điểm t
yt+k : chuỗi thời gian dừng tại thời điểm t +k
^ : giá trị trung bình của chuỗi dừng
rk : giá trị tương quan giữa yt và yt+k tại độ trễ k
rk = 0 thì khơng cĩ hiện tượng tự tương quan
Về mặt lý thuyết, chuỗi dừng khi tất cả các rk = 0 hay chỉ vài rk khác khơng. Do
chúng ta xem xét hàm tự tương quan mẫu, do đĩ sai số mẫu sẽ xuất hiện vì vậy, hiện
tượng tự tương quan khi rk = 0 theo ý nghĩa thống kê.
13
Khi hàm tự tương quan ACF giảm đột ngột, cĩ nghĩa rk rất lớn ở độ trễ 1, 2 và cĩ ý
nghĩa thống kê (|t| >2). Những rk này được xem là những “đỉnh” và ta nĩi rằng hàm tự
tương quan ACF giảm đột ngột sau độ trễ k nếu khơng cĩ những “đỉnh” ở độ trễ k lớn
hơn k. Hầu hết hàm tự tương quan ACF sẽ giảm đột ngột sau độ trễ 1, 2.
Nếu hàm tự tương quan ACF của chuỗi thời gian khơng dừng khơng giảm đột ngột
mà trái lại giảm nhanh nhưng đều: khơng cĩ đỉnh, ta gọi chiều hướng này là “tắt dần”.
Hàm tự tương quan ACF cĩ thể “tắt dần” trong vài dạng sau :
Dạng phân phối mẫu
14
Dạng sĩng sin
Hoặc kết hợp cả hai dạng trên.
Sự khác nhau giữa hiện tượng “tắt dần” nhanh và “tắt dần” chậm đều được phân
biệt khá tùy tiện.
I.2. Hàm tự tương quan từng phần PACF
Song song với việc xác định hàm tự tương quan giữa các cặp y(t) và y(t+k), ta xác
định hàm tự tương quan từng phần cũng cĩ hiệu lực trong việc can thiệp đến các quan sát
y(t+1), ..., y(t+k-1). Hàm tự tương quan từng phần tại độ trễ k Ckk được ước lượng bằng
hệ số liên hệ y(t) trong mối kết hợp tuyến tính bên dưới. Sự kết hợp được tính dựa trên
tầm ảnh hưởng của y(t) và các giá trị trung gian y(t+k).
y(t+k) = Ck1y(t+k-1) + Ck2y(t+k-2) + ... + Ckk-1y(t + 1) + Ckky(t) + e(t)
Giải phương trình hồi quy dựa trên bình phương tối thiểu vì hệ số hồi quy Ckj phải
được tính ở mỗi độ trễ k, với j chạy từ 1 đến k.
Giải pháp ít tốn kém hơn do Durbin phát triển dùng để xấp xỉ đệ quy hệ số hồi quy
cho mơ hình ARIMA chuỗi dừng, sử dụng giá trị hàm tự tương quan tại độ trễ k là rk và
hệ số hồi quy của độ trễ trước. Dưới đây là phương pháp Durbin sử dụng cho 3 độ trễ đầu
tiên.
Độ trễ 1: Khởi tạo, giá trị của hàm tự tương quan từng phần tại độ trễ 1 cĩ cùng
giá trị với hàm tự tương quan tại độ trễ 1 vì khơng cĩ trung gian giữa các quan sát kết
tiếp: C11 = r1
Độ trễ 2: Hai giá trị C22 và C21 được tính dựa vào hàm tự tương quan r2 và r1, cùng
với hàm tự tương quan từng phần trước đĩ
15
Độ trễ 3: Tương tự, ba giá trị C33, C32, C31 được tính dựa vào các hàm tự tương
quan trước r3, r2, r1 cùng với các hệ số được tính ở độ trễ thứ 2: C22 và C21.
Tổng quan, hàm tự tương quan từng phần được tính theo Durbin :
∑
∑
Trong đĩ :
rk: Hàm tự tương quan tại độ trễ k
v: Phương sai
Ckj : Hàm tự tương quan từng phần cho độ trễ k, loại bỏ những ảnh hưởng của các
độ trễ can thiệp.
Ckj = Ck-1,j – (Ckk).C(k-1,k-j) k = 2,…; j = 1,2, …, k-1
C22 = (r2-r1
2
)/(1-r1
2
)
C11 = r1
Khi độ trễ tăng, số các hệ số tăng theo. Phương pháp của Durbin cho phép việc
tính đệ quy dựa vào việc sử dụng kết quả trước đĩ.
Tĩm lại, hàm tự tương quan ACF và hàm tự tương quan từng phần PACF của
chuỗi thời gian cĩ các đặc tính khác nhau. Hàm tự tương quan ACF đo mức độ phụ thuộc
tuyến tính giữa các cặp quan sát. Hàm tự tương quan từng phần PACF đo mức độ phụ
thuộc tuyến tính từng phần. ARIMA khai thác những điểm khác biệt này để xác định cấu
trúc mơ hình cho chuỗi thời gian.
Xu hướng vận động của hàm tự tương quan từng phần PACF cĩ thể giảm đột ngột
(thường sau độ trễ 1 hoặc 2) hay cĩ thể giảm đều. Cũng như hàm tự tương quan ACF, xu
hướng giảm đều của hàm tự tương quan từng phần PACF cũng cĩ các dạng phân phối mũ,
dạng sĩng hình sin hoặc kết hợp cả 2 dạng này
16
Dao động hàm mũ tắt dần (Damped Exponential)
Dao động tắt dần theo quy luật số mũ (Damped exponential oscillation)
17
Dao động sĩng tắt dần theo quy luật hình sin (Damped sine wave)
II. Mơ hình AR(p)
Ý tưởng chính của mơ hình AR(p) là hồi quy trên chính số liệu quá khứ ở những
chu kì trước.
Y(t) = a0 + a1y(t-1) + a2y(t-2) +…apy(t-p) + e(t)
Trong đĩ :
y(t) : quan sát dừng hiện tại
y(t-1), y(t-2), ... : quan sát dừng quá khứ (thường sử dụng khơng quá 2 biến này)
a0, a1, a2, … : các tham số phân tích hồi quy.
et: sai số dự báo ngẫu nhiên của giai đoạn hiện tại. Giá trị trung bình được mong
đợi bằng 0.
Y(t) là một hàm tuyến tính của những quan sát dừng quá khứ y(t-1). y(t-2), …
Nĩi cách khác khi sử dụng phân tích hồi quy y(t) theo các giá trị chuỗi thời gian
dừng cĩ độ trễ, chúng ta sẽ được mơ hình AR (yếu tố xu thế đã được tách khỏi yếu tố thời
gian, chúng ta sẽ mơ hình hĩa những yếu tố cịn lại – đĩ là sai số).
Số quan sát dừng quá khứ sử dụng trong mơ hình hàm tự tương quan là bậc p của
mơ hình AR. Nếu ta sử dụng hai quan sát dừng quá khứ, ta cĩ mơ hình tương quan bậc
hai AR(2).
Điều kiện dừng là tổng các tham số phân tích hồi quy nhỏ hơn 1 :
a1 + a2 + … + ap < 1
18
Mơ hình AR(1): y(t) = a0 + a1y(t-1) + e(t)
Mơ hình AR(2): y(t) = a0 + a1y(t-1) + a2y(t-2) +e(t)
III. Mơ hình MA(q)
Quan sát dừng hiện tại y(t) là một hàm tuyến tính phụ thuộc các biến sai số dự báo
quá khứ và hiện tại. Mơ hình bình quân di động là một trung bình trọng số của những sai
số mới nhất.
y(t) = b0 + e(t) +b1e(t-1) + b2e(t-2) + ... +bqe(t-q)
Trong đĩ:
y(t): quan sát dừng hiện tại
e(t): sai số dự báo ngẫu nhiên, giá trị của nĩ khơng được biết và giá trị trungbình
của nĩ là 0.
e(t-1), e(t-2), ...: sai số dự báo quá khứ (thơng thường mơ hình sẽ sử dụng khơng
quá 2 biến này)
b0, b1, b2, ...: giá trị trung bình của y(t) và các hệ số bình quân di động.
q: sai số quá khứ được dùng trong mơ hình bình quân di động, nếu ta sử dụng hai
sai số quá khứ thì sẽ cĩ mơ hình bình quân di động bậc 2 là MA(2).
Điều kiện cần là tổng các hệ số bình quân di động phải nhỏ hơn 1 :
b1 + b2 + ... + bq < 1
Mơ hình MA(1): y(t) = b0 + e(t) + b1e(t-1)
Mơ hình MA(2): y(t) = b0 + e(t) + b1e(t-1) + b2e(t-2)
IV. Sai phân I(d)
Chuỗi dừng: Chuỗi thời gian được coi là dừng nếu như trung bình và phương sai
của nĩ khơng đổi theo thời gian và giá trị của đồng phương sai giữa hai thời đoạn chỉ phụ
thuộc vào khoảng cách và độ trễ về thời gian giữa hai thời đoạn này chứ khơng phụ thuộc
vào thời điểm thực tế mà đồng phương sai được tính. Sai phân chỉ sự khác nhau giữa giá
trị hiện tại và giá trị trước đĩ. Phân tích sai phân nhằm làm cho ổn định giá trị trung bình
của chuỗi dữ liệu, giúp cho việc chuyển đổi chuỗi thành một chuỗi dưng.
Sai phân lần 1 I(1): z(t) = y(t)
Sai phân lần 2 I(2): h(t) = z(t) – z(t-1)
19
V. Mơ hình ARIMA
Mơ hình ARMA(p,q): là mơ hình hỗn hợp của AR và MA. Hàm tuyến tính sẽ bao
gồm những quan sát dừng quá khứ và những sai số dự báo quá khứ và hiện tại :
y(t)=a0+ a1y(t-1)+ a2y(t-2)+...+apy(t-p)+e(t)+b1e(t-1)+b2e(t-2)+...+ bqe(t-q)
Trong đĩ :
y(t) : quan sát dừng hiện tại
y(t-p), và e(t-q) : quan sát dừng và sai số dự báo quá khứ.
a0, a1, a2, ..., b1, b2, ... : các hệ số phân tích hồi quy
Ví dụ : ARMA(1,2) là mơ hình hỗn hợp của AR(1) và MA(2)
Đối với mơ hình hỗn hợp thì dạng (p,q) = (1,1) là phổ biến. Tuy nhiên, giá trị p và
q được xem là những độ trễ cho ACF và PACF quan trọng sau cùng. Cả hai điều kiện
bình quân di động và điều kiện dừng phải được thỏa mãn trong mơ hình hỗn hợp ARMA.
Mơ hình ARIMA(p,d,q): Do mơ hình Box-Jenkins chỉ mơ tả chuỗi dừng hoặc
những chuỗi đã sai phân hĩa, nên mơ hình ARIMA(p,d,q) thể hiện những chuỗi dữ liệu
khơng dừng, đã được sai phân (ở đây, d chỉ mức độ sai phân). Khi chuỗi thời gian dừng
được lựa chọn (hàm tự tương quan ACF giảm đột ngột hoặc giảm đều nhanh), chúng ta cĩ
thể chỉ ra một mơ hình dự định bằng cách nghiên cứu xu hướng của hàm tự tương quan
ACF và hàm tự tương quan từng phần PACF. Theo lý thuyết, nếu hàm tự tương quan
ACF giảm đột biến và hàm tự tương quan từng phần PACF giảm mạnh thì chúng ta cĩ mơ
hình tự tượng quan. Nếu hàm tự tương quan ACF và hàm tự tương quan từng phần PACF
đều giảm đột ngột thì chúng ta cĩ mơ hình hỗn hợp.
Về mặt lý thuyết, khơng cĩ trường hợp hàm tự tương quan ACF và hàm tự tương
quan từng phần cùng giảm đột ngột. Trong thực tế, hàm tự tương quan ACF và hàm tự
tương quan từng phần PACF giảm đột biến khá nhanh. Trong trường hợp này, chúng ta
nên phân biệt hàm nào giảm đột biến nhanh hơn, hàm cịn lại được xem là giảm đều. Do
đơi lúc sẽ cĩ trường hợp giảm đột biến đồng thời khi quan sát biểu đồ hàm tự tương quan
ACF và hàm tự tương quan từng phần PACF, biện pháp khắc phục là tìm vài dạng hàm
dự định khác nhau cho chuỗi thời gian dừng. Sau đĩ, kiểm tra độ chính xác mơ hình tốt
nhất.
Mơ hình ARIMA (1, 1, 1):
y(t) – y(t-1) = a0 + a1(y(t-1) – y(t-2) + e(t) + b1e(t-1))
Hoặc:
20
z(t) = a0 + a1z(t-1) + e(t) + b1e(t-1)
Với z(t) = y(t) – y(t-1) ở sai phân đầu tiên: d = 1.
Tương tự ARIMA(1,2,1):
h(t) = a0 + a1z(t-1) + e(t) + b1e(t-1),
Với h(t) = z(t) – z(t-1) ở sai phân thứ hai: d = 2.
Trong thực hành d lớn hơn 2 rất ít được sử dụng.
VI. Các bước phát triển mơ hình ARIMA
Phương pháp Box – Jenkins bao gồm các bước chung:
Xác định mơ hình
Ước lượng tham số
Kiểm định độ chính xác
Dự báo.
VI.1. Xác định mơ hình:
Mơ hình ARIMA chỉ được áp dụng đối với chuỗi dừng Mơ hình cĩ thể trình bày
theo dạng AR, MA hay ARMA. Phương pháp xác định mơ hình thường được thực hiện
qua nghiên cứu chiều hướng biến đổi của hàm tự tương quan ACF hay hàm tự tương quan
từng phần PACF.
Chuỗi ARIMA khơng dừng : cần phải được chuyển đồi thành chuỗi dừng trước khi
tính ước lượng tham số bình phương tối thiểu. Việc chuyển đổi này được thực hiện bằng
cách tính sai phân giữa các giá trị quan sát dựa vào giả định các phần khác nhau của các
chuỗi thời gian đều được xem xét tương tự, ngoại trừ các khác biệt ở giá trị trung bình.
Nếu việc chuyển đổi này khơng thành cơng, sẽ áp dụng tiếp các kiểu chuyển đổi khác
(chuyển đồi logarithm chẳng hạn).
VI.2. Ước lượng tham số:
Tính những ước lượng khởi đầu cho các tham số a0, a1,…, ap, b1, …, bq của mơ
hình dự định. Sau đĩ xây dựng những ước lượng sau cùng bằng một quá trình lặp.
VI.3. Kiểm định độ chính xác:
Sau khi các tham số của mơ hình tổng quát đã xây dựng, ta kiểm tra mức độ chính
xác và phù hợp của mơ hình với dữ liệu. Chúng ta kiểm định phần dư (Yt –Y^t) và cĩ ý
21
nghĩa cũng như mối quan hệ các tham số. Nếu bất cứ kiểm định nào khơng thỏa mãn, mơ
hình sẽ nhận dạng lại các bước trên được thực hiện lại.
VI.4. Dự báo :
Khi mơ hình thích hợp với dữ liệu đã tìm được, ta sẽ thực hiện dự báo tại thời điểm
tiếp theo t. Do đĩ, mơ hình ARMA(p,q) :
y(t+1) = a0 + a1y(t) + … + apy(t – p + 1) + e(t+1) + b1e(t) + … + bqe( t – q + 1)
22
PHẦN III: ÁP DỤNG MƠ HÌNH ARIMA VÀO BÀI TỐN
PHÂN TÍCH DỮ LIỆU CHỨNG KHỐN
I. Mơ hình ARIMA cho dự báo tài chính, chứng khốn
I.1. Dữ liệu tài chính
Dữ liệu chúng ta sử dụng là dữ liệu chuỗi thời gian. Đặc điểm chính để phân biệt
giữa dữ liệu cĩ phải là thời gian thực hay khơng đĩ chính là sự tồn tại của cột thời gian
được đính kèm trong đối tượng quan sát. Nĩi cách khác, dữ liệu thời gian thực là một
chuỗi các giá trị quan sát của biến Y:
Y = {y1, y2, y3,…, yt-1, yt, yt+1, …, yn}
với yt là giá trị của biến Y tại thời điểm t.
Mục đích chính của việc phân tích chuỗi thời gian thực là thu được một mơ hình
dựa trên các giá trị trong quá khứ của biến quan sát y1, y2, y3,…, yt-1, yt cho phép ta dự
đốn được giá trị của biến Y trong tương lai, tức là cĩ thể dự đốn được các giá trị yt+1,
yt+2,…yn. Trong bài tốn của chúng ta, dữ liệu chứng khốn được biết tới như một chuỗi
thời gian đa dạng bởi cĩ nhiều thuộc tính cùng được ghi tại một thời điểm nào đĩ.
Với dữ liệu đang xét, các thuộc tính đĩ là : Open, High, Low, Close, Volume
Open : Giá cổ phiếu tại thời điểm mở cửa trong ngày.
High : Giá cổ phiếu cao nhất trong ngày
Low : Giá cổ phiếu thấp nhất trong ngày
Close : Giá cổ phiếu được niêm yết tại thời điểm đĩng của sàn giao dịch
Volume : Khối lượng giao dịch cổ phiếu (bán, mua) trong ngày.
I.2. Mơ hình ARIMA cho bài tốn dự báo tài chính
Dựa vào trình tự cơ bản của phương pháp luận (Phần I) cùng cấu trúc và hoạt động
của mơ hình ARIMA (trong Phần II). Để áp dụng mơ hình ARIMA vào bài tốn dự báo
tài chính, ta xây dựng mơ hình dự báo.
Mơ hình gồm 3 quá trình chính:
Xác định mơ hình: Với đầu vào là tập dữ liệu chuỗi thời gian trong tài chính giúp
cho việc xác định ban đầu các thành phần trong mơ hình p, d, q, S.
23
Ước lượng, kiểm tra : Mơ hình ARIMA là phương pháp lặp, sau khi xác định các
thành phần, mơ hình sẽ ước lượng các tham số, sau đĩ thì kiểm tra độ chính xác của mơ
hình: Nếu hợp lý, tiếp bước sau, nếu khơng hợp lý, quay trở lại bước xác định
Dự báo: Sau khi đã xác định các tham số, mơ hình sẽ đưa ra dự báo cho ngày tiếp
theo.
I.3. Thiết kế mơ hình ARIMA cho dữ liệu
Việc thiết kế thành cơng mơ hình ARIMA phụ thuộc vào sự hiểu biết rõ ràng về
vấn đề, về mơ hình, cĩ thể dựa vào kinh nghiệm của các chuyên gia dự báo… Trong quá
trình tìm hiểu, khĩa luận sẽ đưa ra các bước để xây dựng một mơ hình như sau :
1. Chọn tham biến
2. Chuẩn bị dữ liệu
Xác định tính dừng của chuỗi dữ liệu
Xác định yếu tố mùa vụ
Xác định yếu tố xu thế
3. Xác định các thành phần p, q trong mơ hình ARMA
4. Ước lượng các tham số và chẩn đốn mơ hình phù hợp nhất
5. Dự báo ngắn hạn
I.3.1 Chọn tham biến
Hướng tiếp cận phổ biến trong dữ liệu tài chính là tập trung xây dựng mơ hình dự
báo giá cổ phiếu đĩng cửa sau khi kết thúc mỗi phiên giao dịch (Close).
I.3.2 Chuẩn bị dữ liệu
Xác định tính dừng của chuỗi dữ liệu : Dựa vào đồ thị của chuỗi và đồ thị
của hàm tự tương quan.
Nếu đồ thị của chuỗi Y = f(t) một cách trực quan nếu chuỗi được coi là
dừng khi đồ thị của chuỗi cho trung bình hoặc phương sai khơng đổi theo
thời gian (chuỗi dao động quanh giá trị trung bình của chuỗi)
Dựa vào đồ thị của hàm tự tương quan ACF nếu đồ thị cho ta một chuỗi
giảm mạnh và tắt dần về 0 sau q độ trễ.
Xác định yếu tố mùa vụ cho chuỗi dữ liệu: Dựa vào đồ thị của chuỗi dữ liệu
Y=(t).
24
Xác định yếu tố xu thế cho chuỗi dữ liệu
I.3.3 Xác định thành phần p, q trong mơ hình ARMA
Sau khi loại bỏ các thành phần: Xu thế, mùa vụ, tính dừng thì dữ liệu trở thành
dạng thuần cĩ thể áp dụng mơ hình ARMA cho quá trình dự báo. Việc xác định 2 thành
phần p và q.
Chọn mơ hình AR(p) nếu đồ thì PACF cĩ giá trị cao tại độ trễ 1, 2, …, p và
giảm nhiều sau p và dạng hàm ACF giảm dần
Chọn mơ hình MA(q) nếu đồ thị ACF cĩ giá trị cao tại độ trễ 1, 2, …, q và
giảm nhiều sau q và dạng hàm PACF giảm dần.
I.3.4 Ước lượng các thơng số của mơ hình và kiểm định mơ hình
phù hợp nhất
Cĩ nhiều phương pháp khác nhau để ước lượng. Ở đây, trong phạm vi đề tài tập
trung vào: Khi đã chọn được mơ hình, các hệ số của mơ hình sẽ được ước lượng theo
phương pháp tối thiểu tổng bình phương các sai số. Kiểm định các hệ số a, b của mơ hình
bằng thống kê t. Ước lượng sai số bình phương trung bình của phần dư S2:
∑
∑
Trong đĩ:
et = Yt – Y^t = phần dư tại thời điểm t
n = số phần dư
r = tổng số hệ số ước lượng
Tuy nhiên : cơng thức chỉ đưa ra để tham khảo...Hiện nay phương pháp ước lượng
cĩ hầu hết trong các phần mềm thống kê : ET, MICRO TSP và SHAZAM, Eviews...
Nếu phần dư là nhiễu trắng thì cĩ thể dừng và dùng mơ hình đĩ để dự báo.
I.3.5 Kiểm tra mơ hình phù hợp nhất
Dựa vào các kiểm định như
BIC nhỏ (Schwarz criterion được xác định bởi : n.Log(SEE) + K.Log(n))
SEE nhỏ
25
R2 lớn : R-squared = (TSS-RSS)/TSS
,
Q-statistics và đồ thị tương quan chỉ ra phần dư là nhiễu trắng.
Sau đĩ cĩ thể thử với các mơ hình khác và so sánh kết quả theo các tiêu chuẩn
đánh giá.
I.3.6 Dự báo ngắn hạn mơ hình
Dựa vào mơ hình được chọn là tốt nhất, với dữ liệu quá khứ tới thời điểm t, ta sử
dụng để dự báo cho thời điểm kế tiếp t+1.
II. Áp dụng
Ứng dụng mơ hình ARIMA vào bài tốn dự báo chứng khốn của của Cơng ty cổ
phần Thủy sản Mekong(Mã CK : AAM). Nguồn dữ liệu được lấy từ trang web Stockbiz
(www.stockbiz.vn). Sử dụng Phần mềm EVIEWS 6 để dự đốn (Ứng dụng của mơ hình
ARIMA cho bài tốn dự đốn chuỗi thời gian).
II.1. Dữ liệu
Để xây dựng mơ hình ARIMA tơi đã sử dụng chuỗi dữ liệu mã chứng khốn AMM
gồm 157 quan sát từ ngày 24/4/2009 tới 15/4/2010. Dữ liệu quá khứ được lấy trên giá
đĩng cửa (Close) và quá trình dự báo giúp ta xác định được giá đĩng cửa những ngày tiếp
theo.
26
Hình: Biểu đồ giá đĩng cửa
II.2. Nhận dạng mơ hình
Xác định các tham số p, d, q trong ARIMA
20
24
28
32
36
40
44
2009Q4 2010Q1
CLOSE
27
Từ hình trên, ta thấy biểu đồ hàm tự tương quan ACF giảm dần một cách từ từ về
0. Chuỗi chưa dừng, ta phải sai phân lần 1.
Kiểm tra đồ thị Correlogram của chuỗi sai phân bậc 1.
Như vậy sau khi lấy sai phân bậc 1 chuỗi đã dừng: d=1,
ACF tắt nhanh về 0 sau 1 độ trễ q=1,
PAC giảm nhanh về 0 sau 1 độ trễ: p=1
II.3. Ước lượng và kiểm định với mơ hình ARIMA
Xây dựng mơ hình ARIMA(1, 1, 1)
Chọn Quick/Estimate Equation… sau đĩ nhập “d(close) c ar(1) ma(1)”
28
Hình: Ước lượng mơ hình ARIMA(1,1,1)
Hình: Kết quả mơ hình ARIMA(1,1,1)
29
Chọn View/Residual tests/Correlogram-Q- Statistic
Hình: Kiểm tra phần dư cĩ nhiễu trắng
Như vậy, sai số của mơ hình ARIMA(1,1,1) là một chuỗi dừng và nĩ cĩ phân phối
chuẩn. Sai số này là nhiễu trắng.
30
II.4. Thực hiện dự báo
Tại cửa sổ Equation ấn nút Forecast
Tại Forecast sample, ta chỉnh ngày dự báo: 15/5/2010 – 20/5/2010
Kết quả là:
31
Ta cĩ kết quả dự báo từ ngày 15/5/2010 – 20/5/2010
Ngày Giá thực tế Giá dự báo Đánh giá
17/05/2010 28.17 27.74802 -0.42198
18/05/2010 27.92 27.66328 -0.25672
19/05/2010 27.33 27.57923 0.24923
20/05/2010 27.92 27.49576 -0.42424
Qua thực nghiệm dự báo được 4 ngày từ ngày 17/05 – 20/05/2010, chúng ta nhận
thấy kết quả đưa ra khá chính xác so với giá thực tế của mã chứng khốn AAM.
II.5. Kết luận
Kết quả dự báo cho thấy giá trị dự báo xấp xỉ với giá trị thực tế và khoản tin cậy
95% cũng chứa giá trị thực tế. Điều này chứng tỏ độ tin cậy của mơ hình dự báo là khá
cao. Trong một vài phiên giao dịch do tác động của các yếu tố ngoại lai lớn như tâm lý
nhà đầu tư, tác động của các thị trường chứng khốn khác, thơng tin về sự thay đổi chính
sách...sẽ làm cho sai số dự báo tăng cao hơn. Do đĩ kết quả của mơ hình vẫn chỉ mang
tính chất tham khảo nhiều hơn. Tuy nhiên cĩ thể nĩi mơ hình ARIMA là một mơ hình tốt
để dự báo trong ngắn hạn.
32
Tài liệu tham khảo:
[1] Phương pháp nghiên cứu khoa học trong Tin học - GS.TSKH Hồng Kiếm.
ĐHQGTP HCM, 2005
[2] Dự báo và phân tích dữ liệu trong kinh tế và tài chính – Nguyễn Trọng Hồi,
Phùng Thanh Bình, Nguyễn Khánh Duy
[3] Sử dụng mơ hình ARIMA cho việc giải quyết bài tốn dự báo tỷ giả - Nguyễn
Thị Hiền Nhã. Luận văn thạc sĩ tin học, Đại học Khoa Học Tự Nhiên – Đại Học
Quốc Gia TP.HCM, 2002.
[4] Hướng dẫn sữ dụng Eview – Phùng Thanh Bình
Các file đính kèm theo tài liệu này:
- nguyen_hoang_hac_ch1101081_2888.pdf