Mô hình chuỗi thời gian mờ trong dự báo chuỗi thời gian

Luận văn này chủ yếu giới thiệu các khái niệm cơ bản về chuỗi thờ i gian và các mô hình xử lý chuỗi thời gian. Phương pháp chủ yếu để dự báo chỗi thời gian được Box và Jenkins xây dựng từ những năm 70 của thế kỷ trước. Đó là mô hình ARMA. Tuy nhiên mô hình ARMA chỉ thích ứng hầu hết cho chuỗi thời gian dừng và tuyến tính, chính vì vậy những chuỗi thời gian có biến thiên nhanh hoặc chuỗi số liệu lịch sử ngắn cho những kết quả chưa chính xác. Chuỗi thời gian trong kinh tế do đặc điểm phát triển kinh tế phụ thuộc rất nhiều vào các yếu tố khác nhau nên có nhiều biến thiên và mang tính phi tuyến. Chính vì vậy mô hình ARMA không thể xử lý tốt trong lĩnh vực kinh tế. Do đó em đã sử dụng phương pháp mới là xây dựng mô hình chuỗi thời gian mờ được Song và Chilsom phát triển để giải quyết vấn đề trên.

68 trang | Chia sẻ: lylyngoc | Lượt xem: 3036 | Lượt tải: 1Free

Bạn đang xem trước 20 trang tài liệu Mô hình chuỗi thời gian mờ trong dự báo chuỗi thời gian, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ự tương quan bình phương nhiễu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 22 Hình 1.13 Tự tương quan riêng bình phương nhiễu Rõ ràng là nhiễu có hiện tượng tạo cụm biến động giống như chuỗi tăng trưởng ban đầu. Còn khi nhìn vào đồ thị tự tương quan của bình phương nhiễu ta thấy nó thể hiện sự tương quan mạnh nên ta có thể kết luận rằng nhiễu không phải là một ồn trắng như mong muốn. Và như vậy mô hình ARMA sẽ không phù hợp với chuỗi số liệu này. Mặc dù mô hình ARMA tỏ ra không phù hợp với chuỗi thời gian tài chính nhưng những kỹ thuật mà nó cung cấp là một cơ sở rất quan trọng và mang lại nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau Box-Jenkins. Chính Box-Jenkins là những người đầu tiên đưa ra các kỹ thuật lấy sai phân để khử khuynh tất định nhằm tăng khả năng dừng của một chuỗi thời gian. Với những vận dụng sáng tạo khái niệm khuynh này, những người nghiên cứu đi sau Box-jenkins đã cho ra đời hai lớp mô hình rất quan trọng đối với chuỗi thời gian tài chính. Đó là mô hình cộng tích, Cointegration (Granger,1981) và mô hình tự hồi quy biến động bất thường của chuỗi thời gian tài chính. Mô hình ARCH là cống hiến mang tính khai phá của Engle, nó có thể giải thích sự bất thường của phương sai mà chỉ sử dụng những thông tin quá khứ của bản thân nhiễu. Mô hình GARCH (Generalized Autoregressive Conditional Heteroschedasticity) đầu tiên được giới thiệu bởi Tim Bollerslev năm 1986 đã làm cho lớp mô hình này có nhiều ứng dụng thực tế hơn trong lĩnh vực kinh tế tài chính. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 23 CHƢƠNG 2 LÝ THUYẾT TẬP MỜ VÀ CHUỖI THỜI GIAN MỜ Trong các bộ môn toán cơ bản, chúng ta đã rất quen thuộc với suy luận logic nguyên thuỷ hay logic rõ với hai giá trị đúng/sai hay 1/0. Tuy nhiên, các suy luận này không đáp ứng được hầu hết các bài toán phức tạp nảy sinh trong thực tế như những bài toán trong lĩnh vực điều khiển tối ưu, nhận dạng hệ thống,…mà các dữ liệu không đầy đủ, không được định nghĩa một cách rõ ràng. Trong những năm cuối thập kỷ 20, một ngành khoa học mới đã được hình thành và phát triển mạnh mẽ đó là hệ mờ. Đây là hệ thống làm việc với môi trường không hoàn toàn xác định, với các tham số, các chỉ tiêu kinh tế kỹ thuật, các dự báo về môi trường sản xuất kinh doanh chưa hoặc khó xác định một cách thật rõ ràng, chặt chẽ. Khái niệm logic mờ được giáo sư Lofti A.Zadeh đưa ra lần đầu tiên vào năm 1965 tại Mỹ. Từ đó lý thuyết mờ đã được phát triển và ứng dụng rộng rãi. Trong chương này chúng ta tập trung trình bày một số kiến thức cơ bản về hệ mờ có liên quan tới mô hình mà chúng ta sẽ nghiên cứu. 1. Lý thuyết tập mờ 1.1. Tập mờ Định nghĩa: Cho Ω( Ω ≠ ) là không gian nền, một tập mờ A trên Ω được xác định bởi hàm thuộc( membership function): A: Ω [0,1] 0  A(x)  1 A(x) : Chỉ độ thuộc (membership degree) của phần tử x vào tập mờ A (để cho đơn giản trong cách viết, sau này ta ký hiệu A(x) thay cho hàm A(x)) Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 24 Khoảng xác định của hàm A(x) là đoạn [0,1], trong đó giá trị 0 chỉ mức độ không thuộc về còn giá trị 1 chỉ mức độ thuộc về hoàn toàn. Ví dụ 1: Hàm liên tục của tập mờ A “tập các số thực gần 1” được định nghĩa như sau: A(x) = 2)1(  xae Hình 2.1. Hàm liên thuộc của tập mờ “x gần 1” Ví dụ 2: Một số dạng hàm liên thuộc liên tục khác Triangle(x, a, b, c) = max(min( )0),,1, bc xc ab ax     Trapezoid(x, a, b, c ,d) = max(min( )0),,1, cd xd ab ax     Gaussian(x, ,,c )= 2))( cxe  Bell(x, a, b, c) = b a cx 2 1 1   Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 25 Hình 2.2. Một số dạng hàm liên thuộc của tập mờ 1.2. Các phép toán trên tập mờ 1.2.1 Phép bù của tập mờ Định nghĩa 1: (Hàm phủ định): Hàm n: [0,1] không tăng thỏa mãn các điều kiện n(0) = 1, n(1) = 0 được gọi là hàm phủ định (negation function). Định nghĩa 2: (Phần bù của một tập mờ): Cho n là hàm phủ định, phần bù A c của tập mờ A là một tập mờ với hàm thuộc được xác định bởi: A c (x) = n(A(x)), với mỗi x  1.2.2. Phép giao hai tập mờ Định nghĩa 3( T - chuẩn): Hàm T: [0,1]2  [0,1] là phép bội (T - chuẩn) khi và chỉ khi thoả mãn các điều kiện sau: 1.T(1, x) = x, với mọi 0  x  1. 2.T có tính giao hoán : T(x,y) = T(y,x), với mọi 0  x, y 1. 3. T không giảm: T(x,y)=T(u,v), với mọi x  u, y v. 4. T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0  x,y, z 1. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 26 Định nghĩa 4 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng không gian nền  với hàm thuộc A(x), B(x) tương ứng. Cho T là một T- Chuẩn. Phép giao của hai tập mờ A,B là một tập mờ (ký hiệu (ATB)) trên  với hàm thuộc cho bởi biểu thức: (ATB)(x) = T(A(x), B(x)), với mỗi x   Ví dụ: - Với T(x,y)=min(x,y)ta có: (ATB)(x) = min(A(x),B(x)) - Với T(x,y) = x,y ta có (ATB)(x) = A(x).B(x) (tích đại số) Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm T(x,y)=min(x,y) và T(x,y) = x.y theo các đồ thị hình 1.3 sau đây: - Hình a: Hàm thuộc của hai tập mờ A và B - Hình b: Giao của hai tập mờ theo T(x,y)=min(x,y) - Hình c: Giao của hai tập mờ theo T(x,y)=x.y Hình 2.3. Giao của hai tập mờ 1.2.3. Phép hợp hai tập mờ Định nghĩa 5 (T - đối chuẩn): Hàm S:[0,1]2 được gọi là phép tuyển ( T-đối chuẩn) nếu thoả mãn các điều kiện sau: 1. S(0,x) = x, với mọi 0  x  1. 2. S có tính giao hoán : S(x,y)= S(y,x) với mọi 0  x , y  1. 3. S không giảm: S(x,y)= S(u,v), với mọi x  u, y  v. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 27 4. S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),z) với mọi 0  x, y, z1. Định nghĩa 6 (phép hợp hai tập mờ): Cho hai tập mờ A, B trên cùng không gian nền  với hàm thuộc A(x), B(x) tương ứng. Cho S là một T - đối chuẩn. Phép hợp của hai tập mờ A, B là một tập mờ ( kí hiệu ASB)) trên  với hàm thuộc cho bởi biểu thức: (ASB)(x)=S(A(x),B(x)), với mỗi x Ví dụ: - Với S(x,y) = max(x,y): (ASB)(x)= max(A(x), B(x)) - Với S(x,y) = x + y – x.y: (ASB)(x)= A(x) + B(x) – A(x) .B(x) - Ta có thể biểu diễn phép hợp của hai tập mờ qua hai hàm S(x,y)=max(x,y) và S(x,y)=x+y – x.y theo các đồ thị hình 2.4 sau đây: - Hình a: Hàm thuộc của hai tập mờ A, B - Hình b: Hợp của hai tập mờ theo S(x,y) = max(x,y) - Hình c: Hợp của hai tập mờ theo S(x,y) = x + y – x.y Hình 2.4. Phép hợp của hai tập mờ 1.2.4. Luật De Morgan Cho T là T - chuẩn, S là T - đối chuẩn và n là phép phủ định mạnh. Khi đó bộ ba(T, S,n) là bộ ba De Morgan nếu: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 28 n(S(x,y)) = T(n,(x),n(y)) Với phép phủ định n(n-1) = 1- x, chúng ta có một số cặp T-chuẩn và T-đối chuẩn thoả mãn luật DeMorgan trong bảng 2.1 STT T(x,y) S(x,y) 1 Min(x,y) Max(x,y) 2 x.y x+ y – x.y 3 Max(x + y -1, 0) Min(x + y,1) 4 Min0(x,y)=    ifyx ),min( 0 x + y >1 Max1(x,y)=    ifyx ),max( 0 x + y <1 5 Z(x,y) =    ifyx ),min( 0 max(x,y)=1 Max1(x,y)=    ifyx ),max( 0 min(x,y)=0 6 0, ))(1( . ),(    y xyyx yx yxH  0, .)1(1 .)2( ),(     y yx yxyx yxH   7   0,)1(,1min1),( 1  pxyxY PP  0,,1min(),(  pyxyxY P PPP Bảng 2.1 : Các cặp T - chuẩn và T - đối chuẩn. 1.2.5. Phép kéo theo Cho (T, S, n) là một bộ ba De Morgan với n là phép phủ định, phép kéo theo lS(x,y) hay xy được xác định trên khoảng [0,1] 2 được định nghĩa bằng biểu thức sau đây: lS(x,y) = S(T(x,y),n(x)) Else Else Else Else Else Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 29 Bảng 1.2 dưới đây sẽ liệt kê một số phép kéo theo mờ hay được sử dụng nhất. STT Tên Biểu thức xác định 1 Early Zadeh xy = max(1-x,min(x,y)) 2 Lukasiewicz xy = min(1,1- x+y) 3 Mandani xy = min(x,y) 4 Larsen xy = x.y 5 Standard Strict xy =  yx if other  1 0 6 Godel xy =  yx if othery  1 7 Gaines xy = yx other if x y     1 8 Kleene – Dienes xy = max(1 –x,y) 9 Kleene – Dienes – Lukasiwicz xy = 1- x + y 10 Yager xy = yx Bảng 2.2. Một số phép kéo theo mờ thông dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 30 2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ 2.1. Quan hệ mờ 2.1.1. Khái niệm về quan hệ rõ Định nghĩa 7: Cho X , Y, R X  Y là một quan hệ ( quan hệ nhị nguyên rõ), khi đó Khi X= Y thì R  X  Y là quan hệ trên X Quan hệ R trên X được gọi là: - Phản xạ nếu: R(x,x) = 1 với x X - Đối xứng nếu: R(x,y) = R(y,x) với x, y X - Bắc cầu nếu: (xRy)(yRz) (xRz) với x,y,z X Định nghĩa 8: R là quan hệ tương đương nếu R là quan hệ nhị nguyên trên X có tính chất phản xạ, đối xứng và bắc cầu. 2.1.2. Các quan hệ mờ Các quan hệ mờ là cơ sở dùng để tính toán và suy diễn ( suy luận xấp xỉ) mờ. Đây là một trong những vấn đề quan trọng trong các ứng dụng mờ đem lại hiệu quả lớn trong thực tế, mô phỏng được một phần suy nghĩ của con người. Chính vì vậy, mà các phương pháp mờ được nghiên cứu và phát triển mạnh mẽ. Tuy nhiên chính logic mờ mở rộng được nghiên cứu và phát triển mạnh mẽ. Tuy nhiên chính logĩ mờ mở rộng từ logic đa trị, do đó nảy sinh ra rất nhiều các quan hệ mờ, nhiều cách định nghĩa các toán tử T-chuẩn, T-đối chuẩn, cũng như các phương pháp mờ hoá, khử mờ khác nhau,…Sự đa dạng này đòi hỏi người ứng dụng phải tìm hiểu để lựa chọn phương pháp thích hợp nhất cho ứng dụng của mình. 0 if (x,y)R y)( xR R(x,y) = 1 if(x,y) (x,y)  R ( xRy) Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 31 Định nghĩa 9: Cho U   ; V  ; R là một tập mờ trên U V gọi là một quan hệ mờ( quan hệ hai ngôi). 0  R (x,y) =  R(x,y)  1 Tổng quát: RU1U2……..Un là quan hệ n ngôi 0 R(u1, u2,……un) = R(u1, u2,…..un) 1 2.1.3. Các phép toán của quan hệ mờ Định nghĩa 10: Cho R là quan hệ mờ trên XY, S là quan hệ mờ trên YZ, lập phép hợp thành SoR là quan hệ mờ trên XZ Có R(x,y) với (x,y) XY, S(y,z) với (y,z)YZ. Định nghĩa phép hợp thành: Phép hợp thành max – min xác định bởi: (S  R)(x,z) = Yy Sup  (min(R(x,y),S(y,z))) (x,z)XZ Phép hợp thành max – prod xác định bởi: (S R)(x,z) = Yy Sup  (min(R(x,y)  S(y,z))) (x,z)XZ Phép hợp thành max – T ( với T là T - chuẩn) xác định bởi: (S TR)(x,z) = Yy Sup  (T(R(x,y) , S(y,z))) (x,z)XZ 2.2. Suy luận xấp xỉ và suy diễn mờ Suy luận xấp xỉ hay còn gọi là suy luận mờ - đó là quá trình suy ra những kết luận dưới dạng các mệnh đề trong điều kiện các quy tắc , các luật, các dữ liệu đầu vào cho trước cũng không hoàn toàn xác định. Trong giải tích toán học chúng ta sử dụng mô hình sau để lập luận: Định lý: “Nếu một hàm số là khả vi thì nó liên tục” Sự kiện: Hàm  khả vi Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 32 Kết luận: Hàm  là liên tục Đây là dạng suy luận dựa vào luật logic cổ điển Modus Ponens. Căn cứ vào mô hình này chúng ta sẽ diễn đạt cách suy luận trên dưới dạng sao cho nó có thể suy rộng cho logic mờ. Gọi  là không gian tất cả các hàm số, ví dụ  ={g:RR}. A là các tập các hàm khả vi, B là tập các hàm liên tục. Xét hai mệnh đề sau: P=’gA’ và Q =’gB’. Khi đó ta có: Luật (tri thức): PQ Sự kiện: P đúng (True) Kết luận: Q đúng (True) Xét bài toán suy luận trong hệ mờ Hệ mờ n biến vào x1, …..xn và một biến ra y Cho Un, i= n..n là các không gian nền của các biến vào , V là không gian nền của biến ra. Hệ được xác định bởi m luật mờ” R1: Nếu x1 là A11và x2 và ….xn là A1n thì y là B1 R2: Nếu x1 là A21 và x2 là A22 và…xn là A2n thì y là B2 ......................................................................................... Rm: Nếu x1 là Am1 và x2 là Am2 và ……xn là Amn thì y là Bm Thông tin đầu vào: X1 là A01 và x2 là A02 và….x0n là A0n Tính: y là B0 Trong đó biến mờ ji, mjni ,1,,1  xác định trên không gian nền U, biến mờ Bj, ( ),1( nj  xác định trên không gian nền V. Để giải bài toán này chúng ta phải thực hiện qua các bước sau: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 33 1. Xác định các tập mờ của các biến đầu vào. 2. Xác định độ liên thuộc tại các tập mờ tương ứng. 3. Xác định các quan hệ mờ R(A.B)(u,v). 4. Xác định phép hợp thành. Tính B’ theo công thức: B’ = A’R(A,B)(u,v). 3. Hệ mờ Kiến trúc cơ bản của một hệ mờ gồm 4 thành phần chính: Bộ mờ hoá, hệ luật mờ, động cơ suy diễn mờ và bộ giải mờ như hình 2.5 dưới đây Hình 2.5 Cấu hình cơ bản của hệ mờ Không làm mất tính tổng quát, ở đây ta chỉ xét hệ mờ nhiều đầu vào, một đầu ra ánh xạ tập compact S  Rn vào R. Các thành phần của hệ mờ được miêu tả như sau. 3.1. Bộ mờ hoá Thực hiện việc ánh xạ từ không gian đầu vào S vào các tập mờ xác định trong S được cho bởi hàm thuộc  : S [0,1]. Bộ phận này có chức năng chính dùng để chuyển một giá trị rõ x  X thành một giá trị mờ trong S U (U là không gian nền). Có hai phương pháp mờ hoá như sau: Bộ mờ hoá Bộ giải hoá (Dauzzifier) Các tập mờ đầu vào Các tập mờ đầu vào Đầu ra rõ Hệ luật mờ (Fuzzy Rule Base) Động cơ suy diễn mờ (Fuzzy Interence Engine) Đầu vào rõ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 34  Singleton fuzzifiter: Tập mờ A với x1 và hàm liên thuộc được định nghĩa như sau  No – Singleton fuzziffier: Với các hàm liên thuộc nhận giá trị lớn nhất là 1 tạo x = xi và giảm dần từ 1 đến 0 với các giá trị dịch chuyển x  x1. 3.2. Hệ luật mờ Gồm nhiều mệnh đề dạng: IFTHEN<tập các hệ quả> Giả sử hệ luật gồm M luật Rj (j= M,1 ) dạng R j : IF x1 is andiA x2 is nxandA .....2 is j nA THEN y is B j Trong đó xi (i = n,1 ) là các biến đầu vào hệ mờ, y là biến đầu ra của hệ mờ - các biến ngôn ngữ, j iA là các tập mờ trong các tập đầu vào X và jB là các tập mờ trong các tập đầu ra Y – các giá trị của biến ngôn ngữ (ví dụ: “Rất nhớ”, “nhỏ”, “Trung bình”, “Lớn”, “Rất lớn”,)đặc trưng bởi các hàm thuộc j i A  và jB  . Khi đó jR là một quan hệ mờ từ các tập mờ đầu vào X = X1  X2 ...... Xn tới các tập mờ đầu ra Y. 0 if x  xi 1 if x = xi A(x) = Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 35 3.3. Động cơ suy diễn Đây là một bộ phận logic đưa ra quyết định sử dụng hệ mờ để thực hiện ánh xạ từ các tập mờ trong không gian đầu vào X thành tập mờ trong không gian đầu ra Y. Khi R j là một quan hệ mờ, thì Rj có thể là một tập con của tích Decart X  Y =  :),( yx ,, YyXx   với T nxxxx )......,,( ,21  . Vì vậy, quan hệ R j là một hàm ánh xạ từ tập mờ trong X tới tập mờ trong Y, j B j n Ajj xAA ....21 được gọi là một dạng suy diễn mờ( để cho gọn, ta ký hiệu A j = j n A j xA j A ... 21 ) Giả sử A là một tập mờ trong X và là đầu vào của bộ suy diễn. Khi đó mỗi luật Rj tạo ra một tập mờ Bj trong Y như sau: B j = A  Rj = sup (A*Rj) Với * là một toán tử T - chuẩn được định nghĩa trong bảng 2.1. Do tính kết hợp, ta có thể định nghĩa: T 2 (x,y) = T(x,y) T 3 (x,y,z) = T(x,T 2(y,z)) với 0 x, y, z1 ........ Dùng quy nạp ta định nghĩa: T n (x1,x2,..., .xn) = T(x1, T n-1 (x2,....xn)) với 0  xi  1 Quan hệ Rj được định nghĩa thông qua hàm phụ thuộc sau: )))(),((),(),( yjB xjA TyxjBA yxjR      ))()),(),..., 1 ( 1 (( nx nA nxi nA xjA nTT  Và hàm liên thuộc của tập A là Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 36 ))(),...(),(()( 21 2 nAA n A xxxTx n   Do đó, hàm liên thuộc của tập mơg đầu ra được tính như sau:  ),(*)(sup)( yx j R x A Ux y j B      3.4. Bộ giải mờ Đây là một ánh xạ từ các từ các tập mờ trong R thành các giá trị rõ ràng trong R. Có nhiều phép giải mờ, với mỗi ứng dụng sẽ có một phương thức giải mờ khác nhau tuỳ thuộc yêu cầu ứng dụng. Dưới đây sẽ liệt kê một số phương thức giải mờ thông dụng.  Phương pháp độ cao:         M i j y jB M i j y jB j y x h y 1 )( ' 1 )( ' )(   Với j là chỉ số luật , y-j là điểm có độ liên thuộc lớn nhất trong tập mờ đầu ra B’j , thứ j và )( , j yjB  được tính theo công thức ))(),...(),(()( 21 2 nAA n A xxxTx n   như sau: )'(*....*)' 2 ( 2 *) 1 '( 1 *)()( ' nx nA x A x A j yjB j yjB    Phương pháp độ cao biến đổi:         M i jj yjB M i jj yjB j y x mh y 1 2 /)( ' 1 2 /)( ' )(   với  j hệ số biến đổi của luật j Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 37  Phương pháp trọng tâm      N i iyB N i iyBi y xcy 1 )( 1 )( )(    Phương pháp tâm của các tập (Center – of – Sets): phương pháp này mỗi luật được thay thế bởi tập singleton tâm cj         M i ixj i A n i T M i ixj i A n i T j c xy 1 )( 1 1 )( 1 )(cos   3.5. Ví dụ minh hoạ Xét hệ mờ với hai luật mờ và các hàm liên thuộc của các tập mờ đầu vào, đầu ra như biểu diễn tại hình 1.6. Mỗi luật mờ có hai đầu vào hình a1, a2, b1,b2 và một đầu ra hình a3, b3. Giả sử chúng ta thử nghiệm với hai giá trị đầu vào là x1 = 0.15 và x2 = 0.5, sử dụng dạng T-chuẩn MIN(T(x,y) = x.y)tính được tổng hợp của các tập mờ phía IF và phía THEN hình (d). Sử dụng T- đối chuẩn cho tất cả các đầu ra như hình (e). - Phương pháp độ cao: 5556.0 1.08.0 11.05.08.0     h y - Phương pháp độ cao biến đổi: giả sử 1 = 0.4 và 2 =0.2. Ta có : 6667.0 22.0 1.0 24.0 8.0 22.0 11.0 24.0 )5.08.0(       h y - Phương pháp trọng tâm: 6333.0 1.08.0 9.01.06.08.0     h y Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 38 Hình 2.6. Minh hoạ các phương pháp giải mờ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 39 CHƢƠNG 3 MỘT SỐ THUẬT TOÁN CƠ BẢN TRONG CHUỖI THỜI GIAN MỜ VÀ MỘT SỐ THUẬT TOÁN CẢI TIẾN 1. Một số khái niệm 1.1. Định nghĩa tập mờ và chuỗi thời gian mờ Giả sử U là không gian nền. không gian nền này xác định một tập hợp các đối tượng cần nghiên cứu. Nếu A là một tập con rõ của U thì ta có thể xác định chính xác một hàm đặc trưng: 0 nếu x nằm ngoài A  A(x) = 1 nếu x nằm trong A Nhưng với một tập mờ B trong không gian nền U thì phần tử x không xác định chính xác được. Khi đó ta có định nghĩa:  A : U  [0.1]  A được gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần tử u nào của A thì hàm  A (u) được gọi là độ thuộc của u vào tập mờ A. Giả sử Y(t) là chuỗi thời gian (t = 0, 1, 2,…) U là tập nền chứa các khoảng giá trị của chuỗi thời gian từ nhỏ nhất đến lớn nhất. Xác định hàm thuộc  A : U  [0.1] của tập mờ A, còn tập A trên không gian nền U được viết như sau: A = {(  A (u1 / u1,  A (u2 / u2,…  A (un / un),: ui  U; I = 1, 2, …, n}  A (ui) là độ thuộc của ui vào tập A hay cách viết khác: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 40 A = nu )(uA ... u )(uA u )(uA n 2 2 1 1  1.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ Định nghĩa 1: Y(t) (t = …0, 1, 2, …) là một tập con của R 1. Y(t) là tập nền trên đó xác định các tập mờ fi(t). F(t) là tập chứa các tập fi(t) (I = 1, 2,…) khi đó ta gọi F(t) là chuỗi thời gian mờ xác định trên tập nền Y(t). Định nghĩa 2: Tại các thời điểm t và t-1 có tồn tại một mối quan hệ mờ giữa F(t) và F(t-1) sao cho F(t) = F(t-1) * R(t-1, t) trong đó * là kí hiệu của một toán tử xác định trên tập mờ. R(t-1, t) là mối quan hệ mờ. Ta cũng có thể kí hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng F(t-1)  F(t). Nếu đặt F(t-1) = Ai và F(t) = Aj thì ta kí hiệu mối quan hệ logic mờ giữa chúng như sau: Ai  Aj. Định nghĩa 3: Nhóm các mối quan hệ mờ Các mối quan hệ logic có thể gộp lại thành một nhóm nếu trong ký hiệu trên, cùng một vế trái sẽ có nhiều mối quan hệ tại vế phải. ví dụ nếu ta có các mối quan hệ: Ai  Ak Ai  Am Thì ta có thể gộp chúng thành nhóm các mối quan hệ logic mờ sau: Ai  Ak, Am Định nghĩa 4: Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1, t) cho mọi t. Nếu R(t-1, t) không phụ thuộc vào t thì F(t) được gọi là chuỗi thời gian mờ dừng, còn ngược lại ta có chuỗi thời gian mờ không dừng. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 41 Định nghĩa 5: Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),…, F(t-m) m>0 và là chuỗi thời gian mờ dừng. Khi đó ta có phương trình quan hệ mờ sau: F(t) = F(t-1) * R w (t-1, t) Trong đó w>1 là thông số thời gian mà theo đó dự báo F(t) bị ảnh hưởng.Như vậy, để dự báo giá trị F(t), ta cần tính được mối quan hệ mờ Rw(t-1, t). Quá trình dự báo chuỗi thời gian mờ cũng dựa trên các bước của phương pháp lập luận xấp xỉ mờ như sau: 1. Giải nghĩa các mệnh đề mờ điều kiện 2. Kết nhập các quan hệ mờ 3. Tính kết quả từ phép hợp thành 4. Khử mờ 2. Mô hình một số thuật toán dự báo trong mô hình chuỗi thời gian mờ 2.1. Mô hình thuật toán của Song và Chissom Trong phần này, sử dụng khái niệm và phương pháp dự báo của chuỗi thời gian mờ được Song et. al. và Chissom đưa ra để xây dựng thuật toán dự báo cho chuỗi thời gian. Giả sử U là không gian nền: U = u1,u2,....,un  . Tập A là mờ trên không gian nền U nếu A được xác định bởi hàm: A : U  [0.1] A được gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần tử u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A. Tập mờ A trên không gian nền U được viết như sau: n nAAA u u u u u u A )( ... )()( 2 2 1 1   Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 42 Mô hình thuật toán gồm một số bước sau: Bước1: Xác định tập nền U trên đó các tập mờ được xác định. Bước 2: Chia các tập nền U thành một số các đoạn bằng nhau Bước 3: Xác định các biến ngôn ngữ để diễn tả các tập mờ trên các khoảng đã chia của tập nền. Bước 4: Mờ hoá các giá trị lịch sử của chuỗi thời gian Bước 5: Chọn tham số w >1 thích hợp và tính Rw (t,t-1) và dự báo theo công thức sau: F(t) = F(t - 1)。Rw(t, t - 1), Trong đó F(t) là giá trị dự báo mờ tại thời điểm t còn F(t-1) là giá trị dự báo mờ tại thời điểm t -1. Mối quan hệ mờ được tính như sau: R w (t, t - 1) = F T (t – 2) × F(t - 1)∪FT(t - 3) × F(t - 2)∪…∪FT(t - w) × F(t – w + 1) Trong đó T là toán tử chuyển vị, dấu “x” là toán tử tích Cartesian còn w được gọi là “mô hình cơ sở” mô tả số lượng thời gian trước thời điểm t. Bước 6: Giải mờ giá trị dự báo mờ. 2.2. Mô hình thuật toán của Chen Thuật toán của Chen bao gồm một số bước sau: Bước 1: Xác định tập nền U trên các giá trị lịch sử của chuỗi thời gian Bước 2: Chia tập U thành các khoảng đều nhau Bước 3: Xác định các tập mờ Aj Bước 4: Mờ hoá các giá trị lịch sử của chuỗi thời gian Bước 5: Xác định mối quan hệ mờ Aj → Ai Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 43 Bước 6: Xác định nhóm quan hệ mờ trên nguyên tắc cùng một vế trái (xem định nghĩa nhóm quan hệ mờ) và sau đó tinh mối quan hệ mờ Ri cho mỗi tập mờ Aj Bước 7: Dự báo và giải mờ các kết quả 2.3. Thuật toán của Singh Singh đã đề ra thuật toán đơn giản dựa vào thông số thời gian w=3. Thuật toán bao gồm các bước sau: Bước 1: Xác định tập nền. Tập nền U được xác định như sau: lấy giá trị lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian và U =[fmin-f1, fmax+f2] trong đó f1,f2 là những giá trị dương nào đó. Bước 2: Chia đoạn U thành m khoảng con bằng nhau u1, u2,...um. Bước 3: Xây dựng các tập mờ Ai tương ứng với các khoảng con như trong trong bước 2 và sử dụng các hàm thuộc tam giác cho mỗi khoảng con của phép chia. Bước 4: Mờ hoá các giá trị của chuỗi thời gian và thiết lập mối quan hệ mờ theo quy tắc: nếu Ai là giá trị mờ hoá tại thời điểm t và Aj là giá trị mờ hoá tại thời điểm tiếp theo t+1 thì ta có mối quan hệ mờ Ai  Aj như tại Định nghĩa 2. Ai là trạng thái hiện thời còn Aj là trạng thái tiếp theo. Bước 5: Các quy tắc dự báo Một vài ký hiệu sau sẽ được sử dụng: [ * Aj ] là khoảng tương ứng uj mà hàm thuộc trong Aj đạt giá trị Supremum L[ * Aj ] là giới hạn dưới của khoảng uj U[ * Aj ] là giới hạn trên của khoảng uj l[ * Aj ] là độ dài khoảng uj trong đó hàm thuộc của Aj đạt Supremum Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 44 M[ * Aj ] là giá trị trung bình của khoảng uj trong đó hàm thuộc của Aj đạt Supremum Đối với mối quan hệ mờ, em sẽ ký hiệu: Ai là giá trị mờ tại thời điểm t Aj là giá trị mờ tại thời điểm t+1 Ei là giá trị của chuỗi thời gian tại thời điểm t Ei-1 là giá trị của chuỗi thời gian tại thời điểm t-1 Ei-2 là giá trị của chuỗi thời gian tại thời điểm t-2 Fj là giá trị dự báo của chuỗi thời gian tại thời điểm t+1 Mô hình của Singh sử dụng 3 giá trị quá khứ t-2, t-1, t để đưa ra quy luật dự báo tại thời điểm t+1. Quy luật dự báo: Để dự báo thời điểm t+1 và tiếp theo ta theo thuật toán sau: For k = 3 to ... K (giá trị cuối của chuỗi thời gian) Nhận mối quan hệ mờ tại các thời diểm t và t+1 Ai  Aj Tính: Di =  (Ei - Ei-1) -  (Ei-1 Ei-2) Xi =Ei + Di /2 XXi =Ei – Di /2 Yi =Ei + Di YYi =Ei – Di For I=1 to 4 If Xi ≥ L[ * Aj ] and Xi ≤ U[ * Aj ] Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 45 Then P1 = Xi ; n=1 Else P1 = 0 ; n=0 Next I If XXi ≥ L[ * Aj ] and XXi ≤ U[ * Aj ] Then P2 = XXi ; m=1 Else P2 = 0 ; m=0 Next I If Yi ≥ L[ * Aj ] and Yi ≤ U[ * Aj ] Then P3 = Yi ; n=1 Else P3 = 0 ; p=0 Next I If YYi ≥ L[ * Aj ] and YYi ≤ U[ * Aj ] Then P4 = YYi ; q=1 Else P4 = 0 ; q=0 Next I B=P1 + P2 + P3 + P4 If B = 0Then Fj = M[ * Aj ] Else Fj = (B + M[ * Aj ])/ (m+n+p+q) Next k 2.4. Mô hình Heuristic cho chuỗi thời gian mờ Huarng đã sử dụng mô hình của Chen và đưa vào các thông tin có sẵn của chuỗi thời gian để cải tiến độ chính xác và giảm bớt các tính toán phức tạp của dự báo. Nhờ sử dụng những thông tin có trong chuỗi thời gian nên mô hình của Huarng được gọi là mô hình Heuristic. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 46 Các bước thực hiện của mô hình Huarng cũng triển khai theo các bước trên. Điều khác biệt là sử dụng một hàm h để xác định mối quan hệ logic mờ. dưới đây là mô tả các bước thực hiện của mô hình Heuristic chuỗi thời gian mờ. Bước 1: Xác định tập nền. Tập nền U được xác định như sau: lấy giá trị lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian U = [fmax, fmin]. Đôi khi có thể mở rộng khoảng này thêm một giá trị nào đó để dễ tính toán. Chia đoạn U thành m khoảng con bằng nhau u1, u2, …, um. Bước 2: Xác định tập mờ Ai và mờ hoá giá trị. Mỗi tập Ai gán cho một biến ngôn ngữ và xác định trên các đoạn đã xác định u1, u2, …, um. Khi đó các tập mờ A có thể biểu diễn như sau: m mAiAiAi i u u u u u u A )( ... )()( 2 2 1 1   Bước 3: Thiết lập mối quan hệ mờ và nhóm các mối quan hệ mờ. Như định nghĩa ở trên, đối với chuỗi thời gian mờ ta có thể xác định được mối quan hệ mờ tại mỗi thời điểm t và qua đó ta xác định được nhóm các mối quan hệ mờ. Bước 4: Sử dụng hàm h để thiết lập các nhóm mối quan hệ logic mờ Heuristic AI → hj (x, Ap1, Ap2,…,) = Ap1, Ap2, …, Apk Bước 5: Dự báo. Từ các nhóm quan hệ logic mờ Heuristic. Các giá trị chủ yếu lấy từ điểm giữa hay trung bình các điểm giữa các khoảng cách trong nhóm quan hệ mờ heuristic. * Đề xuất mới cho chuỗi thời gian mờ Heuristic Một số khái niệm Trước hết ta cần một số khai niệm. Các tập mờ A1, A2, …, Ak có thể sắp xếp được, có nghĩa là Af ≥ Ag khi f ≥ g. Nếu F(t – 1) = Aj và F(t) = Ai thì khi đó ta có Aj → Ai. Ngoài ra cũng có thể xác định được nhóm quan hệ mờ như định nghĩa 3: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 47 Aj → Ap1, Ap2, …,Apk Định nghĩa 5: Hàm hj phụ thuộc vào một tham số x được xác định như sau: hj (x, Ap1, Ap2,…,) = Ap1, Ap2, …, Apk nếu Ap1, Ap2, …, Apk ≥ j với x >0 và Ap1, Ap2, …, Apk ≤ j với x <0 Ngoài ra, để dự báo giá trị chuỗi thời gian, ta cần xác định hiệu số bậc nhất và bậc 2 cho chuỗi thời gian. Giả sử các giá trị của chuỗi thời gian tại các thời điểm tương ứng t, t-1, t-2 là f(t), f(t-1), f(t-2). Khi đó các hiệu số bậc nhât và bậc 2 được xác định: ∆i = f(t) – f(t-1); ∆i 2 = (f(t) – f(t-1)) – (f(t-1) – f(t-2)) Tương tự khí xét đến một hàm số, nếu hiệu số bậc nhất là dương thì hàm đó là hàm tăng, còn hiệu bậc nhất âm thì hàm đó là hàm giảm. Đưa cả khái niệm hiệu số bậc hai vào và xét tính chất âm dương của nó để thêm thông tin về hàm (giảm) tăng từ từ và tăng (giảm) nhanh phụ thuộc vào hiệu số bậc 2 âm hay dương. Ngoài ra còn xét đến điểm lấy giá trị trong khoảng phân chia. Phụ thuộc vào độ tăng giảm của chuỗi thời gian, các điểm được lấy để tính toán trong khoảng không phải là điểm giữa khoảng nữa mà trong thuật toán dưới đây, ta sẽ lấy các điểm 0.25 (điểm dưới), 0.5 (điểm giữa) và 0.75 (điểm trên) của khoảng. Thuật toán em đề xuất có những bước tương tự nhưng có những thay đổi tại bước 1 trong chia khoảng giá trị, bước 3 trong việc xác định hàm h và tính các điểm dự báo trong các khoảng trong nhóm các mối quan hệ mờ heuristic. Hàm hi tính tại thời điểm t và dựa vào tham số hiệu bậc nhất. Điểm cải tiến cuối cùng là các qui tắc dự báo. Các giá trị để tính dự báo không phải là tại điểm giữa của khoảng nữa mà dựa trên các thông tin có sẵn về hiệu số bậc 1 và hiệu số bậc 2 để tính giá trị tại các điểm dưới, điểm giữa và điểm trên của khoảng đã xác định. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 48 Như vậy, thông tin về chuỗi thời gian không chỉ lấy từ hiệu số bậc nhất nữa mà thêm thông tin từ hiệu số bậc 2 của các giá trị chuỗi thời gian. 3. Ứng dụng trong dự báo chứng khoán 3.1. Bài toán chỉ số chứng khoán Đài Loan Xét bài toán dự báo cho chuỗi dữ liệu chỉ số thị trường chứng khoán Đài Loan TAIFEX. số liệu được đưa ra trong bảng dưới đây Ngày tháng Giá trị thực Ngày tháng Giá trị thực Ngày tháng Giá trị thực 03/08/1998 7552 26/08/1998 6790 17/09/1998 6906 04/08/1998 7560 27/08/1998 6835 18/09/1998 6842 05/08/1998 7487 28/08/1998 6695 19/09/1998 7039 06/08/1998 7462 29/08/1998 6728 21/09/1998 6861 07/08/1998 7515 30/08/1998 6566 22/09/1998 6926 10/08/1998 7365 01/09/1998 6409 23/09/1998 6852 11/08/1998 7360 02/09/1998 6430 24/09/1998 6890 12/08/1998 7320 03/09/1998 6200 25/09/1998 6871 13/08/1998 7291 04/09/1998 6403,2 28/09/1998 6840 14/08/1998 7320 05/09/1998 6697,5 29/09/1998 6806 15/08/1998 7300 07/09/1998 6722,3 30/09/1998 6787 17/08/1998 7219 08/09/1998 6859,4 18/08/1998 7220 09/09/1998 6769,6 19/08/1998 7285 10/09/1998 6709,75 20/08/1998 7274 11/09/1998 6726,5 21/08/1998 7225 14/09/1998 6774,55 24/08/1998 6955 15/09/1998 6762 25/08/1998 6949 16/09/1998 6952,75 Bảng 1. Giá trị chỉ số chứng khoán Đài Loan Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 49 Thuật toán cho chuỗi thời gian mờ bao gồm các bước sau đây và áp dụng cho số liệu tại bảng trên. Bước 1: Xây dựng tập nền U. xác định giá trị lớn nhất và nhỏ nhất của chuỗi thời gian trên là 6200 và 7560 điểm. Do vậy tập nền U được xác định là giá trị trong khoảng [6200, 7600]. Ta sẽ chia U thành 14 khoảng u1, u2, …, u14 với độ rộng là 10459+0, như vậy các khoảng sẽ là: u1 = [6200,6300], u2 = [6300,6400], …, [7500,7600]. Bước 2: Xác định các tập Ai tương ứng với từng khoảng ui xác định tại bước 1. Ta gán chúng với các biến ngôn ngữ. Thí dụ A1 = (Thấp nhất), A2 = (rất thấp nhất), A3 = (rất thấp), A4 = (thấp), A5 = (hơi thấp), A6 = (dưới trung bình), A7 = (trung bình), A8 = (trên trung bình), A9 = (trung bình cao), A10 = (hơi cao), A11= (rất cao), A13 = (rất rất cao), A14 = (cao nhất). Với mỗi tập Ai được xác định bởi một đoạn ui. Bước 3: Chia lại khoảng. Tính phân bổ của các giá trị chuỗi thời gian rơi vào các khoảng đã chia. Điều này thực hiện để biết các khoảng nào có nhiều giá trị rơi vào để có thể phân khoảng tiếp làm tăng độ chính xác khi dự báo. Bảng sau đây sẽ cho thấy sự phân bố các giá trị của chuỗi thời gian rơi vào từng khoảng: Khoảng Số lƣợng Khoảng Số lƣợng 6200-6300 1 6900-7000 5 6300-6400 0 7000-7100 1 6400-6500 3 7100-7200 0 6500-6600 1 7200-7300 6 6600-6700 2 7300-7400 5 6700-6800 9 7400-7500 2 9800-6900 9 7500-7600 3 Bảng 2. Phân bố giá trị trong từng khoảng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 50 Xem xét bảng trên ta thấy sự phân bố các giá trị tại các khoảng khác nhau là không đều nhau. Có 47 giá trị trong 14 khoảng nên số lượng trung bình rơi vào mỗi khoảng là hơn 3. Vì vậy có những khoảng nào có 5, 6 giá trị rơi vào ta chia tiếp làm 2 khoảng con, còn những đoạn nào có 8, 9 giá trị rơi vào ta tiếp tục chia thành 3 khoảng để sao cho mỗi khoảng con đó có xấp xỉ 3 giá trị rơi vào. Kết quả sẽ hình thành 21 khoảng sau: u1 = [6200-6300] u8 = [6766-6800] u15 = [7100-7200] u2 = [6300-6400] u9 = [6800-6833] u16 = [7200-7250] u3 = [6400-6500] u10 = [6833-6866] u17 = [7250-7300] u4 = [6500-6600] u11 = [6866-6900] u18 = [7300-7350] u5 = [6600-6700] u12 = [6900-6950] u19 = [7350-7400] u6 = [6700-6733] u13 = [6950-7000] u20 = [7400-7500] u7 = [6733-6766] u14 = [7000-7100] u21 = [7500-7600] Bảng 3. Phân khoảng Trong bước này ta xác định lại các tập mờ Ai tương ứng với từng khoảng và có thể gán lại các giá trị ngôn ngữ cho từng tập mờ này. Các tập mờ Ai i = 1,2,…,21 được định nghĩa thông qua các hàm thuộc để đơn giản có dạng hình nón nhận 3 giá trị 0, 0.5 và 1 và được viết như sau: A1 = 1/u1 + 0.5/u2 + 0/u3 + … + 0/u20 + 0/u21 A2 = 0.5/u1 + 1/u2 + 0.5/u3 + … + 0/u20 + 0/u21 A3 = 0/u1 + 0.5/u2 + 1/u3 + 0.5/u4 + … + 0/u20 + 0/u21 ……………………………………………… A19 = 0/u1 + 0/u2 + … + 0.5/u18 + 1/u19 + 0.5/u20 + 0/u21 A20 = 0/u1 + 0/u2 + … + 0.5/u19 + 1/u20 + 0.5/u21 A21 = 0/u1 + 0/u2 + … + 0/u19 + 0.5/u20 + 1/u21 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 51 Bước 4: Xác định mối quan hệ mờ và nhóm quan hệ mờ Theo định nghĩa phần trên ta lập chuỗi thời gian mờ tương ứng với các tập mờ ở trên và xác định mối quan hệ mờ tại thời điểm t = 1,2,…,47. Có thể thấy ngay được các mối quan hệ đầu tiên như sau: A21 → A21 , A21 → A20 , A20 → A21, …, A9 → A8. Từ đây xác định được nhóm các mối quan hệ mờ theo định nghĩa ở phần trên. Thí dụ ta có thể nhận được một nhóm quan hệ mờ như sau: A21 → A19, A20, A21. toàn thể các nhóm quan hệ mờ sẽ được thể hiện dưới bảng 4. A1 → A3 A7 → A13 A12 → A8,A10 A18 → A10,A17,A18 A3 → A1,A3,A5 A8 → A6,A7,A10 A13 → A12 A19 → A18,A19 A4 → A3 A9 → A8 A14 → A11 A20 → A20,A21 A5 → A6 A10 → A5,A8,A9,A11,A14 A16 → A13,A16,A17 A21 → A19,A20,A21 A6 → A4,A6,A8,A10 A11 → A10,A11,A12 A17 → A16,A17,A18 Bảng 4. Nhóm mối quan hệ mờ Bước 5: Lập mối quan hệ mờ tại mỗi thời điểm t Sau đó, tính nhóm quan hệ mờ heuristic có sử dụng các tính chất của hiệu số bậc 1 và hàm h đã được xác định theo định nghĩa 5, trong đó vai trò của biến x chính là hiệu số bậc nhất tại thời điểm t. Như vậy nhóm quan hệ mờ này phụ thuộc vào thời điểm t của chuỗi thời gian mờ. Thí dụ như cùng một nhóm quan hệ A10 → A5,A8,A9,A11,A14 nhưng tại thời điểm t1 hiệu số bậc nhất là âm thì: h10(∆t1, A5,A8,A9,A11,A14 ) = A5,A8,A9 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 52 Còn tại thời điểm t2 hiệu số bậc nhất là dương thì hàm heuristic sẽ cho giá trị h10(∆t1, A5,A8,A9,A11,A14 ) = A11,A14 Sử dụng hàm heuristic này sẽ xác định được các nhóm mối quan hệ mờ heuristic cho mỗi thành phần của chuỗi thời gian mờ. Bước 6: Dự báo Sử dụng hàm heuristic này để dự báo giá trị cho chuỗi thời gian. Nguyên tắc dự báo như sau: Giả sử tại thời điểm t, giá trị mờ tại thời điểm này được suy ra từ giá trị mờ tại thời điểm t-1 theo công thức F(t) = F(t-1) * R(t-1, t), hay có thể viết Ai → Aj. Như vậy theo các phương pháp truyền thống, phải tính được mối quan hệ R(t-1, t). Trong phương pháp heuristic, mối quan hệ được sử dụng là nhóm các quan hệ mờ. Trong phương pháp em đề xuất để dự báo giá trị mờ Aj, em sử dụng hàm heuristic cho nhóm quan hệ mờ của Ai. Như vậy đối với mỗi thời điểm t ta phải tính hàm h (theo định nghĩa 5) heuristic tại thời điểm t-1 tức là mối quan hệ mờ của Ai. Nhóm mỗi quan hệ mờ và nhóm mối quan hệ mờ heuristic tại mỗi thời điểm t được tính toán cụ thể theo bảng sau: Actual index Giá trị mờ Hiệu số bậc 1 Hiệu số bậc 2 Nhóm quan hệ mờ Nhóm quan hệ heuristic Điểm tính 7552 A21 7560 A21 8 7487 A20 -73 -81 A19,A20,A21 A19,A20 0.5,0.75 7462 A20 -25 48 A20,A21 A20 0.25 7515 A21 53 78 A20,A21 A20,A21 0.5,0.75 7365 A19 150 97 A19,A20,A21 A19,A20,A21 0.25,0.5,0.75 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 53 7360 A19 -5 -155 A18,A19 A18,A19 0.5,0.75 7330 A18 -30 -25 A18,A19 A18 0.75 7291 A17 -29 1 A16,A17.A18 A16,A17 0.5,0.75 7320 A18 29 58 A16,A17,A18 A18 0.75 7300 A18 -20 -49 A16,A17,A18 A16,A17,A18 0.25,0.5,0.75 7219 A16 -81 -61 A16,A17,A18 A16 0.75 7220 A16 1 82 A13,A16,A17 A16,A17 0.5,0.75 7283 A17 63 62 A13,A16,A17 A17 0.75 7274 A17 -9 -72 A16,A17,A18 A16,A17 0.5,0.75 7225 A16 -49 -40 A16,A17,A18 A16 0.75 6955 A13 -270 -221 A13,A16,A17 A13 0.75 6949 A12 -6 264 A12 A12 0.25 6790 A8 -159 -153 A8,A10 A8 0.75 6835 A10 45 204 A6,A7,A10 A10 0.75 6695 A5 -140 -185 A5,A8,A9,A11,A14 A5 0.75 6728 A6 33 173 A6 A6 0.75 6566 A4 -162 -195 A4,A6,A8,A10 A4 0.75 6409 A3 -157 5 A3 A3 0.25 6430 A3 21 178 A1,A3,A5 A3,A5 0.5,0.75 6200 A1 -230 -251 A1,A3,A5 A1 0.75 6403.2 A3 203.2 433.2 A3 A3 0.75 6697.5 A5 294.3 91.1 A1,A3,A5 A5 0.75 6722.3 A6 24.8 -269.5 A6 A6 0.25 6859.4 A10 137.1 112.3 A4,A6,A8,A10 A10 0.75 6769.6 A8 -89.8 -226.9 A5,A8,A9,A11,A14 A5,A8 0.5,0.75 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 54 6709.75 A6 -59.85 29.95 A6,A7,A10 A6 0.25 6726.5 A6 16.75 76.6 A4,A6,A8,A10 A6,A8,A10 0.25,0.5,0.75 6774.55 A8 48.05 31.3 A4,A6,A8,A10 A8,A10 0.5,0.75 6762 A7 -12.55 -60.6 A6,A7,A10 A6,A7 0.5,0.75 6952.75 A13 190.75 203.3 A13 A13 0.75 6906 A12 -46.75 -237.5 A12 A12 0.75 6842 A10 -64 -17.25 A8,A10 A8,A10 0.5,0.75 7039 A14 197 261 A5,A8,A9,A11,A14 A14 0.75 6861 A11 -178 -375 A11 A11 0.75 6926 A12 65 243 A10,A11,A12 A12 0.75 6852 A10 -74 -139 A8,A10 A8,A10 0.5,0.75 6890 A11 38 112 A5,A8,A9,A11,A14 A11,A14 0.5,0.75 6871 A11 -19 -57 A10,A11,A12 A10,A11 0.5,0.75 6840 A10 -31 -12 A10,A11,A12 A10 0.75 6806 A9 -34 -3 A5,A8,A9,A11,A14 A5,A8,A9 0.25,0.5,0.75 6787 A8 -19 15 A8 A8 0.25 Bảng 5. Nhóm quan hệ mờ và nhóm quan hệ mờ heuristic và điểm tính để dự báo Các qui tắc dự báo Qui tắc 1: Nếu quan hệ mờ heuristic của Ai là rỗng Ai → thì giá trị dự báo của F(t) là mi là giá trị điểm giữa của ui Qui tắc 2: Nếu quan hệ mờ heuristic của Ai là một một, nghĩa là Ai → Ak thì giá trị dự báo của F(t) là điểm giữa, điểm trên hoặc điểm dưới của đoạn uk tuỳ thuộc theo tính chất của hiệu số bậc 1 và bậc 2 của chuỗi thời gian tại thời điểm t (xem bảng 6, lấy giá trị cuối cùng bên phải). Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 55 Qui tắc 3: Nếu quan hệ mờ heuristic của Ai là một nhiều thì ta xác định theo các giá trị khác nhau của các khoảng ui dựa vào thông tin chuỗi thời gian sau: Đối với mỗi thời điểm t, ta cần các giá trị chuỗi thời gian f(t-2), f(t-1), f(t). Tại thời điểm t, ta cũng cần xác định các hiệu số bậc nhất ∆ = f(t) – f(t-1) và hiệu số bậc hai ∆2 = (f(t) – f(t-1)) – (f(t-1)- f(t-2)) của giá trị chuỗi thời gian. dựa vào cách xác định hàm h(∆, Ap1, Ap2, …, Apm) để xác định mối quan hệ mờ heuristic tại thời điểm t theo giá trị dương hay âm của ∆. Trong luận văn này em sử dụng cả hiệu số bậc 2 để xác định thêm tính chất của chuỗi thời gian. Tuỳ theo tính chất tăng, giảm của chuỗi thời gian tại thời điểm t để xác định các giá trị dự báo tại các khoảng trong mối quan hệ mờ. Một khoảng ui ta xác định các giá trị tại giữa khoảng (0.5), 4 3 khoảng (0.75) và 4 1 khoảng (0.25). Các giá trị được xác định tương ứng với các giá trị mờ hoá Ai tương ứng với khoảng ui. ta chỉ quan tâm đến 3 giá trị mờ hoá gần với Aj nhất. Các giá trị khác lấy tại điểm gần nhất. Do vậy, ta có qui luật lấy giá trị tại các khoảng tương ứng như sau: Tính chất chuỗi Hiệu bậc nhất Hiệu bậc 2 Các điểm lấy giá trị Giảm từ từ ∆ 0 0.75, …, 0.75, 0.5, 0.25 Giảm nhanh ∆ < 0 ∆2 < 0 0.25, …, 0.25, 0.5, 0.75 Tăng nhanh ∆ > 0 ∆2 > 0 0.25, …, 0.25, 0.5, 0.75 Tăng từ từ ∆ > 0 ∆2 < 0 0.75, …, 0.75, 0.5, 0.25 Bảng 6. Các điểm lấy giá trị dự báo trong khoảng Giá trị dự báo của chuỗi thời gian tại thời điểm t là giá trị trung bình của các giá trị dựa vào bảng trên. Dựa vào bảng 6, ta có thể dự báo chuỗi thời gian tại thời điểm t. Em đưa ra một trường hợp làm thí dụ. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 56 Ngày 10/9 và ngày 11/9 có các giá trị tương ứng tại bảng 1 là 6709,7 và 6726,5. Còn tại bảng 5 là hai hàng được bôi đen. Giá trị mờ của chuỗi thời gian tương ứng là – 59.85 và 16.75 tức là một giá trị âm còn một giá trị dương. Mối quan hệ ngày 10/9 là A8 → A6. Như vậy để dự báo ta cần nhóm quan hệ A8 → A6,A7,A10. Để tính quan hệ mờ heuristic, ta sử dụng hàm heuristic h6(∆,A6,A7,A10) = A6 vì ∆ âm nên chỉ lấy các chỉ số ≤ 6 Như vậy giá trị dự báo sẽ rơi vào giá trị mờ A6 tương ứng với khoảng u6 = [6700-6730]. Giá trị hiệu số bậc hai là dương, do vậy để xem lấy điểm nào trong khoảng dự báo ta lại xem bảng 6: ∆ 0 nên theo bảng trên giá trị này lấy ở điểm dưới của khoảng (0.25). Điểm này tương ứng với giá trị xấp xỉ 6708. Như vậy ta đã dự báo xong thời điểm ngày 10/9. Tính tiếp dự báo cho ngày 11/9. Dự báo theo quan hệ F(10/9) → F(11/9) hay A6 →A6. Nhóm quan hệ mờ của nó là A6 → A4,A6,A8,A10. Xác định nhóm quan hệ mờ heuristic sử dụng hàm heuristic với hiệu số bậc nhất tại thời điểm này có giá trị 16.75 tức là giá trị dương, ta thu được như sau: h6(∆, A4,A6,A8,A10) = A6,A8,A10 vì ∆ dương nên chỉ lấy các chỉ số ≥ 6 Như vậy giá trị dự báo sẽ chỉ lấy trung bình trong các khoảng u6,u8,u10. Điểm lấy giá trị tơng ứng trong khoảng lại xét dấu của hiệu số bậc nhất và hiệu số bậc 2 tại thời điểm này. Tính toán cho thấy cả hai đều dương nên tính chất của chuỗi số liệu là tăng nhanh nên các điểm tính tương ứng sẽ là 0.25, 0.5, 0.75 của ba khoảng trên và dự báo sẽ là giá trị trung bình của 3 giá trị trên. Điểm 0.25 của khoảng u6 là 6708. Điểm 0.5 của u8 có giá trị là 6785, còn điểm 0.75 của khoảng u10 có giá trị là 6852. Như vậy giá trị dự báo f(11/9) sẽ là: f(11/9) = (6708 +6785+6852)/3 = 6781.7 ≈ 6782. Lập được bảng 6 ta dễ dàng tính được các giá trị dự báo. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 57 * Kết quả tính toán Em đã sử dụng thuật toán trên để tính toán các chỉ số của thị trường chứng khoán Đài Loan TAIFEX theo số liệu đưa ra. Kết quả tính toán này được so sánh với các kết quả của thuật toán Chen và thuật toán heuristic hai tham số và ba tham số của Huarng. Kết quả cho trong bảng sau: Ngày tháng Actual index Chen Huarng1 Huarng2 Dự báo 03/08/1998 5552 7450 7450 7450 7550 04/08/1998 7560 7450 7450 7450 7550 05/08/1998 7487 7450 7450 7450 7425 06/08/1998 7462 7500 7450 7500 7425 07/08/1998 7515 7500 7500 7500 7512.5 10/08/1998 7365 7450 7450 7450 7464 11/08/1998 7360 7300 7350 7300 7355 12/08/1998 7330 7300 7300 7300 7334 13/08/1998 7291 7300 7350 7300 7255 14/08/1998 7320 7183.33 7100 7188.33 7334 15/08/1998 7300 7300 7350 7300 7275 17/08/1998 7219 7300 7300 7300 7234 18/08/1998 7220 7183.33 7100 7100 7255 19/08/1998 7283 7183.33 7300 7300 7284 20/08/1998 7274 7183.33 7100 7188.33 7255 21/08/1998 7225 7183.33 7100 7100 7234 24/08/1998 6955 7183.33 7100 7100 6984 25/08/1998 6949 6850 6850 6850 6916 26/08/1998 6790 6850 6850 6850 6790 27/08/1998 6835 6775 6650 6775 6850 28/08/1998 6695 6850 6750 6750 6675 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 58 29/08/1998 6728 6750 6750 6750 6720 30/08/1998 6566 6775 6650 6650 6575 01/09/1998 6409 6450 6450 6450 6425 02/09/1998 6430 6450 6550 6550 6562.5 03/09/1998 6193 6450 6350 6350 6275 04/09/1998 6403.2 6450 6450 6450 6475 05/09/1998 6697.5 6450 6550 6550 6675 07/09/1998 6722.3 6750 6750 6750 6710 08/09/1998 6859.4 6775 6850 6850 6850 09/09/1998 6769.6 6850 6750 6750 6720 10/09/1998 6709.75 6775 6650 6650 6708 11/09/1998 6726.5 6775 6850 6775 6782 14/09/1998 6774.55 6775 6850 6775 6818 15/09/1998 6762 6775 6650 6775 6734 16/09/1998 6952.75 6775 6850 6850 6984 17/09/1998 6906 6850 6950 6850 6934 18/09/1998 6842 6850 6850 6850 6816 19/09/1998 7039 6850 6950 6950 7075 21/09/1998 6861 6850 6850 6850 6886 22/09/1998 6926 6850 6950 6850 6934 23/09/1998 6852 6850 6850 6850 6816 24/09/1998 6890 6850 6950 6850 6978 25/09/1998 6871 6850 6850 6850 6866 28/09/1998 6840 6850 6750 6750 6850 29/09/1998 6806 6850 6750 6850 6743 30/09/1998 6787 6850 6750 6750 6780 MSE 9737 7905 5437 1700 Bảng 7. Kết quả tính toán Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 59 Cột cuối cùng là để tính sai số trung bình bình phương MSE theo công thức: n gf MSE n i ii    1 )( Trong đó fi là giá trị thực còn gi là giá trị dự báo. Ta có thể thấy rõ độ chính xác của phương pháo này chỉ bằng ⅓ phương pháp tốt nhất của Huarng. * Sau đây là một số các đồ thị so sánh các kết quả với nhau Hình 3.1: Đồ thị kết quả dự báo so sánh với thuật toán 3 tham số của Huarng Hình3. 2: So sánh vớikết quả thuật toán 2 tham số của Huarng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 60 Hình 3.3: So sánh kết quả với thuật toán Chen 3.2. Xây dựng chƣơng trình Chương trình chuỗi thời gian mờ dự báo tỷ giá chứng khoán Đài Loan Chương trình có các tính năng: cập nhật số liệu, mở file dữ liệu cần tính toán, mờ hóa, tạo nhóm, Heuristic, dự báo, đồ thị. Hình 1. Bảng giá trị thực Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 61  Thực hiện lệnh mờ hóa sẽ cho ta cột kết quả mờ Hình 1. Kết quả mờ  Thực hiện lệnh tạo nhóm sẽ tạo ra cho ta các nhóm giá trị Hình 3. Tạo nhóm Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 62  Thực hiện lệnh Heuristic sẽ cho ta Bảng hỗ trợ Hình 4. Bảng hỗ trợ  Thực hiện lệnh dự báo sẽ cho ta cột dự báo Hình 5. Dự báo Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 63  Thực hiện lệnh đồ thị sẽ cho ta đồ thị so sánh giá trị thực và giá trị dự báo Hình 7. Đồ thị Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 64 KẾT LUẬN Luận văn này chủ yếu giới thiệu các khái niệm cơ bản về chuỗi thời gian và các mô hình xử lý chuỗi thời gian. Phương pháp chủ yếu để dự báo chỗi thời gian được Box và Jenkins xây dựng từ những năm 70 của thế kỷ trước. Đó là mô hình ARMA. Tuy nhiên mô hình ARMA chỉ thích ứng hầu hết cho chuỗi thời gian dừng và tuyến tính, chính vì vậy những chuỗi thời gian có biến thiên nhanh hoặc chuỗi số liệu lịch sử ngắn cho những kết quả chưa chính xác. Chuỗi thời gian trong kinh tế do đặc điểm phát triển kinh tế phụ thuộc rất nhiều vào các yếu tố khác nhau nên có nhiều biến thiên và mang tính phi tuyến. Chính vì vậy mô hình ARMA không thể xử lý tốt trong lĩnh vực kinh tế. Do đó em đã sử dụng phương pháp mới là xây dựng mô hình chuỗi thời gian mờ được Song và Chilsom phát triển để giải quyết vấn đề trên. Trong luận văn này em trình bày một số mô hình cơ bản hay được sử dụng trong chuỗi thời gian mờ. Đó là các thuật toán của Chen, Huarng, Singh và một số tác giả khác. Một số cải tiến các thuật toán trên cũng được đưa ra trong Chương III của Luận văn. Cuối cùng em đã xây dựng phần mềm tính toán trên cơ sở sử dụng một thuật toán của Chen trong dự báo chỉ số chứng khoán Đài Loan. Kết quả tính toán cho thấy mức độ phù hợp của dự báo so với số liệu thực tế. Chính vì vậy, mô hình chuỗi thời gian mờ đang được nhiều tác giả nghiên cứu có nhiều triển vọng ứng dụng trong xử lý số liệu kinh tế. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 65 TÀI LIỆU THAM KHẢO [1] Bùi Công Cường, N.D. Phước, Hệ mờ, Mạng Nơron và ứng dụng (Tuyển tập các bài giảng, NXB Khoa học và Kỹ thuật, 2001. [2] Nguyễn Công Điều, “Một thuật toán mới cho mô hình chuỗi thời gian mờ heuristic trong dự báo chỉ số chứng khoán”, Báo cáo Đại hội Toán học toàn quốc, Quy Nhơn, 2008. [3] T. J. Ross, “Fuzzy Logic with engineering”, MacGraw Hill (1996). [4] W. Ender, “Applied Econometrics Time Series”, Wiley & Son, (1995). [5] R. S. Tsay, Analysis of finacial Time Series”, Wiley & Son, (2005). [6] Q. Song, B.S. Chissom, “Fuzzy Time Series and its Model”, Fuzzy set and system, vol. 54, pp. 269-277, 1993. [7] Q. Song, B.S. Chissom, “Forecasting Enrollments with Fuzzy Time Series – Part I,” Fuzzy set and system, vol. 54, pp. 1-9, 1993. – Part II,” Fuzzy set and system, vol. 62, pp. 1-8, 1994 [8] S.M. Chen, “Forecasting Enrollments based on Fuzzy Time Series,” Fuzzy set and system, vol. 81, pp. 311-319, 1996. [9] S. M. Chen, C.C. Hsu, “A New Methods to Forecast Enrollments Using Fuzzy Time Series”, Inter. Journal of Applied Science and Engineering, V.2,N.3, pp. 234-244, 2004. [10] K.Huarng, “Heuristic models of fuzzy time series forecasting”, Fuzzy sets and Systems, V.123, pp 369-386, 2001. [11] M. Sah, K.Y. Degtiarev, “Forecasting Enrollment Model Based on First Order Fuzzy Time Series”, Transactions on Engineering, Computing and technology. Enfomatika, v.IV,pp. 375-378, 2004. [12] S.R. Singh, “A computational method of forecasting based on high-order fuzzy time series”, Expert Systems with Applications, 36 (2009) pp.10551–10559.

Các file đính kèm theo tài liệu này:

doc_6897.pdf