Đề tài Dự báo tốc độ tăng trưởng kinh tế Việt Nam: Sự vượt trội của mô hình Mạng thần kinh nhân tạo (ANN) so với mô hình Hồi quy tuyến tính truyền thống

TÓM TẮT ĐỀ TÀI 1. Lý do chọn đề tài Tốc độ tăng trưởng Tổng sản phẩm quốc nội (Gross Domestic Product - GDP) là một chỉ số kinh tế có ý nghĩa rất quan trọng đối với các nhà điều hành kinh tế và các doanh nghiệp trong việc xem xét mức tăng trưởng của nền kinh tế, là tiền đề hỗ trợ cho các quyết định về chính sách, chiến lược cho một giai đoạn trong tương lai. Vì các thông tin về tốc độ tăng trưởng GDP được công bố ra công chúng có một độ trễ nhất định nên vấn đề cấp thiết hiện nay là cần có một mô hình dự báo tốc độ tăng trưởng GDP có hiệu quả. Do vậy, các công trình hướng đến việc xây dựng mô hình dự báo các biến số vĩ mô, đặc biệt là tốc độ tăng trưởng GDP luôn nhận được sự quan tâm của nhiều nhà nghiên cứu trong và ngoài nước. Những năm gần đây, mô hình Mạng thần kinh nhân tạo (Artificial Neural Network – ANN) được mô phỏng theo cách thức tổ chức và vận hành của bộ não con người, với các ưu điểm vượt trội trong việc xác định và dự báo một cách chính xác các biến số kinh tế có quan hệ phi tuyến đã được các nhà kinh tế học tập trung nghiên cứu và ứng dụng rộng rãi. Tuy nhiên, ở thời điểm hiện tại việc ứng dụng mô hình Mạng thần kinh nhân tạo cho việc dự báo các biến số kinh tế ở Việt Nam vẫn chưa phổ biến. Từ các lý do trên, nhóm nghiên cứu đã thực hiện đề tài: “Dự báo tốc độ tăng trưởng kinh tế Việt Nam: Sự vượt trội của mô hình Mạng thần kinh nhân tạo (ANN) so với mô hình Hồi quy tuyến tính truyền thống”. 2. Mục tiêu nghiên cứu Để tiến hành nghiên cứu việc xây dựng và kiểm chứng khả năng dự báo của mô hình Mạng thần kinh nhân tạo, bài nghiên cứu đã đặt ra các vấn đề cần giải quyết trong suốt quá trình nghiên cứu: Thứ nhất, mô hình Mạng thần kinh nhân tạo là gì ?, cơ chế hoạt động như thế nào ? Thứ hai, những ưu điểm, khuyết điểm và các vấn đề vẫn chưa được giải quyết từ các công trình nghiên cứu trên thế giới ? Thứ ba, mô hình Hồi quy tuyến tính truyền thống là một mô hình đã rất phổ biến hiện nay ở Việt Nam, và rằng nó khác biệt như thế nào so với mô hình Mạng thần kinh nhân tạo ? Thứ tư, có nhiều quan điểm liên quan đến việc cần phải điều chỉnh dữ liệu trước khi đưa vào mô hình Mạng thần kinh nhân tạo, liệu rằng nó có cần thiết cho bài nghiên cứu này khi tiến hành xây dựng mô hình Mạng thần kinh nhân tạo hay không ? Thứ năm, mô hình Mạng thần kinh nhân tạo nào sẽ được lựa chọn để xây dựng mô hình dự báo tốc độ tăng trưởng GDP Việt Nam? Thứ sáu, khả năng ứng dụng mô hình Mạng thần kinh nhân tạo trong việc dự báo tốc độ tăng trưởng GDP Việt Nam nói riêng và các biến kinh tế nói chung ?, mô hình Mạng thần kinh nhân tạo có thể kết hợp với mô hình Hồi quy tuyến tính để cho ra một mô hình dự báo tốt ở Việt Nam như một số công trình trên thế giới đã thực hiện hay không ? Cuối cùng, hướng nghiên cứu mở rộng nào trong tương lai mà bài nghiên cứu đặt ra cho những vấn đề còn hạn chế? 3. Phương pháp nghiên cứu Trong bài nghiên cứu này, nhóm sử dụng phương pháp định lượng sẽ là phương pháp chủ yếu để xây dựng mô hình Mạng thần kinh nhân tạo và mô hình Hồi quy tuyến tính truyền thống cho dự báo. Tuy nhiên, phương pháp định tính cũng sẽ được nhóm sử dụng làm cơ sở lựa chọn các nhân tố kinh tế tác động đến tốc độ tăng trưởng GDP. Bên cạnh đó, phương pháp so sánh sẽ được áp dụng để tìm kiếm mô hình dự báo hiệu quả từ các mô hình trên. Mô hình Mạng thần kinh nhân tạo được xây dựng trên phần mềm NeuroSolutions phiên bản 6.01 (bản dùng thử), và mô hình Hồi quy tuyến tính truyền thống được xây dựng bằng phần mềm EViews 5.0. Về bộ dữ liệu dùng cho xây dựng mô hình được thu thập từ Ngân hàng nhà nước Việt Nam và Tổng cục thống kê Việt Nam. 4. Nội dung nghiên cứu Thứ nhất, bài nghiên cứu sẽ tiến hành lược khảo các bài nghiên cứu trước đây trong và ngoài nước để có tổng quan về vấn đề cần nghiên cứu. Thứ hai, nhóm sẽ trình bày lý thuyết về Mạng thần kinh nhân tạo để đặt nền tảng cho việc xây dựng mô hình. Thứ ba, xây dựng các mô hình dự báo tốc độ tăng trưởng GDP. Cuối cùng, bài nghiên cứu thực hiện so sánh và rút ra kết luận cho một mô hình dự báo tốc độ tăng trưởng GDP hiệu quả. 5. Đóng góp của đề tài Trong giới hạn và mục tiêu của nghiên cứu, bài nghiên cứu này cung cấp một cái nhìn tổng quan trong việc ứng dụng mô hình Mạng thần kinh nhân tạo để dự báo các biến số kinh tế. Bên cạnh đó, thông qua quá trình thực nghiệm xây dựng các mô hình dự báo tốc độ tăng trưởng Tổng sản phẩm quốc nội (GDP) Việt Nam, nhóm nghiên cứu đã tiến hành so sánh hiệu quả dự báo giữa mô hình Mạng thần kinh nhân tạo và mô hình Hồi quy tuyến tính truyền thống để tìm ra mô hình dự báo tốt nhất. Vì vậy, bài nghiên cứu này sẽ là một đóng góp tích cực cho hướng nghiên cứu mới trong lĩnh vực dự báo các biến số kinh tế. 6. Hướng phát triển sắp tới của đề tài Bên cạnh những gì bài nghiên cứu đã thực hiện được thì thật sự cần thiết để nói rằng vấn đề ứng dụng mô hình Mạng thần kinh nhân tạo trong việc xử lý thông tin và dự báo các biến số kinh tế sẽ không ngừng lại, mà nó cần phải liên tục được nghiên cứu, hoàn thiện, khắc phục những điểm yếu, cũng như vận dụng, khai thác các ưu điểm của mô hình. Từ đó, góp phần đưa mô hình Mạng thần kinh nhân tạo như là một sự lựa chọn tốt cho công tác dự báo biến số kinh tế bên cạnh các mô hình kinh tế lượng truyền thống ở Việt Nam. MỤC LỤC PHẦN MỞ ĐẦU . 1 Chương 1: GIỚI THIỆU . . 2 1.1. Mô hình Mạng thần kinh nhân tạo và công tác dự báo 2 1.2. Lược khảo các nghiên cứu trước đây 3 1.3. Mục tiêu của bài nghiên cứu . 7 Chương 2: MÔ HÌNH MẠNG THẦN KINH NHÂN TẠO 9 2.1. Đặc điểm của Mạng thần kinh nhân tạo . 9 2.1.1. Nơ-ron sinh học 9 2.1.2. Nơ-ron nhân tạo 11 2.1.3. Mạng thần kinh nhân tạo 13 2.2. Các dạng mô hình Mạng thần kinh nhân tạo 14 2.2.1. Mạng thần kinh truyền thẳng . 14 2.2.1.1. Mạng thần kinh truyền thẳng đơn giản nhất . 14 2.2.1.2. Mạng thần kinh truyền thẳng đa lớp . 15 2.2.1.3. Mạng thần kinh bổ sung 17 2.2.2. Mạng thần kinh nhân tạo hồi tiếp 18 2.2.2.1. Mạng thần kinh hồi tiếp Jordan 19 2.2.2.2. Mạng thần kinh hồi tiếp Elman . 19 2.3. Huấn luyện Mạng thần kinh nhân tạo . 20 2.3.1. Quá trình học của Mạng thần kinh 20 2.3.2. Các phương pháp học 20 2.3.2.1. Học theo tham số 20 2.3.2.2. Học cấu trúc . 22 2.3.3. Hàm truyền 22 2.3.4. Thuật toán truyền ngược 26 2.3.4.1. Điều chỉnh trọng số của Mạng thần kinh 28 2.3.4.2. Nguyên tắc giảm độ dốc 29 2.3.4.3. Truyền ngược sai số 30 2.4. Các vấn đề của mô hình Mạng thần kinh nhân tạo . 34 2.4.1. Tổng quát hóa và học quá mức 34 2.4.2. Thủ tục ngừng đúng lúc . 35 2.5. Ưu điểm và khuyết điểm của mô hình Mạng thần kinh nhân tạo . 37 2.5.1.Ưu điểm 37 2.5.2. Khuyết điểm 38 2.6. So sánh mô hình Mạng thần kinh nhân tạo và mô hình hồi quy tuyến tính . 39 Chương 3: XÂY DỰNG MÔ HÌNH DỰ BÁO TỔNG SẢN PHẨM QUỐC NỘI (GDP) CỦA VIỆT NAM . . 41 3.1. Dữ liệu 41 3.1.1. Giải thích biến . 43 3.1.2. Kỳ vọng về dấu 46 3.2. Xây dựng mô hình Hồi quy tuyến tính truyền thống cho dự báo tốc độ tăng trưởng GDP Việt Nam . 47 3.3. Xây dựng mô hình Mạng thần kinh nhân tạo để dự báo tốc độ tăng trưởng Tổng sản phẩm quốc nội (GDP) của Việt Nam 50 3.3.1. Quy trình xây dựng mô hình Mạng thần kinh nhân tạo 50 3.3.1.1. Lựa chọn các biến số và thu thập dữ liệu . 50 3.3.1.2. Tiền xử lý dữ liệu . 51 3.3.1.3. Lựa chọn các thông số cho mô hình . 54 3.3.1.4. Tiến hành thực hiện xây dựng mô hình 57 3.3.1.5. Dự báo và phân tích kết quả . 58 3.3.2. Xây dựng mô hình Mạng thần kinh nhân tạo một cách độc lập để dự báo tốc độ tăng trưởng GDP 59 3.3.3. Xây dựng mô hình Mạng thần kinh nhân tạo với sự hỗ trợ từ mô hình hồi quy tuyến tính truyền thống 62 Chương 4: KẾT QUẢ DỰ BÁO VÀ KẾT LUẬN . 67 4.1 So sánh kết quả dự báo tốc độ tăng trưởng GDP Việt Nam của các mô hình . 67 4.2 Kết luận 72 PHẦN KẾT LUẬN . 73 PHỤ LỤC 74 TÀI LIỆU THAM KHẢO . . 94

pdf109 trang | Chia sẻ: lvcdongnoi | Lượt xem: 3376 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Đề tài Dự báo tốc độ tăng trưởng kinh tế Việt Nam: Sự vượt trội của mô hình Mạng thần kinh nhân tạo (ANN) so với mô hình Hồi quy tuyến tính truyền thống, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hướng nghiên cứu mở rộng của đề tài trong tương lai. 74 PHỤ LỤC 1 KẾT QUẢ ƢỚC LƢỢNG VÀ KIỂM ĐỊNH TRONG MÔ HÌNH HỒI QUY TUYẾN TÍNH Hình A.1: Kết quả kiểm định phân phối chuẩn của phần dƣ Bảng A.1: Kết quả hồi quy tăng trƣởng GDP theo các nhân tố tác động Biến độc lập Hệ số hồi quy Sai số thống kê Thống kê t P - Value C 2,83006 1,25857 2,248632 0,0326 VNIBOR3Mt-2 -0,173891 0,065644 -2,649000 0,0131** VĐTNNt 0,016149 0,004716 3,424517 0,0019*** LĐt-1 0,073402 0,017077 4,298412 0,0002*** NKt-1 -0,019866 0,007954 -2,497529 0,0187** XKt-2 -0,014667 0,00684 -2,144100 0,0409** GDPt-1 0,767097 0,119095 6,441030 0*** ***, ** lần lượt là mức ý nghĩa 1%, 5% 75 Bảng A.2: Các chỉ số thống kê R-squared 0,832359 Mean dependent var 7,0159 Adjusted R-squared 0,796436 S.D. dependent var 1,2894 S.E. of regression 0,581754 Akaike info criterion 1,9313 Sum squared resid 9,476259 Schwarz criterion 2,2424 Log likelihood -26,798080 F-statistic 23,171 Durbin-Watson stat 1,870304 Prob(F-statistic) 0 Bảng A.3: Kết quả kiểm định phƣơng sai thay đổi Breusch-Godfrey Serial Correlation LM Test: F-Statistic 0,100658 Probability 0,753482 Obs*R-squared 0,129998 Probability 0,718434 Bảng A.4: Kết quả kiểm định tự tƣơng quan với độ trễ là 1 White Heteroskedasticity Test: F-Statistic 0,861434 Probability 0,643035 Obs*R-squared 26,90316 Probability 0,469029 Bảng A.5: Kết quả kiểm định tự tƣơng quan với độ trễ là 4 Breusch-Godfrey Serial Correlation LM Test: F-Statistic 0,198517 Probability 0,936693 Obs*R-squared 1,120929 Probability 0,890938 76 Bảng A.6: Kết quả kiểm đinh đa cộng tuyến Biến phụ thuộc F P-Value R2 VIF VNIBOR3Mt-2 5,777824 0,000809 0,499042 1,996175 VĐTNNt 1,571722 0,199293 0,21321 1,270987 LĐt-1 5,334063 0,001351 0,479076 1,919666 NKt-1 5,47266 0,001149 0,485481 1,943563 XKt-2 1,958013 0,115091 0,252386 1,337589 GDPt-1 7,775025 0,000097 0,572745 2,340523 Bảng A.7: Kiểm định bỏ sót biến Ramsey RESET Test: F-Statistic 0,370853 Probability 0,693737 Log likelihood ratio 0,984474 Probability 0,611257 77 PHỤ LỤC 2 KẾT QUẢ DỰ BÁO CỦA CÁC MÔ HÌNH DỰ BÁO TRONG MẪU (Q2/2001 - Q4/2009) % GDP mục tiêu ANN HQTT NN & HQTT Q2/2001 6,59474417 6,83178342 6,21026943 6,605600649 Q3/2001 6,786217837 8,09504509 7,434701804 6,907369323 Q4/2001 6,551018981 6,91853674 5,698805732 6,164947994 Q1/2002 6,296923933 6,19337594 6,11410508 6,379618667 Q2/2002 6,328591487 7,00516051 7,422285561 6,803187815 Q3/2002 6,983462606 7,13580042 7,170366149 6,871774483 Q4/2002 6,980884815 7,0464883 7,199128047 7,316621746 Q1/2003 6,630242562 6,24454099 5,374694992 6,575035468 Q2/2003 6,531112105 6,44449067 5,487943055 6,259271616 Q3/2003 7,435034958 7,22831068 8,767490051 7,80000116 Q4/2003 7,718024544 7,77530619 7,153477856 7,27887275 Q1/2004 7,06697672 6,62655535 6,046379851 6,749166748 Q2/2004 7,132683154 7,49415949 7,706471127 6,840198907 Q3/2004 7,600886799 7,39372018 8,353300521 7,699276037 Q4/2004 7,949776304 7,87124339 8,556494507 8,556075824 Q1/2005 7,614352532 7,1540279 6,567761547 7,179703968 Q2/2005 7,453721744 7,61344247 8,068578294 7,734386737 Q3/2005 8,453934892 8,4488758 9,241150352 8,856910893 Q4/2005 7,722061146 8,78984142 9,241150352 8,705639071 Q1/2006 6,859094176 7,48174762 7,239199184 7,092106331 Q2/2006 7,702520456 6,84629378 6,786083638 7,15643991 Q3/2006 8,729717714 7,61843295 9,241150352 8,413488494 Q4/2006 8,605059674 8,03551284 8,851108846 8,533489423 78 Q1/2007 7,679103304 7,8555529 7,490376952 7,379688747 Q2/2007 7,661031078 6,90072105 7,77656382 7,685394292 Q3/2007 8,934956606 8,66360398 9,241150352 8,369654957 Q4/2007 8,612783134 7,96031429 9,069316582 9,026234414 Q1/2008 7,25685776 7,25367329 6,625774024 7,251324922 Q2/2008 5,652333049 6,60516815 5,499009962 5,657754439 Q3/2008 6,245281926 6,61045149 6,594015491 6,271597475 Q4/2008 5,209127599 6,00787432 4,942831597 5,157747535 Q1/2009 5,620032708 3,06677223 4,942831597 3,075473499 Q2/2009 6,584777383 3,87239471 4,942831597 4,329800445 Q3/2009 6,738173364 5,07277101 5,057850512 5,053770237 Q4/2009 7,414912178 7,39573465 7,9227285 7,820099231 DỰ BÁO NGOÀI MẪU (Q1/2010 - Q4/2010) % GDP mục tiêu ANN HQTT NN & HQTT Q1/2010 5,51674037 3,60174027 6,082738973 5,764309118 Q2/2010 6,324781803 7,50449988 5,942752212 6,097514309 Q3/2010 7,180184696 6,29686366 7,183827829 7,140441001 Q4/2010 7,24688094 6,67845393 7,030516692 6,977260394 79 PHỤ LỤC 3 SƠ LƢỢC QUÁ TRÌNH PHÁT TRIỂN CỦA MẠNG THẦN KINH NHÂN TẠO Sự phát triển của Mạng thần kinh nhân tạo trải qua cả một quá trình từ việc đưa ra khái niệm đến việc ứng dụng những khái niệm này. Cuối thế kỷ 19, đầu thế kỷ 20, ý tưởng cơ bản ban đầu về mạng thần kinh được nghiên cứu và phát triển bởi các nhà khoa học thuộc lĩnh vực Vật lý học, Tâm lý học và Thần kinh học. Nhưng các công trình nghiên cứu của họ chủ yếu đi sâu vào lý thuyết tổng quát về học, nhìn, lập luận, điều khiển… mà không đưa ra những mô hình toán học cụ thể mô tả hoạt động của nơ-ron. Đến năm 1943, Warren McCulloch và Walter Pittsđã mô tả hoạt động của nơ-ron sinh học, phỏng theo hoạt động của chúng để xây dựng một mạng nơ-ron đơn giản. Các nơ- ron của mạng như các thiết bị nhị phân với ngưỡng cố định, có khả năng thực hiện các phép tính lô-gic.Điều này đánh dấu sự ra đời của mạng thần kinh nhân tạo. Năm 1948, Norbert Wiener đã quan tâm đến việc kiểm soát thông tin và xử lý tín hiệu thống kê. Ông là người sáng lập ngành điều khiển học, tạo bước đầu đột phá lớn trong lĩnh vực khoa học máy tính. Năm 1949, Donald Hebb giới thiệu quy tắc học đầu tiên. Quy tắc học này còn được gọi là quy tắc học Hebb, được dựa trên cơ sở các nơ-ron có khả năng tăng cường sự kết nối với nhau, nghĩa là các nơ-ron sẽ tăng cường độ kết nối giữa chúng sau mỗi lần học. Những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hình hóa các nguyên lý của những lý thuyến tổng quát liên quan đến cách thức con người suy nghĩ và hành động đã trở thành hiện thực. Nathanial Rochester sau nhiều năm làm việc tại phòng nghiên cứu của IBM đã nỗ lực để mô phỏng một mạng nơ-ron. Trong thời kỳ này, các phương pháp tính toán truyền thống đã đạt được những thành công rực rỡ, trong khi đó những nghiên cứu về mạng thần kinh còn ở giai đoạn sơ khai. Mùa hè năm 1956, Hội nghị Dartmouth tại Trường Đại Học Dartmouth của Mỹ đánh dấu sự ra đời của ngành trí tuệ nhân tạo (Artificial Intelligence). Hội nghị đã mở ra thời kỳ phát triển mới và thúc đẩy hơn nữa mối quan tâm của các nhà khoa học trong lĩnh vực trí tuệ nhân tạo cũng như mạng nơ-ron nhân tạo. Vào cuối những năm 50 của thế kỷ 20, Frank Rosenblatt phát minh ra Mạng truyền thẳng đơn giản nhất (Perceptron) và quy tắc học Perceptron. Mạng Perceptron có khả năng nhận dạng dữ liệu. Quy tắc Perceptron mạnh hơn quy tắc Hebb. Quy tắc này học 80 chính xác hơn Hebb, kết quả làm tăng cường sự kết nối giữa các nơ-ron. Cũng trong thời gian này, Bernard Widrow và Marcian Hoff đã xây dựng Mạng thần kinh tuyến tính thích ứng (Adaptive Linear Neuron – ADALINE) và mở rộng ADALINE với nhiều lớp mạng thành Mạng thần kinh tuyến tính thích ứng đa lớp (Multiple Adaptive Linear Neuron - MADALINE). Bên cạnh đó, họ còn khám phá ra quy tắc học Widrow – Hoff hay còn gọi là quy tắc học Delta. Quy tắc này gần giống với quy tắc Perceptron, nhưng khác ở chỗ quy tắc Widrow – Hoff có thể tối thiểu hóa chênh lệch giữa đầu ra tính toán và đầu ra mục tiêu. Tuy nhiên, cả Rosenblatt và Widrow – Hoff đều vấp phải vấn một vấn đề mà Minsky và Papert đã phát hiện ra vào năm 1969. Đó là các mạng này đã không thể sử dụng với các hàm lô-gic phức tạp, không thể học các loại hàm không phân tách tuyến tính (Linearly inseparable functions). Họ đã cố gắng cải thiện quy tắc học và mạng để có thể khắc phục vấn đề này nhưng họ không thành công. Do vậy, việc nghiên cứu về mạng nơ-ron gần như bị chậm lại trong suốt một thập kỷ. Đến năm 1972, Teuvo Kohonen và James Anderson phát triển một loại Mạng thần kinh mới có khả năng hoạt động như một bộ nhớ. Stephen Grossberg tiến hành khảo sát các Mạng thần kinh tự tổ chức (Self Organizing Networks). Năm 1974, Paul Werbos đã phát triển và ứng dụng thuật toán truyền ngược (Backpropagation Algorithm). Tuy nhiên, vài năm sau đó thuật toán này mới trở nên phổ biến. Nó được biết đến và áp dụng rộng rãi nhất cho đến ngày nay. Tuy nhiên, những thành công ban đầu này đã khiến cho con người nghĩ quá nhiều về khả năng của Mạng thần kinh. Điều này tác động tiêu cực đến sự phát triển của khoa học và kỹ thuật thời bấy giờ khi người ta lo sợ đã đến lúc máy móc có thể làm mọi việc của con người. Những lo lắng này khiến người ta bắt đầu phản đối các nghiên cứu về Mạng thần kinh. Do vậy, việc nghiên cứu về Mạng thần kinh đã tạm lắng xuống. Đến năm 1982, trong bài báo gửi tới Viện khoa học Quốc gia, thì John Hopfield với sự phân tích toán học rõ ràng, mạch lạc đã chỉ ra cách thức các Mạng thần kinh làm việc và những công việc chúng có thể thực hiện được. Cống hiến của Hopfield không chỉ dừng lại ở giá trị của một công trình nghiên cứu khoa học mà còn thúc đẩy sự trở lại của các nghiên cứu về Mạng thần kinh. Mở rộng nghiên cứu của Hopfield, Rumelhart, Hinton và Williams (1986) đã khám phá thuật toán sai số truyền ngược (Error Backpropagation) để huấn luyện cho Mạng thần kinh đa lớp nhằm giải các bài toán mà Mạng thần kinh truyền thẳng đơn giản nhất không giải quyết được. Từ năm 1987 đến nay, nhiều hội thảo về nghiên cứu Mạng thần kinh đã được tổ chức hàng năm. Chẳng hạn, năm 1987, hội thảo quốc tế đầu tiên về mạng nơ-ron của Viện 81 các kỹ sư điện và điện tử IEEE (Institute of Electrical and Electronic Engineer) đã thu hút hơn 1800 người tham gia. Ngày nay, không chỉ dừng lại ở việc nghiên cứu lý thuyết mà các nghiên cứu ứng dụng Mạng thần kinh để giải các bài toán thực tế được phát triển rộng khắp. Các ứng dụng Mạng thần kinh ra đời ngày càng nhiều và ngày càng hoàn thiện trong nhiều lĩnh vực như xử lý, nhận dạng, lọc, điều khiển, dự báo,... 82 PHỤ LỤC 4 CÁC ỨNG DỤNG CỦA MẠNG THẦN KINH NHÂN TẠO 1. Sơ lƣợc các ứng dụng Mạng thần kinh nhân tạo Mạng thần kinh nhân tạo là một công cụ mô hình hóa dữ liệu hữu hiệu có khả năng nhận dạng và thể hiện các mối quan hệ phức tạp giữa các biến dự báo (các biến độc lập, các đầu vào) và các biến được dư báo (các biến phụ thuộc, các biến đầu ra). Mạng thần kinh nhân tạo hữu dụng nhất cho việc phát hiện, phân loại và dự báo khi có một lượng lớn các thông tin có sẵn. Mạng thần kinh đã và đang được ứng dụng để giải quyết nhiều vấn đề trong nhiều lĩnh vực với các tiện ích khác nhau cụ thể như: Lĩnh vực kinh tế  Kế toán, kiểm toán: nhận biết gian lận thuế, cải thiện việc kiểm toán công ty bằng cách phát hiện các bất hợp lý.  Tài chính, ngân hàng: Mạng thần kinh nhân tạo được ứng dụng trong lĩnh vực tài chính, ngân hàng với hầu hết các chức năng phổ biến của nó như nhận dạng, phân loại và dự báo. Nó được các định chế tài chính ứng dụng để dự báo hiệu quả hoạt động của một ngân hàng, lập kế hoạch tài chính, dự báo tỷ giá hối đoái, dự báo số lượng chào bán chứng khoán ra công chúng, dự báo chỉ số thị trường chứng khoán hay giá chứng khoán, kinh doanh tiền tệ, hàng hóa, dầu, …. Giúp tính điểm tín dụng khách hàng thông qua tuổi, học vấn, nghề nghiệp, lịch sử giao dịch và các thông tin khác của ứng viên có sẵn. Phát hiện thẻ ngân hàng giả mạo, phát hiện gian lận trong giao dịch tài khoản, … Bên cạnh đó, nó còn được phát triển với mục tiêu cảnh báo sớm các cuộc khủng hoảng trong tương lai như dự báo phá sản của một doanh nghiệp, dự báo rủi ro quốc gia, …  Bảo hiểm: Mạng thần kinh nhân tạo giúp phát hiện các gian lận trong các khoản thanh toán tiền bồi thường, …  Marketing: Sự cần thiết để phân loại các nhóm khách hàng, nhận dạng đặc điểm khách hàng, dự báo doanh số,… đã được mạng thần kinh nhân tạo đáp ứng rất tốt.  Quản trị: Mạng thần kinh giúp phân bổ nguồn lực, xác định yêu cầu nguồn nhân lực, sản lượng tiêu thụ hàng hóa, nhu cầu nguồn nguyên vật liệu cho sản xuất,…  Ngoài ra, Mạng thần kinh nhân tạo còn được các nhà điều hành kinh tế, các tổ chức định chế tài chính, các nhà kinh doanh sử dụng như một công cụ phát hiện các mối quan hệ, nhân tố tác động và dự báo các biến số kinh tế vĩ mô như lạm phát, lãi suất, sản lượng công nghiệp, tốc độ tăng trưởng kinh tế,… nhằm giúp 83 cho việc xây dựng, hoạch định và quyết định các chiến lược cho các mục tiêu trong từng giai đoạn cụ thể. Lĩnh vực dự báo thời tiết, cảnh báo các thảm họa thiên nhiên: Nhận dạng hình ảnh vệ tinh, khí tượng học, xây dựng hệ thống cảnh báo hiện đại trong tương lai cho lở đất, động đất, sóng thần hay các thảm họa thiên nhiên,… Lĩnh vực khai khoáng, năng lƣợng: Mạng thần kinh nhân tạo giúp dự báo trữ lượng khoáng sản, sản lượng điện, nhu cầu sử dụng điện trong tương lai,… Lĩnh vực y học: Mạng thần kinh nhân tạo đã sớm được phát triển và ứng dụng để chẩn đoán các căn bệnh, nhận dạng hình ảnh X-quang. Sự khác nhau về các chỉ số liên quan sức khỏe (chẳng hạn, một sự kết hợp nhịp tim, nồng độ các chất khác nhau trong máu, nhịp hô hấp, …) có thể được giám sát và chúng thực sự có các mối quan hệ rất phức tạp. Tuy nhiên, Mạng thần kinh đã được phát triển để nhận dạng các mẫu hình bất thường nhằm phát hiện, dự báo các căn bệnh tiềm ẩn, giúp cho việc điều trị thích hợp sớm được thực hiện, giảm thiểu tác hại của việc phát hiện trễ. Lĩnh vực giao thông - vận tải: Từ các tín hiệu thông tin đầu vào, mạng thần kinh nhân tạo được dùng để xử lý và cho ra các kết quả cảnh báo sớm khả năng ùn tắc giao thông trên các tuyến đường, hoạch định đường đi tối ưu, … giúp tiết giảm chi phí rất lớn cho các tổ chức vận tải và xã hội. Lĩnh vực khoa học – công nghệ  Mạng thần kinh nhận tạo đã được ứng dụng và phổ biến rộng rãi nhất trong lĩnh vực này. Công nghệ tự động hóa với những xử lý tinh vi, phức tạp đã gắn liền với mạng thần kinh nhân tạo trong việc tạo ra một trung tâm xử lý vào – ra chính xác của các thiết bị điện tử, các thế hệ robot, …Ngoài ra, mạng thần kinh nhân tạo còn giúp cho các cơ quan hàng không trong việc điều khiển không lưu, phát triển các vật thể bay không người lái,... Nó cũng được phát triển trong việc nhận dạng chữ viết,…  Ngành công nghiệp giải trí được thừa hưởng rất nhiều từ sự phát triển của khoa học, công nghệ. Với các thành tựu mà mạng thần kinh nhân tạo có được cùng với nền khoa học thế giới, nó đã được ứng dụng mạnh mẽ trong lĩnh vực giải trí. Chẳng hạn, người ta tạo ra các máy trò chơi điện tử với khả năng xử lý thông minh, các con vật điện tử thông minh (Giga Pets), hay ứng dụng trong việc tạo ra các phần mềm chơi cờ tướng, cờ vua,… 84  Mạng thần kinh nhân tạo còn giúp cho việc phát minh ra các công cụ bổ trợ học tập như máy học ngoại ngữ có khả năng nhận, xử lý và chuyển ngữ, phát âm các đoạn văn bằng các ngôn ngữ khác nhau từ các nội dung do người học cung cấp,… Trong lĩnh vực an ninh – xã hội: Ở một số quốc gia, Mạng thần kinh nhân tạo còn có thể được ứng dụng rộng rãi trong lĩnh vực an ninh để xác định, phát hiện các xu hướng tội phạm, từ đó giúp cho việc giám sát và phân bổ lực lượng nhằm đảm bảo an ninh được thuận lợi hơn. Chẳng hạn, ở Westminster, California, Hoa Kỳ với dân số vào khoảng 87.000 người, cảnh sát nơi đây đã dùng phần mềm ứng dụng mạng thần kinh nhân tạo để chống lại khủng bố. Các báo cáo về khủng bố sẽ được đưa vào mô hình như các đầu vào, hệ thống sẽ phát hiện và lập ra bản đồ mẫu hình khủng bố địa phương. Họ cho rằng với hệ thống này họ có thể dự báo tốt hơn các xu hướng khủng bố, cải thiện các công tác tuần tra, và triển khai các chương trình ngăn chặn khủng bố tốt hơn. Như vậy, Mạng thần kinh nhân tạo với các đặc tính của nó đã được các nhà khoa học nghiên cứu, phát triển ứng dụng mạnh mẽ trong mọi lĩnh vực của cuộc sống nhằm mang lại lợi ích và sự hiệu quả cho xã hội. 2. Một số bằng chứng thực nghiệm cho khả năng ứng dụng Mạng thần kinh nhân tạo Từ những sơ lược về các ứng dụng mạng thần kinh nhân tạo được trình bày ở trên, chúng tôi cho rằng cần có những bằng chứng thực nghiệm để chứng minh cho những vấn đề đã nêu đó. Và các bằng chứng thực nghiệm về khả năng ứng dụng mạng thần kinh không ngừng được các nhà nghiên cứu trong mọi lĩnh vực tiếp tục nghiên cứu và đưa ra như là một cơ sở vững chắc cho việc áp dụng mạng thần kinh vào thực tiễn, cũng như nhận dạng và khắc phục những hạn chế của mô hình nhằm hướng đến một sự áp dụng hiệu quả, phù hợp hơn. Trong lĩnh vực kinh tế Christian L. Dunis và Mark Williams (2002) kiểm tra và phân tích việc sử dụng mạng thần kinh để dự báo tỷ giá hối đoái và các mô hình giao dịch khác như mô hình ARMA, phương pháp trung bình di động MACD, mô hình giản đơn. Bên cạnh việc sử dụng các tiêu chuẩn đo lường truyền thống về tính chính xác dự báo để đánh giá các mô hình khác nhau, tác giả còn đánh giá sử dụng tiêu chuẩn truyền thống như tỷ suất sinh lợi điều chỉnh rủi ro. Dữ liệu trong mẫu được sử dùng là dữ liệu theo ngày từ 17/10/1994 đến 18/5/2000 và dữ liệu ngoài mẫu là từ 19/5/2000 đến 3/7/2001. Các mô hình giao dịch được đánh giá theo các tiêu chuẩn đo lường độ chính xác dự báo và xét theo kết quả giao dịch thông qua chiến lược giao dịch mô phỏng. Kết quả cho thấy, mô hình 85 mạng thần kinh nhân tạo hoạt động tốt hơn các mô hình truyền thống khác trong dự báo với kết quả giao dịch đạt tỷ suất sinh lợi hàng năm cao nhất là 29,68% so với các mô hình khác trung bình là 15,65%. Ngoài ra, mạng thần kinh nhân tạo có tỷ lệ các giao dich ít thành công cao nhất là 57,24% so với các mô hình khác trung bình là 47,75%. Ashish Vikram, Sivakumar Chennuru, H.R.rao, và Shambhu Upadhyaya (2004) đã đưa ra tại Hội nghị Quốc tế Hawaii lần thứ 37 “Một giải pháp thiết kế cho các định chế tài chính để xử lý các hoạt động phi pháp: Phương pháp mạng thần kinh nhân tạo”. Theo các tác giả, công nghiệp dịch vụ tài chính và ngân hàng ngày nay đặt nặng vào việc dùng hệ thống dữ liệu được kết nối và máy tính hóa nhằm quản lý các tài khoản và các thông tin tài chính theo thời gian thực cho hàng triệu khách hàng. Với kỹ thuật cơ bản này là một nguồn rất lớn các thông tin, các thông tin này có thể được dùng để xác nhận và ngăn chặn gian lận tài chính bao gồm sự chuyển khoản bất hợp pháp/trái phép của các quỹ được thực hiện bởi các bộ phận bên ngoài và bên trong đối với định chế tài chính bị lừa gạt. Bài nghiên cứu triển khai một ý tưởng bao gồm việc dùng các mạng thần kinh nhân tạo cho các thông tin có liên quan từ các nguồn dữ liệu và kỹ thuật đa dạng nhằm nhận dạng hoạt động của các tài khoản đáng nghi ngờ. Bằng việc sử dụng phương pháp lớp ẩn- dùng quy tắc dựa trên sự phân loại, mạng thần kinh nhân tạo tự tổ chức học không giám sát hoạt động tốt như mạng thần kinh nhân tạo học có giám sát được huấn luyện để truy cập mức độ rủi ro liên quan với một giao dịch hoặc một tập hợp các giao dịch- để giám sát và phân tích các giao dịch của tài khoản ở các định chế tài chính dựa trên các thông tin có sẵn từ các nguồn khác nhau trong hệ thống tài chính nên giúp giảm bớt khó khăn và chi phí cho việc liên tục giám sát theo thời gian thực hoạt động của tài khoản. Cuối cùng, mục tiêu là phát hiện hoạt động bất thường, và nếu như các hoạt động có ý gian lận này xảy ra sẽ làm tổn hại rất lớn cho các định chế tài chính trong thời kỳ các hệ thống tài chính được máy tính hóa, với hệ thống tài chính được máy tính hóa sẽ tiềm ẩn các yếu tố không mong đợi cả trong và ngoài các định chế này. Trong bài nghiên cứu này, phạm vi và số biến được xác định đồng thời hiện được tăng lên. Nói về chất lượng, việc tăng sự phức tạp của vấn đề bằng cách tăng số lượng biến số giải thích có thể được giải quyết bằng cách dùng các mạng thần kinh tinh vi hơn với số nơ-ron và/ hoặc các lớp nhiều hơn cho một sự đánh đổi có được năng lực tính toán lớn hơn. Nghiên cứu cũng sẽ yêu cầu tạo ra các phương pháp để chuyển đổi các nguồn dữ liệu khác nhau có liên quan đến tài khoản thành các định dạng phù hợp cho việc sử dụng bằng các mạng thần kinh nhân tạo. Các công việc này sẽ tương đối dễ dàng, chẳng hạn chuyển đổi nguồn địa chỉ IP liên quan đến một giao dịch thành một định dạng có thể đọc được bằng mạng thần kinh nhân tạo, có thể 86 được thực hiện bằng việc cung cấp các file hoặc các gói thông tin (packet) dò tìm đường kết nối mạng liên quan với một tài khoản/ giao dịch thành một bộ lọc trích lọc thông tin cần thiết và lưu trữ nó trong một bộ dữ liệu. Kingkarn Sookhanaphibarn, Piruna Polsiri, Worawat Choensawat và Frank C.Lin (2007) đã đề xuất “Ứng dụng mạng thần kinh nhân tạo để phân tích sự phá sản của doanh nghiệp ở Thái Lan”. Nhóm tác giả đã cho rằng cuộc khủng hoảng Đông Nam Á năm 1997-1998 là một bài học cho việc thiếu một hệ thống cảnh báo sớm và để đáp ứng như một tín hiệu cảnh báo sớm hiệu quả, thì độ chính xác của một mô hình dự báo sự phá sản rất quan trọng và vững chắc theo thời gian. Bài nghiên cứu này phân tích các biến tài chính và các biến quyền sở hữu bằng cách dùng phân tích thành phần gốc với mục tiêu giảm một lượng lớn dữ liệu tài chính cho bài toán dự báo phá sản của doanh nghiệp. Bằng việc dùng mạng thần kinh cho dự báo phá sản, thì các đặc tính được tạo ra cung cấp cho mạng thần kinh nhân tạo như dữ liệu đầu vào. Các thực nghiệm của nhóm tác giả này chứng tỏ cho việc thực hiện dự báo của 3 mô hình mạng thần kinh nhân tạo: Lượng tử hóa vec-tơ học hỏi (Learning Vector Quantization), Mạng thần kinh dựa vào xác suất (Probabilistic Neural Network) và Mạng thần kinh truyền thẳng với học truyền ngược (Feedforward Network with Back-propagation learning). Tất cả các phương pháp này được áp dụng với các bộ dữ liệu của 41 định chế tài chính Thái Lan cho thời kỳ 1993-2003. Họ đã tiến hành so sánh sự hiệu quả của 3 mô hình này cho độ chính xác dự báo. Ngoài ra, Phân tích thành phần gốc (PCA) được dùng trong các mô hình để giảm kích thước dữ liệu. Dữ liệu với các kích thước giữa 5 và 9 thì hiệu quả nhất trong khi dữ liệu với kích thước bước ít hơn 5 cho ra độ chính xác thấp nhất. Việc so sánh giữa 3 mô hình, thì mô hình Lượng tử hóa vec- tơ học hỏi (Learning Vector Quantization) thực hiện tốt hơn hẳn 2 mô hình còn lại khi xem xét cả độ chính xác dự báo và độ lệch (Bias). Mô hình mạng thần kinh nhân tạo dựa vào xác suất (Probabilistic Neural Network – PNN) cho ra các kết quả phù hợp với mỗi lần chạy nhưng mà độ chính xác của nó là thấp nhất. Mạng thần kinh truyền thẳng với học truyền ngược cung cấp các kết quả chính xác phù hợp với các kết quả đó nhưng độ lệch của nó thì dường như cao hơn hai phương pháp còn lại. Ngoài ra, trong một nền kinh tế thị trường đang hội nhập với sự tập trung quyền sở hữu là phổ biến, thì các biến quyền sở hữu chứng tỏ đóng một vai trò quan trọng trong việc xác định khả năng một định chế tài chính bị phá sản. Nor Mazlina Abu Bakar và Izah Mohd Tahir (2009) đã thực hiện công trình nghiên cứu “Áp dụng mô hình hồi quy tuyến tính bội (Multiple Linear Regression) và mô hình mạng thần kinh nhân tạo dự báo hiệu quả hoạt động của ngân hàng”. Bài nghiên 87 cứu này hướng đến việc dự báo hiệu quả hoạt động của ngân hàng bằng mô hình hồi quy bội và mô hình mạng thần kinh nhân tạo. Sau đó, sẽ tiến hành đánh giá hiệu quả của hai mô hình này cho mục tiêu tìm ra một công cụ tốt cho dự báo hiệu quả hoạt động của ngân hàng. Dữ liệu về 13 ngân hàng cho thời kỳ 2001-2006 đã được sử dụng trong bài nghiên cứu này. Tỷ suất sinh lợi trên tài sản (ROA) được xem là đại lượng đại diện cho hiệu quả hoạt động của ngân hàng và là biến phụ thuộc cho các hàm hồi quy bội, đầu ra của mạng thần kinh nhân tạo. Các biến như tính thanh khoản, rủi ro tín dụng, tỷ số chi phí-thu nhập, quy mô, tỷ số tập trung, lạm phát và GDP là 7 biến độc lập, biến đầu vào của các mô hình. Kết quả thực nghiệm của mô hình hồi quy bội chỉ ra rằng 2 biến: rủi ro tín dụng và tỷ số chi phí-thu nhập thì có ý nghĩa trong việc giải thích hiệu quả hoạt động của ngân hàng. Hai biến này giải thích khoảng 60,9% cho tất cả các thay đổi của hiệu quả hoạt động của ngân hàng trong dữ liệu này với Sai số bình phương trung bình - MSE là 0,33. Mô hình mạng thần kinh nhân tạo đã tìm ra kết quả tối ưu bằng cách học có giám sát với 13 nơ-ron lớp ẩn. Kết quả kiểm tra lại cho thấy rằng 7 biến đầu vào giải thích khoảng 66,9% cho tất cả các thay đổi của hiêu quả hoạt động của ngân hàng trong dữ liệu này với MSE rất thấp 0,00687. Hiệu quả của cả 2 phương pháp thì được đo lường bằng Sai số dự báo bình phương trung bình - MSPR ở giai đoạn phê duyệt (validation stage). Giá trị MSPR của mô hình mạng thần kinh nhân tạo thấp hơn giá trị MSPR của mô hình hồi quy bội (0,0061 so với 0,619). Cuối cùng, bài nghiên cứu thực nghiệm này kết luận rằng mạng thần kinh nhân tạo là một công cụ hiệu quả hơn cho việc dự báo hiệu quả hoạt động của ngân hàng. Lĩnh vực dự báo thời tiết, cảnh báo các thảm họa thiên nhiên K. T. Chang và J. K. Liu (2004) sử dụng mạng thần kinh nhân tạo và hình ảnh vệ tinh để phát hiện lở đất ở núi Jiu-fen-ell, Đài Loan. Kết quả cho thấy, sử dụng mạng thần kinh nhân tạo có thể giúp nhận dạng được khoảng 85% việc lở đất. Lĩnh vực khai khoáng, năng lƣợng Juntakan Taweekun (2005) đã tiến hành thực nghiệm xây dựng mô hình “Dự báo trữ lượng ở Thái Lan bằng mạng thần kinh nhân tạo” mà cụ thể là dự báo nhu cầu sử dụng điện ở Thái Lan trong tương lai. Trong bài nghiên cứu này, tổng sản phẩm quốc nội (GDP), tổng sản phẩm quốc dân (GNP), chỉ số sản xuất sản phẩm, dân số, số hộ gia đình, giá dầu, sức tiêu thụ nhiên liệu, nhiệt độ môi trường bình quân và sức tiêu thụ điện được dùng như là các biến đầu vào của các mạng thần kinh nhân tạo để dự báo nhu cầu năng lượng điện cao nhất. Các mạng thần kinh nhân tạo truyền thẳng 3 lớp được huấn luyện với thuật toán huấn luyện không lặp lại nhanh (fast non-iterative 88 training algorithm) được dùng trong bài nghiên cứu này cho việc dự báo trong dài hạn. Các mạng thần kinh nhân tạo được lựa chọn bằng cách loại bỏ dần các biến đầu vào không cần thiết. Kết quả từ bài nghiên cứu này cho thấy nhu cầu năng lượng điện cho các năm 2003, 2005, 2010, 2015 và 2020 lần lượt là 19.067, 22.577, 31.527, 36.753 và 38.212 MW. Mạng thần kinh nhân tạo có thể cho các ước lượng chính xác như được chứng minh qua các chỉ tiêu đo lường hiệu quả như căn bậc hai của sai số bình phương trung bình, hệ số biến thiên, sai số độ lệch trung bình. Trong lĩnh vực y học Nhóm Yuzheng Wu (1993) đã ứng dụng mạng thần kinh trong việc chụp tia X vú để giúp các bác sĩ chụp X-quang chẩn đoán bệnh ung thư vú. Mạng thần kinh nhân tạo truyền thẳng có 3 lớp với thuật toán truyền ngược được huấn luyện để phân tích ảnh của những khối u ở ngực với các đặc điểm cơ bản được rút ra bởi các bác sĩ chụp X- quang có kinh nghiệm. Mạng thần kinh sử dụng 43 đặc điểm cơ bản được rút ra này có thể phân biệt khá tốt giữa các khối u lành tính và ác tính. Đối với các trường hợp bệnh án điển hình, mạng thần kinh cũng có khả năng phân biệt khối u lành tính và ác tính tốt hơn các bác sĩ chụp X-quang chuyên khoa nếu chỉ làm việc mà không có sự hỗ trợ của mạng thần kinh. Dữ liệu huấn luyện sử dụng là 133 trường hợp được lựa chọn từ tập san về chụp tia X vú, giống như các trường hợp lý thuyết trong đó 43 đặc điểm cho từng trường hợp được rút ra để xây dựng mô hình. Ngoài ra, 60 trường hợp bệnh lý về khối u vú thực tế được lựa chọn ngẫu nhiên trong năm 1989 để đánh giá hoạt động của mô hình. Wieslaw J. Oczkowski và Susan Barreca (1997) sử dụng mạng thần kinh để dự đoán nơi xuất viện hay điểm đo lường sự hoạt động độc lập của các chức năng (Functional Independent Measure score - FIM) để có quyết định cho xuất viện đối với các bệnh nhân bị đột quỵ ở một mức phù hợp theo tình trạng bệnh lý. Thông thường những bệnh nhân trên 96 điểm FIM luôn được xuất viện cho về nhà trong khi những bệnh nhân dưới 37 điểm luôn được yêu cầu phải đến khu hồi phục chức năng chuyên biệt sau khi xuất viện. Vì thế rất khó dự đoán nơi xuất viện cho các bệnh nhân có điểm FIM trong khoảng 37 đến 96 điểm. Do đó, tác giả sử dụng mẫu dữ liệu gồm các khía cạnh về tuổi tác, thời gian sau khi đột quỵ, sự hồi phục cơ chân, việc điều khiển các cơ vận động khác, mất thị giác, mất cảm giác, sự xao lãng, điểm FIM khi mới nhập viện và sự có mặt của người chăm sóc của 147 bệnh nhân bị đột quỵ từ tháng 10/1990 đến tháng 3/1994 với điểm FIM trong khoảng từ 37 đến 96 làm dữ liệu trong mẫu và 17 bệnh nhân khác được lựa chọn ngẫu nhiên trong khoảng tháng 4/1994 đến tháng 1/1995 làm dữ liệu ngoài mẫu để xây dựng mô hình dự báo nơi xuất viện. Kết quả 89 mạng thần kinh có thể dự báo chính xác đến 88% nơi xuất viện cho các bệnh nhân bị đột quỵ với tình trạng bệnh lý ở một mức phù hợp. 3. Một số dẫn chứng cho việc ứng dụng mạng thần kinh nhân tạo trong thực tế Bên cạnh các bài nghiên cứu thực nghiệm chứng minh năng lực của mạng thần kinh nhân tạo thì trong thực tế nó cũng đã được sử dụng phổ biến bởi các cá nhân hay các công ty, tổ chức trong các lĩnh vực khác nhau. Cụ thể như: Lĩnh vực kinh tế Mike Murphy, cố vấn của công ty M P Murphy & Associates Pty Ltd, chuyên về công nghệ thông tin và quản trị rủi ro cho các công ty bảo hiểm, ngân hàng, công ty tài chính và các câu lạc bộ thể thao lớn ở ÚC và Anh. Ông sử dụng mạng thần kinh để dự báo rủi ro bị chấn thương cho các cầu thủ, cũng như phân loại chiến lược cho các trận đấu. Nguồn: Citibank dùng mạng thần kinh để tìm kiếm các cơ hội trong các thị trường tài chính. Bằng việc nghiên cứu cẩn thận dữ liệu thị trường chứng khoán trong quá khứ với phần mềm mạng thần kinh, các nhà quản trị tài chính của Citibank nghiên cứu về các trùng hợp thú vị hoặc các bất thường nhỏ (được gọi là sự không hiệu quả của thị trường). Chẳng hạn, mạng thần kinh có thể giúp các nhà quản trị Citibank phát hiện ra rằng trái phiếu Mỹ hiện đang bán tại Nhật Bản thấp hơn ở Mỹ là 1 cent. Các thông tin này có thể tạo nên một khác biệt lớn cho vị trí hàng đầu của Citibank trong một thị trường tài chính đầy cạnh tranh. Phát hiện gian lận là một trong các lĩnh vực mà mạng thần kinh nhân tạo được sử dụng nhiều nhất. Visa, Master Card, và nhiều công ty thẻ tín dụng khác dùng một mạng thần kinh để phát hiện các bất thường trong các tài khoản cá nhân. Mastercard ước tính mạng thần kinh nhân tạo tiết kiệm cho họ 50 triệu Đô-la Mỹ mỗi năm. Ngân hàng León thuộc Cộng hòa Đô-mi-ni-ca (Dominican Republic) đã sử dụng hệ thống quản trị gian lận thông minh (Neural Fraud Management System) kết hợp mạng thần kinh nhân tạo với thiết bị phát hiện gian lận, hệ thống mô hình hóa tự động và thiết bị phân nhóm giám sát được thiết kế nhằm giúp ngăn chặn, phát hiện và phân tích các gian lận đối với các loại thẻ ngân hàng như: thẻ tín dụng, thẻ ghi nợ và ATM. Kết quả ngân hàng đã giảm tỷ lệ gian lận đến 60% trong 3 tháng đầu sử dụng hệ thống. Tương tự ngân hàng Guayaqyuil Bank ở Ecuador đã phát hiện 100% gian lận trong tháng đầu tiên. Nhiều công ty bảo hiểm (Cigna, AIG, Travelers, Liberty Mutual, Hartford) cùng với các khoản thanh toán tiền bồi thường và các hãng vận tải khác dùng mạng thần kinh để 90 phát hiện gian lận. Hệ thống tìm các mẫu hình trong các khoản tiền trả hóa đơn với các cuộc kiểm tra thực nghiệm. Nguồn: Công ty tư vấn tài chính LBS Capital Management sử dụng mạng thần kinh nhân tạo để dự báo chỉ số S&P 500. Mô hình mà LBS xây dựng có thể dự đoán chỉ số S&P 500 với độ chính xác lên đến 95%. Nguồn: Công ty G. R. Pugh & Company (Cranford, NJ) là một công ty nghiên cứu ngành. Công ty đã sử dụng mạng thần kinh để dự báo giá trái phiếu cho các năm tiếp theo và hệ số xếp hạng của các công ty trong ngành công ích dựa trên thông tin về tài chính và kinh doanh mà công ty thu thập. Công ty cũng so sánh mạng thần kinh với các mô hình toán học truyền thống hay thậm chí là với phương pháp dự báo mà họ đã từng sử dụng. Kết quả cho thấy, mạng thần kinh có thể dự báo chính xác 100% hệ số xếp hạng của các công ty công ích với khung xếp hạng tổng quát (ví dụ A, B, C..) và 95% với khung xếp hạng chi tiết (ví dụ, khung xếp hạng chi tiết cho A có thể là A++, A+…) trong khi mô hình truyền thống chỉ xếp hạng chính xác khoảng 85% cho các công ty công ích với khung xếp hạng tổng quát. Nguồn: Ngoài ra, công ty phần mềm HNC- chuyên phát triển các phần mềm giúp các công ty trong các lĩnh vực như tài chính, bảo hiểm, bán lẻ, truyền thông…- được thành lập bởi Robert Hecht-Nielsen, cũng đã phát triển nhiều ứng dụng của mạng thần kinh. Một trong số đó là hệ thống tính điểm tín dụng giúp công ty Fair Isaac Corporation (FICO- nhà cung cấp dịch vụ tính điểm tín dụng, quyết định quản trị và phát hiện gian lận, hình thành từ sự sáp nhập của công ty xếp hạng tín dụng Fair Isaac and Co và công ty phần mềm HNC) gia tăng lợi nhuận so với mô hình hiện tại lên đến 27%. Công ty cũng ứng dụng trong việc kiểm tra vấn đề thế chấp tài sản. Nguồn: %20Networks%20in%20Practice Trong lĩnh vực quản trị và marketing, cũng có nhiều công ty sử dụng mạng thần kinh để phân bổ nguồn lực hay phân nhóm khách hàng. Hãng máy bay Air Canada đã sử dụng mạng thần kinh nhân tạo để sắp xếp lịch trình bay, giảm sự chậm trễ khi sắp xếp lại lịch trình, cắt giảm năng lượng hay các chi phí trực tiếp khác, rút ngắn thời gian nhàn rỗi của máy bay. Tại Kodak, việc sử dụng mạng thần kinh để phân bổ nguồn lực tối ưu đã giúp cắt giảm chi phí sản xuất 3 triệu Đô-la Mỹ mỗi năm. Bristish Airway, 91 một hãng hàng không quốc tế đã sử dụng mạng thần kinh nhân tạo để phân tích dữ liệu khách hàng về sở thích và mong muốn khách hàng để phân loại dữ liệu tham khảo từ khách hàng thành các nhóm khác nhau. Nhờ đó, công ty có thể đưa ra các chương trình ưu đãi bao gồm việc tặng các chuyến bay miễn phí hay đưa ra nhiều ưu đãi đặc biệt cho khách như các chuyến đi nghỉ hay các khu vui chơi giải trí trong nước phù hợp với nguyện vọng của khách hàng. (Paulo J.G.Lisboa, Bill Edisbury, Alfredo Vellido, 2000). Microsoft sử dụng mạng thần kinh nhân tạo để tối đa hóa hiệu quả của chiến dịch marketing. Hàng năm, công ty gửi thư đến các khách hàng đã đăng ký sử dụng phần mềm để giới thiệu những phần mềm mới hay những phần mềm được nâng cấp tuy nhiên tỷ lệ trả lời thư khá thấp. Công ty đã sử dụng mạng thần kinh nhân tạo với các biến khác nhau như thời gian khách hàng đăng ký gần đây, số lượng sản phẩm mà khách hàng đặt mua… để hướng đến khách hàng mục tiêu hiệu quả hơn. Việc này đã giúp tiết kiệm chi phí gửi thư đến 35%. Fingerhurt, công ty giao nhận đặt và trả hàng bằng đường bưu điện có trụ sở tại Minnesota, Mỹ có danh sách khách hàng rất lớn khoảng 6 triệu người. Để xác định những khách hàng đã và đã không thích đặt hàng từ danh mục của công ty. Fingerhurt gần đây đã chuyển qua dùng phần mềm mạng thần kinh nhân tạo. Công ty này nhận ra rằng phần mềm mới này hiệu quả hơn và được mong đợi sẽ mang về hàng triệu Đô-la Mỹ bằng việc tinh chỉnh các danh sách thư tín của nó. Công ty tài chính FleetBoston dùng mạng thần kinh để xem xét các giao dịch với các khách hàng. Mạng thần kinh nhân tạo có thể phát hiện các mẫu hình có thể chỉ ra một sự bất mãn gia tăng trong khách hàng đối với công ty. Mạng thần kinh nhân tạo tìm các dấu hiệu sụt giảm các giao dịch hoặc là sự cân đối tài khoản của một trong các khách hàng lớn của Fleet Nguồn: Trong sản xuất, Công ty Bia Anheuser-Busch sử dụng mạng thần kinh để nhận biết thành phần hóa học của sản phẩm bia công ty họ và của công ty bia đối thủ với mức độ chính xác 96%. Điều này cho phép họ đảm bảo chất lượng sản phẩm và theo sát những thay đổi trong các sản phẩm của đối thủ. Nguồn: Mats Rosengren làm việc trong lĩnh vực viễn thám cho nhóm tư vấn METRIA Miljoanalys ở Thụy Điển thực hiện công việc cho Ủy ban rừng quốc gia, tổ chức bảo vệ môi trường và nhiều tổ chức khác liên quan đến môi trường ở các nước. Ông đã sử dụng mạng thần kinh nhân tạo cùng với những hình ảnh vệ tinh để vẽ bản đồ về loại rừng hay những thay đổi xảy ra trong rừng cho công ty tư vấn của mình. Điều này khá 92 cần thiết đối với các công ty lâm nghiệp trong việc lên kế hoạch quản lý rừng. Lợi ích đầu tiên cho việc sử dụng mạng thần kinh so với các mô hình khác là không cần phải thiết lập mô hình toán học cho việc phân loại hay hồi quy. Các phương pháp phân loại phổ biến khác dùng trong lĩnh vực viễn thám dựa trên giả định các lớp sinh học có phân phối chuẩn trong khi đối với các lớp sinh học mà ông cần phân loại thường không có phân phối chuẩn. Vì thế việc sử dụng mạng thần kinh thường giúp tiết kiệm 25% thời gian và chi phí so với các mô hình hồi quy và phân loại khác. Nguồn: Lĩnh vực dự báo thời tiết, cảnh báo các thảm họa thiên nhiên Tony Hall làm việc tại Cục thời tiết quốc gia (National Weather Service) ở Texas, Mỹ đã sử dụng mạng thần kinh để dự báo lượng mưa rơi ở đây. Kết quả dự báo cho thấy mạng thần kinh có thể dự báo chính xác đến 85% lượng mưa. Nguồn: Lĩnh vực khai khoáng, năng lƣợng Trong lĩnh vực khai thác mỏ, hầu hết các vụ tai nạn là do sụp hầm. Phương pháp được sử dụng trong nhiều năm để xác đinh sự ổn định của vách đá là gõ nhẹ vào vách đá với công cụ đo lường âm thanh để nghe âm thanh phát ra. Một thợ mỏ giàu kinh nghiệm có thể phân biệt vách đá cứng hay vách đá yếu bằng âm thanh phát ra. Tuy nhiên, đây là phương pháp mang tính chủ quan. Vì thế hội đồng nghiên cứu khoa học và công nghiệp (Counsil for Scientific and Industrial Research – CSIR) ở Nam Phi đã chế tạo thiết bị bổ trợ với mô hình mạng thần kinh được gắn vào thiết bị giúp cho các thợ mỏ xác định tính ổn định của vách đá. Thiết bị sẽ thu âm thanh phát ra, sau đó âm thanh này được tiền xử lý trước khi đưa vào mô hình. Mô hình sau khi huấn luyện sẽ phân loại vách đá là cứng hay yếu. Mô hình mạng thần kinh nhân tạo trong thiết bị này đạt được độ chính xác đến 70% đối với kiểm tra ngoài mẫu. Nguồn: Lĩnh vực y học Trong lĩnh vực y học, Bệnh viện Anderson Memorial ở nam California sử dụng hệ thống CRTS/QURI với mô hình mạng thần kinh nhân tạo để dự báo mức độ nghiêm trọng của bệnh và phân bổ nguồn lực bệnh viện nhằm cung cấp thông tin hỗ trợ các bác sĩ trong việc chẩn đoán bệnh và cải thiện chất lượng chăm sóc bệnh nhân. Kết quả cho thấy việc sử dụng hệ thống trên có thể dự báo chính xác 95% mức độ nghiêm trọng của bệnh trong khi phân tích hồi quy truyền thống lại thất bại. Trong 15 tháng 93 đầu tiên sử dụng hệ thống, bệnh viện đã tiết kiệm được khoảng 0,5 triệu Đô-la Mỹ chi phí không cần thiết, giảm các công đoạn xét nghiệm chẩn đoán và giúp giảm số lượng bệnh nhân tử vong. Nguồn: 94 TÀI LIỆU THAM KHẢO Tiếng Việt 1. Bùi Trinh, 2010, “Nhập siêu kéo dài: tỷ giá hay cơ cấu kinh tế ?”, thesaigontimes.vn, truy cập ngày 23/02/2011 Tiếng Anh 1. Amin Gharipour, Morteza Sameti, and Ali Yousefian, “A Comparative Approximate Economic Behavior Analysis of Support Vector Machines and Neural Networks Models”, Iranian Economic Review, Vol.15, No.26, 2010. 2. Anderson, JA (1972): “A Simple Neural Network Generating an Interactive Memory”, Mathematical Bioscience, 14, 1972, p197-p220. 3. Alain NtumbaKabundi, “Macroeconomic forecasting: A comparison between Artificial neural network and econometric models”, Master of commerce, 11/2002. 4. Ben Krose, Patrick van de Smargt, “An introduction to neural network”, The University of Amsterdam, 1996. 5. Bishop, C. M., “Neural Networks for Pattern Recognition”, Oxford University Press, Oxford, 1995. 6. C.M. Kuan –H. White, “Artificial Neural Networks: An Econometric Perpective” Econometric Review, Vol.13, 1994, p1-p9. 7. Curak Marijana, Klime Pososki, Curak Ivan, “Forecasting economic growth using financial variables – Comparision of linear regression and neural network model”, MCBE'09 Proceedings of the 10th WSEAS international conference on Mathematics and computers in business and economics. 8. Cowan, J.: “A Mathematical Theory of Central Nervous Activity”, unpublished Ph.D dissertation, University of London, 1967. 9. Christian L. Dunis và Mark Williams, “Modelling and Trading the EUR/USD Exchange Rate: Do Neural Network Models Perform Better ?”, Liverpool Business School, CIBEF – Centre for International Banking, Economics and Finance, 2/2002. 10. Diron, M., “Short-Term Forecasts of Euro Area Real GDP Growth: An Assessment of Real-Time Performance Based on Vintage Data”, European Central Bank Working Paper No. 622, 2005. 11. E. Maasoumi et.al, “Artificial Neural networks for some macroeconomic Series: A First Report”, Econometric reviews, Vol.13, 1994, p105-p122. 95 12. Ferrara, L., D. Guégan and P. Rakotomarolahy, “GDP nowcasting with ragged- edge data: a semi-parametric modeling”, Journal of Forecasting 29, 2010, p186 - p199. 13. Greg Tkacz and Sarah Hu, “Forecasting GDP Growth Using Artificial Neural Networks”, Bank of Canada Working Paper 99-3, January 1999. 14. Guoqiang Zhang, B. Eddy Patuwo and Micheal Y. Hu, “Forecasting with artificial neural networks: The state of the art”, International Journal of Forecasting 14, 1998, p35–p62. 15. G.Tkacz, “Neural Network Forecasting of Canadian GDP Growth”, International Journal of Forecasting, Vol. 17, 2001, p57 - p69. 16. G.P.Zhang, “Time Series Forecasting Using A Hybird ARIMA and Neural Network Model” Neurocomputing, Vol. 50, 2003, p159 - p175. 17. Guégan, D. and P. Rakotomarolahy, “Alternative methods for forecasting GDP”, CES Working Papers, 2010, p65. 18. Guégan, D. and P. Rakotomarolahy, “A Short Note on the Nowcasting and the Forecasting of Euro-area GDP Using Non-Parametric Techniques”, Economics Bulletin, Vol.30, No.1, 2010, p508 - p518. 19. Hao-Yen Yang, “A note on the casual relationship between energy and GDP in Taiwan”, Energy Economics 22 2000 309-317, 2000. 20. Haykin, S., “Neural Networks: A Comprehensive Foundation”, Macmillan College Publishing Company Inc, 1994. 21. Heng Chang Dai, Colin Macbeth, “Effects of learning parameters on learning procedure and performance of a BPNN”, Journal Neural Networks, Volume 10 Issue 9, Nov, 1997, Elsevier Science Ltd. Oxford, UK. 22. Hossain, Akhtar, “Sources of Econmomic Growth in Indonesia”, 1966-2003, AEID. Vol. 6-2, 2006. 23. Hebb, DO: “The organization of Behavior”, New York: John Wiley & Sons, 1949. 24. Horne, BG and Giles, CL “An Experimental Comparison of Recurrent Neural Networks”, in Tesauro G., et al. (eds), Advances in Neural Information Processing System 7, MIT, Press, Cambridge, MA, 1995, p697 - p704. 25. Introduction to Neural Networks: 26. Irina Klevecka and Janis Lelis, “Preprocessing of input data of neural networks: the case of forecasting telecomunication network traffic”, 2008, SN00857130 TELENOR ASA 2009. 96 27. Isabel Yi Zheng and James Rossiter, “Using monthly indicators to predict quarterly GDP”. Bank of Canada Banque du Canada, Working Paper 2006-26/ Document de travail 2006-26, 2006. 28. James L.McChelland, “Explorations in parallel distributed processing: a handbook of models, programs and exercises”, Second Edition, Draft, March 21, 2011. 29. Jingtao Yao, Chew Lim Tan, “A case study on using neural network to perform technical forecasting of Forex”, Neurocomputing 34, 2000, p79-p98. 30. Khan, Mohsin S. and Abdelhak S. Senhadji, “Threshold Effects in the Relationship Between Inflation and Growth”, IMF Working Paper 00/110, Washington: International Monetary Fund, 2000. 31. Kitchen, J. and R. Monaco, “Real-Time Forecasting in Practice: The U.S. Treasury Staff’s Real-Time GDP Forecast System”, Business Economics (October), 2003, p10-p19. 32. Kingkarn Sookhanaphibarn, Piruna Polsiri, Worawat Choensawat and Frank C.Lin, “Application of Neural Networks to Bankruptcy Analysis in Thailand”, International Journal of Computational Intelligence Research, ISSN 0973-1873, Vol.3, No.1, 2007, p91 - p96. 33. Klein, L.R. and E. Sojo, “Combinations of High and Low Frequency Data in Macroeconometric Models.”, In Economics in Theory and Practice: An Eclectic Approach, edited by L.R. Klein and J. Marquez, 3–16. Norwell, MA: Kluwer Academic Publishers, 1989. 34. Kohonen, T.: “Correlation Matrix Memories”, IEEE Transaction on Computers, C- 21, 1972, p353-p359. 35. K.T.Chang và J.K.Liu, “Landslide features interpreted by Neural Network method using a high-resolution satellite image and digital topographic data”, Commission VII TS WG VII/5, Proceedings of XXth ISPRS Congress, 2004. 36. Lahane Ashish Gajanan, “Financial Forecasting: Comparison Of ARIMA, FFNN and SVR Models”, Master of Technology, Department Of Computer Science And Engineering Indian Institute of Technology, Bombay, 2008. 37. Massimiliano Marcellino, “A comparison of time series models for forecasting GDP growth and inflation”, IEP-Università Bocconi, IGIER and CEPR, 2007. 38. Mcadam, P., McNellis, P., “Forecasting Inflation with Thick Models and Neural Networks”, Economic Modeling, 2005, Vol. 22, p848 - p867. 39. McCulloch, WS and Pitts, W.(1943): “A Logical Calculus of the Ideas Immanent in Nervous Activity”, Bulletin of Mathematical Biophysics, 5, 1943, p115-p133. 97 40. Miller, P.J. and D.M. Chin, “Using Monthly Data to Improve Quarterly Model Forecasts”, Federal Reserve Bank of Minneapolis Quarterly Review Vol.20, No.2, 1996, p16 – p33. 41. Minsky, ML and Papert, A.: “Perceptrons”, Cambridge: MIT Press, 1969 42. Milton Friedman, “The role of monetary policy”, The American Economic Review, Vol.58, No.1, Mar-1968, p1-p17, Published by: American Economic Association. 43. N. R. Swanson – H. White, “A Model Selection Approach to Real – Time Macroeconomic Forecasting Using Linear Models and Artificial Neural Networks”, Review of Economics and Statistics, Vol.79, 1997, p540 – p550. 44. Mohd Zukime HJ Mat Junoha, Kolej Universiti Kejuruteraan Utara Malaysia, “Predicting GDP growth in Malaysia using knowledged-based economy indicators: A comparison between neural network and econometric approaches”, Sunway College Journal 1, 2004, p39–p50. 45. Paulo J.G.Lisboa, Bill Edisbury, Alfredo Vellido, “Business applications of neural networks, the state of the art of real-world applications”, World Scientific Publishing Co.Ptc.Ltd, 2000. 46. Pengyi Shi, Zhuo Chen, Gaungming Xie, “Using Artificial neural network trained with genetic algorithm to model GDP prediction”, Center for systems and control, LTCS và Dept, of Merch & Eng Sci, Pecking University, June 28, 2006. 47. Refenes, Apostolos Nicholas; Zapranis, Achileas and Francis, Gavin: “Stock Performance Modelling Using Neural Networks: A Comparative Study With Regression Models", Neural Networks, Vol. 7, No. 2, 1994, p375-p388. 48. Rosenblatt, F.: “Principles of Neurodynamics”, New York: Spartan, 1962. 49. Ruey-Shiang Guh, “Robustness of the neural network based control chart pattern recognition system to non-normality”, International Journal of Quality & Reliability Management, Vol. 19 Iss: 1, 2002, p97 – p112. 50. Rumelhart, DE, Hinton, GE and Williams, RJ: “Learning Internal Representations by Error Propagation”, in Rumelhart, DE and McCelland eds., Parallel Distributed Processing: Explorations in the Microstructures of Cognition. Cambridge: MIT Press, 1, 1986, p318 - p362. 51. Rϋnstler, G. and F. Sédillot, “Short-Term Estimates of Euro Area Real GDP by Means of Monthly Data”, ECB Working Paper No. 276, 2003. 52. Steven Gonzalez, “Neural Networks for Macroeconomic Forecasting: A Complementary Approach to Linear Regression Models”, Working Paper 2000-07. 98 53. Tilak AbeySinghe và Gulasekeran Rajaguru, “Quarterly Real GDP Estimates for China and ASEAN4 with a Forecast Evaluation.”, Journal of Forecasting, 2004, p431–p447. Published online in Wiley InterScience: www.interscience.wiley.com. 54. Wei Huang, K. K. Lai, Y. Nakamori, ShouYang, “Forecasting foreign exchange rate with Artificail neural network: A review”, International Journal of Information Technology & Decision Making, Vol. 3, No. 1, 2004, p145–p165, World Scientific Publishing Company. 55. Werbos, P.: “Beyond Regression: New Tools For Predicting and Analysis in the Behavioral Sciences”, Ph.D. thesis, Cambridge, MA: Harvard University Committee on Applied Mathematics, 1974. 56. Wieslaw J. Oczkowski và Susan Barreca, “Neural network modeling accurately predicts the functional outcome of stroke survivors with moderate disabilities”, Arch Phys Med Rehabil Vol 78, April 1997. 57. Widrow, B. and Hoff, ME: “Adaptive Switching Circuits”, IRE WESCON convention Record, part 4, 1960, p96 - p104. 58. Yon Han Pao, “Adaptive pattern recognition and neural networks”, Addison- Wesley Longman Publishing Co., Inc. Boston, MA, USA ©,1989. 59. Yuzheng Wu, Maryellen L.Giger, Kunio Doi, Carl J.Vyborny, Robert A.Schmidt, Charles E.Metz, “Artificial Neural Networks in mammography: application to decision making in the diagnosis of breast cancer”, RSNA 1993. 60. Yrd. Doc. Dr. Recep DUZGUN, “A comparison of Aritficail neural network and Arima models’ success in GDP forecast”, I.I.B.F.Dergisi YIL 2008, CILT XXV SAYI2. 61. Y.Li et.al, “Macroeconomics Modelling on UK GDP Growth by Neural Computing”, Technical report CSC-95009, 1995. 62. Zoubin Ghahramani, “Unsupervised Learning”, Gatsby Computational Neuroscience Unit University College London, UK, September 16, 2004.

Các file đính kèm theo tài liệu này:

  • pdfDự báo tốc độ tăng trưởng kinh tế Việt Nam- Sự vượt trội của mô hình Mạng thần kinh nhân tạo (ANN) so với mô hình Hồi quy tuyến tính truyền thống.pdf
Luận văn liên quan