Mô hình dự báo kinh tế - Hệ hỗ trợ ra quyết định trong doanh nghiệp

Trong những năm gần đây, cùng với chức năng khai thác có tính chất tác nghiệp, việc khai thác các cơ sở dữ liệu phục vụ các yêu cầu trợ giúp quyết định ngày càng có ý nghĩa quan trọng và là nhu cầu to lớn trong mọi lĩnh vực hoạt động kinh doanh, quản lý kinh tế cũng như nghiên cứu khoa học, thống kê tình hình phát triển xã hội, dân số v.v Dữ liệu được lưu trữ và thu thập ngày càng nhiều nhưng người ra quyết định trong quản lý, kinh doanh lại cần những thông tin dưới dạng “tri thức” rút ra từ những nguồn dữ liệu đó hơn là chính những dữ liệu đó cho việc ra quyết định. Quá trình ra quyết định cần có nhiều phương pháp hỗ trợ, trong số những phương pháp đó thì Dự báo là một phương pháp được sử dụng rất phổ biến và kết quả dự báo chính là đầu vào rất cần thiết trong quá trình đưa ra ý kiến chủ quan chung sau khi thảo luận. Việc ứng dụng các hệ hỗ trợ ra quyết định dựa trên các mô hình dự báo giúp các doanh nghiệp xây dựng chiến lược phát triển sản xuất kinh doanh đúng đắn của mình trong tương lai, mang lại hiệu quả to lớn cho doanh nghiệp, tổ chức, v.v . TÓM TẮT NỘI DUNG: Chương 1 - LÝ THUYẾT HỆ HỖ TRỢ RA QUYẾT ĐỊNH 1.1. Lý thuyết ra quyết định 1.1.1. Quyết định là gì? 1.1.2. Ra quyết định là gì? 1.1.3. Tại sao cần hỗ trợ ra quyết định? 1.1.4. Bản chất của hỗ trợ ra quyết định 1.1.5. Các yếu tố ảnh hưởng đến ra quyết định 1.1.6. Người ra quyết định 1.1.7. Thách thức đối với ra quyết định quản lý 1.2. Quá trình ra quyết định 1.2.1. Phân loại quyết định 1.2.2. Các giai đoạn của quá trình ra quyết định 1.3. Hệ hỗ trợ ra quyết định 1.3.1. Khái niệm 1.3.2. Các thành phần của Hệ hỗ trợ ra quyết định 1.3.3. Phân loại Hệ hỗ trợ ra quyết định 1.3.3.1. Theo DSS- Glossary: 1.3.3.2. Theo Holsapple và Whinston (1996): Chương 2 - TỔNG QUAN VỀ DỰ BÁO VÀ NGHIÊN CỨU MỘT SỐ MÔ HÌNH DỰ BÁO 2.1. Vai trò và ứng dụng của dự báo 2.2. Các qui trình dự báo 2.3. Các kĩ thuật dự báo 2.3.1. Dự báo định tính 2.3.1.1. Lấy ý kiến của ban điều hành 2.3.1.2. Lấy ý kiến của các nhà phân phối 2.3.1.3. Phương pháp điều tra người tiêu dùng 2.3.2. Dự báo định lượng 2.3.3. Dự báo bằng phương pháp chuyên gia 2.4. Nghiên cứu một số phương pháp định lượng 2.4.1. Phương pháp dự báo dựa trên mô hình hồi qui tuyến tính bội 2.4.1.1. Mô hình cơ bản 2.4.1.2. Phương pháp bình phương tối thiểu 2.4.1.3. Các giả thiết của phương pháp bình phương tối thiểu 2.4.1.4. Phương sai và sai số chuẩn của các ước lượng 2.4.1.5. Hệ số xác định và Hệ số tương quan 2.4.1.6. Phân phối xác xuất của các ước lượng 2.4.1.7. Các sai số đặc trưng 2.4.1.8. Các tiêu chuẩn chung để chọn mô hình 2.4.2. Phương pháp dự báo chuỗi thời gian 2.4.2.1. Các mô hình tự hồi quy 2.4.2.2. Các mô hình trung bình trượt 2.4.2.3. Các mô hình ARMA 2.4.2.4. Mô hình ARIMA 2.5. Đánh giá các mô hình

70 trang | Chia sẻ: lvcdongnoi | Lượt xem: 5085 | Lượt tải: 3

Bạn đang xem trước 20 trang tài liệu Mô hình dự báo kinh tế - Hệ hỗ trợ ra quyết định trong doanh nghiệp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

thuật hoặc sản xuất dựa trên việc xử lý có hệ thống các đánh giá của chuyên gia. Phương pháp này phải giải quyết được các vấn đề chính sau đây: a. Lựa chọn và thành lập nhóm chuyên gia dự đoán và nhóm các nhà phân tích: Nhóm chuyên gia dự báo sẽ đưa ra những đánh giá dự báo về đối tượng cần dự báo. Đây là các chuyên gia có trình độ hiểu biết chung tương đối cao ngoài lĩnh vực hẹp của mình, có kiến thức chuyên môn sâu về lĩnh vực dự báo, có lập trường khoa học và có khả năng tiên đoán thể hiện ở sự phản ánh nhất quán xu thế phát triển của đối tượng dự báo và có định hướng và suy nghĩ về tương lai trong lĩnh vực mình quan tâm. Nhóm chuyên gia phân tích còn gọi là nhóm các nhà quản lý bao gồm: những người có cương vị lãnh đạo, những người có quyền quyết định chọn phương pháp dự báo. Đây cũng là các chuyên gia có trình độ chuyên môn cao về vấn đề cần dự báo, có kiến thức về dự báo và chuyên gia phân tích còn phải có lòng kiên nhẫn, tính lịch thiệp do quá trình tiếp xúc và hợp tác với các chuyên gia là một quá trình phức tạp. b. Trưng cầu ý kiến của các chuyên gia Trưng cầu ý kiến chuyên gia là một giai đoạn của phương pháp chuyên gia. Tuỳ theo đặc điểm thu nhận và xử lý thong tin mà chọn những phương pháp trưng cầu cơ bản như: trưng cầu ý kiến theo nhóm và cá nhân; trưng cầu vắng mặt và có mặt và trưng cầu trực tiếp hay gián tiếp. c. Xử lý ý kiến chuyên gia Sau khi thu thập ý kiến của các chuyên gia, cần phải tiến hành một loạt các biện pháp xử ký các ý kiến này. Đây là bước quan trọng để đưa ra kết quả dự báo. Có hai dạng vấn đề cần giải quyết khi xử lý ý kiến chuyên gia: - Đánh giá thời gian hoàn thành sự kiện, thời gian xuất hiện quá trình mới. Ví dụ: trong lĩnh vực quy hoạch phát triển công nghiệp ô tô Việt Nam…., dự báo thời gian nào giá xe ô tô của các hãng trên thế giới tăng cao và ảnh hưởng đến chính sách nhập khẩu ô tô của Việt Nam. - Đánh giá tầm quan trọng tương đối giữa các sự kiện. Ví dụ: đánh giá vai trò quan trọng của các yếu tố đầu vào (mức thu nhập bình quân đầu người, cơ sở hạ tầng đường xá, v.v…) ảnh hưởng đến số lượng ô tô thêm mới trong một tỉnh/thành phố. 2.4. Nghiên cứu một số phương pháp định lượng Trong phần này luận văn tập trung nghiên cứu hai phương pháp dự báo mang tính định lượng: Dự báo kinh tế lượng dựa trên mô hình hồi quy tuyến tính để nối kết một hoặc một vài biến phụ thuộc với một (hay một số) biến độc lập. Phương pháp này rất phổ biến do có khả năng giải thích các thay đổi ở các biến phụ thuộc theo sự thay đổi của các biến kinh tế hay các biến động thái khác - đặc biệt là những thay đổi trong các biến về chính sách. Dự báo chuỗi thời gian chủ yếu dựa trên những nỗ lực để dự đoán các giá trị của một biến căn cứ vào những giá trị trong quá khứ của chính biến đó. Hai nhóm phương pháp này rất rộng và ranh giới giữa chúng là không rõ ràng. Ví dụ, trong khi một số mô hình kinh tế lượng được thiết lập chỉ dựa trên các giá trị quá khứ của biến phụ thuộc, thì một số mô hình chuỗi thời gian thuần túy (phi kinh tế lượng) lại kết nối một biến với các giá trị của các biến khác. Phương pháp chuỗi thời gian thường được xem là trội hơn phương pháp kinh tế lượng khi dự báo ngắn hạn. Các mô hình kinh tế lượng sẽ thích hợp hơn trong trường hợp mô hình hóa các ảnh hưởng dài hạn. Sự kết hợp cả hai nhóm phương pháp dự báo tạo ra tiềm năng cải thiện các dự báo cả dài hạn lẫn ngắn hạn. 2.4.1. Phương pháp dự báo dựa trên mô hình hồi qui tuyến tính bội 2.4.1.1. Mô hình cơ bản Trước khi xét đến mô hình hồi qui tuyến tính bội, chúng ta khái quát qua về mô hình hồi qui tuyến tính đơn. Mô hình hồi qui tuyến tính đơn là mô hình thể hiện mối quan hệ tuyến tính giữa một biến phụ thuộc và một biến độc lập. Tính tuyến tính của mô hình: Yt = α + βXt + ut Trong đó: Xt và Yt là quan sát thứ t (t = 1 đến n) của biến độc lập X và biến phụ thuộc Y α và β là các tham số chưa biết và sẽ được ước lượng, gọi là hệ số hồi qui ut là số hạng sai số không quan sát được và được giả định là biến ngẫu nhiên với một số đặc tính nhất định. Thuật ngữ đơn trong mô hình hồi qui tuyến tính đơn được sử dụng để chỉ rằng có duy nhất một biến giải thích (X) được sử dụng trong mô hình. Thuật ngữ hồi qui xuât phát từ Fraccis Galton (1886), người đặt ra mối liên hệ giữa chiều cao của nam giới với chiều cao của người cha và quan sát thực nghiệm cho thấy có một xu hướng giữa chiều cao trung bình của nam giới với chiều cao của những người cha của họ để "hồi qui" (hoặc di chuyển) cho chiều cao trung bình của toàn bộ tổng thể, α + βXb gọi là phần xác định của mô hình và là trung bình có điều kiện của Y theo X, đó là E(Yt⎢Xt) = α + βXt. Thuật ngữ tuyến tính để chỉ là bản chất các thông số của tổng thể α và β là tuyến tính (bậc nhất) chứ không phải Xt là tuyến tính. Nhưng trong thực tế, có nhiều ví dụ không thể giải thích bằng mô hình hồi qui tuyến tính đơn do mối quan hệ giữa các sự vật hiện tượng là rất đa đạng, một sự vật hiện tượng xảy ra không đơn giản chỉ phụ thuộc vào một mà phụ thuộc vào rất nhiều các yếu tố khác. Ví dụ: - Lượng cầu một loại hàng hoá phụ thuộc vào giá, thu nhập người mua, giá các hàng hoá khác v.v… - Sản lượng phụ thuộc vào giá, các nhập lượng ban đầu, các nhập lượng trung gian, công nghệ v.v… - Đầu tư nước ngoài (FDI) phụ thuộc vào suất sinh lợi của đầu tư, tiền lương, tham nhũng, tính minh bạch v.v… Khi chúng ta có một tập hợp dữ liệu có chứa các biến giải thích, trường hợp phổ biến là tất cả các biến này cùng thay đổi, điều đó làm chúng ta không thể cố định ảnh hưởng của một biến giải thích nào đó đến biến phụ thuộc. Việc xét đến các tác động riêng biệt của nhiều nhân tố có thể được giải thích bằng mô hình hồi qui tuyến tính bội (mô hình hồi qui đa biến) Hàm hồi qui tổng thể: Mô hình: liên hệ biến phụ thuộc Y cho trước với nhiều biến độc lập: X1, X2, …, Xk ttkkttt uXXXY +++++= ββββ ...33221 (2.9) [ ] [ ]sX'...' 33221 itkktti EXXXsXYE εββββ +++++= (2.10) Ảnh hưởng của thay đổi trong Yt khi chỉ có Xti thay đổi được xác định bởi: [ ] k k i X sXYE β= ∂ ∂ ' (2.11) Vì vậy ý nghĩa của hệ số hồi qui βi là giữ giá trị của tất cả các biến khác không đổi, nếu Xti thay đổi một đơn vị thì Yt kỳ vọng thay đổi, trung bình là, βi đơn vị. Vì vậy, phân tích hồi qui bội giúp chúng ta kiểm soát được một tập hợp con các biến giải thích và kiểm tra ảnh hưởng của một biến độc lập đã chọn 2.4.1.2. Phương pháp bình phương tối thiểu Trong mô hình hồi qui bội, chúng ta sẽ sử dụng các dữ liệu Y và Xti và tìm kiếm ước lượng "tốt nhất" của các tham số của tổng thể là kβββ ,...,, 21 . Ta có thủ tục ước lượng phổ biến nhất là phương pháp bình phương tối thiểu . Phương pháp này thường được gọi là bình phương tối thiểu thông thường (OLS – Original Least Square), để phân biệt với những phương pháp bình phương tối thiểu khác. Ký hiệu ước lượng của kβββ ,...,, 21 là kβββ ))) ,...,, 21 , phần dư ước lượng thì bằng: tkkttt XXYu βββ )))) −−−−= ...221 Tiêu chuẩn tối ưu được sử dụng bởi phương pháp bình phương tối thiểu là cực tiểu hóa hàm mục tiêu: ESS = ( )∑∑ == −−−−= n t tkktt n t t XXYu 1 2 221 1 2 ... βββ )))) (2.12) với các tham số chưa biết là kβββ ))) ,...,, 21 . ESS là tổng các phần dư bình phương và phương pháp OLS cực tiểu tổng các phần dư bình phương. Chú ý rằng ESS là khoảng cách bình phương được đo lường từ đường hồi qui. Sử dụng khoảng cách đo lường này, có thể nói rằng phương pháp OLS là tìm đường thẳng gần nhất với dữ liệu trên đồ thị. Trực quan hơn, giả sử ta chọn một tập hợp những giá trị kβββ ))) ,...,, 21 , đó là một đường thẳng tkkt XX βββ ))) −−− ...221 . Có thể tính được độ lệch của Yt từ đường thẳng được chọn theo phần dư ước lượng tkkttt XXYu βββ )))) −−−−= ...221 . Sau đó bình phương giá trị này và cộng tất cả các giá trị bình phương của toàn bộ mẫu quan sát. Tổng các phần dư bình phương của các trị quan sát do đó sẽ bằng ∑ 2tu) . Tương ứng với một điểm trên đồ thị sẽ có một trị tổng bình phương sai số. Phương pháp bình phương tối thiểu chọn những giá trị kβββ ))) ,...,, 21 sao cho ESS là nhỏ nhất. Việc bình phương sai số đạt được hai điều sau. Thứ nhất, bình phương giúp loại bỏ dấu của sai số và do đó xem sai số dương và sai số âm là như nhau. Thứ hai, bình phương tạo ra sự bất lợi cho sai số lớn một cách đáng kể. Ví dụ, giả sử phần dư của mẫu là 1, 2, -1 và -2 của hệ số hồi qui chọn trước trị kβββ ))) ,...,, 21 . So sánh các giá trị này với một mẫu khác có phần dư là -1, -1, -1 và 3. Tổng giá trị sai số tuyệt đối ở cả hai trường hợp là như nhau. Mặc dù mẫu chọn thứ hai có sai số tuyệt đối thấp hơn từ 2 đến 1, điều này dẫn đến sai số lớn không mong muốn là 3. Nếu ta tính ESS cho cả hai trường hợp thì ESS của trường hợp đầu là (12 + 22 + (-1)2 + (-2)2) = 10. ESS cho trường hợp sau là ((-1)2 + (-1)2 + (-1)2 + 32) = 12. Phương pháp bình phương tối thiểu áp đặt sự bất lợi lớn cho sai số lớn và do đó đường thẳng trong trường hợp đầu sẽ được chọn. Thủ tục OLS cực tiểu tổng bình phương sai số ESS và cho ra k phương trình chuẩn. Những phương trình này nói chung duy nhất được giải cho các hệ số, với điều kiện là số quan sát lớn hơn k. ∑∑∑ +++= tkktt XXnY βββ ))) ...221 2 2 2221t2 ...X ttkkttt XXXXY ∑∑∑∑ +++= βββ ))) ......................... titkktittit XXXXXY ∑∑∑∑ +++= βββ ))) ...X 221ti ∑∑∑∑ +++= 2221tk ...X tkktkttkt XXXXY βββ ))) k phương trình chuẩn trên có thể giải được các nghiệm đơn β. Các chương trình máy tính chuẩn thực hiện được mọi tính toán này khi nhập dữ liệu vào và xác định các biến độc lập, biến phụ thuộc. Các tính chất trong hồi qui đơn cũng đúng với hồi qui tuyến tính bội. Do đó ước lượng OLS là BLUE, không thiên lệch, hiệu quả và nhất quán. Phần dư và các giá trị dự đoán có được từ các liên hệ sau: tkkttt XXYu βββ )))) −−−−= ...221 tttkktt uYXXY ))))) −=+++= βββ ...221 2.4.1.3. Các giả thiết của phương pháp bình phương tối thiểu 2.4.1.4. Phương sai và sai số chuẩn của các ước lượng Từ lý thuyết xác suất ta biết rằng phương sai của một biến ngẫu nhiên đo lường sự phân tán xung quanh giá trị trung bình. Phương sai càng bé, ở mức trung bình, từng giá trị riêng biệt càng gần với giá trị trung bình. Tương tự, khi đề cập đến khoảng tin cậy, ta biết rằng phương sai của biến ngẫu nhiên càng nhỏ, khoảng tin cậy của các tham số càng bé. Như vậy, phương sai của một ước lượng là thông số để chỉ độ chính xác của một ước lượng. Do đó việc tính toán phương sai của kβββ ))) ,...,, 21 là luôn cần thiết. Do kβββ ))) ,...,, 21 thuộc vào các giá trị Y, mà Y lại phụ thuộc vào các biến ngẫu nhiên ut (t = 1 đến n) nên chúng cũng là biến ngẫu nhiên với phân phối tương ứng. Ta có phương sai của 2β ) : [ ] ( )( ) ( ) 22322322 2 3 2R σβ ∑∑∑ ∑ − = iiii i xxxx x VA ) (2.13) Các giá trị dự báo và sai số chuẩn Cũng như trong mô hình hồi qui đơn biến, chúng ta quan tâm đến việc tạo ra các dự báo có điều kiện của biến phụ thuộc với các giá trị cho trước của các biến độc lập. Giả sử Xfi là giá trị cho trước của biến độc lập thứ i với i = 2,..., k và t = f, với các giá trị này chúng ta muốn dự báo i. Định nghĩa: fkkf XX ββββ +++= ...221 Và fY )) =β , định nghĩa trước đó t = f, và vì vậy dự báo cần có là giá trị ước lượng của β, và sai số chuẩn tương ứng sẽ giúp chúng ta xây dựng một khoảng tin cậy cho dự báo. Giải β1 từ phương trình trên và thay vào mô hình ban đầu ta có: ttkktfkkft uXXXXY ++++−−−= βββββ ...... 2222 Nhóm số hạng một cách thích hợp, ta có thể viết lại như sau: ttkkt uZZ ++++= βββ ...22 với Zti = Xti – Xfi, cho i = 2,...,k. Việc viết lại công thức này chỉ ra các bước sau để tiến hành dự báo Bước 1: Với giá trị Xfi cho trước của biến độc lập thứ i và t = f, tạo một biến mới Zti = Xti – Xfi với i = 2, ..., k Bước 2: Hồi qui Yt theo một số hạng và các biến mới Zt2, ..., Ztk Bước 3: Số hạng không đổi được ước lượng là một dự báo điểm cần có. Khoảng tin cậy tương ứng được tính bằng ( ff stst *,* +− ββ )) ), với t* là giá trị tới hạn của phân phối t với bậc tự do n-k và mức ý nghĩa cho trước, và sf là sai số chuẩn của số hạng không đổi được ước lượng có được từ bước 2. 2.4.1.5. Hệ số xác định và Hệ số tương quan Ta có tổng bình phương sai số (ESS) hay tổng các bình phương phần dư là ∑= 2tuSS )E . Sai số chuẩn của phần dư là ( )2-nSSE=σ) . Giá trị này đo lường độ phân tán của sai số khi sử dụng tY ) làm biến dự báo và thường được so sánh với Yσ ) được cho ở trên để xem xét mức độ giảm xuống là bao nhiêu. Bởi vì ESS càng nhỏ càng tốt, và mức độ giảm xuống càng nhiều. Phương pháp này không hoàn toàn tốt lắm, tuy nhiên, bởi vì các sai số chuẩn rất nhạy cảm đối với đơn vị đo lường Y nên rất cần có một thông số đo lường khác không nhạy cảm với đơn vị đo lường. Thông số đo lường tổng biến thiên của tY ) so với Y (giá trị trung bình của tY ) ) cho toàn mẫu là 2)( YYt −∑ ) . Được gọi là tổng bình phương hồi qui (RSS). ( ) ( ) tfktkkftt uXXXXY +−++−+= βββ ...222 Ta có: ( ) ( ) ∑∑∑ +−=− 222 ttt uYYYY )) Do đó TSS = RSS + ESS. Lưu ý rằng ( ) ( ) ttt uYYYY )) +−=− Ta có: TSS SS1 E TSS RSS −= được gọi là hệ số xác định đa biến và ký hiệu là R2 ( ) TSS RSSE YY u R t t =−= − −= ∑ ∑ TSS SS11 2 2 ) 10 2 ≤≤ R (2.14) rõ ràng R2 nằm giữa khoảng từ 0 đến 1. R2 không có thứ nguyên vì cả tử số và mẫu số đều có cùng đơn vị. Điểm quan sát càng gần đường thẳng ước lượng, "độ thích hợp" càng cao, nghĩa là ESS càng nhỏ và R2 càng lớn. Do vậy, R2 là thông số đo lường độ thích hợp, R2 càng cao càng tốt. ESS còn được gọi là biến thiên không giải thích được vì tu ) là ảnh hưởng của những biến khác ngoài Xt và không có trong mô hình. RSS là biến giải thích được. Như vậy, TSS là tổng biến thiên của Y, có thể phân thành hai thành phần: (1) RSS, là thành phần giải thích được theo X; và (2) ESS, là thành phần không giải thích được. Giá trị R2 nhỏ nghĩa là có sự biến thiên ở Y không thẻ giải thích được bằng X. Ta cần phải thêm vào những biến khác có ảnh hưởng đến Y. Ngoài ý nghĩa là một tỷ lệ của tổng biến thiên của Y được giải thích qua mô hình, R2 còn có một ý nghĩa khác. Đó là thông số đo lường mối tương quan giữa giá trị quan sát Yt và giá trị dự báo ( ) ttYYt rY ) ) . Ta có: 2 2 2 )()( )( R TSS RSS YVarYVar YYCovr tt tt YY === ) ) ) (2.15) Như vậy, bình phương hệ số tương quan giữa giá trị quan sát Yt và giá trị dự báo tY ) bằng phương trình hồi qui thì sẽ cho ra kết quả bằng với giá trị R2. Có một thắc mắc phổ biến về độ thích hợp tổng thể, đó là “bằng cách nào để xác định rằng R2 là cao hay thấp?”. Không có một qui định chuẩn hay nhanh chóng để kết luận về R2 như thế nào là cao hay thấp. Với chuỗi dữ liệu theo thời gian, kết quả R2 thường lớn bởi vì có nhiều biến theo thời gian chịu ảnh hưởng xu hướng và tương quan với nhau rất nhiều. Do đó, giá trị quan sát R2 thường lớn hơn 0,9. R2 bé hơn 0,6 và 0,7 được xem là thấp. Tuy nhiên với dữ liệu chéo, đại diện cho dạng của một yếu tố thay đổi vào một thời điểm nào đó, thì R2 thường thấp. Trong nhiều trường hợp, R2 bằng 0,6 hoặc 0,7 thì chưa hẳn là xấu. Đây đơn giản chỉ là thông số đo lường về tính đầy đủ của mô hình. Điều quan trọng hơn là nên đánh giá mô hình xem dấu của hệ số hồi qui có phù hợp với các lý thuyết kinh tế, trực giác và kinh nghiệm của người nghiên cứu hay không. Ta xét bình phương hệ số tương quan giữa X2 và X3: ( ) ( )( )∑∑ ∑ = 2 3 2 2 2 322 23r ii ii xx xx Biến đổi một chút chúng ta có phương sai của β2 như sau: [ ] ( )( ) 2223222 1 1R σβ rx VA i − = ∑ ) 2.4.1.6. Phân phối xác xuất của các ước lượng Để có khả năng xây dựng các khoảng tin cậy đối với các tham số chưa biết và kiểm định giả thuyết về chúng, chúng ta cần biết các phân phối xác suất chọn mẫu của những ước lượng này. Khi đề cập về phần phối chọn mẫu của các ước lượng, chúng ta cần biết ba nội dung sau đây: - Kỳ vọng toán học - Phương sai - Dạng hàm của phân phối chọn mẫu Đầu tiên hãy xét kỳ vọng của ước lượng β2: ( )( ) ( )( ) ( )( ) ( )2322322 323 2 32 2 ∑∑∑ ∑∑∑∑ − − = iiii iiiiiii xxxx xxxyxxYβ) Lưu ý rằng các chữ Y hoa đã thay thế cho các dạng độ lệch mà chúng ta đã sử dụng. Ta thay thế: iiii uxxY ++= 3322 ββ vào trong biểu thức ước lượng và thực hiện vài biến đổi đại số chúng ta sẽ có: ( )( ) ( )( ) ( )( ) ( )2322322 323 2 32 2 ∑∑∑ ∑∑∑∑ − − = iiii iiiiiii xxxx xxxyxxYβ) ( )( ) ( )( ) ( )( ) ( )2322322 323 2 32 2 ∑∑∑ ∑∑∑∑ − − += iiii iiiiiii xxxx xxxyxxYβ Khi lấy giá trị kỳ vọng của biểu thức thứ hai, ta thấy ước lượng của tham số là không chệch vì ta có kết quả sau đây: ⎣ ⎦ 22 ββ =)E Chúng ta hầu như đã quen với cách trình bày phương sai của ước lượng. Cuối cùng, rõ ràng từ biểu thức trên là mỗi ước lượng đều là một tổ hợp tuyến tính của của các biến ngẫu nhiên có phân phối chuẩn, vì thế mỗi ước lượng cũng đều có phân phối chuẩn. Những kết quả suy luận nêu trên cũng đúng đối với hàm hồi qui bội có k biến. Những ước lượng tham số là không chệch, và các phương sai của ước lượng tham số đã biết, và chúng tuân theo phân phối chuẩn. Tuy vậy, trên thực tế không thể biểu diễn được những kết quả này nếu không sử dụng công cụ đại số ma trận. 2.4.1.7. Các sai số đặc trưng Dựa vào các sai số đặc trưng, chúng ta sẽ có cách lựa chọn biến độc lập và biến phụ thuộc cho mô hình dự báo. Việc lựa chọn các biến độc lập và phụ thuộc trong mô hình kinh tế phải được dựa trên lý thuyết kinh tế, kiến thức về các hành vi tiềm ẩn, và kinh nghiệm quá khứ. Tuy nhiên, bản chất các quan hệ giữa các biến kinh tế là không bao giờ biết và vì vậy chúng ta có thể mong đợi những sai số trong việc xác định các đặc trưng của mô hình kinh tế lượng. Sai số đặc trưng xảy ra nếu chúng ta xác định sai mô hình theo các loại như chọn biến, dạng hàm số, hoặc cấu trúc sai số (nghĩa là số hạng ngẫu nhiên ut và các tính chất của nó). Khi chọn các biến độc lập của mô hình, ta có thể phạm phải hai loại sai số sau: (1) bỏ qua một biến thuộc về mô hình và (2) đưa vào một biến không liên quan. Trong hàm cầu, nếu chúng ta bỏ qua biến giá cả hàng hoá hoặc thu nhập của hộ gia đình, chúng ta có thể gây ra trường hợp sai số đặc trưng loại thứ nhất. Ngược lại, với ví dụ về bất động sản, giá một ngôi nhà phụ thuộc vào diện tích sử dụng, số phòng ngủ, phòng tắm, nếu ta đưa vào các biến như thiết bị sử dụng điện, khoảng cách từ nhà đến trường, loại mái lợp thì sẽ không tác động đáng kể đến giá bán ngôi nhà. Như vậy chúng ta sẽ phạm phải sai số đặc trưng loại thứ hai, nghĩa là đưa biến thừa vào mô hình. Khi bỏ qua biến quan trọng: Đầu tiên chúng ta khảo sát trường hợp trong đó một biến thuộc về mô hình bị bỏ qua. Giả sử mô hình thật là: tttt uXXY +++= 33221 βββ Nhưng chúng ta ước lượng mô hình: ttt vXY ++= 221 ββ Nói cách khác, giá trị thật của β3 là khác 0, nhưng chúng ta lại giả định rằng nó bằng 0 và vì vậy đã loại bỏ biến X3 ra khỏi mô hình. Các hệ quả của loại sai số xác định này được tóm tắt qua tính chất sau: a. Nếu một biến độc lập mà hệ số hồi qui thật của nó khác không bị loại ra khỏi mô hình các giá trị ước lượng của tất cả các hệ số hồi qui còn lại sẽ bị thiên lệch trừ phi biến bị loại ra không tương quan với mọi biến được đưa vào. b. Ngay cả khi điều kiện này được thoả mãn, số hạng hằng số được ước lượng nói chung cũng bị thiên lệch, và vì vậy các giá trị dự báo cũng bị thiên lệch. c. Ước lượng phương sai của hệ số hồi qui của một biến được đưa vào nói chung sẽ bị thiên lệch, và vì vậy các kiểm định giả thuyết sẽ không có ý nghĩa. Từ 3 tính chất trên ta thấy rằng việc bỏ qua một biến quan trọng là rất nghiêm trọng. Các ước lượng và trị dự báo sẽ bị thiên lệch, và các kiểm định giả thuyết sẽ không còn có ý nghĩa nữa. Nguyên nhân của sự thiên lệch (gọi là thiên lệch biến bị bỏ sót) là dễ dàng nhận thấy. Đưa vào mô hình một biến không liên quan: Giả sử rằng mô hình thật là: ttt uXY ++= 221 ββ Nhưng chúng ta thêm nhầm biến X3 và ước lượng được mô hình: tttt vXXY +++= 33221 βββ Các hệ quả của việc thêm vào biến không liên quan được tóm tắt qua các tính chất sau: a. Nếu một biến độc lập có giá trị hệ số hồi qui thật bằng không (nghĩa là biến này là thừa) được đưa vào mô hình, các giá trị ước lượng của tất cả các hệ số hồi qui khác vẫn sẽ không thiên lệch và nhất quán. b. Tuy nhiên phương sai của chúng sẽ cao hơn các giá trị khi không có biến không liên quan, và vì vậy các hệ số sẽ không hiệu quả. c. Vì các phương sai ước lượng của các hệ số hồi qui là không thiên lệch, các kiểu định quả thuyết vẫn có hiệu lực. Như vậy hậu quả của việc đưa vào mô hình một biến không liên quan là ít nghiêm trọng hơn so với trường hợp bỏ sót một biến quan trọng. 2.4.1.8. Các tiêu chuẩn chung để chọn mô hình Chúng ta đã chứng minh trước đây bằng cách tăng số biến trong một mô hình, tổng bình phương phần dư ∑ 2tu) sẽ giảm và R2 sẽ tăng, nhưng đổi lại bậc tự do sẽ giảm. 2R và sai số chuẩn của phần dư, [ ] 21)(SS knE − , tính đến việc đánh đổi giữa giảm ESS và giảm bậc tự do. Đây là những tiêu chuẩn thông dụng nhất để so sánh các mô hình. Nhìn chung, mô hình đơn giản hơn được ưa thích hơn vì hai lý do kỹ thuật sau. Thứ nhất, đưa quá nhiều biến vào mô hình khiên cho độ chính xác tương đối của riêng mỗi hệ số giảm. Thứ hai, việc giảm bậc tự do sẽ giảm năng lực của kiểm định trên các hệ số. Vì vậy, xác suất của việc không bác bỏ giả thuyết sai tăng khi bậc tự do giảm. Các mô hình đơn giản cũng dễ hiểu hơn các mô hình phức tạp. Vì vây, lý tưởng nên thiết lập những tiêu chuẩn hạn chế những mô hình lớn nhưng cũng không luôn luôn chọn mô hình đơn giản. Trong những năm gần đây, nhiều tiêu chuẩn chọn mô hình được đề nghị. Tất cả những tiêu chuẩn này có dạng của tổng bình phương phần dư (ESS) nhân với một nhân tốt bất lợi phụ thuộc vào mức độ phức tạp của mô hình. Mô hình càng phức tạp ESS càng giảm nhưng lại tăng tính bất lợi. Các tiêu chuẩn vì vậy phải cung cấp các loại đánh đổi khác giữa mức độ thích hợp và độ phức tạp của mô hình. Một mô hình có trị thống kê tiêu chuẩn thấp được ưa chuộng hơn. Akaike (1970, 1974) xây dựng hai phương pháp, một được gọi là sai số hoàn toàn xác định trước (FPE) và phương pháp thứ hai gọi là tiêu chuẩn thông tin Akaike (AIC). Hannan và Quinn (1979) đề nghị một phương pháp khác (được gọi là tiêu chuẩn HQ). Các tiêu chuẩn khác gồm của Schwarz (1978), Shibata (1981), và Rice (1984), và phương pháp tính chính xác chéo tổng quát (GCV) được Craven và Wahba (1979) phát triển và được Engle, Graner, Rice, và Weiss (1986) sử dụng. Mỗi một trị thống kê này đều dựa trên vài tính chất tối ưu, chi tiết về các phương pháp này được đề cập trong các bài báo liệt kê trên. Bảng tiêu chuẩn chọn mô hình tóm tắt những tiêu chuẩn này (n là số lần quan sát và k là số thông số ước lượng). SGMASQ: 1 1 n SS − ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ ⎟⎠ ⎞⎜⎝ ⎛ −⎟⎠ ⎞⎜⎝ ⎛ n kE HQ: ( ) nknE 2lnn SS ⎟⎠ ⎞⎜⎝ ⎛ AIC: nkeE 2 n SS ⎟⎠ ⎞⎜⎝ ⎛ RICE: 1 21 n SS − ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ ⎟⎠ ⎞⎜⎝ ⎛ −⎟⎠ ⎞⎜⎝ ⎛ n kE FPE: kn knE − +⎟⎠ ⎞⎜⎝ ⎛ n SS SCHWARZ: nknE ⎟⎠ ⎞⎜⎝ ⎛ n SS GVC: 2 1 n SS − ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ ⎟⎠ ⎞⎜⎝ ⎛ −⎟⎠ ⎞⎜⎝ ⎛ n kE SHIBATA: n knE 2 n SS +⎟⎠ ⎞⎜⎝ ⎛ Bảng: Các tiêu chuẩn chung chọn mô hình Không cần thiết phải đưa 2R vào trong tiêu chuẩn vì 2R và SGMASQ ( )2σ) quan hệ nghịch, và vì vậy giá trị SGMASQ thấp cũng có nghĩa là 2R sẽ có giá trị cao. 2R chỉ có ích khi xác định tỷ số của biến đổi trong Y được giải thích bởi các biến X. Một cách lý tưởng, chúng ta muốn có một mô hình có các giá trị của các trị thống kê đều thấp, khi so sánh với một mô hình khác. Mặc dù có thể xếp hạng một vài tiêu chuẩn này đối với một giá trị ESS, n, và k cho trước, thứ tự này sẽ không còn ý nghĩa nữa bởi vì các mô hình đều có ESS và k khác nhau. Trong những trường hợp đặc biệt, một số tiêu chuẩn trở nên dư thừa – nghĩa là, một mô hình ưu việt hơn theo một tiêu chuẩn cũng sẽ ưu việt hơn xét theo các tiêu chuẩn khác. Tuy nhiên, một cách tổng quát, có thể tìm được một mô hình ưu việt theo một tiêu chuẩn nhưng lại không ưu việt theo tiêu chuẩn khác. Ví dụ, tiêu chuẩn Schwarz coi trọng về tính phức tạp của mô hình hơn là các yếu tốt khác và vì vậy có thể dẫn đến một kết luận khác. Một mô hình tốt hơn một mô hình khác theo một số tiêu chuẩn sẽ được ưa chuộng hơn. Tuy nhiên, tiêu chuẩn AIC là tiêu chuẩn được sử dụng phổ biến nhất trong phân tích chuỗi thời gian. 2.4.2. Phương pháp dự báo chuỗi thời gian Như phần trên đã trình bày, các mô hình kinh tế lượng chủ yếu dựa trên một động thái rõ nét của các đối tượng có lien quan đến hệ thống kinh tế. Tuy nhiên một họ các mô hình thay thế khác được sử dụng rộng rãi, đặc biệt trong dự báo ngắn hạn, được gọi là các mô hình chuỗi thời gian. Chủ yếu, các mô hình này nối kết một biến phụ thuộc với các giá trị của nó trong quá khứ và với các sai số ngẫu nhiên mà có thể có tương quan theo chuỗi. Các mô hình chuỗi thời gian không dựa trên bất kỳ một động thái kinh tế rõ nét nào. Cho đên cách đây 30 năm, các mô hình chuỗi thời gian được sử dụng phổ biến nhất trong kỹ thuật và các khoa học vật lý. Tuy nhiên, trong khoảng 2 thập niên gần đây, các phương pháp chuỗi thời gian đã được sử dụng khá rộng rãi trong kinh tế học, trong việc nghiên cứu sự biến đổi các thành phần trong sự phát triển đời sống xã hội, đặc biệt với các dự báo ngắn hạn, trong đó các mô hình chuỗi thời gian đã chứng tỏ là thích hợp hơn so với các mô hình kinh tế lượng. Chuỗi số thời gian là chuỗi các trị số của chỉ tiêu thống kê, dự báo, nghiên cứu sự biến động, v.v… được sắp xếp theo thứ tự thời gian. Qua chuỗi số thời gian có thể nghiên cứu các đặc điểm về sự biến động của hiện tượng, vạch rõ xu hướng và tính quy luật của sự phát triển, đồng thời để dự đoán các mức độ của hiện tượng trong tương lai. Một chuỗi số thời gian có thể được cấu tạo bởi hai thành phần, đó là: thời gian và chỉ tiêu về hiện tượng được nghiên cứu. Thời gian có thể là ngày, tuần, tháng, năm, quý… Độ dài giữa hai thời điểm liền nhau được gọi là khoảng cách thời gian. Chỉ tiêu về hiện tượng được nghiên cứu có thể là số tuyệt đối, số tương đối, số bình quân. Trị số của chỉ tiêu gọi là mức độ của chuỗi số. Một cách tổng quát, các chuỗi thời gian thường được mô hình hoá dạng tổng (hay tích) của 3 thành phần: (1) thành phần xu hướng, (2) thành phần mùa và (3) thành phần ngẫu nhiên. Do đó ta có: Yt = Tt + St + ut hay Yt = Tt * St * ut Trong đó: - Y là biến phụ thuộc - T là thành phần xu hướng theo mùa - S là thành phần mùa - U là thành phần sai số ngẫu nhiên Ví dụ về một xu hướng theo thời gian dạng tuyến tính đơn giản là: Yt = α + βt Và một số dạng đường xu hướng khác được sử dụng phổ biến: (a) Đường thẳng: Yt = β1 + β2t + ut (b) Bậc hai: Yt = β1 + β2t + β3t2 + ut (c) Bậc ba: Yt = β1 + β2t + β3t2 + β4t3+ ut (d) Log-tuyến tính: Yt = β1 + β2ln(t) + ut (e) Nghịch đảo: Yt = β1 + β2(1/t) + ut (f) Tuyến tính-log: ln(Yt) = β1 + β2t + ut ; Yt > 0 (g) Log-hai lần: ln(Yt) = β1 + β2ln(t) + ut ; Yt > 0 (h) Logistic: t t t ut Y Y ++=⎥⎦ ⎤⎢⎣ ⎡ − 211 ln ββ Năm dạng đường xu hướng đầu tiên thì có Yt là biến phụ thuộc, hai dạng đường tiếp theo thì ln(Yt) là biến phụ thuộc, và công thức cuối cùng có dạng log hoá đối với Yt là biến phụ thuộc. Các giá trị của 2R chỉ so sánh được giữa hai mô hình có cùng biến phụ thuộc. Hơn nữa, dạng log hoá đòi hỏi Yt và Yt/(1 – Yt) phải dương. Đường cong log là dạng hữu ích khi Yt ở giữa 0 và 1 hoặc khi Yt là trị số phần trăm. Thành phần mùa là thành phần do hiện tượng mùa vụ xảy ra thường xuyên chẳng hạn như tháng, quý, tuần, ngày, giờ, các ngày nghỉ lễ, v.v… Cấu trúc của các mô hình chuỗi thời gian: 2.4.2.1. Các mô hình tự hồi quy (AR – Auto Regressive) Mô hình chuỗi thời gian tự hồi quy hoàn toàn có cấu trúc như sau: Yt = α1Yt-1 + α2Yt-2 + … + αpYt-p + ut (2.22) Trong đó Yt là quan sát thứ t đối với biến phụ thuộc sau khi trừ đi giá trị trung bình của chính nó, và ut là thành phần sai số có động thái tốt có trung bình bằng 0 và phương sai không đổi và không tương quan với us nếu t ≠ s (khái niệm này gọi là nhiễu trắng – white noise). Thành phần hằng số được bỏ qua vì Yt được biểu diễn dạng độ thiên lệch khỏi giá trị trung bình. Nói cách khác, Yt được mô hình hoá chỉ với quá khứ của nó mà không phải với các biến độc lập khác. Đây là các mô hình tự hồi qui, AR và mô hình trong phương trình (2.22) được gọi là mô hình AR(p), với p là bậc tự hồi qui. 2.4.2.2. Các mô hình trung bình trượt (MA – Moving Average) Mô hình sau đây gọi là mô hình trung bình trượt MA bậc q, kí hiệu là MA (q) Yt = νt – β1 νt-1 – β2 νt-2 – …– βq νt-q (2.23) với νt là chuỗi sai số nhiễu trắng. Do đó, Yt là tổ hợp tuyến tính của các biến ngẫu nhiên nhiễu trắng. 2.4.2.3. Các mô hình ARMA (Auto Regressive Moving Average) Phối hợp giữa các công thức tự hồi quy và trung bình trượt tạo ra mô hình ARMA. Do đó mô hình ARMA (p, q) có dạng tổng quát: Yt = α1Yt-1 + α2Yt-2 + … + αpYt-p + νt – β1 νt-1 – β2 νt-2 – …– βq νt-q (2.24) Hàm tự tương quan: Xét hệ số tương quan r(s) giữa ut và ut-s đối với những giá trị của s từ 0 đến t-1. Hàm này gọi là hàm tự tương quan. Định nghĩa hàm tự tương quan như sau: ( ) ( )( ) ( ) ( )2 , ,)( t stt t stt stt uE uuE uVar uuCov uuCovsr −− − === (2.25) nó có thể được ước lượng bằng hệ số tương quan của mẫu giữa ut và ut-s. Đồ thị tương quan: Là đồ thị của r(s) theo s, với s = 0, 1, …, t-1. Nó là một chỉ dẫn hữu ích để xác định mức độ tương quan của thành phần sai số (ut) với các sai số trong quá khứ ut-1, ut-2, … Là một đồ thị hữu ích để giúp nhận ra các dạng thức trong mối tương quan giữa các chuỗi Tính dừng: Ta xét trường hợp hàm tự tương quan r(s) là độc lập với t, thời đoạn mà các tương quan của phần dư hiện tại và quá khứ được đo, và chỉ phụ thuộc vào khoảng cách (s) giữa thời đoạn t và thời đoạn (t-s) để tính tương quan. Hơn nữa ut được giả định là có phương sai hữu hạn. Đặc tính này được gọi là tính dừng, và bất kỳ chuỗi thời gian nào tuân theo điều này sẽ được gọi là chuỗi thời gian dừng. Do vậy quá trình tạo ra các nhiễu rối ngẫu nhiên là không biến động theo thời gian. Không có tính dừng, Var (ut-s) và Var (ut) là như nhau. Các mô hình không dừng, sai phân hoá: Ta thấy điểm dừng có đặc tính tương quan giữa một biến tại thời đoạn t là (Yt) và giá trị của nó ở thời đoạn s là (Ys) chỉ phụ thuộc vào khoảng cách (t– s) giữa hai thời đoạn. Một chuỗi dừng có giá trị trung bình là hằng số (không nhất thiết = 0) và phương sai không đổi theo thời gian. Quá trình tạo ra chuỗi này là không biến động theo thời gian. Tuy nhiên, hầu hết các chuỗi trong kinh tế có tính không dừng vì chúng tăng trưởng dần theo thời gian. Chẳng hạn, nếu Yt có xu hướng theo thời gian dạng tuyến tính hay lũy thừa thì nó sẽ không dừng. Vậy, trong trường hợp đó ta phải làm thế nào? Hầu hết các chuỗi thời gian không dừng đều có thể được chuyển thành dạng dừng nhờ quá trình sai phân hoá. Xét một xu hướng tuyến tính có dạng Yt = α + βt. Sai phân bậc nhất của Yt được định nghĩa là: ΔYt = Yt – Yt-1. Ta thấy: ΔYt = α + βt - α - β(t-1) = β Là hằng số và do đó nó có tính dừng. Do đó, xu hướng tuyến tính có thể được loại bỏ bằng cách lấy sai phân một lần. Nếu một chuỗi tăng trưởng theo luỹ thừa với mức tăng không đổi, ln(Yt) sẽ có xu hướng tuyến tính và có thể lấy sai phân. Dễ dàng chứng minh được là xu hướng bậc 2 có thể được loại bỏ bằng cách lấy sai phân 2 lần. Sai phân bậc hai (ký hiệu là Δ2Y) được định nghĩa là sai phân bậc nhất của sai phân bậc nhất. Do đó: Δ2Yt = (Yt – Yt-1) - (Yt-1 – Yt-2) = Yt – 2Yt-1 + Yt-2 (2.26) Một dạng khác mà trong đó tính không dừng thường xuất hiện đó là tính mùa. Tính không dừng trong các chuỗi theo tháng và theo quý thường có thể được loại bỏ bằng cách lấy sai phân thích hợp: Δ4 = Yt – Yt-4 đối với dữ liệu theo quý và Δ12 = Yt – Yt-12 đối với dữ liệu theo tháng. 2.4.2.4. Mô hình ARIMA (Auto Regressive Intergrated Moving Average) Giả sử rằng, một chuỗi thời gian không dừng có thể được chuyển thành một chuỗi dừng bằng cách lấy sai phân d lần. Thì chuỗi đó được gọi là tích hợp bậc d và được viết là I(d). Chuỗi dừng do sai phân sau đó sẽ có thể được mô hình hoá theo ARMA (p, q). Trong trường hợp này quá trình tạo ra chuỗi Yt được gọi là tự hồi qui tích hợp trung bình trượt, và mô hình đó là mô hình ARIMA, kí hiệu ARIMA (p, d, q). Ước lượng và dự báo với mô hình ARIMA George Box và Gwilym Jenkins (1976) đã nghiên cứu mô hình ARIMA và tên của họ thường được dùng để gọi tên các quá trình ARIMA tổng quát, áp dụng vào việc phân tích và dự báo các chuỗi thời gian. Phương pháp Box- Jenkins đề xuất một phương pháp cụ thể gồm 4 giai đoạn: 1. Nhận dạng, xác định p, d, q 2. Ước lượng, bao gồm việc ước lượng các tham số của phương trình (2.22) trong đó vế trái là chuỗi được lấy sai phân d lần. 3. Kiểm tra chẩn đoán, bao gồm việc áp dụng các kiểm định khác nhau để xem mô hình ước lượng có thích hợp với dữ liệu một cách thoả đáng hay không. Nếu mô hình chưa thích hợp thì lặp lại quá trình. 4. Dự báo, thực hiện việc dự báo theo mô hình đã chọn. NHẬN DẠNG: Bởi vì hầu hết các chuỗi thời gian thay đổi theo thời gian một cách có hệ thống, bước đầu tiên của giai đoạn nhận dạng là chọn d, số lần lấy sai phân để làm cho nó xấp xỉ dừng (thoả mãn tính dừng). Đồ thị vẽ chuỗi theo thời gian thường cho thấy chứng cứ về bản chất của chuỗi. nếu chuỗi biểu thị sự tăng trưởng theo luỹ thừa, thì đầu tiên hãy lấy logarit và vẽ nó theo thời gian. Nếu rõ rang là có xu hướng tuyến tính, chung ta sẽ lấy sai phân chuỗi (hay log của nó) một lần và vẽ chuỗi đã lấy sai phân. Nếu vẫn thể hiện xu hướng, có thể phải lấy sai phân lần thứ hai. Chuỗi thời gian về kinh tế hiếm khi phải lấy sai phân hơn hai lần. Cách thứ hai để nhận ra xem có cần thiết phải lấy sai phân không là tính hàm tự tương quan(ACF) đã được định nghĩa trước đây và vẽ đồ thị tương quan. Đồ thị tương quan là đồ thị của các hệ số tương quan giữa một chuỗi và các giá trị của nó trong quá khứ. Nếu đồ thị này giảm từ từ thì phải có chỉ định phải lấy sai phân. Tiếp theo vẽ đồ thị tương quan của các sai phân bậc nhất. Nếu đồ thị này tiếp tục giảm từ từ thì lại có chỉ định phải lấy sai phân bậc hai. Tính không dừng do các ảnh hưởng mùa được xử lý bằng cách tách mùa cho chuỗi. Cách đơn giản để tách thành phần mùa trong một chuỗi dữ liệu tháng là lấy sai phân Yt – Y t-12. Hoặc, ta lấy hồi quy Yt theo các biến giả theo mùa và sau đó lấy phần dư của chương trình đã được thích hợp hoá, với các ảnh hưởng mùa đã bị loại ra. Nếu các ảnh hưởng mùa xuất hiện, ACF sẽ có đỉnh nhọn ở những khoảng đều đặn (xem hình minh hoạ 2.1 về dữ liệu tháng). Hình 2.1. Đồ thị tương quan với dữ liệu doanh số theo tháng Sai phân Yt – Yt-12 thường loại bỏ các ảnh hưởng mùa và xu hướng tuyến tính. Hình 2.2. Đồ thị tương quan đối với dữ liệu sai phân 12 tháng Các chọn lựa ban đầu về bậc của tự hồi quy và các thành phần trung bình trượt (p và q) thường được thực hiện đồng thời. Đối với những giá trị độ trễ lớn (ký hiệu k), ACF lý thuyết của mô hình AR(p) sẽ xấp xỉ dạng Apk (với - 1<ρ<1). Nếu ρ là dương thì ACF sẽ giảm dần. nếu ρ là âm thì hàm số sẽ được bao bởi một cặp đường cong như hình 2.22. Hình 2.3. Đồ thị tương quan đối với AR(p) Với mô hình MA(q) thì đồ thị tương quan về lý thuyết là bằng 0 đối với các độ trễ lớn hơn q nhưng không có dạng cụ thể trước q (xem hình 2.23). Đồ thị tương quan ước lượng có thể dung như một chỉ dẫn để chọn giá trị q. Nếu đồ thị tương quan vẫn duy trì gần 0 sau một độ trễ cụ thể nào đó, thì độ trế đó sẽ là lựa chọn tốt cho giá trị q. Hình 2.4. Đồ thị tương quan đối với MA(q) Để chọn giá trị ban đầu cho p, sử dụng một hàm khác gọi là hàm tự tương quan riêng phần (PACF – Partial Auto Correlation Function) và đồ thị đi kèm là đồ thị tương quan riêng phần. Giả sử chúng ta thích hợp hoá một mô hình tự hồi quy bậc nhất có dạng: Yt = a11Yt-1 + ut và ước lượng a11 bằng OLS (thành phần hằng số được bỏ qua bằng cách lấy Yt là độ lệch khỏi giá trị trung bình của chuỗi). Tiếp theo chúng ta ước lượng mô hình AR(2) có dạng Yt = a21Yt-1 + a22Yt-2 + ut Và thu được 22a ) . Bằng cách tiến hành này chúng ta có thể thu được kka ) là hệ số hồi qui ước lượng của Yt-k khi mô hình tự tương quan bậc k được ước lượng. Đồ thị kka ) là đồ thị tương quan riêng phần. Nó là tương quan giữa Yt và Yt-k sau khi ảnh hưởng của các Y khác đã được loại bỏ. Đồ thị tương quan riêng phần về lý thuyết có đặc tính là nếu bậc của tự hồi quy là p thì akk = 0 với mọi k > p. Do đó, đồ thị tương quan riêng phần được ước lượng có thể được sử dụng như một chỉ dẫn để chọn giá trị p. Nếu đồ thị tự tương quan riêng phần vẫn duy trì gần 0 sau một độ trễ cụ thể nào đó, thì độ trễ đó sẽ là lựa chọn tốt cho p. Hướng dẫn để nhận dạng mô hình chuỗi thời gian sơ bộ có thể tóm tắt như sau: 1. Nếu đồ thị tự tương quan còn lại gần bằng 0 sau một độ trễ nào đó, q chẳng hạn, thì sự lựa chọn thích hợp cho bậc của MA là q. 2. Nếu đồ thị tương tương quan riêng phần còn lại gần 0 sau một độ trễ nào đó, p chẳng hạn, thì sự lựa chọn thích hợp cho bậc của AR là p. 3. Nếu hai điều trên không xảy ra nhưng cả hai đồ thị rốt cục lại giảm tới 0, chúng ta có thể bắt đầu với một mô hình ARMA(1,1) đơn giản. ƯỚC LƯỢNG: Quy trình ước lượng các tham số của mô hình chuỗi thời gian khá phức tạp và gồm cả việc giải hệ phương trình phi tuyến. Có nhiều chương trình máy tính có thể tính đồ thị tương quan và đồ thị tương quan riêng phần được sử dụng để nhận dạng mô hình, và sau đó tự động thực hiện quá trình ước lượng (EViews, FORECAST MASTER, FORECAST PRO, TSP, MicroTSP, v.v…) KIỂM TRA CHẨN ĐOÁN: Giai đoạn kiểm tra chẩn đoán bao gồm việc cho mô hình ước lượng chịu các loại kiểm định khác nhau để đảm bảo là nó thích hợp một cách thoả đáng với dữ liệu. Cách tốt nhất để khảo sát xem một mô hình có thích hợp hay không với dữ liệu là tiến hành kiểm chứng hậu mẫu, nghĩa là, để dành một phần của mẫu (không sử dụng để ước lượng) để dự báo kiểm định và sau đó đem so sánh các giá trị dự báo với giá trị đã biết của Y. Các trị thống kê tóm tắt thường được sử dụng là sai số bình phương trung bình và tiêu chí thong tin Akaile. Cách đơn giản khác là làm thích hợp mô hình quá mức, nghĩa là thích hợp hoá một mô hình có bậc hơi cao hơn và sau đó kiểm định xem các tham số dôi thêm có khác 0 một cách đáng kể không. Trong mọi trường hợp, nếu mô hình thích hợp tốt với dữ liệu, thì phần dư từ mô hình ( tυ ) ) sẽ là nhiễu trắng. Qui trình thông thường là tính phần dư và hàm tự tương quan của chúng và sau đó khảo sát xem có phải là các phần dư xấp xỉ một chuỗi nhiễu trắng không. Box và Pierce (1970) đã đề xuất một kiểm định chính thức cho việc này. Qui trình là tính trị thống kê Box – Pierce. ∑= = = Kk k krnQ 1 2 (2.26) Với rk là tự tương quan bậc k của các phần dư ( tυ ) ), n là số quan sát, và k là giá trị được chọn trước của các tự tương quan (chẳng hạn, 20 hay cao hơn). Nếu chuỗi phần dư là nhiễu trắng, thì Q sẽ có phân phối chi-square, với k – p – q bậc tự do. Nếu q lớn hơn giá trị chuẩn của chi-square, thì chúng ta kết luận là chuỗi phần dư không là nhiễu trắng. Một kiểm định gần đây được sử dụng phổ biến là Ljung & Box (1978). Trị thống kê kiểm định Ljung-Box cho bởi: ∑= = ⎥⎦ ⎤⎢⎣ ⎡ − += Kk k k kn r nnLJB 1 ' 2 '' )2( (2.27) Trong đó n’ = n – d là số các quan sát được sử dụng sau khi chuỗi được lấy sai phân d lần. Dưới giả thiết không cho rằng các phần dư thực chất là nhiễu trắng, LJB có phân phối chi-square với độ tự do là K-p-q. Tiêu chuẩn để chấp nhận hay loại bỏ trong kiểm định tương tự như trong kiểm định Box- Pierce. DỰ BÁO: Bước cuối cùng là thực hiện việc dự báo thật. Chúng ta thấy từ phương trình (2.3) rằng giá trị dự báo trước một thời đoạn được cho bởi (cho vn+1 tiến đến 0): qnqnnpnpnnn YYYY −+−−+−+ −−−−+++= 112111211 ...... υβυβυβααα ) ))))))))) (2.28) Nếu chuỗi phải được lấy sai phân để làm cho nó dừng thì trị dự báo là nnn YYY ))) −=Δ ++ 11 từ đó 1+nY ) sẽ được tính ra là 1+Δ+ nn YY )) . Nếu chuỗi được lấy sai phân 2 lần, thì từ phương trình (2.4) ta có: 1 2 11 2 +−+ Δ+−= nnnn YYYY )) TÓM TẮT Một trong các ứng dụng chủ yếu của mô hình kinh tế lượng là để dự báo hay dự đoán. Cả hai nhóm phương pháp dự báo: Kinh tế lượng và chuỗi thời gian. Dự báo kinh tế lượng đặt cơ sở trên mô hình hồi quy để nối kết một (hay nhiều) biến phụ thuộc với một số biến độc lập. Dự báo chuỗi thời gian nối kết biến phụ thuộc với các giá trị của nó trong quá khứ và cố gắng sử dụng mối quan hệ này để dự báo biến phụ thuộc. Một môi trường dự báo bao gồm ba giai đoạn. Một người khảo sát sử dụng một mẫu các quan sát và ước lượng mô hình. Các giá trị dự báo của biến phụ thuộc trong thời kỳ trong mẫu này còn được gọi là các giá trị thích hợp hoá. Các giá trị dự báo ngoài mẫu có thể là kiểm định hay tiên nghiệm. Dự báo kiểm định là đối với giai đoạn mà trong đó các giá trị thực tế của biến phụ thuộc và độc lập đều đã biết. Các giá trị dự báo như thế thường được so sánh với giá trị thực tế để đánh giá năng lực dự báo của mô hình. Các dự báo tiên nghiệm là dự báo cho tương lai với các giá trị của biến độc lập được dự báo từ các mô hình khác. Dự báo có thể là có điều kiện hoặc không điều kiện. Khi các giá trị của các biến độc lập là biết trước thì ta có dự báo có điều kiện. Dự báo không điều kiện được tạp ra khi các giá trị của các biến ngoại sinh không được biết trước mà được tạo ra từ bản thân mô hình hay từ một mô hình hỗ trợ khác. Việc đánh giá năng lực dự báo của một mô hình được thực hiện theo một số cách. Đầu tiên, chúng ta lấy ra một phần của mẫu và không sử dụng chúng cho mục đích ước lượng. Kế đến, chúng ta tạo ra các dự báo cho mẫu được lấy ra (đây là dự báo kiểm định) và tính sai số dự báo và tổng bình phương sai số dự báo (ESS). Giá trị này có thể được dùng để tính các trị thống kê để lựa chọn mô hình được liệt kê trong bảng Tiêu chuẩn chọn mô hình. Một mô hình có các giá trị thấp hơn ở hầu hết các trị thống kê tiêu chuẩn thì được xem là trội hơn. Hơn nữa, chúng ta tiến hành hồi quy các giá trị dự báo theo một hằng số và giá trị thực tế. Nếu dự báo là hoàn hảo, chúng ta sẽ kỳ vọng là thành phần hằng số ước lượng sẽ gần bằng 0 và thành phần độ dốc ước lượng gần bằng 1. Làm thích hợp bằng đường xu hướng là một kỹ thuật được sử dụng phổ biến để diễn tả biến phụ thuộc của một hàm chỉ theo thời gian. Dạng hàm nhận được có thể là tuyến tính, bậc hai, log tuyến tính, nghịch đảo, tuyến tính log, log-hai lần hay logistic. Một nhà quan sát mà chỉ quuan tâm đến xu hướng rõ nét của một chuỗi thời gian hơn là đến sự biến động xung quanh xu hướng đó thì có thể làm trơn dữ liệu bằng cách sử dụng trị trung bình của một số các thành phần lien tiếp nhau (gọi là trung bình trượt) hoặc làm trơn theo luỹ thừa, nghĩa là tạo ra một trung bình có trọng số của các giá trị hiện tại và quá khứ của chuỗi, các trọng số giảm dần theo luỹ thừa khi chúng ta lùi về quá khứ. Kỹ thuật này có thể được sử dụng đối với các sai số dự báo để có được các dự báo thích nghi. Khi nhiều phương án mô hình có dấu hiệu là tạo ra được các giá trị dự báo khá tốt, thì tốt hơn ta nên kết hợp các dự báo hơn là chọn lấy một mô hình tốt nhất và bỏ các mô hình khác. Phương pháp tối ưu để kết hợp dự báo là lấy hồi quy (sử dụng dữ liệu của mẫu hay dữ liệu giai đoạn kiểm định) các giá trị thực tế theo một hằng số và các trị dự báo được tạo ra từ các phương án mô hình. Các hệ số ước lượng sau đó được dung như các trọng số đối với dự báo kết hợp. Trong thời kỳ mẫu, trị dự báo kết hợp có tổng sai số bình phương nhỏ nhất, với sai số dự báo bình phương bằng 0, ngay cả khi các dự báo riêng lẻ bị thiên lệch. Trong các mô hình kinh tế lượng, các giá trị dự báo được tạo ra bằng cách thay các giá trị dự báo hay giả định cho các biến độc lập. Nếu có tương quan chuỗi trong các phần dư, các sai số có thể được mô hình hoá với quá trình tự hồi quy và thong tin được dung để thu được các dự báo có hiệu quả hơn. Các mô hình chuỗi thời gian nối kết một biến phụ thuộc với các giá trị của nó trong quá khứ. Một chuỗi thời gian tự hồi quy hoàn toàn (mô hình AR) sẽ nối kết biến phụ thuộc với các giá trị của nó trong quá khứ với các sai số nhiễu trắng (white noise). Mô hình trung bình trượt (mô hình MA) nối kết một biến phụ thuộc với một tổ hợp tuyến tính của các thành phần sai số nhiễu trắng. Mô hình ARMA là tổ hợp các đặc tính của AR và MA vào trong một mô hình. Đồ thị tương quan là một đồ thị hữu ích để giúp nhận ra các dạng thức trong mối tương quan giữa các chuỗi. Nó vẽ hàm tự tương quan, nghĩa là cho hệ số tương quan giữa các giá trị của một chuỗi tại thời gian t và tại t-s với các giá trị s khác nhau. Đặc tính dừng có tính chất là chuỗi có trị trung bình và phương sai không đổi theo thời gian, và tương quan giữa một biến tại thời gian t và tại s (t ≠ s) chỉ tuỳ thuộc vào khoảng cách t-s giữa 2 thời đoạn. Một chuỗi không dừng thường có thể được lấy sai phân (bằng cách tính sự thay đổi giữa một thời đoạn và thời đoạn kế tiếp) để làm cho nó dừng. Đôi khi có thể phải tiến hành lấy sai phân nhiều lần hoặc chuyển sang dạng log trước khi lấy sai phân. Một xu hướng tuyến tính có thể được loại bỏ bằng cách lấy sai biệt 1 lần, xu hướng bậc hai có thể được loại bỏ bằng cách lấy sai phân 2 lần, v.v… Dữ liệu theo quý và tháng thường biểu hiện các tác động mùa. Nó có thể được loại bỏ bằng cách sai phân bậc 4 hay 12, nghĩa là Yt – Yt-4 hay Yt – Yt-n. Các mô hình ARIMA là những mô hình được lấy sai phân bậc nhất nhiều lần để tạo ra tình trạng dừng và sau đó lấy một mô hình ARMA để thích hợp chúng. Việc ước lượng một mô hình chuỗi thời gian bao gồm 3 giai đoạn: (1) Nhận dạng, (2) Ước lượng và (3) Kiểm định chẩn đoán. Nhận dạng là quá trình xác định bậc của sai phân, của mô hình tự hồi quy và của mô hình trung bình trượt. Các đồ thị tương quan và tương quan riêng phần được dung để nhận dạng các mô hình. Kiểm định chẩn đoán là quá trình cho mô hình trải qua kiểm định để xem nó có thích hợp một cách thoả đáng hay không? Hai kiểm định tthwờng được dung ở đây là Box-Pierce và Ljung-Box. Một khi mô hình đã được đánh giá là phù hợp, các dự báo sẽ được tạo ra từ mô hình được ước lượng. 2.5. Đánh giá các mô hình - Đánh giá độ chính xác và tính hợp lệ của mô hình dự báo. - Thu nhặt dữ liệu để kiểm tra Mô hình Dữ liệu thu được thường được xem như rất “đắt”. Thực tế, công nghệ “làm mềm” chất xám, mà chúng ta trở nên tự tin hơn vào các phương sách; hơn nữa, dữ liệu có thể tin cậy được cần thiết để kiểm tra một mô hình định lượng. Các mô hình toán học, đôi khi thoát khỏi sự đánh giá của người ra quyết định. Hay cách khác, một số người thường nghĩ theo phương pháp đại số; những người khác lại nhìn theo phương pháp hình học. Khi dữ liệu là phức tạp hay nhiều chiều, thì có nhiều lý do để làm việc với các công thức. Quá trình mô hình trên được sử dụng để: • hiểu được cơ chế ưu tiên tạo ra chuỗi thời gian. Bao gồm mô tả, giải thích sự biến đổi, tính thời vụ, xu hướng vvv... • dự đoán tương lai với điều kiện mọi chuyện sẽ đâu vào đấy • điều khiển hệ thống, để thực hiện chuỗi sự kiện nếu xảy ra trong tương lai. Dự báo thống kê: Sự lựa chọn và thực hiện một phương pháp dự báo chính xác luôn luôn là một kế hoạch quan trọng và điều khiển lợi nhuận đối với hầu hết các hãng và các đại lý. Thông thường, tình trạng tài chính của toàn bộ quá trình hoạt động đều dựa vào độ chính xác của dự báo vì những thông tin này sẽ được sử dụng để tạo ra ngân sách tương quan và các quyết định mang tính chất hệ thống trong các lĩnh vực quản lý nhân sự, lợi tức, thị trường và quảng cáo, vốn tài chính, v.v…. Có hai hướng chính để dự báo. Cả dự đoán giá trị tương lai dựa trên phân tích các yếu tố tin cậy ảnh hưởng đến giá trị tương lai, ví dụ như phương pháp giải thích, đến dự đoán dựa trên một phương pháp học suy luận của dữ liệu đã có trong quá khứ qua thời gian, ví dụ phương pháp ngoại suy. Tự động tương quan: Tự tương quan là một chuỗi các tương quan của chuỗi các khoảng cách thời gian bằng nhau giữa các thành phần. Không giống như dữ liệu thống kê mà là các mẫu ngẫu nhiên cho phép ta thực hiện việc phân tích thống kê, đưa ra khả năng dự đoán và dự báo. Ba công cụ để đánh giá tự tương quan của một chuỗi thời gian là đồ thị chuỗi thời gian, và ít nhất là các giá trị tự tương quan thứ nhất và thứ hai. Tóm tắt các phương pháp Dự báo: Một cách lý tưởng, các tổ chức mà đủ khả năng làm như vậy sẽ gán dự báo quyết định tương ứng với các phòng ban và/hoặc các cá nhân là có chất lượng tốt nhất và có nguồn nhân lực cần thiết để tạo ra những ước lượng dự báo như vậy dưới các mô hình nhu cầu phức tạp. Rõ ràng, một hãng với hoạt động đang phát triển liên tục và một đội ngũ nhân viên kỹ thuật cùng với các nhà thống kê, nhà khoa học quản lý, nhà phân tích máy tính vvv, vào các vị trí tốt hơn nhiều để lựa chọn và đưa ra cách sử dụng chính xác cho các kỹ thuật dự báo phức tạp hơn là một công ty với nhiều nguồn nhân lực giới hạn. Một chuỗi thời gian là một tập các năng lực có thứ tự trên một đặc điểm định lượng của một hiện tượng tại mọi điểm khoảng cách thời gian bằng nhau. Một trong số các đích chính của việc phân tích chuỗi thời gian là để dự báo các giá trị tương lai của các chuỗi.

Các file đính kèm theo tài liệu này:

Mô hình dự báo kinh tế - Hệ hỗ trợ ra quyết định trong doanh nghiệp.pdf