Đề tài Vận dụng phương pháp dãy số thời gian phân tích năng suất lúa tỉnh Trà Vinh giai đoạn 2000 – 2009 và dự đoán đến năm 2012

LỜI MỞ ĐẦU Với nền kinh tế thị trường có sự điều tiết của Nhà nước, Việt Nam cần có một bộ máy quản lý vĩ mô có đủ khả năng ra mọi quyết định phù hợp với thời cuộc, khi hiệu quả sản xuất kinh doanh trở thành yếu tố sống. Trước hết cần yêu cầu cấp thiết về thông tin quản lý, ngành Thống kê đã xác định nhiệm vụ trọng tâm của mình là giúp chính phủ thu thập, xử lý, phân tích thông tin kinh tế xã hội. Một trong những thông tin quan trọng đó là thu thập, xử lý, phân tích về cơ cấu giống gieo trồng, sản lượng, năng suất cũng như diện tích canh tác cây lương thực mà đặc biệt là lúa gạo. Bởi đây là mặc hàng nông sản hết sức quan trọng đảm bảo an ninh lương thực trong nước và đó cũng là mặc hàng xuất khẩu quan trọng của nền kinh tế. Để giúp mọi người có cái nhìn sâu sắc hơn về vấn đề này, nhóm phân tích xin có nghiên cứu về năng suất lúa qua đề tài: “Vận dụng phương pháp dãy số thời gian phân tích năng suất lúa tỉnh Trà Vinh giai đoạn 2000 – 2009 và dự đoán đến năm 2012”. Với các phần gồm: Chương 1. Phương pháp luận Chương 2. Đánh giá năng suất lúa tỉnh Trà Vinh giai đoạn 2000 – 2009 Chương 3. Dự đoán năng suất lúa giai đoạn 2010 – 2012 Để nghiên cứu đề tài này, nhóm phân tích đã kết hợp kiến thức đã được lĩnh hội trong quá trình học tập và nghiên cứu tại nhà trường với sự hướng dẫn tận tình của Giảng viên Trần Minh Tâm. Đồng thời có tham khảo các tài liệu tin cậy có liên quan đến lĩnh vực này. Trong điều kiện kiến thức và thời hạn còn hạn chế nhóm phân tích chỉ có thể phân tích năng suất lúa của tỉnh Trà Vinh thông qua phương pháp dãy số thời gian. Vì vậy sẽ không tránh khỏi những thiếu sót và nhận xét không đầy đủ. Rất mong nhận được ý kiến đóng góp của các bạn và đặc biệt là thầy cô thuộc bộ môn Lý thuyết thống kê. MỤC LỤC Trang CHƯƠNG 1. PHƯƠNG PHÁP LUẬN 1 1.1 Những vấn đề chung về dãy số thời gian 1 1.1.1 Khái niệm dãy số thời gian 1 1.1.2 Yêu cầu vận dụng 1 1.1.3 Ý nghĩa của việc nghiên cứu dãy số thời gian 1 1.1.4 Các yếu tố ảnh hưởng đến dãy số thời gian 2 1.2 Các chỉ tiêu cơ bản dùng để phân tích biến động dãy số thời gian 2 1.2.1 Mức độ bình quân theo thời gian 2 1.2.2 Lượng tăng (giảm) tuyệt đối 3 1.2.3 Tốc độ phát triển 4 1.2.4 Tốc độ tăng (giảm) 5 1.2.5 Giá trị tuyệt đối của 1% tăng (giảm) 5 1.3 Phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng 6 1.3.1 Mở rộng khoảng cách thời gian 6 1.3.2 Phương pháp dãy số bình quân trượt 6 1.3.3 Phương pháp hồi quy 7 1.3.4 Phương pháp chọn dạng hàm 7 1.3.5 Biến động thời vụ 12 1.3.6 Phương pháp phân tích các thành phần của dãy số thời gian 13 1.4 Dự đoán thống kê 16 1.4.1 Khái niệm về dự đoán thống kê 16 1.4.2 Một số phương pháp dự đoán thống kê ngắn hạn trên cơ sở dãy số thời gian 17 CHƯƠNG 2. ĐÁNH GIÁ NĂNG SUẤT LÚA TỈNH TRÀ VINH GIAI ĐOẠN 2000 – 2009 23 2.1 Đánh giá khái quát năng suất lúa Trà Vinh trong giai đoạn 2000 - 2009 23 2.1.1 Hệ thống chỉ tiêu thống kê năng suất lúa 23 2.1.2 Điều tra năng suất lúa 23 2.1.3 Công thức tính năng suất lúa 23 2.2 Phân tích sự biến động của năng xuất lúa theo thời gian (2000 - 2009) 25 2.2.1 Phân tích các chỉ tiêu dãy số thời gian 25 2.2.2 Biểu diễn xu hướng phát triển năng suất lúa tỉnh Trà Vinh bằng hàm xu hướng 28 CHƯƠNG 3. DỰ BÁO NĂNG SUẤT 2010 - 2012 38 3.1 Ngoại suy bằng các mức độ bình quân 38 3.1.1 Ngoại suy bằng lượng tăng (giảm) tuyệt đối bình quân 38 3.1.2 Ngoại suy bằng tốc độ phát triển bình quân 39 3.2 Ngoại suy hàm xu thế 39 3.3 Dự đoán bằng các phương pháp san mũ 41 3.3.1 Phương pháp san mũ giản đơn 41 3.3.2 Phương pháp san mũ Holt 42 3.3.3 Mô hình dạng phi tuyến với xu thế là hàm mũ và không có biến động thời vụ 43 3.3.4 Mô hình dạng phi tuyến với hàm Damped và không có biến động thời vụ 44 Kết luận 48 DANH MỤC BẢNG Trang Bảng 2.1: Bảng năng suất lúa cả năm phân theo địa phương 24 Bảng 2.2: Các chỉ tiêu dãy số thời gian 26 Bảng 2.3: Tóm tắt kết quả các hàm xu hướng 38 Bảng 3.1: Lượng tăng giảm tuyệt đối 38 Bảng 3.2: Tốc độ phát triển của năng suất lúa tỉnh Trà Vinh 39 Bảng 3.3: Kết quả dự đoán của hàm xu thế 40 Bảng 3.4: Tóm tắt các mô hình dự đoán bằng san bằng mũ 45 Bảng 3.5: Dự báo năng suất lúa của tỉnh Trà Vinh theo mô hình san mũ Hotl 45 Bảng 3.6: Mô hình dự báo năng suất lúa tỉnh Trà Vinh 46 MỤC LỤC HÌNH Trang Hình 2.1: Biểu đồ thể hiện năng suất lúa của tỉnh Trà Vinh so với mức bình quân của Đồng bằng sông Cửu Long 25 Hình 2.2: Năng suất lúa tỉnh Trà Vinh 27 Hình 3.1: So sánh sự biến động năng suất lúa thực tế với lý thuyết 41 Hình 3.2: Mô hình dự báo năng suất lúa tỉnh Trà Vinh theo mô hình san mũ Holt 46

48 trang | Chia sẻ: lvcdongnoi | Lượt xem: 3476 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Đề tài Vận dụng phương pháp dãy số thời gian phân tích năng suất lúa tỉnh Trà Vinh giai đoạn 2000 – 2009 và dự đoán đến năm 2012, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

CHƯƠNG 1. PHƯƠNG PHÁP LUẬN 1.1 Những vấn đề chung về dãy số thời gian 1.1.1 Khái niệm dãy số thời gian Các hiện tượng kinh tế - xã hội luôn luôn biến động qua thời gian. Để nghiên cứu sự biến động này người ta dùng phương pháp dãy số thời gian. Dãy số thời gian là dãy các trị số của một chỉ tiêu nào đó được sắp xếp theo thứ tự thời gian. Xét về hình thức, dãy số thời gian gồm 2 thành phần là: - Thời gian: ngày, tuần, tháng, năm. - Trị số của chỉ tiêu (hay mức độ của dãy số), nó có thể là số tuyệt đối, số tương đối hoặc số trung bình. Căn cứ vào đặc điểm về mặt thời gian người ta thường chia dãy số thời gian thành 2 loại: - Dãy số thời kì là dãy số biểu hiện sự thay đổi của hiện tượng qua từng thời kì nhất định. - Dãy số thời điểm là dãy số biểu hiện mặt lượng của hiện tượng vào một thời điểm nhất định. 1.1.2 Yêu cầu vận dụng Khi xây dựng dãy số thời gian phải đảm bảo yêu cầu có thể so sánh được giữa các mức độ trong dãy số. Cụ thể phải thống nhất về nội dung và phương pháp tính các chỉ tiêu theo thời gian. Phải thống nhất về phạm vi và tổng thể nghiên cứu. Các khoảng cách thời gian trong dãy số nên bằng nhau nhất là trong dãy số thời kì phải bằng nhau. 1.1.3 Ý nghĩa của việc nghiên cứu dãy số thời gian Phương pháp phân tích một dãy số thời gian dựa trên một giả thuyết căn bản là sự biến động trong tương lai của hiện tượng nói chung sẽ giống với sự biến động của hiện tượng ở quá khứ và hiện tại nếu xét về đặc điểm và cường độ của hiện tượng. Nói cách khác, các yếu tố đã ảnh hưởng đến biến động của hiện tượng trong quá khứ được giả định trong tương lai sẽ tiếp tục tác động đến hiện tượng theo xu hướng giống hoặc gần giống như trước. Do vậy, mục tiêu chính của phân tích dãy số thời gian là chỉ ra và tách biệt các yếu tố ảnh hưởng đến dãy số. Điều đó có ý nghĩa trong việc dự đoán và xem xét chu kỳ biến động của hiện tượng. Đây là công cụ đắc lực cho họ trong việc ra quyết định. 1.1.4 Các yếu tố ảnh hưởng đến dãy số thời gian Biến động của dãy số thời gian thường được xem là kết quả của các yếu tố sau đây: Tính xu hướng: quan sát số liệu thực tế của hiện tượng trong một thời gian dài (thường là nhiều năm), ta thấy biến động của hiện tượng theo một chiều hướng (tăng hoặc giảm) rõ rệt. Nguyên nhân của loại biến động này là sự thay đổi trong công nghệ sản xuất, gia tăng dân số, biến động về tài sản … Tính chu kỳ: biến động của hiện tượng được lặp lại với một chu kì nhất định, thường kéo dài từ 2 - 10 năm, trải qua 4 giai đoạn: phục hồi và phát triển, thịnh vượng, suy thoái và đình trệ. Biến động theo chu kì là do biến động tổng hợp của nhiều yếu tố khác nhau. Chẳng hạn hiện tượng thời tiết bất thường Enlino, Enlina ảnh hưởng đến năng xuất và sản lượng nông nghiệp. Tính thời vụ: biến động của một số hiện tượng kinh kế - xã hội mang tính thời vụ nghĩa là hàng năm, vào những thời điểm nhất định (tháng hoặc quý) biến động của hiện tượng được lặp đi lặp lại. Nguyên nhân của biến động hiện tượng là do các điều kiện thời tiết , khí hậu, tập quán xã hội, tín ngưỡng của dân cư… Tính ngẫu nhiên hay bất thường: là những biến động không có quy luật và hầu như không thể dự đoán được. Loại biến động này thường xảy ra trong một thời gian ngắn và không lặp lại. Nguyên nhân là do ảnh hưởng của các biến cố chính trị, thiên tai, chiến tranh… 1.2 Các chỉ tiêu cơ bản dùng để phân tích biến động dãy số thời gian 1.2.1 Mức độ bình quân theo thời gian Phản ánh mức độ đại biểu của các mức độ trong dãy số. Gồm có: - Mức độ trung bình của dãy số thời kỳ. + Các lượng biến có quan hệ tổng: + Các lượng biến có quan hệ tích: - Mức độ trung bình của dãy số thời điểm. + Khoảng cách thời gian của các thời điểm bằng nhau: + Nếu khoảng cách thời gian của các thời điểm không bằng nhau: 1.2.2 Lượng tăng (giảm) tuyệt đối Phản ánh sự thay đổi về trị số tuyệt đối của chỉ tiêu giữa hai thời gian nghiên cứu. Nếu mức độ của hiện tượng này tăng lên thì trị số của hai chỉ tiêu mang dấu dương (+) và ngược lại mang dấu âm (-). Tuỳ theo mục đích nghiên cứu mà ta có các chỉ tiêu về lượng tăng (hoặc giảm) sau đây: Tuỳ theo mục đích nghiên cứu ta có: - Lượng tăng (giảm) tuyệt đối liên hoàn (hay từng kỳ) gọi là hiệu số giữa mức độ kỳ nghiên cứu (yi) và mức độ kỳ đứng liền trước nó (yi-1) chỉ tiêu này phản ánh mức độ tăng (hoặc giảm) tuyệt đối giữa hai thời gian liền nhau (thời gian i-1 và thời gian i). (i=) - Lượng tăng (giảm) tuyệt đối định gốc (hay tính dồn) là hiệu số giữa mức độ kỳ nghiên cứu (yi) và mức độ của một kỳ nào đó được chọn làm gốc, thường là mức độ đầu tiên trong dãy số (y1) chỉ tiêu này phản ánh mức tăng (hoặc giảm) tuyệt đối trong những khoảng thời gian dài. (i=) - Lượng tăng (giảm) tuyệt đối bình quân: Biểu hiện một cách chung lượng tăng (giảm) tuyệt đối, tính trung bình cho cả thời kỳ nghiên cứu. Chỉ tiêu này thường chỉ sử dụng khi các trị số của dãy số có cùng xu hướng (cùng tăng hay cùng giảm). 1.2.3 Tốc độ phát triển Tốc độ phát triển là một số tương đối (thường được biểu hiện bằng lần hoặc %) phản ánh tốc độ và xu hướng biến động của hiện tượng qua thời gian tuỳ theo mục đích nghiên cứu ta có các loại tốc độ phát triển sau đây: - Tốc độ phát triển liên hoàn: Biểu hiện sự biến động về mặt tỷ lệ của hiện tượng giữa hai kỳ liên tiếp. (i=) - Tốc độ phát triển định gốc: Biểu hiện sự biến động về mặt tỷ lệ của hiện tượng giữa kỳ nghiên cứu và kỳ chọn làm gốc. (i=) - Tốc độ phát triển bình quân: Là chỉ tiêu biểu hiện mức độ chung nhất của sự biến động về mặt tỷ lệ của hiện tượng trong suốt thời kỳ nghiên cứu. (i=) Mối liên hệ giữa tốc độ phát triển liên hoàn và định gốc: - Tích các tốc độ phát triển liên hoàn bằng tốc độ phát triển định gốc: (i=) - Thương của hai tốc độ phát triển định gốc liền kề nhau bằng tốc độ phát triển liên hoàn: (i=) 1.2.4 Tốc độ tăng (giảm) Thực chất tốc độ phát triển tăng (giảm) bằng tốc độ phát triển trừ đi 1 (hoặc trừ 100 nếu tính bằng %). Nó phản ánh mức độ của hiện tượng nghiên cứu giữa hai thời kỳ tăng lên hay giảm đi bao nhiêu lần (hoặc %). Nói lên nhịp điệu của sự phát triển theo thời gian. - Tốc độ tăng (giảm) liên hoàn: (i=) - Tốc độ tăng (giảm) định gốc: (i=) - Tốc độ tăng (giảm) bình quân: Phản ánh nhịp điệu tăng (giảm) đại diện trong thời kỳ nhất định và được tính qua tốc dộ phát triển bình quân. 1.2.5 Giá trị tuyệt đối của 1% tăng (giảm) Là chỉ tiêu biểu hiện mối quan hệ giữa chỉ tiêu lượng tăng (giảm tuyệt đối với tốc độ tăng (giảm). Nghĩa là tính xem cứ 1 % tăng (giảm) liên hoàn thì tương ứng với 1 giá trị tuyệt đối tăng giảm là bao nhiêu. Chỉ tiêu này không tính cho tốc độ tăng (giảm) định gốc vì kết quả luôn luôn là hằng số. 1.3 Phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng Xu hướng là yếu tố thường được xem xét đến trước nhất khi nghiên cứu dãy số thời gian. Nghiên cứu xu hướng chủ yếu phục vụ cho mục đích dự đoán trung hạn và dài hạn về một chỉ tiêu kinh tế nào đó. Xuất phát từ yêu cầu đó ta cần sử dụng những biện pháp thích hợp nhằm loại bỏ ảnh hưởng của các nhân tố ngẫu nhiên, nêu rõ xu hướng và tính quy luật của sự phát triển hiện tượng qua thời gian. 1.3.1 Mở rộng khoảng cách thời gian Vận dụng đối với những dãy số thời gian có khoảng cách thời gian tương đối ngắn. Có quá nhiều mức độ và chưa phản ánh được xu hướng phát triển cơ bản của hiện tượng. Nội dung của mở rộng khoảng cách thời gian bằng cách ghép một số thời gian liền nhau vào thành khoảng thời gian ngắn hơn. Tuy nhiên, nó cũng có những hạn chế là chỉ dùng cho những dãy số có nhiều mức độ. Vì khi mở rộng khoảng cách thời gian số lượng các mức độ trong dãy số mất đi rất nhiều. 1.3.2 Phương pháp dãy số bình quân trượt Số bình quân trượt: là số bình quân cộng của một nhóm nhất định các mức độ trong dãy số. Được tính bằng cách loại trừ dần mức độ đầu đồng thời thêm vào các mức độ tiếp theo sao cho số lượng các mức độ tham gia tính số bình quân là không đổi. Dãy số bình quân trượt: là dãy số được hình thành từ các số bình quân trượt. Ví dụ với dãy số thời gian: y1; y2; y3; …; yn (n mức độ). Ta thấy bình quân trượt giản đơn 3 mức độ thì: …. Khi đó ta có dãy số bình quân trượt là: . Tiếp tục trượt lần 2 ta sẽ có dãy số: . Để xác định nhóm bao nhiêu mức độ để tính toán tùy thuộc vào 2 yếu tố là: - Tính chất biến động của hiện tượng. - Số lượng mức độ trong dãy số. Ngoài ra ta cũng có thể dùng phương pháp bình quân trượt có trọng số là giá trị của tam giác Pascal. Trọng số: Bình quân trượt 3 mức độ. 1 2 1 Bình quân trượt 4 mức độ. 1 3 3 1 Bình quân trượt 5 mức độ. 1 4 6 4 1 1.3.3 Phương pháp hồi quy Nội dung Là phương pháp toán học được vận dụng trong thống kê để biểu diễn xu hướng phát triển của những hiện tượng có nhiều dao động ngẫu nhiên, mức độ tăng giảm thất thường. Từ một dãy số thời gian căn cứ vào đặc điểm của biến động trong dãy số, dùng phương pháp hồi quy để xác định trên đồ thị một đường xu thế có tính chất lý thuyết thay cho đường gấp khúc thực tế. Yêu cầu Phải chọn được mô hình mô tả một cách gần đúng nhất xu hướng phát triển của hiện tượng. 1.3.4 Phương pháp chọn dạng hàm - Căn cứ vào quan sát trên đồ thị cộng với phân tích lý luận về bản chất lý luận của hiện tượng. - Có thể dựa vào sai phân (lượng tăng giảm tuyệt đối). - Dựa vào phương pháp bình quân nhỏ nhất (lý thuyết lựa chọn dạng hàm hồi quy của tương quan). Dạng hàm xu thế tổng quát: Trong đó: là giá trị lý thuyết (theo thời gian). Các dạng hàm thường dùng là: 1.3.4.1 Hàm số xu hướng dạng bậc 1 Trong đó: Dạng đồ thị hàm đường thẳng: 1.3.4.2 Hàm xu hướng dạng bậc 2 Trong đó: Hàm đồ thị dạng Parabol: 1.3.4.3 Hàm xu hướng bậc ba Trong đó: Dạng đồ thị bậc 3: 1.3.4.4 Hàm xu hướng dạng mũ Giả sử đường dữ liệu được biểu diễn dưới dạng: Mô hình hàm xu hướng: Lấy log hai vế hàm mũ ta được: lnyt = lnb0 + b1t Áp dụng hàm xu hướng dạng đường thẳng ta được: Trong đó: hay Dạng đồ thị hàm mũ: 1.3.4.5 Hàm xu hướng dạng luỹ thừa Giả sử đường dữ liệu được biểu diễn dưới dạng: Mô hình hàm xu hướng: Áp dụng hàm xu hướng dạng đường thẳng ta được: Trong đó: Dạng đồ thị dạng luỹ thừa: 1.3.4.6 Hàm xu hướng dạng hàm Logarithmic Giả sử đường biểu diễn được biểu diễn dưới dạng: Mô hình hàm xu hướng: Áp dụng hàm xu hướng dạng đường thẳng ta được: Trong đó: Dạng đồ thị hàm Logarithmic: 1.3.5 Biến động thời vụ Khái niệm Biến động thời vụ là hành năm trong khoảng thời gian nhất định có sự biến động được lặp đi lặp lại gây ra tình trạng lúc thì khẩn trương, lúc thì thu hẹp quy mô hoạt động làm ảnh hưởng đến các quy mô ngành kinh tế. Nguyên nhân Do ảnh hưởng của điều kiện tự nhiên và tập quán sinh hoạt của dân cư. Nó ảnh hưởng nhiều nhất đến các ngành như nông nghiệp, du lịch, các ngành chế biến sản phẩm công nghiệp và công nghiệp khai thác…. Hiện tượng biến động thời vụ làm cho việc sử dụng thiết bị và lao động không đồng đều, năng suất lao động khi tăng khi giảm làm giá thành biến động. Ý nghĩa nghiên cứu Giúp nhà quản lý chủ động trong quản lý kinh tế xã hội. Giúp cho việc lập các kế hoạch sản xuất hoặc hoạt động nghiệp vụ thích hợp, hạn chế ảnh hưởng của thời vụ đối với sản xuất và sinh hoạt xã hội. Phương pháp nghiên cứu Dựa vào số liệu trong nhiều năm (ít nhất là 3 năm) theo tháng hoặc theo quý. - Tính chỉ số thời vụ đối với dãy số thời gian có các mức độ tương đối ổn định. Cụ thể là các mức độ cùng kỳ từ năm này sang năm khác không có biểu hiện tăng giảm rõ rệt. Công thức tính: là số bình quân của các mức độ cùng tên i. là số bình quân của các mức độ trong dãy số. Ii là chỉ số thời vụ của thời gian thứ i. + Ý nghĩa: nếu coi mức độ bình quân chung của tất cả các kỳ là 100% thì chỉ số thời vụ của kỳ nào lớn hơn 100% thì đó là lúc “bận rộn” và ngược lại. - Với dãy số thời gian có xu hướng rõ rệt việc tính chỉ số thời vụ phức tạp hơn. Trước hết ta cần điều chỉnh dãy số bằng phương trình hồi quy để tính ra các giá trị lý thuyết rồi sau đó dùng các mức độ này làm căn cứ so sánh và tính chỉ số thời vụ. 1.3.6 Phương pháp phân tích các thành phần của dãy số thời gian. Phương pháp phổ biến nhất là phân tích dãy số thời gian gồm ba thành phần. - Thành phần thứ nhất là hàm xu thế (ft) phản ánh xu hướng cơ bản của hiện tượng kéo dài qua thời gian. - Thành phần thứ hai là biến động thời vụ (st) nó là sự lặp lại của hiện tượng trong khoảng thời gian nhất định hàng năm. - Thành phần thứ ba là biến động ngẫu nhiên (zt). - Ba thành phần trên có thể kết hợp với nhau thành hai dạng. + Dạng kết hợp nhân phù hợp với biến động thời vụ có biên độ biến đổi tăng: + Dạng kết hợp cộng phù hợp với biến động thời vụ có biến động ít: Biến động thời vụ theo tháng: ( tháng , năm ). Biến động ngẫu nhiên có độ lệch bằng 0: Zt=0 Và ba thành phần được kết hợp theo dạng cộng ta có: Trong thực tế Zt rất khó xác định vì vậy nên ta có: Các tham số a,b,ci được xác định băng phương pháp bình phương nhỏ nhất. Dạng tổng quát: Tháng, quý Năm 1 ...... I ... m j.Tj 1 Y11 ... yil ... ym1 ..... J Y1j ... yij ... ymj ... N y1n ... yin ... ymn Cj Trong đó : 1.4 Dự đoán thống kê . 1.4.1 Khái niệm về dự đoán thống kê 1.4.1.1 Khái niệm Theo nghĩa chung nhất, dự đoán là xây dựng thông tin có cơ sở khoa học về mức độ, trạng thái, các quan hệ, xu hướng phát triển … có trong tương lai của hiện tượng. Dự doán Thống kê là thuật ngữ chỉ một nhóm các phương pháp thống kê để xây dựng các dự đoán số lượng. Đây là sự tiếp tục của quá trình phân tích Thống kê trong đó sự vận dụng các phương pháp sẵn có của thống kê để xây dựng các dự đoán số lượng. Mục đích của dự đoán thống kê ngắn hạn là nhằm đưa ra kết quả từ đó làm căn cứ để tiến hành điều chỉnh lập các hoạt động sản xuất kinh doanh, làm sao cho có hiệu quả nhất và kịp thời nhất. 1.4.1.2 Các loại dư báo, tầm dự báo (thời gian dự báo) Có ba loại: - Dự báo ngắn hạn : dưới 3 năm . - Dự báo trung hạn : từ 3 đến 7 năm . - Dự báo dài hạn : trên 10 năm . Thường thì tầm dự báo càng xa , mức độ chính xác càng kém. Dự đoán thống kê ngắn hạn: là dự đoán quá trình tiếp theo của hiện tượng của những khoảng thời gian tương tương đối ngắn, nối tiếp với hiện tại bằng việc sử dụng những thông tin thống kê và áp dụng những phương pháp thích hợp. 1.4.1.3 Các phương pháp dự đoán Phương pháp chuyên gia: xin ý kiến các chuyên gia về lĩnh vực đó. Trên cơ sở đó sử lý ý kiến và đưa ra dự đoán. Phương pháp hồi qui (phương pháp kinh tế lượng) xác định mô hình hồi qui nhiều biến (x1, x2 ,...,xn ). Phương pháp mô hình hoá dãy số thời gian: 1.4.2 Một số phương pháp dự đoán thống kê ngắn hạn trên cơ sở dãy số thời gian 1.4.2.1 Dự đoán dựa vào lượng tăng hoặc giảm tuyệt đối bình quân Phương pháp này có thể sử dụng khi các lượng tăng (giảm) tuyệt đối liên hoàn xấp xỉ bằng nhau. Mô hình dự đoán tổng quát là: Trong đó: Ŷn+L : giá trị dự đoán ở thời điểm n + L yn : giá trị thực tế ở thời điểm n : lượng tăng (giảm) tuyệt đối trung bình L : tầm xa dự đoán 1.4.2.2 Dự đoán dựa vào tốc độ phát triển trung bình. Phương pháp này được áp dụng khi tốc độ phát triển liên hoàn xấp xỉ nhau. Mô hình của dự đoán theo năm: Trong đó: Ŷn+L: giá trị dự đoán ở thời điểm n + L yn : giá trị thực tế ở thời điểm n : lượng tăng (giảm) tuyệt đối trung bình L : tầm xa dự đoán Trong trường hợp có tài liệu của từng quý ta có thể sử dụng mô hình dự đoán. Trong đó: yi,j: Mức độ dự đoán của quý i(i=) của năm J. Yi : Tổng các mức độ của quý i. 1.4.2.3 Ngoại suy hàm xu hướng Từ chiều hướng biến động thực tế của hiện tượng, xác định hàm số hồi qui: . Căn cứ vào hàm số hồi qui đã xây dựng dự đoán mức độ tương lai của hiện tượng. Công thức dự đoán: 1.4.2.4 Dự đoán dựa vào bảng Buys.Ballot (bảng B.B) Mô hình có dạng: Y=a+b.t+cj Trong đó: a: là tham số tự do. b: hệ số hồi quy cj: hệ số thời vụ 1.4.2.5 Các phương pháp dự báo trung bình Phương pháp này thích hợp với các dự báo cần phải được cập nhật hàng tháng, hàng tuần, hàng ngày đối với hàng trăm, hàng ngàn hạng mục như tồn kho, doanh số. Thường thì rất khó dự báo cho từng hạng mục. Chính vì vậy, các phương pháp dự báo giản đơn, ít tốn kém, và nhanh có thể phát triển các kĩ thuật dự báo phức tạp cho từng hạng mục. Chính vì vậy, các phương pháp dự báo giản đơn, ít tốn kém, và nhanh có thể sẽ hữu hiệu cho mục đích dự báo ngắn hạn này. Trung bình giản đơn Mô hình dự báo trung bình giản đơn có thể được biểu hiện qua công thức đơn giản sau đây: Trong đó, t có thể là quan sát cuối cùng trong mẫu hoặc toàn bộ mẫu dữ liệu quá khứ sẳn có. Khi một quan sát mới được thêm vào, thì giá trị dự báo tiếp theo là , chỉ đơn giản là trung bình của và quan sát mới thêm vào. Cho nên khi cập nhật tin tức thì công thức sẽ được điều chỉnh như sau: Phương pháp này chỉ phù hợp với các chuỗi dữ liệu không có biến động lớn, và thuật ngữ thời gian gọi là có tính dừng. Trung bình di động Phương pháp trung bình di động sử dụng một số quan sát gần nhất làm giá trị dự báo. Phương pháp trung bình động cũng thích hợp với các chuỗi dừng. Với hệ số trượt k, trung bình di động bậc k, ký hiệu là MA(k) được thể hiện theo công thức sau đây: Như vậy, trung bình di động cho giai đoạn là giá trị trung bình số học của k quan sát gần nhất. Trong một giá trị trung bình di động, thì trọng số quan sát của mỗi quan sát đều bằng nhau và bằng 1/k. Trung bình di động kép Phương pháp bình quân di động kép nhằm sử dụng dữ liệu chuỗi thời gian có yếu tố xu thế. Bản thân phương pháp này đã có hàm ý như sau: Bước 1. Tính giá trị bình quân di động cho chuổi dữ liệu gốc (MA). Bước 2. Tính giá trị bình quân di động cho chuỗi bình quân di động thứ nhất (MA’). 1.4.2.6 Dự báo bằng các phương pháp san bằng mũ San mũ đơn Trong khi các phương pháp trung bình di động chỉ quan tâm đến các quan sát gần nhất, thì các phương pháp san mũ đơn lại đưa ra một giá trị trung bình di động với trọng số giảm dần cho tất cả các quan sát trong quá khứ. Mô hình san mũ giản đơn thường phù hợp với loại dữ liệu không thể dự đoán được xu hướng tăng hay giảm. Mục tiêu của phương pháp này là ước lượng giá trị trung bình hiện tại và sử dụng giá trị này làm giá trị dự báo cho tương lai. Phương pháp san mũ vẫn dựa trên cơ sở lấy trung bình tất cả các giá trị quá khứ của chuỗi dữ liệu dưới dạng trọng số giảm dần theo hàm mũ. Quan sát gần nhất (với giá trị dự báo) nhận trọng số anpha ()( với 0<<1) lớn nhất, quan sát tiếp theo nhận trọng số tiếp theo nữa nhận trọng số nhỏ hơn nữa, (1-)2, và cứ tiếp diễn như thế cho đến quan sát cuối cùng trong dữ liệu quá khứ. Cách thể hiện đơn giản nhất của phương pháp này được biểu hiện theo công thức sau đây: Trong đó: = giá trị dự báo (mới) ở giai đoạn t+1 = hệ số san mũ = giá trị quan sát hoặc giá trị thực ở giai đoạn t = giá trị dự báo (cũ) ở giai đoạn t Như vậy, ý tưởng của phương pháp san mũ giản đơn cho rằng giá trị dự báo mới là một giá trị trung bình có trọng số thực tế giữa giá trị thực tế và giá trị dự báo ở giai đoạn t. Một khi đã có hệ số san mũ và giá trị dự báo trước đó thì việc ước lượng giá trị dự báo mới trở nên hết sức dễ dàng. San mũ Holt Khác với san mũ đơn, mô hình san mũ Holt được sử dụng đối với dữ liệu có yếu tố xu thế. Hanke (2005) cho rằng bởi vì hầu hết các chuỗi dữ liệu kinh tế và kinh doanh hiếm khi theo một xu thế cố định, nên chúng ta cần xem xét khả năng mô hình hoá các xu thế mang tính cục bộ và có thể được sử dụng cho dự báo tương lai. Khi chuỗi thời gian có yếu tố xu thế (cục bộ), thì chúng ta cần phải dự báo giá trị trung bình (giá trị san mũ) và độ dốc (xu thế) hiện tại để làm cơ sở cho dự báo tương lai. Ý tưởng cơ bản của phương pháp Holt là sử dụng các hệ số san mũ khác nhau để ước lượng giá trị trung bình và độ dốc của chuỗi thời gian (theo mô hình san mũ giản đơn). Trên cơ sở san mũ giản đơn, các hệ số san mũ này sẽ đưa ra các giá trị ước lượng về mức trung bình và độ dốc ngay khi có sẳn một quan sát mới. Nói cách khác, giá trị trung bình hiện tại vẫn là trung bình với các trọng số giảm dần của tất cả các giá trị trung bình quá khứ; và độ dốc hiện tại sẽ là trung bình với trọng số giảm dần của tất cả các độ dốc quá khứ. Phương trình Holt được thể hiện qua ba phương trình sau đây: 1. Ước lượng giá trị trung bình hiện tại: 2. Ước lượng xu thế (độ dốc): 3. Dự báo p giai đoạn trong tương lai: Trong đó: = Giá trị san mũ mới (hoặc giá trị trung bình hiện tại). = Hệ số san mũ của giá trị trung bình (0<<1). = Giá trị quan sát hoặc giá trị thực tế vào thời điểm t. = Hệ số san mũ của giá trị xu thế (0<<1) = Giá trị ước lượng của xu thế. = Thời đoạn dự báo trong tương lai. = Giá trị dự báo p cho giai đoạn trong tương lai. San mũ Winters San mũ Winters là một phương pháp mở rộng của san mũ Holt đổi với các dữ liệu có chứa các yếu tố mùa. Yếu tố mùa trong chuỗi thời gian có thể thuộc dạng phép cộng hoặc phép nhân. Dạng phép cộng có nghĩa là yếu tố mùa ở các năm khác nhau được lặp đi lặp lại một cách đều đặn. Ngược lại, các dạng phép nhân có yếu tố mùa ở năm sau được lặp đi lặp lại nhưng với một cường độ cao hơn hoặc thấp hơn so với từng mùa năm trước. Mô hình san mũ Winters tổng quát nhất là mô hình dạng nhân tính. Mô hình này được ước lượng thông qua bốn phương trình sau đây: 1. Ước lượng giá trị trung bình hiện tại: 2. Ước lượng giá trị xu thế (độ dốc): 3. Ước lượng giá trị chỉ số mùa: 4. Dự báo p giai đoạn trong tương lai: Trong đó: = Giá trị san mũ mới (hoặc giá trị trung bình hiện tại). = Hệ số san mũ của giá trị trung bình (0<<1). = Giá trị quan sát hoặc giá trị thực tế vào thời điểm t. = Hệ số san mũ của giá trị xu thế (0<<1) = Giá trị ước lượng của xu thế. = Thời đoạn dự báo trong tương lai. S = Độ dài của yếu tố mùa = Giá trị dự báo p cho giai đoạn trong tương lai. CHƯƠNG 2. ĐÁNH GIÁ NĂNG SUẤT LÚA TRÀ VINH GIAI ĐOẠN 2000 - 2009 2.1 Đánh giá khái quát năng suất lúa Trà Vinh trong giai đoạn 2000 - 2009 2.1.1 Hệ thống chỉ tiêu thống kê năng suất lúa Năng suất lúa là lượng sản phẩm lúa thu được tính bình quân trên một đơn vị diện tích gieo trồng trong một thời gian nhất định. Đây là chỉ tiêu chất lượng tổng hợp cho phép đánh giá trình độ thâm canh và khả năng mở rộng diện tích gieo trồng. Gồm những chỉ tiêu cơ bản sau: Năng suất tính cho một ha diện tích gieo trồng trong từng thời vụ. Năng suất tính cho một ha diện tích gieo trồng bình quân trong cả năm. Năng suất tính cho một ha diện tích canh tác trong một năm (năng suất đất). Năng suất tính cho một ha diện tích gieo trồng thực tế có thu hoạch: dùng để xác định năng suất cho chu kỳ sản xuất sau. 2.1.2 Điều tra năng suất lúa Do sản xuất lúa trãi trên diện tích rộng nên muốn nắm bắt được kết quả sản xuất ta phải tiến hành điều tra thống kê bằng phương pháp điều tra chọn mẫu như: - Điều tra chọn mẫu điển hình. - Điều tra chọn mẫu máy móc. - Điều tra chọn mẫu theo hộ. Tổng cục Thống kê chủ trương điều tra năng suất và sản lượng lúa theo phương pháp chọn mẫu thống nhất trong cả nước dưới hình thức “Điều tra thực thu hộ gia đình”. 2.1.3 Công thức tính năng suất lúa Với nguồn số liệu về diện tích gieo trồng và sản lượng lúa đầy đủ ta có thể tính được năng suất lúa theo công thức: Sản lượng lúa cả năm (tạ) Diện tích gieo trồng (ha) Năng suất lúa bình quân cả năm (tạ/ha)= Bảng 2.1 Bảng năng suất lúa cả năm phân theo địa phương (đơn vị:tạ/ha) Năm 2000 2001 2002 2003 2004 2005 2006 2007 2008 Sơ bộ 2009 ĐB sông Cửu Long 42,3 42,2 46,2 46,3 48,7 50,4 48,3 50,7 53,6 52,9 Long An 34,7 36,9 40,1 41,8 43,9 45,1 40,8 45,5 47,7 46,6 Tiền Giang 46,1 46,6 48,5 48,6 50,7 51,7 49,0 52,9 53,9 53,1 Bến Tre 35,2 37,7 39,4 39,9 40,7 40,9 40,6 38,2 45,6 44,7 Trà Vinh 39,9 37,5 42,7 44,3 43,9 44,3 44,3 41,5 47,9 46,4 Vĩnh Long 45,1 42,1 45,9 45,2 46,3 47,9 47,4 51,2 50,5 51,6 Đồng Tháp 46,0 48,1 51,1 50,8 53,4 55,7 53,0 56,9 58,1 58,8 An Giang 46,9 46,0 54,4 53,3 57,5 59,3 58,1 60,4 62,2 60,7 Kiên Giang 42,2 39,7 44,8 44,2 48,0 49,4 46,1 51,1 55,6 54,6 Cần Thơ 45,5 44,3 48,5 47,3 52,0 53,2 51,8 54,4 54,8 54,5 Hậu Giang 47,1 48,6 46,8 45,7 50,3 52,0 Sóc Trăng 43,7 43,7 46,3 46,1 48,4 50,8 49,4 49,2 54,0 53,2 Bạc Liêu 41,1 40,8 40,9 41,7 44,7 46,8 47,0 46,2 49,3 48,5 Cà Mau 34,3 31,8 32,2 33,0 30,7 35,3 34,9 34,1 36,3 36,2 Nguồn: Tổng cục thống kê Qua số liệu bảng 2.1 ta thấy năng suất lúa (2000 – 2009) của các tỉnh An Giang, Đồng Tháp, Cần Thơ, Sóc Trăng, Tiền Giang luôn cao hơn mức bình quân của Đồng bằng sông Cửu Long từ 0,1 tạ đến 9,8 tạ/ha. Có thể nói đây là các tỉnh sản xuất lúa tiêu biểu của Đồng bằng sông Cửu Long. Ngoài ra, ta cũng có thể thấy tỉnh Kiên Giang đang thực sự tăng trưởng vượt bậc, năng suất lúa của tỉnh Kiên Giang cao hơn năng suất lúa bình quân của Đồng bằng sông Cửu Long từ 0,4 – 0,7 tạ/ha trong những năm gần đây (2007 – 2009). Hậu Giang, Vĩnh Long là hai tỉnh có năng suất lúa đạt mức gần như trung bình tương đương với mức năng suất bình quân của cả Đồng bằng sông Cửu Long. Hai tỉnh có mức năng suất lúa đạt thấp nhất so với mức bình quân của Đồng bằng sông Cửu Long có thể nói đến là Cà Mau và Bến Tre mức dao động kém từ 4,5 đến 16,7 tạ/ha. Kế đến là tỉnh Bạc Liêu mức dao động kém từ 1,2 đến 4,4 tạ/ha. Trà Vinh và Long An là hai tỉnh có mức năng suất đạt gần như tương đương nhau. Trong đó, mức dao động kém về năng suất của Long An so với mức bình quân năng suất của Đồng bằng sông Cửu Long từ 4,5 – 7,6 tạ/ha, còn mức dao động kém của Trà Vinh là từ 2 – 9,2 tạ/ha. Như vậy, khi nhìn một cách tổng quát trong giai đoạn từ năm 2000 – 2009, có thể thấy được về năng suất lúa đạt được, Trà Vinh kém hơn so 11 tỉnh trong tổng số 13 tỉnh của Đồng bằng sông Cửu Long. Nguyên nhân có thể là do điều kiện tự nhiên không thuận lợi, trình độ canh tác thấp kém chưa có sự tiến bộ vượt bậc trong sản xuất nông nghiệp. Điều này thực sự đòi hỏi tỉnh Trà Vinh nên có những biện pháp thích hợp nhằm cải thiện tình hình năng suất lúa cho những năm tiếp theo. Hình 2.1 Biểu đồ thể hiện năng suất lúa của tỉnh Trà Vinh so với mức bình quân của Đồng bằng sông Cửu Long 2.2 Phân tích sự biến động của năng suất lúa theo thời gian (2000 – 2009) 2.2.1 Phân tích các chỉ tiêu dãy số thời gian Từ số liệu năng suất lúa tỉnh Trà Vinh ta tính được các chỉ tiêu sau: Bảng 2.2 Các chỉ tiêu dãy số thời gian Năm Năng suất lúa Lượng tăng giảm tuyệt đối liên hoàn Lượng tăng giảm tuyệt đối định gốc Tốc độphát triểnliên hoàn (%) Tốc độphát triểnđịnh gốc (%) Tốc độtăng giảmliên hoàn (%) Tốc độtăng giảmđịnh gốc (%) Giá trịtuyệt đốicủa 1%tăng giảm Yi δi ∆i ti Ti ai Ai gi 2000 39,9 2001 37,5 (2,40) (2,40) 93,98 93,98 (6,02) 92,98 0,40 2002 42,7 5,20 2,80 113,87 107,02 13,87 106,02 0,38 2003 44,3 1,60 4,40 103,75 111,03 3,75 110,03 0,43 2004 43,9 (0,40) 4,00 99,10 110,03 (0,90) 109,03 0,44 2005 44,3 0,40 4,40 100,91 111,03 0,91 110,03 0,44 2006 44,3 0,00 4,40 100,00 111,03 0,00 110,03 0,44 2007 41,5 (2,80) 1,60 93,68 104,01 (6,32) 103,01 0,44 2008 47,9 6,40 8,00 115,42 120,05 15,42 119,05 0,42 Sơ bộ 2009 46,4 (1,50) 6,50 96,87 116,29 (3,13) 115,29 0,48 Từ số liệu trên ta có thể tính các trị số trung bình: Năng suất bình quân 43,27 Lượng tăng giảm tuyệt đối bình quân = 0,72 Tốc độ phát triển bình quân = 1,017 Tốc độ tăng (giảm) trung bình = 0,017 Qua kết quả tính toán trên ta có thể thấy năng suất lúa tỉnh Trà Vinh trong giai đoạn 2000 – 2009 có biến động phức tạp. Hình 2.2 Biểu đồ thể hiện sự biến động của năng suất lúa tỉnh Trà Vinh 2000 - 2009 Năng suất lúa qua các năm có sự biến động liên tục nhưng tỷ lệ tăng (giảm) không đều. Từ hình 2.2 ta có thể thấy năng suất lúa năm 2001 đột ngột giảm so với năm 2000, giảm 2,4 tạ/ha tỉ lệ giảm 6,02%, nhưng vào năm 2002 năng suất lại tăng lên đến 42,7 tạ/ha, tỉ lệ tăng 13,87% và tiếp tục tăng trong năm 2003 (tỷ lệ tăng 3,75% so với năm 2002). Từ hình 2.2 ta dễ dàng thấy từ năm 2003 đến 2006 sự biến động của năng suất lúa trong giai đoạn này là không đáng kể. Có thể nói giai đoạn này năng suất của tỉnh Trà Vinh khá ổn định. Để có thể thấy rõ hơn ta có thể phân tích lượng tăng giảm tuyệt đối định gốc trong giai đoạn này, lượng tăng giảm tuyệt đối định gốc vào năm 2003 là 4,4 tạ/ha, năm 2004 là 4,0 tạ/ha, năm 2005 là 4,4 tạ/ha, năm 2006 là 4,4 tạ/ha, như vậy trong giai đoạn này năng suất lúa rất ổn định. Nhưng vào năm 2007 năng suất lúa đột ngột giảm chỉ còn 41,5 tạ/ha, nhưng nó lại tăng mạnh vào năm sau (tăng 6,4 tạ/ha, tỷ lệ tăng 15,42%). Vào năm 2009 năng suất lúa là 46,4 tạ/ha, giảm nhẹ so với năm 2008 (giảm 3,13%). Về chỉ tiêu tốc độ phát triển ta có thể thấy tốc độ phát triển liên hoàn của các năm khá đều nhưng vào các năm 2000, 2004, 2007 và 2009 tốc độ phát triển rất thấp so với tốc độ phát triển bình quân. Nguyên nhân của tình trạng này có thể do cơ sở vật chất, trình độ chuyên môn của nông dân còn hạn chế. Việt Nam chưa cải thiện được tình hình sản xuất lạc hậu của nước ta, sử dụng sức lao động của con người là chính, còn phụ thuộc quá nhiều nhiều vào thiên nhiên. Để tăng năng suất ta cần hiện đại hóa sản xuất, sử dụng những thiết bị hiện đại vào sản suất, nâng cao trình độ chuyên môn cho nông dân, hạn chế đến mức thấp nhất sự ảnh hưởng của thời tiết đến sản xuất. 2.2.2 Biểu diễn xu hướng phát triển năng suất lúa tỉnh Trà Vinh bằng hàm xu hướng Dùng phần mềm SPSS ta tìm mô hình xu hướng phù hợp nhất: Năm Yi t 2000 39,9 1 2001 37,5 2 2002 42,7 3 2003 44,3 4 2004 43,9 5 2005 44,3 6 2006 44,3 7 2007 41,5 8 2008 47,9 9 Sơ bộ 2009 46,4 10 Với mô hình , ta có kết quả: Model Summary R R Square Adjusted R Square Std. Error of the Estimate 0,760 0,577 0,525 2,093 The independent variable is time. ANOVA Sum of Squares df Mean Square F Sig. Regression 47,880 1 47,880 10,931 0,011 Residual 35,041 8 4,380 Total 82,921 9 The independent variable is time. Coefficients Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta t 0,762 0,230 0,760 3,306 0,011 (Constant) 39,080 1,430 27,334 0,000 Từ kết quả trên ta xây dựng được mô hình đường thẳng sau: Ŷ = 39,08 + 0,762t Sai số chuẩn: SE = 2,093 Sig (b1)=0,011 (nhỏ hơn 0,05), do đó hệ số hồi quy b1 có ý nghĩa thống kê ở độ tin cậy 95%. Hệ số xác định: R2 = 0,577. Điều này cho thấy trong 100% sự biến động của năng suất thì có 57,7% biến động của biến năng suất Y là được giải thích bởi mô hình Ŷ = 39,08 + 0,762t; 42,3% còn lại là do các yếu tố ngẫu nhiên và các yếu tố khác không có trong mô hình. Thống kê F bằng 10,931 với Sig. bằng 0,011 (nhỏ hơn 0,05), điều này cho ta kết luận rằng mô hình này phù hợp với dữ liệu. v Với mô hình , ta có kết quả: Model Summary R R Square Adjusted R Square Std. Error of the Estimate 0,772 0,596 0,480 2,188 The independent variable is time. ANOVA Sum of Squares Df Mean Square F Sig. Regression 49,408 2 24,704 5,160 0,042 Residual 33,513 7 4,788 Total 82,921 9 The independent variable is time. Coefficients Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta t 1,353 1,075 1,350 1,259 0,248 t ** 2 -0,054 0,095 -0,606 -0,565 0,590 (Constant) 37,897 2,573 14,726 0,000 Từ kết quả thu được trên ta thu được mô hình sau: Ŷ = 37,897 + 1,353t – 0,054t2 Sai số chuẩn: SE = 2,188 Sig (b1)=0,248 (lớn hơn 0,05), do đó hệ số hồi quy b1 không có ý nghĩa thống kê ở độ tin cậy 95%. Sig (b2)=0,590 (lớn hơn 0,05), cho nên hệ số hồi quy b2 không có ý nghĩa thống kê ở độ tin cậy 95%. Hệ số xác định: R2 = 0,596. Điều này cho thấy trong 100% sự biến động của năng suất thì có 59,6% biến động của biến năng suất Y là được giải thích bởi mô hình Ŷ = 37,897 + 1,353t – 0,054t2; 40,4% còn lại là do các yếu tố ngẫu nhiên và các yếu tố khác không có trong mô hình. Thống kê F = 5,160 với Sig.= 0,042 (nhỏ hơn 0,05), cho thấy mô hình này vẫn phù hợp với dữ liệu. Tuy nhiên, mức độ phù hợp thực sự rất thấp. v Với mô hình Model Summary R R Square Adjusted R Square Std. Error of the Estimate 0,796 0,634 0,451 2,249 The independent variable is t. ANOVA Sum of Squares df Mean Square F Sig. Regression 52,566 3 17,522 3,463 0,091 Residual 30,355 6 5,059 Total 82,921 9 The independent variable is t. Coefficients Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta T 3,787 3,272 3,777 1,157 0,291 t ** 2 -0,581 0,675 -6,545 -0,861 0,422 t ** 3 0,032 0,040 3,621 0,790 0,460 (Constant) 35,153 4,365 8,053 0,000 Ta có mô hình hàm bậc 3 như sau: Ŷ = 35,153 + 3,787t – 0,581t2 + 0,032t3 Sai số chuẩn: SE = 2,249 Sig (b1)=0,291 (lớn hơn 0,05), do đó hệ số hồi quy b1 không có ý nghĩa thống kê ở độ tin cậy 95%. Sig (b2)=0,422 (lớn hơn 0,05), nên hệ số hồi quy b2 không có ý nghĩa thống kê ở độ tin cậy 95%. Sig (b3)=0,46 (lớn hơn 0,05), nên hệ số hồi quy b3 cũng không có ý nghĩa thống kê ở độ tin cậy 95%. Điều này có thể kết luận, mô hình hàm bậc ba Ŷ = 35,153 + 3,787t – 0,581t2 + 0,032t3 không có ý nghĩa thống kê kinh tế. Hệ số xác định: R2 = 0,634. Điều này cho thấy trong 100% sự biến động của năng suất thì có 63,4% biến động của biến năng suất Y là được giải thích bởi mô hình Ŷ = 35,153 + 3,787t – 0,581t2 + 0,032t3; 36,6% còn lại là do các yếu tố ngẫu nhiên và các yếu tố khác không có trong mô hình. Tuy nhiên, ta thấy thống kê F = 3,463 với Sig.= 0,91 (lớn hơn 0,05), cho thấy mô hình này thực sự không phù hợp với dữ liệu được sử dụng cho đề tài. v Mô hình dạng ,ta có kết quả: Model Summary R R Square Adjusted R Square Std. Error of the Estimate 0,767 0,588 0,536 0,049 The independent variable is t. ANOVA Sum of Squares df Mean Square F Sig. Regression 0,027 1 0,027 11,411 0,010 Residual 0,019 8 0,002 Total 0,046 9 The independent variable is t. Coefficients Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta ln(t) 0,075 0,022 0,767 3,378 0,010 (Constant) 38,561 1,420 27,164 0,000 The dependent variable is ln(Yi). Ta có mô hình hàm xu hướng dạng lũy thừa như sau: Ŷ = 38,561.t0,075 Sai số chuẩn: SE = 0,049 Hệ số b1 có ý nghĩa thống kê ở độ tin cậy 95%, vì Sig.(b1)= 0,01(nhỏ hơn 0,05). Hệ số xác định: R2 = 0,588. Điều này cho thấy trong 100% sự biến động của năng suất thì có 58,8% biến động của biến năng suất Y là được giải thích bởi mô hình Ŷ = 38,561.t0,075; 41,2% còn lại là do các yếu tố ngẫu nhiên và các yếu tố khác không có trong mô hình. Ta thấy mô hình hàm hồi quy có dạng: Ŷ = 38,561.t0,075 Qua dạng hàm trên ta thấy năng suất lúa có xu hướng tăng nhưng tốc độ tăng sẽ giảm dần. Điều này cũng phù hợp với thực tế vì năng suất lúa có giới hạn nhất định do chịu ảnh hưởng của các yếu tố sinh học và điều kiện tự nhiên. Thống kê F = 11,411 với Sig.= 0,01 (nhỏ hơn 0,05), cho thấy mô hình này thực sự phù hợp với dữ liệu. v Mô hình dạng , ta có kết quả: Model Summary R R Square Adjusted R Square Std. Error of the Estimate 0,767 0,589 0,537 2,065 The independent variable is t. ANOVA Sum of Squares Df Mean Square F Sig. Regression 48,822 1 48,822 11,454 0,010 Residual 34,099 8 4,262 Total 82,921 9 The independent variable is t. Coefficients Unstandardized Coefficients Standardized Coefficients T Sig. B Std. Error Beta ln(t) 3,177 0,939 0,767 3,384 0,010 (Constant) 38,471 1,561 24,643 0,000 Ta xây dựng được mô hình Logarithmic sau: Ŷ = 38,471 + 3,177lnt Sai số chuẩn: SE = 2,065 Hệ số b1 có ý nghĩa thống kê ở độ tin cậy 95%, vì Sig.(b1)= 0,01(nhỏ hơn 0,05). Hệ số xác định: R2 = 0,589. Điều này cho thấy trong 100% sự biến động của năng suất thì có 58,9% biến động của biến năng suất Y là được giải thích bởi mô hình Ŷ = 38,471 + 3,177lnt; 41,1% còn lại là do các yếu tố ngẫu nhiên và các yếu tố khác không có trong mô hình. Thống kê F = 11,454 với Sig.= 0,01 (nhỏ hơn 0,05), cho thấy mô hình này thực sự phù hợp với dữ liệu. v Mô hình dạng , ta có kết quả sau: Model Summary R R Square Adjusted R Square Std. Error of the Estimate 0,754 0,569 0,515 0,050 The independent variable is t. ANOVA Sum of Squares df Mean Square F Sig. Regression 0,026 1 0,026 10,547 0,012 Residual 0,020 8 0,002 Total 0,046 9 The independent variable is t. Coefficients Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta t 0,018 0,005 0,754 3,248 0,012 (Constant) 39,144 1,332 29,391 0,000 The dependent variable is ln(Yi). Ta xây dựng hàm xu hướng dạng hàm mũ: Ŷ = 39,144 .e0,018t Sai số chuẩn: SE = 0,05 Hệ số b1 có ý nghĩa thống kê ở độ tin cậy 95%, vì Sig.(b1)= 0,012 (nhỏ hơn 0,05). Hệ số xác định: R2 = 0,569. Điều này cho thấy trong 100% sự biến động của năng suất thì có 56,9% biến động của biến năng suất Y là được giải thích bởi mô hình Ŷ = 39,144 .e0,018t; 41,1% còn lại là do các yếu tố ngẫu nhiên và các yếu tố khác không có trong mô hình. Thống kê F = 10,547 với Sig.= 0,01 (nhỏ hơn 0,05), cho thấy mô hình này thực sự phù hợp với dữ liệu. Bảng 2.3 Tóm tắt kết quả các hàm xu hướng Tên hàm Mô hình SE 1. Hàm xu hướng bậc 1 Ŷ = 39,08 + 0,762t 2,093 2. Hàm xu hướng bậc 2 Ŷ = 37,897 + 1,353t – 0,054t2 2,188 3. Hàm xu hướng bậc 3 Ŷ = 35,153 + 3,787t – 0,581t2 + 0,032t3 2,249 4. Hàm xu hướng dạng lũy thừa Ŷ = 38,561. t0,075 0,049 5. Hàm xu hướng dạng Logarithmic Ŷ = 38,471 + 3,177lnt 2,065 6. Hàm xu hướng dạng hàm mũ Ŷ = 39,144. e0,018t 0,05 Kết luận Qua phân tích 6 hàm xu hướng ở trên, ta thấy hàm xu hướng bậc 3 không phù hợp với dữ liệu, hàm bậc 2 phù hợp ở mức độ rất thấp. Còn lại bốn mô hình là hàm xu hướng bậc 1, hàm xu hướng dạng lũy thừa, hàm xu hướng dạng Logarithmic, hàm xu hướng dạng hàm mũ là thực sự phù hợp. Tuy nhiên, qua bảng tóm tắt so sánh mức sai số chuẩn SE ở trên, ta thấy sai số chuẩn SE của hàm xu hướng dạng lũy thừa dạng Ŷ = 38,561.t0,075 là có giá trị nhỏ nhất (SE = 0,049). Vậy mô hình lũy thừa là thích hợp nhất để phản ánh xu hướng biến động năng suất lúa tỉnh Trà Vinh trong giai đoạn 2000 – 2009. CHƯƠNG 3. DỰ BÁO NĂNG SUẤT LÚA 2010 – 2012 3.1 Ngoại suy bằng các mức độ bình quân 3.1.1 Ngoại suy bằng lượng tăng (giảm) tuyệt đối bình quân Bảng 3.1 Lượng tăng giảm tuyệt đối Năm Năng suất lúa Lượng tăng giảm tuyệt đối liên hoàn Yi δi 2000 39,9 2001 37,5 (2,40) 2002 42,7 5,20 2003 44,3 1,60 2004 43,9 (0,40) 2005 44,3 0,40 2006 44,3 0,00 2007 41,5 (2,80) 2008 47,9 6,40 Sơ bộ 2009 46,4 (1,50) Từ bảng 3.1 ta tính được lượng tăng giảm tuyệt đối bình quân ; . Suy ra: Dự đoán cho 3 năm tiếp theo ta có kết quả như sau: Năm 2010: y2010 = 46,4 + 0,72 × 1 = 47,12 (tạ/ha) Năm 2011: y2011 = 46,4 + 0,72 × 2 = 47,84 (tạ/ha) Năm 2012: y2012 = 46,4 + 0,72 × 3 = 48,56 (tạ/ha) Kết quả của phương pháp này cho thấy năng suất lúa của tỉnh có tăng nhưng mức độ tăng chậm. Hơn thế nữa giá trị của lượng tăng giảm tuyệt đối liên hoàn trong dãy số chênh lệch nhau rất nhiều. Vì vậy ta thấy kết quả của phương pháp này không mấy chính xác. 3.1.2 Ngoại suy bằng tốc độ phát triển bình quân Bảng 3.2 Tốc độ phát triển của năng suất lúa tỉnh Trà Vinh Năm Năng suất lúa Tốc độ phát triểnliên hoàn (%) Yi ti 2000 39,9 2001 37,5 93,98 2002 42,7 113,87 2003 44,3 103,75 2004 43,9 99,10 2005 44,3 100,91 2006 44,3 100,00 2007 41,5 93,68 2008 47,9 115,42 Sơ bộ 2009 46,4 96,87 Từ số liệu bảng 3.2 ta tính được tốc độ phát triển bình quân ; Suy ra: Ta tiến hành dự đoán 3 năm tiếp theo: Năm 2010: y2010 = 46,4 × (1,017)1 = 47,19 (tạ/ha) Năm 2011: y2011 = 46,4 × (1,017)2 = 47,99 (tạ/ha) Năm 2012: y2012 = 46,4 × (1,017)3 = 48,80 (tạ/ha) Theo phương pháp này ta thấy kết quả năng suất lúa theo dự đoán tăng quá chậm nên kết quả có thể chưa chính xác. Nguyên nhân có thể do tốc độ tăng trưởng trong dãy số tăng không đều; tốc độ tăng trưởng trong dãy số có những năm tăng cao nhưng cũng có những năm giảm rất mạnh mà chúng ta lại lấy tốc độ phát triển bình quân để dự đoán, vì thế làm cho kết quả dự doán không được chính xác. 3.2 Ngoại suy hàm xu thế Ở phần trên ta đã trình bày phương pháp biểu diễn xu thế biến động của năng suất lúa và ta đã tìm được hàm xu thế phù hợp nhất ( có SE nhỏ nhất) đó là hàm lũy thừa với mô hình tổng quát . Qua tính toán trên SPSS ta có mô hình hàm xu hướng lũy thừa sau Ŷ = 38,561. t0,075. Ta tiến hành dự đoán cho 3 năm tiếp theo và có kết quả như sau: Bảng 3.3 Kết quả dự đoán của hàm xu thế Đơn vị tính: tạ/ha NĂM Yi FIT_1 LCL_1 UCL_1 2000 39,9 38,56 33,50 44,39 2001 37,5 40,61 35,84 46,02 2002 42,7 41,86 37,14 47,18 2003 44,3 42,77 38,02 48,13 2004 43,9 43,49 38,66 48,93 2005 44,3 44,09 39,16 49,64 2006 44,3 44,60 39,56 50,28 2007 41,5 45,05 39,90 50,86 2008 47,9 45,45 40,19 51,39 2009 46,4 45,81 40,44 51,88 2010 . 46,13 40,67 52,34 2011 . 46,44 40,86 52,77 2012 . 46,71 41,04 53,17 Kết quả dự đoán có 2 loại: - Dự đoán điểm: ký hiệu là fit_1 cho biết năng suất lúa trong những năm 2010, 2011, 2012 lần lượt là 46,13 (tạ/ha); 46,44 (tạ/ha); 46,71 (tạ/ha). - Dự đoán khoảng: ký hiệu lcl_1 là cận dưới, ucl_1 là cận trên. Như vậy với khoảng tin cậy 95% thì năng suất lúa trong các năm như sau: + Năm 2010 năng suất lúa tỉnh Trà Vinh nằm trong khoảng từ 40,67 (tạ/ha) đến 52,34 (tạ/ha). + Năm 2011 năng suất lúa tỉnh Trà Vinh nằm trong khoảng từ 40,86 (tạ/ha) đến 52,77 (tạ/ha). + Năm 2012 năng suất lúa tỉnh Trà Vinh nằm trong khoảng từ 41,04 (tạ/ha) đến 53,17 (tạ/ha). Hình 3.1 So sánh sự biến động năng suất lúa thực tế với lý thuyết Từ hình 3.1 ta có thể nhận thấy dự đoán điểm cho kết quả dự đoán khác xa với thực tế. Sự biến động của năng suất lúa thực tế và lý thuyết chênh lệch nhau rất nhiều, đây là một khuyết điểm của dự đoán điểm vì không cho ta một kết quả với một khoảng tin cậy nhất định nào đó, từ đó cho thấy mô hình dự đoán điểm của hàm xu hướng không phù hợp. Để khắc phục người ta tiến hành dự đoán khoảng. Vì vậy chúng ta nhận kết quả của dự đoán khoảng với độ chính xác 95%. 3.3 Dự đoán bằng các phương pháp san mũ 3.3.1 Phương pháp san mũ giản đơn Dùng SPSS ta có kết quả: Model Description Model Name MOD_1 Series 1 nsuat Simple Model Trend None Seasonality None Applying the model specifications from MOD_1 Smallest Sums of Squared Errors Series Model rank Alpha (Level) Sums of Squared Errors Yi 1 0,00000 82,92100 2 0,40000 84,29830 3 0,50000 84,66604 4 0,30000 84,97598 5 0,60000 85,87500 6 0,20000 86,51371 7 0,10000 87,23316 8 0,70000 87,77469 9 0,80000 90,36142 10 0,90000 93,74476 Smoothing Parameters Series Alpha (Level) Sums of Squared Errors df error Yi 0,00000 82,92100 9 Shown here are the parameters with the smallest Sums of Squared Errors. These parameters are used to forecast. Với kết quả trên ta nhận α = 0 và nó cho ta SSE = 82,921 là nhỏ nhất. 3.3.2 Phương pháp san mũ Holt Model Description Model Name MOD_31 Series 1 nsuat Holt's Model Trend Linear Seasonality None Applying the model specifications from MOD_31 Initial Smoothing State Yi Level 39,53889 Trend 0,72222 Smallest Sums of Squared Errors Series Model rank Alpha (Level) Gamma (Trend) Sums of Squared Errors Yi 1 0,00000 1,00000 35,75142 2 0,00000 0,80000 35,75142 3 0,00000 0,60000 35,75142 4 0,00000 0,40000 35,75142 5 0,00000 0,20000 35,75142 6 0,00000 0,00000 35,75142 7 0,10000 0,00000 39,10786 8 0,10000 0,20000 40,16749 9 0,10000 0,40000 41,40651 10 0,10000 0,60000 42,78813 Smoothing Parameters Series Alpha (Level) Gamma (Trend) Sums of Squared Errors df error Yi 0,00000 0,00000 35,75142 8 Shown here are the parameters with the smallest Sums of Squared Errors. These parameters are used to forecast. Kết quả từ SPSS cho thấy với α = 0 và γ = 0 cho ta ESS = 35,75142 là nhỏ nhất. 3.3.3 Mô hình dạng phi tuyến với hàm xu thế là hàm mũ và không có biến động thời vụ Ta có kết quả SPSS như sau: Model Description Model Name MOD_7 Series 1 nsuat Model Trend Exponential Seasonality None Applying the model specifications from MOD_7 Initial Smoothing State Yi Level 41,15700 Trend 0,93985 Smallest Sums of Squared Errors Series Model rank Alpha (Level) Gamma (Trend) Sums of Squared Errors Yi 1 0,70000 0,40000 115,77778 2 0,80000 0,40000 116,84602 3 0,90000 0,20000 119,21503 4 0,60000 0,40000 119,45182 5 0,80000 0,20000 120,26830 6 0,70000 0,60000 122,10544 7 1,00000 0,20000 122,53800 8 0,90000 0,40000 122,83811 9 0,60000 0,60000 123,09134 10 0,70000 0,20000 126,32169 Smoothing Parameters Series Alpha (Level) Gamma (Trend) Sums of Squared Errors df error Yi 0,70000 0,40000 115,77778 8 Shown here are the parameters with the smallest Sums of Squared Errors. These parameters are used to forecast. Với kết quả trên ta có α = 0 và γ = 0 cho ESS = 115,77778 là nhỏ nhất. 3.3.4 Mô hình dạng phi tuyến với hàm Damped và không có biến động thời vụ Ta có kết quả SPSS như sau: Model Description Model Name MOD_30 Series 1 nsuat Model Trend Damped Seasonality None Applying the model specifications from MOD_30 Initial Smoothing State Yi Level for Phi (Trend Mod.) at 0,100 36,28889 Trend for Phi (Trend Mod.) at 0,100 7,22222 Smallest Sums of Squared Errors Series Model rank Alpha (Level) Gamma (Trend) Phi (Trend Mod.) Sums of Squared Errors Yi 1 0,60000 1,00000 0,10000 80,92883 2 0,60000 0,80000 0,10000 80,95810 3 0,60000 0,60000 0,10000 81,03070 4 0,60000 0,40000 0,10000 81,14867 5 0,60000 0,20000 0,10000 81,31427 6 0,70000 0,00000 0,10000 81,45239 7 0,60000 0,00000 0,10000 81,53001 8 0,70000 0,20000 0,10000 81,60583 9 0,70000 0,40000 0,10000 81,80935 10 0,70000 0,60000 0,10000 82,06135 Smoothing Parameters Series Alpha (Level) Gamma (Trend) Phi (Trend Mod.) Sums of Squared Errors df error Yi 0,60000 1,00000 0,10000 80,92883 8 Shown here are the parameters with the smallest Sums of Squared Errors. These parameters are used to forecast. Với α = 1 và γ = 1 cho ESS = 80,92883 là nhỏ nhất. Bảng 3.4 Bảng tóm tắt các mô hình dự đoán bằng san bằng mũ Mô hình α Γ ESS Mô hình san mũ giản đơn 0 - 82,921 Mô hình san mũ Holt 0 0 35,75142 Mô hình dạng phi tuyến với hàm xu thế là hàm mũ và không có biến động thời vụ 0 0 115,77778 Mô hình dạng phi tuyến với hàm Damped và không có biến động thời vụ 1 1 80,92883 Từ bảng 3.3 ta thấy mô hình dạng tuyến tính và không có mùa vụ (San mũ Holt) là có kết quả ESS nhỏ nhất (ESS = 35,75142) với α và tối ưu lần lượt là 0, 0 nên ta tiến hành dự đoán theo mô hình đó. Kết quả dự đoán như sau: Bảng 3.5 Bảng dự báo năng suất lúa của tỉnh Trà Vinh theo mô hình san mũ Holt NĂM Yi DỰ BÁO 2000 39,9 40,21 2001 37,5 40,84 2002 42,7 41,46 2003 44,3 42,09 2004 43,9 42,72 2005 44,3 43,35 2006 44,3 43,97 2007 41,5 44,60 2008 47,9 45,23 2009 46,4 45,86 2010 46,49 2011 47,11 2012 47,74 Hình 3.3 Mô hình dự báo năng suất lúa tỉnh Trà Vinh theo mô hình san mũ Holt Bảng 3.6 Bảng dự đoán năng suất lúa tỉnh Trà Vinh Đơn vị: tạ/ha Năm Năng suất lúa thực tế Dự đoán điểm Hàm xu thế San bằng mũ 2000 39,9 38,56 40,21 2001 37,5 40,61 40,84 2002 42,7 41,86 41,46 2003 44,3 42,77 42,09 2004 43,9 43,49 42,72 2005 44,3 44,09 43,35 2006 44,3 44,60 43,97 2007 41,5 45,05 44,60 2008 47,9 45,45 45,23 2009 46,4 45,81 45,86 2010 46,13 46,49 2011 46,44 47,11 2012 46,71 47,74 Quan sát các kết quả thu được từ các phương pháp dự đoán ta nhận thấy: kết quả thu được từ phương pháp dự đoán hàm xu thế cho kết quả là dự đoán điểm 2004, 2005, 2006 gần như sát với thực tế. Với phương pháp san bằng mũ kết quả không được như vậy nên ta có quyền nghi ngờ kết quả dự đoán không chính xác. Nhưng ta cũng không thể khẳng định phương pháp dự đoán bằng hàm xu thế là tốt hơn. Đây chỉ là những kết quả khi phân tích định lượng và giả định rằng xu hướng vận động của năng suất lúa dự báo trong quá khứ, hiện tại sẽ vẫn được tiếp tục duy trì trong tương lai, do đó, kết quả dự đoán này vẫn không thể đánh giá được hết biến động của năng suất lúa. Là vì các nguyên nhân tác động đến năng suất lúa trong quá khứ, hiện tại và tương lai là không giống nhau. Ngoài ra năng suất lúa trong thực tế còn phụ thuộc rất nhiều vào điều kiện tự nhiên, trình độ khoa học kĩ thuật nông nghiệp trong tương lai. Giả sử nếu xảy ra thiên tai, lũ lụt thì tổn thất về năng suất lúa là không thể ước tính được. Hay khi trình độ khoa học kĩ thuật nông nghiệp được nâng cao vượt bậc thì việc nâng suất lúa đạt kết quả cao hơn những dự đoán là chuyện đương nhiên. Do đó, một vấn đề cần lưu ý khi thực hiện dự báo là đôi khi cần phải kết hợp các dự báo định lượng và định tính với nhau nhằm có một kết quả dự báo chính xác hơn. KẾT LUẬN Trong khi nền công nghiệp nước ta còn chưa bắt kịp với thế giới thì để hoàn thành mục tiêu công nghiệp hoá hiện đại hoá đất nước vào năm 2020 thì chúng ta cần phải dựa vào ngành nông nghiệp trong những năm tới. Việc tăng năng suất và sản lượng phục vụ cho chiến lược xuất khẩu các mặt hàng nông nghiệp luôn là hướng đi đúng đắn của nền kinh tế. Với bài nghiên cứu này em hy vọng các vấn đề cơ bản về năng suất lúa sẽ được giải quyết một phần nào và sẽ là một tài liệu để các nhà quản lý tham khảo. Những biến động về năng suất lúa trong tương lai đã được dự đoán trước nhưng đó chỉ là số liệu ban đầu. Chúng ta cần phải điều chỉnh lại qua thảo luận lại với các chuyên gia mới có thể áp dụng vào thực tế. Việc chỉ dùng phương pháp dãy số thời gian để phân tích năng suất lúa có thể chỉ cho thấy cái nhìn ở một góc độ nào đó. Vì vậy khi áp dụng vào thực tế chúng ta cần nghiên cứu kĩ điều kiện áp dụng của nó.

Các file đính kèm theo tài liệu này:

thong_ke_kinh_te.doc
loi_mo_dau.doc