CHƯƠNG 1 2
1.1 Vài trò của dự báo phụ tải ngắn hạn trong công tác điều độ 2
1.2 Các yếu tố ảnh hưởng trực tiếp đến phụ tải ngày 3
1.3 Phương hướng nghiên cứu dự báo phụ tải 4
CHƯƠNG 2 5
2.1 Đặc điểm của biểu đồ phụ tải ngày 5
2.2 Dự báo phụ tải ngắn hạn cho 24 giờ sau 6
2.2.1 Kiểu của đồ thị phụ tải 7
2.2.2 Đỉnh và đáy của biểu đồ phụ tải 9
2.2.3 Dự báo phụ tải cho 24 giờ sau 9
CHƯƠNG 3 10
3.1 Giới thiệu về mạng nơron 10
3.1.1 Lịch sử phát triển 10
3.1.2 Ứng dụng 11
3.1.3 Căn nguyên sinh học[6] 11
3.2 Nơron nhân tạo[6] 12
3.3 Hàm xử lý[6] 13
3.3.1 Hàm kết hợp 13
3.3.2 Hàm kích hoạt (hàm chuyển) 13
3.4 Cấu trúc của mạng nơ ron 15
3.4.1 Mạng truyền thẳng 15
3.4.2 Mạng hồi qui 15
3.5 Luật học[6] 16
3.5.1 Học có thầy: 16
3.5.2 Học không có thầy: 16
3.6 Hàm mục tiêu 16
CHƯƠNG 4 18
4.1 Kiến trúc cơ bản[6] 18
Mạng truyền thẳng 18
4.2 Khả năng biểu diễn 19
4.3 Vần đề thiết kế cấu trúc mạng[6] 19
4.3.1 Số lớp ẩn 19
4.3.2 Số nơron trong lớp ẩn 20
4.4 Thuật toán lan truyền ngược (Back – Propagation) 20
4.4.1 Mô tả thuật toán 20
4.4.2 Sử dụng thuật toán lan truyền ngược 21
CHƯƠNG 5 23
5.1 Đặt vấn đề 23
5.2 Các bước thực hiện 23
5.2.1 Thu thập dữ liệu 23
5.2.2 Phân tích dữ liệu 24
5.2.3 Xử lý dữ liệu 24
5.2.4 Chương trình dự báo phụ tải 26
CHƯƠNG 6 KẾT LUẬN 39
42 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 2418 | Lượt tải: 3
Bạn đang xem trước 20 trang tài liệu Đề tài Tìm hiểu xây dựng chương trình dự báo phụ tải điện, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ều chỉnh các nguồn tua-bin khí, nhiệt điện, thủy điện nhằm đảm bảo vận hành kinh tế, tránh cho nhà máy thủy điện Hòa Bình vận hành trong công suất không cho phép về kỹ thuật. Trong đó phụ tải lúc cao điểm Pmax là khâu quan trọng nhất trong ngày.
Giải quyết tốt vấn đề cung cấp điện có vai trò và ý nghĩa vô cùng lớn, vì vậy việc áp dụng và nghiên cứu mô hình dự báo khác nhau nhằm tìm ra mô hình dự báo tối ưu cho vấn đề dự báo phụ tải là việc rất cần thiết.
Các yếu tố ảnh hưởng trực tiếp đến phụ tải ngày
Mục tiêu cuối cùng của tất cả các dự báo là kết quả dự báo phải bám sát giá trị thực tế. Muốn có dự báo ngày với sai số nhỏ, phải chọn phương pháp dự báo tối ưu.
Các yếu tố ảnh hưởng đến phụ tải ngày:
Thứ của ngày trong tuần: giá trị phụ tải giờ trong các ngày làm việc thường cao hơn phụ tải của các ngày nghỉ cuối tuần.
Thời tiết trong ngày: thời tiết trong ngày bao gồm các thông số: nhiệt độ, độ ẩm, tốc độ gió và hướng gió,… trong các thông số đó nhiệt độ là yếu tố ảnh hưởng trực tiếp đến phụ tải. Có thể xem phụ tải là một hàm số phụ thuộc vào nhiệt độ. Giữa phụ tải và nhiệt độ có mối quan hệ là nhiệt độ tăng thì phụ tải tăng và ngược lại.
Ngày đặc biệt trong năm: Ngày đặc biệt trong năm là các ngày lễ, ngày tết, như ngày tết âm lịch, tết dương lịch, ngày 30/4 và 1/5, ngày 2/9,… Phụ tải những ngày này trên toàn quốc giảm rất nhiều so với ngày thường.
Kế hoạch sửa chữa lớn trong ngày có cắt điện phụ tải: Hiện nay, trong quá trình thực hiện các kế hoạch sửa chữa lớn, như cải tạo các trạm biến áp 220KV, cắt điện đường dây đang vận hành để kéo đường dây mới,…, vẫn phải cắt phụ tải diện rộng, dẫn đến điện năng tiêu thụ vào các ngày(giờ) này giảm một cách đáng kể. Dự báo phụ tải những ngày này phải tính toán khấu trừ phụ tải giảm do ngừng cung cấp điện. Dạng của biểu đồ phụ tải trong ngày có cắt điện diện rộng cũng mang đặc thù riêng, thay đổi tùy thuộc vào thời gian, vùng, miền cắt điện.
Qua số liệu thống kê, quá trình nghiên cứu thực tế và kinh nghiệm vận hành, các nhà nghiên cứu, các chuyên gia điều độ đi đến kết luận: nhiệt độ môi trường, và đặc thù ngày đang xét (ngày đặc biệt, ngày nghỉ cuối tuần, ngày lễ, ngày đặc biệt) là các biến ảnh hưởng mạnh nhất đến giá trị phụ tải ngày.
Phương hướng nghiên cứu dự báo phụ tải
Cũng như các dự báo khác, dự báo phụ tải ngày cũng phải dựa vào số liệu thống kê, phân tích và áp dụng thuật toán để xác định mối quan hệ giữa phụ tải và các yếu tố ảnh hưởng, từ đó dự báo phụ tải dựa trên các yếu tố ảnh hưởng đó.
Trước đây, các mô hình toán học truyền thống hay được áp dụng cho dự báo như: Hồi qui tuyến tính (linear regression), san trung bình(moving averages), hệ số ngẫu nhiên(stochastic), san hàm mũ(expodential smoothing), AGRIMA (Autoregressive Intergarated Moving Average),…
Nghiên cứu phương pháp dự báo phụ tải ngày là nghiên cứu và áp dụng các phương pháp để tìm quan hệ giữa phụ tải ngày và các yếu tố chủ yếu ảnh hưởng đến phụ tải ngày. Việc áp dụng mạng nơron nhân tạo cho dự báo phụ tải của hệ thống điện Việt Nam dựa trên các yêu cầu: phương pháp đơn giản, có tính đến ảnh hưởng của biến nhiệt độ và đặc thù ngày, cho dự báo với sai số nhỏ.
PHƯƠNG PHÁP LUẬN GIẢI QUYẾT BÀI TOÁN
DỰ BÁO PHỤ TẢI NGẮN HẠN THEO PHƯƠNG PHÁP HAI GIAI ĐOẠN
Đặc điểm của biểu đồ phụ tải ngày
Phụ tải ngày hệ thống điện Việt Nam là phụ tải có thành phần điện sinh hoạt và dịch vụ chiếm tỷ lệ khá cao. Việc giảm tỷ trọng điện năng tiêu thụ trong công nghiệp và tăng tỷ trọng tiêu thụ trong sinh hoạt làm chế độ tiêu thụ điện năng xấu đi, hệ số phụ tải giảm, đồ thị phụ tải nhọn hơn, gây nhiều khó khăn cho việc đảm bảo an toàn cung cấp điện.
Hình 2.1 là đồ thị phụ tải ngày hệ thống điện Quốc gia được xây dựng theo giá trị phụ tải của 24 giờ trong ngày. Đồ thị trên hình biến thiên theo giá trị phụ tải từng giờ, phụ tải Pmax lớn gấp 2 ÷ 3 lần so với Pmin. Phụ tải Pmax thường xảy ra vào 19h – 20h vào mùa hè, 18h – 19h vào mùa đông. Thấp điểm Pmin xảy ra vào ban đêm khoảng 3h – 4h vào mùa hè, 2h – 3h vào mùa đông.
Hình 2. 1 Đồ thị phụ tải ngày hệ thống điện Quốc gia
Trong quá trình vận hành của trung tâm Điều độ, phụ tải cao điểm (Pmax) và phụ tải thấp điểm (Pmin) là hai điểm quan trọng nhất trong đồ thị phụ tải ngày. Phụ tải cao điểm và thấp điểm quyết định huy động nguồn và điều chỉnh phối hợp thủy điện và nhiệt điện trong lập phương thức ngày trong điều hành hệ thống điện.
Vào cao điểm tối phụ tải tăng đặc biệt nhanh
Huy động các nguồn điện đắt tiền như tua-bin khí chạy dầu phải trước cao điểm tối thời gian ít nhất là 30 phút để khởi động và nâng dần công suất.
Khi thiếu nguồn mới huy động tua-bin khí chạy dầu sẽ không kịp gây tần số thấp và sa thải phụ tải do rơle tần số thấp tác động.
Trong trường hợp sự cố thiếu nguồn, người ta cần phải dự báo công suất thiếu để chuẩn bị trước phương án cắt tải sau đó phối hợp với các điều độ miền phân bổ công suất cần phải cắt cho các điều độ lưới điện phân phối. Cắt tải có chuẩn bị trước thường ít gây thiệt hại về kinh tế hơn do rơ – le tần số thấp tác động.
Vào thấp điểm đêm phụ tải giảm rất thấp
Cần phải điều chỉnh các nguồn tua-bin khí chạy dầu, nhiệt điện sao cho các tổ máy của thủy điện Hòa Bình không vận hành trong vùng công suất không cho phép bảo đảm vận hành an toàn các tổ máy và thỏa mãn các chỉ tiêu về kinh tế.
Nếu dự báo chính xác được Pmax và Pmin , người ta có thể huy động và điều chỉnh nguồn hợp lý, cũng như vận hành hệ thống điện an toàn và hiệu quả.
Dự báo phụ tải ngắn hạn cho 24 giờ sau
Mục đích của dự báo phụ tải cho 24 giờ sau là đưa ra các giá trị phụ tải dự báo theo từng giờ sát với thực tế. Nói cách khác giảm sai số là vấn đề quan trọng trong quá trình dự báo.
Quá trình phân tích, so sánh đồ thị phụ tải của hệ thống điện Việt Nam trong một thời gian dài cho thấy kiểu biểu đồ phụ tải ngày chủ yếu bị ảnh hưởng bởi các thói quen tổ chức sinh hoạt, cách phân công sắp xếp công việc của khách hàng. Nghĩa là kiểu biểu đồ phụ tải có mối liên quan chặt chẽ với môi trường hoạt động, ngày tháng (làm việc, nghỉ ngơi, lễ tết, hội hè,…) của riêng từng khách hang và của cả cộng đồng. Còn đáy và đỉnh phụ tải lại là hàm của các biến thời tiết như nhiệt độ, độ ẩm, mây, lượng mưa, vận tốc và hướng gió.
Nói cách khác, kiểu của biểu đồ phụ tải và giá trị đỉnh, đáy phụ thuộc vào các yếu tố tương đối độc lập với nhau. Điều này có ý nghĩa vô cùng quan trọng đối với vấn đề dự báo phụ tải ngắn hạn. Dựa vào đặc điểm này chúng ta sẽ phân quá trình dự báo phụ tải thành hai giai đoạn dự báo khác nhau. Biểu đồ phụ tải sẽ được xác định hoàn toàn nếu ta xác định được kiểu của biểu đồ phụ tải, giá trị đỉnh và giá trị đáy của biểu đồ phụ tải. Do đó, bài toán dự báo phụ tải được chia thành hai bài toán nhỏ:
Xác định kiểu biểu đồ phụ tải ngày cần dự báo
Dự báo đỉnh và đáy biểu đồ phụ tải ngày cần dự báo
Kiểu của đồ thị phụ tải
Xét đồ thị phụ tải hệ thống điện hình 2.2, đây là biểu đồ phụ tải hệ thống điện Quốc gia ngày làm việc 12 – 6 – 2003 được xây dựng theo giá trị phụ tải của 24 giờ trong ngày. Giá trị phụ tải phân bố không đều, dạng biểu đồ nhọn và sự chênh lệch giữa 2 giá trị đỉnh và đáy rất lớn.
Hình 2. 2 Đồ thị phụ tải ngày 12 – 6 – 2003 của hệ thống điện Quốc gia
Đặt: giá trị phụ tải của giờ thứ I là P(i), với i=1,24, giá trị phụ tải đỉnh là Pmax, giá trị phụ tải đáy là Pmin.
Rõ ràng giá trị phụ tải Pmax, Pmin và phụ tải theo từng giờ của các ngày khác nhau sẽ có giá trị khác nhau.
Để thu được kiểu biểu đồ phụ tải ngày chuẩn, ta sẽ qui chuẩn phụ tải từng giờ theo công thức:
Pni=Pi-PminPmax-Pmin, với i=1,24
P(i) là phụ tải qui chuẩn của giờ thứ i.
Dựa trên giá trị phụ tải qui chuẩn thu được của 24 giờ trong ngày, ta xây dựng được biểu đồ phụ tải ngày chuẩn hóa. Đồ thị phụ tải này còn được gọi là véctơ biểu đồ phụ tải.
Nếu đặt véctơ biểu đồ phụ tải là P, ta có:
P=[p1,p2,..,p24]T=[Pn1,Pn2,…,Pn24]T
Với Pn(i) là phụ tải được chuẩn hóa của giờ thứ i.
Hình 2.3 là đồ thị phụ tải ngày chuẩn hóa, biều đồ phụ tải được qui chuẩn vẫn giữ nguyên dạng biến thiên của mình và các giá trị phụ tải được qui chuẩn nằm trong khoảng [0, 1]. Đặc điểm này không phụ thuộc vào giá trị đỉnh và đáy của biểu đồ phụ tải trong ngày được qui chuẩn nhận các giá trị lớn hay nhỏ đến mức nào.
Hình 2. 3 Đồ thị phụ tải ngày 12 – 6 – 2003 đã chuẩn hóa
Đỉnh và đáy của biểu đồ phụ tải
Xác định hai giá trị đặc biệt trên đồ thị phụ tải, phụ tải cao điểm và phụ tải thấp điểm là mục tiêu quan trọng hàng đầu của người làm công tác dự báo. Tính kinh tế, hiệu quả, phương thức vận hành điều độ trong ngày cũng như hướng đầu tư phát triển trong tương lai của hệ thống điện phụ thuộc rất lớn vào độ chính xác của việc dự báo hai giá trị này.
Sau khi xác định được hai giá trị quan trọng Pmax và Pmin các giá trị phụ tải giờ khác trong ngày sẽ được xác định theo mối quan hệ của chúng đối với đỉnh và đáy của biểu đồ phụ tải thông qua kiểu biểu đồ phụ tải của ngày dự báo.
Dự báo phụ tải cho 24 giờ sau
Nếu biết:
Dạng biểu đồ phụ tải chuẩn (xác định được Pn(i), với i=1,24 )
Xác định được Pmax, Pmin của biểu đồ phụ tải trong ngày.
Ta sẽ tính được phụ tải của từng giờ trong ngày theo công thức:
Pi= Pmin+Pmax-PminPn(i)
CÁC KHÁI NIỆM CƠ BẢN VỀ MẠNG NƠRON
Giới thiệu về mạng nơron
Lịch sử phát triển
Dưới đây là các mốc đáng chú ý trong lịch sử phát triển của mạng nơron[6]:
Cuối thế kỷ 19 đầu thế kỷ 20 sự phát triển chủ yếu chỉ là những công việc có sự tham gia của cả ba ngành Vật lý học, Tâm lý học và thần kinh học. Các công trình nghiên cứu của họ chủ yếu đi sâu vào các lý thuyết tổng quát về HỌC, NHÌN và lập luận,… và không đưa ra các mô hình toán học cụ thể mô tả hoạt động của các nơron.
Mọi chuyện thực sự bắt đầu vào những năm 1940 với công trình của Warren McCulloch và Walter Pitts. Họ chỉ ra rằng về nguyên tắc, mạng của các nơron nhân tạo có thể tính toán bất kỳ một hàm số học hay logic nào.
Tiếp theo là Donald Hebb, ông đã phát biểu rằng việc thuyết lập luận cổ điển (như Pavlov) đưa ra là hiện thực bởi do các thuộc tính của từng nơron riêng biệt, ông cũng nêu ra một phương pháp học của các nơron nhân tạo.
Ứng dụng thực nghiệm đầu tiên của các nơron nhân tạo có được vào cuối những năm 50 cùng với phát minh của mạng nhận thức và luật học tương ứng bởi Frank Rosenblatt. Mạng này có khả năng nhận dạng các mẫu. Điều này đã mở ra rất nhiều hy vọng cho việc nghiên cứu mạng nơron.
Cùng thời gian đó, Bernard Widrow và Marcian Hoff đã đưa ra một thuật toán học mới và sử dụng nó để huấn luyện cho các mạng tuyến tính thích nghi, mạng có cấu trúc và chức năng tương tự như mạng của Rosenblatt. Luật học Widrow – Hoff vẫn còn được sử dụng cho đến ngày nay.
Tuy nhiên cả Rosenblatt và Widrow – Hoff đều cùng vấp phải một vấn đề do Marvin Minsky và Seymour Papert phát hiện ra, đó là các mạng nhận thức chỉ có khả năng giải quyết được các bài toán tách được tuyến tính. Họ cố gắng cải tiến luật học và mạng để có thể vượt qua được hạn chế này nhưng họ đã không thành công trong việc cải tiến luật học để có thể huấn luyện được các mạng có cấu trúc phức tạp hơn.
Do những kết quả của Minsky Papert nên việc nghiên cứu về mạng nơron gần như bị chững lại trong suốt một thập kỷ 70 do nguyên nhân là không có được các máy tính đủ mạnh để có thể thực nghiệm..
Vào những năm 80, việc nghiên cứu mạng nơron phát triển rất mạnh mẽ cùng với sự ra đời của PC. Có hai khái niệm mới liên quan đến sự hồi sinh này, đó là:
Việc sử dụng các phương pháp thống kê để giải thích hoạt động của một lớp các mạng hồi qui có thể được dùng như bộ nhớ liên hợp trong công trình của nhà vật lý học John Hopfield.
Sự ra đời của thuật toán lan truyền ngược để luyện các mạng nhiều lớp được một vài nhà nghiên cứu độc lập tìm ra như: David Rumelhart, James Mc Celland, đó cũng là câu trả lời cho Minsky – Papert.
Ứng dụng
Trong quá trình phát triển, mạng nơron đã được ứng dụng trong rất nhiều lĩnh vực[6]:
Tài chính: Định giá bất động sản, cho vay, kiểm tra tài sản cầm cố, đánh giá mức độ hợp tác, phân tích đường tín dụng, ...
Ngân hàng: Bộ đọc séc và các tài liệu, tính tiền của thẻ tín dụng.
Giải trí: Hoạt hình, các hiệu ứng đặc biệt.
Bảo hiểm: Đánh giá việc áp dụng chính sách, tối ưu hóa sản phẩm.
Điện tử học: Dự báo mã tuần tự, sơ đồ chip IC, điều khiển tiến trình, nhận dạng tiếng nói, mô hình phi tuyến.
Quốc phòng: Định vị - phát hiện vũ khí, dò mục tiêu, phát hiện đối tượng, nhận dạng nét mặt, các bộ cảm biến thế hệ mới, xử lý ảnh,…
Tự động: Các hệ thống dẫn đường tự động cho ôtô, các bộ phân tích hoạt động của xe.
Hàng không: Phi công tự động, giả lập đường bay, các hệ thống điều khiển lái máy bay, bộ phát hiện lỗi.
Căn nguyên sinh học[6]
Bộ não con người chứa khoảng 1011 các phần tử liên kế chặt chẽ với nhau (khoảng 104 liên kết đối với mỗi phần tử) gọi là các nơron. Dưới con mắt của những người làm công tác tin học, một nơron được cấu tạo bởi các thành phần: tế bào hình cây (dendrite) – tế bào thân (cell body) và sợi trục thần kinh (axon). Tế bào hình cây có nhiệm vụ mang các tín hiệu điện tới tế bào thân, tế bào thân sẽ thực hiện gộp và phân ngưỡng các tín hiệu đến. Sợi trục thần kinh làm nhiệm vụ đưa tín hiệu từ tế bào thân ra bên ngoài.
Điểm tiếp xúc giữa sợi trục thần kinh của nơron này và tế bào hình cây của một nơron khác được gọi là khớp thần kinh (synapse). Sự sắp xếp của các nơron và mức độ mạnh yếu của các khớp thần kinh được quyết đinh bởi các quá trình hóa học phức tạp, sẽ thiết lập chức năng của mạng nơron.
Một vài nơron có sẵn từ khi sinh ra, các phần khác được phát triển thông qua việc học, ở đó có sự thiết lập các liên kết mới và loại bỏ các liên kết cũ.
Cấu trúc của mạng nơron luôn luôn phát triển. Các thay đổi sau này có khuynh hướng bao gồm chủ yếu là việc làm tăng hay giảm độ mạnh của các mối liên kết thông qua các khớp thần kinh.
Mạng nơron nhân tạo không tiếp cận đến sự phức tạp của bộ não. Mặc dù vậy, có hai sự tương quan cơ bản giữa mạng nơron nhân tạo và sinh học. Thứ nhất, cấu trúc khối tạo thành chúng đều là các thiết bị tính toán đơn giản, được liên kết chặt chẽ với nhau. Thứ hai, các liên kết giữa các nơron quyết định chức năng của mạng.
Cần chú ý rằng mặc dù mạng nơron sinh học hoạt động rất chậm so với các linh kiện điện tử (10-3 giây so với 10-9 giây), nhưng bộ não có khả năng thực hiện nhiều công việc nhanh hơn nhiều so với các máy tính thông thường. Đó một phần là do cấu trúc song song của mạng nơron sinh học: toàn bộ các nơron hoạt động một cách đồng thời tại một thời điểm. Mạng nơron nhân tạo cũng chia sẻ đặc điểm này.
Nơron nhân tạo[6]
Một nơron nhân tạo (Hình 3.1), còn được gọi là một đơn vị xử lý hay một nút, thực hiện một chức năng: nhận tín hiệu vào từ một nguồn bên ngoài hay từ các đơn vị phía trước và tính tín hiệu ra từ các tín hiệu vào sau đó lan truyền sang các đơn vị khác
Hình 3. 1 Đơn vị xử lý thứ j
Ở đây:
xi: là các đầu vào
wij: các trọng số tương ứng với các đầu vào
θj: ngưỡng của nơron thứ j
aj: tổng đầu vào của nơron thứ j (net input)
zj: đầu ra của nơron thứ j
g(.): hàm chuyển (hàm kích hoạt)
Một nơron trong mạng có thể có nhiều đầu vào (x1, x2,…, xn) nhưng chỉ có một đầu ra zj. Đầu vào của một nơron có thể là từ bên ngoài mạng, hoặc đầu ra của một nơron khác, hay là đầu ra của chính nó.
Trong mạng nơron có ba kiểu nơron:
Nơron đầu vào, nhận tín hiệu từ bên ngoài
Nơron ẩn, tín hiệu vào và ra của nó nằm trong mạng
Nơron đầu ra, gửi tín hiệu ra bên ngoài.
Hàm xử lý[6]
Hàm kết hợp
Hàm kết hợp thực hiện nhiệm vụ kết hợp các giá trị đưa vào nơron thông qua các liên kết với các nơron khác, sinh ra một giá trị gọi là net input. Tổng đầu vào nơron j là tổng trọng số của các đầu ra từ các nơron cộng thêm ngưỡng hoặc độ lệch θj :
aj=i=1nwjixi+θj
Nếu wji>0 nơron được coi là ở trạng thái kích thích. Nếu wji<0 nơron ở trạng thái kiềm chế.
Hàm kích hoạt (hàm chuyển)
Quá trình biến đổi giá trị aj thành tín hiệu đầu ra zj được thực hiện bởi hàm kích hoạt zj=g(aj). Hàm kích hoạt thường bị ép vào một khoảng giá trị xác định. Các hàm kích hoạt hay được sử dụng là:
Hàm tuyến tính (Linear function) g(x)=x
Hình 3. 2 Hàm tuyến tính
Hàm bước nhị phân (Binary step function, Hard limiter function)
Đầu ra của hàm này được giới hạn 1 trong 2 giá trị:
gx=1 if(x≥θ)0 if(x≤θ)
Trong hình sau θ được chọn bằng 0
Hình 3. 3 Hàm bước nhị phân
Hàm Sigmoid (Sigmoid function)
gx=11+e-x
Hàm này rất thuận lợi khi sử dụng cho các mạng được huấn luyện bằng thuật toán lan truyền ngược BP, bởi vì nó dễ đạo hàm, do đó nó có thể giảm đáng kể tính toán trong qua trình huấn luyện. Hàm này được ứng dụng cho các bài toán mà các đầu ra mong muốn rơi vào khoảng [0, 1].
Hình 3. 4 Hàm Log – Sigmoid
Hàm Sigmoid lưỡng cực (Bipolar Sigmoid function)
Hàm này có các đặc trưng tương tự hàm Sigmoid. Nhưng được ứng dụng cho các bài toán có đầu ra mong muốn rơi vào khoảng [-1, 1].
gx=1-e-x1+e-x
Hình 3. 5 Hàm Sigmoid lưỡng cực
Hàm kích hoạt của các nơron ẩn là cần thiết để biểu diễn sự phi tuyến vào trong mạng. Lý do là hợp của các hàm đồng nhất là một hàm đồng nhất. Mặc dù vậy nó mang tính chất phi tuyến làm cho các mạng nhiều tầng có khả năng biểu diễn các ánh xạ phi tuyến rất tốt. Tuy nhiên đối với luật học lan truyền ngược, hàm phải khả vi(đạo hàm) và sẽ có ích nếu hàm được gắn trong một khoảng nào đó. Do vậy hàm Sigmoid là một lựa chọn thông dụng nhất.
Cấu trúc của mạng nơ ron
Cấu trúc của mạng nơron được xác định bởi: số lớp, số nơron trên mỗi lớp, và sự liên kết giữa các nơ ron.
Mạng truyền thẳng
Dòng dữ liệu từ nơron đầu vào đến nơron đầu ra chỉ được truyền thẳng. Không có các liên kết từ nơron đầu ra đến các nơron đầu vào trong cùng một lớp hay của các lớp trước đó.
Hình 3. 6 Mạng nơ ron truyền thẳng nhiều lớp
Mạng hồi qui
Có chứa các liên kết ngược, nghĩa là các nơron lớp ra tới nơron lớp vào trong cùng một lớp hoặc các lớp trước đó.
Hình 3. 7 Mạng hồi qui
Luật học[6]
Thành phần quan trọng nhất và không thể thiếu của mạng nơ ron đó là luật học, được dùng để điều chỉnh các trọng số để mạng nhận biết được quan hệ giữa đầu vào và đích mong muốn. Có nhiều thuật toán học đã được phát minh để tìm ra tập trọng số tối ưu để làm giải pháp cho các bài toán. Các thuật toán đó có thể chia làm nhóm chính: học có thầy (học có giám sát) và học không có thầy (học không có giám sát).
Học có thầy:
Mạng được huấn luyện dựa trên tập ví dụ huấn luyện (các cặp mẫu đầu vào x và đầu ra mong muốn t). Sự khác biệt giữa các đầu ra thực tế với đầu ra mong muốn được thuật toán sử dụng để điều chỉnh thông số. Điều này thường được đưa ra như một bài toán xấp xỉ hàm số - cho dữ liệu huấn luyện, mục đích là tìm ra hàm f(x) thỏa mãn tất cả các mẫu học đầu vào.
Hình 3. 8 Mô hình học có thầy – học có giám sát
Học không có thầy:
Với phương pháp học không có thầy không có phản hồi từ môi trường để chỉ ra rằng đầu ra của mạng là đúng hay sai. Mạng sẽ phải khám phá các đặc trưng, các điều chỉnh, các mối tương quan, hay các lớp trong dữ liệu vào một các tự động động. Trong thực tế, phần lớn các biến thể của học không có thầy, các đích trùng với đầu vào. Nói cách khác, học không có thầy luôn thực hiện một công việc tương tự như một mạng tự liên hợp, cô đọng thông tin từ dữ liệu vào.
Hàm mục tiêu
Để huấn luyện một mạng và xét xem nó thực hiện tốt đến đâu, ta cần xây dựng một hàm mục tiêu để cung cấp cách thức đánh giá khả năng của hệ thống. Việc chọn hàm mục tiêu là rất quan trọng bởi vì hàm này thể hiện các mục tiêu thiết kế và quyết định thuật toán huấn luyện nào có thể được sử dụng. Để xây dựng một hàm mục tiêu đo được chính xác cái chúng ta muốn không phải là việc dễ dàng. Trong số những hàm cơ bản được sử dụng rộng rãi là hàm tổng bình phương lỗi (sum of squares error function)
E=1NQq=1Qi=1N(tqi-yqi)2
Trong đó:
Q: số ví dụ trong tập ví dụ huấn luyện.
N: số đơn vị đầu ra.
tqi: đầu ra mong muốn của nơ ron ra i trên ví dụ thứ q
yqi: đầu ra thực tế của nơ ron ra i trên ví dụ thứ q.
MẠNG NƠ RON TRUYỀN THẲNG VÀ THUẬT TOÁN LAN TRUYỀN NGƯỢC
Kiến trúc cơ bản[6]
Kiến trúc mạng truyền thẳng nhiều lớp là kiến trúc chủ đạo của các mạng nơron hiện tại. Mặc dù có khá nhiều biến thể nhưng đặc trưng của kiến trúc này là cấu trúc và thuật toán là đơn giản và nhanh (Master 1993).
Mạng truyền thẳng
Mạng truyền thẳng nhiều lớp bao gồm một lớp vào, một hoặc nhiều lớp ẩn và một lớp ra. Các nơ ron đầu vào thực chất không phải là nơ ron đúng nghĩa, bởi lẽ chúng không thực hiện bất kỳ một tính toán nào trên dữ liệu vào, đơn giản nó chỉ tiếp nhận các dữ liệu vào và chuyển cho các lớp kế tiếp. Các nơ ron ở lớp ẩn và lớp ra mới thực sự thực hiện các tính toán, kết quả được định dạng bởi hàm kích hoạt của nơ ron đầu ra.
Hình 4. 1 Mạng nơ ron truyền thẳng nhiều lớp
Trong đó:
P: ma trận đầu vào (R hàng, 1 cột).
Wi: ma trận trọng số của các nơron lớp thứ i.
bi: ma trận độ lệch của lớp thứ i.
ni: tổng liên kết đầu vào (net input).
fi: hàm kích hoạt của lớp thứ i.
ai: ma trận đầu ra của lớp thứ i.
Å: hàm tính tổng liên kết đầu vào.
Mỗi liên kết gắn với một trọng số, trọng số này được điều chỉnh trong quá trình tín hiệu đi qua liên kết đó. Trọng số dương thể hiện trạng thái kích thích, các trọng số âm thể hiện trạng thái kiềm chế. Mỗi nơron tính toán mức kích hoạt của chúng bằng cách tính tổng các đầu vào và đưa đến hàm kích hoạt. Khi tất cả các nơron trong một lớp mạng cụ thể đã tính toán xong đầu ra thì lớp kế tiếp có thể bắt đầu thực hiện, bởi vì đầu ra của lớp hiện tại chính là đầu vào của lớp kế tiếp. Khi tất cả các nơron của mạng đã thực hiên xong tính toán thì đầu ra của nơ ron lớp ra là kết quả của mạng. Tuy nhiên, có thể chưa là kết quả yêu cầu, khi đó một thuật toán huấn được áp dụng để điều chỉnh các tham số của mạng.
Khả năng biểu diễn
Chẳng hạn[7]:
Mạng một lớp có khả năng biểu diễn các hàm tách được tuyến tính, chẳng hạn hàm logic AND có thể phân chia được bằng một đường thẳng trong khi miền giá trị của hàm XOR thì không.
Mạng có hai lớp ẩn có khả năng biểu diễn một đường phân chia tùy ý với một độ chính xác bất kỳ với các hàm kích hoạt phân ngưỡng và có thể xấp xỉ bất kỳ ánh xạ mịn nào với độ chính xác bất kỳ với các hàm kích hoạt có có dạng Sigmoid.
Mạng có một lớp ẩn có thể xấp xỉ tốt bất kỳ một ánh xạ liên tục nào từ một không gian hữu hạn sang một không gian hữu hạn khác, chỉ cần cung cấp số nơ ron trong lớp ẩn.
Vần đề thiết kế cấu trúc mạng[6]
Về mặt lý thuyết có tồn tại một mạng có thể mô phỏng một bài toán với độ chính xác bất kỳ. Tuy nhiên để có thể tìm ra được mạng này không phải là điều đơn giản. Với một bài toán cụ thể để xác định chính xác một kiến trúc mạng như: cần bao nhiêu lớp ẩn, mỗi lớp ẩn cần bao nhiêu nơ ron là một công việc hết sức khó khăn.
Số lớp ẩn
Về mặt lý thuyết, các mạng có hai lớp ẩn có thể biểu diễn các hàm với dáng điệu bất kỳ, nên không có lý do nào sử dung mạng có nhiều hơn hai lớp ẩn. Người ta đã xác định rằng đối với phần lớn các bài toán cụ thể, chỉ cần sử dụng một lớp ẩn là đủ. Các bài toán sử dụng hai lớp ẩn hiếm khi xảy ra trong thực tế. Việc huấn luyện mạng thường rất chậm khi sử dụng nhiều lớp ẩn. Lý do:
Phần lớn các thuật toán luyện mạng cho các mạng nơ ron truyền thằng đều dựa trên phương pháp gradient. Các lớp thêm vào sẽ thêm việc phải lan truyền các lỗi làm cho véctơ gradient rất không ổn định.
Số các cực trị địa phương tăng lên rất lớn khi có nhiều lớp ẩn. Phần lớn các thuật toán tối ưu dựa trên gradient chỉ có thể tìm ra các cực trị địa phương, do vậy chúng có thể không tìm ra cực trị toàn cục. Mặc dù thuật toán luyện mạng có thể tìm ra cực trị toàn cục, nhưng xác suất khá cao là chúng ta sẽ bị tắc trong một cực trị địa phương.
Tuy nhiên, có thể đối với một bài toán cụ thể, sử dụng nhiều hơn một lớp ẩn với số ít nơron thì tốt hơn là sử dụng ít lớp ẩn với số nơ ron là lớn, đặc biệt đối với các mạng cần phải học các hàm không liên tục. Về tổng thể người ta cho rằng việc đầu tiên là nên xem xét mạng chỉ có một lớp ẩn. Nếu dùng một lớp ẩn với một lượng lớn các nơ ron mà không có hiệu quả thì nên sử dụng thêm một lớp ẩn nữa với một số ít các nơ ron.
Số nơron trong lớp ẩn
Vấn đề quan trọng trong thiết kế một mạng là mỗi tầng cần có bao nhiêu nơron. Số nơron trong mỗi lớp quá ít có thể dẫn đến việc không thể nhận dạng được tín hiệu đầy đủ trong một tập dữ liệu phức tạp, hay thiếu ăn khớp. Sử dụng quá nhiều nơron sẽ tăng thời gian luyện mạng.
Số lượng thích hợp các nơron ẩn phụ thuộc vào rất nhiều yếu tố như: số đầu vào, số đầu ra của mạng, số trường hợp trong tập mẫu, độ nhiễu của dữ liệu đích, độ phức tạp của hàm lỗi, kiến trúc mạng và thuật toán luyện mạng.
Có rất nhiều luật để lựa chọn số nơron trong các lớp ẩn (xem [10]), chẳng hạn:
m∈[l,n] nằm giữa khoảng kích thước lớp vào, lớp ra.
m=2(l+n)3 23 tổng kích thước lớp vào và lớp ra
m<2l nhỏ hơn hai lần kích thước lớp vào
m=l.n căn bậc 2 của tích kích thước lớp vào và lớp ra
Thuật toán lan truyền ngược (Back – Propagation)
Mô tả thuật toán
THUẬT TOÁN LAN TRUYỀN NGƯỢC
Bước 1: Lan truyền xuôi đầu vào qua mạng
a0=p
am+1=fm+1Wm+1am+bm+1, với m=0,M-1
a=aM
Bước 2: Lan truyền độ nhạy cảm (lỗi) ngược lại qua mạng:
sM=-2FMnMt-a
sm=Fmnm(Wm+1)Tsm+1, với m=M-1,1
Bước 3: Cuối cùng, các trọng số và độ lệch được cập nhật bởi công thức sau:
Wmk+1=Wmk-αsm(am-1)T
bmk+1=bmk-αsm
Sử dụng thuật toán lan truyền ngược
Chọn lựa cấu trúc mạng
Như ta đã biết, thuật toán lan truyền ngược có thể được sử dụng để xấp xỉ bất kỳ một hàm số học nào nếu như ta có đủ số nơron trong lớp ẩn. Mặc dù vậy, phát triển trên chưa cho ta được một số cụ thể các lớp và số nơ ron trong mỗi lớp cần sử dụng.
Ví dụ: xấp xỉ hàm số sau
fx=1+siniπ4xvới-2≤x≤2
Lớp ẩn sử dụng hàm sigmoid, lớp ra dùng hàm đồng nhất
sigmoidx=11-e-x và gx=x
Số nơ ron trong lớp ẩn là 4, với kết quả xấp xỉ của mạng như sau
Hình 2. 4 i = 1
Hình 2. 5 i = 2
Hình 2. 6 i = 4
Hình 2. 7 i = 8
Các đường màu đen là trả lời của mạng, còn các đường mờ hơn là hàm xấp xỉ
Từ hình ta thấy khi tăng số nơ ron trong lớp ẩn lên thì khả năng xấp xỉ hàm số của mạng sẽ tốt hơn. Điều đó có nghĩa là nếu muốn xấp xỉ một hàm số mà số điểm cần xấp xỉ là lớn thì ta sẽ cần số nơ ron lớn hơn trong lớp ẩn.
Sự hội tụ
Trong phần trên ta thấy các trường hợp mạng nơ ron không trả lời chính xác mặc dù thuật toán lan truyền ngược đã thực hiện tối thiểu hóa trung bình bình phương lỗi. Điều đó là do khả năng của mạng bị giới hạn bởi số nơ ron trong lớp ẩn.
Sự tổng quát hóa
Trong phần lớn các trường hợp, mạng nơ ron truyền thẳng nhiều lớp được luyện bởi một số cố định các mẫu xác định sự hoạt động đúng của mạng:
p1,t1,…,pQ,tQ
Trong đó:
Pi: là đầu vào
Ti: là đầu ra mong muốn
Tập huấn luyện này thông thường là thể hiện của số lớn nhất các lớp có thể cặp. Một điều rất quan trọng là mạng nơ ron có khả năng tổng quát hóa được từ những cái nó đã học. Nếu có được điều đó, mặc dù dữ liệu có nhiễu thì mạng vẫn có khả năng hoạt động tốt (trả lại kết quả gần với đích mong muốn)
ỨNG DỤNG MẠNG NƠ RON TRUYỀN THẲNG TRONG DỰ BÁO PHỤ TẢI ĐIỆN
Đặt vấn đề
Để thiết lập một mạng nơ ron huấn luyện ta cần quan tâm tới: Số lớp ẩn, kích thước lớp ẩn, Ma trận trọng số, hệ số điều chỉnh Bias, kiểu dữ liệu đầu vào và ra của mạng, dạng hàm nén.
Thường thì dữ liệu lịch sử đặc trưng của dự báo phụ tải thì các số liệu mang giá trị nguyên và lớn, trong khi kiểu dữ liệu tiêu chuẩn của đầu vào mạng là dạng số thực có giá trị nhỏ. Bởi vì đó là đặc trưng của mạng nơ ron cho nên trước khi dữ liệu thô được đưa vào huấn luyện ta phải qua bước chuẩn hóa dữ liệu.
Nếu dữ liệu đầu vào được cung cấp ở nhiều thời điểm khác nhau thì cũng mạng cũng đạt được một tỉ lệ chính xác ở mức tương ứng, rất khó để đảm bảo dự báo chính xác hoàn toàn.
Các bước thực hiện
Thu thập dữ liệu
Trước tiên ta phải xác định xem các dữ liệu nào là cần thiết để có thể giải quyết bài toán và phải đảm bảo được các yêu cầu sau:
· Các dữ liệu chắc chắn có liên quan đến bài toán.
Tiền xử lý
Huấn luyện mạng
Hậu xử lý
Thu thập dữ liệu
· Các dữ liệu nào có thể liên quan.
· Các dữ liệu nào là phụ trợ.
Các dữ liệu có liên quan và có thể liên quan đến bài toán cần phải được xem là các đầu vào cho hệ thống.
Trong một số trường hợp, ta có thể chọn lựa dữ liệu tương tự từ các tình huống thực tế. Ta cần phải ước đoán số lượng dữ liệu cần thiết để có thể sử dụng trong việc xây dựng mạng. Nếu lấy quá ít dữ liệu thì những dữ liệu này sẽ không thể phản ánh toàn bộ các thuộc tính mà mạng cần phải học và do đó mạng sẽ không có được phản ứng mong đợi đối với những dữ liệu mà nó chưa được huấn luyện.
Mặt khác, Không nên đưa vào huấn luyện cho mạng qúa nhiều dữ liệu. Về tổng thể lượng dữ liệu cần thiết bị chi phối bởi số các trường hợp cần luyện cho mạng. Bản chất đa chiều của dữ liệu và cách giải quyết mong muốn là các nhân tố chính xác định số các trường hợp cần luyện cho mạng và kéo theo là lượng dữ liệu cần thiết.
Việc định lượng gần đúng lượng dữ liệu cần đưa vào luyện mạng là hết sức cần thiết. Thông thường, dữ liệu thường thiếu hoàn chỉnh, do đó nếu muốn mạng có khả năng thực hiện được những điều mà ta mong đợi thì nó cần phải được luyện với lượng dữ liệu lớn hơn.
Phân tích dữ liệu
Có hai kỹ thuật cơ bản giúp cho ta có thể hiểu được dữ liệu
Phân tích thống kê
Mạng nơron có thể được xem như là một mở rộng của phương pháp thống kê chuẩn. Các thử nghiệm có thể cho ta biết được khả năng mà mạng có thể thực hiện. Hơn nữa, phân tích có thể cho ta các đầu mối để xác định các đặc trưng, ví dụ nếu dữ liệu được chia thành các lớp, các thử nghiệm thống kê có thể xác định được khả năng phân biệt các lớp trong dữ liệu thô hoặc dữ liệu đã qua tiền xử lý.
Trực quan hoá dữ liệu
Trực quan hoá dữ liệu bằng cách vẽ biểu đồ trên các dữ liệu theo một dạng thích hợp sẽ cho ta thấy được các đặc trưng phân biệt của dữ liệu, chẳng hạn như: các điểm lệch hay các điểm đỉnh. Điều này nếu thực hiện được có thể áp dụng thêm các thao tác tiền xử lý để tăng cường các đặc trưng đó.
Thông thường, phân tích dữ liệu bao gồm cả các kiểm tra thống kê và trực quan hoá. Các kiểm tra này sẽ được lặp đi lặp lại. Trực quan hoá cho ta sự đánh giá về dữ liệu và các khái niệm sơ khởi về các mẫu nằm sau dữ liệu. Trong khi các phương pháp thống kê cho phép ta kiểm thử những khái niệm này.
Xử lý dữ liệu
Tính đúng đắn của dữ liệu
Dữ liệu khi chuyển vào phải đảm bảo một khuân dạng phù hợp để có thể đưa vào luyện mạng. Ở bước này ta cần thực hiện các công việc sau:
Kiểm tra tính hợp lệ dữ liệu(Data validity checks)
Việc kiểm tra tính hợp lệ sẽ phát hiện ra các dữ liệu không thể chấp nhận được mà nếu sử dụng chúng thì sẽ cho ra các kết quả không tốt. Chẳng hạn, ta có thể kiểm tra khoảng hợp lệ của dữ liệu về nhiệt độ không khí của một vùng nhiệt đới. Ta mong muốn các giá trị trong khoảng từ 80C đến 400C, do đó các giá trị nằm ngoài khoảng này rõ ràng là không thể chấp nhận được.
Nếu có một mẫu cho một phân bố sai của dữ liệu (chẳng hạn: phần lớn dữ liệu được thu thập ở một ngày trong tuần) thì ta cần xem xét nguyên nhân của nó. Dựa trên bản chất của nguyên nhân dẫn đến sai lầm, ta có thể hoặc phải loại bỏ các dữ liệu này, hoặc cho phép những thiếu sót đó.Nếu có các thành phần quyết định không mong muốn như là các xu hướng hay các biến thiên có tính chất mùa vụ, chúng cần được loại bỏ ngay.
Phân hoạch dữ liệu
Phân hoạch là quá trình chia tập dữ liệu thành các tập kiểm định, huấn luyện và kiểm tra. Tập kiểm định dùng để xác định kiến trúc của mạng, tập huấn luyện dùng để điều chỉnh trọng số của mạng, tập kiểm tra dùng để kiểm tra hiệu năng của mạng sau khi huấn luyện. Ta cần phải đảm bảo rằng:
· Tập ví dụ huấn luyện chứa đủ dữ liệu, các dữ liệu đó phân bố phù hợp sao cho có thể biểu diễn các thuộc tính mà ta muốn mạng sẽ học được.
· Không có dữ liệu trùng nhau hay tương tự nhau của các dữ liệu trong các tập dữ liệu khác nhau
Tiền xử lý
Về mặt lý thuyết, một mạng nơron có thể dùng để ánh xạ các dữ liệu thô đầu vào trực tiếp thành các dữ liệu đầu ra. Nhưng trong thực tế, việc sử dụng quá trình tiền xử lý cho dữ liệu thường mang lại những hiệu quả nhất định trước khi những dữ liệu này được đưa vào mạng. Có rất nhiều kỹ thuật liên quan đến tiền xử lý dữ liệu. Tiền xử lý dữ liệu có thể là thực hiện lọc dữ liệu (trong dữ liệu biến thiên theo thời gian time-series) hay các phương pháp phức tạp hơn như: các phương pháp kết xuất, trích chọn các đặc trưng từ dữ liệu ảnh tĩnh. Bởi lẽ việc chọn thuật toán dùng trong tiền xử lý dữ liệu là phụ thuộc vào ứng dụng và bản chất của dữ liệu, cho nên các khả năng lựa chọn là rất lớn. Tuy nhiên, mục đích của các thuật toán tiền xử lý dữ liệu thường tương tự nhau, như sau (xem [6]):
Chuyển đổi dữ liệu về khuôn dạng phù hợp đối với đầu vào mạng nơron, điều này thường đơn giản hoá quá trình xử lý của mạng phải thực hiện trong thời gian ngắn hơn. Các chuyển đổi này có thể bao gồm:
Áp dụng một hàm toán học( hàm logarit hay bình phương) cho đầu vào
Mã hoá các dữ liệu văn bản trong cơ sở dữ liệu
Chuyển đổi dữ liệu sao cho nó có giá trị nằm trong khoảng [0,1]
Lấy biến đổi Fourier cho các dữ liệu thời gian
Lựa chọn các dữ liệu xác đáng nhất, việc lựa chọn này có thể bao gồm các thao tác đơn giản như lọc hay lấy tổ hợp của các đầu vào để tối ưu hoá nội dung của dữ liệu. Điều này đặc biệt quan trọng khi mà dữ liệu có nhiễu hoặc chứa các thông tin thừa. Việc lựa chọn cẩn thận các dữ liệu phù hợp sẽ làm cho mạng dễ xây dựng và tăng cường hiệu năng của chúng đối với các dữ liệu nhiễu.
Tối thiểu hoá số các đầu vào mạng, giảm số chiều của dữ liệu đầu vào và tối thiểu số các mẫu đưa vào có thể đơn giản hoá được bài toán. Trong một số trường hợp ta không thể nào đưa tất cả các dữ liệu vào mạng.
Hậu xử lý
Hậu xử lý bao gồm các xử lý áp dụng cho đầu ra của mạng. Cũng như đối với tiền xử lý, hậu xử lý hoàn toàn phụ thuộc vào các ứng dụng cụ thể và có thể bao gồm cả việc phát hiện các tham số có giá trị vượt quá khoảng cho phép hoặc sử dụng đầu ra của mạng như một đầu vào của một hệ khác, chẳng hạn như một bộ xử lý dựa trên luật. Đôi khi hậu xử lý chỉ đơn giản là quá trình ngược lại đối với quá trình tiền xử lý.
Chương trình dự báo phụ tải
Mạng nơron lan truyền ngược sai số (Back - Propagation) sẽ được dùng để giải quyết bài toán thứ hai - dự báo đỉnh và đáy biểu đồ phụ tải của dự báo phụ tải.
Bước đầu tiên là nhận dạng kiểu ngày cần dự báo. Các kiểu ngày đã được phân dạng của cùng tháng đó năm trước được kiểm tra lại. Theo bảng phân dạng ngày của cùng tháng cần dự báo ở các năm trước ta có thể xếp ngày cần dự báo vào dạng ngày nào đó. Chẳng hạn, ngày cần dự báo là một ngày làm việc bình thường và có thể lấy dạng biểu đồ phụ tải của các ngày làm việc bình thường trước đó làm mẫu để dự báo theo. Để thu được véc tơ BĐPT giờ của 3-5 ngày bình thường trước đó, tính trung bình và chuẩn hoá.
Có BĐPT giờ của ngày cần dự báo, chúng ta tiến hành xây dựng chương trình dự báo phụ tải đỉnh và đáy.
Các mẫu huấn luyện mạng là các số liệu bao gồm: nhiệt độ cao nhất trong ngày Tmax và phụ tải cao nhất trong ngày Pmax của các ngày không có yếu tố bất thường như truyền hình trực tiếp các sự kiện thể thao văn hoá được đại đa số công chúng yêu thích, sự cố cắt điện hoặc thiên tai bất thường xảy ra.
Cấu trúc mạng nơron dự báo đỉnh biểu đồ phụ tải
Cấu trúc mạng gồm có 2 lớp: 1 lớp ẩn và một lớp ra, lớp ẩn gồm 28 nơron, lớp ra gồm 1 nơron, các thông số khác của mạng
Mạng gồm 8 đầu vào:
· Nhiệt độ cao nhất của ngày cần dự báo
· Nhiệt độ cao nhất của ngày trước ngày cần dự báo
· Nhiệt độ cao nhất của ba ngày có cùng kiểu ngày trước đó
Hình 5. 1 Kiến trúc mạng
Các thông số phụ tải mẫu dùng để huấn luyện mạng nơron là Pmax, Pmin và nhiệt độ Tmax, Tmin tương ứng cùng ngày trong vài tuần trước. Tốc độ huấn luyện được chọn giá trị ban đầu trong khoảng 0.3 đến 0.5, hệ số quan tính được chọn giá trị ban đầu là 0.5
Thứ
Ngày
DL dự báo đỉnh
DL dự báo đáy
Phụ tải cao điểm (MW)
Nhiệt độ cao nhất (0C)
Phụ tải thấp điểm(MW)
Nhiệt độ thấp(0C)
CN
1/6/2010
5718.4
35
3334.2
26
2
2/6/2010
6258.2
36
3257.5
27
3
3/6/2010
6257.5
35
3532.3
27
4
4/6/2010
6189.6
37
3654.3
27
5
5/6/2010
6358.8
35
3460.5
26
6
6/6/2010
6364.4
36
3618.4
27
7
7/6/2010
6210.7
37
3905
28
CN
8/6/2010
6020.5
37
3967
27
2
9/6/2010
6588.5
36
3997.5
26
3
10/6/2010
6581.5
36
4316.5
26
4
11/6/2010
6454.9
35
4124.5
26
5
12/6/2010
6450.2
32
3837.5
25
6
13/6/2010
6587.1
33
3858.5
25
7
14/6/2010
6245.5
35
3658.5
26
CN
15/6/2010
5896.5
34
3842
26
2
16/6/2010
6412.9
35
3760.5
25
3
17/6/2010
6431.4
35
3890
25
4
18/6/2010
6506.5
35
3969
26
5
19/6/2010
6547.8
35
4149.5
27
6
20/6/2010
6592.2
33
4063.5
25
7
21/6/2010
6237.3
33
3850
26
CN
22/6/2010
5743.5
34
3618
26
2
23/6/2010
6396.7
33
3452
26
3
24/6/2010
6404.8
32
3829.5
25
4
25/6/2010
6391.6
35
3814
25
5
26/6/2010
6483.1
35
3956.5
26
6
27/6/2010
6284.8
35
3995.5
27
7
28/6/2010
5958.3
36
3781
27
CN
29/6/2010
5551.3
36
3634
26
2
30/6/2010
6050.8
35
3289
25
Có các số liệu về nhiệt độ cao nhất Tmax và phụ tải cao nhất Pmax tương ứng trong ngày của các ngày làm việc trong tháng, ta có thể xây dựng tập hợp ví dụ huấn luyện dùng để huấn luyện và kiểm tra khả năng dự báo của mạng. Một ví dụ huấn luyện cụ thể trong tập ví dụ huấn luyện nói trên được xây dựng từ tám giá trị vào:
· Tmax của ngày cần dự báo
· Tmax của ngày trước ngày cần dự báo
· Tmax của ba ngày có cùng kiểu ngày trước đó
· Pmax của ba ngày có cùng kiểu ngày trước đó
và một giá trị đầu ra : Pmax của ngày cần dự báo
Chẳng hạn, ngày cần dự báo là thứ 6 - 20/6/2010
Giá trị vào của mạng
Giá trị ra của mạng
Tmax
(20/6)
Tmax
(19/6)
Tmax
(19/6)
Tmax
(18/6)
Tmax
(17/6)
Pmax
(19/6)
Pmax
(18/6)
Pmax
(17/6)
Pmax
(20/6)
33
35
35
35
35
6547.8
6506.5
6431.4
6592.2
Số liệu đầu vào và ra của các ngày khác được xây dựng theo phương pháp tương tự. Bảng 5.2 là tập ví dụ huấn luyện dùng cho quá trình học và dự báo của mạng vào tháng 6/2010, được xây dựng trên cơ sở dữ liệu phụ tải của các ngày làm việc bình thường trong tháng.
Như vậy có dữ liệu về nhiệt độ cao nhất trong ngày và phụ tải cao nhất tương ứng của ngày đó ta có thể xây dựng tập ví dụ huấn luyện cho bất kỳ giai đoạn nào trong năm.
Các dữ liệu đầu vào và ra của mạng phải được chuyển đổi sao cho dữ liệu nằm trong khoảng [0,1].
Đối với bài toán DBPT đỉnh ở Trung tâm Điều độ Quốc gia các giá trị phụ tải Pmaxđược chia cho 9000, nhiệt độ cao nhất trong ngày vào mùa hè được chia cho 60
Giá trị vào của mạng
Gía trị ra của mạng
Ngày
Tmax
ngày dự báo
Tmax
ngày trước
Tmax
ngày thứ 1 cùng kiểu ngày
Tmax
ngày thứ 2 cùng kiểu ngày
Tmax
ngày thứ 3 cùng kiểu ngày
Pmax
ngày thứ 1 cùng kiểu ngày
Pmax
ngày thứ 2 cùng kiểu ngày
Pmax
ngày thứ 3 cùng kiểu ngày
Pmax
ngày dự báo
9/6/2010
36
36
36
35
37
6364.4
6358.8
6189.6
6588.5
10/6/2010
36
36
36
36
35
6588.5
6364.4
6358.8
6581.5
11/6/2010
35
36
36
36
36
6581.5
6588.5
6364.4
6454.9
12/6/2010
32
35
35
36
36
6454.9
6581.5
6588.5
6450.2
13/6/2010
33
32
32
35
36
6450.2
6454.9
6581.5
6587.1
16/6/2010
35
34
34
33
32
6587.1
6450.2
6454.9
6412.9
17/6/2010
35
35
35
33
32
6412.9
6587.1
6450.2
6431.4
18/6/2010
35
35
35
35
33
6431.4
6412.9
6587.1
6506.5
19/6/2010
35
35
35
35
35
6506.5
6431.4
6412.9
6547.8
20/6/2010
33
33
33
35
35
6547.8
6506.5
6431.4
6592.2
23/6/2010
33
34
34
33
35
6592.2
6547.8
6506.5
6396.7
24/6/2010
32
33
33
33
35
6396.7
6592.2
6547.8
6404.8
25/6/2010
35
32
32
33
33
6404.8
6396.7
6592.2
6391.6
26/6/2010
35
35
35
32
33
6391.6
6404.8
6396.7
6483.1
27/6/2010
35
35
35
35
32
6483.1
6391.6
6404.8
6284.8
30/6/2010
35
36
36
35
35
6284.8
6483.1
6391.6
6050.8
Sau khi chuyển đổi ta có bảng giá trị sau:
Giá trị vào của mạng
Gía trị ra của mạng
Ngày
Tmax
ngày dự báo
Tmax
ngày trước
Tmax
ngày thứ 1 cùng kiểu ngày
Tmax
ngày thứ 2 cùng kiểu ngày
Tmax
ngày thứ 3 cùng kiểu ngày
Pmax
ngày thứ 1 cùng kiểu ngày
Pmax
ngày thứ 2 cùng kiểu ngày
Pmax
ngày thứ 3 cùng kiểu ngày
Pmax
ngày dự báo
9/6/2010
0.6
0.6
0.6
0.58
0.62
0.71
0.71
0.69
0.73
10/6/2010
0.6
0.6
0.6
0.6
0.58
0.73
0.71
0.71
0.73
11/6/2010
0.58
0.6
0.6
0.6
0.6
0.73
0.73
0.71
0.72
12/6/2010
0.53
0.58
0.58
0.6
0.6
0.72
0.73
0.73
0.72
13/6/2010
0.55
0.53
0.53
0.58
0.6
0.72
0.72
0.73
0.73
16/6/2010
0.58
0.57
0.57
0.55
0.53
0.73
0.72
0.72
0.71
17/6/2010
0.58
0.58
0.58
0.55
0.53
0.71
0.73
0.72
0.71
18/6/2010
0.58
0.58
0.58
0.58
0.55
0.72
0.71
0.73
0.72
19/6/2010
0.58
0.58
0.58
0.58
0.58
0.72
0.72
0.71
0.73
20/6/2010
0.55
0.55
0.55
0.58
0.58
0.73
0.72
0.72
0.73
23/6/2010
0.55
0.57
0.57
0.55
0.58
0.73
0.73
0.72
0.71
24/6/2010
0.53
0.55
0.55
0.55
0.58
0.71
0.73
0.73
0.71
25/6/2010
0.58
0.53
0.53
0.55
0.55
0.71
0.71
0.73
0.71
26/6/2010
0.58
0.58
0.58
0.53
0.55
0.71
0.71
0.71
0.72
27/6/2010
0.58
0.58
0.58
0.58
0.53
0.72
0.71
0.71
0.7
30/6/2010
0.58
0.6
0.6
0.58
0.58
0.7
0.72
0.71
0.67
Quá trình huấn luyện:
Giá trị huấn luyện bao gồm 8 giá trị vào là 8 giá trị đầu tiên và một giá trị ra là giá trị cuối cùng. Và tập ví dụ huấn luyện ký hiệu là (Pi,Ti), trong đó Pi=[p1,p2,....pq] và Ti=[t1]
Quá trình huấn luyện của mạng dừng lại nếu SSE=0.0001 hoặc số vòng huấn luyện mạng bằng 30.000 vòng.
Kết thúc quá trình huấn luyện mạng ta thu được:
Hình 5. 2 Tổng sai số bình phương và tốc độ dự báo của Pmax
Bộ trọng số
W1 = [-0.8932 0.4695 0.5917 -1.0750 -0.3198 0.3888 -0.5489 -0.9692 0.6686 0.7016 -0.7705 -1.0604 -0.6599 0.7386 0.2315 0.4965 1.3206 -0.2007 -0.1635 0.0897 0.7175 -0.7532 -0.4547 0.9079 -0.9886 0.2810 -0.2138 -0.0124 0.0995 -0.8473 -1.0236 -0.5468 -0.4399 -0.9406 -0.4852 0.8163 0.2945 0.0091 -0.2436 -0.8614 -0.7664 0.3720 -0.9017 -0.4152 0.2335 0.3503 0.0605 0.7402 0.9401 -0.1735 0.6700 -0.7701 -0.1312 -0.3363 0.7641 0.5485 0.5443 -0.5809 0.5261 -1.2810 -0.6978 -0.2652 0.6252 -0.1548 -0.0540 -0.0862 0.9587 -0.4414 0.6307 -0.4286 0.4766 0.7410 -1.0153 -0.1286 0.2795 0.3287 -0.7378 -0.9010 0.5498 -0.5532 -0.7636 0.5593 0.7187 -0.4474 -0.3560 0.8044 -0.7277 -0.6841 -0.4370 -0.7538 -0.7321 0.7203 -0.4280 0.5521 -0.7899 -0.0307 -0.8977 -0.2361 -0.1283 -0.9878 -0.1855 -0.4558 -1.1557 -0.6740 0.5294 -0.4320 0.1656 -1.2026 -0.1512 0.9015 -0.3550 -0.1548 0.1928 0.5321 0.0548 0.1763 0.5473 -0.1607 1.0071 0.9041 -0.8469 -0.4629 -0.6055 -0.1093 0.6940 0.4008 0.8303 -0.1852 -1.0084 0.6465 0.0793 -0.7825 -0.6349 0.1579 -0.0394 -0.8822 0.2208 0.3285 0.7607 -1.0421 0.7279 -0.0161 0.1291 0.6321 -0.2797 0.5278 0.3521 -1.0989 0.2065 -0.8827 0.2023 -0.0074 0.1349 0.1498 -0.0031 -0.6000 -0.1140 0.4315 -0.3167 0.9579 -1.1092 -0.2140 -0.5056 -0.0082 -0.5891 -0.9000 -0.9173 0.8578 0.5158 -0.6202 0.3017 1.0089 0.5166 -0.1210 0.6582 -0.9751 0.4032 0.3559 0.2568 0.5543 -0.1565 -0.2196 0.6781 0.4055 -0.4490 0.2872 0.1055 -1.0047 -0.9185 -0.5245 0.2949 -0.4707 -0.3296 -0.8969 -0.0313 -1.0543
B1 = [1.4234 0.7550 -2.4198 0.5843 1.2653 -1.1902 -0.5569 0.0279 -0.0585 0.0031 -0.9545 0.1634 0.8090 0.4483 1.1512 -0.3496 -1.6753 -0.3753 0.4160 0.5991 -0.7744 0.0666 0.7090 -0.1123 -0.7626 -1.7894 0.8927 -0.2846]
W2 =[ -0.4841 -1.2111 -0.5291 -0.3676 0.0610 -0.1173 -0.3092 -0.1961 -0.6982 0.3587 0.2411 -0.2180 -0.0922 0.0954 0.1975 0.0724 0.1405 0.0871 0.6056 0.6837 0.1784 -0.2657 0.5674 -0.1764 0.7143 -0.0521 0.3823 -0.1246 ]
B2 =[1.2251]
Kết quả dự báo với tập gồm 4 ví dụ còn lại ở trên là:
Ngày
Pmax mục tiêu
Pmax dự báo
25/6/2010
0.71
0.7257
26/6/2010
0.72
0.7101
27/6/2010
0.7
0.7202
30/6/2010
0.67
0.7182
Cấu trúc mạng nơron dự báo đáy biểu đồ phụ tải
Dự báo giá trị đáy biểu đồ phụ tải, các số liệu phụ tải Pmin và nhiệt độ thấp nhất trong ngày của các ngày làm việc 06/2010 trong bảng 5.1 dược dùng làm mẫu để học và dự báo.
Dựa vào các số liệu về nhiệt độ thấp nhất trong ngày và Pmin tương ứng của các ngày làm việc trong tháng, ta xây dựng tập hợp mẫu dùng để huấn luyện và kiểm tra khả năng dự báo của mạng. Một ví dụ huấn luyện cụ thể trong tập ví dụ huấn luyện trên được xây dựng từ tám giá trị vào:
· Tmin của ngày cần dự báo
· Tmin của ngày trước ngày dự báo
· Tmin của ba ngày có cùng kiểu ngày trước đó
· Pmin của ba ngày có cùng kiểu ngày trước đó
và một giá trị đầu ra : Pmin của ngày cần dự báo
Tương tự như dự báo đỉnh biểu đồ phụ tải, dựa vào số liệu nhiệt độ thấp nhất và phụ tải Pmin trong ngày ở bảng 5.1 ta xây dựng được tập ví dụ huấn luyện được liệt kê trong bảng 5.5
Giá trị vào của mạng
Gía trị ra của mạng
Ngày
Tmin
ngày dự báo
Tmin
ngày trước
Tmin
ngày thứ 1 cùng kiểu ngày
Tmin
ngày thứ 2 cùng kiểu ngày
Tmin
ngày thứ 3 cùng kiểu ngày
Pmin
ngày thứ 1 cùng kiểu ngày
Pmin
ngày thứ 2 cùng kiểu ngày
Pmin
ngày thứ 3 cùng kiểu ngày
Pmin
ngày dự báo
9/6/2010
26
27
27
26
27
3618.4
3460.5
3654.3
3997.5
10/6/2010
26
26
26
27
26
3997.5
3618.4
3460.5
4316.5
11/6/2010
26
26
26
26
27
4316.5
3997.5
3618.4
4124.5
12/6/2010
25
26
26
26
26
4124.5
4316.5
3997.5
3837.5
13/6/2010
25
25
25
26
26
3837.5
4124.5
4316.5
3858.5
16/6/2010
25
26
25
25
26
3858.5
3837.5
4124.5
3760.5
17/6/2010
25
25
25
25
25
3760.5
3858.5
3837.5
3890
18/6/2010
26
25
25
25
25
3890
3760.5
3858.5
3969
19/6/2010
7
26
26
25
25
3969
3890
3760.5
4149.5
20/6/2010
25
27
27
26
25
4149.5
3969
3890
4063.5
23/6/2010
26
26
25
27
26
4063.5
4149.5
3969
3452
24/6/2010
25
26
26
25
27
3452
4063.5
4149.5
3829.5
25/6/2010
25
25
25
26
25
3829.5
3452
4063.5
3814
26/6/2010
26
25
25
25
26
3814
3829.5
3452
3956.5
27/6/2010
27
26
26
25
25
3956.5
3814
3829.5
3995.5
30/6/2010
25
26
27
26
25
3995.5
3956.5
3814
3289
Sau khi chuyển đổi ta có bảng:
Giá trị vào của mạng
Gía trị ra của mạng
Ngày
Tmin
ngày dự báo
Tmin
ngày trước
Tmin
ngày thứ 1 cùng kiểu ngày
Tmin
ngày thứ 2 cùng kiểu ngày
Tmin
ngày thứ 3 cùng kiểu ngày
Pmin
ngày thứ 1 cùng kiểu ngày
Pmin
ngày thứ 2 cùng kiểu ngày
Pmin
ngày thứ 3 cùng kiểu ngày
Pmin
ngày dự báo
9/6/2010
0.43
0.45
0.45
0.43
0.45
0.4
0.38
0.41
0.44
10/6/2010
0.43
0.43
0.43
0.45
0.43
0.44
0.4
0.38
0.48
11/6/2010
0.43
0.43
0.43
0.43
0.45
0.48
0.44
0.4
0.46
12/6/2010
0.42
0.43
0.43
0.43
0.43
0.46
0.48
0.44
0.43
13/6/2010
0.42
0.42
0.42
0.43
0.43
0.43
0.46
0.48
0.43
16/6/2010
0.42
0.43
0.42
0.42
0.43
0.43
0.43
0.46
0.42
17/6/2010
0.42
0.42
0.42
0.42
0.42
0.42
0.43
0.43
0.43
18/6/2010
0.43
0.42
0.42
0.42
0.42
0.43
0.42
0.43
0.44
19/6/2010
0.45
0.43
0.43
0.42
0.42
0.44
0.43
0.42
0.46
20/6/2010
0.42
0.45
0.45
0.43
0.42
0.46
0.44
0.43
0.45
23/6/2010
0.43
0.43
0.42
0.45
0.43
0.45
0.46
0.44
0.38
24/6/2010
0.42
0.43
0.43
0.42
0.45
0.38
0.45
0.46
0.43
25/6/2010
0.42
0.42
0.42
0.43
0.42
0.43
0.38
0.45
0.42
26/6/2010
0.43
0.42
0.42
0.42
0.43
0.42
0.43
0.38
0.44
27/6/2010
0.45
0.43
0.43
0.42
0.42
0.44
0.42
0.43
0.44
30/6/2010
0.42
0.43
0.45
0.43
0.42
0.44
0.44
0.42
0.37
Sau khi huấn luyện với tập gồm 12 ví dụ đầu và sai số SSE=0.0025 ta thu được kết quả sau :
Bộ trọng số:
W1 =[-0.2226 -0.5307 0.6798 -0.1274 0.8361 0.6254 -0.4585 0.3931 -0.3386 0.7219 -1.3341 1.0993 0.1653 0.4762 0.3677 0.2857 0.5705 0.2295 0.5705 -0.7247 -0.2326 0.1988 0.4235 0.7127 0.5096 0.8490 -0.0856 -0.7140 -0.5770 -0.4521 0.2639 0.5474 0.4740 -0.5280 -0.4481 -0.3951 0.6932 -0.3841 0.7242 -0.8288 -0.9260 -1.1254 0.6018 -0.6037 0.3126 0.4762 0.8602 -0.3511 0.4969 -1.3492 0.8454 -1.1111 -0.0374 -0.4415 0.0845 -0.2656 0.1196 1.3896 -0.3545 -0.1315 0.1090 -0.4182 0.4771 0.7405 0.6382 0.1099 -1.3263 0.0423 -0.4941 0.5995 0.6699 0.4501 -0.3304 -0.8863 0.9964 -1.7116 0.5276 0.3730 -0.5795 -1.0420 0.0342 -1.3883 1.6009 -1.0169 0.1596 0.1223 -0.6357 0.1980 -0.1549 0.6414 0.0299 -0.3037 -0.9148 0.6181 0.2945 -0.9399 0.7206 0.6961 0.4441 0.4632 0.4294 -0.2428 -0.8439 0.1831 0.5066 -0.7491 1.0208 -0.9404 -0.9090 0.2224 -0.6676 -0.6710 -0.3000 0.4910 0.2308 0.4841 -0.8905 -0.6943 -0.9525 -0.1476 0.1837 -0.3190 1.4424 -1.3415 -0.9324 0.6851 0.3686 -0.5046 0.0237 0.4378 0.2048 1.2054 0.0099 0.2204 -0.9466 0.7852 0.0681 1.4341 -1.4019 -0.0771 -0.1092 -0.3562 0.1567 1.2852]
B1 = [-0.2600 -0.5463 -1.9161 -0.8638 -0.6058 0.1596 0.4726 -0.9612 -0.3976 0.8357 0.3145 -0.5816 -1.0780 0.6044 -0.2628 -0.1475 -1.5309 0.1403]
W2 = [ 0.1734 -1.5562 0.0443 -0.4638 0.2124 1.1382 1.2547 -0.8656 -1.1429 1.9320 1.8206 0.1321 -0.5311 1.1717 -0.1650 1.7337 -0.9031 -2.0031]
B2 = [ -0.6482]
Kết quả dự báo với tập gồm 4 ví dụ còn lại ở trên là:
Ngày
Pmin mục tiêu
Pmin dự báo
25/6/2010
0.42
0.4371
26/6/2010
0.44
0.4758
27/6/2010
0.44
0.4516
30/6/2010
0.37
0.3688
KẾT LUẬN
Mạng nơ ron có thể được huấn luyện để xấp xỉ các hàm bất kỳ mà không cần biết trước sự liên hệ của các đầu vào đối với đầu ra. Chúng có thể hoạt động như một bộ nhớ tự liên hợp bằng cách sử dụng các dữ liệu đặc thù cho các ứng dụng, bài toán trong lĩnh vực cụ thể. Đó là đặc trưng đem lại cho mạng nơ ron lợi thế đối với các mô hình khác, đặc trưng thứ lỗi.
Trong bài báo cáo này, chúng em xem xét các thuộc tính của mạng nơ ron truyền thẳng và quá trình xác định đầu vào, kiến trúc mạng của mạng phục vụ cho một bài toán cụ thể. Cụ thể là ứng dụng mạng nơ ron dự báo phụ tải điện ngắn hạn.
Giai đoạn 1 là giai đoạn nhận dạng biểu đồ. Với dữ liệu của quá khứ lưu trữ được ta dễ dàng xác định được kiểu ngày của ngày cần dự báo.
Giai đoạn 2, mạng nơ ron truyền ngược sai số qua quá trình huấn luyện với tập mẫu là các giá trị phụ tài đỉnh( phụ tải đáy) và nhiệt độ cao nhất của các ngày có cùng kiểu ngày với ngày dự báo, được sử dụng để dự báo phụ tải theo nhiệt độ môi trường.
Báo cáo nay được thực hiện nhằm làm sang tỏ những vấn đề lý thuyết về mạng nơ ron truyền thẳng nhiều lớp, thuật toán lan truyền ngược, các bước cần thực hiện khi phân tích, thiết kế và xây dựng ứng dụng cho bái toán dự báo phụ tải điện.
MỤC LỤC
Các file đính kèm theo tài liệu này:
- Tìm hiểu xây dựng chương trình dự báo phụ tải điện.docx