Trước hết, một tương tác trường điện từ mạnh tồn tại giữa trường điện từ gây
ra bởi nam châm trên phần tĩnh và lõi sắt trên đó có gắn các cuộn dây của phần
động. Lõi sắt này có nhiệm vụ chính là để tăng hiệu quả làm việc của động cơ. Lực
nhiễu này, được gọi là lực cogging, cố gắng căn chỉnh lõi sắt và nam châm để ổn
định vị trí của phần động (vị trí chốt). Lực cogging này chỉ phụ thuộc vào mối qua
hệ giữa vị trí của phần động với nam châm.
82 trang |
Chia sẻ: lylyngoc | Lượt xem: 2488 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận văn Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ngoài các hiện tượng quan tâm rong
phần lựa chọn cấu trúc của BSN.
3.3. Kết quả mô phỏng bằng phần mềm 20-sim.
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
63
3.3.1. Bộ điều khiển feedback.
a. Sơ đồ mô phỏng :
Hình 3.31: Sơ đồ mô phỏng hệ thống khi chỉ có FeedBack.
b.Kết quả mô phỏng:
Learning feed-forward control
-0.05
0
0.05
0.1
Reference [m]
-0.05
0
0.05
0.1
ProcessOutput [m]
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
64
Hình 3.32: Kết quả mô phỏng hệ thống khi chỉ có Feedback tham gia
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
65
3.3.2. LFFC khi có ViscouNeural.
a. Sơ đồ mô phỏng :
Hình 3.33: Sơ đồ mô phỏng
b, So sánh kết quả mô phỏng.
Hình 3.34: So sánh kết quả mô phỏng lực Viscou tạo ra và lực Viscou thật.
a, Lực Viscou được tạo ra
a,
b,
Learning feed-forward control
-0.6
-0.4
-0.2
0
0.2
0.4
Estimated viscous force [N]
50 55 60 65 70
time {s}
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
True viscous force [N] {m/s}
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
66
b, Lực Viscou thật
Vai trò của bù lực Viscou được thể hiện rõ ràng bằng cách so sánh kết quả mô
phỏng như được chỉ ra trong Hình 3.35a và Hình 3.35b. Khi BSN Viscou được
sử dụng, tín hiệu error được giảm đáng kể.
Hình 3.35: So sánh kết quả mô phỏng error trước và sau khi có bù lực Viscou.
a, Khi chỉ có Feedback
b, Khi có thêm bù lực Viscou
3.3.3. LFFC khi có CoulombNeural và ViscouNeural.
a. Sơ đồ mô phỏng :
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Le ning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
a, b,
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
67
Hình 3.36: Sơ đồ mô phỏng
b. So sánh kết qủa mô phỏng:
Hình 3.37: So sánh kết quả mô phỏng lực Coulomb được tạo ra và lực Coulomb
thật.
a, Lực Coulomb thực
b, Lực Coulomb được tạo ra
Vai trò của CoulombNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô
phỏng của tín hiệu error như được chỉ ra trong Hình 3.38a và Hình 3.38b.
Hình 3.38: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù
lực Coulomb.
a, Khi chỉ có Feedback và NeuralViscou
0
Learning feed-forward control
-0.25
-0.15
-0.05
0.05
0.15 True coulomb force [N]
16 17 18 19 20 21 22
time {s}
-2
-1
0
1
2 Estimated coulomb force [N] {N}
0.
4
0.2
0
-0.2
0 -0.4
-0.4
-0.2
0
0.2
0.4
a,
b,
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Le ning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
68
b, Khi có thêm bù lực Coulomb
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
69
3.3.4. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural.
a. Sơ đồ mô phỏng :
Hình 3.39: Sơ đồ mô phỏng
b. So sánh kết quá mô phỏng:
Hình 3.40: So sánh kết quả mô phỏng tín hiệu lực Cogging được tạo ra và lực
Cogging thật.
a, Lực Cogging thật
b, Lực Cogging được tạo ra
Learning feed-forward control
-0.3
-0.2
-0.1
0
0.1
0.2
True cogging force [N]
93 94 95 96 97 98 99 100
time {s}
-0.2
-0.1
0
0.1
0.2 Estimated cogging force [N]
a,
b,
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
70
Vai trò của CoggingNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô
phỏng của tín hiệu error như được chỉ ra trong Hình 3.41a và Hình 3.41b.
Hình 3.41: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù
lực Cogging.
a, Khi chỉ có Feedback và ViscouNeural, CoulombNeural.
b, Khi có thêm tín hiệu bù lực Cogging.
3.3.5. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural,
InertialNeural.
a. Sơ đồ mô phỏng :
Hình 3.42: Sơ đồ mô phỏng
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Le ning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
a, b,
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
71
b. So sánh kết quá mô phỏng:
Hình 3.43: So sánh kết quả mô phỏng lực Inertia được tạo ra và lực Inertia
thật.
a, Lực Inertia được tạo ra.
b, Lực Inertia thật.
Vai trò của InertiaNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô
phỏng của tín hiệu error như được chỉ ra trong Hình 3.43a và Hình 3.43b.
Hình 3.44: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù lực
Inertia.
a, Khi chỉ có Feedback và ViscouNeural, CoulombNeural, CoggingNeural
b, Khi có thêm tín hiệu bù lực Inertia.
Learning feed-forward control
-0.6
-0.4
-0.2
0
0.2
0.4 Estimated inertia force [N]
10 15 20 25 30
time {s}
-0.4
-0.2
0
0.2
0.4
0.6 True inertia force [N] {m/s}
a,
b,
Le rning fe d-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
72
So sánh kết quả mô phỏng tín hiệu error khi bộ điều khiển chỉ có Feedback và
khi có LFFC tham gia.
Hình 3.45: So sánh kết quả mô phỏng tín hiệu error khi bộ điều khiển chỉ có
Feedback và khi có LFFC tham gia
a, Khi chỉ có Feedback
b, Khi có thêm tín hiệu bù lực Viscou, lực Coulomb, lực Cogging lực Inertia
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Learning feed-forw rd control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
a, b,
Chương 4: Kết luận
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
71
Chương 4: KẾT LUẬN
Trong Chương 1, đưa ra khái niệm của LFFC, đó là một bộ điều khiển học
có phản hồi sai số trong đó phần truyền thẳng là một mạng B-Spline (BSN). Vấn
đề quan trọng là phải thiết kế phần truyền thẳng của LFFC sao cho quá trình học
là hội tụ và cùng với đó là phải làm sao cho bậc của hệ thống phải được giữ ở
mức tối thiểu. Đây là hai chủ đề chính được đề cập đến trong luận văn.
Trong Chương 2 và 3, đề cập đến bộ điều khiển LFFC phụ thuộc thời
gian, là bộ điều khiển mà thời gian chuyển động theo chu kỳ là đầu vào duy nhất
của BSN. Trong trường hợp này, LFFC tương tự như điều khiển học lặp lại và
điều khiển lặp lại. Do vậy, em đưa ra ý tưởng sử dụng các kết quả hội tụ của điều
khiển học lặp lại và điều khiển lặp lại trong quá trình thiết lập LFFC.
Trong điều khiển học lặp lại và điều khiển lặp lại phần truyền thẳng được
thiết kế như một vòng lặp có nhớ. Thay vì luyện phần truyền thẳng bởi đầu ra của
bộ điều khiển phản hồi, tín hiệu học có thể nhận được bằng cách lọc sai số bám
nhờ một bộ lọc có khả năng học. Bộ lọc này được thiết kế dựa trên một mô hình
gần đúng của hệ thống bị điều khiển. Phân tích về độ ổn định cho thấy rằng các
yếu tố động học tần số cao không mô hình hóa được sẽ làm cho tín hiệu truyền
thẳng của điều khiển học lặp lại và RC không hội tụ. Quá trình hội tụ có thể đạt
được bằng việc điều chỉnh vòng lặp có nhớ theo cách thức sao cho các thành
phần tần số làm cho mô hình của hệ thống bị điều khiển (kéo theo bộ lọc có khả
năng học) trở nên không chính xác sẽ bị loại bỏ.
LFFC phụ thuộc thời gian có thể được xem như là một loại điều khiển học
lặp lại / điều khiển lặp lại trong đó quá trình học được ổn định hóa nhờ thay thế
vòng lặp có nhớ bởi một BSN và phần điều khiển phản hồi được sử dụng như là
một bộ lọc có học. Các thành phần tần số trong quan hệ vào ra của một BSN phụ
thuộc vào độ rộng của miền xác định của B-Spline. Chọn độ rộng lớn sẽ ảnh
hưởng đến tín hiệu truyền thẳng tần số thấp, trong khi đó độ rộng nhỏ sẽ tác động
đến tín hiệu truyền thẳng tần số cao. Do vậy, các kết quả thu được từ điều khiển
Chương 4: Kết luận
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
72
học lặp lại và điều khiển lặp lại cho ta thấy rằng quá trình học có thể được ổn
định bằng cách chọn độ rộng của miền xác định của B-spline sao cho BSN không
thể xấp xỉ thành phần tần số cao của tín hiệu học. Nhờ các giả định nghiêm ngặt
(một trong số đó là hệ thống điều khiển phải là SISO LTI-Hệ thống tuyến tính
bất biến một đầu vào một đầu ra) , chúng ta có thể mô tả một cách định lượng :
chúng ta đưa ra các điều kiện ổn định cho độ rộng tối thiểu của miền xác định
của các B-Spline, dmin, và cho tỷ lệ học tối đa. Các yếu tố ổn định này được kiểm
chứng nhờ các quá trình mô phỏng. Trong luận văn này, LFFC phụ thuộc thời
gian được áp dụng cho LiMMS. Do LiMMS là hệ thống phi tuyến, nó không thỏa
mãn giả thiết cho việc phân tích sự ổn định. Bất chấp điều này, các kết quả trong
quá trình mô phỏng cho thấy giá trị dmin là chính xác và tỷ lệ học tối đa cũng ổn
định.
Đối với các chuyển động đặt trước ngẫu nhiên, LFFC phụ thời gian không
thể áp dụng được. Thay vào đó phải sử dụng hệ thống LFFC phụ thuộc quỹ đạo,
có nghĩa là tín hiệu đặt trước cùng với đạo hàm hoặc tích phân của nó được sử
dụng như là các đầu vào của phần truyền thẳng.
Chúng ta không thể đưa ra các điều kiện ổn định cho quá trình thiết kế các
tham số của một BSN trong LFFC phụ thuộc quỹ đạo. Trong một số trường hợp
(ví dụ như khi vận tốc đặt trước là không đổi), các điều kiện ổn định của LFFC
phụ thuộc thời gian có thể được chuyển thành các điều kiện ổn định cho LFFC
phụ thuộc quỹ đạo. Về bản chất có thể nói rằng miền xác định của các B-Spline
(đa chiều) pahỉ chứ tối thiểu dmin [s] của chuyển động đặt trước. Thiết kế một
phân bố B-Spline thỏa mãn điều kiện này là rất khó và sẽ dần đến độ rộng B-
Spline lớn, điều này làm cho vấn đề trở nên không hấp dẫn.
Do vậy, một cách tiếp cận khác được xem xét. Chúng ta giả sử chọn một
phân bố B-Spline mà không quan tâm đến các điều kiện ổn định và thêm một tiêu
chuẩn ổn định hóa vào LFFC để làm cho quá trình học hội tụ. Một trong những
sự lựa chọn để thực hiện vấn để này là tối thiểu hóa hàm lượng giá nhờ cơ chế
Chương 4: Kết luận
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
73
học. Đây là một kỹ thuật nổi tiếng trong mô hình mạng mờ nơron và được gọi là
kỹ thuật tối giản. Tuy nhiên, thực tế cho thấy rất khó để chọn các tham số của cơ
chế học tối giản sao cho LFFC hội tụ. Do đó, một sự lựa chọn khác được đưa ra,
lại bắt nguồn từ điều khiển học lặp lại. Việc tối giản được thực hiện nhờ việc lọc
tín hiệu học của LFFC thay vì thay đổi cơ chế học. Ý tưởng chủ đạo là quá trình
học hội tụ khi tín hiệu học được đảm bảo sao cho tất cả các thành phần tần số cao
trên dmin
-1[Hz] bị loại bỏ. Điều này (ví dụ) có thể đạt được nhờ kỹ thuật lọc với
một BSN phụ thuộc thời gian phù hợp. Các kết quả mô phỏng xác nhận rằng
bằng cách thêm một bộ lọc như vậy, sự hội tụ của LFFC phụ thuộc quỹ đạo có
thể đạt được. Tuy nhiên, vẫn chưa có các phân tích khoa học nhằm giải thích
được các kết quả quan sát.
Các đầu vào đặc biệt nào sẽ được lựa chọn trong trường hợp một LFFC
phụ thuộc quỹ đạo được xây dựng dựa trên cơ sở biểu diễn không gian trạng thái
(chính xác về cấu trúc) của một hệ động học. chúng ta đã chỉ ra rằng một đối
tượng chỉ có thể được điều khiển nhờ một LFFC phụ thuộc quỹ đạo khi biểu diễn
không gian trang thái thảo mãn một số điều kiện. Do vậy, LiMMS có thể được
điều khiển bởi LFFC phụ thuộc quỹ đạo.
Khi các đầu vào của BSN được chọn thẳng dựa trên cơ sở của mô hình đối
tượng sẽ cho ta một BSN đa chiều. Điều này dẫn đến vấn đề liên quan đến bậc
của hệ thống. Mô hình mờ nơron cho thấy vấn đề này có thể được giải quyết
bằng cách chia BSN đa chiều thành vài BSN có số chiều nhỏ hơn. Điều này được
thực hiện dựa trên một cơ sở được gọi là biểu diễn phân ly các biến của một hàm
số. Các kết quả lựa chọ BSN được biết đến như là một cấu trúc mạng suy biến.
Cùng với vấn đề này, một LFFC phụ thuộc quỹ đạo được gọi là suy biến khi nó
bao gồm nhiều khâu truyền thẳng thay vì một. Một cách thứ 2 (kém hiệu quả
hơn) nhằm giảm thiểu bậc cảu hệ thống là chọn các phân bố B-Spline với càng ít
B-Spline càng tốt. Có một vài phương pháp được xem xét khi thiết kế một LFFC
suy biến.
Chương 4: Kết luận
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
74
Luyện một LFFC suy biến không pahỉ là quá trình truyền thẳng. Khi tất cả
các BSN được luyện đồng thời, không có gì đảm bảo rằng mỗi BSN sẽ học được
đúng tín hiệu truyền thẳng của nó. Do vậy, chúng ta đưa ra một phương pháp
luyện một LFFC hiệu quả, có nghĩa là bằng cách chọn một chuỗi các chuyển
động luyện mạng nhờ đó các BSN được luyện một cách chính xác. Tuy nhiên,
phương pháp này trong thực tế được gọi là phương pháp luyện mạng có chiến
lược vẫn khá chủ quan, dựa trên kinh nghiệm.
Các thủ tục thiết kế cho LFFC được tính toán và áp dụng trong các thí
nghiệm thực tế cho điều khiển LiMMS. Trong đó, LiMMS được điều khiển bởi
một LFFC phụ thuộc thời gian cũng như bởi một LFFC. Trong một loạt các thí
nghiệm ban đầu sử dụng LFFC phụ thuộc thời gian, các điều kiện ổn định được
kiểm chứng. Kết quả của các thí nghiệm này tương tự như kết quả trong phần mô
phỏng điều này có nghĩa là giá trị của dmin là chính xác trong khi tỷ lệ học cực đại
khá ổn định. Tiếp đó, phân bố B-Spline của LFFC phụ thuộc thời gian được tối
ưu. Cuối cùng một LFFC suy biến được thiết kế và kiểm chứng. Phần truyền
thẳng bao gồm 3 BSN bù quán tính, ma sát và cogging. Sau khi tiến hành các thí
nghiệm luyện mạng có chiến lược, LFFC suy biến đạt được một sai số bám nhỏ
đối với một dải lớn các chuyển động tham chiếu. Tuy nhiên, đối với các chuyển
động lặp lại thì LFFC phụ thuộc thời gian là ưu việt hơn cả.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 1
Chương 1: GIỚI THIỆU
1.1. Tổng quan về Learning control (LC).
Một trong số các công cụ cạnh tranh mà các hãng sản xuất tuỳ ý sử dụng đó là
chất lượng của sản phẩm. Đặc biệt là trong các thị trường có liên quan đến các sản
phẩm công nghệ cao. Đó là một trong những nhân tố quan trọng mang tính sống còn
để tạo ra các sản phẩm có chất lượng tốt hơn. Điều này được nhìn nhận trong thị
trường đối với các sản phẩm mà chúng ta sẽ xem xét trong luận văn này, ví dụ như
các hệ thống chuyển động cơ điện tử. Theo quan điểm cơ điện tử, chất lượng của các
hệ thống cơ điện tử có thể được cải tiến bằng việc thay đổi thiết kế cơ khí và bộ điều
khiển. Ví dụ như khi nghiên cứu các cánh tay robot, nơi mà chuyển động chính xác
phụ thuộc vào độ cứng và quán tính của hệ thống. Nếu cánh tay không đạt được các
yêu cầu nhất định, độ cứng của nó có thể được tăng lên hoặc quán tính của nó có thể
được giảm bớt bằng cách thay đổi kết cấu cơ khí hoặc bằng việc ứng dụng vật liệu
mới.
Việc thay đổi bộ điều khiển có thể được thực hiện hoặc bằng cách thay đổi
thông số của bộ điều khiển đang tồn tại hoặc bằng cách thiết kế bộ điều khiển mới.
Khi một bộ điều khiển được cải tiến, chỉ đơn thuần là yêu cầu thay đổi phần mềm và
trong một số trường hợp là thêm các sensor cách đánh giá này tương đối dễ dàng
thực hiện được, khi đem so sánh với các cấu trúc tương ứng. Trong luận văn này
chúng ta sẽ tập trung vào việc nâng cao chất lượng của hệ thống bằng bộ điều khiển.
Việc thiết kế một bộ điều khiển nói chung thường dựa trên một mô hình của
một đối tượng. Mô hình đối tượng càng chính xác bao nhiêu thì việc thiết kế bộ điều
khiển càng hiệu quả bấy nhiêu. Khi mô hình hoá đối tượng, các vấn đề sau có thể
gặp phải:
1. Hệ thống quá phức tạp để có thể hiểu hoặc trình bày một cách đơn giản.
2. Mô hình quá khó hoặc quá đắt để đánh giá. Một số đặc tính của một số hiệu ứng
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 2
(phi tuyến) khó có thể đạt được, ví dụ như ma sát…
3. Đối tượng có thể chịu ảnh hưởng lớn của nhiễu tác động từ môi trường, điều này
khó dự đoán trước được.
4. Các thông số của đối tượng có thể biến đổi theo thời gian.
Bộ điều khiển thích nghi có thể là một giải pháp khi cấu trúc của mô hình
động học của đối tượng và nhiễu mô hình tác động lên nó được biết trước trong khi
các giá trị của các thông số thì không thể xác định được. Khi mô hình không có giá
trị hoặc có nhiều thông số không xác định được thì lúc đó điều khiển học sẽ được xét
đến.
1,2 Learning Control (LC) là gì ?
Các bộ LC thường được hình dung gần giống như là hệ thống điều khiển của
con người và do đó nó có các thuộc tính giống với con người. Trong luận văn này
không nghiên cứu các bộ LC theo quan điểm sinh học, nhưng đồng ý với một số
định nghĩa sau:
Định nghĩa 1.1 (LC) Một bộ LC là một hệ thống điều khiển bao gồm trong đó 1 hàm
xấp xỉ các ánh xạ đầu vào - đầu ra tương ứng trong suốt quá trình điều khiển mà một
hoạt động mong muốn của hệ thống điều khiển đạt được.
Định nghĩa 1.2 (Hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xác định
bởi một hàm đươc lựa chọn
.,F
, với các véc tơ thông số
được lựa chọn để hàm
.F
được xấp xỉ “tốt nhất”.
Lưu ý 1.1 (Điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều khiển
thích nghi có thể được xem xét giống như là một dạng của LC trong đó một hàm
xấp xỉ được sử dụng có thể chỉ xấp xỉ một lớp giới hạn của các hàm mục tiêu. Nói
chung, một bộ LC sẽ bao gồm một hàm xấp xỉ cho một lớp đối tượng có nhiều hàm
mục tiêu hơn.
Một biến mở rộng của các hàm xấp xỉ có thể được sử dụng như mạng nơron, mạng
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 3
mờ-nơron (cũng được biết đến với tên các bộ điều khiển logic mờ thích nghi)..v..v..
Nói một cách sơ bộ, các bộ hàm xấp xỉ có thể được sử dụng theo 2 cách:
Trước hết, hàm xấp xỉ có thể được sử dụng để tạo (một phần) tín hiệu điều
khiển. Việc học được thay thế bởi việc thích nghi vectơ thông số của hàm xấp xỉ
theo cách mà một số các hàm giá trị chứa đựng sai lệch điều khiển là cực tiểu. Bộ
điều khiển này được gọi là LC trực tiếp.
Thứ hai, Hàm xấp xỉ có thể được sử dụng để học một mô hình đối tượng tương
ứng được kiểm soát ví dụ như là để làm giảm hàm giá trị của sai số dự báo. Dựa trên
cơ sở của mô hình đã được học một bộ điều khiển được xây dựng, Bộ điều khiển này
được gọi là LC gián tiếp.
Từ khi bộ LC đầu tiên được phát triển vào năm (1963) cho tới nay, lĩnh vực LC
đã và đang phát triển rất rộng rãi. Rất nhiều các cấu trúc của bộ điều khiển khác
nhau đã được đề xuất và các thuộc tính của chúng (như tính ổn định và tốc độ hội tụ
đã được phân tích cả trong thực tế và lý thuyết. Tuy nhiên, mặc dù tất cả chúng đều
được nghiên cứu nhưng chỉ có một số bộ LC được ứng dụng trong các sản phẩm
mang tính thương mại. Có thể vì những lí do sau đây:
Việc chứng minh sự ổn định được đánh giá cao. Phần lớn các nghiên cứu lý
thuyết của các bộ LC được tập trung vào tính ổn định. Tuy nhiên, một bộ LC ổn
định cũng không cần thiết mang lại một đáp ứng ngắn hạn học tốt …….Hoạt động
của bộ LC đối với một con robot đã được quan sát bằng cách mô phỏng. Sau khi
thực hiện với chuyển động 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8. Khi
tiếp tục tự học, sai số hiệu chỉnh đã tăng lên đến hệ số 1051 tại bước lặp thứ 62.000
và cuối cùng giảm xuống hệ số 10-18 tại bước lặp thứ 250.000. Như vậy, mặc dù thực
tế cuối cùng sai số hiệu chỉnh nhỏ đã đạt được nhưng bộ LC không có giá trị thực
nghiệm vì nó có dải sai số hiệu chỉnh rất rộng ở giữa.
Không nên quá quan tâm tới sai số hiệu chỉnh điểm 0. Một số LC cố gắng đạt
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 4
được sai số hiệu chỉnh điểm 0. Tuy nhiên, điều này yêu cầu có những tín hiệu điều
khiển lớn ở những tần số trên băng thông hệ thống, các tần số này có thể gây nguy
hiểm cho các cơ cấu chấp hành và nói chung là không đạt được như mong muốn.
Loại sai số của hàm xấp xỉ. Trong đại đa số các bộ LC, hàm xấp xỉ được thực hiện
với vai trò như một mạng nơron (Multi Layer Perceptron MLP). Như chúng tôi sẽ
bàn tới ở dưới đây, loại mạng nơron này không tương thích một cách đặc biệt cho
việc điều khiển.
Trên cơ sở những suy xét này, chúng ta có thể đưa ra một số các thuộc tính sau
mà một bộ LC nên có để để trở thành một mặt hàng được ưa chuộng về mặt thương
mại:
Dễ dàng sử dụng trong một hệ thống điều khiển có sẵn. Điều này có nghĩa là
khi có một đáp ứng ngắn hạn học tốt, thì hiệu suất cực tiểu được bảo đảm. Ví dụ như
là trong một bộ điều khiển hiện nay. Thậm chí trong suốt quá trình huấn luyện đối
tượng vẫn có thể được duy trì trong quá trình vận hành, mà không gây ra những tổn
thất của quá trình sản suất.
Có khả năng sử dụng những kiến thức dự đoán của đối tượng. Nói chung các
nhà thiết kế và/hoặc người vận hành có một số kiến thức về đối tượng ví dụ như
trong cấu trúc của mô hình toán học (đơn giản) dưới dạng các hàm, một giản đồ
Bode của đối tượng hoặc một mô tả dưới dạng biến ngôn ngữ của hành vi đối tượng.
Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ điều
khiển, để chọn các thông số của bộ điều khiển hợp lý và để tăng tốc độ học.
Hàm xấp xỉ nên phù hợp cho việc điều khiển. Điều này có nghĩa rằng:
Không gian nhớ cần thiết cho việc thực hiên nên nhỏ. Trong thực tế, bộ điều
khiển được thực hiên bằng phần mềm được gắn vào máy tính. Dung lượng bộ nhớ là
có hạn. Do đó, số lượng các thông số của hàm xấp xỉ mà yêu cầu phải xấp xỉ tín hiệu
điều khiển không thể quá rộng.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 5
Việc tính toán đầu ra của hàm xấp xỉ và sự tương thích của quan hệ vào / ra
phải được thực hiện một cách nhanh chóng. Trong môi trường thời gian thực, trong
một khoảng thời gian mẫu, các thông số của hàm xấp xỉ phải tương ứng và đầu ra
được tính. Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ và
cho phép thời gian tính toán là rất ít. Các hàm xấp xỉ mà bao gồm một lượng lớn các
tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển.
Cơ chế học nên hội tụ nhanh. Để giữ được lượng thời gian trong đó quá trình
vận hành của hệ thống được điều khiển là cận tối ưu tới mức tối thiểu, cơ chế học
nên hội tụ nhanh.
Cơ chế học không nên bị tối thiểu cục bộ, khi bị lưu giữ trong mức tối thiểu
cục bộ, Thì cơ chế học cho rằng các giá trị đạt được của các thông số của hàm xấp
xỉ, được biểu thị bởi
loc
, sinh ra sai số xấp xỉ cực tiểu, được biểu thị bởi E(
loc
).
Mặc dù
locglob
tồn tại, làm cho
)()( locglob EE
. Trong ảnh 1.1 một ví dụ một
chiều của hiện tường như vậy được giới thiệu. Ở mức tối thiểu cục bộ,
loc
, độ
dốc của sai số xấp xỉ bằng 0. Cơ cấu học mà sử chỉ sử dụng độ dốc của sai số xấp xỉ
thì không thể thoát khỏi mức tối thiểu cục bộ.
Hình 1.1 Cực tiểu cục bộ trong kỹ thuật học
Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khó để huấn luyện
LC để thu được hiệu quả cao.
E(ω)
Cùc tiÓu côc bé
Cùc tiÓu toµn bé
ωloc ωglob
w
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 6
Quan hệ vào/ ra phải tương thích một cách cục bộ. Trong một số hàm xấp xỉ,
quan hệ vào/ ra này là tương thích toàn cục. Điều này có nghĩa là nếu giá trị của một
trong các thông số của hàm xấp xỉ được tương thích, thì quan hệ vào /ra trên toàn bộ
phạm vi đầu vào bị thay đổi. Xét một bộ LC được huấn luyện để thực hiện một số
chuyển động. Khi bộ LC được huấn luyện để thực hiện một chuyển động mới, điều
này liên quan tới việc tương ứng các thông số của hàm xấp xỉ. Bởi vì mối quan hệ
vào ra được tương thích toàn cục nên các tín hiệu điều khiển học trước đó bị thay đổi
có thể gây ra nhưng tổn thất trong quá trình làm việc. Do đó điều mong đợi ở đây là
mối quan hệ vào ra của hàm xấp xỉ được tương thích một cách cục bộ. Trong trường
hợp này, việc học 1 chuyển động mới sẽ không làm thay đổi các tín hiệu đã được
học trước đó.
Hàm xấp xỉ có khả năng tự khái quát hoá tốt. Khả năng tự khái quát hoá là khả
năng tạo ra một đầu ra nhạy cho một đầu vào không được thể hiện trong quá trình
huấn luyện nhưng nó tương tự như các huấn luyện mẫu. Khi hàm xấp xỉ có khả năng
khái quát hoá tốt, bộ LC cũng sẽ thu được một hiệu quả bám cao cho các chuyển
động tương tự các chuyển động được huấn luyện. Vì vậy nó đủ để huấn luyện LC
với một lượng nhỏ các đặc tính chuyển động huấn luyện. Khi bộ xấp xỉ không có
khả năng tự khái quát hoá tốt, bộ LC phải được huấn luyện cho mỗi chuyển động
quan trọng, nó tạo ra một quá trình huấn luyện mở rộng .
Sự mềm mại của giá trị xấp xỉ nên dễ dàng điều khiển. Như nói ở phần trước
đây, bộ LC không chỉ thu được sai số bằng không đối với một vài tần số, khi tín hiệu
điều khiển có tần số cao sẽ không mong muốn. Người sử dụng phải có khả năng
quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ.
Đáp ứng ngắn hạn là học tốt. Đáp ứng ngắn hạn của bộ LC nên là loại đáp ứng
mà có sai số bám dần hội tụ về giá trị mong muốn. Việc tăng sai số bám trong pha
trung gian của quá trình học có thể làm hỏng đối tượng, hơn thế nữa, đây là trường
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 7
hợp quá trình làm việc tối thiểu có thể không còn được bảo đảm khi bộ điều khiển
được sử dụng như một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn.
Sự ổn định lâu dài cần phải được bảo đảm. Việc tự học có thể được thực hiện
một cách liên tục hoặc được thực hiện trước khi vận hành. Việc học liên tục được
yêu cầu khi các thông số của đối tượng thay đổi trong suốt quá trình vận hành. Ví
dụ, do hao mòn hay chịu ảnh hưởng của môi trường. Trong trường hợp này, một bộ
điều khiển phải có khả năng đảm bảo việc học ổn định bất chấp các điều kiện vận
hành thay đổi như thế nào.
1.3. Bộ điều khiển học sai số phản hồi
Một bộ LC thú vị cho các cánh tay robot mà phải bám một cách ngẫu nhiên theo các
đường dẫn. Nói chung bộ điều khiển này được biết đến với cái tên là bộ điều khiển
học sai số phản hồi: Bộ điều khiển (Feedback Error Learning FEL).
Hệ thống LC bao gồm 2 phần:
Bộ điều khiển Feef-forward được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ
uF = F(r). Một bộ điều khiển Feed-forward thông thường có thể được sử dụng để bù
thêm cho các hệ thống động học và theo cách này sẽ thu được độ bám chính xác
cao. Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo F = P-1, thì đầu
ra của đối tượng, y, sẽ bằng tín hiệu đặt , r.
Hình 1.2 Bộ điều khiển FEL
r
-
Hµm xÊp xØ
C
+ +
+
UF
P
y
r (n)
r
.
. .
.
.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 8
Đối tượng P, luôn chịu sự tác động của nhiễu. Các loại nhiễu ở bao gồm cả
nhiễu ngẫu nhiên và nhiễu có bản chất tái sinh. Những nhiễu tái sinh tái diễn giống
nhau khi một chuyển động cụ thể được lặp lại. Điều này có nghĩa rằng chúng có thể
được xem xét như một hàm trạng thái của đối tượng, x, xem hình 1.3.
Hình 1.3 đối tượng và nhiễu phát sinh
1.3.1. Một ví dụ về vị trí ma sát độc lập.
Giống như đối tượng động học, các nhiễu tái sinh có thể được bù bởi một bộ điều
khiển feed-forward.
Để bù chính xác cho hệ thống động học và nhiễu tái sinh, yêu cầu cần phải có
một mô hình chi tiết. Sự không chính xác về mô hình có thể làm cho bộ điều khiển
feed-forward vận hành kém. Khi một mô hình chính xác khó có thể xác định được,
thì một phương pháp thay thế có thể được thực hiện.
Thay vì đi thiết kế một bộ điều khiển feed-forward dựa trên những đặc điểm cơ
bản của mô hình thực hiện bộ điều khiển feed-forward giống như là một hàm xấp xỉ,
ví dụ như là
,F rFU
. Trong suốt quá trình điều khiển, quan hệ vào/ra của hàm
xấp xỉ được tự thích ứng để học các đối tượng nghịch đảo và để bù các nhiễu phát
sinh. Khó khăn chính ở đây là lựa chọn tín hiệu học mà chỉ ra được mối quan hệ
vào/ra của hàm xấp xỉ phải được tương thích như thế nào. Tín hiệu học có thể thu
được theo rất nhiều cách. Theo lý thuyết đã chứng minh chỉ ra rằng khi đầu ra của
u +
+
P
y
x
d(x)
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 9
F
bộ điều khiển phản hồi được sử dụng làm tín hiệu học (hình 1.2) thì quan hệ vào/ra
của hàm xấp xỉ hội tụ tới đối tượng nghịch đảo và giá trị bù của nhiễu tái sinh.
Loại hàm xấp xỉ mà chúng ta sử dụng ở đây là mạng nơron MLP.
93,3,3,2,2,2,1,1,1, Rr
T
ddddddddd
(1.1)
Trong trường hợp cánh tay 3 bậc tự do (Degrees Of Freedom DOF) sử dụng kinh
nghiệm, đầu vào của MLP bao gồm góc khớp đặt θd và đạo hàm bậc 1 bậc 2 của
chúng:
Trong khi đầu ra uF được xét dưới dạng lực xoắn động cơ; (công thức 1.2)
3321 Ru
T
F
(1.2)
Bộ điều khiển phản phản hồi. Như đã được nói tới, bộ điều khiển phản hồi
trạng thái, đem lại các tín hiệu học cho bộ điều khiển feed-forward. Hơn thế, nó xác
định quá trình bám cực tiểu tại thời điểm bắt đầu học. Cuối cùng, bộ điều khiển phản
hồi bù các nhiễu ngẫu nhiên.
Bộ điều khiển FEL đã được thực hiện trong nhiều ứng dụng của nhiều tác giả; ví dụ
như là:
- Hệ thống phanh tự động cho ôtô.
- Điều khiển hệ thống camera.
- Điều khiển cánh tay robot.
- Máy hàn.
Các ứng dụng chỉ ra rằng bộ điều khiển FEL đã cải thiện một cách rõ ràng dựa
trên quá trình vận hành của bộ điều khiển phản hồi và các ứng dụng này cũng chỉ ra
có thể thu được chất lượng bám cao mà không cần mô hình mở rộng. Cách hoạt
động của một bộ FEL được so sánh với cách hoạt động của hệ thống điều khiển
thích nghi. Kết luận rằng, trong trường hợp mô hình đối tượng chính xác được sử
dụng trong các hệ thống điều khiển thích nghi, quá trình bám của bộ điều khiển
thích nghi và của bộ điều khiển FEL là tương tự như nhau. Khi FEL hội tụ chậm hơn
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 10
bộ điều khiển thích nghi, trong tình huống này bộ điều khiển thích nghi được ưa
chuộng hơn. Tuy nhiên khi chưa có một mô hình đối tượng chính xác, thì bộ điều
khiển thích nghi sẽ không thể thu được hiệu suất bám như mong muốn. Bộ điều
khiển FEL không phải trải qua điều này và nó vẫn đem lại hệ số bám chính xác. Khả
năng này nâng cao giả thiết rằng bộ FEL có phù hợp cho hang loạt các ứng dụng mở
rộng khi trong thực tế các đối tượng thường khó có một mô hình chính xác. Câu hỏi
đặt ra là nếu xét về mặt thương mại thì nên sử dụng bộ điều khiển nào? Để trả lời
cho câu hỏi này chúng ra sẽ đi đánh giá xem bộ điều khiển FEL có đáp ứng được
đầy đủ các chỉ tiêu chất lượng mà ta đã đưa ra trong mục 1.2 hay không.
Dễ dàng sử dụng trên hệ thống điều khiển có sẵn. Sự mở rộng duy nhất đối với
hệ thống điều khiển có sẵn là hàm xấp xỉ. Khi hệ thống điều khiển được thực hiện
bằng phần mềm điều này yêu cầu ít có sự thay đổi và có thể dễ dàng được thực hiện.
Sự hợp nhất các kiến thức quan trọng trong thiết kế. Khi cấu trúc của đối tượng
động học được xác định, thì mạng MLP trong bộ điều khiển feed-forward có thể
tách ra thành một vài mạng MLP nhỏ hơn. Mỗi một mạng con này sẽ bù cho một
phần riêng biệt của đối tượng động học. Những thí nghiệm đã chỉ ra rằng mạng này
đã nâng tốc độ học lên đáng kể.
Sự ổn định được xác lập. Điều này đã được chứng minh bằng lý thuyết rằng bộ
điều khiển FEL sử dụng cho điều khiển cánh tay robot cho kết quả hội tụ. Với các hệ
thống khác, sự ổn định chưa được xét đến trên phương diện lý thuyết.
Đáp ứng ngắn hạn tốt. Trong quá trình học, sai số bám sẽ dần hội tụ đến giá trị
cực tiểu của nó. Giống như sự ổn định, đáp ứng ngắn hạn cũng chưa được xét tới
trên phương diện lý thuyết.
Hàm xấp xỉ phù hợp cho việc điều khiển. Rất nhiều các giá trị thực của bộ một
LC phụ thuộc vào loại hàm xấp xỉ được sử dụng. Mặc dù thực tế là bộ điều khiển
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 11
FEL cũng đạt được chất lượng bám cao nhưng cách học không phải là tối ưu cho
mạng MLP.
Yêu cầu bộ nhớ nhỏ. Một trong số những thuộc tính tốt của MLP là nó có thể
xấp xỉ các hàm mục tiêu đa chiều với một số ít các thông số. Do đó tổng dung lượng
bộ nhớ của máy tính yêu cầu cho việc thực hiện là rất nhỏ.
Tốn kém cho việc tính toán giá trị. Việc tính toán đầu ra của mạng MLP và
trọng số của bộ thích nghi bao gồm một số lượng lớn các tính toán phức tạp. Do đó,
với một số ứng dụng điều khiển thời gian thực thì loại mạng mạng nơron này có thể
không phù hợp.
Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ. Cơ chế học dễ
dàng đạt được tại vùng giá trị cực tiểu cục bộ. Hàm trọng lượng của mạng kết thúc ở
vùng cực tiểu nào phụ thuộc vào hàm trọng lượng ban đầu của mạng. Do đó nó cần
phải thực hiện nhiều thử nghiệm huấn luyện mạng với các cài đặt hàm trọng lượng
ban đầu khác nhau, để thu được độ bám chính xác có thể chấp nhận được.
Có khả năng tổng quát hoá tốt. Một thuận lợi thực tế là mối quan hệ vào ra chỉ
có thể thích ứng toàn bộ đó là khi MLP có khả năng tổng quát tốt khi quá trình huấn
luyện được thực hiện một cách tổng thể. Khi một hệ thống chuyển động phải vận
hành ở tốc độ thấp, bộ điều khiển FEL có khuynh hướng đưa ra hiệu suất kém. Điều
này là do thực tế mạng MLP gặp khó khăn trong việc học các dữ liệu có tương quan
với nhau ở mức cao. Khi các dữ liệu có tương quan với nhau ở mức cao, mạng có
khuynh hướng chuẩn hoá tín hiệu theo dữ liệu cuối cùng, kết quả là đưa ra khả năng
khái quát hoá kém.
Sự trơn tru của các giá trị xấp xỉ là không hoàn toàn điều khiển được. Số lượng
các thông số của một bộ MLP quyết định tính chính xác cực đại của giá trị xấp xỉ.
Nó không đảm bảo được độ trơn tru nhất định. Nhờ việc học, mạng MLP có thể xấp
xỉ rất gần các hàm mục tiên trong phạm vi đầu vào và rất chính xác ở phần còn lại.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 12
Nhìn vào các thuộc tính ở trên, ta có thể kết luận rằng trong trường hợp mà cách
học tốt, bộ điều khiển FEL có khả năng đáp ứng rất tốt. Các nghiên cứu khác nhau
nhằm mục đích khắc phục các vấn đề tồn tại của bộ điều khiển FEL. Theo đó ta sẽ
giới thiệu tóm lược 3 phương pháp: 2 phương pháp đầu thay đổi cấu trúc của bộ điều
khiển học. Trong khi ở phương pháp còn lại loại hàm xấp xỉ khác đựơc sử dụng.
Trước tiên, phương pháp thứ nhất có thể cải thiện cách học bằng cách chọn các
đầu vào khác nhau cho hàm xấp xỉ. Sai số tín hiệu được thêm vào như một đầu vào
của bộ xấp xỉ, điều này sẽ làm thay đổi bộ điều khiển LC từ chỗ hoàn toàn là 1 bộ
điều khiển feed-forward nguyên bản chuyển sang bộ điều khiển feed-forward (hình
1.4). Các thí nghiệm đã chỉ ra rằng bộ LC này khắc phục được một số lỗi của bộ
điều khiển FEL gốc.
Hình 1.4 Học theo sai số phản hồi.
Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một bộ
được huấn luyện để thực hiện một nhiệm vụ cụ thể. Một mạng neural giám sát học
xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào. Bộ LC này đã được
kiểm tra trên tay máy mà phải thực hiện các chuyển động với các đối tượng có trọng
lượng khác nhau. Sau khi học, mỗi bộ điều khiển feed-forward đã học sẽ phải đảm
r
-
Hµm xÊp xØ
C
+ +
+
UF
P
y
r (n)
r
.
. .
.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 13
nhiệm cho một đối tượng xác định. Mạng giám sát đã học từ bộ điều khiển feed-
forward nào được áp dụng cho đối tượng đó.
Khi mạng MLP là nguyên nhân chính gây nên các khó khăn của điều khiển FEL,
một phương pháp rõ ràng ở đây là phải tìm ra những hàm xấp xỉ khác nhau. Mạng
MLP được thay thế bởi mạng (Cerebellar Model Articulation Controller CMAC).
Mạng CMAC phụ thuộc vào các lớp mạng nơron mà làm việc với hàm cơ sở. Trong
trường hợp mạng CMAC, hàm cơ sở bao gồm các hàm đa thức thông minh mà có
giá trị khác không trên phần không gian đầu vào. Ở mỗi điểm trong không gian đầu
vào p các hàm cơ sở chồng chéo lên nhau. Thông số của p được biết đến như là một
thông số khái quát hoá và có thể được lựa chọn bởi nhà thiết kế. Đầu ra của mạng
CMAC là tổng các trọng số của hàm ước lượng cơ sở. Việc học được tiến hành bằng
cách mô phỏng theo các trọng số của mạng, chứ không phải là theo bản thân các
hàm cơ sở. Tất cả điều này nhằm mục đích cải thiện những vấn đề sau:
Độ hội tụ nhanh hơn. Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏ các
hàm trọng lượng được thích nghi, gây ra độ hội tụ nhanh.
Có thể học các dữ liệu tương quan. Các vùng của hàm cơ sở đã được trộn lẫn,
điều này có ích cho quá trình học các dữ liệu tương quan.
Không có cực tiểu cục bộ. Cơ cấu học không trải qua vùng cực tiểu cục bộ.
Tuy nhiên một bất lợi là người thiết kế bộ điều khiển phải lựa chọn sự phân
phối của các hàm cơ sở. Điều này yêu cầu phải có một số kiến thức nền tảng về ánh
xạ vào/ra theo mong muốn và việc điều chỉnh sự phân phối của hàm cơ sở là cần
thiết trước khi đạt được hiệu suất có thể chấp nhận được. Các nghiệm thí đã chỉ ra
rằng việc thay thế mạng MLP bởi mạng CMAC đem lại một quá trình học tốt hơn và
độ bám chính xác hơn.
1.4. Điều khiển truyền thẳng tự học.
Trong luận văn này một hệ thống LC được xét có cấu trúc tương tự như cấu
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 14
trúc của bộ điều khiển FEL (hình 1.2). Tuy nhiên, phần feed-forward của bộ điều
khiển LC được thực hiện giống như mạng B-Spline (BSN) thay vì mạng MLP. Loại
điều khiển FEL được gọi là LFFC. Phương pháp BSN cũng tương tự như phương
pháp CMAC. Giống như mạng CMAC, mạng BSN sử dụng các hàm cơ bản còn gọi
là B-Spline để xấp xỉ hoá.
Trong thiết kế LFFC các thông số sau của BSN phải được lựa chọn :
1.4.1. Đầu vào của mạng BSN.
Đối với các hệ thống chuyển động, các đầu vào của BSN bao gồm các vị trí
đặt, r, và các đạo hàm của nó (xem hình 1.2).
1.4.2. Sự phân bố B-Spline trên đầu vào của mạng BSN.
Đầu ra của BSN là tổng trọng lượng của các B- spline ước lượng . Do đó, số
lượng của các B-Spline và các vị trí của chúng quyết định tính chính xác của giá trị
xấp xỉ. Các tín hiệu đích có dạng trơn có thể được xấp xỉ một cách chính xác với
một số lượng thấp các B-Spline “rộng”. Các tín hiệu có độ dao động lớn yêu cầu
một số lượng lớn các B-Spline “hẹp” (xem hình 1.5)
Hình 1.5 ánh xạ BSN
B-splines
μ
uF
0
1
--==Hàm mục tiêu --==Hàm xấp xỉ
r[m]
r[m]
Hàm xấp xỉ
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 15
Một khả năng riêng biệt của việc phân bố các B-Spline có thể được tạo ra trên cơ sở
kiến thức của đối tượng nghịch đảo và của các nhiễu, hoặc nhờ một tiến trình lặp đi
lặp lại sử dụng các dữ liệu thực nghiệm.
1.4.3. Sự lựa chọn các cơ cấu học.
Tự học ví dụ như là sự thích nghi của các trọng số mạng có thể được tiến
hành sau mỗi một mẫu - được biết tới gọi là học trực tuyến hoặc sau mỗi chuyển
động đã được thực hiện xong - được gọi là off-line learning.
Luật online learning như sau:
)()( rerw ii
(1.3)
Và luật offline learning như sau:
s
s
N
i
ji
N
i
jji
i
r
rer
w
1
1
)(
)()(
(1.4)
với:
rj: đầu vào của BSN. Trong LFFC đầu vào bao gồm cả vị trí đặt và đạo hàm
của nó
,....,, jjj rrrf
)( ji r
: thành phần của B-Spline thứ I
1.0)( ji r
i
: sự thích nghi của trọng số B-Spline thứ i
: tỷ lệ học 0 <
1
)( jre
: Sai số xấp xỉ được tạo bởi mạng, trong LFFC e(rj) là đầu ra của bộ điều
khiển phản hồi uC;
Ns: Số lượng các mẫu đầu vào.
1.4.4. Sự lựa chọn tốc độ học.
Tốc độ học càng lớn thì độ hội tụ của kỹ thuật học càng nhanh. Tuy nhiên
một tốc độ học mà lớn thì sẽ làm cho giá trị xấp xỉ thêm nhạy cảm với nhiễu và có
thể là nguyên nhân gây mất ổn định.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 16
Bằng việc sử dụng BSN, ta đã có các ưu điểm sau:
Không có cực tiểu cục bộ. Đầu ra của BSN là một hàm trọng số tuyến tính.
Điều này có nghĩa là các kỹ thuật học được đưa ra trong (1.3) và (1.4) không trải
qua vùng cực tiểu cục bộ. Điều này nhấn mạnh rằng các trọng số đầu của BSN
không ảnh hưởng đến độ chính xác tự hiệu chỉnh cuối cùng.
Học cục bộ. Khi B-Spline có một nền tảng chắc chắn, ánh xạ vào/ra của
BSN có thể thích nghi một cách cục bộ. Việc huấn luyện một chuyển động mới
không nhất thiết phải ảnh hưởng tới khả năng hiệu chỉnh các chuyển động đã học
trước đó. Hơn thế nữa, do nền tảng chắc chắn của B-Spline chỉ có một số lượng
nhỏ các trọng số góp phần cho đầu ra, trong quá trình huấn luyện, chỉ có các
trọng số cần cần được đáp ứng. Điều này trái ngược với MLP nơi mà tất cả các
trọng số của mạng bị thay đổi trong suốt quá trình học. Do đó, BSN hội tụ nhanh
hơn nhiều so với MLP.
Sự chính xác trong điều chỉnh. Độ trơn của quan hệ vào/ra là xác định
được bằng cách chọn phân bố B-spline. Việc chọn B-spline mà có nền tảng vững
chắc hơn, làm cho BSN có được giá trị xấp xỉ dữ liệu ở miền cao tần chính xác
hơn. Khi mà, do sự giới hạn của cơ cấu chấp hành, ví dụ, với một giá trị xấp xỉ
trơn hơn của dữ liệu được yêu cầu ở một phần xác định của không gian đầu vào,
B-spline nên được sử dụng để có một nền tảng rộng hơn hoặc thức bậc cao hơn.
Trong trường hợp của MLP, người dùng không thể xác định được độ trơn của
các phần khác nhau trong không gian đầu vào, thay vào đó MLP xác định rõ vị
trí nguồn của nó.
Cho tới nay mạng CMAC cũng đã nắm bắt được những thuận lợi đã được liệt kê
ở trên của mạng BSN. Chúng ta chọn BSN bởi vì nó đơn giản. Trong mạng
CMAC các hàm phân bố cơ bản là các hàm mà ở mỗi giá trị đầu vào hàm cơ sở
chính xác p có một định lượng lớn hơn 0. Một số hàm phân bố thoả mãn điều
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 17
này và mỗi hàm như vậy dẫn đến một giá trị xấp xỉ khác nhau. Người sử dụng
phải chọn hàm phân bố nào là có khả năng xấp xỉ tốt nhất. Hơn thế, việc chọn
lọc một giá trị xấp xỉ bằng cách thêm một số ràng buộc (thêm một hàm cơ sở),
kết quả sẽ có được hàm phân bố cơ sở khác. Điều này có thể là không được như
mong muốn cho lắm. Sự phân bố của các hàm cơ bản trong BSN là không phức
tạp lắm.
Hạn chế chính của các BSN (và của các NN với các hàm cơ bản) đó là số lượng
các trọng số mạng tăng theo hàm mũ với kích thước của không gian đầu vào. Số
lượng các trọng số trong một BSN - N chiều được cho bởi:
N
j
jt NN
1
(1.5)
Với Nj là số lượng của B-Spline được định nghĩa ở đầu vào thứ j. Khi xét tới độ
chính xác có thể sẽ yêu cầu nhiều B-Spline và vì vậy giá trị của Nj sẽ lớn hơn, ví
dụ khi một hàm phi tuyến ở mức độ cao được xấp xỉ hoá, các mạng này là không
thực tế khi số lượng đầu vào quá lớn. Điều này được gọi là sai lệch về kích
thước và nó mang lại một số các vấn đề sau:
Số lượng lớn các trọng số mạng. Nếu các đối tượng động học có thành
phần phi tuyến ở mức độ cao, một hàm phi tuyến ở mức độ cao có thể bị ánh xạ
bởi mạng B-Spline. Một mạng mà có khả năng ánh xạ những phi tuyến này một
cách chính xác sẽ chiếm một phần lớn dung lượng lớn của bộ nhớ máy tính.
Trong thực tế, các nguồn bộ nhớ là có giới hạn, do đó mạng phức hợp và ánh xạ
chính xác của nó phải được cân bằng với nhau.
Các bộ huấn luyện rộng. Khi thực thi một sự chuyển động định trước, chỉ
có các trọng số mạng được lập bởi các đầu vào của mạng là được cập nhật. Để
thích ứng một số lượng lớn các trọng số mạng, yêu cầu cần phải có một số lượng
lớn các huấn luyện chuyển động. Điều này sẽ dẫn tới nhiều lần huấn luyện nếu
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 18
mạng được huấn luyện trực tuyến ví dụ trong suốt quá trình điều khiển.
Khả năng khái quát kém. Việc bù của bộ phi tuyến có thể yêu cầu các
B-Spline hẹp để thoả mãn các yêu cầu về độ chính xác. Tuy nhiên, với các B-
Spline hẹp, các tín hiệu đầu ra của mạng rất khác nhau có thể xảy ra với các
đường cong quỹ đạo mà “gần với nhau”. Vì lý do đó, mà các bộ huấn luyện rộng
được đề cập ở trên đáp ứng được tất cả những gì cần thiết mà phải đưa ra trước
khi đề cập tới hiệu quả lợi ích thu được.
Có thể thấy rằng sai lệch về kích thước có thể gây hại nghiêm trọng tới
giá trị thương mại của LFFC. Do đó, nên cố gắng để vượt qua sự sai lệch về kích
thước.
1.5. Ứng dụng minh hoạ: Hệ thống chuyển động động cơ tuyến tính.
Một ứng dụng thú vị của LC là động cơ tuyến tính đồng bộ dùng nam châm
vĩnh cửu. Các động cơ tuyến tính thường được thiết kế để thực hiện các chuyển
động tuyến tính với độ chính xác nhỏ hơn mm ví dụ như cắt lazer, máy quét, hoặc
các máy thực hiện nhiệm vụ gắp - đặt. Động cơ tuyến tính được xét ở đây còn được
gọi là Hệ thống chuyển động động cơ tuyến tính (Linear Motor Motion System
LiMMS) được chế tạo bởi Philips. Cấu trúc động cơ bao gồm phần tĩnh bao phủ bởi
đế kim loại và một phần động. Phần động này chứa cuộn điện và lõi sắt xem hình
1.6. Bằng cách cung cấp dòng điện 3 pha vào trong mỗi cuộn dây của phần động sẽ
tạo ra một chuỗi lực hút và đẩy giữa các cực và đế kim loại. Kết quả là gây ra sự
chuyển động giữa phần động và phần tĩnh . Các hoạt động cơ bản của động cơ là
chuyển động gia trọng: trọng lượng của phần động với một tải (tải giả định), mL, có
giá trị là 37(kg).
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 19
Hình 1.6: Nguyên lý làm việc của động cơ tuyến tính LiMMS
Các đường chỉ thị là các đường cong từ hoá với A B C là các pha của dòng động
cơ 3 pha.
Trong quá trình làm việc, phần động sẽ chịu ảnh hưởng của các lực nhiễu tần
số cao gây ra được gọi là lực dao động. Lực này được tạo bởi 2 nguyên nhân sau:
Trước hết, một tương tác trường điện từ mạnh tồn tại giữa trường điện từ gây
ra bởi nam châm trên phần tĩnh và lõi sắt trên đó có gắn các cuộn dây của phần
động. Lõi sắt này có nhiệm vụ chính là để tăng hiệu quả làm việc của động cơ. Lực
nhiễu này, được gọi là lực cogging, cố gắng căn chỉnh lõi sắt và nam châm để ổn
định vị trí của phần động (vị trí chốt). Lực cogging này chỉ phụ thuộc vào mối qua
hệ giữa vị trí của phần động với nam châm. Nó độc lập với dòng động cơ. Để đơn
giản hoá trong mô phỏng, lực cogging, FC[N] , được mô hình hoá bởi dạng nhiễu
đầu vào hình sin với biên độ 10 [N] và bước sóng 1,6.e-2(m) phụ thuộc vào vị trí của
động cơ y[m]:
FC(y) = 10sin (1.6e
-2
y) (1.6)
Thứ hai là lực dao động có thể được tạo ra bởi sai số trong quá trình đảo
mạch. tức là cách cung cấp dòng cho cuộn dây. Khi chuyển động một cuộn dây
thông qua trường điện từ biến thiên, một từ trường ngược sẽ được tạo ra phụ thuộc
vào vận tốc của cuộn dây trong một đường tuyến tính. Nếu dòng cấp cho cuộn dây
S
N
S
N
S
N
S
N
S
N
ΦA ΦB ΦC ΦA
translator
Base plate
coils
Permanent
magnets
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 20
không cân xứng với một từ trường ngược thì khi đó lực dao động sẽ phụ thuộc vào
vị trí và vận tốc của phần động. một từ trường ngược có thể tính toán được từ một
mô hình chi tiết của phần động và nam châm trên phần tĩnh. Điều này yêu cầu về vị
trí và thuộc tính điện từ của trường điện từ phải được biết một cách chính xác. Trong
trường hợp LiMM sử dụng nam châm giá rẻ thì sẽ dẫn tới dung sai về từ tính lớn.
Hơn thế nữa, các nam châm không được đặt ở vị trí chính xác cao nhất nên sẽ khó
có thể thu được mô hình cần thiết để tính toán sự đảo mạch và do vậy sẽ gây ra các
lực dao động. Ảnh hưởng này không được đưa vào trong mô hình mô phỏng.
Các nhiễu khác tác động lên LiMMS là hiện tượng lực ma sát trong vòng bi
giữa phần động và rãnh dẫn hướng đỡ nó. Giả thiết các đặc tính của cơ cấu ma sát
thực có thể được mô tả bởi đường cong Stribeck, nghĩa là lực ma sát bao gồm ma sát
Coulomb ma sát, ma sát Stiction và ma sát Viscous. Trong mô hình mô phỏng chỉ
xét ma sát Viscous dL = 10 [Nms]:
yyFV 10
(1.7)
Kết quả mô hình mô phỏng như hình 1.7
Hình 1.7: mô hình LiMMS
Chương 2 sẽ trình bày kết quả với một LiMMS thực.
+ +
y
+
-
y
..
y
.
.
FV
FC
dL
coogging
mL
1
s
1
s
1
r
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 21
1.6. Bố cục luận văn.
Chương 2: Phân tích tính ổn định của các chỉ số -Thời gian LFFC
Sự ổn định lâu dài là một tài sản cần thiết cho một học điều khiển. Để có thể phân
tích sự ổn định của các LFFC, ta xét một loại chuyển động đặc biệt là chuyển động
lặp. Trong trường hợp này, LFFC sẽ trở nên tương tự như hai loại điều khiển học
khác là: Điều khiển học tương tác (Iterative Learning Control ILC) và điều khiển lặp
(Repetitive Control RC). Việc phân tích tính ổn định chặt chẽ tồn tại trong cả hai bộ
ILC và RC. Trên cơ sở đó, việc một sự phân tích ổn định của LFFC sẽ được thực
hiện. Việc phân tích tính ổn định sẽ cho ta cái nhìn sâu sắc hoạt động học của LFFC
và cung cấp các quy tắc cho việc lựa chọn đúng đắn các tham số thiết kế.
Chương 3: Thiết kế ứng dụng
Ở chương này, các lý thuyết đã được làm rõ trong các chương trước được sử dụng
thực hiện thủ tục thiết kế cho LFFC. Thủ tục này sẽ được áp dụng cho hệ thống
LiMMS đã được trình bày trong phần 1.5.
Chương 4: Thảo luận
Chúng tôi sẽ thảo luận các kết quả của các chương trước đó và rút ra kết luận.
Các file đính kèm theo tài liệu này:
- Luận văn- Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ.pdf