Luận án đạt được một số kết quả chính như sau:
1) Đề xuất mở rộng lý thuyết đại số gia tử biểu diễn lõi ngữ nghĩa của các từ ngôn ngữ
nhằm cung cấp một cơ sở hình thức cho việc sinh tự động ngữ nghĩa tính toán dựa trên tập
mờ có lõi là một khoảng của khung nhận thức ngôn ngữ. Luận án nghiên cứu trường hợp
cụ thể là ngữ nghĩa dựa trên tập mờ hình thang.
2) Ứng dụng lõi ngữ nghĩa và ngữ nghĩa tính toán dựa trên tập mờ hình thang của
khung nhận thức ngôn ngữ giải bài toán thiết kế tự động FLRBC. Các kết quả thực nghiệm
luận án thực hiện đã cho thấy tính hiệu quả và tính khả dụng của ĐSGT mở rộng luận án
đề xuất.
3) Nghiên cứu các yếu tố ảnh hưởng đến hiệu quả của các phương pháp thiết kế
FLRBC với ngữ nghĩa tính toán của từ ngôn ngữ được xác định dựa trên ĐSGT và đề xuất
giải pháp nâng cao hiệu quả thiết kế FLRBC dựa trên kỹ thuật tính toán mềm.
Trong tiếp cận thiết kế hệ phân lớp dựa trên ĐSGT tồn tại những hạn chế cần có những
nghiên cứu tiếp theo cũng như mở rộng ứng dụng ĐSGT như sau:
- Các phương pháp thiết kế FLRBC với ngữ nghĩa tính toán của các từ ngôn ngữ
được xác định dựa trên ĐSGT được đề xuất từ trước đến nay đều được thực hiện dựa trên
hai giai đoạn là thiết kế tối ưu các từ ngôn ngữ và tìm kiếm hệ luật tối ưu. Việc chia giai
đoạn này có thể chưa đảm bảo tìm được bộ tham số ngữ nghĩa và hệ luật tốt nhất. Giải
pháp có thể được cải tiến ở đây là nghiên cứu áp dụng kỹ thuật đồng tối ưu các tham số
ngữ nghĩa và tìm kiếm hệ luật tối ưu.
- Tiếp cận thiết kế FLRBC trong luận án sử dụng ĐSGT để trích rút hệ luật ngôn ngữ
mờ cho hệ phân lớp với ngữ nghĩa của các từ ngôn ngữ trong cơ sở luật là ngữ nghĩa dựa
trên tập mờ. Do đó, khi lập luận phân lớp sử dụng phương pháp lập luận Single winner
rule hay Weighted vote đều phải sử dụng các phép toán trên tập mờ và kết quả phụ thuộc
vào việc lựa chọn các phép toán này. Với ĐSGT, ta có thể xây dựng phương pháp lập luận
riêng mà không cần sử dụng tập mờ. Một trong các hướng nghiên cứu tiếp theo là xây
dựng phương pháp lập luận cho FLRBC hoàn toàn sử dụng ĐSGT.
- Trong thực tế tồn tại nhiều dạng bài toán phân lớp khác nhau đang được các nhà
nghiên cứu quan tâm giải quyết bằng FLRBC như: Bài toán phân lớp đối với tập dữ liệu
lớn, bài toán phân lớp đối với các tập dữ liệu thiếu thông tin, bài toán phân lớp đối với các
tập dữ liệu có số mẫu dữ liệu không cân bằng đối với các nhãn lớp, bài toán học nửa giám
sát, bài toán học trực tuyến, Đây là các bài toán cần những kỹ thuật xử lý khác nhau và
có thể được giải quyết hiệu quả kết hợp với phương pháp luận ĐSGT.
Luận án đã chứng tỏ khả năng ứng dụng hiệu quả của ĐSGT mở rộng trong thiết kế tự
động FLRBC. ĐSGT mở rộng cần được ứng dụng trong việc giải quyết các bài toán ứng
dụng khác nhau như các bài toán điều khiển, thao tác cơ sở dữ liệu mờ và nhận dạng hệ
mờ nhằm tăng tính hiệu quả và tính linh hoạt trong biểu diễn ngữ nghĩa
27 trang |
Chia sẻ: yenxoi77 | Lượt xem: 590 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận văn Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
của U có thể được biểu diễn dưới dạng các tập mờ như
1
200 150
rất nhanh
nhanh
lõi
8
trong Hình 2.1. Ký hiệu Core(x) là lõi ngữ nghĩa của của x thì Core(x) = {u: x(u) = 1} và
ngữ nghĩa của x là tập Sem(x) = {u: x(u) (0, 1]}. Lõi ngữ nghĩa của hai từ ngôn ngữ bất
kỳ x, y X và ngữ nghĩa tương ứng của chúng thỏa các điều kiện sau:
(C1) Core(x) Sem(x);
(C2) Nếu x ≤ y thì Core(x) ≤ Core(y), Core(x) ≤ Sem(y) và Sem(x) ≤ Core(y).
Trong phương pháp hình thức hóa ĐSGT, lõi ngữ nghĩa của từ ngôn ngữ x cần được
sinh từ gia tử nên một gia tử nhân tạo h0 được bổ sung nhằm cảm sinh lõi ngữ nghĩa của x
là h0x. Việc mở rộng một ĐSGT tuyến tính AX được thực hiện như sau.
Định nghĩa 2.1. Mở rộng ngữ cảnh của một ĐSGT tuyến tính và tự do AX = (X, C, G, H,
) là ĐSGT mở rộng AXmr = (Xmr, C, G, Hmr, ), trong đó C cũng là tập các hằng tử của
AXmr, Hmr = HI {h0} = H
+ H {I, h0}, ở đó H
= {h-q, , h-2, h-1}, h-q < ... < h-2 < h-1
và H+ = {h1, h2 ,... , hp}, h1 < h2 < ... < hp, nghĩa là HI = H {I}, X
mr = X {h0x | x X}
và ≤ là quan hệ thứ tự mở rộng của X trên Xmr, nếu nó thỏa các tiên đề sau:
(A1) Toán tử đơn vị V trong H+ là dương hoặc âm đối với đối với mọi gia tử trong H.
Chẳng hạn V là dương đối với chính nó và đối với L trong H-.
(A2) Nếu u, v X là độc lập, tức là u HI(v) và v HI(u) thì x HI(u) x HI(v).
(A3) Kế thừa gia tử: Với x X, h, k, h’, k’ H, ta có:
(i) x ≠ hx x HI(hx).
(ii) h ≠ k & hx kx h’hx k’kx.
(iii) hx ≠ kx thì hx và kx là độc lập.
(A4) u X, nếu v HI(u) và v u (v ≥ u) thì v hu (v ≥ hu) với h HI.
(A5mr) Các tiên đề cho lõi ngữ nghĩa của từ ngôn ngữ: với x, y Xmr và x ≠ y,
(i) hh0x = h0x với h H
mr và với x X, h0x = x khi và chỉ khi x là hằng,
ngược lại x và h0x là không sánh được.
(ii) Với ∀ , ∈ , < ⟹ ℎ < & < ℎ . □
Các tiên đề của AXmr được bổ sung nhằm mục đích mô tả các đặc trưng của lõi ngữ
nghĩa của các từ ngôn ngữ dưới dạng quan hệ thứ tự.
Định lý 2.1. Cho AXmr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT tuyến
tính và tự do AX = (X, C, G, H, ). Khi đó,
(i) Xmr = X {h0x: x X \ C } và với x C, h0x X.
(ii) x, y Xmr, x ≠ y, ta có < ⟺ < ℎ ⟺ ℎ < ⟺ ℎ < ℎ . Vì vậy
tập {h0x: x X} được sắp tuyến tính.
(iii) Tập
= ∪{ℎ : ∈ ( )} được sắp tuyến tính. □
Định lý sau khẳng định các tiên đề từ (A2) đến (A4) vẫn đúng đối với AXmr .
Định lý 2.2. Cho AXmr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT tuyến
tính và tự do AX = (X, C, G, H, ). Nếu các tập X và H xuất hiện trong các tiên đề (A2),
9
(A3), (A4) được thay thế tương ứng trong bởi Xmr và Hmr thì các mệnh đề được ký hiệu
tương ứng là (A2mr), (A3mr), (A4mr) vẫn đúng đối với AXmr. □
Định lý 2.3. Mọi từ ngôn ngữ được cảm sinh từ AXmr có biểu diễn chính tắc duy nhất. □
2.2. MỞ RỘNG KHÁI NIỆM ĐỘ ĐO TÍNH MỜ
Để bảo đảm tính linh hoạt trong ứng dụng, ta giả thiết độ đo tính mờ của phần tử trung
hòa W là khác 0, tức fm(W) ≠ 0. Khi đó, hệ tiên đề của độ đo tính mờ mở rộng của AXmr
được phát biểu như sau:
Định nghĩa 2.2. Cho AXmr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT
tuyến tính và tự do AX. Một hàm fm : Xmr [0,1] được gọi là độ đo tính mờ của ĐSGT
AXmr nếu nó thỏa các tính chất sau:
(fm1) fm(c-) + fm(W) + fm(c+) = 1;
(fm2) hHmr fm(hu) = fm(u), uH(G);
(fm3) h Hmr và x, y H(G) thỏa x, y ≠ h0z thì )(
)(
)(
)(
yfm
hyfm
xfm
hxfm
. □
Tỷ số fm(hx)/fm(x) là không phụ thuộc vào x được gọi đó là độ đo tính mờ của gia tử h
và ký hiệu là (h) và h bao gồm cả h0.
Mệnh đề 2.1. Độ đo tính mờ fm của các từ ngôn ngữ của ĐSGT AXmr được định nghĩa như
trong Định nghĩa 2.2 thỏa các tính chất sau:
(1) fm(hx) = (h)×fm(x) với h Hmr, x H({c, c+}) và hx ≠ x;
(2) fm(x) = (hn)×...×(h1)fm(c), với x = hn...h1c, c {c
, c+} là biểu diễn chính tắc
của x Xmr;
(3) ( ) 1mrh H h ;
(4) ∑ (ℎ ) + ∑ ( ) ∈ = 1 ∈ ( ) với ∀ > 0. Với k = 1, ta có (fm1). □
2.3. HỆ KHOẢNG TÍNH MỜ LIÊN KẾT VỚI ĐỘ ĐO TÍNH MỜ
Gọi PI([0, 1]) là tập tất cả các khoảng con của đoạn [0, 1]. Ta luôn luôn quy ước là các
khoảng đều đóng ở đầu mút trái và mở ở đầu mút phải, trừ khi đầu mút phải là giá trị 1. Ta
có khái niệm khoảng tính mờ của các từ ngôn ngữ của Xmr, (x) với ∈ ( )
=
{ ∈ :| |≤ }= ( ) ∪{ℎ : ∈ ( )}, dựa trên hệ tiên đề của độ đo tính mờ:
Định nghĩa 2.3. Cho một ĐSGT mở rộng AXmr = (Xmr, C, G, Hmr, ) của một ĐSGT tuyến
tính và tự do AX và độ đo tính mờ fm: Xmr [0, 1] thỏa các tính chất trong Định nghĩa
2.2. Giả sử mỗi từ ngôn ngữ x ( )
được liên kết với một khoảng trong PI([0, 1]). Các
khoảng này được gọi là các khoảng tính mờ mức k của các từ ngôn ngữ tương ứng của
AXmr và nó được xây dựng quy nạp theo k như sau:
1) Với k = 1, xây dựng các khoảng tính mờ 1(c
-), 1(W), 1(c
+) với |1(x)| = fm(x),
sao cho chúng có thứ tự tương đồng với thứ tự của các hạng từ c-, W, c+.
10
2) Với k > 1 và xC, xây dựng các khoảng tính mờ k(x) sao cho (i) nếu |x| < k - 1 thì
|k(x)| = |k-1(x)|, (ii) nếu |x| = k - 1 thì |k(x)| = (h0)fm(x), (iii) nếu |x| = k thì |k(x)| =
fm(x), (iv) thứ tự của các khoảng tính mờ tương đồng với thứ tự của các hạng từ x, tức là,
với x, y {hx: h Hmr}, nếu x ≤ y thì k(x) ≤ k(y). □
Thuật toán 2.1. Thuật toán xây dựng hệ khoảng tính mờ.
Đầu vào: Các độ đo tính mờ fm(c-), fm(W), (h) với h Hmr và số k >= 1 xác định độ dài tối đa
của các từ ngôn ngữ. Lưu ý: fm(c+) = 1 - fm(c-) - fm(W).
Đầu ra: là tập các khoảng với nhãn là các từ ngôn ngữ trong ( )
.
Begin
Khởi tạo j = 1 và tập bằng rỗng.
Bước 1: Với j = 1, ta có = 1(c
-) 1(W) 1(c
+), trong đó:
1(c
-) = [0, fm(c-)), 1(W) = [fm(c
-), fm(c-)+ fm(W)), 1(c
+) = [fm(c-) + fm(W), 1].
Nếu k = 1 thì dừng, ngược lại nếu k > 1 thì thực hiện Bước 2.
Bước 2: j = j + 1. Với mỗi từ ngôn ngữ x ( )
thực hiện:
(i) Nếu |x| < j – 1 thì ta có = j(x) với j(x) = j-1(x) .
(ii) Nếu từ ngôn ngữ x thỏa |x| = j – 1 thì:
Nếu Sign(max(Hmr)) = 1 thì lặp l = 1 đến |Hmr| và đặt i = l, ngược lại thì lặp l = |Hmr|
giảm đến 1 và đặt i = |Hmr| – l + 1, để tính các khoảng tính mờ mức j cho các từ hix
được sinh ra từ x với hi H
mr.
Nếu i = 1, j(hix) = [L(j-1(x)), L(j-1(x)) + (hi)|j-1(x)|), ngược lại nếu i > 1 thì,
Đặt Km = R (j(hi-1x)) + (hi)|j-1(x)|. Nếu Km = 1 thì j(hix) = [R (j(hi-1x)),
Km), ngược lại thì j(hix) = [R (j(hi-1x)), 1] (đóng phải).
= j(hix).
Bước 3 (bước lặp): Lặp lại Bước 2 cho đến khi j = k.
Trả lại là tập các khoảng với nhãn là các từ ngôn ngữ trong ( )
.
End.
Ký hiệu L(•) và R (•) là điểm mút trái và mút phải của một khoảng bất kỳ.
Kết thúc thuật toán, ta thu được là tập các khoảng với nhãn là các từ trong ( )
.
Định lý 2.4. Thuật toán 2.1 về xây dựng các khoảng tính mờ là đúng đắn và các khoảng
tính mờ của ( )
có các tính chất sau:
(1) Với mỗi x thỏa |x| = k, khoảng tính mờ mức k của x, k(x), thỏa |k(x)| = fm(x), còn
với x mà |x| < j k, k(x) = I(h0x) và |k(x)| = (h0)fm(x), tức là các hạng từ độ dài ngắn
hơn j có mặt trong ngữ cảnh cùng các hạng từ độ dài j sẽ có ngữ nghĩa bị co lại;
(2) Với mọi x ( )
thỏa |x| = j < k, ta có k(x) = I(h0x) và |k(x)| = (h0)fm(x). Với x
thỏa |x| = j k – 2, ta có k(x) = k-1(x).
(3) Tập tất cả các khoảng tính mờ mức k, FI(k) = {k(x), x ( )
}, có các tính chất:
a- Đối với hạng từ hằng W, ta có k(W) = 1(W);
b- Với mỗi x H({c,c+}) thỏa |x| = k – 1, tập các khoảng tính mờ {k(hx): h H
mr}
là một phân hoạch nhị phân của khoảng tính mờ k-1(x) mức k – 1 của x.
11
c- Các khoảng tính mờ trong FI(k) có thứ tự tương đồng với thứ tự của các hạng từ của
chúng và lập thành một phân hoạch nhị phân của đoạn [0,1]. □
2.4. ÁNH XẠ ĐỊNH LƯỢNG NGỮ NGHĨA KHOẢNG
Định nghĩa 2.4. Cho AXmr là ĐSGT mở rộng của AX tuyến tính và tự do, ánh xạ f : Xmr
PI([0, 1]) được gọi là ánh xạ định lượng ngữ nghĩa khoảng của AXmr nếu nó thỏa các điều
kiện sau:
(IQ1) f bảo toàn thứ tự trên Xmr, tức là nếu x y thì f(x) f(y), với x, y Xmr;
(IQ2) f(Xmr) là tập trù mật trong [0, 1]. □
Định lý 2.5. Cho độ đo tính mờ fm của ĐSGT AXmr và là tập tất cả các khoảng tính mờ
của các từ ngôn ngữ của AXmr được xác định bởi fm. Khi đó ánh xạ f: Xmr PI[0, 1]
được định nghĩa như sau là ánh xạ định lượng ngữ nghĩa khoảng:
f(x) = |x|+1(h0x) PI[0, 1], với x, y X
mr (2.5)
với lưu ý rằng, nếu x = h0z thì f(x) = |x|+1(h0x) = |x|(h0z). □
2.5. MỞ RỘNG ĐỘ ĐO TÍNH MỜ CỦA CÁC PHẦN TỬ 0 VÀ 1
ĐSGT mở rộng AXmr được mở rộng thành ĐSGT mở rộng toàn phần với độ đo tính mờ
của hai phân tử 0 và 1 khác 0 và được ký hiệu là AXmrtp. Khi đó, hệ tiên đề của độ đo tính
mờ mở rộng của AXmrtp được phát biểu như sau:
Định nghĩa 2.5. Cho một ĐSGT mở rộng toàn phần AXmrtp = (Xmr, C, G, Hmr, ) của một
ĐSGT mở rộng tự do AXmr. Một hàm fm : Xmr [0,1] được gọi là độ đo tính mờ của
ĐSGT AXmrtp nếu nó thỏa các tính chất sau:
(fmc1) fm(0) + fm(c-) + fm(W) + fm(c+) + fm(1) = 1;
(fmc2) hHmr fm(hu) = fm(u), uH(G);
(fmc3) h Hmr và x, y H(G) thỏa x, y ≠ h0z thì fm(hx)/fm(x) = fm(hy)/fm(y). □
Từ Định lý 2.4, điểm mút trái của f(x) qua các độ đo tính mờ với k = |x| được tính:
L(f(x)) = ∑ ( ) ∈ &