Luận văn Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử

Luận án đạt được một số kết quả chính như sau: 1) Đề xuất mở rộng lý thuyết đại số gia tử biểu diễn lõi ngữ nghĩa của các từ ngôn ngữ nhằm cung cấp một cơ sở hình thức cho việc sinh tự động ngữ nghĩa tính toán dựa trên tập mờ có lõi là một khoảng của khung nhận thức ngôn ngữ. Luận án nghiên cứu trường hợp cụ thể là ngữ nghĩa dựa trên tập mờ hình thang. 2) Ứng dụng lõi ngữ nghĩa và ngữ nghĩa tính toán dựa trên tập mờ hình thang của khung nhận thức ngôn ngữ giải bài toán thiết kế tự động FLRBC. Các kết quả thực nghiệm luận án thực hiện đã cho thấy tính hiệu quả và tính khả dụng của ĐSGT mở rộng luận án đề xuất. 3) Nghiên cứu các yếu tố ảnh hưởng đến hiệu quả của các phương pháp thiết kế FLRBC với ngữ nghĩa tính toán của từ ngôn ngữ được xác định dựa trên ĐSGT và đề xuất giải pháp nâng cao hiệu quả thiết kế FLRBC dựa trên kỹ thuật tính toán mềm. Trong tiếp cận thiết kế hệ phân lớp dựa trên ĐSGT tồn tại những hạn chế cần có những nghiên cứu tiếp theo cũng như mở rộng ứng dụng ĐSGT như sau: - Các phương pháp thiết kế FLRBC với ngữ nghĩa tính toán của các từ ngôn ngữ được xác định dựa trên ĐSGT được đề xuất từ trước đến nay đều được thực hiện dựa trên hai giai đoạn là thiết kế tối ưu các từ ngôn ngữ và tìm kiếm hệ luật tối ưu. Việc chia giai đoạn này có thể chưa đảm bảo tìm được bộ tham số ngữ nghĩa và hệ luật tốt nhất. Giải pháp có thể được cải tiến ở đây là nghiên cứu áp dụng kỹ thuật đồng tối ưu các tham số ngữ nghĩa và tìm kiếm hệ luật tối ưu. - Tiếp cận thiết kế FLRBC trong luận án sử dụng ĐSGT để trích rút hệ luật ngôn ngữ mờ cho hệ phân lớp với ngữ nghĩa của các từ ngôn ngữ trong cơ sở luật là ngữ nghĩa dựa trên tập mờ. Do đó, khi lập luận phân lớp sử dụng phương pháp lập luận Single winner rule hay Weighted vote đều phải sử dụng các phép toán trên tập mờ và kết quả phụ thuộc vào việc lựa chọn các phép toán này. Với ĐSGT, ta có thể xây dựng phương pháp lập luận riêng mà không cần sử dụng tập mờ. Một trong các hướng nghiên cứu tiếp theo là xây dựng phương pháp lập luận cho FLRBC hoàn toàn sử dụng ĐSGT. - Trong thực tế tồn tại nhiều dạng bài toán phân lớp khác nhau đang được các nhà nghiên cứu quan tâm giải quyết bằng FLRBC như: Bài toán phân lớp đối với tập dữ liệu lớn, bài toán phân lớp đối với các tập dữ liệu thiếu thông tin, bài toán phân lớp đối với các tập dữ liệu có số mẫu dữ liệu không cân bằng đối với các nhãn lớp, bài toán học nửa giám sát, bài toán học trực tuyến, Đây là các bài toán cần những kỹ thuật xử lý khác nhau và có thể được giải quyết hiệu quả kết hợp với phương pháp luận ĐSGT. Luận án đã chứng tỏ khả năng ứng dụng hiệu quả của ĐSGT mở rộng trong thiết kế tự động FLRBC. ĐSGT mở rộng cần được ứng dụng trong việc giải quyết các bài toán ứng dụng khác nhau như các bài toán điều khiển, thao tác cơ sở dữ liệu mờ và nhận dạng hệ mờ nhằm tăng tính hiệu quả và tính linh hoạt trong biểu diễn ngữ nghĩa

27 trang | Chia sẻ: yenxoi77 | Lượt xem: 846 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Luận văn Phát triển một số phương pháp thiết kế hệ phân lớp trên cơ sở lý thuyết tập mờ và đại số gia tử, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

của U có thể được biểu diễn dưới dạng các tập mờ như 1 200 150 rất nhanh nhanh lõi 8 trong Hình 2.1. Ký hiệu Core(x) là lõi ngữ nghĩa của của x thì Core(x) = {u: x(u) = 1} và ngữ nghĩa của x là tập Sem(x) = {u: x(u)  (0, 1]}. Lõi ngữ nghĩa của hai từ ngôn ngữ bất kỳ x, y  X và ngữ nghĩa tương ứng của chúng thỏa các điều kiện sau: (C1) Core(x)  Sem(x); (C2) Nếu x ≤ y thì Core(x) ≤ Core(y), Core(x) ≤ Sem(y) và Sem(x) ≤ Core(y). Trong phương pháp hình thức hóa ĐSGT, lõi ngữ nghĩa của từ ngôn ngữ x cần được sinh từ gia tử nên một gia tử nhân tạo h0 được bổ sung nhằm cảm sinh lõi ngữ nghĩa của x là h0x. Việc mở rộng một ĐSGT tuyến tính AX được thực hiện như sau. Định nghĩa 2.1. Mở rộng ngữ cảnh của một ĐSGT tuyến tính và tự do AX = (X, C, G, H, ) là ĐSGT mở rộng AXmr = (Xmr, C, G, Hmr, ), trong đó C cũng là tập các hằng tử của AXmr, Hmr = HI  {h0} = H +  H  {I, h0}, ở đó H  = {h-q, , h-2, h-1}, h-q < ... < h-2 < h-1 và H+ = {h1, h2 ,... , hp}, h1 < h2 < ... < hp, nghĩa là HI = H  {I}, X mr = X  {h0x | x  X} và ≤ là quan hệ thứ tự mở rộng của X trên Xmr, nếu nó thỏa các tiên đề sau: (A1) Toán tử đơn vị V trong H+ là dương hoặc âm đối với đối với mọi gia tử trong H. Chẳng hạn V là dương đối với chính nó và đối với L trong H-. (A2) Nếu u, v  X là độc lập, tức là u  HI(v) và v  HI(u) thì x  HI(u)  x  HI(v). (A3) Kế thừa gia tử: Với x  X, h, k, h’, k’  H, ta có: (i) x ≠ hx  x  HI(hx). (ii) h ≠ k & hx  kx  h’hx  k’kx. (iii) hx ≠ kx thì hx và kx là độc lập. (A4) u  X, nếu v  HI(u) và v  u (v ≥ u) thì v  hu (v ≥ hu) với h  HI. (A5mr) Các tiên đề cho lõi ngữ nghĩa của từ ngôn ngữ: với x, y  Xmr và x ≠ y, (i) hh0x = h0x với h  H mr và với x  X, h0x = x khi và chỉ khi x là hằng, ngược lại x và h0x là không sánh được. (ii) Với ∀,∈ , < ⟹ ℎ < & < ℎ. □ Các tiên đề của AXmr được bổ sung nhằm mục đích mô tả các đặc trưng của lõi ngữ nghĩa của các từ ngôn ngữ dưới dạng quan hệ thứ tự. Định lý 2.1. Cho AXmr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT tuyến tính và tự do AX = (X, C, G, H, ). Khi đó, (i) Xmr = X  {h0x: x  X \ C } và với x  C, h0x  X. (ii) x, y  Xmr, x ≠ y, ta có < ⟺ < ℎ⟺ ℎ < ⟺ ℎ < ℎ. Vì vậy tập {h0x: x  X} được sắp tuyến tính. (iii) Tập = ∪{ℎ:∈ ()} được sắp tuyến tính. □ Định lý sau khẳng định các tiên đề từ (A2) đến (A4) vẫn đúng đối với AXmr . Định lý 2.2. Cho AXmr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT tuyến tính và tự do AX = (X, C, G, H, ). Nếu các tập X và H xuất hiện trong các tiên đề (A2), 9 (A3), (A4) được thay thế tương ứng trong bởi Xmr và Hmr thì các mệnh đề được ký hiệu tương ứng là (A2mr), (A3mr), (A4mr) vẫn đúng đối với AXmr. □ Định lý 2.3. Mọi từ ngôn ngữ được cảm sinh từ AXmr có biểu diễn chính tắc duy nhất. □ 2.2. MỞ RỘNG KHÁI NIỆM ĐỘ ĐO TÍNH MỜ Để bảo đảm tính linh hoạt trong ứng dụng, ta giả thiết độ đo tính mờ của phần tử trung hòa W là khác 0, tức fm(W) ≠ 0. Khi đó, hệ tiên đề của độ đo tính mờ mở rộng của AXmr được phát biểu như sau: Định nghĩa 2.2. Cho AXmr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT tuyến tính và tự do AX. Một hàm fm : Xmr  [0,1] được gọi là độ đo tính mờ của ĐSGT AXmr nếu nó thỏa các tính chất sau: (fm1) fm(c-) + fm(W) + fm(c+) = 1; (fm2) hHmr fm(hu) = fm(u), uH(G); (fm3) h  Hmr và x, y  H(G) thỏa x, y ≠ h0z thì )( )( )( )( yfm hyfm xfm hxfm  . □ Tỷ số fm(hx)/fm(x) là không phụ thuộc vào x được gọi đó là độ đo tính mờ của gia tử h và ký hiệu là (h) và h bao gồm cả h0. Mệnh đề 2.1. Độ đo tính mờ fm của các từ ngôn ngữ của ĐSGT AXmr được định nghĩa như trong Định nghĩa 2.2 thỏa các tính chất sau: (1) fm(hx) = (h)×fm(x) với h  Hmr, x  H({c, c+}) và hx ≠ x; (2) fm(x) = (hn)×...×(h1)fm(c), với x = hn...h1c, c  {c , c+} là biểu diễn chính tắc của x  Xmr; (3) ( ) 1mrh H h  ; (4) ∑ (ℎ) + ∑ ()∈ = 1∈() với ∀ > 0. Với k = 1, ta có (fm1). □ 2.3. HỆ KHOẢNG TÍNH MỜ LIÊN KẾT VỚI ĐỘ ĐO TÍNH MỜ Gọi PI([0, 1]) là tập tất cả các khoảng con của đoạn [0, 1]. Ta luôn luôn quy ước là các khoảng đều đóng ở đầu mút trái và mở ở đầu mút phải, trừ khi đầu mút phải là giá trị 1. Ta có khái niệm khoảng tính mờ  của các từ ngôn ngữ của Xmr, (x) với ∈ () = { ∈ :||≤ }= () ∪{ℎ: ∈ ()}, dựa trên hệ tiên đề của độ đo tính mờ: Định nghĩa 2.3. Cho một ĐSGT mở rộng AXmr = (Xmr, C, G, Hmr, ) của một ĐSGT tuyến tính và tự do AX và độ đo tính mờ fm: Xmr  [0, 1] thỏa các tính chất trong Định nghĩa 2.2. Giả sử mỗi từ ngôn ngữ x  () được liên kết với một khoảng trong PI([0, 1]). Các khoảng này được gọi là các khoảng tính mờ mức k của các từ ngôn ngữ tương ứng của AXmr và nó được xây dựng quy nạp theo k như sau: 1) Với k = 1, xây dựng các khoảng tính mờ 1(c -), 1(W), 1(c +) với |1(x)| = fm(x), sao cho chúng có thứ tự tương đồng với thứ tự của các hạng từ c-, W, c+. 10 2) Với k > 1 và xC, xây dựng các khoảng tính mờ k(x) sao cho (i) nếu |x| < k - 1 thì |k(x)| = |k-1(x)|, (ii) nếu |x| = k - 1 thì |k(x)| = (h0)fm(x), (iii) nếu |x| = k thì |k(x)| = fm(x), (iv) thứ tự của các khoảng tính mờ tương đồng với thứ tự của các hạng từ x, tức là, với x, y  {hx: h  Hmr}, nếu x ≤ y thì k(x) ≤ k(y). □ Thuật toán 2.1. Thuật toán xây dựng hệ khoảng tính mờ. Đầu vào: Các độ đo tính mờ fm(c-), fm(W), (h) với h  Hmr và số k >= 1 xác định độ dài tối đa của các từ ngôn ngữ. Lưu ý: fm(c+) = 1 - fm(c-) - fm(W). Đầu ra:  là tập các khoảng với nhãn là các từ ngôn ngữ trong () . Begin Khởi tạo j = 1 và tập  bằng rỗng. Bước 1: Với j = 1, ta có  = 1(c -)  1(W)  1(c +), trong đó: 1(c -) = [0, fm(c-)), 1(W) = [fm(c -), fm(c-)+ fm(W)), 1(c +) = [fm(c-) + fm(W), 1]. Nếu k = 1 thì dừng, ngược lại nếu k > 1 thì thực hiện Bước 2. Bước 2: j = j + 1. Với mỗi từ ngôn ngữ x  () thực hiện: (i) Nếu |x| < j – 1 thì ta có  =   j(x) với j(x) = j-1(x)  . (ii) Nếu từ ngôn ngữ x thỏa |x| = j – 1 thì: Nếu Sign(max(Hmr)) = 1 thì lặp l = 1 đến |Hmr| và đặt i = l, ngược lại thì lặp l = |Hmr| giảm đến 1 và đặt i = |Hmr| – l + 1, để tính các khoảng tính mờ mức j cho các từ hix được sinh ra từ x với hi  H mr. Nếu i = 1, j(hix) = [L(j-1(x)), L(j-1(x)) + (hi)|j-1(x)|), ngược lại nếu i > 1 thì, Đặt Km = R (j(hi-1x)) + (hi)|j-1(x)|. Nếu Km = 1 thì j(hix) = [R (j(hi-1x)), Km), ngược lại thì j(hix) = [R (j(hi-1x)), 1] (đóng phải).  =   j(hix). Bước 3 (bước lặp): Lặp lại Bước 2 cho đến khi j = k. Trả lại  là tập các khoảng với nhãn là các từ ngôn ngữ trong () . End. Ký hiệu L(•) và R (•) là điểm mút trái và mút phải của một khoảng bất kỳ. Kết thúc thuật toán, ta thu được  là tập các khoảng với nhãn là các từ trong () . Định lý 2.4. Thuật toán 2.1 về xây dựng các khoảng tính mờ là đúng đắn và các khoảng tính mờ của () có các tính chất sau: (1) Với mỗi x thỏa |x| = k, khoảng tính mờ mức k của x, k(x), thỏa |k(x)| = fm(x), còn với x mà |x| < j  k, k(x) = I(h0x) và |k(x)| = (h0)fm(x), tức là các hạng từ độ dài ngắn hơn j có mặt trong ngữ cảnh cùng các hạng từ độ dài j sẽ có ngữ nghĩa bị co lại; (2) Với mọi x  () thỏa |x| = j < k, ta có k(x) = I(h0x) và |k(x)| = (h0)fm(x). Với x thỏa |x| = j  k – 2, ta có k(x) = k-1(x). (3) Tập tất cả các khoảng tính mờ mức k, FI(k) = {k(x), x  () }, có các tính chất: a- Đối với hạng từ hằng W, ta có k(W) = 1(W); b- Với mỗi x  H({c,c+}) thỏa |x| = k – 1, tập các khoảng tính mờ {k(hx): h  H mr} là một phân hoạch nhị phân của khoảng tính mờ k-1(x) mức k – 1 của x. 11 c- Các khoảng tính mờ trong FI(k) có thứ tự tương đồng với thứ tự của các hạng từ của chúng và lập thành một phân hoạch nhị phân của đoạn [0,1]. □ 2.4. ÁNH XẠ ĐỊNH LƯỢNG NGỮ NGHĨA KHOẢNG Định nghĩa 2.4. Cho AXmr là ĐSGT mở rộng của AX tuyến tính và tự do, ánh xạ f : Xmr  PI([0, 1]) được gọi là ánh xạ định lượng ngữ nghĩa khoảng của AXmr nếu nó thỏa các điều kiện sau: (IQ1) f bảo toàn thứ tự trên Xmr, tức là nếu x  y thì f(x)  f(y), với x, y  Xmr; (IQ2) f(Xmr) là tập trù mật trong [0, 1]. □ Định lý 2.5. Cho độ đo tính mờ fm của ĐSGT AXmr và  là tập tất cả các khoảng tính mờ của các từ ngôn ngữ của AXmr được xác định bởi fm. Khi đó ánh xạ f: Xmr    PI[0, 1] được định nghĩa như sau là ánh xạ định lượng ngữ nghĩa khoảng: f(x) = |x|+1(h0x)  PI[0, 1], với x, y  X mr (2.5) với lưu ý rằng, nếu x = h0z thì f(x) = |x|+1(h0x) = |x|(h0z). □ 2.5. MỞ RỘNG ĐỘ ĐO TÍNH MỜ CỦA CÁC PHẦN TỬ 0 VÀ 1 ĐSGT mở rộng AXmr được mở rộng thành ĐSGT mở rộng toàn phần với độ đo tính mờ của hai phân tử 0 và 1 khác 0 và được ký hiệu là AXmrtp. Khi đó, hệ tiên đề của độ đo tính mờ mở rộng của AXmrtp được phát biểu như sau: Định nghĩa 2.5. Cho một ĐSGT mở rộng toàn phần AXmrtp = (Xmr, C, G, Hmr, ) của một ĐSGT mở rộng tự do AXmr. Một hàm fm : Xmr  [0,1] được gọi là độ đo tính mờ của ĐSGT AXmrtp nếu nó thỏa các tính chất sau: (fmc1) fm(0) + fm(c-) + fm(W) + fm(c+) + fm(1) = 1; (fmc2) hHmr fm(hu) = fm(u), uH(G); (fmc3) h  Hmr và x, y  H(G) thỏa x, y ≠ h0z thì fm(hx)/fm(x) = fm(hy)/fm(y). □ Từ Định lý 2.4, điểm mút trái của f(x) qua các độ đo tính mờ với k = |x| được tính: L(f(x)) = ∑ ()∈& + ∑ (ℎ)∈()& . (2.6) Công thức (2.6) chưa thể hiện mối quan hệ giữa giá trị định lượng và các tham số của từ. Định lý sau cung cấp công thức đệ quy tính L(f(x)). Giả sử H+ = {hj: j = 1, , p}, H - = { hj: j = -1, , -q}, = ∑ (ℎ) và = ∑ (ℎ) . Ta có, + + (ℎ) = 1. Định lý 2.6. Điểm mút trái của giá trị định lượng f được cảm sinh bởi các độ đo tính mờ fm được tính đệ quy theo thủ tục sau: (1) Với các từ có độ dài 1: L(f(0)) = 0, L(f(c-)) = fm(0) +  × fm(c-), L(f(W)) = fm(0) + fm(c-), L(f(c+)) = fm(0) + fm(c-) + fm(W) và L(f(1)) = 1 - fm(1). (2) Với y = hjx, x  X: đặt (x) = {1 + Sign(hjx)[(h0x) + Sign(hphjx)( - )]}/2, thì L(f(hjx)) = L(f(x)) + Sign(hjx) × fm(x) × { 1+ ℎ × (ℎ) + ∑ (ℎ) − () × (ℎ) () }. 12 2.6. ỨNG DỤNG LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG TRONG THIẾT KẾ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ Luận án áp dụng phương pháp hai giai đoạn thiết kế FLRBC với ngữ nghĩa tính toán của các từ được xác định bởi ĐSGT AXmr và AXmrtp, điểm khác biệt so với ĐSGT AX: 1) Thứ nhất, trong bước thiết kế các từ ngôn ngữ cho các thuộc tính của tập dữ liệu huấn luyện, mỗi thuộc tính được liên kết với một ĐSGT AXmr hoặc AXmrtp thay vì AX. Tập các từ mức k trong Xk đã bao gồm đầy đủ các hạng từ ngôn ngữ có độ dài nhỏ hơn hoặc bằng k và tạo thành một phân hoạch trên miền giá trị định lượng chuẩn hóa [0, 1]. 2) Thứ hai, ngữ nghĩa tính toán dựa trên tập mờ tam giác của các từ ngôn ngữ trong biểu diễn cơ sở luật của FLRBC được thay bằng tập mờ hình thang. 2.6.1. Thiết kế ngữ nghĩa tính toán dựa trên tập mờ của các từ ngôn ngữ Phương pháp luận cho việc thiết kế các từ ngôn ngữ với ngữ nghĩa dựa trên tập mờ có độ dài tối đa của từ là kj cho bài toán phân lớp dựa trên luật mờ như sau: + Mỗi thuộc tính thứ j của tập dữ liệu huấn luyện được liên kết với một ĐSGT AXmrj hoặc AXmrtpj, cảm sinh tập các từ ,() có thứ tự theo ngữ nghĩa định tính của chúng. + Ký hiệu và tương ứng là tập các tham số tính mờ của AXmr và AXmrtp. Cụ thể, ta có = {( ), fm(Wj), (hj,i), (h0,j)} và = {( ), fm(Wj), fm(0j), fm(1j), (hj,i), (h0,j)}. Khi cho các giá trị cụ thể của các tham số mờ, tất cả các khoảng tính mờ ℑ, mức k ≤ kj và f(xj,i) của các từ trong ,() được xây dựng và tạo thành một phân hoạch trên [0, 1]. Do (,)  ℑ(,), nên ta có (,) ≤ ⋯ ≤ (,, ). Giả sử đặt a = R(f(xj,i-1)), b = L(f(xj,i)), c = R(f(xj,i)), d = L(f(xj,i+1)), ta có công thức tính giá trị hàm thuộc của tập mờ hình thang ,() của từ xj,i theo (2.7), trong đó v là một điểm dữ liệu. ,() = ⎩ ⎪ ⎨ ⎪ ⎧ 0 với hoặc với ≤ < 1 với ≤ ≤ với < ≤ (2.7) Hai cấu trúc phân hoạch mờ được sử dụng là: 1) Cấu trúc đơn thể hạt (Hình 2.5), chỉ duy nhất một phân hoạch mờ trên miền giá trị của mỗi thuộc tính của tập dữ liệu huấn luyện và tất cả các tập mờ đều có mặt tại mức kj. 2) Cấu trúc đa thể hạt (Hình 2.7) sử dụng nhiều phân hoạch mờ trên miền giá trị của mỗi thuộc tính của tập dữ liệu huấn luyện. Mỗi thể hạt được cấu tạo bởi các tập mờ của các từ ngôn ngữ có độ dài bằng nhau. Hình 2.5. Các tập mờ được thiết kế theo cấu trúc đơn thể hạt được sinh bởi ĐSGT AXmr. 13 a. Ngữ nghĩa tính toán dựa trên tập mờ hình thang của các từ có độ dài 1. b. Ngữ nghĩa tính toán dựa trên tập mờ hình thang của các từ có độ dài 2. Hình 2.7. Các tập mờ được thiết kế theo cấu trúc đa thể hạt được sinh bởi ĐSGT AXmr. 2.6.2. Sinh tập luật khởi đầu từ dữ liệu dựa trên ngữ nghĩa ĐSGT mở rộng Đặt Л =  {  {kj} | j = 1, , n} với AX mr hoặc Л =  {  {kj} | j = 1, , n} với AXmrtp và gọi chung các giá trị trong Л là các tham số ngữ nghĩa. Thủ tục xây dựng tập luật khởi đầu từ mt mẫu dữ liệu của D là E_IFRG(Л, D, NR0, K, λ) như sau: Thuật toán 2.2. E_IFRG (Thuật toán sinh tập luật khởi đầu). Input: Tập mẫu dữ liệu D = {(dp, Cp) | p = 1, , mt}, M lớp kết luận, n thuộc tính, các tham số ngữ nghĩa Л, NR0 số luật khởi đầu, K giới hạn độ dài của các từ ngôn ngữ, λ giới hạn độ dài tối đa của luật. Output: Tập luật khởi đầu S0. Begin Bước 1: Xây dựng tập các hạng từ, tập khoảng tính mờ, tập ánh xạ định lượng khoảng và các tập mờ hình thang của các từ đối với mọi thuộc tính của tập dữ liệu huấn luyện. Bước 2: Sinh tập luật ứng viên từ tập dữ liệu huấn luyện. Tập các khoảng tính mờ ℑ(,()) chứa thành phần dữ liệu dl,j xác định một khối hộp Hl chứa mẫu dữ liệu dl. Khối hộp Hl cùng với lớp kết luận Cl của pl xác định luật mờ cơ sở độ dài n có dạng sau: IF X1 is x1,i(1) AND AND Xn is xn,i(n) THEN Cl (Rb) Phần kết luận của luật là lớp Cq được chọn từ các nhãn lớp có độ tin cậy của luật là lớn nhất. Từ các luật cơ sở có độ dài n, các luật ứng viên có độ dài nhỏ hơn n được xây dựng bằng cách bỏ đi một số điều kiện tiền đề Al,j của luật cơ sở. Bước 3. Chọn lọc tập luật khởi đầu S0 từ tập luật ứng viên sử dụng tiêu chuẩn sàng. Sắp xếp các luật giảm dần trong mỗi nhóm theo tiêu chuẩn sàng và chọn ra NB0 luật trong mỗi nhóm từ trên xuống dưới. Trả lại tập luật khởi đầu S0. End. 14 Sau Bước 3 ta thu được hệ luật khởi đầu S0 có NR0 = NB0 * M luật. Các luật được gán một trọng số được tính bằng một trong các công thức (1.7), (1.8), (1.9), (1.10). Độ phức tạp của thủ tục E_IFRG là đa thức đối với kích thước và số thuộc tính của tập dữ liệu mẫu D. 2.6.3. Tối ưu các tham số ngữ nghĩa và tìm kiếm hệ luật tối ưu Để hiệu chỉnh thích nghi các tham số ngữ nghĩa được nêu ở trên cho phù hợp với từng tập dữ liệu huấn luyện, bài toán tiến hóa tối ưu hóa đa mục tiêu thiết kế các từ ngôn ngữ tối ưu cho bài toán phân lớp P được đặt ra với E_IFRG(Л, D, NR0, K, λ) là thủ tục xây dựng hệ luật khởi đầu và với các ràng buộc về các tham số ngữ nghĩa đã được nêu ở trên. Khi đó, các mục tiêu của bài toán tìm kiếm giá trị tối ưu của các tham số ngữ nghĩa với cơ sở luật S0 được sinh ra bởi thủ tục E_IFRG là: fp(S0) → max và fa(S0) → min (2.9) trong đó, fp(S0) là tỷ lệ phân lớp đúng của hệ S0 trên tập huấn luyện, fa(S0) là độ dài trung bình của hệ S0. Số luật của hệ S0 được cố định theo từng tập dữ liệu huấn luyện cụ thể. Sau quá trình tối ưu trên ta thu được tập các bộ tham số ngữ nghĩa gần tối ưu Лopt. Sinh tập luật khởi đầu S0 với NR0 luật sử dụng một bộ tham số ngữ nghĩa trong Лopt. Bài toán đặt ra là phải chọn ra một tập luật con của S0 cho FLRBC sao cho đạt các mục tiêu sau: fp(S) → max, fn(S) → min và fa(S) → min (2.10) với ràng buộc S  S0, NR(S)  Nmax. trong đó, fn(S) là số luật của hệ S và Nmax là số luật tối đa được chọn và được xác định trước. Mỗi cá thể ứng với mỗi lời giải là một tập luật S được chọn từ S0 và được biểu diễn bởi một chuỗi số thực ri = (p1, ..., pNmax), pj  [0, 1]. Giá trị pj xác định chỉ số của luật trong S0 được chọn cho S có giá trị là pj × |S0|, ta có 0  pj × |S0|  |S0|. S = {Ri  S0 | i = pj × |S0|, i ≥ 0} (2.11) trong đó • là phép lấy phần nguyên. 2.6.4. Đánh giá kết quả ứng dụng lõi ngữ nghĩa và ngữ nghĩa hình thang trong thiết kế hệ phân lớp dựa trên luật ngôn ngữ mờ 2.6.4.1. Dữ liệu và phương pháp thực nghiệm Các thực nghiệm được tiến hành đối với 23 tập dữ liệu mẫu UCI được cộng đồng nghiên cứu thừa nhận bao gồm: Appendicitis, Australian, Bands, Bupa, Cleveland, Dermatology, Glass, Haberman, Hayes-roth, Heart, Hepatitis, Ionosphere, Iris, Mammographic, Newthyroid, Pima, Saheart, Sonar, Tae, Vehicle, Wdbc, Wine, Wisconsin. Phương pháp kiểm tra chéo 10 nhóm (10-fold cross-validation) được sử dụng và được lặp lại 3 lần đối với một tập dữ liệu được thử nghiệm. Kết quả cuối cùng của các lần thử nghiệm sau khi lựa chọn được hệ luật tối ưu được tính trung bình đối với số luật #R, độ phức tạp của hệ luật #C, tỷ lệ phân lớp đúng trên tập huấn luyện Ptr và trên tập kiểm tra Pte. Độ phức tạp của hệ luật được tính theo công thức #C = #R × Avg, trong đó Avg là độ dài trung bình của hệ luật. 15 Số thế hệ khi tối ưu các tham số ngữ nghĩa MOPSO_SPO là 250, tìm kiếm hệ luật tối ưu MOPSO_RBO là 1000. Số cá thể mỗi thế hệ là 600. Các ràng buộc đối với các tham số ngữ nghĩa như sau: số gia tử âm và gia tử dương đều được lấy là 1. Giới hạn độ dài của các từ ngôn ngữ 0 < kj ≤ 3. Giá trị của các độ đo tính mờ: Với ĐSGT AXmr: 0,2 ≤ ( ), (Lj) ≤ 0,7; 0,0001 ≤ fm(Wj) ≤ 0,2; + + = 1; 0,0001 ≤ (h0,j) ≤ 0,5. Với ĐSGT AX mrtp: 0,00001 ≤ fm(0), fm(1) ≤ 0,01; 0,15 ≤ ( ), (Lj) ≤ 0,7; 0,0001 ≤ fm(Wj) ≤ 0,2; () + + + + () = 1; 0,0001 ≤ (h0,j) ≤ 0,5. Trừ trường hợp được đề cập cụ thể, phương pháp lập luận phân lớp được sử dụng là Single winner rule, công thức tính trọng số luật là CFIII, tiêu chuẩn sàng luật là tích của độ tin cậy và độ hỗ trợ (c × s). Bảng 2.8. Các kết quả thực nghiệm và so sánh giữa các hệ phân lớp FRBC_AXmrtp, FRBC_AXmr, FRBC_AX, All Granularities và Product-1-ALL TUN. Tập dữ liệu FRBC_AXmrtp FRBC_AXmr FRBC_AX All Granularities Product/1-ALL TUN #C Ptr Pte #C Ptr Pte #C Ptr Pte #C Ptr Pte #C Ptr Pte App 16,77 92,38 88,15 16,91 91,30 88,09 21,32 92,28 87,55 8,84 91,86 87,91 20,89 93,47 87,30 Aus 46,50 88,56 87,15 41,85 87,72 86,86 36,20 88,06 86,38 4,00 85,51 85,51 62,43 89,18 85,65 Ban 58,20 78,19 73,46 78,19 76,28 72,10 52,20 76,17 72,80 57,18 71,36 68,73 104,09 71,18 65,80 Bup 181,19 79,78 72,38 170,70 77,54 69,41 187,20 78,13 68,09 112,59 69,50 63,99 210,91 78,59 67,19 Cle 468,13 66,64 62,39 640,19 69,86 63,40 657,43 72,44 62,19 1132,14 73,11 55,11 1020,66 77,21 58,80 Der 182,84 96,37 94,40 189,46 96,88 95,52 198,05 98,03 96,07 220,36 99,07 94,12 185,28 99,28 94,48 Gla 474,29 78,78 72,24 488,38 80,26 72,78 343,60 80,45 72,09 408,83 78,65 60,48 534,88 83,68 71,28 Hab 10,80 77,60 77,40 20,00 77,67 77,43 10,20 76,91 75,76 90,55 79,46 71,89 21,13 76,82 71,88 Hay 114,66 89,40 84,17 139,42 89,98 83,33 122,27 90,11 84,17 140,03 90,88 78,03 158,52 90,99 78,88 Hea 123,29 89,19 84,57 120,69 88,07 84,57 122,72 89,63 84,44 109,45 90,19 83,46 164,61 91,87 82,84 Hep 25,53 93,68 89,28 25,75 94,44 89,17 26,16 95,83 88,44 35,34 96,10 90,44 20,29 97,88 88,53 Ion 88,03 94,69 91,56 83,71 94,67 90,98 90,33 95,35 90,22 141,33 95,64 88,62 86,75 96,25 90,79 Iri 30,37 98,25 97,33 34,59 98,35 96,67 26,29 98,40 96,00 27,40 99,11 95,11 18,54 98,30 97,33 Mam 73,84 85,49 84,20 82,08 85,31 84,46 92,25 86,05 84,20 102,46 83,07 81,04 106,74 83,90 80,49 New 39,82 96,76 95,67 30,93 96,30 95,03 45,18 97,02 94,42 49,40 96,19 91,78 56,47 98,02 94,60 Pim 56,12 78,69 77,01 50,33 78,53 76,66 60,89 78,28 76,18 95,01 77,80 74,92 57,20 79,06 77,05 Sah 59,28 75,51 70,05 58,41 74,55 70,27 86,75 76,35 69,33 76,24 76,70 71,14 110,84 77,73 70,13 Son 49,31 87,59 78,61 53,91 86,84 77,29 79,76 88,39 76,80 70,67 86,54 78,88 47,59 87,91 78,90 Tae 210,70 68,97 61,00 163,61 68,36 59,46 261,00 72,11 59,47 147,09 66,55 54,57 215,92 71,21 60,78 Veh 195,07 70,74 68,20 216,19 71,64 68,12 242,79 70,30 67,62 492,55 69,34 62,81 382,12 71,11 66,16 Wdb 25,04 97,08 96,78 23,08 97,16 95,96 37,35 97,62 96,96 55,74 97,12 94,90 44,27 97,33 94,90 Win 40,39 99,60 98,49 42,09 100,0 98,52 35,82 99,88 98,30 32,10 100,0 96,08 58,99 99,92 93,03 Wis 69,81 97,78 96,95 59,81 97,20 96,51 74,36 97,81 96,74 77,41 98,22 96,07 69,11 98,33 96,35 TB 114,78 86,16 82,67 123,05 86,04 82,29 126,53 86,77 81,92 160,29 85,74 79,37 163,0 87,36 80,57 Số có chữ đậm thể hiện kết quả tốt nhất trong các phương pháp (trên cùng dòng). 2.6.4.2. So sánh đánh giá hai cấu trúc phân hoạch mờ đơn và đa thể hạt Dựa trên kết quả thực nghiệm và so sánh đối với 23 tập dữ liệu được thực nghiệm và sử dụng phương pháp kiểm định thống kê Wilcoxon Signed Rank (WSR) đối với hiệu suất phân lớp và độ phức tạp của hệ luật, ta có thể kết luận tiếp cận thiết kế hệ phân lớp dựa 16 trên phương pháp luận ĐSGT áp dụng phương pháp thiết kế đa thể hạt cho hiệu suất phân lớp tốt hơn phương pháp thiết kế đơn thể hạt. 2.6.4.3. So sánh hai phương pháp lập luận single winner rule và weigted vote Phân tích kết quả thực nghiệm đối với 23 tập dữ liệu mẫu và kết quả kiểm định giả thuyết thống kê WSR đối với hiệu suất phân lớp và độ phức tạp của hệ luật, ta có thể kết luận rằng, các tiếp cận thiết kế hệ phân lớp dựa trên phương pháp luận ĐSGT AX, AXmr, AXmrtp sử dụng phương pháp lập luận single winner rule đều cho hiệu suất phân lớp tốt hơn so với phương pháp lập luận weighted vote tương ứng. 2.6.4.4. So sánh các phương pháp thiết kế hệ phân lớp theo tiếp cận ĐSGT Ký hiệu phương pháp thiết kế FLRBC với ngữ nghĩa tính toán của từ được xác định dựa trên ĐSGT AX, ĐSGT AXmr và ĐSGT AXmrtp tương ứng là FRBC_AX, FRBC_AXmr và FRBC_AXmrtp. Theo các kết quả thực nghiệm trong Bảng 2.8, hệ phân lớp FRBC_AXmrtp cho kết quả phân lớp trên tập kiểm tra cao hơn so với hệ phân lớp FRBC_AX đối với 19 tập dữ liệu và cao hơn so với hệ phân lớp FRBC_AXmr đối với 15 tập dữ liệu trong số 23 tập dữ liệu mẫu được thực nghiệm. Với các kết quả kiểm định thống kê WSR, ta có thể khẳng định rằng, việc ứng dụng ĐSGT AXmrtp trong thiết kế FLRBC cho hiệu suất phân lớp tốt hơn so với việc ứng dụng ĐSGT AXmr và ĐSGT AX, ĐSGT AXmr cho hiệu suất phân lớp tốt hơn ĐSGT AX. 2.6.4.5. So sánh với một số phương pháp theo tiếp cận lý thuyết tập mờ Các kết quả thực nghiệm của hai hệ phân lớp FRBC_AXmr và FRBC_AXmrtp được so sánh với một số các kết quả theo tiếp cận lý thuyết tập mờ được công bố gần đây của R. Alcalá, 2011 và M. Antonelli, 2014. Trong R. Alcalá, 2011, đã đề xuất kỹ thuật lựa chọn phân hoạch đơn thể hạt từ các phân hoạch đa thể hạt. Theo kết quả thực nghiệm, có hai kỹ thuật cho kết quả tốt hơn cả là All Granularities và Product/1-ALL TUN. Các kết quả thực nghiệm, so sánh tương ứng được thể hiện trong Bảng 2.8. Cả hai hệ phân lớp FRBC_AXmr và FRBC_AXmrtp đều cho hiệu suất phân lớp trung bình trên tập kiểm tra đối với 23 tập dữ liệu thử nghiệm cao hơn so nhưng có độ phức tạp của hệ phân lớp thấp hơn so với hai hệ phân lớp All Granularities và Product/1-ALL TUN. Theo kết quả kiểm định giả thuyết thống kê WSR, ta có thể khẳng định rằng cả hai hệ phân lớp FRBC_AXmr và FRBC_AXmrtp đều tốt hơn so với các phương pháp được đề xuất trong R. Alcalá, 2011 về hiệu suất phân lớp nhưng không tăng độ phức tạp của hệ phân lớp. Hai hệ phân lớp được đề xuất trong luận án được so sánh với các kết quả được đề xuất của M. Antonelli, 2014 có tên là PAES-RCS, một tiếp cận khai thác tiến hóa đa mục tiêu để học đồng thời cơ sở luật và các tham số của các hàm thuộc của FLRBC. Các kết quả thực nghiệm và so sánh giữa hệ phân lớp PAES-RCS và các hệ phân lớp FRBC_AXmrtp và FRBC_AXmr được thể hiện trong Bảng 2.13. Hai hệ phân lớp FRBC_AXmrtp và FRBC_AXmr lần lượt có 21 và 19 trong số 23 tập dữ liệu được thực nghiệm có độ chính xác trên tập kiểm tra cao hơn so với hệ phân lớp PAES-RCS. Theo kết quả kiểm định 17 thống kê WSR, cả hai hệ phân lớp FRBC_AXmrtp và FRBC_AXmr đều cho kết quả tốt hơn hệ phân lớp PAES-RCS cả về hiệu suất phân lớp và độ phức tạp của hệ phân lớp. Bảng 2.13. Các kết quả thực nghiệm và so sánh giữa các hệ phân lớp FRBC_AXmrtp, FRBC_AXmr, PAES-RCS, FURIA và C4.5. Tập dữ liệu FRBC_AXmrtp FRBC_AXmr PAES-RCS FURIA C4.5 #C Pte #C Pte #C Pte #C Pte #C Pte App 16,77 88,15 16,91 88,09 35,28 85,09 19,00 85,18 15,00 85,84 Aus 46,50 87,15 41,85 86,86 329,64 85,80 89,60 85,22 5859,00 84,05 Ban 58,20 73,46 78,19 72,10 756,00 67,56 535,15 64,65 10608,00 63,28 Bup 181,19 72,38 170,70 69,41 256,20 68,67 324,12 69,02 3692,00 67,82 Cle 468,13 62,39 640,19 63,40 1140,00 59,06 134,67 56,20 13938,00 48,48 Der 182,84 94,40 189,46 95,52 389,40 95,43 303,88 95,24 280,00 95,25 Gla 474,29 72,24 488,38 72,78 487,90 72,13 474,81 72,41 5610,00 69,15 Hab 10,80 77,40 20,00 77,43 202,41 72,65 22,04 75,44 15,00 71,56 Hay 114,66 84,17 139,42 83,33 120,00 84,03 188,10 83,13 780,00 83,12 Hea 123,29 84,57 120,69 84,57 300,30 83,21 193,64 80,00 2080,00 77,40 Hep 25,53 89,28 25,75 89,17 300,30 83,21 52,38 84,52 216,00 86,25 Ion 88,03 91,56 83,71 90,98 670,63 90,40 372,68 91,75 1870,00 90,59 Iri 30,37 97,33 34,59 96,67 69,84 95,33 31,95 94,66 45,76 95,20 Mam 73,84 84,20 82,08 84,46 132,54 83,37 16,83 83,89 70,00 83,97 New 39,82 95,67 30,93 95,03 97,75 95,35 100,82 96,30 342,00 92,09 Pim 56,12 77,01 50,33 76,66 270,64 74,66 127,50 74,62 2220,00 74,67 Sah 59,28 70,05 58,41 70,27 525,21 70,92 50,88 69,69 1110,00 70,77 Son 49,31 78,61 53,91 77,29 524,60 77,00 309,96 82,14 1805,00 72,11 Tae 210,70 61,00 163,61 59,46 323,14 60,81 43,00 43,08 7820,00 59,60 Veh 195,07 68,20 216,19 68,12 555,77 64,89 2125,97 71,52 89964,00 75,57 Wdb 25,04 96,78 23,08 95,96 183,70 95,14 356,12 96,31 588,00 94,02 Win 40,39 98,49 42,09 98,52 170,94 93,98 80,00 96,60 60,00 93,82 Wis 69,81 96,95 59,81 96,51 328,02 96,46 521,10 96,35 462,00 95,60 TB 114,78 82,67 123,05 82,29 355,23 80,66 281,49 80,34 6497,82 79,57 Số có chữ đậm thể hiện kết quả tốt nhất trong các phương pháp (trên cùng dòng). 2.6.4.6. So sánh đánh giá với một số tiếp cận khác Các kết quả được đề xuất trong luận án được so sánh với kết quả của hai phương pháp thiết kế hệ phân lớp không dựa vào cơ chế tiến hóa là FURIA (Fuzzy Unordered Rules Induction Algorithm) và C4.5. FURIA là một mở rộng của giải thuật RIPPER với tập luật không cần thiết phải được sắp xếp. Hệ phân lớp C4.5 là hệ phân lớp dựa trên cây quyết định khai thác khái niệm entropy thông tin. Các kết quả thực nghiệm và so sánh hai hệ phân lớp FRBC_AXmrtp và FRBC_AXmr so với hai hệ phân lớp FURIA và C4.5 được thể hiện trong Bảng 2.13. Cụ thể, hai hệ phân lớp FRBC_AXmrtp và FRBC_AXmr lần lượt có 17 và 18 tập dữ liệu, trong số 23 tập dữ liệu được thực nghiệm, có độ chính xác trên tập kiểm tra cao hơn so với hệ phân lớp FURIA. Cả hai hệ phân lớp FRBC_AXmrtp và FRBC_AXmr đều có độ chính xác trên tập kiểm tra cao hơn so với hệ phân lớp C4.5 đối với 20 trong số 23 tập dữ liệu được thực nghiệm. Các kết quả kiểm định giả thuyết thống 18 kê, ta có thể kết luận rằng cả hai hệ phân lớp FRBC_AXmr và FRBC_AXmrtp thực sự tốt hơn FURIA và C4.5 cả về hiệu suất phân lớp lẫn độ phức tạp của hệ phân lớp. 2.6.5. Biểu diễn ngữ nghĩa tính toán dựa trên tập mờ hình thang đảm bảo tính giải nghĩa được của khung nhận thức ngôn ngữ Đảm bảo tính giải nghĩa được của khung nhận thức ngôn ngữ (LFoC) là đảm bảo ngữ nghĩa tính toán (tập mờ) của các từ ngôn ngữ phải được xây dựng từ ngữ nghĩa vốn có của chúng và phải bảo toàn những đặc trưng riêng của ngữ nghĩa định tínhcủa chúng (khái quát và cụ thể). N. C. Hồ và các cộng sự đã đưa ra 4 ràng buộc trên ngữ nghĩa tính toán của các từ ngôn ngữ nhằm đảm bảo tính giải được của khung nhận thức ngôn ngữ. Ràng buộc thứ nhất. [58] Ngữ nghĩa vốn có của các từ ngôn ngữ của một biến ngôn ngữ xuất hiện trong một cơ sở luật về nguyên tắc được sử dụng để tạo ra một cơ sở hình thức hóa cho việc xác định ngữ nghĩa định lượng của các từ ngôn ngữ, bao gồm ngữ nghĩa dựa trên tập mờ, cho biểu diễn ngữ nghĩa của cơ sở luật. Ràng buộc thứ hai. [58] Ngữ nghĩa tính toán của các từ ngôn ngữ, bao gồm ngữ nghĩa dựa trên tập mờ, phải được sinh ra dựa trên một cơ chế hình thức hóa đầy đủ của miền giá trị của các biến ngôn ngữ. Ràng buộc thứ ba. [58] Với một tập các từ cụ thể của một biến ngôn ngữ X, phép gán :⟶ với Intv là tập các khoảng trên miền giá trị số được chuẩn hóa của X biểu thị ngữ nghĩa khoảng của các từ của phải bảo toàn tính khái quát và tính cụ thể của các từ. Cụ thể, hai từ x và hx ∈ với h là một gia tử, quan hệ (ℎ) ⊆ () phải được thỏa. Ràng buộc thứ tư. [58] Để bảo toàn ngữ nghĩa của các luật ngôn ngữ, các phép gán ngữ nghĩa tính toán của các từ ngôn ngữ của một biến X xuất hiện trong các luật phải bảo toàn thứ tự ngữ nghĩa của các từ của X. Cấu trúc phân hoạch mờ đơn thể hạt không thỏa Ràng buộc thứ ba, tức (ℎ) ⊈ (), do độ hỗ trợ của tập mờ ứng với từ ngôn ngữ x không chứa độ hỗ trợ của từ ngôn ngữ hx được cảm sinh từ x nhờ gia tử h. Với cấu trúc phân hoạch mờ đa thể hạt dựa trên độ dài của các từ, độ hỗ trợ của từ x không chứa độ hỗ trợ của các từ hx, do đó phân hoạch được tạo ra không thỏa Ràng buộc thứ ba nêu trên. Để thỏa Ràng buộc thứ ba, N. C. Hồ và các cộng sự đề xuất tách các từ ngôn ngữ có độ dài bằng 1 tại mức k = 1 thành hai mức: mức k = 0 chỉ bao gồm 3 từ ngôn ngữ 00, W và 10, mức k = 1 bao gồm 4 từ ngôn ngữ 01, c -, c+ và 11. Với cách biểu diễn này, độ hỗ trợ của tập mờ ứng với từ ngôn ngữ x hoàn toàn chứa độ hỗ trợ của từ ngôn ngữ hx và Ràng buộc thứ ba, tức (ℎ) ⊆ () và kết quả là thỏa cả bốn ràng buộc nêu trên. Các kết quả thực nghiệm cho thấy, hệ phân lớp với cấu trúc đa thể hạt mới có độ chính xác trên tập kiểm tra cao hơn so với hệ phân lớp với cấu trúc đa thể hạt cũ đối với 18 tập dữ liệu mẫu trong số 23 tập dữ liệu được thử nghiệm. So sánh dựa trên kết quả trung bình của độ chính xác trên tập kiểm tra đối với 23 tập dữ liệu, hệ phân lớp FRBC_AXmrtp_k0 có độ chính xác trung bình là 82,94%, cao hơn so với hệ phân lớp FRBC_AXmrtp có độ chính xác trung bình là 82,67%, trong khi có độ phức tạp trung bình cao hơn không nhiều (122,61 so với 114,78). Các kết quả kiểm định giả thuyết thống kê WSR cho ta kết luận, 19 phương pháp thiết kế đa thể hạt với mức k = 1 được tách thành hai mức 0 và 1 có ngữ nghĩa dựa trên tập mờ hình thang của các từ ngôn ngữ thỏa Ràng buộc thứ ba và đảm bảo tính giải nghĩa được của khung ngôn nhận thức ngôn ngữ và cho độ chính xác phân lớp cao hơn so với phương pháp thiết kế đa thể hạt không tách mức k = 1. 2.7. KẾT LUẬN CHƯƠNG 2 Chương này trình bày các nghiên cứu phát triển mở rộng lý thuyết ĐSGT biểu diễn lõi ngữ nghĩa và ngữ nghĩa tính toán dựa trên tập mờ hình thang và ứng dụng trong thiết kế tự động FLRBC cũng như trình bày các thực nghiệm, đánh giá và so sánh. CHƯƠNG 3 THIẾT KẾ HIỆU QUẢ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ SỬ DỤNG KỸ THUẬT TÍNH TOÁN MỀM Chương này trình bày các thiết kế hiệu quả hệ phân lớp dựa trên luật ngôn ngữ mờ trên cơ sở đại số gia tử dựa trên kỹ thuật tính toán mềm. 3.1. THIẾT KẾ HIỆU QUẢ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ SỬ DỤNG CÁC THUẬT TOÁN TỐI ƯU 3.1.1. Đánh giá tính hiệu quả của thuật toán MOPSO so với thuật toán GSA 3.1.1.1. Giải thuật tối ưu bầy đàn đa mục tiêu - Chia sẻ thích nghi (fitness sharing): Khi một cá thể i đang chia sẻ các nguồn tài nguyên thì sự thích nghi fi của nó bị giảm bớt tỷ lệ với số cá thể xung quanh nó. - Tiêu chuẩn tính trội (dominance criterion): Một phương án u được gọi là trội hơn phương án v nếu phương án u không tồi hơn phương án v đối với tất cả các mục tiêu và phương án u thực sự tốt hơn phương án v tại ít nhất một mục tiêu. Giải thuật PSO đa mục tiêu (MOPSO) dựa trên tiêu chuẩn tính trội và khái niệm chia sẻ thích nghi được Lechuga M. S. đề xuất năm 2006 như sau: Thuật toán 3.1. MOPSO //[83] Giải thuật tối ưu đa mục tiêu PSO Đầu vào: ω, c1, c2, Npop, Gmax. //ω: hệ số inertia, c1, c2: hệ số tăng tốc, Npop: số particle mỗi thế hệ, Gmax: số thế hệ Đầu ra: Tập các phương án tối ưu Лopt là kết quả của quá trình huấn luyện. Begin Bước 1: Các biến popi, pbesti, gbesti, fSharei được khởi tạo. Biến fSharei được tính như sau: fSharei = x / nCounti (3.4) trong đó, x = 10, 2 0 1 ( / ) 0 jn j i share i i j d nCount sharing          (3.5) n là số particle trong bộ nhớ lưu trữ, σshare là khoảng cách giữa các cá thể mà chúng ta muốn duy trì và jid là khoảng cách giữa các cá thể i và j. Bước 2: Tốc độ của mỗi particlei được tính toán như sau: veli = ω × veli + c1 × r1 × (pbesti − popi) + c2 × r2 × (Лh − popi) (3.6) nếu các trường hợp còn lại 20 trong đó, ω là hệ số inertia, c1 và c2 là các hệ số tăng tốc, veli là giá trị tốc độ liền trước đó, r1 và r2 là các giá trị ngẫu nhiên giữa 0 và 1, pbesti là vị trí tốt nhất được tìm thấy bởi particle, Лh là particle được đi theo và popi là vị trí hiện tại của particle trong không gian biến. Bước 3: Vị trí mới của các particlei được tính như sau: popi = popi + veli (3.7) Bước 4: Các vị trí mới của bầy được đánh giá. Bước 5: Bộ nhớ lưu trữ Лopt được cập nhật theo tiêu chuẩn tính trội và chia sẻ thích nghi. Bước 6: Bộ nhớ của từng particle được cập nhật sử dụng tiêu chuẩn tính trội. Bước 7: Chấm dứt và trả về Лopt nếu đạt số thế hệ Gmax, ngược lại thì trở về Bước 2. End. 3.1.1.2. Ứng dụng thuật toán MOPSO tối ưu các tham số ngữ nghĩa và tìm kiếm hệ luật tối ưu Tối ưu các tham số ngữ nghĩa sử dụng giải thuật MOPSO là MOPSO_SPO. Thuật toán 3.2. MOPSO_SPO //[CT2] Tối ưu các tham số ngữ nghĩa Đầu vào: tập dữ liệu mẫu D = {(dp, Cp) | p = 1, , m}; Các ràng buộc của các tham số tính mờ; Các tham số: NR0, Npop, Gmax, K, λ; //Npop là kích thước bầy, Gmax là số thế hệ Đầu ra: Tập các tham số ngữ nghĩa tối ưu Лopt; Begin Cụ thể hóa Giải thuật 3.1 với vị trí của mỗi cá thể là một bộ tham số ngữ nghĩa cần tối ưu; Trả lại tập các giá trị tốt nhất của tập các bộ tham số ngữ nghĩa (gần) tối ưu Лopt; End. 3.1.1.3. Thực nghiệm so sánh thuật toán MOPSO so với thuật toán GSA Theo các kết quả thực nghiệm, việc sử dụng giải thuật tối ưu MOPSO trong thiết kế FLRBC với ngữ nghĩa dựa trên ĐSGT AX cho độ chính xác trên tập kiểm tra cao hơn so với sử dụng giải thuật tối ưu GSA đối với 13 trong số 17 tập dữ liệu được thực nghiệm. Xét theo độ chính xác trung bình trên tập kiểm tra, việc sử dụng giải thuật tối ưu MOPSO cho độ chính xác trung bình cao hơn (80,83% so với 80,50%) và có độ phức tạp trung bình của các hệ luật thấp hơn (141,64 so với 177,49) so với sử dụng giải thuật tối ưu GSA. Theo các kết quả kiểm định thống kê, ta có thể kết luận rằng tiếp cận thiết kế FLRBC dựa trên ĐSGT AX sử dụng MOPSO cho kết quả tốt hơn so với sử dụng GSA đối với cả hai tiêu chí so sánh là độ chính xác và độ phức tạp của hệ phân lớp. 3.1.2. Đánh giá tính hiệu quả của thuật toán MOPSO-SA so với thuật toán MOPSO 3.1.2.1. Giải thuật tối ưu đa mục tiêu lai MOPSO-SA Giải thuật mô phỏng tôi luyện (simulated annealing - SA) được sử dụng nhằm giúp các particle của MOPSO thoát khỏi vùng tối ưu địa phương để tiếp tục quá trình tìm kiếm do giải thuật SA sử dụng luật chấp thuận Metropolis (metropolis acceptance rule). Giải thuật mô phỏng tôi luyện SA Thuật toán 3.3. SA //Thuật toán mô phỏng tôi luyện Đầu vào: các tham số: E, T0, α, điều kiện kết thúc. Đầu ra: Phương án tối ưu  là kết quả của quá trình huấn luyện. Begin Bước 1: Khởi tạo cấu hình ban đầu  = 0 năng lượng E, tỷ suất làm lạnh α  [0, 1], T = T0. 21 Bước 2: Chọn ngẫu nghiên một new là lân cận của  và tính sự thay đổi năng lượng ∆E. Bước 3: Nếu giá trị ∆E âm thì  = new (cấu hình mới được chấp nhận). Ngược lại, cấu hình mới được chấp nhận với xác suất ( / )BE k TP e  , kB là hằng số Boltzman. Bước 4: Nếu đạt điều kiện kết thúc thì trả lại  và quá trình tôi luyện kết thúc. Ngược lại, giảm nhiệt độ T = α×T và nhảy tới Bước 2. End. Giải thuật tối ưu đa mục tiêu lai MOPSO-SA Thuật toán 3.4. MOPSO-SA //[CT6] giải thuật tối ưu bầy đàn mô phỏng tôi luyện Đầu vào: các tham số: Gmax, Tmax, α, Npop, D. Đầu ra: Tập các phương án tối ưu Лopt là kết quả của quá trình huấn luyện. Begin Bước 1: Khởi tạo t = 0, và sinh ngẫu nhiên n particle của thế hệ ban đầu. Nhiệt độ ban đầu T0 = Tmax, tỷ suất làm lạnh α, số thế hệ Gmax. Các giá trị của các hàm mục tiêu của mỗi particle đánh giá. Giá trị chia sẻ thích nghi của từng each particle được tính theo công thức (3.4). Bước 2: Với mỗi i trong bầy đàn. Bước 2.1: Tính tốc độ của 1t ivel của particle i theo công thức (3.6). Bước 2.2: Tính vị trí mới 1t ipop của particle i theo công thức (3.7). Bước 2.3: Đánh giá các giá trị mục tiêu của particle thứ i. Bước 2.4: Kiểm tra tiêu chuẩn tính trội giữa vị trí mới 1t ipop của particle i và vị trí cũ của nó tại thế hệ trước đó t ipop . Nếu vị trí 1t ipop trội hơn vị trí t ipop , nghĩa là vị trí mới tốt hơn, thì vị trí 1t ipop được chấp nhận là vị trí mới của particle i. Ngược lại, tính giá trị RMSR: RMSR = 1 2, , 1 1 ( ) D t t i j i j j fitness fitness D    (3.8) trong đó, D là số mục tiêu. Sinh ngẫu nhiên một số δ  [0, 1]. Vị trí mới được chấp nhận nếu δ > ( / )tRMSR Te hoặc số lần di chuyển thất bại lớn hơn 100. Nếu vị trí mới được chấp nhận thì nhảy tới Bước 2. Ngược lại, nhảy tới Bước 2.1. Bước 3: Cập nhật bộ nhớ lưu trữ Лopt theo tiêu chuẩn tính trội và chia sẻ thích nghi. Bước 4: Cập nhật bộ nhớ của các particle dựa trên tiêu chuẩn tính trội. Bước 5: Nếu đạt số thệ hệ Gmax thì trả về tập các phương án tốt nhất được lưu trong bộ nhớ lưu trữ Лopt và giải thuật chấm dứt. Ngược lại, thay đổi nhiệt độ tôi luyện 1t tT T   , tăng t = t + 1, và nhảy tới Bước 2. End. 3.1.2.2. Ứng dụng giải thuật MOPSO-SA thiết kế tối ưu các từ ngôn ngữ và lựa chọn hệ luật tối ưu Với các mục tiêu tối ưu (2.8), giải thuật tối ưu các tham số ngữ nghĩa được cấu trúc hóa bằng giải thuật MOPSO-SA và được đặt tên là MOPSOSA_SPO. Thuật toán 3.5. MOPSOSA_SPO //[CT6] Tối ưu các tham số ngữ nghĩa Đầu vào: tập dữ liệu mẫu D = {(dp, Cp) | p = 1, , m}, các tham số: a, b, NR0, Npop, Gmax, K, λ, Tmax, α; //Npop là kích thước bầy, Gmax là số thế hệ. Đầu ra: Tập các tham số ngữ nghĩa tối ưu Лopt; Begin 22 Giải thuật này cụ thể hóa Giải thuật 3.4 với vị trí của mỗi cá thể là một bộ tham số ngữ nghĩa; Trả lại tập các giá trị tốt nhất của tập các bộ tham số ngữ nghĩa (gần) tối ưu Лopt; End. 3.1.2.3. Thực nghiệm so sánh giải thuật MOPSO-SA so với giải thuật MOPSO Theo các kết quả thực nghiệm đối với 23 tập dữ liệu, hệ phân lớp MOPSO-SAAX có độ chính xác trên tập kiểm tra cao hơn so với hệ phân lớp MOPSOAX đối với 16 trong số 23 tập dữ liệu được thực nghiệm và có độ chính xác bằng nhau đối với 3 tập dữ liệu. Hệ phân lớp MOPSO-SAAXmrtp có độ chính xác trên tập kiểm tra cao hơn so với hệ phân lớp MOPSOAXmrtp đối với 17 tập dữ liệu trong số 23 tập dữ liệu được thực nghiệm và có độ chính xác bằng nhau đối với 1 tập dữ liệu. Qua các kết quả kiểm định WSR, ta có thể kết luận rằng, việc sử dụng giải thuật tối ưu MOPSO-SA trong thiết kế FLRBC với ngữ nghĩa dựa trên ĐSGT AX cho độ chính xác phân lớp tốt hơn so với việc sử dụng giải thuật MOPSO (82,48% so với 81,92%) nhưng không làm tăng độ phức tạp của hệ phân lớp. Việc sử dụng giải thuật tối ưu MOPSO-SA trong thiết kế FLRBC với ngữ nghĩa dựa trên ĐSGT AXmrtp không những cho độ chính xác phân lớp tốt hơn (82,94% so với 82,67%) mà còn cho độ phức tạp trung bình thấp hơn (107,52 so với 114,78) so với việc sử dụng giải thuật tối ưu MOPSO. 3.2. NÂNG CAO HIỆU QUẢ SINH LUẬT MỜ VỚI NGỮ NGHĨA DỰA TRÊN ĐẠI SỐ GIA TỬ BẰNG KỸ THUẬT LỰA CHỌN ĐẶC TRƯNG Với mục tiêu làm giảm số chiều của các tập dữ liệu có số chiều lớn trước khi thực hiện sinh luật sử dụng ĐSGT, luận án đề xuất ứng dụng kỹ thuật lựa chọn đặc trưng với trọng số động do Sun X. đề xuất năm 2013 như một bước tiền xử lý bổ sung cho phương pháp hai bước thiết kế FLRBC trên cơ sở ĐSGT. 3.2.1. Một số khái niệm cơ bản về lý thuyết thông tin 3.2.2. Kỹ thuật lựa chọn đặc trưng sử dụng trọng số động Công thức phân tích tính hợp lý: (, ) = 2 × (;) ()() (0 ≤ (, ) ≤ 1) (3.15) Một thuộc tính fi được bị dư thừa với thuộc tính fj nếu thỏa bất đẳng thức sau: ; ≤ (;) (3.16) Tỷ lệ dư thừa tương đối giữa hai thuộc tính: (, ) = 2 × ;(;) ()() (3.17) Hai thuộc tính fi và fj là phụ thuộc lẫn nhau nếu: ; ≥ (;) (3.18) Tỷ lệ phụ thuộc lẫn nhau giữa fi và fj: (, ) = 2 × ;(;) ()() (3.19) Tỷ lệ phụ thuộc lẫn nhau giữa fi và fj biểu thị tỷ lệ tăng hoặc giảm của tính hợp lý giữa fi và nhãn lớp bởi có sự tham gia của thuộc tính mới được định nghĩa như sau: (, ) = (, ), ; > (;) (, ), ; ≤ (;) (3.20) Ta thấy rằng −1≤ (, ) ≤ 1. Giải thuật lựa chọn đặc trưng DWFS được đề xuất bởi Sun X. dưới dạng mã giả: 23 Thuật toán 3.6. DWFS //mô phỏng thuật toán trong [116] Đầu vào: Tập dữ liệu huấn luyện D với không gian thuộc tính F và lớp C. Đầu ra: Tập con S được lựa chọn có thuộc tính. Begin Khởi tạo các biến: k = 1, = ∅; Khởi tạo trọng số w(f) cho từng thuộc tính f trong F bằng 1; Tính giá trị U(f, class) cho từng thuộc tính f trong F; While ≤ do For từng thuộc tính ứng viên ∈ do Tính () = (, ) × (); End; Chọn thuộc tính ứng viên fj có J(f) lớn nhất; = ∪ {}; F = F \ {fj}; For từng thuộc tính ứng viên ∈ do Tính tỷ lệ phụ thuộc lẫn nhau CR(i, j); () = () × (1 + (, )); End; k = k + 1; End. Độ phức tạp của giải thuật DWFS là ( × ) như đã được chứng minh bởi Sun X., trong đó, n là số thuộc tính gốc và số thuộc tính được lựa chọn. 3.2.3. Ứng dụng giải thuật DWFS trong thiết kế FLRBC trên cơ sở ĐSGT Phương pháp hai giai đoạn thiết kế FLRBC theo tiếp cận ĐSGT được bổ sung thêm một giai đoạn tiền xử lý áp dụng giải thuật DWFS. Bước tiền xử lý như sau: Với mỗi tập dữ liệu cụ thể, các thuộc tính có giá trị liên tục được phân hoạch thành các cụm bằng việc áp dụng kỹ thuật phân cụm mờ c-means với hàm chỉ số hợp lệ cụm (cluster validity index function) PBMF để rời rạc hóa dữ liệu và sau đó áp dụng giải thuật DWFS để lựa chọn một tập con các thuộc tính có tính phân biệt nhất. 3.2.4. Kết quả thực nghiệm và thảo luận Sau khi áp dụng kỹ thuật lựa chọn đặc trưng, thời gian sinh luật giảm rất nhiều. Chẳng hạn, thời gian sinh tập luật khởi đầu từ tập dữ liệu Dermatology gốc trong trường hợp độ dài luật tối đa là 3 hết 07:41:03 hay 27.663 giây, lớn hơn 5.532 lần so với sau khi áp dụng kỹ thuật lựa chọn đặc trưng lựa chọn ra 7 thuộc tính. Kết quả thực nghiệm về độ chính xác phân lớp của FLRBC trên cơ sở ĐSGT AX và ĐSGT AXmrtp đối với tập dữ liệu gốc và các tập dữ liệu đã áp dụng kỹ thuật lựa chọn đặc trưng trên kết quả trung bình đối với 8 tập dữ liệu được thử nghiệm, độ chính xác và độ phức tạp trung bình của các hệ phân lớp không có nhiều khác biệt. Các kết quả kiểm định giả thuyết thống kê cho ta kết luận, việc áp dụng phương pháp lựa chọn đặc trưng như một bước tiền xử lý trong phương pháp thiết kế FLRBC trên cơ sở ĐSGT không làm giảm chất lượng của hệ phân lớp. Để giảm thời gian sinh luật từ các tập dữ liệu có số chiều lớn, kỹ thuật lựa chọn đặc trưng nên được áp dụng như một kỹ thuật tiền xử lý dữ liệu. 3.3. Kết luận chương 3 Chương này trình bày giải pháp nâng cao chất lượng của FLRBC được thiết kế trên cơ sở ĐSGT sử dụng hai thuật toán tối ưu bầy đàn đa mục tiêu MOPSO và thuật toán lai 24 MOPSO-SA để tối ưu các tham số ngữ nghĩa và tìm kiếm hệ luật tối ưu. Áp dụng kỹ thuật lựa chọn đặc trưng để làm giảm số chiều của dữ liệu nhằm giảm thời gian sinh luật. KẾT LUẬN CỦA LUẬN ÁN Luận án đạt được một số kết quả chính như sau: 1) Đề xuất mở rộng lý thuyết đại số gia tử biểu diễn lõi ngữ nghĩa của các từ ngôn ngữ nhằm cung cấp một cơ sở hình thức cho việc sinh tự động ngữ nghĩa tính toán dựa trên tập mờ có lõi là một khoảng của khung nhận thức ngôn ngữ. Luận án nghiên cứu trường hợp cụ thể là ngữ nghĩa dựa trên tập mờ hình thang. 2) Ứng dụng lõi ngữ nghĩa và ngữ nghĩa tính toán dựa trên tập mờ hình thang của khung nhận thức ngôn ngữ giải bài toán thiết kế tự động FLRBC. Các kết quả thực nghiệm luận án thực hiện đã cho thấy tính hiệu quả và tính khả dụng của ĐSGT mở rộng luận án đề xuất. 3) Nghiên cứu các yếu tố ảnh hưởng đến hiệu quả của các phương pháp thiết kế FLRBC với ngữ nghĩa tính toán của từ ngôn ngữ được xác định dựa trên ĐSGT và đề xuất giải pháp nâng cao hiệu quả thiết kế FLRBC dựa trên kỹ thuật tính toán mềm. Trong tiếp cận thiết kế hệ phân lớp dựa trên ĐSGT tồn tại những hạn chế cần có những nghiên cứu tiếp theo cũng như mở rộng ứng dụng ĐSGT như sau: - Các phương pháp thiết kế FLRBC với ngữ nghĩa tính toán của các từ ngôn ngữ được xác định dựa trên ĐSGT được đề xuất từ trước đến nay đều được thực hiện dựa trên hai giai đoạn là thiết kế tối ưu các từ ngôn ngữ và tìm kiếm hệ luật tối ưu. Việc chia giai đoạn này có thể chưa đảm bảo tìm được bộ tham số ngữ nghĩa và hệ luật tốt nhất. Giải pháp có thể được cải tiến ở đây là nghiên cứu áp dụng kỹ thuật đồng tối ưu các tham số ngữ nghĩa và tìm kiếm hệ luật tối ưu. - Tiếp cận thiết kế FLRBC trong luận án sử dụng ĐSGT để trích rút hệ luật ngôn ngữ mờ cho hệ phân lớp với ngữ nghĩa của các từ ngôn ngữ trong cơ sở luật là ngữ nghĩa dựa trên tập mờ. Do đó, khi lập luận phân lớp sử dụng phương pháp lập luận Single winner rule hay Weighted vote đều phải sử dụng các phép toán trên tập mờ và kết quả phụ thuộc vào việc lựa chọn các phép toán này. Với ĐSGT, ta có thể xây dựng phương pháp lập luận riêng mà không cần sử dụng tập mờ. Một trong các hướng nghiên cứu tiếp theo là xây dựng phương pháp lập luận cho FLRBC hoàn toàn sử dụng ĐSGT. - Trong thực tế tồn tại nhiều dạng bài toán phân lớp khác nhau đang được các nhà nghiên cứu quan tâm giải quyết bằng FLRBC như: Bài toán phân lớp đối với tập dữ liệu lớn, bài toán phân lớp đối với các tập dữ liệu thiếu thông tin, bài toán phân lớp đối với các tập dữ liệu có số mẫu dữ liệu không cân bằng đối với các nhãn lớp, bài toán học nửa giám sát, bài toán học trực tuyến, Đây là các bài toán cần những kỹ thuật xử lý khác nhau và có thể được giải quyết hiệu quả kết hợp với phương pháp luận ĐSGT. Luận án đã chứng tỏ khả năng ứng dụng hiệu quả của ĐSGT mở rộng trong thiết kế tự động FLRBC. ĐSGT mở rộng cần được ứng dụng trong việc giải quyết các bài toán ứng dụng khác nhau như các bài toán điều khiển, thao tác cơ sở dữ liệu mờ và nhận dạng hệ mờ nhằm tăng tính hiệu quả và tính linh hoạt trong biểu diễn ngữ nghĩa. DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN [CT1] Nguyễn Cát Hồ, Trần Thái Sơn, Phạm Đình Phong (2012), “Định lượng ngữ nghĩa khoảng của đại số gia tử với việc bổ sung một gia tử đặc biệt”, Tạp chí Tin học và Điều khiển học Tập 28 (4), tr. 346 – 358. [CT2] Phong Pham Dinh, Ho Nguyen Cat, Thuy Nguyen Thanh (2013), “Multi- objective Particle Swarm Optimization Algorithm and its Application to the Fuzzy Rule Based Classifier Design Problem with the Order Based Semantics of Linguistic Terms”, In proceeding of The 10th IEEE RIVF International Conference on Computing and Communication Technologies (RIVF-2013), Hanoi, Vietnam, pp. 12 – 17. [CT3] Phạm Đình Phong, Nguyễn Cát Hồ, Nguyễn Thanh Thủy (2013), “Nghiên cứu phương pháp xây dựng thể hạt với ngữ nghĩa tập mờ tam giác của các từ ngôn ngữ cho bài toán phân lớp”, Kỷ yếu Hội nghị Quốc gia lần thứ VI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin, Thừa Thiên – Huế, tr. 385 – 393. [CT4] Phạm Đình Phong, Nguyễn Cát Hồ, Trần Thái Sơn, Nguyễn Thanh Thủy (2013), “Một phương pháp thiết kế hệ phân lớp mờ dựa trên việc mở rộng lượng hóa Đại số gia tử”, Tạp chí Tin học và Điều khiển học Tập 29 (4), tr. 325 – 337. [CT5] Cat Ho Nguyen, Thai Son Tran, Dinh Phong Pham (2014), “Modeling of a semantics core of linguistic terms based on an extension of hedge algebra semantics and its application”, Knowledge-Based Systems 67, pp. 244 – 262 (SCI indexed). [CT6] Phong Pham Dinh, Thuy Nguyen Thanh, Thanh Tran Xuan (2014), “A Hybrid Multi-objective PSO-SA Algorithm for the Fuzzy Rule Based Classifier Design Problem with the Order Based Semantics of Linguistic Terms”, VNU Journal of Science: Computer Science and Communication Engineering 30 (4), pp. 44–56. [CT7] Pham Dinh Phong (2015), “An application of feature selection for the fuzzy rule based classifier design with the order based semantics of linguistic terms for high- dimensional datasets”, Journal of Computer Science and Cybernetics 31 (2), pp. 171 – 184. [CT8] Pham Dinh Phong (2015), An application of feature selection for the fuzzy rule based classifier design based on an enlarged hedge algebras for high-dimensional datasets, Journal of Science and Technology, VAST, ISSN: 0866-708X 53 (5), pp. 583–597.

Các file đính kèm theo tài liệu này:

luan_van_phat_trien_mot_so_phuong_phap_thiet_ke_he_phan_lop.pdf