Luận án Nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa

Trong chương 2 của luận án, tác giả đã trình bày các thuật toán phân cụm bán giám sát mờ trong phân đoạn ảnh. Để kiểm nghiệm các thuật toán trên, các kết quả thực nghiệm sẽ được trình bày trong chương này. Cụ thể như sau: dữ liệu cho thực nghiệm là các ảnh nha khoa thu thập trong giai đoạn 2014-2015 tại bệnh viện trường Đại học Y Hà Nội được cài đặt trên các thuật toán phân cụm bán giám sát mờ lai ghép (eSFCM-Otsu), thuật toán phân cụm bán giám sát mờ dựa trên đặc trưng không gian (SSFC-SC), thuật toán phân cụm bán giám sát mờ kết hợp với phương pháp thỏa dụng mờ (SSFC-FS), thuật toán phân cụm bán giám sát mờ có lựa chọn thông tin bổ trợ (SSFC-FSAI) và các kết quả được thể hiện dưới dạng số và bảng. Các kết quả này đã chứng tỏ những đề xuất và cải tiến được trình bày trong luận án có hiệu năng và độ chính xác cao hơn các thuật toán có liên quan được đề xuất bởi các tác giả khác. Việc đánh giá được thực hiện qua giá trị của các độ đo phân cụm.

143 trang | Chia sẻ: tueminh09 | Lượt xem: 1321 | Lượt tải: 2

Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ƣu khi m = 2. 94 (a)Kết quả so sánh độ đo PBM (b) Kết quả so sánh độ đo SSWC (c) Kết quả so sánh độ đo IFV (d) Kết quả so sánh độ đo DB (e) Kết quả so sánh độ đo CH (f) Kết quả so sánh độ đo BH (g) Kết quả so sánh độ đo BR (h) Kết quả so sánh độ đo DL Hình 3.3. Độ chính xác của các phƣơng pháp phân cụm với số cụm thay đổi Hình 3.3 minh họa sự so sánh độ chính xác của các thuật toán theo số cụm và các độ đo. Trong các hình 3.3, thể hiện giá trị của các tham số còn lại tƣơng ứng là 9.0 và m=2. Việc mô tả trực quan bằng hình 3.3 cũng khẳng định cho việc chọn tham số phù hợp, đồng thời cũng khẳng định lợi thế của thuật toán mới đề xuất. Các kết quả nhận đƣợc dựa trên việc thực nghiệm với các trƣờng hợp khác nhau của bộ tham số (b1, b2, b3) với thuật toán SSFC-FS (mỗi trƣờng hợp gọi là 1 case). Việc thiết lập các case của bộ tham số (b1, b2, b3) nhƣ sau: Case 1: (b1 > b2 > b3): (b1=0.6, b2=0.3, b3=0.1). Case 2: (b1 > b3 > b2): (b1=0.6, b2=0.1, b3=0.3). Case 3: (b2 > b1 > b3): (b1=0.3, b2=0.6, b3=0.1). Case 4: (b2 > b3 > b1): (b1=0.1, b2=0.6, b3=0.3). Case 5: (b3 > b1 > b2): (b1=0.3, b2=0.1, b3=0.6). 95 Case 6: (b3 > b2 > b1): (b1=0.1, b2=0.3, b3=0.6). Bảng 3.8. Kết quả thuật toán SSFC-FS với các bộ tham số (b1, b2, b3) C=3 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 PBM 110873.56 98323.63 115721.36 112632.63 124733.36 126733.87 DB 2.372 2.253 1.276 2.352 0.983 0.772 IFV 88.78 96.65 127.64 102.63 123.53 134.76 SSWC 0.778 0.752 0.872 0.877 0.798 0.782 CH 3972352 3839150 4178632 4275322 4472652 4328662 BH 3002.83 3127.52 5572.63 5472.63 3527.56 3722.56 BR -3438321 -3326862 -2835723 -2973223 -2532356 -2472573 DL 1027532367 1132766323 1928236868 1865323323 1527352332 1432633265 C=5 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 PBM 108362.37 132562.32 176232.63 142736.43 78232.67 198347.74 DB 0.983 1.672 2.732 0.0927 0.837 0.891 IFV 89.73 99.38 123.63 103.76 113.78 120.83 SSWC 0.783 0.812 0.871 0.887 0.825 0.722 CH 3876232 3237663 4373862 4257321 4242627 4226262 BH 4128.67 4087.39 5598.63 5387.72 4323.22 3273.67 BR -4027632 -4026372 -3252342 -3574253 -2982342 -2827636 DL 1027437643 1026327327 1887532323 1777352474 1626527427 1232674433 C=7 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 PBM 76364.78 67343.28 96237.37 34625.73 93546.22 87232.63 DB 2.354 2.451 0.989 2.870 1.092 0.862 IFV 56.67 59.89 89.76 78.32 67.89 84.78 SSWC 0.678 0.715 0.824 0.917 0.732 0.776 CH 3086463 2986264 4376223 4176232 4565235 3987437 BH 2098.72 2283.27 4723.84 4709.89 3982.74 3872.83 BR -4578322 -3948886 -3327427 -3293834 -2982323 -2883275 DL 987237874 936744424 1029326443 1008722333 982364224 956726323 96 Bảng 3.9. Giá trị trung bình của thuật toán SSFC-FS với các bộ tham số (Giá trị in đậm chỉ ra giá trị tốt nhất của mỗi độ đo) Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 PBM 98533.57 99409.74 129397.12 96664.93 98837.42 137438.08 DB 1.903 2.125 1.666 1.772 0.971 0.842 IFV 78.39 85.31 113.68 94.90 101.73 113.46 SSWC 0.746 0.760 0.856 0.894 0.785 0.760 CH 3645016 3354359 4309572 4236292 4426838 4180787 BH 3076.74 3166.06 5298.37 5190.08 3944.51 3623.02 BR -4014758 -3767373 -3138497 -3280437 -2832340 -2727828 DL 1014069295 1031946025 1615031878 1550466043 1378747994 1207344674 Trong bảng 3.8 và bảng 3.9, kết quả chỉ ra thấy thuật toán SSFC-FS phù hợp với case 3 (b2 > b1 > b3): (b1=0.3, b2=0.6, b3=0.1). Thực nghiệm cũng chỉ ra, các giới hạn dƣới của IFV chỉ số của các giải pháp tối ƣu đƣợc nêu trong mục 2.3 là hoàn toàn chính xác thông qua sáu trƣờng hợp trong kiểm tra bảng 3.8 và bảng 3.9. Các kết quả đƣợc tính toán thực tế nhƣ sau: Case 1: IFV= 88.78 >  22max2 log 1 C SD C D   = 4.89. Case 2: IFV = 96.65>  22max2 log 1 C SD C D   = 5.43. Case 3: IFV = 110.62 >  22max2 log 1 C SD C D   = 6.15. Case 4: IFV = 102.63 >  22max2 log 1 C SD C D   = 5.72. Case 5: IFV = 123.53 >  22max2 log 1 C SD C D   = 6.88. Case 6: IFV = 134.76>  22max2 log 1 C SD C D   = 7.56. 97 Trong bảng 3.10, chỉ ra kết quả so sánh tính toán trên cơ sở lý thuyết và thực nghiệm về giá trị trung bình của độ đo IFV thực hiện thuật toán SSFC-SC. Kết quả này thể hiện việc tính toán lý thuyết và thực nghiệm gần xấp xỉ nhau. Để so sánh thuật toán đƣợc đề xuất SSFC-SC với các thuật toán có liên quan, các kết quả đƣợc trình bày ở trên đƣợc thể hiện dƣới dạng đồ thị nhƣ Hình 3.3. Bảng 3.10. Giá trị trung bình IFV lý thuyết và IFV thực nghiệm C=3 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 IFV(LT) 87.89 96.72 109.71 103.69 123.04 133.83 IFV(TN) 88.78 96.65 110.62 102.63 123.53 134.76 C=5 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 IFV(LT) 88.60 98.35 123.02 102.89 111.92 119.89 IFV(TN) 89.73 99.38 123.63 103.76 113.78 120.83 C=7 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 IFV(LT) 55.36 58.82 89.02 76.78 66.67 84.03 IFV(TN) 56.67 59.89 89.76 78.32 67.89 84.78 98 3.4. Ứng dụng phân đoạn ảnh trong hỗ trợ chẩn đoán bệnh nha khoa Chẩn đoán bệnh luôn đóng một vai trò quan trọng trong nha khoa. Trong chẩn đoán các bệnh nha khoa, thì ảnh X-quang chính là một tƣ liệu quan trọng, nó giúp nha sĩ dựa vào đó có thể kiểm tra, phân tích, và tìm ra những bệnh mà nếu chỉ nhìn bằng mắt thƣờng sẽ khó xác định. Thực tế, kinh nghiệm và trình độ của các bác sĩ là khác nhau cũng có thể dẫn đến các kết quả khác nhau và chƣa hoàn toàn đảm bảo chính xác. Khi không có các hệ hỗ trợ chẩn đoán thì các bác sĩ phải xem xét toàn bộ ảnh và các thông tin từng phần rồi tìm kiếm xem vùng nào có khả năng mắc bệnh. Khi có các hệ hỗ trợ chẩn đoán thì các hệ hỗ trợ đã đƣa ra trợ giúp việc tìm kiếm xem vùng nào có khả năng mắc bệnh và bệnh nào có thể mắc sau đó bác sỹ chỉ cần tập trung vào vùng đó và kiểm tra lại xem chẩn đoán đó có đúng hay không để đƣa ra quyết định cuối cùng. Trong thực tế việc chẩn đoán chính xác bệnh thì nha sĩ cần các thông tin thu thập một loạt các thông tin khác nhau từ quá trình thăm khám, qua ảnh X-quang và từ các xét nghiệm. Trong ứng dụng này luận án chỉ dừng lại việc hộ trợ chẩn đoán nha khoa sử dụng khai thác các thông tin ảnh X-quanh nha khoa. Việc ứng dụng chẩn đoán bệnh nha khoa có thể sử dụng suy diễn mờ với tập cơ sở dữ liệu ảnh. Tuy nhiên phƣơng pháp này vẫn còn một số nhƣợc điểm nhƣ: một ảnh có thể mắc nhiều bệnh khác nhau (lai ghép giữa các bệnh mà trong cơ sở dữ liệu mẫu không có) khi đó chẩn đoán đƣợc một bệnh hoặc không phát hiện hết các bệnh, kết quả suy diễn đạt hiệu suất chƣa cao, chƣa đi sâu vào từng khu vực. Khi đó trong phần này có đề xuất một môn hình sử dụng ảnh phân đoạn để hỗ trợ chẩn đoán bệnh nha khoa. 99 3.4.1. Mô hình hóa bài toán Trong hệ thống chẩn đoán nha khoa (DDS: Dental Diagnosis System) thể hiện trong hình 3.4, khi đó cơ sở dữ liệu ảnh nha khoa mẫu đƣợc xây dựng là tập huấn luyện tạo dựng thành kho dữ liệu để sử dụng cho việc chẩn đoán bệnh về sau. Một ảnh đầu vào từ tập dữ liệu kiểm tra đƣợc đƣa vào hệ thống DDS và sau đó đƣợc phân tích bằng phƣơng pháp trích chọn đặc trƣng nha khoa để có đƣợc biểu diễn đặc trƣng (mục 2.2). Sau đó, sử dụng thuật toán SSFC-FS nhằm phân loại các ảnh đầu vào dựa trên các đặc trƣng không gian của ảnh nha khoa để phân thành các phân đoạn, từ đó đƣa ra các vùng có thể có bệnh. Từ những phân đoạn này, chúng tôi chỉ giữ lại những phân đoạn có khả năng mắc bệnh để tiến hành chẩn đoán. Đối với một phân đoạn ảnh xác định cho trƣớc sử dụng các ảnh trong cơ sở dữ liệu ảnh mẫu để chuẩn đoán xem vùng này có bị bệnh không, nếu bị bệnh thì bệnh đó là bệnh gì. Khi đó phân đoạn là một đỉnh của đồ thị và mỗi ảnh trong cơ sở dữ liệu mẫu cùng là 1 đỉnh của đồ thị dựa mối quan hệ đặc trƣng giữa các ảnh hoặc vùng xây dựng nên các cạnh của đồ thị (trong trƣờng hợp tất cả đều có quan hệ với các đặc trƣng khác nhau sẽ tạo lên một đồ thị đầy đủ). 100 Hình 3.4. Hệ thống chẩn đoán bệnh nha khoa (DDS) Phƣơng pháp lƣợng tử hóa véc tơ là một thủ tục không bắt buộc có thể đƣợc sử dụng trong các trƣờng hợp mà đồ thị là lớn (có nhiều đỉnh). Sau đó, một cải tiến của phƣơng pháp APC là APC+ tích hợp một hàm lực mới giữa một đỉnh đồ thị, Bắt đầu Ảnh X- quang nha khoa, các tham số Cơ sở dữ liệu ảnh mẫu Trích chọn đặc trƣng nha khoa Lƣợng tử hóa Kết thúc Phân cụm sử dụng APC+ Tổng hợp bệnh của ảnh xác định từ các phân đoạn Bảng tổng hợp bệnh của các phân đoạn Phân đoạn ảnh sử dụng phƣơng pháp SSFC-FS tạo ra C* phân đoạn Tạo C1 (C1<C*) phân đoạn Phân đoạn thứ i Trích chọn đặc trƣng của phân đoạn thứ i Biểu diễn bằng đồ thị Xác định bệnh của phân đoạn thứ i i=i+1 i > C1 i=1 Chẩn đoán bệnh Sai Đúng 101 thuật toán này nhằm mục đích xem phân đoạn đang xét gần với ảnh mẫu nào trong cơ sở dữ liệu mẫu. Quá trình này đƣợc thực hiện lặp đi lặp lại cho các phân đoạn khác, kết quả cuối cùng là một tập các bệnh tƣơng tự cho tất cả các phân đoạn đƣợc biểu diễn trong một bảng quyết định bệnh. Một thủ tục ra quyết định mới xác định bệnh chính thức từ bảng đƣợc đề xuất trong một vài bƣớc cuối cùng của hệ thống DDS. Kết quả cuối cùng của hệ thống này là bệnh có khả năng xảy ra nhất đối với một ảnh nha khoa ban đầu. Thuật toán của phƣơng pháp DDS đƣợc trình bày trong bảng 3.11 dƣới đây: Bảng 3.11. Thuật toán của phƣơng pháp DDS Input Ảnh X-quang nha khoa và các tham số Output Thông tin chẩn đoán bệnh DDS: 1 Trích chọn đặc trƣng từ ảnh đầu vào 2 Phân đoạn ảnh nha khoa dùng SSFC-FS (thành C* phân đoạn) 3 Chọn C1 phân đoạn trong C * phân đoạn 4 i=0 5 Repeat 6 i=i+1 7 Trích chọn đặc trƣng của phân đoạn thứ i 8 Mô hình hóa bằng đồ thị 9 Lƣợng tử hóa véc tơ 10 Phân cụm dựa trên đồ thị dùng APC+ 11 Xác định các bệnh tƣơng ứng với phân đoạn thứ i 12 Until i > C1 13 Lập bảng tổng hợp bệnh các phân đoạn 14 Tổng hợp bệnh của ảnh xác định từ các phân đoạn 15 Xác định bệnh của ảnh. 102 Trong thuật toán của phƣơng pháp DDS thì các bƣớc: trích chọn đặc trƣng từ ảnh đầu vào, phân đoạn ảnh nha khoa dùng SSFC-FS đã đƣợc trình bày ở chƣơng 2. Còn các bƣớc: chọn phân đoạn có khả năng mắc bệnh, chẩn đoán từng phân đoạn, lập bảng tổng hợp bệnh các phân đoạn, tổng hợp bệnh của ảnh xác định từ các phân đoạn, xác định bệnh sẽ đƣợc trình bày ở các mục tiếp theo. 3.4.2. Chọn phân đoạn có khả năng mắc bệnh Sau khi phân đoạn ảnh xong thu đƣợc các vùng có sự đồng nhất. Với ảnh đầu vào đó ta thu đƣợc các phân đoạn khác nhau. Nhƣng sau khi phân đoạn thì các phân đoạn sẽ có khả năng mắc bệnh là khác nhau và sẽ có giá trị khác nhau trong chẩn đoán. Do vậy ta đƣa ra một trọng số để xác định khả năng mắc bệnh của các vùng. Ví dụ: một vùng là nền của khoảng không khi chụp phim X-quang, là vùng không có khả năng mắc bệnh. Nhƣ vậy, việc lựa chọn các vùng để chẩn đoán là hết sức quan trọng. Do vậy trong mục này sẽ tập trung xem xét các vùng có khả năng mắc bệnh. Trong ảnh X-quang nha khoa thƣờng có ba vùng chính: vùng một là răng; thứ hai tƣơng ứng với xƣơng, tủy, xi măng và cơ cấu vòm; và cuối cùng là vùng nền của ảnh với các cấp độ màu xám tối thiểu. Bệnh răng miệng thƣờng xảy ra ở hai vùng đầu tiên. Khi bệnh về răng xuất hiện thì xuất hiện các số điểm ảnh bất thƣờng so với các điểm khác trong vùng của ảnh X-quang. Nhƣ vậy, cƣờng độ giữa các điểm ảnh này là không tƣơng đồng [15]. Từ đặc điểm này, chúng ta có thể xác định các khu vực có thể mắc bệnh để chẩn đoán bệnh về nha khoa dựa trên sự tƣơng đồng trong vùng của ảnh. Các bƣớc thực hiện:  Bước 1: Xác định các điểm ảnh trong phân đoạn sau khi phân đoạn ảnh.  Bước 2: Tính trọng số độ tƣơng đồng giữa các điểm ảnh trong một vùng theo công thức sau:   * ,1 ,1,max Ckuaveragew ij Cjki k        (3.22) 103 Trong đó u(k)ij là sự giống nhau giữa các điểm i với điểm ảnh j trong vùng ảnh k.  Bước 3: Chuẩn hóa trọng số tƣơng đồng:   * ,1 ,1, max 1 Ck w w W k Ck k k   (3.23)  Bước 4: Sắp xếp các trọng số tƣơng đồng đã chuẩn hóa.  Bước 5: Chọn các phân cùng có trọng số tƣơng đồng thấp hơn λ. 3.4.3. Chẩn đoán từng phân đoạn 3.4.3.1. Biểu diễn đồ thị Khi chọn đƣợc C1 vùng có khả năng mắc bệnh ở mục trên để thực hiện chẩn đoán. Sau đó mỗi vùng chẩn đoán đƣợc kết hợp với cơ sở dữ liệu ảnh nha khoa mẫu để tạo thành một biểu đồ. Khi đó đồ thị đƣợc sử dụng với mục đích biểu diễn mối quan hệ giữa mô hình bệnh tật và vùng chẩn đoán một cách trực quan. Mỗi nút đồ thị của biểu diễn vùng chẩn đoán hoặc ảnh mẫu trong cơ sở dữ liệu mẫu bệnh. Các cung thể hiện mối quan hệ giữa vùng chẩn đoán với các ảnh mẫu trong cơ sở dữ liệu mẫu bệnh hoặc các mẫu bệnh với nhau dựa trên các đặc trƣng ảnh nha khoa. (có thể xác định trọng số mỗi quan hệ giữa các cung (u, v) dựa trên khoảng cách Euclide ( vu  ) giữa nút u với nút v. Khi đó hình 3.5 minh họa một vùng chẩn đoán bệnh với bốn mẫu ảnh. Hình 3.5. Biểu đồ biểu diễn vùng phân đoạn và 4 mẫu bệnh. 104 3.4.3.2. Lượng tử hóa đồ thị Mục đích của mục này là giảm bớt số nút trong đồ thị để đẩy nhanh thời gian xử lý. Lƣợng tử hóa đồ thị là một phƣơng pháp hiệu quả thƣờng đƣợc dùng để đƣa ra các nút đại diện cho một nhóm nút gần giống nhau những vẫn đảm bảo không mất mát thông tin [25]. Các bƣớc thực hiện lƣợng tử hóa đồ thị nhƣ sau:  Bước 1: Chọn k nút ngẫu nhiên từ đồ thị ban đầu (k điểm từ dữ liệu ban đầu).  Bước 2: Tính toán khoảng cách Euclide bình phƣơng giữa tất cả k véc tơ đƣợc chọn với phân đoạn chẩn đoán tƣơng ứng.  Bước 3: Khởi tạo vectơ X j vào phân đoạn thứ i với các giới hạn của bình phƣơng khoảng cách Euclide từ X j để véc tơ thứ i là ngắn nhất  Bước 4: Tính toán trung tâm của phân đoạn.  Bước 5: Xác định sai số MSE của k phân đoạn thu đƣợc. 3.4.3.3. Phân cụm dựa trên đồ thị Trong phần này, một cải tiến của thuật toán phân cụm dựa trên đồ thị APC (gọi là APC+) sẽ đƣợc trình bày. Thuật toán APC+ tích hợp một hàm lực mới giữa 1 điểm dữ liệu và một mẫu nhằm tìm ra bệnh tƣơng đồng nhất đối với phân đoạn ảnh đang xét. Thuật toán phân cụm dựa trên đồ thị (Affinity propagation clustering – APC) [59] đƣợc sử dụng để trao đổi thông điệp giữa chính các điểm dữ liệu với nhau xác định mẫu nào trong cơ sở dữ liệu thuộc về cùng nhóm bệnh với phân đoạn ảnh đang xét. Trong thuật toán APC ban đầu, hàm tƣơng tự giữa các nút đƣợc xác định bởi công thức sau: jixx ji  ,sN,1,...,j N; 1,...,i },{s S 2 ijij . (3.24) Khi i = j = k, thì các Nk ,...,1,skk  đƣợc gọi là “preferences”. Bên cạnh đó, có 2 loại thông điệp đƣợc truyền đi giữa các điểm dữ liệu là “responsibility” và 105 “availability” tƣơng ứng đƣợc ký hiệu là ),( kir và ),( kia . Thông điệp ),( kir đƣợc gửi từ một điểm dữ liệu i tới điểm mẫu k, thông điệp ),( kia đƣợc gửi theo hƣớng ngƣợc lại. Các thông điệp này đƣợc định nghĩa bởi:  )',()',(max),(:),( ' kiskiakiskir kk   (3.25)   ),'(,0max),(,0min:),( },{' kirkkrkia kii  (3.26) Trong thuật toán cải tiến APC+, chúng tôi tích hợp một hàm lực giữa 1 điểm dữ liệu và một mẫu vào vế phải của công thức (3.25) nhằm tăng tốc độ truyền thông điệp giữa các điểm. Cụ thể, hàm lực này đƣợc xác định bởi:              ik ik ik ik ik ik ik ddif xd dd ddif xd dd F 2 2 , (3.27) Trong đó ikd là khoảng cách Euclid giữa một điểm i và một mẫu k; d là giá trị trung bình của khoảng cách từ điểm i tới tất cả các mẫu. Khi đó r(i, k) trong (3.25) đƣợc thay thế bởi:   ik kk Fkiakiskiskiakiskir *),(*),()',()',(max),(:),( '   . (3.28) Thuật ngữ “self-availability” đƣợc định nghĩa nhƣ một trƣờng hợp đặc biệt:  ),'(,0max:),( ,' kirkka ki   . (3.29) Một hằng số đƣợc gọi là hệ số giảm xóc đƣợc sử dụng để giảm sự dao động khi truyền thông điệp: ),().1(),(.:),( 11 kirkirkir ttt    (3.30) ),().1(),(.:),( 11 kiakiakia ttt    (3.31) Bảng 3.12 trình bày mã giả của thuật toán APC+. 106 Bảng 3.12. Thuật toán APC+ Input Một tập hợp các độ tƣơng tự theo cặp  Nkikis ,...,2,1,),(  Output Một bộ gán nhãn: ) cˆ ., . . ,cˆ( cˆ N1 APC+ 1 Khởi tạo, i, k : a(i, k)=0, t=0. 2 Repeat 3 Cập nhật “responsibility” theo công thức (3.30) với r(i, k) đƣợc xác định nhƣ trong (3.28) 4 Cập nhật “ availability” bằng công thức (3.31) 5 t=t+1 6 Until       )1()( ,, tt kiakia 3.4.4 . Xây dựng bảng tổng hợp của các đoạn Sau khi áp dụng thuật toán APC+, chúng tôi tìm ra đƣợc các mẫu bệnh đồng nhất với vùng thứ i. Từ nhãn của các mẫu bệnh mẫu thuộc cùng nhóm với vùng thứ i, tính toán khoảng cách trung bình từ vùng chẩn đoán đến các mẫu bệnh cùng nhãn trong cùng nhóm với phân đoạn, đƣợc xác định theo công thức (3.32) nhƣ sau:   mjCidd ikij ,1,,1,average 1' jgroup k'   . (3.32) Sau đó, vectơ độ thuộc của vùng chẩn đoán thứ i vào các mẫu bệnh chuẩn đƣợc xác định bởi công thức (3.33):   mjCiddu ijjijij ,1,,1,max/ 1  (3.33) Tổng hợp bệnh của vùng: Sau khi tính đƣợc véc tơ độ thuộc của từng vùng chẩn đoán, tổng hợp tất cả các vùng có thể mắc bệnh đƣợc xác định ở mục 3.4.2 ta xây dựng đƣợc bảng tổng hợp bệnh cho tất cả các phân đoạn. Bảng tổng hợp bệnh của các phân đoạn đƣợc biểu diễn trong bảng 3.13. 107 Bảng 3.13. Bảng tổng hợp bệnh của các vùng Mẫu bệnh 1 Mẫu bệnh 2 .. Mẫu bệnh m Phân đoạn 1 u11 u12 u1m Phân đoạn 2 .. Phân đoạn n un1 u2n unm Chú ý rằng giá trị độ thuộc của mỗi phân đoạn tới mẫu bệnh đƣợc xác định theo phƣơng trình (3.33). Khi đó, sử dụng các phƣơng trình này ta có đƣợc kết quả tổng hợp bệnh cho ảnh đầu vào trong bảng 3.14: Bảng 3.14. Các kết quả tổng hợp bệnh của ảnh Mẫu bệnh 1 Mẫu bệnh 2 .. Mẫu bệnh m Ảnh y1 y2 ym Trong đó: mj uW uW y m j n i iji n i iji j ,1, * * 1 1 1       . (3.34)  myyyy ,....,,max 21max  (3.35) Cuối cùng, ta xác định đƣợc bệnh nha khoa trong ảnh theo công thức (3.34) bằng toán tử tìm cực đại. 3.4.5. Phân tích và đánh giá mô hình DDS - DDS tạo ra một cách tiếp cận kết hợp giữa các phƣơng pháp phân đoạn ảnh và ra quyết định cho việc chẩn đoán bệnh nha khoa. - DDS còn cải tiến phƣơng pháp phân cụm dựa trên đồ thị mới đƣợc gọi là APC+ cho giai đoạn phân lớp. - DDS cũng có hiệu năng cao hơn với thuật toán phân cụm lan truyền sự tƣơng đồng (APC) bằng cách điều chỉnh một hàm lực giữa một điểm đầu vào và một 108 mẫu trong APC+; sử dụng các thao tác phân đoạn và một phƣơng pháp ra quyết định mới. - DDS đƣa ra một quan điểm tốt về việc làm thế nào để kết hợp thuật toán phân cụm (trong phân đoạn) với hệ thống dựa trên tri thức (kết hợp thuật toán APC+ và thủ tục ra quyết định trong việc phân lớp và ra quyết định). Điều này có ý nghĩa lớn đối với bài toán chẩn đoán nha khoa nói riêng và các lĩnh vực y tế - tin học liên ngành nói chung. 3.4.6. Kết quả thực nghiệm Dựa trên bộ dữ liệu về ảnh X-quang nha khoa, để đánh giá mô hình đề xuất với các mô hình dựa trên thuật toán đã có từ trƣớc (APC, FKNN [48]). Các độ đo đƣợc tính toán trong mỗi trƣờng hợp để có sự so sánh về hiệu năng của các thuật toán. Các kết quả lần lƣợt sẽ đƣợc trình bày trong các phần dƣới đây. 3.4.6.1. Độ đo và tiêu chí đánh giá kết quả Các độ đo phân lớp dữ liệu cũng đƣợc sử dụng nhằm mục đích đánh giá hiệu năng của thuật toán đƣợc đề xuất. Các độ đo MSE (Mean Squared Error), MAE (Mean Absolute Error) and Accuracy đƣợc sử dụng trong thực nghiệm của đề tài luận án.  Độ đo MSE: Nếu Yˆ là véc tơ với n thành phần dự đoán và Y là véc tơ các giá trị đƣợc quan sát tƣơng ứng với các đầu vào của hàm tạo ra các dự đoán Yˆ thì độ đo MSE đƣợc ƣớc lƣợng bởi công thức sau [29]:      n i i n i ii e n YY n MSE 11 2 1ˆ1 . (3.36) Điều này có nghĩa là độ đo MSE là trung bình của bình phƣơng các sai số. Chỉ số này đƣợc tính toán một cách dễ dàng cho một mẫu đặc thù. Giá trị tốt nhất của độ đo MSE là giá trị nhỏ nhất của nó. 109  Độ đo MSA: Bên cạnh độ đo MSE, độ đo MAE cũng đƣợc sử dụng để tính toán sai số dự đoán nhƣng thƣờng dùng trong phân tích chuỗi thời gian. Trong thống kê, MAE là một đại lƣợng đƣợc dùng để đánh giá xem các dự đoán gần với các đầu ra thực sự nhƣ thế nào. Công thức xác định độ đo MAE đƣợc cho bởi [22]:    n i i n i ii e n yf n MAE 11 11 , (3.37) Trong đó if : là thành phần dự đoán, iy là giá trị thực. Giá trị của độ đo MSA càng nhỏ càng tốt.  Độ đo Accuracy: Độ đo Accuracy là độ đo đơn giản nhất của quyết định chẩn đoán. Nó đƣợc tính toán bởi công thức sau [22]: dcba da Accuracy    , (3.38) Với: - a là kết quả dự đoán bệnh là đúng – tích cực (TP) - b là kết quả dự đoán bệnh là sai – tích cực (FP) - c là kết quả dự đoán bệnh là sai – tiêu cực (FN) - d là kết quả dự đoán bệnh là đúng – tiêu cực (TN) Giá trị của độ đo Accuracy càng lớn càng tốt. 3.4.6.2. Kết quả chẩn đoán từ dữ liệu ảnh Sau khi thực hiện chẩn đoán bệnh trên từng phân đoạn của các ảnh đầu vào trong bộ dữ liệu kiểm tra, kết quả tổng hợp đƣợc thể hiện trong bảng 3.15 dƣới đây. 110 Bảng 3.15. Dự đoán bệnh cuối cùng cho dữ liệu kiểm tra Ảnh Mẫu bệnh Kết luận bệnh 1 2 3 4 5 4 0.46 0.00 0.25 0.29 0.00 1 8 0.32 0.04 0.23 0.24 0.17 1 11 0.28 0.34 0.10 0.28 0.00 2 22 0.22 0.29 0.11 0.25 0.13 2 23 0.21 0.31 0.00 0.24 0.24 2 24 0.20 0.23 0.33 0.25 0.00 3 29 0.00 0.26 0.33 0.24 0.16 3 32 0.15 0.09 0.27 0.26 0.22 3 39 0.00 0.22 0.27 0.31 0.21 4 40 0.21 0.06 0.26 0.24 0.23 3 41 0.17 0.16 0.20 0.26 0.22 4 44 0.22 0.21 0.00 0.26 0.31 5 45 0.09 0.28 0.00 0.30 0.32 5 47 0.23 0.05 0.17 0.25 0.31 5 Bảng 3.16. Đánh giá hiệu năng của tất cả các phƣơng pháp APC FIS FKNN DDS MSE 0.821 0.2493 0.2373 0.0742 MAE 0.701 0.1321 0.2373 0.0742 Accuracy (%) 89.10 90.30 80.55 92.86 Với số liệu trong bảng 3.16, rõ ràng là phƣơng pháp DDS đƣợc đề xuất có hiệu năng tốt hơn các thuật toán khác nhƣ APC, FIS, FKNN. Trên đồ thị hình 3.6 111 với từng độ đo: với độ đo MSE (thể hiện bởi đƣờng màu đỏ) và độ đo MAE (thể hiện đƣờng màu xanh) thì điểm của phƣơng pháp DDS là thấp nhất, khi đó thể hiện phƣơng pháp DDS là tốt nhất sau đó đến lần lƣợt phƣơng pháp FIS, FKNN, APC. Còn độ đo Accuracy (thể hiện bởi đƣờng màu vàng) thì thì điểm của phƣơng pháp DDS là cao nhất, khi đó thể hiện phƣơng pháp DDS là tốt nhất sau đó đến lần lƣợt phƣơng pháp FIS, FKNN, APC. Bằng kết quả thực nghiệm dựa trên 3 độ đo MSE, MAE, Accuracy thì phƣơng pháp DDS đều cho kết quả trong hộ trợ chẩn đoán bệnh nha khoa tốt hơn với các phƣơng pháp APC, FIS, FKNN. Kết quả này chứng tỏ độ chính xác của phƣơng pháp đề xuất cao hơn, do vậy DDS đƣa ra một quan điểm tốt trong việc kết hợp ảnh phân đoạn đoạn với hệ thống dựa trên tri thức (kết hợp thuật toán APC+ và thủ tục ra quyết định trong việc phân lớp và ra quyết định) để đƣa ra kết quả hỗ trợ chẩn đoán bệnh nha khoa. Điều này có ý nghĩa đối với bài toán hỗ trợ chẩn đoán bệnh nha khoa nói riêng và các lĩnh vực y tế - tin học liên ngành nói chung. Hình 3.6. Kết quả thực nghiệm trên đồ thị 112 3.5. Kết luận Trong chƣơng 3 đã trình bày các kết quả thực nghiệm của các thuật toán phân cụm bán giám mờ mới đề xuất với các phƣơng pháp phân cụm bán giám sát mờ, phƣơng pháp phân cụm mờ, phƣơng pháp tách ngƣỡng đã có. Kết quả đã đƣợc đánh giá thông qua các độ đo, đồng thời thông qua các kết quả thực nghiệm này kiểm nghiệm lại một lần nữa tính đúng đắn của các đề xuất khi xây dựng bằng các mô hình lý thuyết. Trong mục 3.3, luận án đã đánh giá so sánh các thuật toán phân cụm bán giám sát mờ mới đề xuất với thuật toán phân cụm mờ, đồng thời cũng đánh cách xác định thông tin sao cho phù hợp với từng ảnh đầu vào. Trong mục 3.4 đã trình bày về ứng dụng của ảnh phân đoạn trong thiết kế hệ hỗ trợ chẩn đoán bệnh. Đã đƣa ra đề xuất mô hình hỗ trợ chẩn đoán bệnh từ ảnh phân đoạn. Trong mục 3.4.6 luận án đã trình bày các tiêu chí đánh giá và đánh giá kết quả chẩn đoán bệnh nha khoa thông qua các độ đo Accuracy, MSE, MAE. 113 KẾT LUẬN Từ các đề xuất đƣợc trình bày trong chƣơng 2 và chƣơng 3 của luận án, công trình nghiên cứu này đã đề xuất các phƣơng pháp phân cụm bán giám sát mờ trong phân đoạn ảnh X-quang nha khoa và ứng dụng trong chẩn đoán bệnh nha khoa. Trên cơ sở nghiên cứu đó, luận án đã đạt đƣợc một số kết quả đóng góp nghiên cứu sau đây: - Đề xuất phƣơng pháp phân đoạn ảnh nha khoa dựa trên phân cụm bán giám sát mờ lai ghép. Kết hợp các phƣơng pháp FCM, OTSU và eSFCM để xây dựng mô hình lai ghép và áp dụng cho bài toán phân đoạn ảnh X-quang nha khoa. Với sự kết hợp này, thuật toán mới đề xuất có kết quả tốt hơn so với các thuật toán riêng lẻ đƣợc đánh giá bằng các độ đo dựa trên các kết quả thực nghiệm. Đề xuất về thuật toán mới này đã đƣợc công bố trong [CT3]; - Đề xuất thuật toán phân cụm bán giám sát mờ có sử dụng đặc trƣng không gian ảnh nha khoa trong bài toán phân đoạn ảnh nha khoa (SSFC-SC). Bằng cách kết hợp thông tin không gian với các đặc trƣng của ảnh nha khoa và thông tin bổ trợ của phân cụm bán giám sát mờ, bài toán phân đoạn ảnh nha khoa đƣợc mô tả dƣới dạng một bài toán tối ƣu đa mục tiêu. Phƣơng pháp nhân tử Lagrange đƣợc sử dụng để xác định nghiệm tối ƣu của bài toán (là ma trận độ thuộc và các tâm cụm). Các kết quả thực nghiệm chứng tỏ rằng hiệu năng và độ chính xác của thuật toán đƣợc đề xuất cao hơn một số thuật toán có liên quan theo các chỉ số đánh giá; - Vận dụng phƣơng pháp thỏa dụng mờ để giải bài toán tối ƣu đa mục tiêu của phân cụm bán giám sát mờ. Từ đó đề xuất thuật toán SSFC-FS. Các tính chất nghiệm thu đƣợc bằng phƣơng pháp thỏa dụng mờ cũng đƣợc chỉ rõ và khẳng định bằng lý thuyết nghiệm thu đƣợc giải theo phƣơng pháp thỏa dụng mờ tốt hơn nghiệm thu đƣợc giải theo phƣơng pháp Lagrange dựa trên chỉ số đánh giá IFV. Nghiệm thu đƣợc theo phƣơng pháp thỏa dụng mờ hội tụ về nghiệm tối ƣu toàn cục thông qua đánh giá sự chênh lệch giữa hai lần lặp liên tiếp. Các tích chất nghiệm thu đƣợc bằng phƣơng pháp thỏa dụng mờ đƣợc chứng minh và thể hiện thông qua các định lý 2.1, 2.2, 2.3, 2.4 và các tính chất 2.1, 2.2, 2.3 ở chƣơng 2. Kết quả nghiên cứu đã đƣợc công bố tại [CT5]; 114 - Đƣa ra phƣơng pháp xác định hàm thông tin bổ trợ phù hợp (SSFC-FSAI) với ảnh đầu vào khi áp dụng phƣơng pháp phân cụm bán giám sát mờ dựa trên đặc trƣng không gian (SSFC-FS). Nghĩa là, với mỗi ảnh đầu vào, hàm thông tin bổ trợ đƣợc lựa chọn một cách phù hợp để hiệu năng và độ chính xác khi thực hiện thuật toán là cao nhất. Kết quả nghiên cứu đã đƣợc công bố tại [CT2]; - Đã tiến hành cài đặt thử nghiệm và đánh giá so sánh các thuật toán cải tiến với một số thuật toán mà các nghiên cứu trƣớc đã đƣa ra dựa trên bộ dữ liệu thực tế. Kết quả thử nghiệm khẳng định rằng với 8 độ đo trong phân cụm thì các thuật toán đƣợc đề xuất trong luận án có hiệu năng tốt hơn với các thuật toán đƣợc đề xuất trƣớc. Các kết quả này đƣợc trình bày cụ thể ở trong các mục 3.2 và mục 3.3. Đồng thời luận án cũng trình bày một ứng dụng của phân đoạn ảnh nha khoa trong hỗ trợ chẩn đoán bệnh nha khoa, đã đƣợc công bố tại [CT4]. Bên cạnh các kết quả đã đạt đƣợc, các nghiên cứu trong luận án vẫn còn một số hạn chế nhƣ: i) Các kết quả phân đoạn mới chỉ thực nghiệm trên các ảnh X- quang nha khoa thông thƣờng trong khi việc thử nghiệm với các loại ảnh nha khoa 3D cho phù hợp với sự phát triển công nghệ mới là cần thiết; ii) Thời gian thực hiện của các thuật toán đề xuất còn lớn, cần cải tiến để phù hợp với thực tế; iii) Các kết quả chẩn đoán thu đƣợc mới chỉ hỗ trợ các bác sỹ trong chẩn đoán cận lâm sàng, cần kết hợp với kết quả chẩn đoán lâm sàng trong quá trình chẩn đoán và xây dựng thêm các đặc trƣng xuất phát từ các bệnh để việc chẩn đoán đƣợc chính xác hơn. Hƣớng phát triển các nghiên cứu trong thời gian tiếp theo: i) Cải tiến các thuật toán đã có để thời gian xử lý phù hợp hơn; ii) Áp dụng phân cụm bán giám sát mờ trong phân đoạn ảnh với các ảnh thông thƣờng; iii) Tiếp tục nghiên cứu bài toán chẩn đoán bệnh nha khoa để cho việc tiếp cận với thực tế hơn; iv) Kết hợp với các triệu chứng lâm sàng trong quá trình chẩn đoán. 115 NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN Thông qua quá trình nghiên cứu phân tích về các phƣơng pháp phân cụm bán giám sát mờ áp dụng cho phân đoạn ảnh nha khoa, trong luận án đã có một số đóng góp nhƣ sau: 1. Luận án đã nghiên cứu phát triển các thuật toán phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa, cụ thể đã có một số đóng góp mới nhƣ sau: - Đề xuất các phƣơng pháp phân đoạn ảnh nha khoa dựa trên phân cụm bán giám sát mờ lai ghép. Lai ghép giữa: phân cụm bán giám sát mờ với phân cụm mờ và phƣơng pháp tách ngƣỡng Otsu; - Đề xuất phân cụm bán giám sát mờ có sử dụng đặc trƣng không gian ảnh nha khoa vào bài toán phân đoạn ảnh; - Vận dụng các phƣơng pháp giải tối ƣu đa mục tiêu để giải bài toán tối ƣu đa mục tiêu của phân cụm bán giám sát mờ, từ đó đƣa ra các mệnh đề, định lý và tính chất nghiệm của bài toán; - Xây dựng kho dữ liệu các hàm xác định thông tin bổ trợ cho phân cụm bán giám sát mờ, từ đó lựa chọn hàm thông tin bổ trợ phù hợp với từng ảnh đầu vào cho chất lƣợng cụm đƣợc tốt hơn. 2. Cài đặt thực nghiệm các thuật toán cải tiến dựa trên thu thập và phân tích dữ liệu ảnh về các mẫu bệnh nha khoa. Ứng dụng phân đoạn ảnh trong hệ hỗ trợ chẩn đoán nha khoa. 116 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ [CT1]. Lê Bá Dũng và Trần Mạnh Tuấn (2010), “Một số phƣơng pháp phân cụm dữ liệu”, tạp chí Khoa học và công nghệ - Đại học Thái Nguyên, tập 69, số 07, trang 15-20. [CT2]. Tran Manh Tuan, Le Hoang Son, Le Ba Dung (2015), “Dynamic semi- supervised fuzzy clustering for dental x-ray image segmentation: an analysis on the additional function”, Journal of Computer Science and Cybernetics, 31(4), 323-339. [CT3]. Le Hoang Son, Tran Manh Tuan (2016), “A cooperative semi-supervised fuzzy clustering framework for dental X-ray image segmentation”, Expert Systems With Applications, 46, pp. 380 – 393 (SCIE, IF = 2.240, Elsevier). [CT4]. Tran Manh Tuan, Le Hoang Son (2016), “A novel framework using graph- based clustering for dental x-ray image search in medical diagnosis”, International Journal of Engineering and Technology, 8(6), pp.428-433. [CT5]. Tran Manh Tuan, Tran Thi Ngan, Le Hoang Son (2016), “A Novel Semi- Supervised Fuzzy Clustering Method based on Interactive Fuzzy Satisficing for Dental X-Ray Image Segmentation”, Applied Intelligence, in press, DOI: 10.1007/s10489-016-0763-5 (SCI, IF=1.853, Springer). 117 TÀI LIỆU THAM KHẢO Tiếng Việt [1]. Bùi Công Cƣờng (2001), Hệ mờ, mạng nơron và ứng dụng, Nhà xuất bản khoa học và kỹ thuật, Hà nội. [2]. Hoàng Tử Hùng, Huỳnh Kim Khang, Ngô Thị Quỳnh Lan, Ngô Lê Thu Thảo, Hoàng Đạo Bảo Trâm (2008), Giải phẫu răng, Nhà xuất bản Y học, Hà Nội [3]. Doãn Tam Hòe (2005), Lý thuyết tối ưu và đồ thị, nhà xuất bản giáo dục. [4]. Nguyễn Hải Thanh (2005), Toán ứng dụng (Giáo trình sau đại học), NXB sƣ phạm, Hà Nội. Tiếng Anh [5]. Agarwal, M., Agrawal, H., Jain, N., & Kumar, M. (2010), “Face recognition using principle component analysis, eigenface and neural network”, IEEE International Conference on, In Signal Acquisition and Processing IEEE, 2010 (ICSAP10), 310-314. [6]. Alok, A. K., Saha, S., & Ekbal, A. (2015), “A new semi-supervised clustering technique using multi-objective optimization”, Applied Intelligence, 43(3), 633-661. [7]. Anbarasi, M., Anupriya, E., & Iyengar, N. C. S. N. (2010), “Enhanced prediction of heart disease with feature subset selection using genetic algorithm”, International Journal of Engineering Science and Technology, 2(10), 5370-5376. [8]. Ahonen, T., Hadid, A., & Pietikainen, M.(2006), “Face description with local binary patterns: Application to face recognition”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 28(12), 2037-2041. 118 [9]. Babu, N. V., & Patel, P.(2015), “Comparative Evaluation of Extraoral and Intraoral Periapical Radiographic Technique in Children”, International Journal of Scientific Study, 2(10), 7-12. [10]. Bezdek, J. C. (1981), Pattern recognition with fuzzy objective function algorithms, Kluwer Academic Publishers. [11]. Bhatla, N., & Jyoti, K. (2012), “An analysis of heart disease prediction using different data mining techniques”, International Journal of Engineering Research and Technology, 1(8), 1-4. [12]. Bouchachia, A., & Pedrycz, W. (2006), “Data clustering with partial supervision”, Data Mining and Knowledge Discovery, 12(1), 47-78. [13]. Caponetti, L., Castellano, G., Basile, M. T., & Corsini, V. (2014), “Fuzzy mathematical morphology for biological image segmentation”, Applied intelligence, 41(1), 117-127. [14]. CARIES, D. (2005), “Oral and dental diseases: Causes, prevention and treatment strategies” Burden of Disease in India, 275-278. [15]. Chen, J., Zhao, S., & Wang, H. (2011), “Risk analysis of flood disaster based on fuzzy clustering method”, Energy Procedia, 5, 1915-1919. [16]. Chuang, K. S., Tzeng, H. L., Chen, S., Wu, J., & Chen, T. J. (2006). “Fuzzy c-means clustering with spatial information for image segmentation”, computerized medical imaging and graphics, 30(1), 9-15. [17]. Dutta, A., Kar, A., & Chatterji, B. N. (2011), “Adaptive Corner Detection Algorithm and its Extension using Window-based Approach for Gray-scale Images”, IETE Journal of Research, 57(3), 286-293. [18]. Ghazali, K. H., Mustafa, M. M., Hussain, A., Bandar, M. E. C., & Kuantan, G. (2007), “Feature Extraction technique using SIFT keypoints descriptors”, The International Conference on Electrical and Engineering and Informatics Institut technology, 17-19. 119 [19]. Gould, S., Gao, T., & Koller, D. (2009), “Region-based segmentation and object detection”, Advances in neural information processing systems, 655-663. [20]. Guillaume, S. (2001), “Designing fuzzy inference systems from data: an interpretability-oriented review”, IEEE Transactions on Fuzzy Systems, 9(3), 426-443. [21]. Houhou, N., Bresson, X., Szlam, A., Chan, T. F., & Thiran, J. P. (2009), “Semi-supervised segmentation based on non-local continuous min-cut”, In Scale Space and Variational Methods in Computer Vision, Springer Berlin Heidelberg , 112-123. [22]. Hyndman, R. J., & Koehler, A. B. (2006), “Another look at measures of forecast accuracy”, International journal of forecasting, 22(4), 679-688. [23]. Jain, A. K., & Chen, H. (2004), “Matching of dental X-ray images for human identification”, Pattern recognition, 37(7), 1519-1532. [24]. Kang, J., & Ji, Z. (2010), “Dental plaque quantification using mean-shift- based image segmentation”, 2010 IEEE International Symposium on Computer Communication Control and Automation, 470-473. [25]. Kekre, H. B., & Sarode, T. K. (2009), “Vector quantized codebook optimization using K-means”, International Journal on Computer Science and Engineering (IJCSE), 283-290. [26]. Kondo, T., Ong, S. H., & Foong, K. W. (2004), “Tooth segmentation of dental study models using range images”, IEEE Transactions on Medical Imaging, 23(3), 350-362. [27]. Lai, Y. H., & Lin, P. L. (2008), “Effective segmentation for dental X-ray images using texture-based fuzzy inference system”, Advanced Concepts for Intelligent Vision Systems, Springer Berlin Heidelberg, 936-947. [28]. Lee, C. C. (1990), “Fuzzy logic in control systems: fuzzy logic controller. II”, IEEE Transactions on Systems, Man and Cybernetics, 20(2), 419-435. 120 [29]. Lehmann, E. L., & Casella, G. (1998), Theory of point estimation, Springer Science & Business Media. [30]. Leung, T., & Malik, J. (1998), “Contour continuity in region based image segmentation”, In Computer Vision—ECCV ”98, Springer Berlin Heidelberg, 544-559. [31]. Li, J., Bioucas-Dias, J. M., & Plaza, A. (2010), “Semisupervised hyperspectral image segmentation using multinomial logistic regression with active learning”, IEEE Transactions on, Geoscience and Remote Sensing, 48(11), 4085-4098. [32]. Lim, Y. W., & Lee, S. U. (1990), “On the color image segmentation algorithm based on the thresholding and the fuzzy c-means techniques”, Pattern recognition, 23(9), 935-952. [33]. Lu, J., Yuan, X., & Yahagi, T. (2007), “A method of face recognition based on fuzzy c-means clustering and associated sub-NNs”, IEEE Transactions on, Neural Networks, 18(1), 150-160. [34]. Mai Shouman, Tim Turner, and Rob Stocker (2012), “Applying k-Nearest Neighbour in Diagnosing Heart Disease Patients”, International Journal of Information and Education Technology, 2(3), 32-37. [35]. Mahoor, M. H., & Abdel-Mottaleb, M. (2005), “Classification and numbering of teeth in dental bitewing images”, Pattern Recognition, 38(4), 577- 586. [36]. Martin, A., Gayathri, V., Saranya, G., Gayathri, P., & Venkatesan, P. (2011),“A hybrid model for bankruptcy prediction using genetic algorithm, fuzzy c-means and MARS”, International Journal on Soft Computing ( IJSC ), 2(1), 12-24. [37]. Narkhede, H. P. (2013), “Review of image segmentation techniques”, Int. J. Sci. Mod. Eng, 1(8), 54-61. 121 [38]. Nayak, J., Naik, B., & Behera, H. S. (2015), “Fuzzy C-Means (FCM) Clustering Algorithm: A Decade Review from 2000 to 2014”, In Computational Intelligence in Data Mining, 2, 133-149, Springer India. [39]. Ngo, L. T., Mai, D. S., & Pedrycz, W. (2015), “Semi-supervising Interval Type-2 Fuzzy C-Means clustering with spatial information for multi-spectral satellite image classification and change detection”, Computers & Geosciences, 83, 1-16. [40]. Nomir, O., & Abdel-Mottaleb, M. (2005), ”A system for human identification from X-ray dental radiographs”, Pattern Recognition, 38(8), 1295- 1305. [41]. Oad, K. K., DeZhi, X., & Butt, P. K. (2014), “A Fuzzy Rule Based Approach to Predict Risk Level of Heart Disease”, Global Journal of Computer Science and Technology, 14(3), 16-22. [42]. Oliveira, J., & Proença, H. (2011), “Caries detection in panoramic dental X- ray images”, Computational Vision and Medical Image Processing, Springer Netherlands, 175-190. [43]. Otsu, N. (1979), “A threshold selection method from gray-level histograms” Automatica , 1(9), 62-66. [44]. Paiva, A. R., & Tasdizen, T. (2010), “Fast semi-supervised image segmentation by novelty selection”, 2010 IEEE International, Conference on In Acoustics Speech and Signal Processing (ICASSP), 1054-1057. [45]. Rad, A. E, Rahim, M. S. M, & Norouzi, A. (2014), “Level Set and morphological Operation Techniques in Application of Dental Image Segmentation”, International Scholarly and Scientific Research & Innovation, 8(4), 177-180. 122 [46]. Rad A. E., Mohd Rahim M. S., Rehman A., Altameem A. and Saba T. (2013), “Evaluation of current dental radiographs segmentation approaches in computer-aided applications”, IETE Technical Review, 30(3), 210-222. [47] Rajkumar, A., & Reena, G. S. (2010), “Diagnosis of heart disease using datamining algorithm”, Global journal of computer science and technology, 10(10), 38-43. [48]. Ramírez, E., Castillo, O., & Soria, J. (2010), “Hybrid System for Cardiac Arrhythmia Classification with Fuzzy K-Nearest Neighbors and Neural Networks Combined by a Fuzzy Inference System”, In Soft Computing for Recognition Based on Biometrics, Springer Berlin Heidelberg, 37-55. [49]. Rezaee, M. R., Van der Zwet, P. M., Lelieveldt, B. P., Van Der Geest, R. J., & Reiber, J. H. (2000), “A multiresolution image segmentation technique based on pyramidal segmentation and fuzzy clustering”, IEEE Transactions on, Image Processing, 9(7), 1238-1248. [50]. Said, E., Fahmy, G. F., Nassar, D., & Ammar, H.(2004), “Dental x-ray image segmentation”, International Society for Optics and Photonics and In Defense and Security , 409-417. [51]. E.H. Said, D. Eldin M. Nassar, G. Fahmy, and H.H. Ammar (2006), “Teeth Segmentation in Digitized Dental X-Ray Films Using Mathematical Morphology”, IEEE transactions on information forensics and security, 1(2), 178-89. [52]. Salem Saleh Al-amri, N.V. Kalyankar and Khamitkar S.D (2010), “Image Segmentation by Using Thershod Techniques”, Journal of computing, 2(5), 83- 86. [53]. Sato-Ilic, M., & Jain, L. C. (2006), “Introduction to fuzzy clustering”, In Innovations in Fuzzy Clustering, Springer Berlin Heidelberg, 1-8. 123 [54]. Scott, J. H. (1977), Introduction to dental anatomy, Edinburgh, Churchill Livingstone. [55]. Smith, R. A., Cokkinides, V., von Eschenbach, A. C., Levin, B., Cohen, C., Runowicz, C. D., ... & Eyre, H. J. (2002), “American Cancer Society guidelines for the early detection of cancer”, CA: a cancer journal for clinicians, 52(1), 8- 22. [56]. Son, L. H. (2015), “A novel kernel fuzzy clustering algorithm for geo- demographic analysis”, Information Sciences: an International Journal, 317(C), 202-223. [57]. Son, L.H., Van Hai , P.(2016), “A Novel Multiple Fuzzy Clustering Method Based on Internal Clustering Validation Measures with Gradient Descent”, International Journal of Fuzzy Systems, 1-10. [58]. Son, L.H., Thong, N.T. (2015), “Intuitionistic Fuzzy Recommender Systems: An Effective Tool for Medical Diagnosis”, Knowledge-Based Systems, 74, 133–150. [59]. Sujji, G. E., Lakshmi, Y. V. S., & Jiji, G. W. (2013), “MRI Brain Image Segmentation based on Thresholding”, International Journal of Advanced Computer Research, 3(1), 97-101. [60]. Tapas Kanungo, David M. Mount, Nathan S. Netanyahu, Christine D. Piatko, Ruth Silverman, and Angela Y. Wu(2002), “An Efficient k-Means Clustering Algorithm:Analysis and Implementation”, IEEE transaction on pattern analysis and machine intelligence, 24(7), 881-892. [61]. Tee, C. S.( 2008), Feature selection for content-based image retrieval using statistical discriminant analysis, Doctoral dissertation, Universiti Teknologi Malaysia, Faculty of Computer Science and Information System. 124 [62]. Thong, N. T., Son, L.H. (2015), “HIFCF: An effective hybrid model between picture fuzzy clustering and intuitionistic fuzzy recommender systems for medical diagnosis”, Expert Systems With Applications, 42(7), 3682-3701. [63]. Thong, P. H., Son, L.H. (2015), “Picture fuzzy clustering: a new computational intelligence method”, Soft Computing, In press, DOI: 10.1007/s00500-015-1712-7. [64]. Vendramin, L., Campello, RJ, & Hruschka, ER.(2010), “Relative clustering validity criteria: A comparative overview,” Statistical Analysis and Data Mining: The ASA Data Science Journal, 3(4), 209-235. [65]. Wang, J. S., & Lee, C. G. (2002), “Self-adaptive neuro-fuzzy inference systems for classification applications”, IEEE Transactions on Fuzzy Systems, 10(6), 790-802. [66]. Yasunori, E., Yukihiro, H., Makito, Y., & Sadaaki, M. (2009), “On semi- supervised fuzzy c-means clustering”, Proceeding of FUZZ-IEEE 2009, 1119- 1124. [67]. Yin, X., Shu, T., & Huang, Q. (2012), “Semi-supervised fuzzy clustering with metric learning and entropy regularization”, Knowledge-Based Systems, 35, 304-311. [68]. Zafar, M. S., & Javed, E. (2013), “Extraoral radiography: An alternative to intraoral radiography for endodontic (root canal system) length determination”, European Scientific Journal, 9(15), 51-61. [69]. Zhang, H., & Lu, J. (2009), “Semi-supervised fuzzy clustering: A kernel- based approach”, Knowledge-Based Systems, 22(6), 477-481. [70]. Zhou, J., & Abdel-Mottaleb, M. (2005), “A content-based system for human identification based on bitewing dental X-ray images”, Pattern Recognition, 38(11), 2132-2142. 125 PHỤ LỤC 1 Hình 66 ảnh nha khoa sử dụng trong thực nghiệm. 126 127 128 PHỤ LỤC 2 Một số kết quả về độ chính xác của các thuật toán (Các giá trị in đậm chỉ ra giá trị tốt nhất trong mỗi hàng). Thuật toán FCM OTSU eSFCM eSFCM- OTSU SSFC-SC SSFC-FS SSFC- FSAI Ảnh 1 PBM 35392 49482 31968 32763 53891 52761 23743 DB 0.672 0.641 0.716 0.743 0.763 0.873 0.874 IFV 19.99 Inf 254.27 254.37 47.91 52.87 102.39 SSWC 0.573 0.531 0.565 0.537 0.672 0.763 0.643 CH 6.00E+06 5.00E+06 8.00E+06 7.67E+06 1.00E+07 1.00E+07 3.00E+06 BH 1562.7 992.97 1594 1672 1793 2092.6 738.39 BR -3.00E+07 -8.00E+06 -2.00E+07 -2.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 DL 7.00E+09 4.00E+09 6.00E+09 6.00E+09 7.00E+09 1.00E+10 6.00E+09 Ảnh 2 PBM 30446 43436 27974 321232 52837 47166 21736 DB 0.685 0.677 0.731 0.723 0.827 0.932 0.847 IFV 19.77 Inf 302.12 323.27 47.44 51.67 68.38 SSWC 0.637 0.613 0.627 0.632 0.788 0.963 0.764 CH 9.00E+06 6.00E+06 8.00E+06 8.00E+06 9.00E+06 1.00E+07 5.00E+06 BH 1457.8 898.76 1342.8 1387.5 1663.4 2102.8 798.49 BR -2.00E+07 -1.00E+07 -3.00E+07 -3.00E+07 -4.00E+07 -2.00E+07 -3.00E+07 DL 7.00E+09 1.00E+09 6.00E+09 6.00E+09 7.00E+09 9.00E+09 7.00E+09 Ảnh 11 PBM 24644 45375 18818 19273 50335 46868 14873 DB 0.677 0.689 0.792 0.735 1.053 0.986 0.893 IFV 18.28 Inf 126.47 98.82 37.38 43.64 41.49 SSWC 0.562 0.549 0.556 0.623 0.604 0.726 0.645 CH 5.00E+06 4.00E+06 7.00E+06 7.00E+06 7.00E+06 1.00E+07 1.00E+07 BH 2174.7 839.95 2345.7 2343.4 2569.3 4576.8 849.49 BR -3.00E+06 -3.00E+06 -3.00E+06 -3.00E+06 -3.00E+06 -3.00E+06 -3.00E+06 DL 1.00E+09 5.00E+08 1.00E+09 1.00E+09 1.00E+09 2.00E+09 1.00E+09 Ảnh 12 PBM 39879 52729 36424 32432 57903 51724 28433 DB 0.651 0.667 0.689 0.632 0.864 0.983 0.784 129 IFV 20.43 Inf 269.35 98.27 48.84 52.37 53.29 SSWC 0.614 0.612 0.637 0.681 0.782 0.893 0.743 CH 1.00E+07 2.00E+06 9.00E+06 9.00E+06 1.00E+07 1.00E+07 9.00E+06 BH 1626.3 1112.6 1676.7 1982.3 1789.6 2013.3 847.93 BR -3.00E+07 -1.00E+07 -2.00E+07 -2.00E+07 -3.00E+07 -2.00E+06 -2.00E+06 DL 6.00E+09 5.00E+09 7.00E+09 6.00E+09 8.00E+09 1.00E+10 6.00E+09 Ảnh 24 PBM 66354 87072 58902 72532 85614 85346 74735 DB 0.687 0.694 0.746 0.693 0.725 0.745 0.702 IFV 26.96 Inf 426.53 213.23 65.5 68.12 78.94 SSWC 0.664 0.647 0.666 0.624 0.788 0.986 0.849 CH 2.00E+06 701570 219097 27384 402216 602763 323754 BH 1295.9 601.65 1382.3 1382.3 1393.1 2039.9 784.94 BR -3.00E+06 -3.00E+06 -4.00E+06 -3.00E+06 -4.00E+06 -3.00E+06 -3.00E+06 DL 9.00E+08 3.00E+08 9.00E+08 9.00E+08 9.00E+08 1.00E+09 9.00E+08 Ảnh 25 PBM 34160 87073 58902 67323 95844 89377 43748 DB 0.676 0.698 0.767 0.801 0.804 0.753 0.784 IFV 19.93 Inf 215.55 102.32 48.92 59.87 67.98 SSWC 0.613 0.572 0.627 0.637 0.674 0.765 0.677 CH 9.00E+06 3.00E+06 9.00E+06 9.00E+06 1.00E+07 1.00E+07 9.00E+06 BH 1652.7 1123 1672.7 1536.2 1746.2 2123.9 874.38 BR -4.00E+07 -1.00E+07 -3.00E+07 -3.00E+07 -4.00E+07 -3.00E+07 -2.00E+07 DL 7.00E+09 6.00E+09 7.00E+09 7.00E+09 7.00E+09 9.00E+09 8.00E+09 Ảnh 34 PBM 39714 50655 36489 41283 50984 49673 32744 DB 0.66 0.653 0.692 0.673 0.984 0.787 0.723 IFV 20.74 Inf 259.63 121.28 30.67 32.84 34.39 SSWC 0.597 0.568 0.583 0.628 0.615 0.725 0.674 CH 7.00E+06 1.00E+06 6.00E+06 6.00E+06 7.00E+06 9.00E+06 8.00E+06 BH 1627.6 982.27 1567.6 1635.3 1782.7 2350 946.94 BR -3.00E+07 -1.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07 -2.00E+07 DL 7.00E+09 1.00E+09 6.00E+09 6.00E+09 8.00E+09 1.00E+10 7.00E+09 Ảnh 35 PBM 45714 67630 4788.9 52223 72736 70376 52784 130 DB 0.678 0.646 0.762 0.724 0.987 0.893 0.856 IFV 28.78 Inf 899.34 273.3 35.53 39.87 43.94 SSWC 0.598 0.767 0.618 0.625 0.827 0.857 0.684 CH 6.00E+06 998263 6.00E+06 6.00E+06 6.00E+06 7.00E+06 7.00E+06 BH 1427.3 1122.3 1627.4 1723.3 1982.6 2876.9 756.98 BR -3.00E+07 -2.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07 DL 7.00E+09 6.00E+09 5.00E+09 5.00E+09 7.00E+09 1.00E+10 9.00E+09 Ảnh 55 PBM 35393 49482 31811 32416 35437 32644 27334 DB 0.672 0.641 0.718 0.692 0.687 0.721 0.72 IFV 19.998 Inf 237.19 121.45 53.68 67.78 70.94 SSWC 0.583 0.618 0.604 0.612 0.782 0.893 0.743 CH 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 BH 1562.6 893.37 1638.2 1626.4 1644.6 2012.8 748.94 BR -3.00E+07 -2.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07 -2.00E+07 DL 7.00E+09 6.00E+09 7.00E+09 7.00E+09 7.00E+09 8.00E+09 8.00E+09 Ảnh 56 PBM 105923 96292 97067 92834 98113 93257 87435 DB 0.634 0.605 0.681 0.656 0.631 0.712 0.689 IFV 26.43 Inf 859.76 176.38 69.736 71.893 78.985 SSWC 0.636 0.766 0.633 0.643 0.867 0.985 0.823 CH 3.00E+06 1.00E+07 3.00E+07 3.00E+07 3.00E+06 3.00E+06 2.00E+06 BH 1381.9 836.42 1364.3 1462.3 1369.1 2037.7 783.93 BR -4.00E+06 -2.00E+06 -4.00E+06 -4.00E+06 -5.00E+06 -4.00E+06 -3.00E+06 DL 9.00E+08 3.00E+08 9.00E+08 9.00E+08 9.00E+08 1.00E+10 1.00E+10 . Ảnh 65 PBM 35393 49482 31811 33418 35357 32464 23734 DB 0.685 0.677 0.731 0.723 0.827 0.932 0.847 IFV 19.77 Inf 302.12 323.27 47.44 51.67 68.38 SSWC 0.637 0.613 0.627 0.632 0.788 0.963 0.764 CH 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 BH 1562.6 893.37 1638.2 1626.4 1644.6 2012.8 748.94 BR -3.00E+07 -2.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07 DL 7.00E+09 6.00E+09 5.00E+09 5.00E+09 7.00E+09 1.00E+10 9.00E+09 Ảnh 66 131 PBM 39714 50655 36489 41283 50984 49673 32744 DB 0.66 0.653 0.692 0.673 0.984 0.787 0.723 IFV 20.74 Inf 259.63 121.28 30.67 32.84 34.39 SSWC 0.597 0.568 0.583 0.628 0.615 0.725 0.674 CH 7.00E+06 1.00E+06 6.00E+06 6.00E+06 7.00E+06 9.00E+06 8.00E+06 BH 1627.6 982.27 1567.6 1635.3 1782.7 2350 946.94 BR -3.00E+07 -1.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07 -2.00E+07 DL 7.00E+09 1.00E+09 6.00E+09 6.00E+09 8.00E+09 1.00E+10 7.00E+09

Các file đính kèm theo tài liệu này:

luan_an_nghien_cuu_mot_so_phuong_phap_phan_cum_ban_giam_sat.pdf
Thong tin tom tat TV + TA_ Tran Manh Tuan.pdf
tom tat luan an (4.7.2016)_ Tran Manh Tuan.pdf
tom tat luan an (4.7.2016)_ENG _Tran Manh Tuan.pdf