Trong chương 2 của luận án, tác giả đã trình bày các thuật toán phân cụm
bán giám sát mờ trong phân đoạn ảnh. Để kiểm nghiệm các thuật toán trên, các kết
quả thực nghiệm sẽ được trình bày trong chương này. Cụ thể như sau: dữ liệu cho
thực nghiệm là các ảnh nha khoa thu thập trong giai đoạn 2014-2015 tại bệnh viện
trường Đại học Y Hà Nội được cài đặt trên các thuật toán phân cụm bán giám sát
mờ lai ghép (eSFCM-Otsu), thuật toán phân cụm bán giám sát mờ dựa trên đặc
trưng không gian (SSFC-SC), thuật toán phân cụm bán giám sát mờ kết hợp với
phương pháp thỏa dụng mờ (SSFC-FS), thuật toán phân cụm bán giám sát mờ có
lựa chọn thông tin bổ trợ (SSFC-FSAI) và các kết quả được thể hiện dưới dạng số
và bảng. Các kết quả này đã chứng tỏ những đề xuất và cải tiến được trình bày
trong luận án có hiệu năng và độ chính xác cao hơn các thuật toán có liên quan
được đề xuất bởi các tác giả khác. Việc đánh giá được thực hiện qua giá trị của các
độ đo phân cụm.
143 trang |
Chia sẻ: tueminh09 | Ngày: 24/01/2022 | Lượt xem: 794 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ƣu khi m = 2.
94
(a)Kết quả so
sánh độ đo
PBM
(b) Kết quả so sánh
độ đo SSWC
(c) Kết quả so
sánh độ đo IFV
(d) Kết quả so
sánh độ đo DB
(e) Kết quả so
sánh độ đo CH
(f) Kết quả so sánh
độ đo BH
(g) Kết quả so
sánh độ đo BR
(h) Kết quả so
sánh độ đo DL
Hình 3.3. Độ chính xác của các phƣơng pháp phân cụm với số cụm thay đổi
Hình 3.3 minh họa sự so sánh độ chính xác của các thuật toán theo số cụm
và các độ đo. Trong các hình 3.3, thể hiện giá trị của các tham số còn lại tƣơng
ứng là 9.0 và m=2. Việc mô tả trực quan bằng hình 3.3 cũng khẳng định cho
việc chọn tham số phù hợp, đồng thời cũng khẳng định lợi thế của thuật toán mới
đề xuất.
Các kết quả nhận đƣợc dựa trên việc thực nghiệm với các trƣờng hợp khác
nhau của bộ tham số (b1, b2, b3) với thuật toán SSFC-FS (mỗi trƣờng hợp gọi là 1
case). Việc thiết lập các case của bộ tham số (b1, b2, b3) nhƣ sau:
Case 1: (b1 > b2 > b3): (b1=0.6, b2=0.3, b3=0.1).
Case 2: (b1 > b3 > b2): (b1=0.6, b2=0.1, b3=0.3).
Case 3: (b2 > b1 > b3): (b1=0.3, b2=0.6, b3=0.1).
Case 4: (b2 > b3 > b1): (b1=0.1, b2=0.6, b3=0.3).
Case 5: (b3 > b1 > b2): (b1=0.3, b2=0.1, b3=0.6).
95
Case 6: (b3 > b2 > b1): (b1=0.1, b2=0.3, b3=0.6).
Bảng 3.8. Kết quả thuật toán SSFC-FS với các bộ tham số (b1, b2, b3)
C=3 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6
PBM 110873.56 98323.63 115721.36 112632.63 124733.36 126733.87
DB 2.372 2.253 1.276 2.352 0.983 0.772
IFV 88.78 96.65 127.64 102.63 123.53 134.76
SSWC 0.778 0.752 0.872 0.877 0.798 0.782
CH 3972352 3839150 4178632 4275322 4472652 4328662
BH 3002.83 3127.52 5572.63 5472.63 3527.56 3722.56
BR -3438321 -3326862 -2835723 -2973223 -2532356 -2472573
DL 1027532367 1132766323 1928236868 1865323323 1527352332 1432633265
C=5 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6
PBM 108362.37 132562.32 176232.63 142736.43 78232.67 198347.74
DB 0.983 1.672 2.732 0.0927 0.837 0.891
IFV 89.73 99.38 123.63 103.76 113.78 120.83
SSWC 0.783 0.812 0.871 0.887 0.825 0.722
CH 3876232 3237663 4373862 4257321 4242627 4226262
BH 4128.67 4087.39 5598.63 5387.72 4323.22 3273.67
BR -4027632 -4026372 -3252342 -3574253 -2982342 -2827636
DL 1027437643 1026327327 1887532323 1777352474 1626527427 1232674433
C=7 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6
PBM 76364.78 67343.28 96237.37 34625.73 93546.22 87232.63
DB 2.354 2.451 0.989 2.870 1.092 0.862
IFV 56.67 59.89 89.76 78.32 67.89 84.78
SSWC 0.678 0.715 0.824 0.917 0.732 0.776
CH 3086463 2986264 4376223 4176232 4565235 3987437
BH 2098.72 2283.27 4723.84 4709.89 3982.74 3872.83
BR -4578322 -3948886 -3327427 -3293834 -2982323 -2883275
DL 987237874 936744424 1029326443 1008722333 982364224 956726323
96
Bảng 3.9. Giá trị trung bình của thuật toán SSFC-FS với các bộ tham số
(Giá trị in đậm chỉ ra giá trị tốt nhất của mỗi độ đo)
Case 1 Case 2 Case 3 Case 4 Case 5 Case 6
PBM 98533.57 99409.74 129397.12 96664.93 98837.42 137438.08
DB 1.903 2.125 1.666 1.772 0.971 0.842
IFV 78.39 85.31 113.68 94.90 101.73 113.46
SSWC 0.746 0.760 0.856 0.894 0.785 0.760
CH 3645016 3354359 4309572 4236292 4426838 4180787
BH 3076.74 3166.06 5298.37 5190.08 3944.51 3623.02
BR -4014758 -3767373 -3138497 -3280437 -2832340 -2727828
DL 1014069295 1031946025 1615031878 1550466043 1378747994 1207344674
Trong bảng 3.8 và bảng 3.9, kết quả chỉ ra thấy thuật toán SSFC-FS phù hợp
với case 3 (b2 > b1 > b3): (b1=0.3, b2=0.6, b3=0.1).
Thực nghiệm cũng chỉ ra, các giới hạn dƣới của IFV chỉ số của các giải
pháp tối ƣu đƣợc nêu trong mục 2.3 là hoàn toàn chính xác thông qua sáu trƣờng
hợp trong kiểm tra bảng 3.8 và bảng 3.9. Các kết quả đƣợc tính toán thực tế nhƣ
sau:
Case 1: IFV= 88.78 > 22max2 log
1
C
SD
C
D
= 4.89.
Case 2: IFV = 96.65> 22max2 log
1
C
SD
C
D
= 5.43.
Case 3: IFV = 110.62 > 22max2 log
1
C
SD
C
D
= 6.15.
Case 4: IFV = 102.63 > 22max2 log
1
C
SD
C
D
= 5.72.
Case 5: IFV = 123.53 > 22max2 log
1
C
SD
C
D
= 6.88.
Case 6: IFV = 134.76> 22max2 log
1
C
SD
C
D
= 7.56.
97
Trong bảng 3.10, chỉ ra kết quả so sánh tính toán trên cơ sở lý thuyết và thực
nghiệm về giá trị trung bình của độ đo IFV thực hiện thuật toán SSFC-SC. Kết quả
này thể hiện việc tính toán lý thuyết và thực nghiệm gần xấp xỉ nhau.
Để so sánh thuật toán đƣợc đề xuất SSFC-SC với các thuật toán có liên
quan, các kết quả đƣợc trình bày ở trên đƣợc thể hiện dƣới dạng đồ thị nhƣ Hình
3.3.
Bảng 3.10. Giá trị trung bình IFV lý thuyết và IFV thực nghiệm
C=3 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6
IFV(LT) 87.89 96.72 109.71 103.69 123.04 133.83
IFV(TN) 88.78 96.65 110.62 102.63 123.53 134.76
C=5 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6
IFV(LT) 88.60 98.35 123.02 102.89 111.92 119.89
IFV(TN) 89.73 99.38 123.63 103.76 113.78 120.83
C=7 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6
IFV(LT) 55.36 58.82 89.02 76.78 66.67 84.03
IFV(TN) 56.67 59.89 89.76 78.32 67.89 84.78
98
3.4. Ứng dụng phân đoạn ảnh trong hỗ trợ chẩn đoán bệnh nha khoa
Chẩn đoán bệnh luôn đóng một vai trò quan trọng trong nha khoa. Trong
chẩn đoán các bệnh nha khoa, thì ảnh X-quang chính là một tƣ liệu quan trọng, nó
giúp nha sĩ dựa vào đó có thể kiểm tra, phân tích, và tìm ra những bệnh mà nếu chỉ
nhìn bằng mắt thƣờng sẽ khó xác định. Thực tế, kinh nghiệm và trình độ của các
bác sĩ là khác nhau cũng có thể dẫn đến các kết quả khác nhau và chƣa hoàn toàn
đảm bảo chính xác.
Khi không có các hệ hỗ trợ chẩn đoán thì các bác sĩ phải xem xét toàn bộ
ảnh và các thông tin từng phần rồi tìm kiếm xem vùng nào có khả năng mắc bệnh.
Khi có các hệ hỗ trợ chẩn đoán thì các hệ hỗ trợ đã đƣa ra trợ giúp việc tìm kiếm
xem vùng nào có khả năng mắc bệnh và bệnh nào có thể mắc sau đó bác sỹ chỉ cần
tập trung vào vùng đó và kiểm tra lại xem chẩn đoán đó có đúng hay không để đƣa
ra quyết định cuối cùng.
Trong thực tế việc chẩn đoán chính xác bệnh thì nha sĩ cần các thông tin thu
thập một loạt các thông tin khác nhau từ quá trình thăm khám, qua ảnh X-quang và
từ các xét nghiệm. Trong ứng dụng này luận án chỉ dừng lại việc hộ trợ chẩn đoán
nha khoa sử dụng khai thác các thông tin ảnh X-quanh nha khoa.
Việc ứng dụng chẩn đoán bệnh nha khoa có thể sử dụng suy diễn mờ với tập
cơ sở dữ liệu ảnh. Tuy nhiên phƣơng pháp này vẫn còn một số nhƣợc điểm nhƣ:
một ảnh có thể mắc nhiều bệnh khác nhau (lai ghép giữa các bệnh mà trong cơ sở
dữ liệu mẫu không có) khi đó chẩn đoán đƣợc một bệnh hoặc không phát hiện hết
các bệnh, kết quả suy diễn đạt hiệu suất chƣa cao, chƣa đi sâu vào từng khu vực.
Khi đó trong phần này có đề xuất một môn hình sử dụng ảnh phân đoạn để hỗ trợ
chẩn đoán bệnh nha khoa.
99
3.4.1. Mô hình hóa bài toán
Trong hệ thống chẩn đoán nha khoa (DDS: Dental Diagnosis System) thể
hiện trong hình 3.4, khi đó cơ sở dữ liệu ảnh nha khoa mẫu đƣợc xây dựng là tập
huấn luyện tạo dựng thành kho dữ liệu để sử dụng cho việc chẩn đoán bệnh về sau.
Một ảnh đầu vào từ tập dữ liệu kiểm tra đƣợc đƣa vào hệ thống DDS và sau đó
đƣợc phân tích bằng phƣơng pháp trích chọn đặc trƣng nha khoa để có đƣợc biểu
diễn đặc trƣng (mục 2.2). Sau đó, sử dụng thuật toán SSFC-FS nhằm phân loại các
ảnh đầu vào dựa trên các đặc trƣng không gian của ảnh nha khoa để phân thành
các phân đoạn, từ đó đƣa ra các vùng có thể có bệnh. Từ những phân đoạn này,
chúng tôi chỉ giữ lại những phân đoạn có khả năng mắc bệnh để tiến hành chẩn
đoán. Đối với một phân đoạn ảnh xác định cho trƣớc sử dụng các ảnh trong cơ sở
dữ liệu ảnh mẫu để chuẩn đoán xem vùng này có bị bệnh không, nếu bị bệnh thì
bệnh đó là bệnh gì. Khi đó phân đoạn là một đỉnh của đồ thị và mỗi ảnh trong cơ
sở dữ liệu mẫu cùng là 1 đỉnh của đồ thị dựa mối quan hệ đặc trƣng giữa các ảnh
hoặc vùng xây dựng nên các cạnh của đồ thị (trong trƣờng hợp tất cả đều có quan
hệ với các đặc trƣng khác nhau sẽ tạo lên một đồ thị đầy đủ).
100
Hình 3.4. Hệ thống chẩn đoán bệnh nha khoa (DDS)
Phƣơng pháp lƣợng tử hóa véc tơ là một thủ tục không bắt buộc có thể đƣợc
sử dụng trong các trƣờng hợp mà đồ thị là lớn (có nhiều đỉnh). Sau đó, một cải tiến
của phƣơng pháp APC là APC+ tích hợp một hàm lực mới giữa một đỉnh đồ thị,
Bắt đầu
Ảnh X- quang nha
khoa, các tham số
Cơ sở dữ
liệu ảnh
mẫu
Trích chọn đặc trƣng
nha khoa
Lƣợng tử hóa
Kết thúc
Phân cụm sử dụng APC+
Tổng hợp bệnh của ảnh
xác định từ các phân đoạn
Bảng tổng hợp bệnh
của các phân đoạn
Phân đoạn ảnh sử dụng phƣơng pháp
SSFC-FS tạo ra C* phân
đoạn
Tạo C1
(C1<C*) phân đoạn
Phân đoạn thứ i Trích chọn đặc trƣng
của phân đoạn thứ i
Biểu diễn bằng đồ thị
Xác định bệnh của phân
đoạn thứ i
i=i+1 i > C1
i=1
Chẩn đoán bệnh
Sai
Đúng
101
thuật toán này nhằm mục đích xem phân đoạn đang xét gần với ảnh mẫu nào trong
cơ sở dữ liệu mẫu. Quá trình này đƣợc thực hiện lặp đi lặp lại cho các phân đoạn
khác, kết quả cuối cùng là một tập các bệnh tƣơng tự cho tất cả các phân đoạn
đƣợc biểu diễn trong một bảng quyết định bệnh. Một thủ tục ra quyết định mới xác
định bệnh chính thức từ bảng đƣợc đề xuất trong một vài bƣớc cuối cùng của hệ
thống DDS. Kết quả cuối cùng của hệ thống này là bệnh có khả năng xảy ra nhất
đối với một ảnh nha khoa ban đầu.
Thuật toán của phƣơng pháp DDS đƣợc trình bày trong bảng 3.11 dƣới đây:
Bảng 3.11. Thuật toán của phƣơng pháp DDS
Input Ảnh X-quang nha khoa và các tham số
Output Thông tin chẩn đoán bệnh
DDS:
1 Trích chọn đặc trƣng từ ảnh đầu vào
2 Phân đoạn ảnh nha khoa dùng SSFC-FS (thành C* phân đoạn)
3 Chọn C1 phân đoạn trong C
* phân đoạn
4 i=0
5 Repeat
6 i=i+1
7 Trích chọn đặc trƣng của phân đoạn thứ i
8 Mô hình hóa bằng đồ thị
9 Lƣợng tử hóa véc tơ
10 Phân cụm dựa trên đồ thị dùng APC+
11 Xác định các bệnh tƣơng ứng với phân đoạn thứ i
12 Until i > C1
13 Lập bảng tổng hợp bệnh các phân đoạn
14 Tổng hợp bệnh của ảnh xác định từ các phân đoạn
15 Xác định bệnh của ảnh.
102
Trong thuật toán của phƣơng pháp DDS thì các bƣớc: trích chọn đặc trƣng
từ ảnh đầu vào, phân đoạn ảnh nha khoa dùng SSFC-FS đã đƣợc trình bày ở
chƣơng 2. Còn các bƣớc: chọn phân đoạn có khả năng mắc bệnh, chẩn đoán từng
phân đoạn, lập bảng tổng hợp bệnh các phân đoạn, tổng hợp bệnh của ảnh xác định
từ các phân đoạn, xác định bệnh sẽ đƣợc trình bày ở các mục tiếp theo.
3.4.2. Chọn phân đoạn có khả năng mắc bệnh
Sau khi phân đoạn ảnh xong thu đƣợc các vùng có sự đồng nhất. Với ảnh
đầu vào đó ta thu đƣợc các phân đoạn khác nhau. Nhƣng sau khi phân đoạn thì các
phân đoạn sẽ có khả năng mắc bệnh là khác nhau và sẽ có giá trị khác nhau trong
chẩn đoán. Do vậy ta đƣa ra một trọng số để xác định khả năng mắc bệnh của các
vùng. Ví dụ: một vùng là nền của khoảng không khi chụp phim X-quang, là vùng
không có khả năng mắc bệnh. Nhƣ vậy, việc lựa chọn các vùng để chẩn đoán là hết
sức quan trọng. Do vậy trong mục này sẽ tập trung xem xét các vùng có khả năng
mắc bệnh.
Trong ảnh X-quang nha khoa thƣờng có ba vùng chính: vùng một là răng;
thứ hai tƣơng ứng với xƣơng, tủy, xi măng và cơ cấu vòm; và cuối cùng là vùng
nền của ảnh với các cấp độ màu xám tối thiểu. Bệnh răng miệng thƣờng xảy ra ở
hai vùng đầu tiên. Khi bệnh về răng xuất hiện thì xuất hiện các số điểm ảnh bất
thƣờng so với các điểm khác trong vùng của ảnh X-quang. Nhƣ vậy, cƣờng độ
giữa các điểm ảnh này là không tƣơng đồng [15]. Từ đặc điểm này, chúng ta có thể
xác định các khu vực có thể mắc bệnh để chẩn đoán bệnh về nha khoa dựa trên sự
tƣơng đồng trong vùng của ảnh. Các bƣớc thực hiện:
Bước 1: Xác định các điểm ảnh trong phân đoạn sau khi phân đoạn ảnh.
Bước 2: Tính trọng số độ tƣơng đồng giữa các điểm ảnh trong một vùng
theo công thức sau:
*
,1
,1,max Ckuaveragew ij
Cjki
k
(3.22)
103
Trong đó u(k)ij là sự giống nhau giữa các điểm i với điểm ảnh j trong vùng
ảnh k.
Bước 3: Chuẩn hóa trọng số tƣơng đồng:
*
,1
,1,
max
1
Ck
w
w
W
k
Ck
k
k
(3.23)
Bước 4: Sắp xếp các trọng số tƣơng đồng đã chuẩn hóa.
Bước 5: Chọn các phân cùng có trọng số tƣơng đồng thấp hơn λ.
3.4.3. Chẩn đoán từng phân đoạn
3.4.3.1. Biểu diễn đồ thị
Khi chọn đƣợc C1 vùng có khả năng mắc bệnh ở mục trên để thực hiện chẩn
đoán. Sau đó mỗi vùng chẩn đoán đƣợc kết hợp với cơ sở dữ liệu ảnh nha khoa
mẫu để tạo thành một biểu đồ. Khi đó đồ thị đƣợc sử dụng với mục đích biểu diễn
mối quan hệ giữa mô hình bệnh tật và vùng chẩn đoán một cách trực quan. Mỗi
nút đồ thị của biểu diễn vùng chẩn đoán hoặc ảnh mẫu trong cơ sở dữ liệu mẫu
bệnh. Các cung thể hiện mối quan hệ giữa vùng chẩn đoán với các ảnh mẫu trong
cơ sở dữ liệu mẫu bệnh hoặc các mẫu bệnh với nhau dựa trên các đặc trƣng ảnh
nha khoa. (có thể xác định trọng số mỗi quan hệ giữa các cung (u, v) dựa trên
khoảng cách Euclide ( vu ) giữa nút u với nút v. Khi đó hình 3.5 minh họa một
vùng chẩn đoán bệnh với bốn mẫu ảnh.
Hình 3.5. Biểu đồ biểu diễn vùng phân đoạn và 4 mẫu bệnh.
104
3.4.3.2. Lượng tử hóa đồ thị
Mục đích của mục này là giảm bớt số nút trong đồ thị để đẩy nhanh thời
gian xử lý. Lƣợng tử hóa đồ thị là một phƣơng pháp hiệu quả thƣờng đƣợc dùng để
đƣa ra các nút đại diện cho một nhóm nút gần giống nhau những vẫn đảm bảo
không mất mát thông tin [25]. Các bƣớc thực hiện lƣợng tử hóa đồ thị nhƣ sau:
Bước 1: Chọn k nút ngẫu nhiên từ đồ thị ban đầu (k điểm từ dữ liệu ban
đầu).
Bước 2: Tính toán khoảng cách Euclide bình phƣơng giữa tất cả k véc tơ
đƣợc chọn với phân đoạn chẩn đoán tƣơng ứng.
Bước 3: Khởi tạo vectơ X
j
vào phân đoạn thứ i với các giới hạn của bình
phƣơng khoảng cách Euclide từ X
j
để véc tơ thứ i là ngắn nhất
Bước 4: Tính toán trung tâm của phân đoạn.
Bước 5: Xác định sai số MSE của k phân đoạn thu đƣợc.
3.4.3.3. Phân cụm dựa trên đồ thị
Trong phần này, một cải tiến của thuật toán phân cụm dựa trên đồ thị APC
(gọi là APC+) sẽ đƣợc trình bày. Thuật toán APC+ tích hợp một hàm lực mới giữa
1 điểm dữ liệu và một mẫu nhằm tìm ra bệnh tƣơng đồng nhất đối với phân đoạn
ảnh đang xét.
Thuật toán phân cụm dựa trên đồ thị (Affinity propagation clustering –
APC) [59] đƣợc sử dụng để trao đổi thông điệp giữa chính các điểm dữ liệu với
nhau xác định mẫu nào trong cơ sở dữ liệu thuộc về cùng nhóm bệnh với phân
đoạn ảnh đang xét. Trong thuật toán APC ban đầu, hàm tƣơng tự giữa các nút đƣợc
xác định bởi công thức sau:
jixx ji ,sN,1,...,j N; 1,...,i },{s S
2
ijij . (3.24)
Khi i = j = k, thì các Nk ,...,1,skk đƣợc gọi là “preferences”. Bên cạnh đó, có 2 loại
thông điệp đƣợc truyền đi giữa các điểm dữ liệu là “responsibility” và
105
“availability” tƣơng ứng đƣợc ký hiệu là ),( kir và ),( kia . Thông điệp ),( kir
đƣợc gửi từ một điểm dữ liệu i tới điểm mẫu k, thông điệp ),( kia đƣợc gửi theo
hƣớng ngƣợc lại. Các thông điệp này đƣợc định nghĩa bởi:
)',()',(max),(:),(
'
kiskiakiskir
kk
(3.25)
),'(,0max),(,0min:),(
},{'
kirkkrkia
kii
(3.26)
Trong thuật toán cải tiến APC+, chúng tôi tích hợp một hàm lực giữa 1 điểm dữ
liệu và một mẫu vào vế phải của công thức (3.25) nhằm tăng tốc độ truyền thông
điệp giữa các điểm. Cụ thể, hàm lực này đƣợc xác định bởi:
ik
ik
ik
ik
ik
ik
ik
ddif
xd
dd
ddif
xd
dd
F
2
2 , (3.27)
Trong đó
ikd là khoảng cách Euclid giữa một điểm i và một mẫu k; d là giá trị
trung bình của khoảng cách từ điểm i tới tất cả các mẫu. Khi đó r(i, k) trong (3.25)
đƣợc thay thế bởi:
ik
kk
Fkiakiskiskiakiskir *),(*),()',()',(max),(:),(
'
. (3.28)
Thuật ngữ “self-availability” đƣợc định nghĩa nhƣ một trƣờng hợp đặc biệt:
),'(,0max:),(
,'
kirkka
ki
. (3.29)
Một hằng số đƣợc gọi là hệ số giảm xóc đƣợc sử dụng để giảm sự dao động khi
truyền thông điệp:
),().1(),(.:),( 11 kirkirkir ttt
(3.30)
),().1(),(.:),( 11 kiakiakia ttt (3.31)
Bảng 3.12 trình bày mã giả của thuật toán APC+.
106
Bảng 3.12. Thuật toán APC+
Input Một tập hợp các độ tƣơng tự theo cặp Nkikis ,...,2,1,),(
Output Một bộ gán nhãn: ) cˆ ., . . ,cˆ( cˆ N1
APC+
1 Khởi tạo, i, k : a(i, k)=0, t=0.
2 Repeat
3 Cập nhật “responsibility” theo công thức (3.30) với r(i, k) đƣợc
xác định nhƣ trong (3.28)
4 Cập nhật “ availability” bằng công thức (3.31)
5 t=t+1
6 Until )1()( ,, tt kiakia
3.4.4 . Xây dựng bảng tổng hợp của các đoạn
Sau khi áp dụng thuật toán APC+, chúng tôi tìm ra đƣợc các mẫu bệnh đồng
nhất với vùng thứ i. Từ nhãn của các mẫu bệnh mẫu thuộc cùng nhóm với vùng
thứ i, tính toán khoảng cách trung bình từ vùng chẩn đoán đến các mẫu bệnh cùng
nhãn trong cùng nhóm với phân đoạn, đƣợc xác định theo công thức (3.32) nhƣ
sau:
mjCidd ikij ,1,,1,average 1'
jgroup k'
. (3.32)
Sau đó, vectơ độ thuộc của vùng chẩn đoán thứ i vào các mẫu bệnh chuẩn
đƣợc xác định bởi công thức (3.33):
mjCiddu ijjijij ,1,,1,max/ 1 (3.33)
Tổng hợp bệnh của vùng: Sau khi tính đƣợc véc tơ độ thuộc của từng vùng
chẩn đoán, tổng hợp tất cả các vùng có thể mắc bệnh đƣợc xác định ở mục 3.4.2 ta
xây dựng đƣợc bảng tổng hợp bệnh cho tất cả các phân đoạn. Bảng tổng hợp bệnh
của các phân đoạn đƣợc biểu diễn trong bảng 3.13.
107
Bảng 3.13. Bảng tổng hợp bệnh của các vùng
Mẫu bệnh 1 Mẫu bệnh 2 .. Mẫu bệnh m
Phân đoạn 1 u11 u12 u1m
Phân đoạn 2
..
Phân đoạn n un1 u2n unm
Chú ý rằng giá trị độ thuộc của mỗi phân đoạn tới mẫu bệnh đƣợc xác định theo
phƣơng trình (3.33). Khi đó, sử dụng các phƣơng trình này ta có đƣợc kết quả tổng
hợp bệnh cho ảnh đầu vào trong bảng 3.14:
Bảng 3.14. Các kết quả tổng hợp bệnh của ảnh
Mẫu bệnh 1 Mẫu bệnh 2 .. Mẫu bệnh m
Ảnh y1 y2 ym
Trong đó:
mj
uW
uW
y
m
j
n
i
iji
n
i
iji
j ,1,
*
*
1 1
1
. (3.34)
myyyy ,....,,max 21max (3.35)
Cuối cùng, ta xác định đƣợc bệnh nha khoa trong ảnh theo công thức (3.34)
bằng toán tử tìm cực đại.
3.4.5. Phân tích và đánh giá mô hình DDS
- DDS tạo ra một cách tiếp cận kết hợp giữa các phƣơng pháp phân đoạn ảnh và
ra quyết định cho việc chẩn đoán bệnh nha khoa.
- DDS còn cải tiến phƣơng pháp phân cụm dựa trên đồ thị mới đƣợc gọi là APC+
cho giai đoạn phân lớp.
- DDS cũng có hiệu năng cao hơn với thuật toán phân cụm lan truyền sự tƣơng
đồng (APC) bằng cách điều chỉnh một hàm lực giữa một điểm đầu vào và một
108
mẫu trong APC+; sử dụng các thao tác phân đoạn và một phƣơng pháp ra quyết
định mới.
- DDS đƣa ra một quan điểm tốt về việc làm thế nào để kết hợp thuật toán phân
cụm (trong phân đoạn) với hệ thống dựa trên tri thức (kết hợp thuật toán APC+
và thủ tục ra quyết định trong việc phân lớp và ra quyết định). Điều này có ý
nghĩa lớn đối với bài toán chẩn đoán nha khoa nói riêng và các lĩnh vực y tế -
tin học liên ngành nói chung.
3.4.6. Kết quả thực nghiệm
Dựa trên bộ dữ liệu về ảnh X-quang nha khoa, để đánh giá mô hình đề xuất
với các mô hình dựa trên thuật toán đã có từ trƣớc (APC, FKNN [48]). Các độ đo
đƣợc tính toán trong mỗi trƣờng hợp để có sự so sánh về hiệu năng của các thuật
toán. Các kết quả lần lƣợt sẽ đƣợc trình bày trong các phần dƣới đây.
3.4.6.1. Độ đo và tiêu chí đánh giá kết quả
Các độ đo phân lớp dữ liệu cũng đƣợc sử dụng nhằm mục đích đánh giá hiệu
năng của thuật toán đƣợc đề xuất. Các độ đo MSE (Mean Squared Error), MAE
(Mean Absolute Error) and Accuracy đƣợc sử dụng trong thực nghiệm của đề tài
luận án.
Độ đo MSE:
Nếu Yˆ là véc tơ với n thành phần dự đoán và Y là véc tơ các giá trị đƣợc quan
sát tƣơng ứng với các đầu vào của hàm tạo ra các dự đoán Yˆ thì độ đo MSE đƣợc
ƣớc lƣợng bởi công thức sau [29]:
n
i
i
n
i
ii e
n
YY
n
MSE
11
2 1ˆ1 . (3.36)
Điều này có nghĩa là độ đo MSE là trung bình của bình phƣơng các sai số. Chỉ số
này đƣợc tính toán một cách dễ dàng cho một mẫu đặc thù. Giá trị tốt nhất của độ
đo MSE là giá trị nhỏ nhất của nó.
109
Độ đo MSA:
Bên cạnh độ đo MSE, độ đo MAE cũng đƣợc sử dụng để tính toán sai số dự
đoán nhƣng thƣờng dùng trong phân tích chuỗi thời gian. Trong thống kê, MAE là
một đại lƣợng đƣợc dùng để đánh giá xem các dự đoán gần với các đầu ra thực sự
nhƣ thế nào. Công thức xác định độ đo MAE đƣợc cho bởi [22]:
n
i
i
n
i
ii e
n
yf
n
MAE
11
11
, (3.37)
Trong đó
if : là thành phần dự đoán, iy là giá trị thực. Giá trị của độ đo MSA càng
nhỏ càng tốt.
Độ đo Accuracy:
Độ đo Accuracy là độ đo đơn giản nhất của quyết định chẩn đoán. Nó đƣợc tính
toán bởi công thức sau [22]:
dcba
da
Accuracy
, (3.38)
Với:
- a là kết quả dự đoán bệnh là đúng – tích cực (TP)
- b là kết quả dự đoán bệnh là sai – tích cực (FP)
- c là kết quả dự đoán bệnh là sai – tiêu cực (FN)
- d là kết quả dự đoán bệnh là đúng – tiêu cực (TN)
Giá trị của độ đo Accuracy càng lớn càng tốt.
3.4.6.2. Kết quả chẩn đoán từ dữ liệu ảnh
Sau khi thực hiện chẩn đoán bệnh trên từng phân đoạn của các ảnh đầu vào
trong bộ dữ liệu kiểm tra, kết quả tổng hợp đƣợc thể hiện trong bảng 3.15 dƣới
đây.
110
Bảng 3.15. Dự đoán bệnh cuối cùng cho dữ liệu kiểm tra
Ảnh
Mẫu bệnh Kết luận
bệnh 1 2 3 4 5
4 0.46 0.00 0.25 0.29 0.00 1
8 0.32 0.04 0.23 0.24 0.17 1
11 0.28 0.34 0.10 0.28 0.00 2
22 0.22 0.29 0.11 0.25 0.13 2
23 0.21 0.31 0.00 0.24 0.24 2
24 0.20 0.23 0.33 0.25 0.00 3
29 0.00 0.26 0.33 0.24 0.16 3
32 0.15 0.09 0.27 0.26 0.22 3
39 0.00 0.22 0.27 0.31 0.21 4
40 0.21 0.06 0.26 0.24 0.23 3
41 0.17 0.16 0.20 0.26 0.22 4
44 0.22 0.21 0.00 0.26 0.31 5
45 0.09 0.28 0.00 0.30 0.32 5
47 0.23 0.05 0.17 0.25 0.31 5
Bảng 3.16. Đánh giá hiệu năng của tất cả các phƣơng pháp
APC FIS FKNN DDS
MSE 0.821 0.2493 0.2373 0.0742
MAE 0.701 0.1321 0.2373 0.0742
Accuracy
(%)
89.10 90.30 80.55 92.86
Với số liệu trong bảng 3.16, rõ ràng là phƣơng pháp DDS đƣợc đề xuất có
hiệu năng tốt hơn các thuật toán khác nhƣ APC, FIS, FKNN. Trên đồ thị hình 3.6
111
với từng độ đo: với độ đo MSE (thể hiện bởi đƣờng màu đỏ) và độ đo MAE (thể
hiện đƣờng màu xanh) thì điểm của phƣơng pháp DDS là thấp nhất, khi đó thể
hiện phƣơng pháp DDS là tốt nhất sau đó đến lần lƣợt phƣơng pháp FIS, FKNN,
APC. Còn độ đo Accuracy (thể hiện bởi đƣờng màu vàng) thì thì điểm của phƣơng
pháp DDS là cao nhất, khi đó thể hiện phƣơng pháp DDS là tốt nhất sau đó đến lần
lƣợt phƣơng pháp FIS, FKNN, APC. Bằng kết quả thực nghiệm dựa trên 3 độ đo
MSE, MAE, Accuracy thì phƣơng pháp DDS đều cho kết quả trong hộ trợ chẩn
đoán bệnh nha khoa tốt hơn với các phƣơng pháp APC, FIS, FKNN. Kết quả này
chứng tỏ độ chính xác của phƣơng pháp đề xuất cao hơn, do vậy DDS đƣa ra một
quan điểm tốt trong việc kết hợp ảnh phân đoạn đoạn với hệ thống dựa trên tri thức
(kết hợp thuật toán APC+ và thủ tục ra quyết định trong việc phân lớp và ra quyết
định) để đƣa ra kết quả hỗ trợ chẩn đoán bệnh nha khoa. Điều này có ý nghĩa đối
với bài toán hỗ trợ chẩn đoán bệnh nha khoa nói riêng và các lĩnh vực y tế - tin học
liên ngành nói chung.
Hình 3.6. Kết quả thực nghiệm trên đồ thị
112
3.5. Kết luận
Trong chƣơng 3 đã trình bày các kết quả thực nghiệm của các thuật toán
phân cụm bán giám mờ mới đề xuất với các phƣơng pháp phân cụm bán giám sát
mờ, phƣơng pháp phân cụm mờ, phƣơng pháp tách ngƣỡng đã có. Kết quả đã đƣợc
đánh giá thông qua các độ đo, đồng thời thông qua các kết quả thực nghiệm này
kiểm nghiệm lại một lần nữa tính đúng đắn của các đề xuất khi xây dựng bằng các
mô hình lý thuyết. Trong mục 3.3, luận án đã đánh giá so sánh các thuật toán phân
cụm bán giám sát mờ mới đề xuất với thuật toán phân cụm mờ, đồng thời cũng
đánh cách xác định thông tin sao cho phù hợp với từng ảnh đầu vào.
Trong mục 3.4 đã trình bày về ứng dụng của ảnh phân đoạn trong thiết kế hệ
hỗ trợ chẩn đoán bệnh. Đã đƣa ra đề xuất mô hình hỗ trợ chẩn đoán bệnh từ ảnh
phân đoạn. Trong mục 3.4.6 luận án đã trình bày các tiêu chí đánh giá và đánh giá
kết quả chẩn đoán bệnh nha khoa thông qua các độ đo Accuracy, MSE, MAE.
113
KẾT LUẬN
Từ các đề xuất đƣợc trình bày trong chƣơng 2 và chƣơng 3 của luận án,
công trình nghiên cứu này đã đề xuất các phƣơng pháp phân cụm bán giám sát mờ
trong phân đoạn ảnh X-quang nha khoa và ứng dụng trong chẩn đoán bệnh nha
khoa. Trên cơ sở nghiên cứu đó, luận án đã đạt đƣợc một số kết quả đóng góp
nghiên cứu sau đây:
- Đề xuất phƣơng pháp phân đoạn ảnh nha khoa dựa trên phân cụm bán giám
sát mờ lai ghép. Kết hợp các phƣơng pháp FCM, OTSU và eSFCM để xây dựng
mô hình lai ghép và áp dụng cho bài toán phân đoạn ảnh X-quang nha khoa. Với
sự kết hợp này, thuật toán mới đề xuất có kết quả tốt hơn so với các thuật toán
riêng lẻ đƣợc đánh giá bằng các độ đo dựa trên các kết quả thực nghiệm. Đề xuất
về thuật toán mới này đã đƣợc công bố trong [CT3];
- Đề xuất thuật toán phân cụm bán giám sát mờ có sử dụng đặc trƣng không
gian ảnh nha khoa trong bài toán phân đoạn ảnh nha khoa (SSFC-SC). Bằng cách
kết hợp thông tin không gian với các đặc trƣng của ảnh nha khoa và thông tin bổ
trợ của phân cụm bán giám sát mờ, bài toán phân đoạn ảnh nha khoa đƣợc mô tả
dƣới dạng một bài toán tối ƣu đa mục tiêu. Phƣơng pháp nhân tử Lagrange đƣợc
sử dụng để xác định nghiệm tối ƣu của bài toán (là ma trận độ thuộc và các tâm
cụm). Các kết quả thực nghiệm chứng tỏ rằng hiệu năng và độ chính xác của thuật
toán đƣợc đề xuất cao hơn một số thuật toán có liên quan theo các chỉ số đánh giá;
- Vận dụng phƣơng pháp thỏa dụng mờ để giải bài toán tối ƣu đa mục tiêu
của phân cụm bán giám sát mờ. Từ đó đề xuất thuật toán SSFC-FS. Các tính chất
nghiệm thu đƣợc bằng phƣơng pháp thỏa dụng mờ cũng đƣợc chỉ rõ và khẳng định
bằng lý thuyết nghiệm thu đƣợc giải theo phƣơng pháp thỏa dụng mờ tốt hơn
nghiệm thu đƣợc giải theo phƣơng pháp Lagrange dựa trên chỉ số đánh giá IFV.
Nghiệm thu đƣợc theo phƣơng pháp thỏa dụng mờ hội tụ về nghiệm tối ƣu toàn
cục thông qua đánh giá sự chênh lệch giữa hai lần lặp liên tiếp. Các tích chất
nghiệm thu đƣợc bằng phƣơng pháp thỏa dụng mờ đƣợc chứng minh và thể hiện
thông qua các định lý 2.1, 2.2, 2.3, 2.4 và các tính chất 2.1, 2.2, 2.3 ở chƣơng 2.
Kết quả nghiên cứu đã đƣợc công bố tại [CT5];
114
- Đƣa ra phƣơng pháp xác định hàm thông tin bổ trợ phù hợp (SSFC-FSAI)
với ảnh đầu vào khi áp dụng phƣơng pháp phân cụm bán giám sát mờ dựa trên đặc
trƣng không gian (SSFC-FS). Nghĩa là, với mỗi ảnh đầu vào, hàm thông tin bổ trợ
đƣợc lựa chọn một cách phù hợp để hiệu năng và độ chính xác khi thực hiện thuật
toán là cao nhất. Kết quả nghiên cứu đã đƣợc công bố tại [CT2];
- Đã tiến hành cài đặt thử nghiệm và đánh giá so sánh các thuật toán cải tiến
với một số thuật toán mà các nghiên cứu trƣớc đã đƣa ra dựa trên bộ dữ liệu thực
tế. Kết quả thử nghiệm khẳng định rằng với 8 độ đo trong phân cụm thì các thuật
toán đƣợc đề xuất trong luận án có hiệu năng tốt hơn với các thuật toán đƣợc đề
xuất trƣớc. Các kết quả này đƣợc trình bày cụ thể ở trong các mục 3.2 và mục 3.3.
Đồng thời luận án cũng trình bày một ứng dụng của phân đoạn ảnh nha khoa trong
hỗ trợ chẩn đoán bệnh nha khoa, đã đƣợc công bố tại [CT4].
Bên cạnh các kết quả đã đạt đƣợc, các nghiên cứu trong luận án vẫn còn một
số hạn chế nhƣ: i) Các kết quả phân đoạn mới chỉ thực nghiệm trên các ảnh X-
quang nha khoa thông thƣờng trong khi việc thử nghiệm với các loại ảnh nha khoa
3D cho phù hợp với sự phát triển công nghệ mới là cần thiết; ii) Thời gian thực
hiện của các thuật toán đề xuất còn lớn, cần cải tiến để phù hợp với thực tế; iii)
Các kết quả chẩn đoán thu đƣợc mới chỉ hỗ trợ các bác sỹ trong chẩn đoán cận lâm
sàng, cần kết hợp với kết quả chẩn đoán lâm sàng trong quá trình chẩn đoán và xây
dựng thêm các đặc trƣng xuất phát từ các bệnh để việc chẩn đoán đƣợc chính xác
hơn.
Hƣớng phát triển các nghiên cứu trong thời gian tiếp theo: i) Cải tiến các
thuật toán đã có để thời gian xử lý phù hợp hơn; ii) Áp dụng phân cụm bán giám
sát mờ trong phân đoạn ảnh với các ảnh thông thƣờng; iii) Tiếp tục nghiên cứu bài
toán chẩn đoán bệnh nha khoa để cho việc tiếp cận với thực tế hơn; iv) Kết hợp với
các triệu chứng lâm sàng trong quá trình chẩn đoán.
115
NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN
Thông qua quá trình nghiên cứu phân tích về các phƣơng pháp phân cụm bán giám
sát mờ áp dụng cho phân đoạn ảnh nha khoa, trong luận án đã có một số đóng góp
nhƣ sau:
1. Luận án đã nghiên cứu phát triển các thuật toán phân cụm bán giám sát mờ
trong phân đoạn ảnh nha khoa, cụ thể đã có một số đóng góp mới nhƣ sau:
- Đề xuất các phƣơng pháp phân đoạn ảnh nha khoa dựa trên phân cụm bán
giám sát mờ lai ghép. Lai ghép giữa: phân cụm bán giám sát mờ với phân cụm mờ
và phƣơng pháp tách ngƣỡng Otsu;
- Đề xuất phân cụm bán giám sát mờ có sử dụng đặc trƣng không gian ảnh
nha khoa vào bài toán phân đoạn ảnh;
- Vận dụng các phƣơng pháp giải tối ƣu đa mục tiêu để giải bài toán tối ƣu
đa mục tiêu của phân cụm bán giám sát mờ, từ đó đƣa ra các mệnh đề, định lý và
tính chất nghiệm của bài toán;
- Xây dựng kho dữ liệu các hàm xác định thông tin bổ trợ cho phân cụm bán
giám sát mờ, từ đó lựa chọn hàm thông tin bổ trợ phù hợp với từng ảnh đầu vào
cho chất lƣợng cụm đƣợc tốt hơn.
2. Cài đặt thực nghiệm các thuật toán cải tiến dựa trên thu thập và phân tích dữ liệu
ảnh về các mẫu bệnh nha khoa. Ứng dụng phân đoạn ảnh trong hệ hỗ trợ chẩn
đoán nha khoa.
116
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ
[CT1]. Lê Bá Dũng và Trần Mạnh Tuấn (2010), “Một số phƣơng pháp phân cụm
dữ liệu”, tạp chí Khoa học và công nghệ - Đại học Thái Nguyên, tập 69, số 07,
trang 15-20.
[CT2]. Tran Manh Tuan, Le Hoang Son, Le Ba Dung (2015), “Dynamic semi-
supervised fuzzy clustering for dental x-ray image segmentation: an analysis on
the additional function”, Journal of Computer Science and Cybernetics, 31(4),
323-339.
[CT3]. Le Hoang Son, Tran Manh Tuan (2016), “A cooperative semi-supervised
fuzzy clustering framework for dental X-ray image segmentation”, Expert Systems
With Applications, 46, pp. 380 – 393 (SCIE, IF = 2.240, Elsevier).
[CT4]. Tran Manh Tuan, Le Hoang Son (2016), “A novel framework using graph-
based clustering for dental x-ray image search in medical diagnosis”, International
Journal of Engineering and Technology, 8(6), pp.428-433.
[CT5]. Tran Manh Tuan, Tran Thi Ngan, Le Hoang Son (2016), “A Novel Semi-
Supervised Fuzzy Clustering Method based on Interactive Fuzzy Satisficing for
Dental X-Ray Image Segmentation”, Applied Intelligence, in press, DOI:
10.1007/s10489-016-0763-5 (SCI, IF=1.853, Springer).
117
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1]. Bùi Công Cƣờng (2001), Hệ mờ, mạng nơron và ứng dụng, Nhà xuất bản
khoa học và kỹ thuật, Hà nội.
[2]. Hoàng Tử Hùng, Huỳnh Kim Khang, Ngô Thị Quỳnh Lan, Ngô Lê Thu
Thảo, Hoàng Đạo Bảo Trâm (2008), Giải phẫu răng, Nhà xuất bản Y học, Hà
Nội
[3]. Doãn Tam Hòe (2005), Lý thuyết tối ưu và đồ thị, nhà xuất bản giáo dục.
[4]. Nguyễn Hải Thanh (2005), Toán ứng dụng (Giáo trình sau đại học), NXB sƣ
phạm, Hà Nội.
Tiếng Anh
[5]. Agarwal, M., Agrawal, H., Jain, N., & Kumar, M. (2010), “Face recognition
using principle component analysis, eigenface and neural network”, IEEE
International Conference on, In Signal Acquisition and Processing IEEE, 2010
(ICSAP10), 310-314.
[6]. Alok, A. K., Saha, S., & Ekbal, A. (2015), “A new semi-supervised
clustering technique using multi-objective optimization”, Applied Intelligence,
43(3), 633-661.
[7]. Anbarasi, M., Anupriya, E., & Iyengar, N. C. S. N. (2010), “Enhanced
prediction of heart disease with feature subset selection using genetic
algorithm”, International Journal of Engineering Science and Technology, 2(10),
5370-5376.
[8]. Ahonen, T., Hadid, A., & Pietikainen, M.(2006), “Face description with local
binary patterns: Application to face recognition”, IEEE Transactions on Pattern
Analysis and Machine Intelligence, 28(12), 2037-2041.
118
[9]. Babu, N. V., & Patel, P.(2015), “Comparative Evaluation of Extraoral and
Intraoral Periapical Radiographic Technique in Children”, International Journal
of Scientific Study, 2(10), 7-12.
[10]. Bezdek, J. C. (1981), Pattern recognition with fuzzy objective function
algorithms, Kluwer Academic Publishers.
[11]. Bhatla, N., & Jyoti, K. (2012), “An analysis of heart disease prediction
using different data mining techniques”, International Journal of Engineering
Research and Technology, 1(8), 1-4.
[12]. Bouchachia, A., & Pedrycz, W. (2006), “Data clustering with partial
supervision”, Data Mining and Knowledge Discovery, 12(1), 47-78.
[13]. Caponetti, L., Castellano, G., Basile, M. T., & Corsini, V. (2014), “Fuzzy
mathematical morphology for biological image segmentation”, Applied
intelligence, 41(1), 117-127.
[14]. CARIES, D. (2005), “Oral and dental diseases: Causes, prevention and
treatment strategies” Burden of Disease in India, 275-278.
[15]. Chen, J., Zhao, S., & Wang, H. (2011), “Risk analysis of flood disaster
based on fuzzy clustering method”, Energy Procedia, 5, 1915-1919.
[16]. Chuang, K. S., Tzeng, H. L., Chen, S., Wu, J., & Chen, T. J. (2006).
“Fuzzy c-means clustering with spatial information for image segmentation”,
computerized medical imaging and graphics, 30(1), 9-15.
[17]. Dutta, A., Kar, A., & Chatterji, B. N. (2011), “Adaptive Corner Detection
Algorithm and its Extension using Window-based Approach for Gray-scale
Images”, IETE Journal of Research, 57(3), 286-293.
[18]. Ghazali, K. H., Mustafa, M. M., Hussain, A., Bandar, M. E. C., & Kuantan,
G. (2007), “Feature Extraction technique using SIFT keypoints descriptors”, The
International Conference on Electrical and Engineering and Informatics Institut
technology, 17-19.
119
[19]. Gould, S., Gao, T., & Koller, D. (2009), “Region-based segmentation and
object detection”, Advances in neural information processing systems, 655-663.
[20]. Guillaume, S. (2001), “Designing fuzzy inference systems from data: an
interpretability-oriented review”, IEEE Transactions on Fuzzy Systems, 9(3),
426-443.
[21]. Houhou, N., Bresson, X., Szlam, A., Chan, T. F., & Thiran, J. P. (2009),
“Semi-supervised segmentation based on non-local continuous min-cut”, In Scale
Space and Variational Methods in Computer Vision, Springer Berlin
Heidelberg , 112-123.
[22]. Hyndman, R. J., & Koehler, A. B. (2006), “Another look at measures of
forecast accuracy”, International journal of forecasting, 22(4), 679-688.
[23]. Jain, A. K., & Chen, H. (2004), “Matching of dental X-ray images for
human identification”, Pattern recognition, 37(7), 1519-1532.
[24]. Kang, J., & Ji, Z. (2010), “Dental plaque quantification using mean-shift-
based image segmentation”, 2010 IEEE International Symposium on Computer
Communication Control and Automation, 470-473.
[25]. Kekre, H. B., & Sarode, T. K. (2009), “Vector quantized codebook
optimization using K-means”, International Journal on Computer Science and
Engineering (IJCSE), 283-290.
[26]. Kondo, T., Ong, S. H., & Foong, K. W. (2004), “Tooth segmentation of
dental study models using range images”, IEEE Transactions on Medical
Imaging, 23(3), 350-362.
[27]. Lai, Y. H., & Lin, P. L. (2008), “Effective segmentation for dental X-ray
images using texture-based fuzzy inference system”, Advanced Concepts for
Intelligent Vision Systems, Springer Berlin Heidelberg, 936-947.
[28]. Lee, C. C. (1990), “Fuzzy logic in control systems: fuzzy logic controller.
II”, IEEE Transactions on Systems, Man and Cybernetics, 20(2), 419-435.
120
[29]. Lehmann, E. L., & Casella, G. (1998), Theory of point estimation, Springer
Science & Business Media.
[30]. Leung, T., & Malik, J. (1998), “Contour continuity in region based image
segmentation”, In Computer Vision—ECCV ”98, Springer Berlin Heidelberg,
544-559.
[31]. Li, J., Bioucas-Dias, J. M., & Plaza, A. (2010), “Semisupervised
hyperspectral image segmentation using multinomial logistic regression with
active learning”, IEEE Transactions on, Geoscience and Remote Sensing, 48(11),
4085-4098.
[32]. Lim, Y. W., & Lee, S. U. (1990), “On the color image segmentation
algorithm based on the thresholding and the fuzzy c-means techniques”, Pattern
recognition, 23(9), 935-952.
[33]. Lu, J., Yuan, X., & Yahagi, T. (2007), “A method of face recognition based
on fuzzy c-means clustering and associated sub-NNs”, IEEE Transactions
on, Neural Networks, 18(1), 150-160.
[34]. Mai Shouman, Tim Turner, and Rob Stocker (2012), “Applying k-Nearest
Neighbour in Diagnosing Heart Disease Patients”, International Journal of
Information and Education Technology, 2(3), 32-37.
[35]. Mahoor, M. H., & Abdel-Mottaleb, M. (2005), “Classification and
numbering of teeth in dental bitewing images”, Pattern Recognition, 38(4), 577-
586.
[36]. Martin, A., Gayathri, V., Saranya, G., Gayathri, P., & Venkatesan, P.
(2011),“A hybrid model for bankruptcy prediction using genetic algorithm, fuzzy
c-means and MARS”, International Journal on Soft Computing ( IJSC ), 2(1),
12-24.
[37]. Narkhede, H. P. (2013), “Review of image segmentation techniques”, Int.
J. Sci. Mod. Eng, 1(8), 54-61.
121
[38]. Nayak, J., Naik, B., & Behera, H. S. (2015), “Fuzzy C-Means (FCM)
Clustering Algorithm: A Decade Review from 2000 to 2014”, In Computational
Intelligence in Data Mining, 2, 133-149, Springer India.
[39]. Ngo, L. T., Mai, D. S., & Pedrycz, W. (2015), “Semi-supervising Interval
Type-2 Fuzzy C-Means clustering with spatial information for multi-spectral
satellite image classification and change detection”, Computers &
Geosciences, 83, 1-16.
[40]. Nomir, O., & Abdel-Mottaleb, M. (2005), ”A system for human
identification from X-ray dental radiographs”, Pattern Recognition, 38(8), 1295-
1305.
[41]. Oad, K. K., DeZhi, X., & Butt, P. K. (2014), “A Fuzzy Rule Based
Approach to Predict Risk Level of Heart Disease”, Global Journal of Computer
Science and Technology, 14(3), 16-22.
[42]. Oliveira, J., & Proença, H. (2011), “Caries detection in panoramic dental X-
ray images”, Computational Vision and Medical Image Processing, Springer
Netherlands, 175-190.
[43]. Otsu, N. (1979), “A threshold selection method from gray-level
histograms” Automatica , 1(9), 62-66.
[44]. Paiva, A. R., & Tasdizen, T. (2010), “Fast semi-supervised image
segmentation by novelty selection”, 2010 IEEE International, Conference on
In Acoustics Speech and Signal Processing (ICASSP), 1054-1057.
[45]. Rad, A. E, Rahim, M. S. M, & Norouzi, A. (2014), “Level Set and
morphological Operation Techniques in Application of Dental Image
Segmentation”, International Scholarly and Scientific Research & Innovation,
8(4), 177-180.
122
[46]. Rad A. E., Mohd Rahim M. S., Rehman A., Altameem A. and Saba T.
(2013), “Evaluation of current dental radiographs segmentation approaches in
computer-aided applications”, IETE Technical Review, 30(3), 210-222.
[47] Rajkumar, A., & Reena, G. S. (2010), “Diagnosis of heart disease using
datamining algorithm”, Global journal of computer science and technology,
10(10), 38-43.
[48]. Ramírez, E., Castillo, O., & Soria, J. (2010), “Hybrid System for Cardiac
Arrhythmia Classification with Fuzzy K-Nearest Neighbors and Neural
Networks Combined by a Fuzzy Inference System”, In Soft Computing for
Recognition Based on Biometrics, Springer Berlin Heidelberg, 37-55.
[49]. Rezaee, M. R., Van der Zwet, P. M., Lelieveldt, B. P., Van Der Geest, R. J.,
& Reiber, J. H. (2000), “A multiresolution image segmentation technique based
on pyramidal segmentation and fuzzy clustering”, IEEE Transactions on, Image
Processing, 9(7), 1238-1248.
[50]. Said, E., Fahmy, G. F., Nassar, D., & Ammar, H.(2004), “Dental x-ray
image segmentation”, International Society for Optics and Photonics and
In Defense and Security , 409-417.
[51]. E.H. Said, D. Eldin M. Nassar, G. Fahmy, and H.H. Ammar (2006), “Teeth
Segmentation in Digitized Dental X-Ray Films Using Mathematical
Morphology”, IEEE transactions on information forensics and security, 1(2),
178-89.
[52]. Salem Saleh Al-amri, N.V. Kalyankar and Khamitkar S.D (2010), “Image
Segmentation by Using Thershod Techniques”, Journal of computing, 2(5), 83-
86.
[53]. Sato-Ilic, M., & Jain, L. C. (2006), “Introduction to fuzzy clustering”, In
Innovations in Fuzzy Clustering, Springer Berlin Heidelberg, 1-8.
123
[54]. Scott, J. H. (1977), Introduction to dental anatomy, Edinburgh, Churchill
Livingstone.
[55]. Smith, R. A., Cokkinides, V., von Eschenbach, A. C., Levin, B., Cohen, C.,
Runowicz, C. D., ... & Eyre, H. J. (2002), “American Cancer Society guidelines
for the early detection of cancer”, CA: a cancer journal for clinicians, 52(1), 8-
22.
[56]. Son, L. H. (2015), “A novel kernel fuzzy clustering algorithm for geo-
demographic analysis”, Information Sciences: an International Journal, 317(C),
202-223.
[57]. Son, L.H., Van Hai , P.(2016), “A Novel Multiple Fuzzy Clustering Method
Based on Internal Clustering Validation Measures with Gradient
Descent”, International Journal of Fuzzy Systems, 1-10.
[58]. Son, L.H., Thong, N.T. (2015), “Intuitionistic Fuzzy Recommender
Systems: An Effective Tool for Medical Diagnosis”, Knowledge-Based Systems,
74, 133–150.
[59]. Sujji, G. E., Lakshmi, Y. V. S., & Jiji, G. W. (2013), “MRI Brain Image
Segmentation based on Thresholding”, International Journal of Advanced
Computer Research, 3(1), 97-101.
[60]. Tapas Kanungo, David M. Mount, Nathan S. Netanyahu, Christine D.
Piatko, Ruth Silverman, and Angela Y. Wu(2002), “An Efficient k-Means
Clustering Algorithm:Analysis and Implementation”, IEEE transaction on
pattern analysis and machine intelligence, 24(7), 881-892.
[61]. Tee, C. S.( 2008), Feature selection for content-based image retrieval using
statistical discriminant analysis, Doctoral dissertation, Universiti Teknologi
Malaysia, Faculty of Computer Science and Information System.
124
[62]. Thong, N. T., Son, L.H. (2015), “HIFCF: An effective hybrid model
between picture fuzzy clustering and intuitionistic fuzzy recommender systems
for medical diagnosis”, Expert Systems With Applications, 42(7), 3682-3701.
[63]. Thong, P. H., Son, L.H. (2015), “Picture fuzzy clustering: a new
computational intelligence method”, Soft Computing, In press, DOI:
10.1007/s00500-015-1712-7.
[64]. Vendramin, L., Campello, RJ, & Hruschka, ER.(2010), “Relative clustering
validity criteria: A comparative overview,” Statistical Analysis and Data Mining:
The ASA Data Science Journal, 3(4), 209-235.
[65]. Wang, J. S., & Lee, C. G. (2002), “Self-adaptive neuro-fuzzy inference
systems for classification applications”, IEEE Transactions on Fuzzy Systems,
10(6), 790-802.
[66]. Yasunori, E., Yukihiro, H., Makito, Y., & Sadaaki, M. (2009), “On semi-
supervised fuzzy c-means clustering”, Proceeding of FUZZ-IEEE 2009, 1119-
1124.
[67]. Yin, X., Shu, T., & Huang, Q. (2012), “Semi-supervised fuzzy clustering
with metric learning and entropy regularization”, Knowledge-Based Systems, 35,
304-311.
[68]. Zafar, M. S., & Javed, E. (2013), “Extraoral radiography: An alternative to
intraoral radiography for endodontic (root canal system) length determination”,
European Scientific Journal, 9(15), 51-61.
[69]. Zhang, H., & Lu, J. (2009), “Semi-supervised fuzzy clustering: A kernel-
based approach”, Knowledge-Based Systems, 22(6), 477-481.
[70]. Zhou, J., & Abdel-Mottaleb, M. (2005), “A content-based system for
human identification based on bitewing dental X-ray images”, Pattern
Recognition, 38(11), 2132-2142.
125
PHỤ LỤC 1
Hình 66 ảnh nha khoa sử dụng trong thực nghiệm.
126
127
128
PHỤ LỤC 2
Một số kết quả về độ chính xác của các thuật toán (Các giá trị in đậm chỉ ra giá trị
tốt nhất trong mỗi hàng).
Thuật
toán
FCM OTSU eSFCM
eSFCM-
OTSU
SSFC-SC SSFC-FS
SSFC-
FSAI
Ảnh 1
PBM 35392 49482 31968 32763 53891 52761 23743
DB 0.672 0.641 0.716 0.743 0.763 0.873 0.874
IFV 19.99 Inf 254.27 254.37 47.91 52.87 102.39
SSWC 0.573 0.531 0.565 0.537 0.672 0.763 0.643
CH 6.00E+06 5.00E+06 8.00E+06 7.67E+06 1.00E+07 1.00E+07 3.00E+06
BH 1562.7 992.97 1594 1672 1793 2092.6 738.39
BR -3.00E+07 -8.00E+06 -2.00E+07 -2.00E+07 -3.00E+07 -3.00E+07 -3.00E+07
DL 7.00E+09 4.00E+09 6.00E+09 6.00E+09 7.00E+09 1.00E+10 6.00E+09
Ảnh 2
PBM 30446 43436 27974 321232 52837 47166 21736
DB 0.685 0.677 0.731 0.723 0.827 0.932 0.847
IFV 19.77 Inf 302.12 323.27 47.44 51.67 68.38
SSWC 0.637 0.613 0.627 0.632 0.788 0.963 0.764
CH 9.00E+06 6.00E+06 8.00E+06 8.00E+06 9.00E+06 1.00E+07 5.00E+06
BH 1457.8 898.76 1342.8 1387.5 1663.4 2102.8 798.49
BR -2.00E+07 -1.00E+07 -3.00E+07 -3.00E+07 -4.00E+07 -2.00E+07 -3.00E+07
DL 7.00E+09 1.00E+09 6.00E+09 6.00E+09 7.00E+09 9.00E+09 7.00E+09
Ảnh 11
PBM 24644 45375 18818 19273 50335 46868 14873
DB 0.677 0.689 0.792 0.735 1.053 0.986 0.893
IFV 18.28 Inf 126.47 98.82 37.38 43.64 41.49
SSWC 0.562 0.549 0.556 0.623 0.604 0.726 0.645
CH 5.00E+06 4.00E+06 7.00E+06 7.00E+06 7.00E+06 1.00E+07 1.00E+07
BH 2174.7 839.95 2345.7 2343.4 2569.3 4576.8 849.49
BR -3.00E+06 -3.00E+06 -3.00E+06 -3.00E+06 -3.00E+06 -3.00E+06 -3.00E+06
DL 1.00E+09 5.00E+08 1.00E+09 1.00E+09 1.00E+09 2.00E+09 1.00E+09
Ảnh 12
PBM 39879 52729 36424 32432 57903 51724 28433
DB 0.651 0.667 0.689 0.632 0.864 0.983 0.784
129
IFV 20.43 Inf 269.35 98.27 48.84 52.37 53.29
SSWC 0.614 0.612 0.637 0.681 0.782 0.893 0.743
CH 1.00E+07 2.00E+06 9.00E+06 9.00E+06 1.00E+07 1.00E+07 9.00E+06
BH 1626.3 1112.6 1676.7 1982.3 1789.6 2013.3 847.93
BR -3.00E+07 -1.00E+07 -2.00E+07 -2.00E+07 -3.00E+07 -2.00E+06 -2.00E+06
DL 6.00E+09 5.00E+09 7.00E+09 6.00E+09 8.00E+09 1.00E+10 6.00E+09
Ảnh 24
PBM 66354 87072 58902 72532 85614 85346 74735
DB 0.687 0.694 0.746 0.693 0.725 0.745 0.702
IFV 26.96 Inf 426.53 213.23 65.5 68.12 78.94
SSWC 0.664 0.647 0.666 0.624 0.788 0.986 0.849
CH 2.00E+06 701570 219097 27384 402216 602763 323754
BH 1295.9 601.65 1382.3 1382.3 1393.1 2039.9 784.94
BR -3.00E+06 -3.00E+06 -4.00E+06 -3.00E+06 -4.00E+06 -3.00E+06 -3.00E+06
DL 9.00E+08 3.00E+08 9.00E+08 9.00E+08 9.00E+08 1.00E+09 9.00E+08
Ảnh 25
PBM 34160 87073 58902 67323 95844 89377 43748
DB 0.676 0.698 0.767 0.801 0.804 0.753 0.784
IFV 19.93 Inf 215.55 102.32 48.92 59.87 67.98
SSWC 0.613 0.572 0.627 0.637 0.674 0.765 0.677
CH 9.00E+06 3.00E+06 9.00E+06 9.00E+06 1.00E+07 1.00E+07 9.00E+06
BH 1652.7 1123 1672.7 1536.2 1746.2 2123.9 874.38
BR -4.00E+07 -1.00E+07 -3.00E+07 -3.00E+07 -4.00E+07 -3.00E+07 -2.00E+07
DL 7.00E+09 6.00E+09 7.00E+09 7.00E+09 7.00E+09 9.00E+09 8.00E+09
Ảnh 34
PBM 39714 50655 36489 41283 50984 49673 32744
DB 0.66 0.653 0.692 0.673 0.984 0.787 0.723
IFV 20.74 Inf 259.63 121.28 30.67 32.84 34.39
SSWC 0.597 0.568 0.583 0.628 0.615 0.725 0.674
CH 7.00E+06 1.00E+06 6.00E+06 6.00E+06 7.00E+06 9.00E+06 8.00E+06
BH 1627.6 982.27 1567.6 1635.3 1782.7 2350 946.94
BR -3.00E+07 -1.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07 -2.00E+07
DL 7.00E+09 1.00E+09 6.00E+09 6.00E+09 8.00E+09 1.00E+10 7.00E+09
Ảnh 35
PBM 45714 67630 4788.9 52223 72736 70376 52784
130
DB 0.678 0.646 0.762 0.724 0.987 0.893 0.856
IFV 28.78 Inf 899.34 273.3 35.53 39.87 43.94
SSWC 0.598 0.767 0.618 0.625 0.827 0.857 0.684
CH 6.00E+06 998263 6.00E+06 6.00E+06 6.00E+06 7.00E+06 7.00E+06
BH 1427.3 1122.3 1627.4 1723.3 1982.6 2876.9 756.98
BR -3.00E+07 -2.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07
DL 7.00E+09 6.00E+09 5.00E+09 5.00E+09 7.00E+09 1.00E+10 9.00E+09
Ảnh 55
PBM 35393 49482 31811 32416 35437 32644 27334
DB 0.672 0.641 0.718 0.692 0.687 0.721 0.72
IFV 19.998 Inf 237.19 121.45 53.68 67.78 70.94
SSWC 0.583 0.618 0.604 0.612 0.782 0.893 0.743
CH 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07
BH 1562.6 893.37 1638.2 1626.4 1644.6 2012.8 748.94
BR -3.00E+07 -2.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07 -2.00E+07
DL 7.00E+09 6.00E+09 7.00E+09 7.00E+09 7.00E+09 8.00E+09 8.00E+09
Ảnh 56
PBM 105923 96292 97067 92834 98113 93257 87435
DB 0.634 0.605 0.681 0.656 0.631 0.712 0.689
IFV 26.43 Inf 859.76 176.38 69.736 71.893 78.985
SSWC 0.636 0.766 0.633 0.643 0.867 0.985 0.823
CH 3.00E+06 1.00E+07 3.00E+07 3.00E+07 3.00E+06 3.00E+06 2.00E+06
BH 1381.9 836.42 1364.3 1462.3 1369.1 2037.7 783.93
BR -4.00E+06 -2.00E+06 -4.00E+06 -4.00E+06 -5.00E+06 -4.00E+06 -3.00E+06
DL 9.00E+08 3.00E+08 9.00E+08 9.00E+08 9.00E+08 1.00E+10 1.00E+10
.
Ảnh 65
PBM 35393 49482 31811 33418 35357 32464 23734
DB 0.685 0.677 0.731 0.723 0.827 0.932 0.847
IFV 19.77 Inf 302.12 323.27 47.44 51.67 68.38
SSWC 0.637 0.613 0.627 0.632 0.788 0.963 0.764
CH 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07 1.00E+07
BH 1562.6 893.37 1638.2 1626.4 1644.6 2012.8 748.94
BR -3.00E+07 -2.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07
DL 7.00E+09 6.00E+09 5.00E+09 5.00E+09 7.00E+09 1.00E+10 9.00E+09
Ảnh 66
131
PBM 39714 50655 36489 41283 50984 49673 32744
DB 0.66 0.653 0.692 0.673 0.984 0.787 0.723
IFV 20.74 Inf 259.63 121.28 30.67 32.84 34.39
SSWC 0.597 0.568 0.583 0.628 0.615 0.725 0.674
CH 7.00E+06 1.00E+06 6.00E+06 6.00E+06 7.00E+06 9.00E+06 8.00E+06
BH 1627.6 982.27 1567.6 1635.3 1782.7 2350 946.94
BR -3.00E+07 -1.00E+07 -3.00E+07 -3.00E+07 -3.00E+07 -2.00E+07 -2.00E+07
DL 7.00E+09 1.00E+09 6.00E+09 6.00E+09 8.00E+09 1.00E+10 7.00E+09