Khi thực nghiệm Thuật toán 2.3, chúng tôi chọn các tham số nhƣ sau:
- Các tham số f1, f2, fcut, số cụm C đƣợc lựa chọn bằng thực nghiệm,
giống nhƣ trong phần xây dựng phép biến đổi ảnh (phần 2.1.6): fcut = 0.005, số
cụm C = 5.
- Tham số kích thƣớc cửa sổ Wij tại điểm ảnh (i, j) dij = 3, tƣơng tự nhƣ
phƣơng pháp của Cheng.
- Tham số ĐSGT 1 . K, với K là số kênh ảnh I, đƣợc chúng tôi lựa
chọn bằng kinh nghiệm của ĐSGT, thƣờng lấy trong đoạn [0.3, 0.7]. Trong
thực nghiệm này 1 =. = K = 0.6.
Để đảm bảo tính khách quan trong việc đánh giá hiệu quả của thuật
toán để xuất, ngoài đánh giá bằng trực quan, chúng tôi sử dụng các chỉ số
khách quan nhƣ chỉ số entropy, chỉ số fuzzy entropy (công thức 1.22 và công
thức 1.25, phần 1.6, chƣơng 1) và đề xuất sử dụng chỉ số ĐTP trực tiếp (công
thức 1.26, phần 1.6, chƣơng 1)
139 trang |
Chia sẻ: tueminh09 | Ngày: 25/01/2022 | Lượt xem: 559 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu nâng cao độ tương phản ảnh theo tiếp cận đại số gia tử, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
low Then T is little low
R9: If G là hight AND E is little hight Then T is little hight
R10: If G là low AND E is little low Then T is little low
R11: If G là very hight AND E is very hight Then T is very
very hight
R12: If G là very low AND E is very low Then T T is very
very low
(3.5)
Xây dựng hàm fSnorm cho hệ luật (3.5)
Sử dụng phƣơng pháp lập luận ĐSGT, ta có các bƣớc để tính kết quả
đầu ra khi cho biết đầu vào theo 3 bƣớc nhƣ sau:
Bƣớc 1: Thiết lập các ĐSGT và các tham số tính mờ tƣơng ứng
84
Ký hiệu AG = (G , C, w, H, ), AE = ( E , C, w, H, ) và AT = (T , C, w,
H, ), C = {c–, c+}, c– = low, c+ = hight, H = H- H+, H- = {little}, H+ =
{very}, L ≡ little, V ≡ very.
Đặt ̅ ̅(
), ̅ ̅( ), ̅ ̅(
), ̅ ̅( ),
(
), ( ), trong đó ̅, ̅, ̅, ̅, , (0, 1).
Mối quan hệ dấu của các gia tử đối với các gia tử khác đƣợc xác định
nhƣ Bảng 3.2 sau:
Bảng 3.2. Mối quan hệ dấu của các gia tử
V L
V + +
L - -
Từ bảng trên ta có: sign(Vc-) = sign(VIc-) = sign(VI)sign(Ic-) =
1*sign(Ic
-
) = -1, ở đây I là gia tử đơn vị, Ix=x với mọi x.
Bảng 3.3. Bảng giá trị độ đo tính mờ và SQM tƣơng ứng với AG, AE, AT
Tham số For G For E For T
U(c
+
) 1G
G
1E
E
1T
T
U (V) 1G G 1E E 1T T
v U (low)
G G
E E
T T
vU(V.low) (very low) 2
G G
2
E E
2
T T
vU(L.low) (little low) ̅( ) + G G G ̅( ) + E E E ( )+ T T T
vU(hight) 1
GG
1 E
E
1 TT
vU(V.hight) (very
hight)
2
1
GG
21
EE
2
1 TT
vU(L.hight) (little
hight)
̅( ) - G
G G
̅( ) - EE E ( )- TT T
vU(V.V.low) (very
very low)
3
G G
3
E E
3
T T
vU(V.V.hight) (very
very hight)
3
1
GG
31
EE
31 TT
, trong đó U đóng vai trò của G , E và T .
85
Để tính các giá trị vX(x) cho một ĐSGT AX bất kỳ chúng ta cần lập
bảng sắp thứ tự của các gia tử nhấn và bảng dấu giữa các gia tử. Trong luận
án chỉ sử dụng hai gia tử nên chúng ta chỉ cần sử dụng các phép tính giá trị
định lƣợng ngữ nghĩa rất đơn giản của ĐSGT để chứng tỏ bảng trên là đúng.
Thật vậy, ta có:
( ) ( ) ( )
U U U U U U U
v c fm c fm c
( . ) 1 ( ) ( . ) ( ) * ( )
U U U U U U U U U U
S ig n L c L v L c v c v c
U U U U U
( ) ( ) (1 ) * 1 (1 ) * 1 *U U U U
U U U U U U U U U
v c fm c
( . ) 1 ( ) ( . ) ( ) * 1 ( )U U U U U U U U U US ig n L c L v L c v c v c
1 * U U
U U U
Ngoài ra, chúng ta có mệnh đề sau:
Mệnh đề 3.1.
(i)
1
( . ) ( )
k k
U U U U
v V c k N
(ii)
1
( . ) 1 ( )
k k
U U U U
v V c k N
, ở đây ký hiệu Vk.x là phép nhấn k lần gia tử very lên x U
Chứng minh:
(i) Ta chứng minh bằng quy nạp theo k.
Khi k=0, ( ) ( ) ( )U U U U U U Uv c fm c fm c
. Vậy (i) đúng khi k=0.
Giả sử (i) đúng với k, tức là
1
( . ) ( )
k k
U U U U
v V c
. Chúng ta cần chứng
minh (i) đúng với k+1 tức là
1 2
( . ) ( )
k k
U U U U
v V c
Thật vậy,
1
{ V }
.( . ) 1, ( ) . . .
U
k k k
U U U U U U U
h H
s ig n V V c h v V c v V V c
86
1 2
. ( ) ( )
k k k
U U U U U U U U
v V c
Vậy (i) là đúng.
(ii) Ta chứng minh bằng quy nạp theo k.
Khi k=0,
( ) ( ) (1 ) * 1 (1 ) * 1 *U U U U
U U U U U U U U U
v c fm c
. Vậy (ii) đúng khi k=0.
Giả sử (ii) đúng với k, tức là
1
( . ) 1 ( )
k k
U
U U U
v V c
. Chúng ta cần
chứng minh (ii) đúng với k+1 tức là 1 2( . ) 1 ( )k k U
U U U
v V c
Thật vậy,
{ V }
.( . ) 1, ( )
U
k
U U U
h H
S ig n V V c h
1 1 1
. . 1 . 1 ( ) ( )
k k k k k
U UU U U U U U U U U U
v V c v V c v V c
1 1 2
1 (1 ) * ( ) 1 * ( ) 1 ( )
k k k
U U U
U U U U U
Vậy (ii) là đúng.
Ví dụ: khi 0 .5 , 0 .5 , 0 .4U U ta có bảng giá trị độ đo tính mờ
và SQM ứng với AG, AE, AT nhƣ sau:
Bảng 3.4. Bảng giá trị tính toán minh họa độ đo tính mờ và SQM tƣơng ứng
với AG, AE, AT
Tham số For G For E For T
U(c
+
) 0.6 0.6 0.6
U (V) 0.5 0.5 0.5
v U (low) 0.2 0.2 0.2
vU(V.low) (very low) 0.1 0.1 0.1
vU(L.low) (little low) 0.3 0.3 0.3
vU(hight) 0.7 0.7 0.7
87
vU(V.hight) (very hight) 0.85 0.85 0.85
vU(L.hight) (little hight) 0.55 0.55 0.55
vU(V.V.low) (very very low) 0.05 0.05 0.05
vU(V.V.hight) (very very hight) 0.925 0.925 0.925
Bƣớc 2:
2.1: Tính các SQM của các thành phần bên trái và bên phải hệ luật mờ
sử dụng bảng 3.3.
2.2: Với một toán tử “và” 2 ngôi AND: 2: [ 0 ,1] [0 ,1]A N D , AND(G , E
) = G * E , chúng ta có mảng các điểm nội suy bề mặt Snorm (ở đây m = 2) của
hệ luật (3.5) nhƣ sau:
Bảng 3.5. Bảng giá trị các mốc nội suy dựa trên toán tử AND
của hệ luật (3.5)
Chỉ số luật Các điểm nội suy (x,y)[0,1]2 x y
R1 AND ( ̅( ) ̅( )) ( )
R2 AND ( ̅( ) ̅( )) ( )
R3 AND ( ̅( ) ̅( )) ( )
R4 AND ( ̅( ) ̅( )) ( )
R5 AND ( ̅( ) ̅( )) ( )
R6 AND ( ̅( ) ̅( )) ( )
R7 AND ( ̅( ) ̅( )) ( )
R8 AND ( ̅( ) ̅( )) ( )
R9 AND ( ̅( ) ̅( )) ( )
R10 AND ( ̅( ) ̅( )) ( )
R11 AND ( ̅( ) ̅( )) ( )
R12 AND ( ̅( ) ̅( )) ( )
Từ đây có thể sử dụng một phép nội suy đơn giản fSnorm nhƣ phép tuyến
tính từng khúc trên các mốc nội suy.
88
Nhận xét:
Cho trƣớc cặp giá trị ngữ nghĩa đầu vào (G , E ) [0, 1]
2, ta xác định
giá trị ngữ nghĩa đầu ra hT [0, 1] nhƣ sau: hT = fSnorm (AND(G , E ));
Hàm fSnorm cho hệ luật (3.5) đƣợc xây dựng nhƣ trên đƣợc ký hiệu là
THA, AND hay gọn hơn THA khi đã cho trƣớc toán tử AND.
Mệnh đề 3.2. Hàm 2: [ 0 ,1] [ 0 ,1]
H A
T bảo toàn thứ tự nghĩa là
, , ', ' [ 0 ,1] , ', ' ( , ) ( ', ')
H A H A
a b a b a a b b T a b T a b
Chứng minh: Do
(i) AND bảo toàn thứ tự.
(ii) Các SQM Gv , Ev và Tv bảo toàn thứ tự trên G , E và T (xem
Định nghĩa 1.2 và Định nghĩa 1.3)
Suy ra THA bảo toàn thứ tự tại các mốc nội suy (xem bảng 3.5)
Do fSnorm đƣợc tạo thành từ phép nội suy tuyến tính từng khúc giữa các
mốc nội suy, nên bảo toàn thứ tự THA trên [0, 1]
2
.
Sử dụng THA, chúng ta xác định một độ đo thuần nhất địa phƣơng của
ảnh nhƣ sau:
i j i j 4 ,i j , , * i ji jH AH O T T E H V R (3.6)
Kỹ thuật xây dựng độ đo thuần nhất sử dụng ĐSGT đƣợc thực hiện
theo thuật toán 3.1 nhƣ sau:
Thuật toán 3.1. Xác định độ thuần nhất tại mỗi điểm ảnh HA-HRM.
Đầu vào: Ảnh đa cấp xám I, có kích thƣớc M x N.
Tham số: g, gr, ep, ep, ho, ho (0, 1) của ĐSGT AGr, AEp và
AHo
Đầu ra: Bảng giá trị độ thuần nhất tại mỗi điểm ảnh.
Bƣớc 1: Tính gradient, entropy, độ lệch chuẩn và mô men bậc 4 chuẩn
hóa về đoạn [0, 1] các giá trị này.
89
For mỗi điểm ảnh gij
1.1: Tính Eij, Hij, Vij, R4,ij dùng công thức (1.11)
1.2: Tính 1ij
ij
E E , 1ij ijH H , 1ij ijV V , 4 , 4 ,1ij ijR R
Bƣớc 2: Với toán tử AND, xây dựng hàm THA cho hệ luật HRM(AGr,
AEp, AHo) của các biến ngôn ngữ Gr( g r a d ie n t ), Ep( e n tr o p y ) và
Ho(homogeneity) với các tham số độ đo mờ g, gr, ep, ep, ho, ho (0,1).
Bƣớc 3: Tính độ thuần nhất tại từng điểm ảnh
3.1: For mỗi điểm ảnh gij
Tính ,i j i ji j H AE H T E H
Tính 4 ,ij ijax , * i ji jH O m E H V R
3.2: Chuẩn hóa
For mỗi điểm ảnh gij-
Tính i j
i j
i j
=
m ax { }
H O
H O
Trả về: {βij}
Thuật toán 1 có độ phức tạp O(M*N).
(a)
(b)
Hình 3.4. Các giá trị nhất của kênh V của ảnh #5 sử dụng [18] (a), giá
trị thuần nhất sử dụng ĐSGT (b)
3.2. Nâng cao độ tƣơng phản ảnh mầu với độ đo thuần nhất đề xuất
Trƣớc tiên đề xuất xây dựng một biến đổi ảnh F của từng kênh ảnh
xám của tổ hợp kênh ảnh đầu vào. Khi đó ĐTP đƣợc tính theo công thức:
90
i j i j
i j
i j i j
( ) ( )
( ) ( )
F g F
C
F g F
(3.7)
ở đây ta đồng nhất biến đổi F với ảnh {F(i,j)}.
Nhƣ trong chƣơng 2, tác giả cũng sử dụng một phép phân cụm FCM để
ƣớc lƣợng nhiều dải động mức xám của từng kênh ảnh và xây dựng một biến
đổi ảnh ứng với từng kênh. Ở đây khác với chƣơng 2, tác giả đề xuất sử dụng
hàm S-function thay cho hàm clip để xây dựng một biến đổi ảnh
Với mỗi 1,k K , chúng ta xác định một biến đổi Fk cho kênh ảnh Ik nhƣ
sau:
, m a x , m in ,1 , , , 2 ,
1
, m in
( , ) ; , ,
( , )
C
k k k k c k c k c
c
k k
L L S fu n c tio n I i j B V B
F i j L
C
(3.8)
, trong đó 1, , 1, , 1,k K i M j N , [x] chỉ phần nguyên của số thực x.
Nhận xét: Biến đổi ảnh Fk bảo toàn thứ tự.
Sử dụng độ đo thuần nhất HA-HRM đƣợc xây dựng trong thuật toán
3.1, kỹ thuật nâng cao ĐTP ảnh mầu trong biểu diễn mầu HSV đƣợc thực
hiện theo thuật toán 3.2 nhƣ sau:
Thuật toán 3.2. Nâng cao ĐTP ảnh mầu HSV sử dụng độ đo thuần
nhất HA-HRM.
Đầu vào: Ảnh I trong biểu diễn mầu RGB, kích thƣớc M x N. Tham số
C , 2N C , ngƣỡng fcut (fcut > 0, đủ nhỏ), d (d x d là kích thƣớc cửa sổ).
Đầu ra: Ảnh mầu RGB Inew, và tùy chọn trả về:
Giá trị tƣơng phản trung bình CMR, CMG, CMB, Giá trị Eavg, Havg
Bƣớc 1: Gọi (IH, IS, IV) là biểu diễn mầu của I trong không gian mầu
HSV. Lƣợng hóa để coi các kênh IS, IV nhƣ là các ảnh đa cấp xám.
91
Bƣớc 2: Với dữ liệu đầu vào là tổ hợp kênh (IS, IV), tham số số cụm là
C và ngƣỡng fcut, thực hiện phân cụm FCM để ƣớc lƣợng C dải động mức
xám [Bk,1,c, Bk,2,c] với k{S, V} (xem công thức (2.4)).
Bƣớc 3: Xác định ảnh biến đổi FS, FV của kênh IS, IV tƣơng ứng theo
công thức (2.5).
Bƣớc 4:
4.1: Tính các giá trị thuần nhất của FS, FV dựa trên ĐSGT sử dụng HA-
HRM.
4.2: Tính tham số của [17] cho kênh FS, FV với kích thƣớc cửa sổ d x d,
cụ thể là các giá trị mức xám không thuần nhất {δFS, ij}, {δFV, ij}, số mũ khuếch
đại {FS,ij}, {FV,ij} tại từng điểm ảnh của kênh FS và kênh FV (công thức
(1.14), và (1.16)).
Bƣớc 5: Tính ĐTP và xác định kênh ảnh xám mới của kênh FS và kênh
FV, , ,,S S n e w V V n e wF I F I nhƣ sau:
Với kênh FS FS(IS) và kênh FV FV(IV): Tính ĐTP
S ,i j i j
S ,i j
S ,i j i j
( ) ( )
,
( ) ( )
S S
S S
F g F
C
F g F
V ,ij i j
V ,i j
V ,i j i j
( ) ( )
( ) ( )
V V
V V
F g F
C
F g F
(3.9)
Tính giá trị mức xám mới của kênh S và V:
S ,ij
S ,i j
S ,i j
S ,i j
S ,ij
S ,i j S ,i j S ,i j
S ,i j
S ,n e w
S ,ij
S ,i j S ,i j S ,i j
S ,i j
1
,
1
I ( , )
1
,
1
t
t
t
t
C
g
C
i j
C
g
C
(3.10)
92
V ,ij
V ,ij
S ,i j
V ,i j
V ,ij
V ,ij V ,ij V ,ij
V ,ij
V ,n e w
V ,ij
V ,ij V ,ij V ,ij
V ,ij
1
,
1
I ( , )
1
,
1
t
t
t
t
C
g
C
i j
C
g
C
Lƣu ý: kênh S đƣợc đánh chỉ số k = 1, kênh V đƣợc đánh chỉ số k = 2.
Bƣớc 6: Chuyển ảnh (IH, IS,new, IV,new) trong biểu diễn mầu HSV về biểu
diễn mầu RGB, ta đƣợc ảnh Inew.
Bƣớc 7: Bƣớc tùy chọn, tính các chỉ số CM{R,G,B}, Eavg và Havg.
7.1: Tính tham số của [17] cho kênh IR, IG và IB của ảnh gốc I với kích
thƣớc cửa sổ dxd, cụ thể là các giá trị mức xám không thuần nhất {δR,ij},
{δG,ij}, và {δB,ij} của kênh IR, IG và IB tƣơng ứng (công thức (1.14) và (1.16)).
7.2: Tính CMR, CMG, CMB theo công thức (1.12), cụ thể là:
, , i j
i j , , i j
( , )
( , )
*
n e w R R
n e w R R
R
I i j
I i j
C M
M N
, , i j
i j , , i j
( , )
( , )
*
n e w G G
n e w G G
G
I i j
I i j
C M
M N
, , i j
i j , , i j
( , )
( , )
*
n e w B B
n e w B B
B
I i j
I i j
C M
M N
7.3: Tính: Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công thức (1.8),
Havg = Havg{Inew,R, Inew,G, Inew,B} theo công thức (1.9).
Trả về: Inew,
Và các tùy chọn đƣợc trả về CMR, CMG, CMB, Eavg, Havg.
Không tính đến thuật toán FCM và phép nội suy giải hệ lập luận mờ
(3.5) của ĐSGT, thuật toán 3.2 có độ phức tạp tƣơng đƣơng thuật toán gốc
[17]. Mô hình kiến trúc hệ thống đề xuất đƣợc xây dựng nhƣ hình 3.5:
93
Hình 3.5. Lƣu đồ xử lý của thuật toán đề xuất.
3.3. Thực nghiệm
3.3.1. Tính độ thuần nhất kênh ảnh
Các tham số sử dụng trong phép biến đổi mờ hóa ảnh đƣợc lựa chọn
nhƣ trong phần 2.1.6, chƣơng 2, cụ thể: fcut = 0.005, C = 5.
Các giá trị tham số ĐSGT của các biến ngôn ngữ Gr, Ep, Ho thiết kế độ
đo thuần nhất đƣợc cho bằng thực nghiệm nhƣ bảng sau:
Bảng 3.6. Các tham số cơ sở của ĐSGT Agr, Aep và Aho.
Tham số For Gr ( g r a d ie n t ) For Ep ( e n tr o p y ) For Ho ( h o m o g e n e ity )
U(c
-1
) 0.5 0.5 0.5
U(little) 0.5 0.5 0.5
Tính giá trị sáng xung quanh, ĐTP và số mũ
khuếch đại của S và V.
Tính các giá trị mức xám mới của kênh S và
kênh V
Chuyển đổi ngƣợc HSV về RGB
Kết thúc
Bắt đầu
Ảnh RGB đầu vào
Chuyển đổi RGB sang HSV
Tính các giá trị thuần
nhất δRij,, δGij,, δB,ij
Biến đổi kênh S
và V
94
, trong đó U đóng vào của các biến ngôn ngữ Gr, Ep và Ho.
Các tham số , ,U U đƣợc lựa chọn bằng thực nghiệm nhƣ sau:
0 .5 , 0 .5 , 0 .4
U U
.
3.3.2. Đánh giá độ đo HA-HRM
Khi đánh giá kết quả của tác giả so với độ đo gốc đƣợc công bố trong
[17], vì [17] chỉ đƣợc phát biểu ứng dụng cho ảnh đa cấp xám, trong khi thuật
toán của tác giả đƣợc phát biểu cho ảnh mầu, ngoài đánh giá bằng trực quan
tác giả cũng sử dụng các chỉ số khách quan Eavg, Havg và CM để đánh giá,
tƣơng tự nhƣ trong Chƣơng 2.
3.4. Các kết quả và luận giải
Trong phần này tác giả trình bày thử nghiệm nâng cao ĐTP sử dụng
biến đổi ảnh trên kênh ảnh S và V) trong biểu diễn mầu HSV.
Trong thử nghiệm này, tác giả thực hiện kiểm tra hiệu quả của độ đo
HA-HRM đề xuất sử dụng phép phân cụm FCM xác định tham số cho phép
biến đổi ảnh trong công thức (2.5). Các bƣớc đƣợc thực hiện nhƣ sau:
- Đầu tiên, chuyển biểu diễn mầu RGB sang biểu diễn mầu HSV của
ảnh đầu vào. Phân cụm dữ liệu mức xám tổ hợp kênh S và kênh V với tham
số đƣợc chọn nhƣ trong thử nghiệm A (số cụm C = 5 v.v). Trên từng kênh
ảnh S và kênh V riêng rẽ ƣớc lƣợng {B1,c,k, B2,c,k} (k{S, V}) và thực hiện
biến đổi ảnh cho kênh S và kênh V tƣơng ứng sử dụng hàm biến đổi FS, FV
(công thức (2.5)).
- Thứ hai, xác định giá trị ĐTP theo thuật toán 3.2 và các bƣớc liên
quan cho kênh ảnh S và V đã biến đổi ở bƣớc thứ nhất với kích thƣớc cửa sổ
3x3 và tham số t = 0.25 (1.10).
95
- Thứ ba, tổng hợp lại các kênh ảnh H gốc, kênh S và kênh V đã nâng
cao ĐTP, sau đó biến đổi ngƣợc từ biểu diễn mầu HSV sang biểu diễn mầu
RGB.
- Cuối cùng, tính giá trị mức xám không thuần nhất tại từng điểm ảnh
ứng với các kênh ảnh R, G và B (các giá trị này đƣợc dùng để tính độ đo
tƣơng phản trung bình trên từng kênh R, G và B).
Giá trị trung bình ĐTP trực tiếp CM trên kênh R, G và B trong biểu
diễn mầu RGB ảnh đầu vào đƣợc tính với ảnh giá trị mức xám trung bình
không thuần nhất của từng kênh R, G và B của ảnh RGB gốc và ảnh kết quả
đầu ra khi sử dụng thuật toán 2 với các HOk, k = 16 và phƣơng pháp đề
xuất (HA-HRM) thể hiện ở các bảng 3.7-3.11.
Bảng 3.7. Giá trị chỉ số CMR cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ảnh #1 #2 #3 #4 #5 #6
HO1 0.3692 0.1806 0.1688 0.2002 0.2132 0.1494
HO 2 0.3687 0.1805 0.1687 0.1993 0.2144 0.1494
HO 3 0.3687 0.1805 0.1687 0.1993 0.2144 0.1450
HO 4 0.3688 0.1805 0.1687 0.1992 0.2144 0.1493
HO 5 0.3687 0.1805 0.1686 0.1993 0.2144 0.1451
HO 6 0.3691 0.1806 0.1687 0.1997 0.2160 0.1454
HA-HRM 0.3889 0.1813 0.1802 0.2065 0.2161 0.1505
Bảng 3.8. Giá trị chỉ số CMG cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ ảnh #1 #2 #3 #4 #5 #6
HO 1 0.3780 0.1815 0.1703 0.2016 0.2142 0.1503
HO 2 0.3773 0.1814 0.1701 0.2007 0.2154 0.1503
96
HO 3 0.3773 0.1814 0.1701 0.2007 0.2154 0.1458
HO 4 0.3774 0.1814 0.1701 0.2006 0.2154 0.1502
HO 5 0.3774 0.1814 0.1701 0.2006 0.2154 0.1459
HO 6 0.3778 0.1814 0.1702 0.2011 0.2168 0.1463
HA-HRM 0.4000 0.1822 0.1814 0.2080 0.2170 0.1623
Bảng 3.9. Giá trị chỉ số CMB cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ảnh #1 #2 #3 #4 #5 #6
HO 1 0.4200 0.1851 0.1869 0.2126 0.2148 0.1498
HO 2 0.4192 0.1851 0.1868 0.2118 0.2160 0.1498
HO 3 0.4192 0.1851 0.1868 0.2118 0.2160 0.1451
HO 4 0.4194 0.1850 0.1869 0.2117 0.2160 0.1497
HO 5 0.4193 0.1851 0.1868 0.2118 0.2160 0.1453
HO 6 0.4197 0.1851 0.1869 0.2121 0.2176 0.1457
HA-HRM 0.4418 0.1860 0.2048 0.2194 0.2177 0.1626
Bảng 3.10. Giá trị chỉ số Eavg cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ảnh #1 #2 #3 #4 #5 #6
HO 1 6.1126 7.2722 7.3154 7.5641 7.3993 4.2105
HO 2 6.1129 7.2712 7.3127 7.5456 7.4098 4.2174
HO 3 6.1123 7.2698 7.3122 7.5464 7.4076 4.2051
HO 4 6.1175 7.2684 7.3144 7.5462 7.4167 4.2228
HO 5 6.1101 7.2758 7.3096 7.5631 7.4168 4.2165
HO 6 6.1094 6.8158 6.9599 7.3155 7.2337 4.2239
HA-HRM 6.1509 7.3862 7.5124 7.6307 7.5833 4.3675
97
Bảng 3.11. Giá trị chỉ số Havg cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ ảnh #1 #2 #3 #4 #5 #6
HO 1 0.3999 0.6943 0.7198 0.7640 0.7891 0.4599
HO 2 0.4022 0.6944 0.7201 0.7648 0.7909 0.4606
HO 3 0.4021 0.6944 0.7201 0.7648 0.7909 0.4424
HO 4 0.4023 0.6944 0.7201 0.7648 0.7909 0.4612
HO 5 0.4020 0.6944 0.7201 0.7645 0.7909 0.4420
HO 6 0.4017 0.6944 0.7200 0.7646 0.7904 0.4414
HA-HRM 0.3984 0.6943 0.7197 0.7610 0.7907 0.4501
Bảng 3.7 đến bảng 3.11 của kết quả thực nghiệm của các ảnh #1 - #6 đã
thể hiện các chỉ số khách quan ĐTP trực tiếp trên từng kênh R, G và B khi sử
dụng phép kết nhập 4 đặc trƣng địa phƣơng HO7 đều cho kết quả cao hơn khi
sử dụng các HOk, k = 16. Chỉ số khách quan Eavg khi áp dụng thuật cũng
cao hơn với HA-HRM. Cũng vậy, chỉ số khách quan Havg khi áp dụng HA-
HRM, ngoài ảnh #5 và ảnh #6, đều có giá trị nhỏ hơn so với chỉ số ảnh kết
quả khi áp dụng HOk, k = 16. Đây là những chứng cứ khách quan thể hiện
hiệu quả của độ đo thuần nhất dựa trên ĐSGT so với các phép xây dựng sử
dụng toán tử t-norm.
(a)
(b)
98
(c)
(d)
(e)
(g)
(h)
(k)
(l)
(m)
99
(n)
(p)
Hình 3.6. Thử nghiệm cho ảnh #1 - #6. Ảnh kết quả (cột bên trái ) khi sử
dụng [17], (cột bên phải) sử dụng thuật toán 3.2 với HO7 đề xuất.
Hình 3.7. Ảnh kết quả sử dụng thuật toán 2 với phép kết nhập gốc [17]
ij 4 ,
* * *
ij ij ij ij
H O E V H R cho ảnh #1 và ảnh kết quả không trơn.
100
Kết luận chƣơng 3
Chƣơng này phân tích phƣơng pháp xây dựng độ đo thuần nhất địa
phƣơng của ảnh theo phƣơng pháp của Cheng, chỉ ra những hạn chế của
phƣơng pháp này khi áp dụng vào quy trình nâng cao ĐTP, đồng thời đề xuất
02 đóng góp mới cho phƣơng pháp xây dựng độ đo thuần nhất địa phƣơng
của ảnh, cụ thể:
Thứ nhất, tác giả đã đề xuất phƣơng pháp mới xây dựng độ đo thuần
nhất địa phƣơng của ảnh khi sử dụng lập luận mờ với thuật toán dựa trên
ĐSGT để kết nhập các giá trị địa phƣơng nhƣ gradient, entropy, độ lệch chuẩn
trung bình và moment bậc 4 so với cách kết nhập của [17].
Thứ hai, tác giả cũng đã đề xuất phƣơng pháp mới khác xây dựng độ đo
thuần nhất địa phƣơng của ảnh khi sử dụng lập luận mờ với thuật toán dựa
trên các toán tử t-norm để kết nhập các giá trị địa phƣơng gradient, entropy,
độ lệch chuẩn trung bình và moment bậc 4 so với cách kết nhập của [17];
Chƣơng này cũng trình bày đề xuất một thuật toán mới theo phƣơng
pháp nâng cao ĐTP trực tiếp cho ảnh mầu trong biểu diễn mầu HSV dựa trên
độ đo thuần nhất mới đã đƣợc xây dựng bằng ĐSGT. So sánh hiệu quả nâng
cao ĐTP ảnh khi áp dụng các phƣơng pháp xây dựng độ đo thuần nhất đề
xuất.
Kết quả thực nghiệm đã chứng tỏ rằng các kỹ thuật đã đề xuất của tác
giả đã làm việc tốt với đa dạng ảnh mầu. Độ đo thuần nhất đề xuất hoạt động
hiệu quả hơn các độ đo sử dụng các toán tử kết nhập mờ t-norm thông dụng.
Ảnh nâng cao ĐTP cũng trơn, tăng đƣợc độ sáng toàn bộ ảnh.
101
KẾT LUẬN
Từ những hạn chế trong phƣơng pháp của Cheng nhƣ:
(1) Dùng phép biến đổi ảnh của Cheng có thể làm mất chi tiết của ảnh
gốc và độ sáng ảnh đầu ra của phép nâng cao ĐTP của cheng ít thay đổi;
(2) Hàm biến đổi mức xám trong của Cheng không đối xứng và giá trị
độ xám của điểm ảnh đầu ra có thể nằm ngoài miền giá trị độ xám.
(3) Phép xây dựng độ đo thuần nhất địa phƣơng của ảnh khi áp dụng
vào nâng cao ĐTP ảnh, ảnh kết quả có thể không trơn.
Luận án đã đề xuất 3 vấn đề nghiên cứu mới là:
(1) Xây dựng phép biến đổi mờ hóa ảnh áp dụng cho ảnh đa kênh làm
bƣớc tiền đề cho quy trình nâng cao ĐTP nhằm thay đổi độ sáng của ảnh kết
quả. Phép biến đổi ảnh bảo toàn thứ tự và không làm mất chi tiết ảnh.
(2) Xây dựng hàm biến đổi độ xám dạng chữ S dựa trên hệ luật ngôn
ngữ và giải hệ luật bằng ĐSGT (toán tử Hint) để cải tiến thuật toán của
Cheng, ứng dụng nâng cao ĐTP ảnh đa kênh.
(3) Xây dựng độ thuần nhất theo tiếp cận đại số gia tử áp dụng vào quy
trình nâng cao ĐTP ảnh đa kênh.
Tuy nhiên, luận án còn một số hạn chế:
(1) Hệ luật ngôn ngữ mới dừng lại ở 05 luật, số gia tử mới dừng lại ở
02 gia tử, mặc dù đƣợc chứng minh là có ích nhƣng vẫn rất đơn giản;
(2) Vấn đề ảnh hƣởng của các yếu tố nhƣ phƣơng pháp nội suy, giá trị
các tham số mờ.đến hiệu quả nâng cao ĐTP ảnh chƣa đƣợc xét đến;
(3) Yếu tố độ phức tạp của thuật toán cũng chƣa đƣợc xem xét.
Từ những hạn chế trên, hƣớng nghiên cứu tiếp theo của luận án là:
(1) Nghiên cứu mở rộng số luật trong hệ luật ngôn ngữ, số lƣợng gia tử;
(2) Nghiên cứu sự ảnh hƣởng của các yếu tố liên quan nhƣ phƣơng
pháp nội suy, các giá trị tham số mờ;
(3) Nghiên cứ cải thiện tốc độ tính toán.
102
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ
[CT 1] Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, Ngô
Hoàng Huy, Đặng Duy An, Một phƣơng pháp mới để nâng cao độ tƣơng phản
ảnh mầu theo hƣớng tiếp cận trực tiếp, Tạp chí Công nghệ Thông tin và
Truyền thông, Tập V-1 số 17(37), 06-2017, trang 59-74.
[CT 2] Nguyễn Văn Quyền, Ngô Hoàng Huy, Nguyễn Cát Hồ, Trần
Thái Sơn, Xây dựng độ đo thuần nhất và nâng cao độ tƣơng phản ảnh mầu
theo tiếp cận trực tiếp dựa trên ĐSGT”, Tạp chí Công nghệ Thông tin và
Truyền thông, Tập V-2 số 18(38), 12-2017, trang 19-32.
[CT 3] Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Hoàng
Xuân Trung, Tạ Yên Thái, Xây dựng độ đo thuần nhất cho ảnh mầu dựa trên
các toán tử t-norm, Tạp chí Nghiên cứu khoa học và công nghệ quân sự, số
49, 06-2017, trang 117-131.
[CT 4] Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Hoàng
Xuân Trung, Tạ Yên Thái, Phƣơng pháp xây dựng một histogram mở rộng
cho ảnh đa kênh và ứng dụng, Tạp chí Nghiên cứu khoa học và công nghệ
quân sự, số 50, 08-2017, trang 127-137.
[CT 5] Nguyễn Văn Quyền, Nguyễn Tân Ân, Trần Thái Sơn, Thiết kế
hàm biến đổi độ xám dạng chữ S tăng cƣờng độ tƣơng phản ảnh sử dụng
ĐSGT, Kỷ yếu hội thảo quốc gia về nghiên cứu Cơ bản và Ứng dụng công
nghệ thông tin lần thứ 10 (Fair 10), tháng 8 năm 2017, trang 884-897.
103
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Nguyễn Cát Hồ, Nguyễn Văn Long (2003), “Làm đầy đại số gia tử trên
cơ sở bổ sung các phần tử giới hạn”, Tạp chí Tin học và Điều khiển học,
Tập 19(1), tr. 62–71.
[2] Nguyễn Cát Hồ, Trần Thái Sơn (1995), “Về khoảng cách giữa các giá trị
của biến ngôn ngữ trong đại số gia tử”, Tạp chí Tin học và Điều khiển
học, Tập 11(1), tr. 10-20.
[3] Nguyễn Cát Hồ (2008), “Cơ sở dữ liệu mờ với ngữ nghĩa đại số gia tử”,
Bài giảng trường Thu - Hệ mờ và ứng dụng, Viện Toán học Việt Nam.
[4] Nguyễn Cát Hồ, Phạm Thanh Hà (2007), “Giải pháp kết hợp sử dụng đại
số gia tử và mạng nơron RBF trong việc giải quyết bài toán điều khiển
mờ”, Tạp chí Tin học và Điều khiển học, Tập 25(1), tr. 17-32.
[5] Dƣơng Thăng Long (2010), Một phương pháp xây dựng hệ mờ dạng luật
với ngữ nghĩa dựa trên đại số gia tử và ứng dụng trong bài toán phân
lớp, Luận án tiến sĩ Toán học, Viện Công nghệ Thông tin - Viện Khoa
học và Công nghệ Việt Nam.
[6] Trần Thái Sơn, Nguyễn Thế Dũng (2005), “Một phƣơng pháp nội suy
giải bài toán mô hình mờ trên cơ sở đại số gia tử”, Tạp chí Tin học và
Điều khiển học, Tập 21(3), tr. 248-260.
[7] Lê Xuân Việt (2008), Định lượng ngữ nghĩa các giá trị của biến ngôn
ngữ dựa trên đại số gia tử và ứng dụng, Luận án Tiến sĩ Toán học, Viện
Công nghệ Thông tin - Viện Khoa học và Công nghệ Việt Nam.
[8] Lê Xuân Vinh (2006), Về một cơ sở đại số và logíc cho lập luận xấp xỉ
và ứng dụng, Luận án Tiến sĩ Toán học, Viện Công nghệ Thông tin -
Viện Khoa học và Công nghệ Việt Nam.
104
Tiếng anh
[9] S. S. Agaian, S. Blair and K. A. Panetta (2007), “Transform coefficient
histogram-based image enhancement algorithms using contrast entropy”,
IEEE Trans. Image Processing, vol. 16, no. 3, pp. 741-758.
[10] Aditi M., Irani S. (2006), “Contrast Enhancement of Images using
Human Contrast Sensitivity”, Applied perception in graphics and
visualization, 11, pp. 69-76.
[11] Aman T., Naresh K. (2014), “Performance Analysis of Type-2 Fuzzy
System for Image Enhancement using Optimization”, International
Journal of Enhanced Research in Science Technology & Engineering,
Vol. 3 Issue 7, pp. 108-116.
[12] Arici T., Dikbas S., and Altunbasak Y. (2009), “A Histogram Modification
Framework and Its Application for Image Contrast Enhancement,” IEEE
Transactions on Image Processing, vol. 18, no. 9, pp.1921-1935.
[13] A. Beghdadi, A.L. Negrate (1989), “Contrast enhancement technique
based on local detection of edges”, Comput. Vision Graphics Image
Process. 46, pp.162–174.
[14] Bezdek, James C (2013), “Pattern recognition with fuzzy objective
function algorithms”, Springer Science & Business Media.
[15] A.O. Boudraa and E. H. S. Diop (2008), “Image contrast enhancement
based on 2D teager-kaiser operator”, Proc. of the IEEE International
Conference on Image Processing, pp. 3180-3183.
[16] Cheng H.D, Huijuan Xu (2000), “A novel fuzzy logic approach to
contrast enhancement”, Pattern Recognition 33, pp. 809-819.
[17] Cheng H.D., Mei Xue, Shi X, J. (2003), “Contrast enhancement based on
a novel homogeneity measurement”, Pattern Recognition 36, pp. 2687–
2697.
105
[18] L. Dash, B. N. Chatterji (1991), “Adaptive contrast enhancement and de-
enhancement”, Pattern Recognition 24, pp. 289–302.
[19] A. P. Dhnawan, G. Buelloni, R. Gordon (1986), Enhancement of
mammographic features by optimal adaptive neighborhood image
processing, IEEE Trans. Med. Imaging 5, pp. 8–15.
[20] Fachao L., Lianquin S., Shuxin L. (2004), “A general model of fuzziness
measure”, in: Proc. 2004 Int. Conf. on Machine Learning and
Cybernetic 3, pp. 1831–1835.
[21] R. C. Gonzalez and R. E. Woods, Digital Image Processing, Prentice
Hall, New Jersey, 2008.
[22] M. M. Gupta, J. Qi (1991), “Theory of t-norms and fuzzy inference
methods”, Fuzzy Sets and Systems 40, pp:431-450.
[23] Hanmandlu M., Devendra Jha, Rochak (2003), “Color image enhancement
by fuzzy intensification”, Pattern Recognition Letters 24, pp.81–87.
[24] Hanmandlu M., Devendra Jha (2006), “An Optimal Fuzzy System for
Color Image Enhancement”, IEEE Transactiong on Image Processiong,
Vol. 15, No.10, pp. 2956-2966.
[25] Hanmandlu M., Om Prakash Verma, Nukala Krishna Kumar and
Muralidhar Kulkami (2009), “A Novel Optimal Fuzzy System for Color
Image Enhancement Using Bacterial Foraging”, IEEE Transactions on
Instrumentation and Measurement, Vol. 58, No. 8, pp. 2867-2879.
[26] Hasanien A.E., Badr A. (2003), “A Comparative Study on Digital
Mamography Enhancement Algorithms Based on Fuzzy Theory”,
Studies in Informatics and Control, Vol.12, No.1, pp. 21-31.
[27] Hashemi, S., Kiani, S., Noroozi, N., & Moghaddam, M. E (2010), “An
image contrast enhancement method based on genetic algorithm”,
Pattern Recognition Letters, 31(13), pp. 1816–1824.
106
[28] Ho N. C., Wechler W. (1990), “Hedge algebra: An algebraic approach to
structures of sets of linguistic truth values”, Fuzzy Sets and Systems 35,
pp. 281–293.
[29] Ho N. C., Wechler W. (1992), “Extended algebra and their application to
fuzzy logic”, Fuzzy Sets and Systems 52, pp. 259–281.
[30] Ho N. C., Lan V. N. and Viet L. X. (2008), “Optimal hedge-algebras-
based controller: Design and application”, Fuzzy Sets and Systems,
vol.159, pp.968-989.
[31] Ho N. C., Khang T. D., Nam H. V., Chau N. H. (1999), “Hedge algebras,
linguistic–valued logic and their application to fuzzy reasoning”,
International Journal of Uncertainty, Fuzziness and Knowledge–Based
Systems, 7(4), pp. 347–361.
[32] Ho N. C., Nam H. V. (1999), “Ordered Structure-Based Semantics of
Linguistic Terms of Linguistic Variables and Approximate Reasoning”,
AIP Conf. Proc. on Computing Anticipatory Systems, CASYS’99, 3th
Inter. Conf., pp. 98–116.
[33] Ho N. C., Lan V. N. (2006), “Hedges Algebras: An algebraic approach
to domains of linguistic variables and their applicability”, ASEAN J. Sci.
Technol. Development, 23(1), pp. 1–18.
[34] Ho N. C. (2007), “A topological completion of refined hedge algebras
and a model of fuzziness of linguistic terms and hedges”, Fuzzy Sets and
Systems 158 (4), pp. 436–451.
[35] Ho N. C., Long N. V. (2007), “Fuzziness measure on complete hedge
algebras and quantifying semantics of terms in linear hedge algebras”,
Fuzzy Sets and Systems, 158(4), pp. 452–471.
[36] Huang K.Q., Wang Q., Wu Z.Y. (2006), “Natural color image
enhancement and evaluation algorithm based on human visual system”,
Comput. Vis. Image Underst, 103, pp. 52–63.
107
[37] Balasubramaniam Jayaram, Kakarla V.V.D.L. Narayana, V. Vetrivel,
“Fuzzy Inference System based Contrast Enhancement”, EUSFLAT-LFA
2011.011.
[38] John S., Hanmandlu M., Vasikarla S. (2005), “Fuzzy based arameterized
Guassian Edge Detector Using Global and Local Properties”,
International Conference on Information Technology, 02, pp. 101–106.
[39] Kim J-Y, Kim L-S, Hwang S.-H (2001), “An advanced contrast
enhancement using partially overlapped sub-block histogram equalization”,
IEEE Trans. Circuits Syst. Video Technol.11(4), pp:475–484.
[40] Kiszka J. B., Kochanska M. E., Sliwinska D. S. (1985), “The inference
of some fuzzy implication operators on the accuracy of a fuzzy model”,
Part I, Fuzzy Sets and Systems 15, pp. 111–128.
[41] Koczy L. T., Hirota K. (1993), “Interpolative reasoning with insufficient
evidence in sparse fuzzy rules bases”, Infor. Science 71, pp. 169–201.
[42] K. Singh, R. Kapoor (2014), "Image enhancement using exposure based
sub image histogram equalization", Pattern Recogn. Lett. 36, pp:10–14.
[43] K. Gu, G. Zhai, M. Liu, Q. Xu, X. Yang, and W. Zhang (2013),
"Brightness preserving video contrast enhancement using S-shaped
transfer function," in Proc. IEEE Vis. Commun. Image Process., pp. 1-6.
[44] K. Gu, G. Zhai, S. Wang, M. Liu, J. Zhou, and W. Lin (2015), "A general
histogram modification framework for efficient contrast enhancement," in
Proc. IEEE Int. Symp. Circuits and Syst., pp. 2816-2819.
[45] K. Gu, G. Zhai, W. Lin, and M. Liu (2016), "The analysis of image
contrast: From quality asessment to automatic enhancement," IEEE
Trans. Cybernetics, vol. 46, no. 1, pp. 284-297.
[46] Yu-Ren Lai, Kuo-Liang Chung, Chyou-Hwa Chen, Guei-Yin Lin, Chao-
Hsin Wang (2012), “Novel mean-shift based histogram equalization using
textured regions”, Expert Systems with Applications 39, pp:2750–2758.
108
[47] Yu-Ren Lai, Kuo-Liang Chung, Guei-Yin Lin, Chyou-Hwa Chen (2012),
“Gaussian mixture modeling of histograms for contrast enhancement”,
Expert Systems with Applications 39, pp:6720–6728.
[48] Yu-Ren Lai, Kuo-Liang Chung, Guei-Yin Lin, Chyou-Hwa ChenN
(2012), “Gaussian mixture modeling of histograms for contrast
enhancement”, Expert Systems with Applications 39, pp: 6720–6728.
[49] S. Lee (2007), “An efficient content-based image enhancement in the
compressed domain using Retinex theory”, IEEE Trans. Circuits and
Systems for Video Technology, vol. 17, no. 2, pp:199-213.
[50] Lior S.(2006), “Human Perception-based Color Segmentation Using
Fuzzy Logic”, IPCV, pp. 496-502.
[51] Manglesh K., Shweta S., Priya B. (2005), “An efficient algorithm for
Image Enhancement”, Indian Journal of Computer Science and
Engineering (IJCSE), pp. 118-123.
[52] Matinfar H.R., Sarmadian F., Alavi P. S.K., Heck R.J. (2007),
“Comparison of object-oriented and pixel-based classification on
Lansadsat7, Etm+ Spectral Bands (Case Study: Arid Region of Iran)”,
American-Eurasian J. Agric. & Environ, pp.448-456.
[53] Meshoul S., Batouche M. (2002), “Ant colony system with extremal
dynamics for point matching and pose estimation”, International
Conference on Pattern Recognition, pp. 823–826.
[54] Mizumoto M., Extended fuzzy reasoning (1985), “Approximately
reasoning in Expert systems”, Elsevier Science Publishers B. V, (North
Holland), pp. 71–85.
[55] Mizumoto M. (1985), “Fuzzy inference with “ifthenelse” under
new compositional rules of inference”, Management Decision Support
Systems Using Fuzzy Sets and Possibility Theory (ed. by J.Kacprzyk and
R.R.Yager), Verlag TUV Rheinland, W.Germany, pp. 229–239.
109
[56] M. Shakeri, M.H. Dezfoulian ∗, H. Khotanlou, A.H. Barati, Y. Masoumi
(2017), “Image contrast enhancement using fuzzy clustering with
adaptive cluster parameter and sub-histogram equalization”, Digital
Signal Processing 62, pp. 224-237
[57] Naik, S.K., Murthy, C.A. (2003), “Hue-preserving color image
enhancement without gamut problem”, IEEE Trans. Image Process.
12(12), pp.1591–1598.
[58] Nock, Richard (2004), "Statistical Region Merging" IEEE Transactions
on Pattern Analysis and Machine Intelligence, 26 (11), pp. 1–7.
[59] Om P. V., Puneet K., Hanmandlu M., Sidharth C. (2011), “High
dynamic range optimal fuzzy color image enhancement using Artificial
Ant Colony System”, Applied Soft Computing, pp. 394-404.
[60] Palanikumar S., Sasikumar M., J. Rajeesh (2012), “Entropy Optimized
Palmprint Enhancement Using Genetic Algorithm and Histogram
Equalization”, International Journal of Genetic Engineering, pp. 12-18.
[61] Ponomarenko N. Ponomarenko, L. Jin, O. Ieremeiev, V. Lukin, K.
Egiazarian, J. Astola, B. Vozel, K. Chehdi, M. Carli, F.Battisti, C.-C. Jay
Kuo (2015), “Image database TID2013: Peculiarities, results and
perspectives, Signal Processing”, Image Communication, vol. 30, pp.57-77
[62] Pei, S.C., Zeng, Y.C., Chang, C.H. (2004), “Virtual restoration of
ancient Chinese paintings using color contrast enhancement and Lacuna
texture synthesis”, IEEE Trans. Image Process. 13(3), pp. 416–429.
[63] Sarode M.K.V, Ladhake S.A., Deshmukh P.R. (2008), Fuzzy system for
color image enhancement, World Academy of Science, Engineering &
Technology, 48, pp. 311-316.
[64] M. J. Soha and A. A. Schwartz (1978), “Multi-dimensional histogram
normalization contrast enhancement,” in Proc. 5th Canada. Symp..
Remote Sensing, pp.86–93.
110
[65] Jaynes E.T. (1957), Information Theory and Statistical Mechanics,
Physical Review, pp. 620-630.
[66] Jean-Luc Starck, Fionn Murtagh, and David L. Donoho (2003), “Gray
and Color Image Contrast Enhancement by the Curvelet Transform”,
IEEE Transactions on Image Processing, Vol. 12, No. 6.
[67] Sheeba Jenifer, S.Parasuraman, Amudha Kadirvelu (2016), “Contrast
enhancement and brightness preserving of digital mammograms using
fuzzy clipped contrast-limited adaptive histogram equalization
algorithm”, Applied Soft Computing, Volume 42, pp.167-177
[68] Shen-Chuan Tai, Ting-Chou Tsai, Yi-Ying Chang, Wei-Ting Tsai and
Kuang-Hui Tang (2012), “Contrast Enhancement through Clustered
Histogram Equalization”, Research Journal of Applied Sciences,
Engineering and Technology 4(20), pp.3965-3968.
[69] Shi Y., Mizumoto M. (1997), “Reasoning conditions on Koczy’s
interpolative reasoning method in sparse fuzzy rules bases”, Part II,
Fuzzy Sets and Systems 87, pp. 47–56.
[70] Shi Y., Mizumoto M., Wu Z. Q. (1995), “Reasoning conditions on
Koczy’s interpolative reasoning methods in sparse fuzzy rules bases”,
Fuzzy Sets and Systems 75, pp. 63–71.
[71] Subba R. K., Raju C. N., and Maddala L. B. (2011), “Feature Extraction
for Image Classification and Analysis with Ant Colony Optimization
Using Fuzzy Logic Approach, Signal and image processing”, An
International Journal (SIPIJ), 2(4), pp.137-143.
[72] Sudhavani G., Srilakshmi M., Rao P. V. (2014), “Comparison of Fuzzy
Contrast Enhancement Techniques”, International Journal of Computer
Applications, Volume 95– No.22, pp.26-31.
[73] Tang B., Sapiro G., Caselles V. (2001), “Color image enhancement via
chromaticity diffusion”, IEEE Trans. Image Process., pp. 701–707.
111
[74] Tao C.W., Taur J.S., Jeng J.T., and Wang W.Y. (2009), “A Novel Fuzzy
Ant Colony System for Parameter Determination of Fuzzy Controllers”,
International Journal of Fuzzy Systems, 11(4), pp.298-307.
[75] Tizhoosh H. R., Fochem M., “Image Enhancement with Fuzzy
Histogram Hyperbolization”, Proceedings of EUFIT’95, vol. 3, 1995,
pp. 1695-1698.
[76] Wadud, M. A. A., Kabir, M. H., Dewan, M. A. A., & Chae, O. (2007),
“A dynamic histogram equalization for image contrast enhancement”,
IEEE Transactions on Consumer Electronics, 53(2), pp.593–600.
[77] Yager R. R. (1994), “Aggregation operators and fuzzy systems
modelling”, Fuzzy Sets and Systems 67, pp. 129–145.
[78] Yu D., Ma L. H., Lu H.Q. (2007), “Normalized SI correction for hue-
preserving color image enhancement”, International Conference on
Machine Learning and Cybernetics, pp. 1498–1503.
[79] Zadeh L. A. (1975), “The concept of linguistic variable and its
application to approximate reasoning”, Inform. Sci. 8, pp. 199–249.
[80] Zimmermann H.J. (1991), Fuzzy sets theory and its applications, 2nd
Ed., Kluwer Acad. Pub., USA.
112
PHỤ LỤC
A/ ĐẠI SỐ GIA TỬ
I. Chứng minh (AX, AY, Hint) là một HA-intensification
. 1 1
1 1
m
m
m
với ,m (0,1).
Thật vậy: Xét hàm
( ) 1 (1 ) 1 (1 )
m m
g m m
1 1
1 1 0
m mg
m
( ) (0 ) 0 0 1, 0 1g g m
Vậy 1 1
1 1
m
m
m
b. Nếu chọn sao cho 1 1
1 1
m
m
thì 1 1
1 1
m
< m
Khi đó x, < x 1, ta có
1 1
1 1
x m x
x m x
x, < x 1 và 1 1 1
1 1 1
m x x x
m x x x
x, 0 < x <
Thật vậy:
Ta chứng minh
1
1
ln
1
( )
1
ln
1
m x
m x
f x
x
x
là hàm giảm trên (0,1) khi 0 < m <1.
Do
2
1
21
1
m x
mm x
x m x
;
2
1
21
1
x
x
x x
2 2 21
2
2 2 2
2 1 1
1 ln 1 ln
1 11
ln 1 1
1
f x m x
m x m x
x x m xx
m x x
x
Xét 2 2 22
1 1
( ) 1 ln 1 ln
1 1
x m x
f x m x m x
x m x
,
2
( 0 ) 0f
2
1 1
2 ln ln
1 1
f x m x
m x m
x x m x
Do 0 <mx < x <1, 1 1 1ln ln ln
1 1 1
x m x m x
m
x m x m x
2
0
f
x
2
( ) 0f x x (0,1)
1
( )f x giảm trên (0,1) (đpcm)
Từ đó suy ra điều phải chứng minh.
113
B. MỘT SỐ KỸ THUẬT LIÊN QUAN ĐẾN XỬ LÝ ẢNH
I. Mô hình mầu
Mô hình màu là một mô hình toán học dùng để mô tả các màu sắc trong thực
tế đƣợc biểu diễn dƣới dạng số học. Trên thực tế có rất nhiều mô hình màu khác
nhau đƣợc mô hình để sử dụng vào những mục đích khác nhau. Trong bài này tôi
giới thiệu về ba mô hình màu cơ bản hay đƣợc nhắc tới và ứng dụng nhiều, đó là hệ
mô hình màu RGB, HSV và CMYK.
1.1. Mô hình màu RGB
RGB là mô hình màu rất phổ biến đƣợc dùng trong đồ họa máy tính và nhiều
thiết bị kĩ thuật số khác. Ý tƣởng chính của mô hình màu này là sự kết hợp của 3
màu sắc cơ bản: màu đỏ (R, Red), xanh lục (G, Green) và xanh lơ (B, Blue) để mô
tả tất cả các màu sắc khác.
Nếu nhƣ một ảnh số đƣợc mã hóa bằng 24bit, nghĩa là 8 bit cho kênh R, 8 bit
cho kênh G, 8 bit cho kênh B, thì mỗ kênh này màu này sẽ nhận giá trị từ 0-255.
Với mỗi giá trị khác nhau của các kênh màu kết hợp với nhau ta sẽ đƣợc một màu
khác nhau, nhƣ vậy ta sẽ có tổng cộng 255x255x255 = 1.66 triệu màu sắc. Ví dụ:
màu đen là sự kết hợp của các kênh màu (R, G, B) với giá trị tƣơng ứng (0, 0, 0)
màu trắng có giá trị (255, 255, 255), màu vàng có giá trị (255, 255, 0), màu tím đậm
có giá trị (64, 0, 128) ...Nếu ta dùng 16bit để mã hóa một kênh màu (48bit cho toàn
bộ 3 kênh màu) thì dải màu sẽ trãi rộng lên tới 3*2^16 = ... Một con số rất lớn.
Mô hình màu RGB
114
1.2. Mô hình màu CMYK
CMYK là mô hình màu đƣợc sử dụng phổ biến trong ngành công nghiệp in ấn.
Ý tƣởng cơ bản của hệ mô hình này là dùng 4 màu sắc cơ bản để phục vụ cho việc
pha trộn mực in. Trên thực tế, ngƣời ta dùng 3 màu là C=Cyan: xanh lơ, M =
Magenta: hồng xẫm, và Y = Yellow: vàng để biểu diễn các màu sắc khác nhau. Nếu
lấy màu hồng xẫm cộng với vàng sẽ ra màu đỏ, màu xẫm kết hợp với xanh lơ sẽ cho
xanh lam ... Sự kết hợp của 3 màu trên sẽ cho ra màu đen, tuy nhiên màu đen ở đây
không phải là đen tuyệt đối và thƣờng có độ tƣơng phản lớn, nên trong ngành in, để
tiết kiệm mực in ngƣời ta thêm vào màu đen để in những chi tiết có màu đen thay vì
phải kết hợp 3 màu sắc trên. Và nhƣ vậy ta có hệ màu CMYK. Chữ K ở đây là để kí
hiệu màu đen (Black), có lẽ chữ B đã đƣợc dùng để biểu diễn màu Blue nên ngƣời
ta lấy chữ cái cuối K để biểu diễn màu đen?
Nguyên lý làm việc của hệ màu này nhƣ sau: Trên một nền giấy trắng, khi mỗi
màu này đƣợc in lên sẽ loại bỏ dần đi thành phần màu trắng. Ba màu C, M, Y khác
nhau in theo những tỉ lệ khác nhau sẽ loại bỏ đi thành phần đó một cách khác nhau
và cuối cùng cho ta màu sắc cần in. Khi cần in màu đen, thay vì phải in cả 3 màu
ngƣời ta dùng màu đen để in lên. Nguyên lý này khác với nguyên lý làm việc của hệ
RGB ở chỗ hệ RGB là sự kết hợp của các thành phần màu, còn hệ CMYK là sự loại
bỏ lẫn nhau của các thành phần màu.
Mô hình màu CYMK
115
1.3. Mô hình màu HSV
HSV là mô hình màu đƣợc dùng nhiều trong việc chỉnh sửa ảnh, phân tích ảnh
và một phần của lĩnh vực thị giác máy tính. Hệ mô hình này dựa vào 3 thông số H =
Hue: màu sắc, S = Saturation: độ đậm đặc, sự bảo hòa, V = value: giá trị cƣờng độ
sáng để mô tả màu sắc.
Mô hình màu này thƣờng đƣợc biểu diễn dƣới dạng hình trụ hoặc hình nón.
Theo đó, đi theo vòng tròn từ 0 -360 độ là trƣờng biểu diễn màu sắc(Hue).
Trƣờng này bắt đầu từ màu đỏ đầu tiên (red primary) tới màu xanh lục đầu tiên
(green primary) nằm trong khoảng 0-120 độ, từ 120 - 240 độ là màu xanh lục tới
xanh lơ (green primary - blue primary). Từ 240 - 360 là từ màu đen tới lại màu đỏ.
Theo nhƣ cách biểu diễn mô hình màu theo hình trụ nhƣ trên, đi từ giá trị độ
sáng (V) đƣợc biểu diễn bằng cách đi từ dƣới đáy hình trụ lên và nằm trong khoảng
từ 0 -1. Ở đáy hình trụ V có giá trị là 0, là tối nhất và trên đỉnh hình trụ là độ sáng
lớn nhất (V = 1). Đi từ tâm hình trụ ra mặt trụ là giá trị bão hòa của màu sắc (S). S
có giá trị từ 0 - 1. 0 ứng với tâm hình trụ là chỗ mà màu sắc là nhạt nhất. S = 1 ở
ngoài mặt trụ, là nơi mà giá trị màu sắc là đậm đặc nhất.
Nhƣ vậy với mỗi giá trị (H, S, V) sẽ cho ta một màu sắc mà ở đó mô tả đầy đủ
thông tin về máu sắc, độ đậm đặc và độ sáng của màu đó.
1.4. Chuyển đổi từ RGB sang HSV
Hàm RGB_HSV_Conversion
H: Sắc độ màu [0-360] với màu đỏ tại điểm 0
116
S: Độ bão hòa [0-1]
V: Giá trị cƣờng độ sáng [0-1]
{
//Xác định giá trị cƣờng độ sáng
V= max(R,G,B)
//Xác định độ bão hòa
Temp= min(R,G,B)
If V=0 than
S= 0
Else
S= (V-Temp)/V
End
//Xác định sắc màu
IF s=0 THEN
H= Undefined
Else
Cr= (V-R)/(V-Temp);
Cg= (V-G)/(V-Temp);
Cb= (V-B)/(V-Temp);
// Màu nằm trong khoảng giữa vàng (Yellow) và đỏ tía (Magenta)
If R=V then
H= Cb-Cg
// Màu nằm trong khoảng giữa xanh tím (cyan) và vàng (yellow)
If G= V then
H= 2+Cr-Cb
// Màu nằm trong khoảng giữa đỏ tƣơi (magenta) và xanh (cyan)
If B=V then
H= 4+ Cg – Cr
H= 60*H // Chuyển sang độ
//Loại các giá trị âm
If H < 0 then
H= H+360
117
}
1.5. Chuyển đổi từ HSV sang RGB
Hàm HSV_RGB_Conversion()
H: Sắc độ màu [0-360] với màu đỏ tại điểm 0
S: Độ bão hòa [0-1]
V: Giá trị cƣờng độ sáng [0-1]
{
//Kiểm tra trƣờng hợp ánh sáng không màu
If S=0 then
If H=Undifined then
R= V
G= V
B= V
Endif
Else
If H=360 then
H= 0
Else
H= H/60
endif
I= Floor(H)
F= H-I
M= V*(1-S)
N= V*(1-S*F)
K= V*(1-S*(1-F))
//(R,G,B)=(V,K,M) R= V; C= K; B= M
If I=0 then
(R,G,B)=(V,K,M);
If I=1 then
(R,G,B)=(N,V,M);
If I=2 then
(R,G,B)=(M,V,K);
118
If I=3 then
(R,G,B)=(M,N,V);
If I=4 then
(R,G,B)=(K,M,V);
If I=5 then
(R,G,B)=(V,M,N);
}
II. Phép căn bằng lƣợc đồ xám của ảnh một kênh
Phép cân bằng lƣợc đồ xám của một kênh ảnh là phép biến đổi mức xám để lƣợc đồ
xám đƣợc hiệu chỉnh cân đối bằng nhau.
m in m ax m in m ax( , ) [ , ] 1 ,1 ( , ) [ , ] 1 ,1I I i j L L i M j N Ieq Ieq i j L L i M j N
m in
'
m in m a x m in
( ')
1, , 1, : ( , ) ( , )
g
I
d e f
g L
H is g
i M j N g I i j Ie q i j L L L
M N
, trong đó
( ) # { (i,j) ( , ) }
I
H is g I i j g , [x] ký hiệu là phần nguyên của số thực x.
(a) Ảnh gốc.
Ảnh sau khi cân bằng
Lƣợc đồ xám kênh R
Lƣợc đồ xám kênh R
119
Lƣợc đồ xám kênh G
Lƣợc đồ xám kênh G
Lƣợc đồ xám kênh B
Lƣợc đồ xám kênh B.
Hình A.1. Cân bằng lƣợc đồ xám áp dụng cho từng kênh của ảnh mầu
III. Các phƣơng pháp phát hiện biên ảnh trực tiếp
1. Kỹ thuật phát hiện biên Gradient
Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ
thay đổi giá trị của điểm ảnh, ta có:
Trong đó, dx, dy là khoảng cách (tính bằng số điểm) theo hƣớng x và y.
* Nhận xét:
Vì ảnh số là tín hiệu rời rạc nên khi tính toán chúng ta xấp xỉ đạo hàm
bằng các kỹ thuật nhân chập, chẳng hạn khi lấy dx = dy = 1 chúng ta xấp xỉ
Với dx = dy = 1, ta có:
dy
yxfdyyxf
fy
y
yxf
dx
yxfydxxf
fx
x
yxf
),(),(),(
),(),(),(
120
yxfyxf
y
f
yxfyxf
x
f
,1,
,,1
Do đó, mặt nạ nhân chập theo hƣớng x là A= 11 và hƣớng y là
B =
1
1
2. Kỹ thuật Prewitt
Kỹ thuật sử dụng 2 mặt nạ nhập chập xấp xỉ đạo hàm theo 2 hƣớng x
và y là:
Hx = (
), Hy = (
)
3. Kỹ thuật Sobel
Tƣơng tự nhƣ kỹ thuật Prewitt kỹ thuật Sobel sử dụng 2 mặt nạ nhân
chập theo 2 hƣớng x, y là:
Hx = (
), Hy = (
)
B/ LÝ THUYẾT TẬP MỜ
I. Định ngĩa toán tử t-norm
Định nghĩa toán tử t-norm [22]. Giả sử hàm số T:[0, 1] x [0, 1] [0, 1], T là một
t-norm nếu và chỉ nếu:
Với mọi x, y, z [0, 1]:
(1.1) T(x, y) = T(y, x) (giao hoán),
(1.2) T(x, y) T(x, z), nếu y z (đơn điệu),
(1.3) T(x, T(y, z)) = T(T(x, y), z) (kết hợp),
(1.4) T(x, 1 ) = x .
t-norm T gọi là thỏa mãn điều kiện Archimed, nếu
(1.5) T(x, y) là liên tục,
(1.6) T(x, x) < x x (0, 1).
Một t-norm thỏa mãn điều kiện Archimed thì
121
(1.7) T(x', y') < T(x, y), thì x ' <x, y' <y, x', y', x, y (0, 1).
II. Thuật toán phân cụm FCM
Thuật toán phân cụm mờ đƣợc Bezdek [2] đề xuất dựa trên độ thuộc ukj của
phần tử dữ liệu Xk từ cụm j. Hàm mục tiêu đƣợc xác định nhƣ sau:
2
1 1
m in
N C
m
kj j
k j
k
I VJ u
(12)
+ m là số mờ hóa
+ C là số cụm, N là số phần tử dữ liệu, r là số chiều của dữ liệu.
+ ukj là độ thuộc của phần tử dữ liệu Xk từ cụm j.
+ Xk ∈ R
r
là phẩn tử thứ k của X X1, X2, ..., X N .
+ Vj là tâm của cụm j.
Khi đó ràng buộc của (1) là:
1
1
C
k j
j
u
, [0 ,1]kju k 1, N
(2)
Sử dụng phƣơng pháp Lagrange, xác định đƣợc tâm của cụm dựa vào (3) và
độ thuộc dựa vào (4) từ hàm mục tiêu (1):
1
1
C
m
k j k
k
C
m
k j
k
j
u X
u
V
(3)
1
1
1
1
C
i
k j
m
k j
k i
u
VX
VX
Khi đó thuật toán Fuzzy C-means nhƣ sau:
Input: Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C;
mờ hóa m; ngƣỡng ; số lần lặp lớn nhất Maxstep
Ountput Ma trận U và tâm cụm V.
Bƣớc
1 t = 0
2 ( ) ; ( 1, ; 1, )t
k j
u ra n d o m k N j C thỏa mãn điều kiện (2)
3 Repeat
4 t = t + 1
5 Tính ( ) ; ( 1, )t
j
V j C bởi công thức (3)
6 Tính ( ) ; ( 1, ; 1, )t
k j
u k N j C theo công thức (4)
7
Until
( ) ( 1)t t
U U
hoặc t > Maxstep
122
C/ TẬP DỮ LIỆU ẢNH
I. Tập dữ liệu
#I01: Kích thƣớc 512x384
#I02: Kích thƣớc 512x384
#I03: Kích thƣớc 512x384, cũng ký hiệu là #3
#I04: Kích thƣớc 512x384, cũng ký hiệu là #5
#I05: Kích thƣớc 512x384
#I06: Kích thƣớc 512x384
#I07: Kích thƣớc 512x384, cũng ký hiệu là #4
#I08: Kích thƣớc 512x384
123
#I09: Kích thƣớc 512x384
#I10: Kích thƣớc 512x384
#I11: Kích thƣớc 512x384
#I12: Kích thƣớc 512x384
#I13: Kích thƣớc 512x384
#I14: Kích thƣớc 512x384
#I15: Kích thƣớc 512x384
#I16: Kích thƣớc 512x384
124
#I17: Kích thƣớc 512x384
#I18: Kích thƣớc 512x384
#I19: Kích thƣớc 512x384
#I20: Kích thƣớc 512x384
#I21: Kích thƣớc 512x384
#I22: Kích thƣớc 512x384
#I23: Kích thƣớc 512x384
#I24: Kích thƣớc 512x384
125
#6: Kích thƣớc 512x384
#2: Kích thƣớc 256x384
#1: Kích thƣớc 256x384