XÁC ĐỊNH KHUÔN MẶT NGƯỜI TRONG ẢNH MÀU BẰNG LOGIC MỜ
PHẠM THẾ BẢO
Trang nhan đề
Lời cam đoan
Lời cảm ơn
Lời nói đầu
Mục lục
Một số từ viết tắt
Chương 1:
Bài toán xác định khuôn mặt người
Chương 2:
Logic mờ và cơ sở toán học
Chương 3:
Xây dựng mô hình xác định khuôn mặt người bằng logic mờ
Chương 4:
Cài đặt, kết quả và kết luận
Tài liệu tham khảo
Danh mục các công trình
?Mục lục
Chương 1. Bài toán xác định khuôn mặt người 1
1. Giới thiệu . . 1
2. Khó khăn và thách thức của bài toán . 3
3. Mô hình màu da người . 4
4. Phương pháp xác định khuôn mặt người . . 9
5. Mục tiêu của đề tài . 27
5.1 Xây dựng ngưỡng phân đoạn . . 27
5.2 Dùng logic mờ để xác định khuôn mặt . . 28
5.3 Điều kiện của bài toán . . 29
Chương 2. Logic mờ và cơ sở toán học 30
1. Khái niệm ve^` logic mờ . . 30
2. Tập mờ . . 31
3. Luật mờ Nếu-thì . . 37
4. Suy diễn mờ . . 38
5. Giải mờ . 40
6. Logic mờ và lý thuyết xác suất . . 42
Chương 3. Xây dựng mô hình xác định khuôn mặt người bằng logic mờ 53
1. Xây dựng và phân tích mô hình da người . . 54
1.1. Xác định vùng ảnh ứng viên dựa trên mô hình màu da . . 54
1.2. Phân tích quan các hệ của giá trị trung bình . . 58
1.3. Nhiễu . . 62
2. Tiền xử lý . 66
2.1. Phân đoạn . 66
2.2. Lọc nhiễu . . 67
2.3. Tìm biên . . 69
3. Xây dựng logic mờ dựa trên quan hệ bên ngoài . . 71
3.1. Kích thước của vùng da . 72
3.2. Khi các khuôn mặt bị dính nhiễu . 72
3.3. Thông số chu vi . 73
3.4. Thông số diện tích . . 74
3.5. Độ tròn của khuôn mặt . . 75
3.6. Xây dựng luật mờ . 75
4. Xây dựng logic mờ dựa trên quan hệ giữa mắt và miệng . . 77
4.1. Tiêu chuẩn một điểm là các thành phần mắt miệng trong một
vùng da . 77
4.2. Xác định thành phần mắt-miệng . . 78
4.3. Xây dựng luật mờ . 89
5. Tách các khuôn mặt dính . 89
5.1. Xác định bán kính loang . . 90
5.2. Thuật toán xác định số nhóm và tách dính . 90
5.3. Xác định mức độ loang . . 90
Chương 4. Cài đặt, kết quả, và kết luận 95
1. Cài đặt . . 95
2. Kết quả . 99
3. Kết luận và hướng phát triển . . 107
TÀI LIỆU THAM KHẢO . . i
DANH SÁCH CÁC CÔNG TRÌNH . . x
Phụ lục A. Không gian màu . . xii
Phụ lục B. Phương pháp Fast Marching . .x viii
29 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 2675 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Xác định khuôn mặt người trong ảnh màu bằng logic mờ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
chuïp hình ñeå cho keát quaû hình aûnh ñeïp hôn, nhaát laø khuoân maët ngöôøi.
Nhaän daïng ngöôøi toäi phaïm giuùp cô quan an ninh quaûn lyù toát con ngöôøi.
Nhaän daïng trong moâi tröôøng bình thöôøng cuõng nhö trong boùng toái (söû duïng
camera hoàng ngoaïi). Theû caên cöôùc, chöùng minh nhaân daân (Face
Identification). An ninh saân bay, xuaát nhaäp caûnh (hieän nay cô quan xuaát
nhaäp caûnh Myõ ñaõ aùp duïng).
Cho pheùp nhaân vieân ñöôïc ra vaøo nôi caàn thieát, hay ñaêng nhaäp maùy tính caù
nhaân cuûa mình maø khoâng caàn nhôù teân ñaêng nhaäp cuõng nhö maät khaåu maø chæ
caàn xaùc thöïc thoâng qua khuoân maët.
3
Töông lai seõ phaùt trieån theû thoâng minh coù tích hôïp saün ñaëc tröng cuûa ngöôøi
duøng treân ñoù, khi söû duïng seõ ñöôïc yeâu caàu xaùc thöïc döïa treân khuoân maët.
Maëc duø ñaõ coù nhieàu keát quaû khaû quan nhöng ñaây laø baøi toaùn phöùc taïp neân
vaãn coøn khoù khaên vaø laø thaùch thöùc cho nhöõng ngöôøi nghieân cöùu keá tieáp.
2. Khoù khaên vaø thaùch thöùc cuûa baøi toaùn
Vieäc xaùc ñònh khuoân maët ngöôøi coù nhöõng khoù khaên vaø thaùch thöùc, hình 1.1,
nhaát ñònh nhö sau:
Höôùng cuûa khuoân maët ñoái vôùi maùy aûnh: nhìn thaúng, nhìn nghieâng hay nhìn
töø treân xuoáng. Cuøng trong moät aûnh coù theå coù nhieàu khuoân maët ôû nhöõng tö
theá khaùc nhau. Truïc toaï ñoä cuûa maùy aûnh so vôùi aûnh.
Xuaát hieän chi tieát khoâng phaûi laø ñaëc tröng rieâng cuûa khuoân maët: raâu quai
noùn, maét kính, …. Maët ngöôøi bò che khuaát bôûi caùc ñoái töôïng khaùc trong aûnh.
Caùc neùt maët khaùc nhau treân khuoân maët, nhö: vui, buoàn, ngaïc nhieân, ….
Khoâng xuaát hieän thaønh phaàn khuoân maët.
Ñieàu kieän aûnh, ñaëc bieät laø veà ñoä saùng vaø chaát löôïng aûnh, chaát löôïng thieát bò
thu hình. Kích thöôùc khaùc nhau cuûa caùc khuoân maët ngöôøi vaø ñaëc bieät laø
trong cuøng moät aûnh. Nhieàu khuoân maët coù vuøng da dính laãn nhau.
Maøu saéc cuûa moâi tröôøng xung quanh, hay maøu saéc quaàn aùo cuûa ngöôøi ñöôïc
chuïp laáy aûnh cuõng taùc ñoäng ñeán maøu saéc cuûa aûnh.
Caùc khoù khaên treân chöùng toû raèng baát cöù phöông phaùp giaûi quyeát (thuaät toaùn)
baøi toaùn xaùc ñònh khuoân maët ngöôøi seõ khoâng theå traùnh khoûi moät soá khieám khuyeát
nhaát ñònh. Ñeå ñaùnh giaù vaø so saùnh caùc phöông phaùp xaùc ñònh maët ngöôøi, ngöôøi ta
thöôøng döïa treân caùc tieâu chí sau:
4
Tyû leä xaùc ñònh chính xaùc laø tyû leä soá löôïng caùc khuoân maët ngöôøi ñöôïc xaùc
ñònh ñuùng töø heä thoáng khi söû duïng moät phöông phaùp ñeå xaây döïng so vôùi soá
löôïng khuoân maët ngöôøi thaät söï coù trong caùc aûnh.
Soá löôïng xaùc ñònh nhaàm laø soá löôïng vuøng trong aûnh khoâng phaûi laø khuoân
maët ngöôøi maø heä thoáng xaùc ñònh nhaàm laø khuoân maët ngöôøi.
Vôùi nhöõng khoù khaên ñaõ neâu ra, ta thaáy raèng vieäc giaûi quyeát baøi toaùn xaùc ñònh
khuoân maët ngöôøi khoâng ñôn giaûn. Hieän nay coù nhieàu phöông phaùp giaûi quyeát baøi
toaùn treân. Taát caû caùc nghieân cöùu baøi toaùn xaùc ñònh khuoân maët ngöôøi ñeàu söû duïng
aûnh xaùm hay aûnh maøu laøm döõ lieäu ñaàu vaøo. Aûnh xaùm cho pheùp giaûm thieåu taùc
ñoäng cuûa aùnh saùng ñeán ñoái töôïng, nhöng khoâng gian tìm kieám lôùn – treân toøan boä
aûnh – laøm thôøi gian xöû lyù cao vaø seõ gaëp vaán ñeà choïn löïa kích thöôùc cöûa soå ñeå doø
tìm caùc khuoân maët ngöôøi. Vôùi aûnh maøu, caùc phöông phaùp nghieân cöùu hieän nay
döïa treân caùc ñaëc tröng maøu da ngöôøi ñeå tìm öùng vieân vì theá khoâng giam tìm
kieám seõ thu heïp ñaùng keå, ñieàu naøy daãn ñeán thôøi gian xöû lyù seõ giaûm raát nhieàu vaø
kích thöôùc caùc öùng vieân coù saün neân khoâng gaëp vaán ñeà choïn löïa kích thöôùc cöûa soå,
nhöng neáu choïn aûnh maøu ñeå xöû lyù thì seõ gaëp taùc ñoäng cuûa aùnh saùng hoaëc moâi
tröôøng xung quanh taùc ñoäng ñeán maøu saéc cuûa caùc ñoái töôïng. Vì vaäy, tröôùc khi
trình baøy toång quan veà caùc phöông phaùp xaùc ñònh khuoân maët ngöôøi vaø caùc keát
quaû nghieân cöùu cuûa caùc nhaø khoa hoïc treân laõnh vöïc naøy, chuùng toâi trình baøy moät
soá khaùi nieäm cô baûn veà caùc moâ hình phaân boá maøu da ngöôøi.
3. Moâ hình maøu da ngöôøi
Muïc ñích chính cuûa baøi toaùn xaùc ñònh maøu da ngöôøi laø xaây döïng luaät ñeå
quyeát ñònh ñieåm aûnh naøo coù maøu laø da ngöôøi vaø ngöôïc laïi. Thoâng thöôøng ñeå giaûi
quyeát ñöôïc vaán ñeà treân, chuùng ta phaûi xaây döïng moät ñoä ño ñeå quyết định xem
một điểm ảnh có màu phù hợp với mô hình màu da người hay không.
5
(a) (b) (c)
(d) (e)
(f) (g)
Hình 1.1. Caùc khoù khaên cuûa vieäc xaùc ñònh maët ngöôøi:
(a) höôùng maët nghieâng; (b) maét kính ñen vaø noùn; (c) aûnh bò choùi bôûi aùnh ñeøn;
(d) maùy aûnh ñaët phía treân vaø sau löng ngöôøi bò chuïp;
(e) vuøng da caùc khuoân maët dính nhau;
(f) maøu ôû moâi tröôøng xung quanh gaàn vôùi maøu da ngöôøi;
(g) chaát löôïng aûnh keùm.
6
Ñoä ño ñôn giaûn chính laø ñieàu kieän bieân ñeå kieåm tra moät ñieåm aûnh coù coù theå
laø da ngöôøi hay khoâng [27], [49], [68] nhö coâng thöùc 1.1. Vôùi R, G, B laø ba keânh
maøu trong khoâng gian maøu RGB (xem phuï luïc A). Coù nhieàu nghieân cöùu theo
höôùng naøy, cho nhieàu keát quaû khaû quan nhö coâng thöùc 1.2 hay 1.3; với Y, Cb, Cr
là ba giá trị trong không gian màu YcbCr (xem phuï luïc A). Gaàn ñaây Filipe Tomaz
[18] vaø caùc coäng söï nghieân cöùu cho ñieàu kieän toát hôn coâng thöùc 1.1, coâng thöùc
1.2. Tuy nhieân, ñieàu kieän bieân khoâng hoaøn toaøn chính xaùc, maø coøn phuï thuoäc raát
nhieàu vaøo thieát bò, ñieàu kieän moâi tröôøng nhö: aùnh saùng, khung caûnh xung quanh,
ngöôøi ñöôïc laáy maãu thuoäc chuûng toäc gì, quaàn aùo ñang maëc, …. Neáu muoán ñoä
chính xaùc cao thì phaûi caøng nhieàu ñieàu kieän, neáu caøng nhieàu ñieàu kieän thì caøng
phöùc taïp khi tính toaùn, cuõng nhö döõ lieäu ñeå tìm ñieàu kieän phaûi caøng nhieàu caøng
toát neân khoâng gian löu tröõ seõ taêng nhieàu.
95 vaø 40 vaø B>20 vaø
max{R,G,B}-min{R,G,B}>15 vaø
R-G 15 vaø R>G vaø R>B
R G
(1.1)
(B>160 vaø R160 vaø R<180 vaø B<180) hay
(B200) hay (R+G>400) hay
(G>150 vaø B.40) hay (G/(R+G+B)>.40) hay
(R100 vaø B>110 vaø G<140 vaø B<160)
(1.2)
45 &&Y<252
Cb>-60 && Cb<10.3
Cr>10 && Cr<60
Y
(1.3)
Trong nghieân cöùu caùc moâ hình maøu da ngöôøi, caùc chuyeân gia ñöa ra ba loaïi
moâ hình cô baûn: moâ hình phaân boá maøu da khoâng tham soá, moâ hình phaân boá maøu
da coù tham soá vaø moâ hình hoãn hôïp.
Ñoái vôùi moâ hình phaân boá maøu da khoâng tham soá, yù töôûng chính laø öôùc löôïng
phaân boá maøu da töø döõ lieäu thu thaäp ñöôïc. Keát quaû ñoâi khi xem nhö xaây döïng aùnh
7
xaï xaùc suaát maøu da (Skin Probability Map - SPM) [35], [36], [68]. Vôùi moâ hình
naøy, coù theå söû duïng daïng baûng tra cöùu ñaõ ñöôïc chuaån hoùa [37] nhö coâng thöùc 1.4,
𝑃𝑠𝑘𝑖𝑛 𝑐 =
𝑠𝑘𝑖𝑛 [𝑐]
𝑁𝑜𝑟𝑚
(1.4)
vôùi skin[c] laø bieåu ñoà cuûa töøng keânh maøu cuûa khoâng gian maøu caàn xem xeùt,
töông öùng vector maøu c vaø Norm laø caùc giaù trò ñöôïc chuaån hoùa [41]; phaân loaïi
Bayes [47] döïa treân xaùc suaát ñieàu kieän P(skin|c) theo luaät Bayes (coâng thöùc 1.5)
töø giaù trò Pskin(c) ñaõ coù tröôùc [14], [37], [41]. Hay coøn ôû daïng khaùc nhö coâng thöùc
1.6, hoaëc coâng thöùc 1.7.
𝑃 𝑠𝑘𝑖𝑛 𝑐 =
𝑃 𝑐 𝑠𝑘𝑖𝑛 𝑃(𝑠𝑘𝑖𝑛 )
𝑃 𝑐 𝑠𝑘𝑖𝑛 𝑃 𝑠𝑘𝑖𝑛 +𝑃 𝑐 𝑠𝑘𝑖𝑛 𝑃(𝑠𝑘𝑖𝑛 )
(1.5)
𝑃 𝑠𝑘𝑖𝑛 𝑐
𝑃 𝑠𝑘𝑖𝑛 𝑐
=
𝑃 𝑐 𝑠𝑘𝑖𝑛 𝑃(𝑠𝑘𝑖𝑛 )
𝑃 𝑐 𝑠𝑘𝑖𝑛 𝑃(𝑠𝑘𝑖𝑛 )
(1.6)
𝑃 𝑐 𝑠𝑘𝑖𝑛
𝑃 𝑐 𝑠𝑘𝑖𝑛
> 𝜃
𝜃 = 𝐾
1−𝑃(𝑠𝑘𝑖𝑛 )
𝑃(𝑠𝑘𝑖𝑛 )
(1.7)
K seõ ñöôïc choïn ñeå phuø hôïp vôùi ; moâ hình aån (Hidden Markov Model –
HMM) ñöôïc Leonid [37] söû duïng ñeå ñieàu chænh caùc tham soá qua quaù trình hoïc;
hay aùnh xaï töï toå chöùc (Self-Organizing Map - SOM) do Kohonen ñeà xuaát vaøo
thaäp nieân 80, phöông phaùp SOM duøng ít döõ lieäu nhöng vaãn raát hieäu quaû [68].
Moâ hình phaân boá maøu da coù tham soá ñöôïc xaây döïng ñeå khaéc phuïc nhöôïc
ñieåm veà khoâng gian löu tröõ lôùn vaø hình thaùi cuûa döõ lieäu cuûa moâ hình phaân boá
maøu da khoâng coù tham soá [18], [26]. Moâ hình Gauss vôùi haøm maät ñoä xaùc suaát
(probability density function – pdf) ñöôïc duøng ñeå moâ hình hoùa phaân boá maøu da
ngöôøi döïa treân giaû thieát phaân boá maøu da ngöôøi gaàn gioáng phaân boá Gauss, coâng
thöùc 1.8 [11], [35], [47], [68]. Vôùi c laø vector maøu, s vaø s laø tham soá phaân boá.
Caùc tham soá ñöôïc öôùc löôïng töø döõ lieäu huaán luyeän baèng coâng thöùc 1.9, ñeå xaùc
ñònh maøu c coù phaûi laø maøu da ngöôøi hay khoâng döïa treân ma traän hieäp phöông sai,
8
coâng thöùc 1.10. Ñeå taêng ñoä chính xaùc, moâ hình Gauss hoãn hôïp (Gaussian
Mixture Model - GMM) ñöôïc duøng, moâ hình naøy ñöôïc toång quaùt hoùa töø moâ hình
Gauss nhö coâng thöùc 1.11, trong ñoù k laø soá löôïng caùc thaønh phaàn hoãn hôïp, i laø
caùc tham soá hoãn hôïp ñöôïc chuaån hoùa 𝜋𝑖
𝑘
𝑖=1 = 1 vaø Pi(c|skin) laø caùc pdf, vôùi
moãi moâ hình Gauss coù moät giaù trò trung bình vaø ma traän hieäp phöông sai cuûa
chính noù, thoâng thöôøng k coù giaù trò töø 2 cho ñeán 16 [68], nhö Phung [52], [63] vaø
Qiang Zhu [53].
𝑃 𝑐 𝑠𝑘𝑖𝑛 =
1
2𝜋 𝑠
1/2
𝑒−
1
2
𝑐−𝜇𝑠
𝑇 𝑐−𝜇𝑠
−1
𝑠
(1.8)
𝜇𝑠 =
1
𝑛
𝑐𝑗
𝑛
𝑗=1
𝑠 =
1
𝑛−1
𝑐𝑗 − 𝜇𝑠 𝑐𝑗 − 𝜇𝑠
𝑇𝑛
𝑗=1
(1.9)
𝑠 𝑐 = 𝑐 − 𝜇𝑠 𝑐 − 𝜇𝑠
𝑇−1
𝑠 (1.10)
𝑃 𝑐 𝑠𝑘𝑖𝑛 = 𝜋𝑖𝑃𝑖 𝑐 𝑠𝑘𝑖𝑛
𝑘
𝑖=1 (1.11)
Töø nhaän xeùt hình daùng ñieåm aûnh maøu da ngöôøi coù hình daïng gaàn nhö moät
hình ellipse vaø thaät söï khoâng theå duøng duy nhaát moät moâ hình Gauss ñeå xaáp xæ
moâ hình maøu da ngöôøi, Lee vaø Yoo ñaõ ñeà xuaát moâ hình bao daïng ellipse (Elliptic
Boundary Model), moâ hình naøy nhanh vaø ñôn giaûn nhö moâ hình Gauss ñôn giaûn
vaø GMM, ñoàng thôøi laïi cho keát quaû xaùc ñònh cao hôn treân cuøng cô sôû döõ lieäu cuûa
Compaq [68]. Moâ hình bao daïng ellipse ñöôïc ñònh nghóa nhö coâng thöùc 1.12.
𝑐 = 𝑐 − ∅ 𝑇−1 𝑐 − ∅ (1.12)
Tieán trình huaán luyeän cho heä thoáng goàm hai böôùc: ñaàu tieân, loaïi boû caùc maãu
huaán luyeän coù taàn soá thaáp ñeå loaïi boû bôùt nhieãu vaø döõ lieäu khoâng phuø hôïp. Sau ñoù
caùc tham soá cuûa moâ hình ( vaø ) ñöôïc tính theo coâng thöùc 1.13.
∅ =
1
𝑛
𝑐𝑖
𝑛
𝑖=1 =
1
𝑁
𝑓𝑖 . 𝑐𝑖 − 𝜇 𝑐𝑖 − 𝜇
𝑇𝑛
𝑖=1
𝜇 =
1
𝑁
𝑓𝑖 . 𝑐𝑖
𝑛
𝑖=1 𝑁 = 𝑓𝑖
𝑛
𝑖=1
(1.13)
9
Vôùi n laø toång soá caùc vector maøu rieâng bieät ci cuûa taäp ñieåm aûnh coù maøu da
ngöôøi duøng ñeå huaán luyeän vaø fi laø soá löôïng caùc maãu coù maøu da ngöôøi duøng huaán
luyeän cuøng maøu vôùi vector maøu ci, N chính laø toång soá maãu duøng ñeå huaán luyeän.
Ñoái vôùi moâ hình hoãn hôïp, caùc chuyeân gia keát hôïp nhieàu phöông phaùp hay
coâng cuï khaùc nhau ñeå giaûi quyeát. Theo [68], Kakumanu keát hôïp hai maïng nôron
coù hai lôùp aån, Mohamed Hammami duøng phöông phaùp khai khoaùng döõ lieäu tìm
luaät roài xaây döïng caây quyeát ñònh ñeå phaân loaïi, Huicheng Zheng söû duïng moâ hình
entropy cöïc ñaïi döïa treân phaân boá ôû bieân keát hôïp HMM. Moon Hwan Kim, Jin
Bae Park vaø Young Hoon Joo xaây döïng boä gom nhoùm môø vaø ñieàu khieån môø xaùc
ñònh vuøng maøu da ngöôøi döïa treân logic môø [44]. M. Ben Hmid [38] söû duïng boä
phaân loaïi môø ñeå phaân loaïi ñieåm aûnh naøo laø da ngöôøi vaø khoâng phaûi da ngöôøi
nhaèm hoaøn chænh caùc öùng sau giai ñoaïn phaân ñoaïn thoâ ban ñaàu. Nhoùm taùc giaû
Chia-Feng Juang [30] xaây döïng maïng nôron môø coù saùu taàng ñeå phaân ñoaïn maøu
da ngöôøi. Wong [62] duøng caây töù phaân ñeå phaân tích maøu da vaø xaây döïng moâ hình
maøu da.
Trong thöïc teá, phaân boá maøu da ngöôøi coù theå thay ñoåi do taùc ñoäng ñieàu kieän
aùnh saùng, camera, moâi tröôøng, …. Nhieàu taùc giaû ñaõ xaây döïng moâ hình maøu da coù
theå ñieàu chænh töï ñoäng baèng caùch caäp nhaät lieân tuïc khoâng chæ trong quaù trình
huaán luyeän maø caû trong quaù trình thöïc hieän – hoïc taêng cöôøng. Do phaûi caäp nhaät
lieân tuïc neân caùc moâ hình maøu da phaûi coù tham soá ñôn giaûn, xöû lyù nhanh vaø
khoâng gian löu tröõ ít.
4. Phöông phaùp xaùc ñònh khuoân maët ngöôøi
Coù nhieàu phöông phaùp xaùc ñònh khuoân maët ngöôøi, töø aûnh xaùm ñeán aûnh maøu.
Cuõng coù nhieàu caùch phaân loaïi caùc phöông phaùp ([42]), song vaãn chöa coù moät söï
phaân loaïi naøo thaät chính xaùc, vì caùc phöông phaùp khoâng hoaøn toaøn rieâng bieät.
10
Chuùng toâi seõ trình baøy moät caùch toång quaùt nhaát nhöõng höôùng giaûi quyeát chính,
khoâng trình baøy nhöõng phöông phaùp keát hôïp gaàn ñaây.
Döïa vaøo ñaëc ñieåm cuûa moãi phöông phaùp, chuùng toâi seõ trình baøy caùc phöông
phaùp theo hai höôùng tieáp caän: höôùng tieáp caän döïa treân tri thöùc döôùi daïng luaät vaø
höôùng tieáp caän döïa treân hoïc döõ lieäu maãu.
Höôùng tieáp caän döïa treân tri thöùc döôùi daïng luaät: trong höôùng tieáp caän naøy
caùc chuyeân gia seõ maõ hoùa nhöõng hieåu bieát cuûa con ngöôøi veà khuoân maët
thaønh luaät. Caùc luaät seõ phuï thuoäc raát lôùn vaøo tri thöùc cuûa nhöõng taùc giaû
nghieân cöùu veà baøi toaùn xaùc ñònh khuoân maët ngöôøi. Ñaây laø höôùng tieáp caän
daïng top-down. Trong höôùng naøy, coù nhöõng ñaëc tröng veà khuoân maët maø
chuùng ta coù saün töø nghieân cöùu y khoa hay nhaän xeùt tröïc quan cuûa con ngöôøi,
nhö moät khuoân maët thöôøng coù hai maét ñoái xöùng nhau qua truïc thaúng ñöùng ôû
giöõa khuoân maët, coù moät muõi, moät mieäng, chuùng toâi goïi laø nhöõng tri thöùc coù
saün. Vaø moät loaïi ñaëc tröng khaùc ñoù laø nhöõng ñaëc tröng do caùc taùc giaû
nghieân cöùu ñeà ra döïa treân caùc phaân tích aûnh.
Höôùng tieáp caän döïa treân hoïc döõ lieäu maãu: coù nhöõng hieåu bieát cuûa con
ngöôøi khoâng theå maõ hoùa thaønh luaät roõ raøng hay coù theå maõ hoùa nhöng khoâng
chính xaùc vì theá caùc chuyeân gia xaây döïng taäp maãu ñeå huaán luyeän heä thoáng
bieát choã naøo coù khuoân maët ngöôøi trong aûnh nhö caùch moät con ngöôøi coù theå
nhaän bieát theá giôùi xung quanh.
Khi tieáp caän theo höôùng thöù nhaát chuùng ta seõ gaëp moät vaán ñeà khaù phöùc taïp laø
laøm sao chuyeån töø tri thöùc con ngöôøi sang luaät hieäu quaû. Neáu luaät quaù chi tieát
(chaët cheõ) daãn ñeán coù theå xaùc ñònh thieáu caùc khuoân maët trong aûnh, vì nhöõng
khuoân maët naøy khoâng theå thoûa maõn taát caû luaät ñöa ra. Nhöng neáu luaät toång quaùt
quaù thì coù theå chuùng ta seõ xaùc ñònh sai moät vuøng khoâng phaûi laø khuoân maët maø laïi
xaùc ñònh laø khuoân maët. Vaø cuõng khoù khaên khi môû roäng töø baøi toaùn xaùc ñònh
11
khuoân maët ñöôïc laáy hình thaúng sang baøi toaùn xaùc ñònh khuoân maët ôû nhieàu tö theá
khaùc nhau. Theo [42], Graf duøng boä loïc ñeå laøm noåi caùc bieân keát hôïp pheùp toaùn
morphology laøm noåi baät caùc vuøng coù cöôøng ñoä cao vaø hình daùng chaéc chaén (nhö
maét) roài chuyeån aûnh xaùm thaønh aûnh nhò phaân vôùi caùc ngöôõng coù ñöôïc töø phaân
tích histogram, Sobottka vaø Pitas tìm öùng vieân khôùp hình daïng ellipse roài xem
xeùt treân cô sôû vuøng maét mieäng toái hôn caùc vuøng khaùc ñeå phaân loaïi. Nhoùm Sato
[24] laïi duøng phöông phaùp GA ñeå trích caùc ñaëc tröng khuoân maët, töø caùc ñaëc tröng
xem xeùt caùc vuøng gioáng ellipse ñeå xaùc ñònh khuoân maët trong aûnh maøu, phöông
phaùp naøy cho pheùp giaûi quyeát trong ñieàu kieän aùnh saùng khaùc nhau vaø tö theá
khuoân maët khaùc nhau. Fred [19] döïa treân tính ñoái xöùng cuûa khuoân maët ñeå xem
xeùt phaân boá treân histogram ñeå quyeát ñònh öùng vieân coù phaûi laø khuoân maët chuïp
thaúng trong aûnh xaùm ñôn. Rodrigues vaø Buf [28] quan taâm caùc ñieåm quan troïng
theo ña tyû leä, ñaëc bieät taùc giaû chæ duøng caùc ñieåm quan troïng döïa treân ña phaân
giaûi keát hôïp quan heä hình hoïc cuûa caùc thaønh phaàn khuoân maët ñeå xaùc ñònh khuoân
maët ngöôøi. Hsu [59] khaù thaønh coâng khi xaùc ñònh khuoân maët ngöôøi trong aûnh
maøu. OÂng xaây döïng boä phaân loaïi ñeå xaùc ñònh vò trí cuûa öùng vieân maét vaø mieäng
döïa treân saéc maøu ñaëc tröng cuûa maét vaø mieäng. Keát hôïp quan heä veà khoaûng caùch
hai maét vaø mieäng vaø hình daùng gaàn gioáng daïng ellipse nhaát ñeå xaùc ñònh.
Ngoaøi nhöõng tri thöùc maø chuùng ta ñaõ coù töø nhaän xeùt tröïc quan sô löôïc vaø phaân
tích y khoa, caùc chuyeân gia coá gaéng xaây döïng nhöõng ñaëc tröng môùi töø nhöõng
phaân tích aûnh veà khuoân maët ngöôøi. Theo [42], Yang vaø Huang söû duïng heä thoáng
ña phaân giaûi – hình 1.2 – roài döïa treân luaät ôû möùc cao nhaát ñeå tìm öùng vieân nhö:
“vuøng trung taâm khuoân maët (phaàn toái hôn, hình 1.3) coù boán phaàn”, “phaàn xung
quanh beân treân cuûa khuoân maët (phaàn saùng hôn, hình 1.3)” vaø “möùc ñoä khaùc nhau
giöõa giaù trò xaùm trung bình cuûa phaàn trung taâm vaø phaàn bao beân treân”, hai oâng
ñaõ duøng chieán löôïc “töø thoâ ñeán mòn” hay “laøm roõ daàn” ñeå giaûm soá löôïng tính
12
toaùn. Maëc duø tyû leä chính xaùc chöa cao, nhöng ñaây laø tieàn ñeà cho nhieàu nghieân
cöùu sau naøy. Theo [42], Kotropoulos vaø Pitas ñöa moät phöông phaùp töông töï
Kanade vaø Yang, caùc taùc giaû döïa treân bieåu ñoà chieáu ngang vaø doïc roài xem xeùt
caùc cöïc tieåu ñòa phöông ñeå bieát caïnh beân traùi vaø phaûi cuûa hai beân ñaàu vaø vò trí
mieäng, ñænh muõi vaø hai maét, hình 1.4.a. Phöông phaùp naøy khoù xaùc ñònh khi hình
neàn phöùc taïp vaø khoâng xaùc ñònh ñöôïc khi coù nhieàu khuoân maët xuaát hieän trong
aûnh, hình 1.4.b vaø 1.4.c. Töông töï Mateos vaø coäng söï [21] cuõng duøng phöông
phaùp chieáu, nhöng ñaàu tieân hai oâng tìm öùng vieân trong aûnh maøu roài chieáu tìm
thaønh phaàn khuoân maët ñeå xaùc ñònh khuoân maët, hình 1.5. Theo [42], coù nhieàu
chuyeân gia söû duïng phöông phaùp tìm caïnh roài xaây döïng phöông phaùp xaùc ñònh
khuoân maët döïa treân caïnh nhö: Amit sau khi trích caïnh seõ ñaùnh soá caùc maûnh caïnh
roài xaây döïng caây phaân loaïi ñeå xaùc ñònh, Sirohey loaïi boû caùc caïnh ñeå coøn laïi duy
nhaát moät ñöôøng bao xung quanh khuoân maët vaø neáu ñöôøng bao naøy coù hình daùng
epplise thì ñaây laø khuoân maët, coøn Chetverikov vaø Lerch duøng phöông phaùp döïa
treân blob vaø streak (hình daïng gioït nöôùc vaø soïc xen keõ) ñeå xaùc ñònh theo höôùng
caùc caïnh vôùi hai blob toái vaø ba blob saùng ñeå moâ taû hai maét, hai beân goø maùvaø muõi
vaø caùc treak ñeå moâ taû hình daùng ngoaøi cuûa khuoân maët, loâng maøy vaø moâi. Nhoùm
taùc giaû Mohamed A. Berbar [43] keát hôïp phaân ñoaïn vaø taùch caïnh ñeå tìm öùng
vieân sau ñoù chieáu leân truïc ngang vaø ñöùng ñeå xaùc ñònh caùc thaønh phaàn khuoân maët.
Hình 1.2. (a) AÛnh ban ñaàu coù ñoä phaân giaûi n=1;
(b), (c) vaø (d) AÛnh coù ñoä phaân giaûi n=4, 8 vaø 16.
Theo [42], Leung duøng moâ hình xaùc suaát ñeå xaùc ñònh khuoân maët trong aûnh coù
neàn phöùc taïp döïa treân boä xaùc ñònh ñaëc tröng cuïc boä vaø so khôùp ñoà thò ngaãu nhieân.
13
OÂng xem baøi toaùn xaùc ñònh khuoân maët nhö baøi toaùn tìm kieám vôùi naêm ñaëc tröng
(hai maét, hai loã muõi, phaàn noái giöõa muõi vaø mieäng) ñeå moâ taû moät khuoân maët.
Gioáng nhö xaây döïng moät ñoà thò quan heä, moãi node cuûa ñoà thò töông öùng nhö ñaëc
tröng cuûa moät khuoân maët coù xaùc suaát ñeå xaùc ñònh.
Hình 1.3. Moät loaïi tri tröùc cuûa ngöôøi nghieân cöùu phaân tích treân khuoân maët.
Christian vaø Jonh [10] xaây döïng moät loaïi ñaëc tröng môùi, ñoù laø ñaëc tröng ñoä
cong cuûa caùc ñöôøng treân khuoân maët ñeå giaûi quyeát vaán ñeà aùnh saùng. Hai oâng
duøng PCA (phaân tích thaønh phaàn chính – Principal Component Analysis - PCA)
vôùi ñaëc tröng cong ñeå xaùc ñònh khuoân maët.
Hình 1.4. Phöông phaùp chieáu: (a) AÛnh chæ coù moät khuoân maët vaø hình neàn ñôn giaûn;
(b) AÛnh chæ coù moät khuoân maët vaø hình neàn phöùc taïp;
(c) AÛnh coù nhieàu khuoân maët.
Theo [42], Yachida duøng hai moâ hình môø ñeå moâ taû phaân boá maøu da ngöôøi vaø
maøu toùc trong khoâng gian maøu CIE XYZ. Naêm moâ hình hình daïng cuûa ñaàu (moät
thaúng vaø boán xoay xung quanh) ñeå moâ taû hình daùng cuûa maët trong aûnh. Hai thuoäc
tính ñöôïc gaùn cho moãi oâ laø: tyû leä maøu da vaø tyû leä toùc, cho tyû leä dieän tích vuøng da
(toùc) trong oâ so vôùi dieän tích cuûa oâ. Moãi ñieåm aûnh ñöôïc phaân loaïi thaønh toùc,
khuoân maët, toùc/khuoân maët vaø toùc/neàn döïa vaøo phaân boá, ñeåõ coù caùc vuøng gioáng
14
khuoân maët vaø gioáng toùc keát hôïp caùc ñaëc tröng maét-loâng maøy vaø muõi-mieäng ñeå
xaùc ñònh öùng vieân naøo seõ laø khuoân maët thaät söï.
Khi tieáp caän theo höôùng thöù hai, caùc chuyeân gia söû duïng caùc kyõ thuaät hoïc ñeå
xaùc ñònh khuoân maët. Keát caáu khuoân con ngöôøi rieâng bieät coù theå xem laø ñaëc tröng
ñeå phaân loaïi vôùi ñoái töôïng khaùc. Caùc chuyeân gia seõ xaây döïng caùc heä thoáng ñeå
tìm ra keát caáu roài döïa vaøo ñaây ñeå xaùc ñònh khuoân maët. Theo [42], Augusteijn vaø
Skufca tính keát caáu döïa vaøo ñaëc tröng thoáng keâ treân vuøng. Huaán luyeän ba loaïi
ñaëc tröng: maøu da, toùc vaø nhöõng thöù khaùc cho maïng nôron vôùi moái töông quan
cascade ñeå phaân loaïi caùc keát caáu cuøng aùnh xaï Kohonen gom nhoùm caùc lôùp keát
caáu khaùc nhau, duøng phöông phaùp baàu cöû khi khoâng coù ñöôïc quyeát ñònh. Manian
vaø Ross [67] duøng bieán ñoåi wavelet xaây döïng döõ lieäu keát caáu khuoân maët trong
aûnh xaùm vôùi ña phaân giaûi keát hôïp xaùc suaát thoâng keâ ñeå xaùc ñònh khuoân maët.
Theo [42], Dai vaø Nakano duøng moâ hình SGLD ñeå xaùc ñònh khuoân maët döïa vaøo
thoâng tin maøu vaø moâ hình keát caáu khuoân maët. Hai taùc giaû duøng caùc phaàn töïa maøu
cam ñeå tìm öùng vieân. Moät thuaän lôïi cuûa phöông phaùp naøy laø coù theå xaùc ñònh
khuoân maët khoâng chæ chuïp thaúng vaø coù theå coù raâu vaø coù ñeo kính.
Hình 1.5. Chieáu töøng phaàn öùng vieân ñeå xaùc ñònh khuoân maët.
Moät soá chuyeân gia xaây döïng caùc maãu chuaån cuûa khuoân maët sau ñoù duøng
phöông phaùp so khôùp maãu ñeå xaùc ñònh khuoân maët. Töø aûnh ñöa vaøo, tính caùc giaù
trò töông quan so vôùi caùc maãu chuaån veà ñöôøng vieàn khuoân maët, maét, muõi vaø
mieäng. Töø caùc giaù trò töông quan naøy ñeå quyeát ñònh coù toàn taïi hay khoâng khuoân
15
maët trong aûnh. Höôùng tieáp caän naøy coù lôïi theá laø raát deã caøi ñaët, nhöng khoâng hieäu
quaû khi tyû leä, tö theá vaø hình daùng thay ñoåi [6], [34].
Theo [42], Sakai duøng maãu con veà maét, muõi, mieäng vaø ñöôøng vieàn khuoân
maët ñeå moâ hình hoùa moät khuoân maët. OÂng söû duïng gradient trích caùc ñöôøng thaúng
thuoäc öùng vieân döïa vaøo moái töông quan veà ñöôøng vieàn vaø so khôùp caùc maãu con
ñeå xaùc ñònh coù toàn taïi hay khoâng khuoân maët. Theo [42], Tsukamoto chia moãi aûnh
maãu thaønh nhieàu khoái vaø öôùc löôïng theo moãi khoái. Tham soá hoùa moät maãu khuoân
maët theo: lightness vaø edgeness laø ñaëc tröng cuûa moâ hình. Döïa vaøo giaù trò
faceness (möùc ñoä laø khuoân maët) ñöôïc tính töø caùc khoái trong maãu ñeå xaùc ñònh
khuoân maët. Hình chieáu [21], [65] ñöôïc duøng nhö maãu ñeå xaùc ñònh khuoân maët.
Tìm taäp hình chieáu cô baûn baèng PCA töø maãu khuoân maët. Keát hôïp ñaëc tröng hình
chieáu rieâng vaø bieán ñoåi Hough ñeå xaùc ñònh khuoân maët. Theo [42], Sinha xem xeùt
ñoä toái saùng khaùc nhau cuûa caùc vuøng khaùc nhau treân khuoân maët (nhö hai maét, hai
maù vaø traùn) ñeå xaây döïng 23 quan heä, hình 1.6, trong ñoù coù 11 quan heä thieát yeáu
(caùc muõi teân maøu ñen) vaø 12 quan heä xaùc thöïc (caùc muõi teân xaùm) ñeå phaân loaïi.
Iwata [32] xaây döïng maãu goàm boán ñaëc tröng theo boán höôùng: ngang, beân phaûi
phía treân, ñöùng vaø beân traùi phía treân cuûa khuoân maët chuïp thaúng trong aûnh xaùm.
So khôùp töøng phaàn cuûa maãu keát hôïp xaùc suaát laùng gieàng. Theo [42], Miao ñeà
xuaát so khôùp maãu coù thöù töï ñeå xaùc ñònh khuoân maët ngöôøi, aûnh ñöôïc xoay töø -20
o
ñeán 20
o
vôùi moãi böôùc laø 5
o
theo thöù töï, keát hôïp ña phaân giaûi, hình 1.2 vaø pheùp
toaùn Laplace ñeå tìm caùc caïnh. Moät maãu khuoân maët goàm caùc caïnh moâ taû saùu
thaønh phaàn: hai loâng maøy, hai maét, moät muõi vaø moät mieäng.
Theo [42], Lam vaø Yan duøng ñöôøng gaáp khuùc (snake) coù n ñieåm aûnh ñeå öôùc
löôïng caùc ñoaïn cong nhoû vaø maãu ñeå xaùc ñònh khuoân maët. Thay vì duøng ñöôøng
gaáp khuùc thì Huang vaø Su [20] duøng lyù thuyeát doøng chaûy ñeå xaùc ñònh ñöôøng vieàn
khuoân maët döïa treân ñaëc tính hình hoïc. Hai oâng duøng lyù thuyeát taäp ñoàng möùc
16
loang ñeå coù khuoân maët. Theo [42], Lanitis gaùn nhaõn ñöôøng bao maét, muõi,
caèm/maù, xaây döïng vector moâ taû hình daùng keát hôïp moâ hình phaân boá ñieåm (Point
Distribution Model – PDM) ñeå moâ taû vector hình daùng qua toaøn boä caùc caù theå,
coøn Kirby vaø Sirovich xaùc thöïc khuoân maët döïa vaøo moâ hình hình daùng tích cöïc
(Active Shape Model - ASM) vôùi tham soá veà hình daùng vaø cöôøng ñoä. Hsu vaø Jain
[58] xaây döïng ngöõ nghóa khuoân maët theo hình daùng vaø vò trí caùc thaønh phaàn
khuoân maët. Xaây döïng moät ñoà thò quan heä töø boä ngöõ nghóa ñeå deã daøng so khôùp
khi xaùc ñònh khuoân maët ngöôøi.
Keren [13] xaây döïng khaùi nieäm Antifaces ñeå xaùc ñònh khuoân maët ngöôøi. Döïa
treân nhieàu loaïi maãu, keát hôïp giaû thuyeát phaân boá xaùc suaát xaùc ñònh nhöõng ñoái
töôïng khoâng coù moái töông quan ñeå tìm khuoân maët ngöôøi. OÂng cho bieát, phöông
phaùp naøy nhanh hôn eigenface vaø SVM (Support Vector Machine), maø möùc ñoä
chính xaùc gaàn töông ñöông.
Hình 1.6. Moät maãu khuoân maët, coù 16 vuøng vaø 23 quan heä (caùc muõi teân).
Moät soá phöông phaùp hoïc tieâu bieåu ñöôïc duøng ñeå huaán luyeän heä thoáng xaùc
ñònh khuoân maët ngöôøi nhö: egienface, döïa treân phaân boá, maïng nôron, SVM,
phaân loaïi Bayes, moâ hình Markov aån, lyù thuyeát thoâng tin, hoïc theo quy naïp,
AdaBoost, phaân loaïi döïa treân cuù phaùp, phaân loaïi döïa treân loaïi boû.
Theo [42], Kirby vaø Sirovich maõ hoùa tuyeán tính aûnh caùc khuoân maët baèng moät
soá löôïng vöøa phaûi caùc aûnh cô sôû hay vector cô sôû (coøn bieát vôùi teân aûnh rieâng hay
eigenface), tính chaát naøy döïa treân bieán ñoåi Karhunen-Loøeve, coøn ñöôïc goïi döôùi
17
teân khaùc laø PCA hay bieán ñoåi Hotelling. YÙ töôûng naøy ñöôïc xem laø cuûa Pearson
trình baøy ñaàu tieân vaøo naêm 1901 vaø sau ñoù laø Hotelling vaøo naêm 1933.
Theo [42], Sung vaø Poggio xaây döïng caùc maãu negative vaø positive laø caùc
maãu laø khuoân maët/khoâng phaûi khuoân maët roài xaùc ñònh phaân boá cuûa caùc maãu (moãi
maãu laø moät vector coù 361 chieàu) ñeå gom nhoùm caùc maãu (moãi nhoùm seõ coù saùu
maãu cuøng loaïi) baèng thuaät toaùn k-trung bình (k-mean); hình 1.7; keát hôïp ñoä ño
Mahalanobis vaø Euclide; hình 1.8; xem xeùt maãu thuoäc nhoùm naøo, Moghaddam
vaø Pentland xem xeùt moâ hình hoïc theo xaùc suaát döïa treân öôùc löôïng maät ñoä trong
khoâng gian coù soá chieàu baèng soá chieàu khoâng gian rieâng; hai oâng phaân raõ moät
khoâng gian vector thaønh hai khoâng gian con, hai khoâng gian con naøy loaïi tröø laãn
nhau vaø cuõng boå sung cho nhau: khoâng gian con chính (khoâng gian ñaëc tröng) vaø
phaàn buø tröïc giao; hình 1.9, coøn Yang duøng phöông phaùp phaân tích heä soá (Factor
Analysis – FA), FA töông töï PCA ôû vaøi khía caïnh; nhöng PCA khoâng gioáng FA
vaø PCA khoâng hieäu quaû khi coù nhieãu ñoäc laäp trong döõ, phöông phaùp duøng bieät soá
tuyeán tính Fisher (Fisher’s Linear Discriminant – FLD); treân cô sôû phaân tích bieät
soá tuyeán tính caùc taùc giaû ñaõ xaây döïng phöông phaùp Fisherface; khi duøng FLD ñeå
phaân loaïi maãu seõ toát hôn PCA keát hôïp phaân raõ caùc maãu huaán luyeän khuoân maët
vaø khoâng phaûi khuoân maët vaøo vaøi lôùp con baèng aùnh xaï töï toå chöùc Kohonen
(Kohonen’s Self Organizing Map – SOM); hình 1.8.
Hình 1.7. Phaân nhoùm döõ lieäu khuoân maët vaø nhoùm döõ lieäu khoâng phaûi khuoân maët.
18
Moät thuaän lôïi khi duøng maïng nôron ñeå xaùc ñònh khuoân maët laø tính khaû thi cuûa
heä thoáng hoïc khi coù söï phöùc taïp trong lôùp caùc maãu khuoân maët. Nhöng trôû ngaïi laø
caùc kieán truùc maïng ñeàu toång quaùt, khi aùp duïng thì phaûi xaùc ñònh roõ raøng soá löôïng
taàng, soá löôïng node, tyû leä hoïc, …, cho töøng tröôøng hôïp cuï theå. Theo [42] coù nhieàu
nghieân cöùu theo höôùng naøy nhö: Agui duøng maïng nôron coù thöù töï vôùi hai maïng
con song song maø döõ lieäu laø giaù trò cöôøng ñoä cuûa döïa treân thuaät toaùn loïc Sobel
ñeå coù caùc giaù trò ñaëc tröng: ñaëc tröng ñoä leäch chuaån cuûa caùc giaù trò ñieåm aûnh
trong maãu ñöa vaøo, moät tyû leä cuûa soá ñieåm aûnh traéng treân toång soá ñieåm aûnh (aûnh
nhò phaân) trong moät cöûa soå vaø ñaëc tröng thieát yeáu veà hình hoïc, qua kinh nghieäm
taùc giaû chæ ra raèng neáu caùc aûnh cuøng moät kích thöôùc thì môùi duøng phöông phaùp
naøy ñöôïc. Lin duøng maïng nôron quyeát ñònh treân cô sôû xaùc suaát (Probabilistic
Decision-based Neural Network – PDBNN) vôùi vector ñaëc tröng döïa treân cöôøng
ñoä vaø thoâng tin caïnh trong vuøng khuoân maët chöùa loâng maøy, maét vaø muõi.
Hình 1.8. (a) Khoaûng caùch giöõa maãu caàn kieåm tra vaø caùc nhoùm;
(b) hai thaønh phaàn khoaûng caùch.
Nghieân cöùu cuûa Rowley laø toát nhaát khi so saùnh vôùi caùc phöông phaùp duøng
maïng nôron ñeå xaùc ñònh khuoân maët ngöôøi ñoái vôùi aûnh xaùm, hình 1.11, maïng ña
taàng ñöôïc duøng ñeå hoïc caùc maãu khuoân maët vaø khoâng phaûi khuoân maët (döïa treân
quan heä cöôøng ñoä, veà maët khoâng gian cuûa caùc ñieåm aûnh), phöông phaùp naøy chæ
coù theå xaùc ñònh khuoân maët chuïp thaúng vaø töïa thaúng. Sau ñoù Rowley caûi tieán ñeå
coù theå xaùc ñònh khuoân maët bò xoay baèng maïng ñònh höôùng, hình 1.12, theâm tieán
19
trình xaùc ñònh höôùng khuoân maët vaø xoay veà laïi tö theá chuaån (chuïp thaúng), tuy
nhieân khi quay laïi döõ lieäu thì tyû leä chính xaùc laïi giaûm ñi, chæ coøn khoaûng 76.9%.
Hình 1.9. Phaân raõ moät aûnh khuoân maët vaøo khoâng gian chính F
vaø phaàn buø tröïc giao
F
.
Nhieàu chuyeân gia duøng maïng nôron nhöng caûi tieán phöông phaùp trích ñaëc
tröng nhö: Kwolek [7] duøng boä loïc Gabor ñeå trích ñaëc tröng roài huaán luyeän cho
maïng nôron xoaén (maïng nôron xoaén laø maïng nôron maø moãi node ôû moãi taàng coù
theå lieân keát vôùi caùc laùng gieàng cuïc boä taàng phía tröôùc cuûa noù), Feris [61] duøng
bieán ñoåi wavelet ñeå xem xeùt caùc ñaëc tröng.
Hình 1.10. Ñaïi dieän cuûa moãi lôùp khuoân maët,
moãi ñaïi dieän töông öùng taâm cuûa moät nhoùm.
Hình 1.11. Moâ hình maïng nôron theo Rowley.
20
Haàu heát caùc phöông phaùp huaán luyeän ñeå phaân loaïi khaùc ñeàu duøng tieâu chí toái
thieåu loãi huaán luyeän (ruûi ro do kinh nghieäm) thì SVM duøng quy naïp (ñöôïc goïi laø
toái thieåu ruûi ro caáu truùc), muïc tieâu laø laøm toái thieåu bao beân treân loãi toång quaùt. YÙ
töôûng chính laø duøng moät sieâu phaúng ñeå taùch döõ lieäu, vieäc öôùc löôïng sieâu phaúng
seõ töông ñöông giaûi baøi toaùn tuyeán tính baäc hai. Theo [42], Osuna laø taùc giaû ñaàu
tieân aùp duïng phöông phaùp SVM ñeå giaûi quyeát baøi toaùn xaùc ñònh khuoân maët
ngöôøi. Julien xaây döïng moät caáu truùc SVM môùi, goàm nhieàu SVM keát noái song
song vôùi nhau ñeå hoïc döõ lieäu töø khoâng gian eigenface [31]. Döïa treân phöông
phaùp SVM, moãi chuyeân gia seõ ñeà xuaát moät phöông phaùp trích ñaëc tröng ñeå phaân
loaïi nhö: bieán ñoåi wavelet Gabor, ñoä phaân giaûi thaáp, caùc moâ men Fourier-Mellin
tröïc giao, wavelet phaân tích maãu, histogram, .... Ngoaøi ra SVM coøn ñöôïc thuaät
toaùn leo ñoài, phöông phaùp baàu cöû, … ñeå xaùc ñònh khuoân maët ngöôøi.
Hình 1.12. Moät ví duï cho döõ lieäu vaøo vaø döõ lieäu ra cuûa maïng ñònh höôùng.
Theo [42], Schneiderman vaø Kanade duøng phaân loaïi Naive Bayes öôùc löôïng
xaùc suaát ñeå noái dieän maïo taïi vò trí cuïc boä treân khuoân maët vaø vò trí cuûa caùc maãu
khuoân maët (caùc vuøng con treân khuoân maët) trong ña phaân giaûi; taïi moãi tyû leä khuoân
maët ñöôïc phaân raõ laøm boán vuøng hình chöõ nhaät con; chieáu caùc vuøng naøy xuoáng
khoâng gian coù soá chieàu thaáp hôn (duøng PCA) vaø löôïng töû hoùa thaønh moät taäp caùc
maãu coù giôùi haïn roài öôùc löôïng baèng thoáng keâ; höôùng tieáp caän naøy cho pheùp xaùc
ñònh caùc khuoân maët bò xoay vaø nhìn nghieâng, Rickert cuõng duøng caùc ñaëc tröng
21
cuïc boä roài tìm phaân boá cuûa caùc vector ñaëc tröng baèng phöông phaùp gom nhoùm vaø
Gauss hoãn hôïp sau ñoù tính khaû naêng cuûa vector ñaëc tröng ñeå phaân loaïi.
Thang [66] duøng maïng Bayes keát hôïp, hay goïi laø maïng Bayes coù caáu truùc
röøng (Forest-Structured Bayesian Network) ñeå xaùc ñònh caùc bieät soá. Keát hôïp
phöông phaùp Bagging xaây döïng phaân loaïi tích hôïp nhaèm xaùc ñònh khuoân maët
trong aûnh xaùm. Nam vaø Rhee [39] xaây döïng maïng Bayes hoïc phaân loaïi theo ngöõ
caûnh: maøu da, aùnh saùng vaø keát caáu khuoân maët ñeå xaùc ñònh khuoân maët trong aûnh.
Hai taùc giaû duøng phaân loaïi Bayes ñeå choïn öùng vieân thoâng qua caùc ñaëc tröng veà
cöôøng ñoä vaø keát caáu cuûa khuoân maët. Duy Nguyen [15] duøng boä loïc Sobel tìm caùc
ñaëc tröng cho Naive Bayse nhö Schneiderman vaø Kanade vaø keát hôïp ñoàng thôøi
vôùi moät phöông phaùp xaùc ñònh moâi.
Giaû thuyeát quan troïng cuûa HMM laø maãu coù theå ñöôïc ñaëc tính hoùa nhö caùc
tieán trình ngaãu nhieân coù tham soá vaø tham soá naøy ñöôïc öôùc löôïng chính xaùc. Khi
duøng HMM giaûi quyeát baøi toaùn nhaän daïng maãu, phaûi xaùc ñònh roõ coù bao nhieâu
traïng thaùi aån ñaàu tieân cho moâ hình. Phaûi huaán luyeän HMM hoïc xaùc suaát chuyeån
traïng thaùi töø maãu, moãi maãu ñöôïc moâ taû nhö moät chuoãi caùc quan saùt. Muïc tieâu
huaán luyeän HMM laø cöïc ñaïi hoùa xaùc suaát cuûa quan saùt töø döõ lieäu huaán luyeän
baèng caùch ñieàu chænh caùc tham soá trong moâ hình HMM thoâng qua phöông phaùp
phaân ñoaïn Viterbi chuaån vaø thuaät toaùn Baum -Welch. Moät caùch tröïc quan, coù theå
chia maãu khuoân maët ngöôøi thaønh nhieàu vuøng khaùc nhau nhö ñaàu, maét, muõi,
mieäng vaø caèm. Coù theå xaùc ñònh moät maãu khuoân maët ngöôøi baèng tieán trình xem
xeùt caùc vuøng quan saùt theo thöù töï thích hôïp (töø treân xuoáng döôùi, töø traùi qua phaûi).
Thay vì tin töôûng möùc ñoä chính xaùc vò trí leà ñeå duøng cho caùc phöông phaùp döïa
treân so khôùp (nôi xuaát hieän caùc ñaëc tröng nhö maét vaø muõi caàn xaùc ñònh vò trí leà
toát ñeå laáy ñöôïc toaøn boä chi tieát cuûa ñaëc tröng). Muïc tieâu cuûa phöông phaùp naøy laø
keát hôïp caùc vuøng ñaëc tröng khuoân maët vôùi caùc traïng thaùi cuûa moâ hình. Caùc
22
phöông phaùp döïa vaøo HMM seõ xem xeùt maãu khuoân maët nhö moät chuoãi caùc
vector quan saùt, hình 1.13a vaø hình 1.14. Trong quaù trình huaán luyeän vaø kieåm tra,
aûnh ñöôïc queùt theo moät thöù töï, hình 1.13a vaø hình 1.14. AÙp duïng ñònh höôùng
theo xaùc suaát ñeå chuyeån töø traïng thaùi naøy sang traïng thaùi khaùc, hình 1.13b, döõ
lieäu aûnh ñöôïc moâ hình hoùa baèng phaân boá Gauss nhieàu bieán. Moät chuoãi quan saùt
bao goàm taát caû giaù trò cöôøng ñoä töø moãi khoái. Keát quaû xuaát ra cho bieát quan saùt
thuoäc lôùp naøo. Theo [42], Samaria duøng naêm traïng thaùi töông öùng naêm vuøng
(hình 1.13b) ñeå moâ hình hoùa tieán trình xaùc ñònh khuoân maët, Samaria vaø Young
duøng HMM 1 chieàu (hình 1.13) vaø 2 chieàu (hình 1.14) ñeå trích ñaëc tröng vaø xaùc
ñònh khuoân maët, töông töï Samaria vaø Young; Nefian vaø Hayes duøng HMM vaø
bieán ñoåi Karhunen Loøeve (Karhunen Loøeve Tranform – KLT) vôùi caùc vector
quan saùt bao goàm caùc heä soá (duøng KLT) thì keát quaû seõ toát hôn Samaria vaø Young
vaø tyû leä chính xaùc cao khi duøng HMM 2 chieàu (hình 1.14), coøn Rajagopalan vaø
coäng söï duøng thoáng keâ coù thöù töï ôû möùc cao hôn (Higher Order Statistic - HOS)
ñeå öôùc löôïng cöôøng ñoä.
Hình 1.13. Moâ hình Markov aån:
(a) caùc vector quan saùt ñeå huaán luyeän cho HMM;
(b) naêm traïng thaùi aån.
Filareti [17] duøng ñaëc tröng maøu keát hôïp thoâng tin veà ñoä saâu cuûa aûnh laøm döõ
lieäu daïy HMM hoïc ñeå xaùc ñònh khuoân maët. Phöông phaùp naøy cho pheùp giaûi
quyeát vaán ñeà veà ñieàu kieän hình neàn, ñoä saùng, che khuaát, tö theá khuoân maët. Coøn
Kicheon [33] duøng ñaëc tröng Haar-like ñeå xaùc ñònh khuoân maët ngöôøi vôùi HMM.
23
Hình 1.14. Xaùc ñònh khuoân maët baèng HMM caùc traïng thaùi, moãi traïng thaùi laïi coù nhöõng
traïng thaùi nhoû beân trong: traïng thaùi traùn coù ba traïng thaùi nhoû beân trong;
traïng thaùi maét coù naêm traïng thaùi nhoû beân trong.
Thuoäc tính trong khoâng gian khuoân maët coù theå ñöôïc moâ hình hoùa qua nhieàu
dieän maïo khaùc nhau döïa treân ngöõ caûnh ñeå phaân ñoaïn. Lyù thuyeát tröôøng ngaãu
nhieân Markov (Markov Random Field – MRF) ñöôïc duøng ñeå moâ hình hoùa caùc
thöïc theå döïa vaøo ngöõ caûnh nhö caùc ñieåm aûnh vaø caùc ñaëc tröng coù moái töông quan
vôùi quan heä Kullback. Theo [42], Lew duøng 9 quang caûnh ñeå öôùc löôïng phaân boá
cuûa khuoân maët roài choïn caùc ñieåm aûnh giaøu thoâng tin nhaát (Most Informative
Pixel – MIP) ñeå cöïc ñaïi hoùa thoâng tin quan heä Kullback giöõa haøm xaùc suaát khi
maãu laø khuoân maët ngöôøi vaø khi maãu khoâng phaûi laø khuoân maët ngöôøi; oâng duyeät
treân aûnh xaây döïng khoaûng caùch töø khoâng gian khuoân maët (Distance From Face
Space – DFFS) ñeå xaùc ñònh khuoân maët – hình 1.9, töông töï Colmenarez vaø
Huang xem xeùt cöïc ñaïi hoùa bieät soá treân cô sôû thoâng tin giöõa maãu negative vaø
positive cuûa khuoân maët. Döïa treân yù töôûng naøy Henry [22] tìm tyû leä khaû naêng
duøng cho moâ hình xaùc suaát ñaõ ñöôïc huaán luyeän roài xaùc ñònh khuoân maët. Feng vaø
Shi [71] duøng KFD (Kernel Fisher Discriminant) ñeå phaân tích aûnh coù khuoân maët
ngöôøi roài hoïc caùc ñaëc tröng naøy ñeå xaùc ñònh khuoân maët ngöôøi.
Theo [42], Huang duøng thuaät toaùn C4.5 xaây döïng caây quyeát ñònh töø maãu
khuoân maët; moãi maãu huaán luyeän ñöôïc moâ taû nhö moät vector coù thuoäc tính veà
entropy, trung bình vaø ñoä leäch chuaån cuûa caùc giaù trò cöôøng ñoä cuûa ñieåm aûnh; moãi
node cuûa caây quyeát ñònh seõ chæ roõ quyeát ñònh treân moät thuoäc tính ñôn, Duta vaø
24
Jain moâ taû phöông phaùp hoïc khaùi nieäm khuoân maët baèng thuaät toaùn Find-S cuûa
Mitchell döïa treân phaân boá cuûa maãu khuoân maët baèng
p(x|khuoân maët)
maø khoâng
duøng maãu khoâng phaûi laø khuoân maët vaø chæ duøng phaàn taâm döõ lieäu vôùi vector ñaëc
tröng goàm coù caùc aûnh vôùi 32 möùc cöôøng ñoä hoaëc keát caáu. Ramana [57] duøng caây
quyeát ñònh nhö coâng cuï ñeå phaân loaïi phaàn naøo seõ laø khuoân maët. Khi xaây döïng
caây oâng keát hôïp caû cascade ñeå taêng tính hieäu quaû. Froba vaø Ernts [5] duøng caây
quyeát ñònh coù nhieàu nhaùnh cho pheùp xaùc ñònh khuoân maët ngöôøi nhìn nghieâng töø -
60
o
ñeán 60
o
, moãi node coù khaû naêng loaïi boû cöûa soå con hieän haønh ñang xeùt hoaëc
phaân loaïi vaøo moät trong ba lôùp quay ñöôïc ñònh saün.
Hoïc vôùi AdaBoost laø moät phaân loaïi maïnh phi tuyeán phöùc HM(x), ñöôïc xaây
döïng töø M phaân loaïi yeáu [48], 𝐻𝑀 𝑥 =
𝛼𝑚 ℎ𝑚 (𝑥)
𝑀
𝑚=1
𝛼𝑚
𝑀
𝑚=1
vôùi x laø maãu caàn phaân loaïi,
hm(x){-1,1} laø phaân loaïi yeáu, m0 laø caùc heä soá trong R vaø 𝛼𝑚
𝑀
𝑚=1 laø nhaân toá
chuaån hoùa. Muïc tieâu cuûa Adaboost laø hoïc daõy caùc phaân loaïi yeáu. Giaû söû coù moät
taäp N maãu huaán luyeän ñaõ gaùn nhaõn {(x1,y1), …, (xN,yN)}, vôùi yi laø nhaõn töông öùng
cuûa maãu xiR
n
. Tính moät phaân boá cuûa caùc maãu huaán luyeän [w1, …, wN] caäp nhaät
trong suoát quaù trình hoïc. Sau böôùc laëp m, maãu khoù phaân loaïi (xi,yi) coù troïng soá
môùi wi
(m)
, ñeán böôùc laëp thöù (m+1), maãu naøy seõ coù taàm quan troïng hôn. Viola vaø
Jones [48] duøng boán loaïi ñaëc tröng Haar-like [33] cô baûn ñeå xaùc ñònh khuoân maët
ngöôøi, hình 1.15. Ñaëc tröng Haar ñöôïc öa thích vì coù hai lyù do: (1) phaân loaïi
maïnh trong vieäc xaùc ñònh khuoân maët hay khoâng phaûi khuoân maët; vaø (2) hieäu quaû
khi duøng baûng toång caùc vuøng hoaëc kyõ thuaät aûnh ñaày ñuû.
Hình 1.15. Boán loaïi ñaëc tröng Haar wavelet-like.
25
Ou [73] nhaän xeùt neáu duøng cascade AdaBoost ñeå xaùc ñònh khuoân maët vôùi
thuaät toaùn Greedy thì khoâng toái öu, ñeà xuaát duøng GA thay theá ñeå taêng tính hieäu
quaû. Lienhart [56] phaùt trieån ñaëc tröng Haar-like thaønh boä ñaëc tröng môùi keát hôïp
phaân loaïi cascade ñeå xaùc ñònh khuoân maët ngöôøi. Töø yù töôûng chính treân, nhieàu
chuyeân gia caûi tieán nhö: duøng boost ñeå loaïi tröôøng hôïp hoïc quaù khôùp ñoàng thôøi
söû duïng huaán luyeän taêng cöôøng ñeå giaûm tyû leä sai vaø xöù lyù khuaát, duøng ñaëc tröng
Gauss khoâng ñaúng höôùng vaø Haar-like keát hôïp Adaboost, duøng phöông phaùp
BDF (Block Difference Feature) vôùi caùc ñaëc tröng Haar-like xaùc ñònh caùc tö theá
cuûa khuoân maët, … ñeå taêng tính hieäu quaû.
Li vaø Zhang [64] ñeà xuaát khaùi nieäm Float Boost, laø phöông phaùp hoïc döïa treân
phaân loaïi boosting ñeå tyû leä loãi ôû möùc cöïc tieåu. Phöông phaùp naøy cho pheùp quay
lui taïi moãi böôùc hoïc baèng AdaBoost ñaõ cöïc tieåu hoùa ñöôïc tyû leä loãi tröïc tieáp. Coù
hai vaán ñeà gaëp khi duøng phöông phaùp AdaBoost:
Thöù nhaát, AdaBoost cöïc tieåu theo haøm muõ taïi bieân qua taäp huaán luyeän.
Ñaây laø tieän lôïi, tuy nhieân muïc tieâu cuoái cuøng trong caùc öùng duïng duøng phaân
loaïi maãu thöôøng laø cöïc tieåu moät giaù trò tröïc tieáp keát hôïp vôùi tyû leä loãi. Moät
phaân loaïi maïnh ñöôïc hoïc baèng AdaBoost thì gaàn ñieåm toái öu cuûa öùng duïng
trong ñieàu kieän tyû leä loãi. Vaán ñeà naøy khoâng thaáy taøi lieäu noùi ñeán coù lôøi giaûi.
Thöù hai, AdaBoost ñeå laïi thaùch thöùc neáu duøng phaân loaïi yeáu ñeå hoïc. Hoïc
ñeå phaân loaïi toái öu vôùi phaân loaïi yeáu caàn öôùc löôïng maät ñoä khoâng gian ñaëc
tröng, ñieàu naøy laø vaán ñeà khoù, ñaëc bieät khi soá chieàu cuûa khoâng gian khaù lôùn.
Float Boost xem nhö moät caàu noái giöõa muïc tieâu cuûa hoïc boosting thoâng
thöôøng vaø nhieàu öùng duïng duøng cöïc tieåu tyû leä loãi thoâng qua vieäc keát hôïp phöông
phaùp tìm kieám Floating vaø AdaBoost cuøng kyõ thuaät quay lui. Tian [12] xaây döïng
caây xaùc ñònh treân cô sôû hoïc tích cöïc baèng thuaät toaùn gom nhoùm c-mean môø döïa
treân neàn taûng Float Boost.
26
Tu [72] döïa treân khaùi nieäm cuù phaùp trong xöû lyù ngoân ngöõ ñeå xaây döïng ñoà thò
cuù phaùp cuûa aûnh döïa treân noäi dung aûnh, hình 1.16. Sau khi coù ñöôïc caùc töø vöïng,
oâng duøng phöông phaùp Adaboost (ñaõ ñöôïc huaán luyeän) ñeå xaùc ñònh caùc ñoái
töôïng döïa treân giaû thuyeát cuûa ñoái töôïng.
Elad [40] ñeà xuaát phaân loaïi döïa treân khaùi nieäm loaïi boû toái ña (Maximal
Rejection Classifier – MRC) khaùc haún yù töôûng caùc phaân loaïi khaùc. Caùc phöông
phaùp khaùc tìm möùc ñoä chung cuûa moät caù theå naøo ñoù so vôùi caùc lôùp ñeå ñöa caù theå
vaøo lôùp. Taùc giaû choïn caùch loaïi boû nhöõng lôùp maø caù theå naøy khoâng coù hoaëc coù ít
moái töông quan, döïa vaøo PDF cuûa hai lôùp: khuoân maët (target) vaø khoâng phaûi
khuoân maët (clutter) xaùc ñònh ngöôõng loaïi boû baèng FLD.
Ngoaøi nhöõng phöông phaùp ñaõ trình baøy, nhieàu chuyeân gia keát hôïp nhieàu
phöông phaùp ñeå coù keát quaû hieäu quaû trong baøi toaùn xaùc ñònh khuoân maët. Kim [70]
duøng ñaëc tröng laùng gieàng cuûa khuoân maët ñeå xaây döïng maãu theo höôùng vaø duøng
kyõ thuaät xaùc ñònh caïnh EBM (Edge-like Blob Map) theo cöôøng ñoä. OÂng duøng
logic môø keát hôïp PCA ñeå öôùc löôïng tö theá khuoân maët. Garcia vaø Tziritas [11]
döïa vaøo maøu da ngöôøi tìm öùng vieân. Hai oâng phaân raõ öùng vieân baèng wavelet
xem coù cuøng keát caáu vôùi khuoân maët hay khoâng thoâng qua khoaûng caùch
Bhattacharrya.
Hình 1.16. Moät ví duï veà cuù phaùp aûnh.
27
Theo [42], Li duøng kernel ñeå hoïc nhö laø moät aùnh xaï phi tuyeán, ñaàu tieân oâng
duøng KPCA (Kernel PCA) ñeå choïn caùc ñaëc tröng vaø khoâng gian ñaëc tröng ñeå
hoïc. Sau ñoù oâng duøng KSVC (Kernel Support Vector Classifier) keát hôïp FLD ñeå
xaùc ñònh khuoân maët.
5. Muïc tieâu cuûa ñeà taøi
5.1. Xaây döïng ngöôõng phaân ñoaïn
Thoâng thöôøng caùc phöông phaùp xaùc ñònh khuoân maët ngöôøi trong aûnh maøu ñeàu
söû duïng ñaëc tröng maøu da ngöôøi ñeå choïn caùc öùng vieân. Tuy nhieân khi duøng böôùc
tieàn xöû lyù naøy thì caùc ñaëc tröng khoâng coøn möùc ñoä chính xaùc cao vì nhieàu lyù do
khaùc nhau. Moät trong nhöõng lyù do chính laø nhieãu. Nhieãu seõ gaây ra bieán daïng,
cuõng nhö sai leäch vò trí caùc ñöôøng bieân khuoân maët hay thaønh phaàn khuoân maët, …
Nhieãu coù theå do taùc ñoäng töø moâi tröôøng xung quanh, taùc ñoäng töø aùnh saùng, taùc
ñoäng töø vaät duïng cuûa ngöôøi ñöôïc laáy aûnh vaø ngay caû maøu saéc töø quaàn aùo cuûa
ngöôøi ñöôïc laáy aûnh cuõng taùc ñoäng… Ngoaøi nhöõng taùc ñoäng töø beân ngoaøi, nhieãu
cuõng coù theå sinh ra do loãi kyõ thuaät cuûa coâng ty saûn xuaát thieát bò thu aûnh. Töø nhaän
xeùt naøy cuõng nhö chuùng toâi ñaõ tham khaûo nhieàu phöông phaùp xaùc ñònh khuoân
maët ngöôøi, phaàn 4 trong chöông 1, chuùng toâi seõ ñi xaây döïng moät phöông phaùp
phaân ñoaïn aûnh choïn öùng vieân ñeå xaùc ñònh xem öùng vieân naøo laø khuoân maët ngöôøi.
Quaù trình phaân ñoaïn ñeå choïn öùng vieân chính laø quaù trình tieàn xöû lyù ñeå thu
heïp khoâng gian tìm kieám treân aûnh. Quaù trình naøy cho pheùp chuùng toâi coù theå
giaûm thieåu thôøi gian xaùc ñònh thay vì phaûi tìm treân toaøn aûnh. Nhöng qua quaù trình
tieàn xöû lyù naøy cuõng laøm phaùt sinh moät vaán ñeà, neáu moâ hình maøu da ñeå phaân
ñoaïn aûnh caàn tính toaùn nhieàu ñeå chính xaùc (moâ hình phöùc taïp) thì seõ maát khaù
nhieàu thôøi gian, phaàn 3 trong chöông 1. Vì theá chuùng toâi phaûi xaây döïng moät quaù
28
trình phaân ngöôõng khoâng quaù phöùc taïp ñeå ñaûm baûo thôøi gian xöû lyù maø vaãn ñaûm
baûo coù keát quaû phaân ñoaïn toát.
5.2. Duøng logic môø ñeå xaùc ñònh khuoân maët
Töø caùc öùng vieân ñaõ nhaän ñöôïc chuùng toâi caàn xaây döïng moät phöông phaùp xaùc
ñònh khuoân maët ngöôøi vôùi döõ lieäu ñaàu vaøo laø caùc öùng vieân ñaõ coù töø quaù trình
phaân ñoaïn, nhöng thaät söï caùc öùng vieân naøy ñaõ bò bieán daïng veà hình daùng (goïi laø
bò taùc ñoäng cuûa nhieãu – do taùc ñoäng cuûa moâi tröôøng: coù nhöõng vuøng khoâng phaûi
khuoân maët nhöng coù maøu truøng vôùi maøu da seõ tham gia vaøo öùng vieân, hay nhöõng
ñieåm aûnh thuoäc khuoân maët ngöôøi nhöng döôùi taùc ñoäng cuûa aùnh saùng hay caùc ñoái
töôïng xung quanh seõ bò thay ñoåi maøu saéc vaø sau khi phaân ñoaïn seõ khoâng toàn taïi
laø ñieåm aûnh cuûa öùng vieân nöõa) do quaù trình laáy aûnh bò taùc ñoäng cuõng nhö quaù
trình tìm öùng vieân. Vì theá phöông phaùp xaùc ñònh naøy phaûi chaáp nhaän döõ lieäu ñaàu
vaøo laø caùc öùng vieân khoâng coøn roõ raøng chính xaùc (môø) vaø ñöa ra moät quyeát ñònh
roõ raøng laø öùng vieân ñang xem xeùt seõ laø khuoân maët ngöôøi hay khoâng phaûi khuoân
maët ngöôøi. Döïa treân kieán thöùc vaø kinh nghieäm cuûa chuùng toâi, chuùng toâi quyeát
ñònh choïn phöông phaùp laø duøng logic môø ñeå giaûi quyeát.
Heä thoáng logic môø naøy seõ ñöa ra quyeát ñònh döïa treân nhöõng quan heä khoâng roõ
raøng chính xaùc veà nhöõng tính chaát beân ngoaøi: ñoä troøn, tyû leä chieàu cao-chieàu roäng,
… cuõng nhö nhöõng tính chaát veà quan heä cuûa caùc thaønh phaàn beân trong: quan heä
hai maét, quan heä maét-mieäng, ... (nhöõng quan heä naøy khoâng coøn roõ raøng vaø chính
xaùc vì öùng vieân khoâng coøn roõ raøng chính xaùc veà hình daùng, kích thöôùc, vò trí, …)
ñeå quyeát ñònh öùng vieân naøo seõ laø khuoân maët ngöôøi. Vì vaäy chuùng toâi caàn phaûi
giaûi quyeát hai baøi toaùn sau:
Xaây döïng boä luaät môø töø caùc quan heä veà hình daùng beân ngoaøi cuûa
khuoân maët.
29
Xaây döïng boä luaät môø töø caùc quan heä cuûa caùc thaønh phaàn beân trong
cuûa khuoân maët.
Do quaù trình phaân ñoaïn tìm caùc öùng vieân coù theå coù nhöõng khuoân maët sau khi
phaân ñoaïn seõ taïo moät öùng vieân duy nhaát do ñieàu kieän maøu saéc. Ñaây chính laø baøi
toaùn thöù ba maø chuùng toâi caàn phaûi giaûi quyeát. Chuùng toâi caàn phaûi laøm sao taùch
thaønh caùc öùng vieân maø moãi öùng vieân coù theå laø moät khuoân maët ngöôøi. Chuùng toâi
phaûi xaây döïng boä suy luaän môø ñeå öôùc löôïng phaïm vi vuøng cuûa töøng öùng vieân.
5.3. Ñieàu kieän cuûa baøi toaùn
Ñeå suy luaän ñöôïc thì döõ lieäu môø ñaàu vaøo phaûi ñaûm baûo toàn taïi nhöõng quan heä
ñaëc tröng caàn thieát ñeå suy luaän. Muoán theá, caùc khuoân maët trong hình aûnh caàn
phaûi nhìn thaáy ít nhaát hai phaàn ba khuoân maët ñeå ñaûm baûo coù ñuû ñaëc tröng caàn
thieát. Khi khuoân maët bò xoay moät goùc (baûo ñaûm thaáy hai phaàn ba khuoân maët),
chuùng toâi seõ duøng caùc quan heä veà tyû leä maø khoâng duøng quan heä veà khoaûng caùch
vì nhöõng quan heä tyû leä naøy baát bieán vôùi caùc pheùp bieán ñoåi Affine.
Ngoaøi heä thoáng xaùc ñònh khuoân maët ngöôøi trong aûnh maøu naøy phaûi coù tyû leä
xaùc ñònh chính xaùc treân 70% vaø thôøi gian thöïc hieän döôùi 2 giaây [42], ñieàu kieän
naøy laø ñieàu kieän chung cuûa caùc öùng duïng söû duïng baøi toaùn xaùc ñònh khuoân maët
ngöôøi maø chuùng toâi ñöôïc tham khaûo. Khoâng nhöõng vaäy, phöông phaùp xaùc ñònh
khuoân maët ngöôøi naøy phaûi xaùc ñònh ñöôïc caùc khuoân maët ngöôøi ôû nhieàu ñieàu kieän
khaùc nhau: moâi tröôøng xung quanh ña daïng, vò trí khuoân maët, tö theá khuoân maët.