Hiện nay, vấn đề an ninh là một trong những vấn đề được quan tâm hàng đầu trên thế giới. Bài toán nhận dạng vì vậy được quan tâm rất nhiều. Trong vấn đề nhận dạng con người, đã có nhiều phương pháp được đưa ra và có độ chính xác cao.
Các bài toán nhận dạng được áp dụng theo 2 con đường là nhận dạng offline và nhận dạng online.
Nhận dạng offline: Đối tượng thu thập thành các file dữ liệu và được chuyển về trung tâm. tại đố các số liệu sẽ được phân tích xử lý, thời gian xử lý không yêu cầu quá khắt khe.
Nhận dạng online: đối tượng thu thập và xử lý trực tiếp tại hiện trường. thời gian xử lý luôn được yêu cầu khắt khe để có thể bám theo đối tượng.
Một bài toán nhận dạng con người đang phổ biến hiện nay:
- Nhận dạng vân tay
- Nhận dạng bàn tay
- Nhận dạng vân mắt
- sử dụng thẻ xác nhận
Các phương án đã qua thời gian dài phát triển nên có dộ chính xác cáo. tuy nhiên nó cũng có hạn chế.
Với sự phát triển của khoa học máy tính, vấn đề nhận dạng khuôn mặt được quan tâm và yêu cầu của đồ án như sau:
Xây dựng một hệ thống nhận dạng mặt người online với đầu vào là ảnh khuôn mặt người cần nhận dạng, được thu thập bằng camera số, đầu ra là kết quả nhận dạng cho khuôn mặt đó.
Để có thể xử lý được bài toán trên, đồ án đề xuất hướng tiếp cận là xử dụng các kỹ thuật xử lý ảnh số. các ảnh số được thu thập bằng camera số và xử lý thông qua máy tính PC
Bài toán nhận dạng mặt người online là kết hợp của 2 bài toán:
- Bài toán xác định mặt người trong ảnh số
- Bài toán nhận dạng mặt người
Nội dung đồ án:
- CHương 1: Trình bày yêu cầu đối với đầu vào và đầu ra, thời gian thực hiện của hệ thống
Chương 2: Trình bày về ảnh số, xử lý ảnh số, ứng dụng của ảnh số trong tác và nhận dạng mặt người, các phương pháp hiện có và lựa chọn phương án để giải quyết yêu cầu đề ra.
Chương 3: Nói về quá trình thiết kế, thi công các phần của đồ án
Chương 4: kết quả, giao diện chương trình, các trường hợp đúng, các trường hợp sai và phân tích các trường hợp sai
Chương 5: trình bày các kết quả đã đạt được, các tồn tài và hướng phát triển của đồ án
Chương 6: các tài liệu tham khảo
59 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 3012 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Nghiên cứu xây dựng hệ thống nhận dạng mặt người online, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ể mang lại hiệu quả nhận dạng cao
hơn.
2. Phân tích hệ thống và các cơ sở lý thuyết
- 15 -
Nhược ñiểm của PCA:
- PCA phân loại theo chiều phân bố lớn nhất của tập vec-tơ. Tuy nhiên, không
phải bao giờ chiều phân bố lớn nhất lại mang lại hiệu quả cao nhất cho nhận
dạng. ðây là nhược ñiểm cơ bản của PCA.
- PCA rất nhạy với nhiễu, vì vậy nhiệm vụ tiền xử lý (lọc nhiễu, chuẩn hóa,…)
ñòi hỏi phải thực hiện rất kỹ
2.5.2.2. Nhận dạng bằng LDA
Tương tự như PCA, LDA (Linear Discriminants Analysis) cũng là một phương
pháp nhận dạng theo hướng tiếp cận Apprearance Based.
Mục ñích của LDA là tìm ra một không gian mới ñể tách rời các nhóm ảnh với
nhau. Không gian ñó ñược tạo bởi các vec-tơ không nhất thiết phải trực giao từng ñôi
một.
Trong không gian tạo ra từ LDA, các ảnh trong cùng một nhóm sẽ gần nhau, và các
nhóm khác nhau sẽ cách xa nhau. LDA khắc phục ñược nhược ñiểm của PCA, ñó là
“không phải hướng biến thiên mạnh nhất luôn mang thông tin nhận dạng cao nhất”.
ðối với một nhóm, gọi dwithin là khoảng cách lớn nhất các phần tử trong nhóm ñó,
và dbetween là khoảng cách bé nhất từ tâm của nhóm ñó tới tâm của các nhóm khác.
Mục tiêu của LDA là trong không gian mới, ta có dwithin bé nhất và dbetween lớn nhất.
ðể tính các khoảng cách dwithin, dbetween, ta dựa trên tính toán mối tương quan của
các thành viên trong một nhóm và sự tương quan giữa các nhóm với nhau. Các mối
tương quan này thể hiện qua các ma trận scatter.
Các Hình 2.9 và Hình 2.10 minh họa cho tư tưởng của phương pháp LDA.
(a) Các ñiểm trong không gian khi chiếu lên
một trục bị lẫn với nhau
(b) Các ñiểm ñó chiếu lên một trục khác. ðây
là mục tiêu của phương pháp LDA.
Hình 2.9. Phân loại với LDA
2. Phân tích hệ thống và các cơ sở lý thuyết
- 16 -
(a) Kết quả phân loại tốt khi khoảng cách dwithin bé
nhất và khoảng cách dbetween lớn nhất.
(b) Kết quả phân loại không tốt.
Hình 2.10. Phân loại dựa trên between và within theo LDA.
Ma trận scatter biểu diễn within-class là:
w
1 1
( )( )
jNC
j j T
i j i j
j i
S µ µ
= =
= Γ − Γ −∑∑ (2.4)
Với jiΓ là vec-tơ thứ i trong nhóm thứ j, jµ là trung bình của nhóm thứ j, C là số
nhóm, jN là số phần tử trong nhóm j.
Ma trận scatter biểu diễn between-class là:
1
( )( )
C
T
b j j
j
S µ µ µ µ
=
= − −∑ (2.5)
Với µ là trung bình của tất cả các nhóm.
Không gian tạo ra bởi phương pháp LDA là một tập các vec-tơ
[ ]1 2W W ,W ,...,Wd= ñược xác ñịnh bởi công thức:
argmax
T
b
T
W w
W S W
W
W S W
= (2.6)
Ưu ñiểm của phương pháp:
- LDA mang hầu hết các ưu ñiểm của phương pháp PCA, ñồng thời khắc phục
ñược nhược ñiểm cơ bản của PCA.
Nhược ñiểm của phương pháp:
- LDA ñòi hỏi một khối lượng tính toán rất lớn. Nếu ảnh có kích thước 200 200× ,
thì ma trận biểu diễn bS , wS sẽ có kích thước là 40000 40000× . Hiện nay vẫn
chưa có cách tính nhanh phương pháp LDA.
- LDA cũng nhạy với nhiễu giống như PCA, ñiều này ñòi hỏi nhiệm vụ tiền xử lý
ảnh phải ñược thực hiện kỹ lưỡng.
2. Phân tích hệ thống và các cơ sở lý thuyết
- 17 -
Qua phân tích ưu nhược ñiểm của từng phương pháp nhận dạng, với ñiều kiện ảnh
ñầu vào có kích thước là 600 800× , thời gian xử lý ngắn, ta lựa chọn phương pháp
PCA ñể nhận dạng. PCA có nhiệm vụ tạo ra vec-tơ ñặc tính dùng cho việc nhận dạng.
2.6. Nội dung phương pháp PCA
Trong nhận dạng mặt người, khi sử dụng PCA, ta coi một ảnh xám R C× pixels là
một vec-tơ trong không gian N R C= × chiều.
Không gian mới ñược tạo ra bởi PCA ñược cấu thành từ K vec-tơ ñơn vị có chiều là
N ,N R C<< × . Mỗi vec-tơ ñược gọi là một Eigenface.
Phép biến ñổi:
1 1
2 2
N K
= → =
a w
a w
A W
a w
⋮ ⋮
với K N≪
Theo công thức:
= ⋅W T A (2.7)
Với T là ma trận chuyển ñổi. T có kích thước là K N×
- Gọi M là số ảnh ñầu vào, mỗi ảnh ñã ñược chuyển thành một vec-tơ N chiều. Ta
có tập hợp ñầu vào 1 2{ , ,..., }M=X x x x (
N
i ∈x ℝ ).
- Trung bình của các vec-tơ ñầu vào (tâm của tập hợp ñầu vào):
1
1 M
i
iM =
= ∑x x (2.8)
- Sai lệch so với tâm:
i iΦ = −x x (2.9)
- Gọi 1 2[ , ,..., ]M= Φ Φ ΦA , ta có covariance matrix của A:
1
1 M T T
i i
iM =
= Φ Φ = ⋅∑C A A (2.10)
- Gọi các giá trị riêng của C là 1 2, ,..., Nλ λ λ sắp xếp theo thứ tự giảm dần, tương
ứng với N vec-tơ riêng 1 2, , , Nu u u… . Các vec-tơ riêng này trực giao từng ñôi
một. Mỗi vec-tơ riêng iu ñược gọi là một eigenface. Tập hợp vec-tơ ban ñầu
ñược biểu diễn trong không gian tạo bởi N eigenface theo mô tả sau:
1 1 2 2
1
...
N
N N i i
i
w w w w
=
− = + + + =∑x x u u u u (2.10)
- Chọn lấy K vec-tơ riêng u tương ứng với K giá trị riêng λ lớn nhất. Ta có:
2. Phân tích hệ thống và các cơ sở lý thuyết
- 18 -
ɵ
1 1 2 2
1
...
K
K K i i
i
w w w w
=
− = + + + =∑x x u u u u với K N≪ (2.11)
Véc-tơ các hệ số khai triển 1 2[ , ,..., ]Kw w w chính là biểu diễn mới của ảnh ñược tạo ra
trong không gian PCA. Ảnh mới xˆ vẫn giữ ñược các ñặc ñiểm chính của khuôn mặt
ñầu vào. Véc-tơ 1 2[ , ,..., ]Kw w w ñược tính theo công thức sau:
11
2 2 ( ) ( )
T
T
T
T
K K
w
w
w
= − = ⋅ −
u
u
x x U x x
u
⋮ ⋮
(2.12)
Vấn ñề cần giải quyết ở ñây là ma trận covariance T= ⋅C A A có kích thước 2N .
Với N = 200 × 200 = 40000, khối lượng tính toán sẽ rất lớn. Do ñó, ñể tính ñược các
eigenface mà không cần phải tính cả ma trận C, người ta ñưa ra phương pháp tính
nhanh dựa vào tính vec-tơ riêng và giá trị riêng của ma trận T= ⋅L A A có kích thước
M×M, với M là số ảnh ñầu vào. Ta có thể chứng mình như sau: gọi iv , iµ lần lượt là
vec-tơ riêng và giá trị riêng của ma trận L:
T
i i iµ⋅ ⋅ = ⋅A A ν ν (2.13)
Nhân cả 2 vế với A ta có:
T
i i iµ⋅ ⋅ ⋅ = ⋅ ⋅A A A ν A ν (2.14)
Ta thấy i⋅A ν chính là vec-tơ riêng của
T= ⋅C A A , ứng với giá trị riêng iµ .
2.7. Sơ ñồ khối và nhiệm vụ từng khối trong hệ thống
2.7.1. Sơ ñồ khối phần cứng
Sơ ñồ các khối phần cứng của hệ thống như sau:
Hình 2.11. Mô hình phần cứng của hệ thống
2. Phân tích hệ thống và các cơ sở lý thuyết
- 19 -
Trong khuôn khổ của ñồ án, ảnh số của ñối tượng ñược thu thập thông qua một
webcam. Tín hiệu webcam truyền về PC là một luồng hình ảnh với tốc ñộ 25 hình/s
theo kênh truyền thông qua cổng USB. Khối thu thập ảnh có chức năng lấy ra một
hình ảnh trong ñó có chứa ñối tượng cần nhận dạng. MATLAB sẽ ñiều khiển toàn bộ
quá trình thu nhận từng luồng và giữ lại ảnh cần chọn.
MATLAB cho phép chúng ta ñiều khiển quá trình hoạt ñộng và truyền dữ liệu của
camera có kết nối với máy tính theo các chuẩn khác nhau. ðể ñiều khiển thiết bị,
MATLAB sẽ thông qua driver Windows API (Application Programming Interface) ñể
tác ñộng tới các phần cứng kết nối với máy tính. Thư viện chuyên dụng Image
Acquisition Toolbox của MATLAB ñược thiết kế riêng dành cho mục ñích ñiều khiển
thiết bị và thu nhận ảnh.
Chức năng ñiều khiển của MATLAB thông qua thư viện Image Acquisition Toolbox
ñược minh họa trên Hình 2.12
Hình 2.12: Thu thập hình ảnh từ webcam theo các chuẩn khác nhau bằng thư viện Image Acquisition
Toolbox của MATLAB
Từ Hình 2.12 ta thấy khối thu thập ảnh và xử lý ảnh ñược kết nối với nhau thông
qua Image Acquisition Toolbox.
Luồng tín hiệu ñược truyền về PC và ñược MATLAB thu nhận. Cơ chế lấy ảnh theo
luồng tín hiệu của MATLAB ñược thể hiện trong Hình 2.13.
2. Phân tích hệ thống và các cơ sở lý thuyết
- 20 -
Hình 2.13: Luồng dữ liệu ảnh và thu nhận frame ảnh bằng MATLAB
Luồng tín hiệu theo chuẩn USB ñược truyền lên liên tục khi có lệnh start từ máy
tính ñiều khiển Webcam hoạt ñộng. Mỗi frame là một ảnh. Dữ liệu sẽ ñược ghi vào bộ
nhớ bắt ñầu từ khi có lệnh Trigger và kết thúc quá trình lưu bởi lệnh Acquisition stop.
Khi ta cần lấy một ảnh, thời gian giữa Trigger và Acquisition Stop sẽ có chiều dài
bằng 1 frame. Khi ñó ta sẽ có ảnh cần chụp. Các tín hiệu Trigger và Acquisition có thể
ñược ñiều khiển tự ñộng (automatic) hoặc bằng tay (manual). ðồ án lựa chọn phương
pháp manual, các lệnh Trigger và Acquisition ñược ñiều khiển bởi người sử dụng.
2.7.2. Sơ ñồi khối phần mềm:
Phần mềm chủ yếu là ñược viết ñối với khối Xủ lý ảnh số.
Tiền xử lý
Trích chọn ñặc
tính
Thu thập và
tách mặt người
trong ảnh
Cơ sở
dữ liệu
Phân loại, nhận
dạng
Xử lý kết quả
Ảnh cần
nhận dạng
Ảnh ñược
chuẩn hóa
Vec-tơ
ñặc tính
Xử lý ảnh số
Hình 2.14. Sơ ñồ khối phần mềm hệ thống nhận dạng mặt người
2. Phân tích hệ thống và các cơ sở lý thuyết
- 21 -
2.7.2.1. Cơ sở dữ liệu
Các ảnh mẫu ñược chọn và ñược xử lý qua hai bước Tiền xử lý và Trích chọn ñặc
tính. Các vec-tơ ñặc tính của các ảnh học ñược lưu vào cơ sở dữ liệu, sử dụng ñể ñối
chiếu với các ñối tượng mới cần nhận dạng.
Ảnh ñối tượng cần nhận dạng cũng ñược xử lý qua các bước trên. Qua bước xử lý
Phân loại và nhận dạng, vec-tơ ñặc tính của ảnh ñầu vào sẽ ñược so sánh lần lượt với
vec-tơ ñặc tính của từng ảnh học trong cơ sở dữ liệu ñể ñưa ra kết quả nhận dạng.
Trong ñồ án này, cơ sở dữ liệu ñược dùng là hai bộ ảnh:
- Bộ ảnh thứ nhất ñược download từ thư viện của trường ñại học Cambridge, ảnh
khuôn mặt ñược cắt thủ công bằng chương trình Photoshop 7.0. ðộ phân giải
của các ảnh là 220×170 pixels và ñược lưu trong ổ cứng máy PC với ñịnh dạng
JPEG.
- Bộ thứ hai là ảnh ñược chụp trực tiếp bằng webcam, ñược tách ra từ khối thu
thập ảnh của hệ thống. Ảnh ñược tách có ñộ phân giải 310×250 pixels, lưu trong
ổ cứng máy PC dưới ñịnh dạng JPEG.
2.7.2.2. Thu thập và tách mặt người trong ảnh
Ảnh ñược chụp bằng Webcam kỹ thuật số, ñược mã hóa thành file ảnh dạng
JPEG có kích thước 600×800 pixel, hệ màu RGB 24 bits. Chương trình MATLAB
ñiều khiển việc thu thập ảnh, hình ảnh ñược xử lý, hiển thị lên màn hình PC và lưu trữ
trong bộ nhớ máy tính. Nhiệm vụ của khối là sau khi thu thập ñược ảnh, tự ñộng tách
mặt người ra khỏi ảnh số.
2.7.2.3. Tiền xử lý
Nhiệm vụ của khối: tách mặt ra khỏi ảnh và chuẩn hóa.
ðầu vào của khối: hóa ảnh ñầu vào, là các ảnh ñược trích trực tiếp từ webcam (có
ñộ phân giải là 800×600 pixel, ảnh màu RGB 24 bits).
ðầu ra của khối: Ảnh mặt người ñược tách khỏi nền và ñược chuẩn hóa.
Chức năng của khối gồm:
- Tách mặt người ra khỏi ảnh.
- Chuẩn kích thước về 310×250 pixel.
- Căn tư thế thẳng ñứng (xoay ngang theo ñường nối hai mắt).
- Chuẩn ánh sáng
- Chuẩn mức xám
- Lọc nhiễu
2.7.2.4. Trích chọn vec-tơ ñặc tính
Nhiệm vụ của khối là tạo ra vec-tơ ñặc tính mang những ñặc tính riêng của khuôn
mặt cần nhận dạng. Số chiều của vec-tơ ñặc tính phải nhỏ hơn rất nhiều so với tín hiệu
ñầu vào.
2. Phân tích hệ thống và các cơ sở lý thuyết
- 22 -
ðầu vào của khối: ảnh sau khi ñã qua tiền xử lý.
ðầu ra của khối: vec-tơ ñặc tính ñược tính bằng phương pháp PCA.
- Các bước tiến hành trích chọn ñặc tính với PCA:
1. Tạo một tập S gồm M ảnh (ảnh học). Mỗi ảnh có kích thước R C× . Mỗi
ảnh ñược chuyển thành một vec-tơ N R C= × chiều.
{ }1 2 3, , ,..., MS = Γ Γ Γ Γ (2.15)
2. Tính ảnh trung bình Ψ của tập hợp trên.
1
1 M
i
iM =
Ψ = Γ∑ (2.16)
3. Tính sai lệch của các ảnh ñầu vào so với trung bình
i iΦ = Γ −Ψ (2.17)
4. Tìm tập hợp gồm M vec-tơ trực giao, u , biểu diễn chiều phân bố mạnh
nhất của tập dữ liệu Φ . Tập hợp các vec-tơ u ñược gọi là eigenface của
tập dữ liệu học.
5. Xây dựng các ảnh mới kω theo M vec-tơ u
[ ]1 2
( )
, ,...,
T
k k k
T
M
uω
ω ω ω
= Γ −Ψ
Ω =
(2.18)
Cuối cùng, ta có kω là vec-tơ ñặc tính của ảnh thứ k trong tập cơ sở dữ liệu ñầu
vào.
Ảnh mới cần nhận dạng, Γ , sẽ ñược trích chọn vec-tơ ñặc tính theo công thức:
( )Tkuω = Γ −Ψ (2.19)
2.7.2.5. Phân loại, nhận dạng
Khối này có chức năng ñối chiếu vec-tơ ñặc tính ñược tạo ra với cơ sở dữ liệu, từ ñó
ñưa ra ñược kết quả nhận dạng. Trong bài toán, kết quả nhận dạng là “ñã ñược biết”
hay là “chưa ñược biết”.
Khối này có thể ñược thực hiện theo nhiều phương pháp khác nhau như khoảng
cách Euclides, mạng nơ-ron, SVM,…
Khoảng cách Euclides là phương pháp ñơn giản nhất, nó có kết quả tốt ñối với các
ñối tượng tạo thành các nhóm cách xa nhau. Trong ñồ này, ta sử dụng phương pháp
2. Phân tích hệ thống và các cơ sở lý thuyết
- 23 -
này ñể nhận dạng. Vec-tơ ñặc tính của ñối tượng cần nhận dạng sẽ ñược so sánh lần
lượt với vec-tơ ñặc tính của từng ảnh mẫu ñã ñược học trước ñó. Các khoảng cách
ngắn nhất ñược lưu lại. Nếu khoảng cách ngắn nhất nhỏ hơn một ngưỡng cho phép, ta
xác nhận rằng ñối tượng “ñã ñược biết ñến”.
Việc nhận dạng trên ñược thực hiện qua công thức sau:
{ }min , 1,k k Mε ω ω= − = (2.20)
Nếu thresholdε ≤ , ta xác nhận ảnh Γ là “ñã ñược biết”.
Nếu thresholdε > , ta xác nhận ảnh Γ là “chưa ñược biết”.
Trong ñó threshold là giá trị của ngưỡng nhận biết. Giá trị này ñược ñiều chỉnh cho
từng bộ cơ sở dữ liệu.
Nếu kết quả nhận dạng là ñối tượng “ñã ñược biết”, hệ thống sẽ tìm ñến một file
dữ liệu chứa các thông tin về ñối tượng vừa tìm ñược. Các thông tin ñó sẽ ñược hiển
thị trên giao diện của chương trình.
Chương 2 ñã trình bày về các khối của hệ thống và phương án giải quyết cho từng
khối. Chương 3 sẽ thể hiện quá trình vận dụng các phương án ñó vào hệ thống. Các
bước thiết kế và kết quả triển khai vào hệ thống sẽ ñược trình bày chi tiết cho từng
khối.
3. Thiết kế chi tiết và triển khai hệ thống
- 24 -
Chương 3. Thiết kế chi tiết và triển khai hệ thống
3.1. Thu thập và tách mặt người trong ảnh
ðầu vào của khối: ảnh lấy ñược từ Webcam.
ðầu ra của khối: Ảnh người cần nhận dạng ñược tách khỏi nền.
Khối này sử dụng phương pháp trừ ảnh ñể tách ñối tượng.
Cho ảnh nền X và ảnh chứa ñối tượng Y có cùng kích thước 600×800.
Ảnh kết quả của phép trừ ảnh là I.
Xét pixel có tọa ñộ 0 0( , )x y , ta có:
0 0 0 0
0 0
0 0 0 0
1 ( , ) ( , )
( , )
0 ( , ) ( , )
khi X x y Y x y
I x y
khi X x y Y x y
ε
ε
− >
=
− ≤
(3.1)
Kết quả của phép trừ ảnh là một ảnh nhị phân. Khu vực chứa ñối tượng sẽ có màu
trắng (giá trị bằng 1), và khu vực còn lại sẽ có màu ñen (giá trị bằng 0). Tuy nhiên, do
sự thay ñổi cường ñộ sáng ở một mức ñộ nào ñó giữa ảnh nền và ảnh chứa ñối tượng,
ảnh sẽ có nhiều nhiễu.
Lọc nhiễu:
- Lọc các nhiễu (các vùng màu trắng không có ñối tượng) có diện tích bé. Vùng
chứa ñối tượng luôn là vùng có diện tích tích lớn nhất.
- Lọc các vùng ñen bên trong khu vực chứa ñối tượng.
(a)
(b)
(c)
(d)
(e)
Hình 3.1. Quá trình thu thập và tách ñối tượng khỏi ảnh. a. - Ảnh nền, b- Ảnh chưa ñối tượng, c. Kết
quả trừ ảnh, d. Mặt nạ sau khi lọc nhiễu, e – ðối tượng ñược tách khỏi nền.
3. Thiết kế chi tiết và triển khai hệ thống
- 25 -
3.2. Chuẩn hóa ảnh
- ðầu vào: Ảnh ñối tượng sau khi ñã ñược tách ở khâu thu thập.
- ðầu ra: Ảnh có kích thước cố ñịnh (310×250 pixels), bao trọn khuôn mặt ñối
tượng, ñược xoay thẳng và ñược cân bằng sáng.
3.2.1. Cắt và xoay chuẩn ảnh:
ðể thực hiện nhiệm vụ tìm khung khuôn mặt mà xoay chuẩn, ñồ án sử dụng phương
pháp tìm tâm 2 mắt ñể xác ñịnh vị trí khuôn mặt.
ðể xác ñịnh vùng mắt, ta nhận thấy mắt là một vùng có ánh sáng tối nằm ở một khu
vực riêng trên khuôn mặt, xung quanh là vùng màu da. Do ñó, ta sử dụng phương pháp
tách vùng ñể tìm ra vùng chứa mắt. Phương pháp phân ngưỡng ñược sử dụng.
Các bước thực hiện:
Hình 3.2. Khối chuẩn hóa ảnh
3. Thiết kế chi tiết và triển khai hệ thống
- 26 -
a – Xác ñịnh tâm mắt
Ta thấy, số pixel quy ñịnh gương mặt có tỉ lệ gần như không ñổi so với tổng số
pixel (ñiều này do ta ñã quy ñịnh chặt chẽ ñiều kiện biên).
Ảnh chứa ñối tượng Lược ñồ mức xám của ảnh
Hình 3.3. Xác ñịnh vùng mắt bằng phân tích lược ñồ mức xám
Ta thấy khu mực chứa màu mắt khá nổi bật trong lược ñồ mức xám. Nhận thấy tỉ lệ
của vùng da và nền so với tổng số pixel luôn nằm trong một khoảng cố ñịnh, do ñó ta
có thể tính ñược ngưỡng của vùng màu mắt.
Do diện tích của vùng mắt là nhỏ hơn rất nhiều so với vùng tóc, nên ta sử dụng
chương trình lọc ñể bỏ ñi các vùng có diện tích lớn. Vùng có diện tích lớn hơn ngưỡng
sẽ ñược thay thế bằng giá trị 0 (màu ñen). Qua khảo sát, ñồ án lựa chọn ngưỡng ñó là
1000 pixels.
Việc ñặt ngưỡng thông thường sẽ sinh ra các vùng nhiễu có diện tích bé. ðể lọc các
vùng này, ta cũng sử dụng hàm lọc giống như trên nhưng chỉ ñể lọc với các vùng có
diện tích bé hơn ngưỡng. Qua khảo sát, ñồ án lựa chọn ngưỡng ñó là 100 pixels.
Sau khi lọc nhiễu, ta có kết quả như sau:
Ảnh mặt nạ sau khi ñặt
ngưỡng tách màu mắt
Ảnh mặt nạ sau khi ñược lọc
nhiễu.
Vùng mắt ñược tách
Hình 3.4. Quá trình ñặt ngưỡng tách vùng mắt.
Sau khi tách ñược vùng mắt, sử dụng phương pháp tìm tâm của một vùng, ta có
ñược tâm của mắt như sau:
3. Thiết kế chi tiết và triển khai hệ thống
- 27 -
Hình 3.5. Xác ñịnh tâm mắt của ñối tượng
Tìm ñược tâm 2 mắt, từ ñây ta có thể thực hiện phép xoay ảnh và tách ñược vùng
mặt như mong muốn.
b – Xoay ảnh và tắt khung mặt
Từ tọa ñộ tâm 2 mắt, ta xác ñịnh góc nghiêng α của khuôn mặt so với phương
thẳng ñứng. Nếu 05α > , ta sẽ thực hiện phép xoay ảnh.
α
α
Hình 3.6. Xác ñịnh góc nghiêng của khuôn mặt dựa trên tâm mắt.
Giả sử tại tâm 2 mắt có tọa ñộ tương ứng là (x1,y1) và (x2,y2) khi ñó ta có:
2 1
2 1
y
x
y
tg
x
α
−
=
−
(3.2)
Xoay chuẩn ñổi tượng thực chất là một phép biến ñổi hệ tọa ñộ. Giả sử ảnh f ban
ñầu ở trong hệ tạo ñộ (w,z), thông qua phép biến ñổi T ta ñược ảnh f’ trong hệ tọa ñộ
(x, y);
( ){ }( , ) ,x y T w z= (3.3)
Phương pháp biến ñổi phổ biến hay ñược dùng là phương pháp affine transform
theo phương pháp này thì:
3. Thiết kế chi tiết và triển khai hệ thống
- 28 -
[ ] [ ] [ ]
11 12
21 22
31 32
0
1 1 1 0
1
t t
x y w z w z t t
t t
= ⋅ = ⋅
T (3.4)
Các phép chuyển ñổi thông thường có thể là: scale, rotation translation,…
ðối với mỗi phương pháp có ma trận T khác nhau, trong trường hợp xoay ảnh thì ma
trận T tương ứng sẽ là:
cos sin 0
sin cos 0
0 0 1
α α
α α
= −
T (3.5)
Tương ứng với phương trình toán học:
cos sin
sin cos
x w z
y w z
α α
α α
= −
= +
(3.6)
Sau khi xoay, tọa ñộ của các ñiểm trong ảnh cũ sẽ bị dịch chuyển ñi theo công thức
trên. Trong hệ tọa ñộ mới, ta có ñược khuôn mặt theo tư thế thẳng ñứng và hai tâm
mới tương ứng với mắt của ñối tượng. Từ ñây, ta có ñược khung ñể tách phần mặt
mong muốn ra khỏi ảnh.
Kết quả thực hiện như sau:
01α =
09α =
Hình 3.7. Xoay chuẩn ñối tượng theo góc α
3. Thiết kế chi tiết và triển khai hệ thống
- 29 -
c) Chuẩn sáng ảnh
ðể kiểm tra mức sáng, ta kiểm tra biểu ñồ mức xám của ảnh và sử dụng thuật toán
san bằng mức xám (histogram equalization). Ảnh sau khi ñược san bằng mức xám thì
mức xám của ảnh sẽ phân bố ñều từ 0-255.
(a)
0 50 100 150 200 250
0
500
1000
1500
b)
(b)
(c)
0 50 100 150 200 250
0
500
1000
1500
2000
d)
(d)
Hình 3.8. Kết quả cân bằng mức xám, biểu ñồ sau khi mức xám phân bố ñều hơn so với ban ñầu.
3.3. Trích chọn ñặc tính bằng phương pháp PCA
Các khâu trong quá trình trích chọn ñặc tính:
- ðầu vào: Ảnh ñã ñược chuẩn hóa
- ðầu ra: vec-tơ ñặc tính của ảnh ñầu vào.
ðể có ñược vec-tơ ñặc tính, ta cần phải qua 2 giai ñoạn:
Giai ñoạn 1: Tạo ra các eigenfaces thông qua quá trình học các ảnh mẫu.
Giai ñoạn 2: Chiếu vec-tơ ảnh cần nhận dạng vào không gian eigenface. Các vec-tơ
ñặc tính của ảnh ñầu vào là phép chiếu tử ảnh ban ñầu vào không gian tạo bởi các
eigenface.
Quá trình trích chọn ñặc tính ñược thể hiện qua lưu ñồ sau:
3. Thiết kế chi tiết và triển khai hệ thống
- 30 -
Khối
Trích chọn
ñặc tính
Hình 3.9. Sơ ñồ bên trong khối Trích chọn ñặc tính sử dụng PCA
3.3.1. Quá trình học
Mô hình ñược xây dựng và kiểm nghiệm trên 2 bộ dữ liệu:
- Bộ 1: Ảnh ñược download từ bộ dữ liệu ảnh mẫu ORL của Cambridge
University Engineering Department. Bộ dữ liệu lựa chọn có 20 người, ảnh ñược
cắt thủ công, mỗi người 5 ảnh. Trong số 5 ảnh của mỗi người ta chọn ngẫu nhiên
2 ảnh ñể tạo bộ số liệu học, và 3 ảnh còn lại ñể kiểm tra mô hình. Trong bộ ảnh
này, các ảnh học ñược xếp vào cùng một thư mục, có ñánh số thứ tự.
- Bộ 2: Bộ thu thập trực tiếp từ hệ thống webcam ñược thiết kế trong khuôn khổ
của ñồ án. Người chụp ñứng cách webcam khoảng 1m, tư thế tương ñối ngay
ngắn. Số người ñược thu thập là 6 người, mỗi người có 5 ảnh ñể xây dựng mô
hình. Ảnh ñể kiểm tra mô hình cũng ñược lấy trực tiếp từ webcam. Trong bộ ảnh
này, ảnh ñược xếp theo nhóm. Các ảnh của cùng một người ñược xếp chung vào
một thư mục. Những người khác nhau sẽ ñược ñặt trong các thư mục khác nhau.
Trong mỗi thư mục có một file dữ liệu chứa thông tin về người có ảnh ñặt trong
thư mục ñó. Các thư mục ñược ñánh số theo thứ tự.
3. Thiết kế chi tiết và triển khai hệ thống
- 31 -
Các khuôn mặt trong trong bộ dữ liệu 1 ñược cắt thủ công . Tư thế của mỗi khuôn
mặt là ngẫu nhiên và chưa ñược căn chỉnh. Các ảnh chưa ñược chuẩn sáng và san bằng
mức xám.
Trong bộ cơ sở dữ liệu 2, các ảnh ñều ñã ñược căn chỉnh về tư thế thẳng ñứng. Các
ảnh cũng chưa ñược chuẩn sáng và san bằng mức xám.
Tất cả các ảnh học của mỗi bộ ñược liệt kê và ñược thể hiện trên các Hình 3.10 (a)
và Hình 3.10(b) sau:
Hình 3.10 (a). Các ảnh học của bộ dữ liệu 1
3. Thiết kế chi tiết và triển khai hệ thống
- 32 -
(b)
Hình 3.10 (b). Các ảnh học của bộ dữ liệu 2.
3.3.1.1. Chuẩn hóa ma trận ảnh
Chuẩn hóa vec-tơ là khâu ñầu tiên cần thực hiện khi sử dụng thuật toán PCA. Sự
phân bố của một vec-tơ trong không gian ñược thể hiện qua trung bình (mean) và
chuẩn (standart) của vec-tơ ñó.
Cho vec-tơ [ ]1 2, ,..., Nx x x=X , trung bình và chuẩn của vec-tơ X ñược tính như sau:
1
2
1
1
( )
( )
( )
1
N
i
i
N
i
i
mean x
N
x
std
N
=
=
= =
−
=
−
∑
∑
X X
X
X
(3.7)
Theo công thức trên, từ một ảnh Γ ban ñầu, ta có trung bình Γ và chuẩn
( )std Γ của Γ .
Phép chuẩn hóa ma trận ảnh ñược thực hiện theo công thức sau:
3. Thiết kế chi tiết và triển khai hệ thống
- 33 -
( , )
'( , )
( )
x y
x y
std
Γ − Γ
Γ =
Γ
(3.8)
trong ñó, 'Γ là ma trận ảnh ñã ñược chuẩn hóa, (x, y) là tọa ñộ ñiểm ảnh.
Kết quả quá trình chuẩn hóa ñược thể hiện như sau:
Ảnh ñầu vào Ảnh sau chuẩn hóa
Hình 3.11. Chuẩn hóa ma trận ảnh
3.3.1.2. Tính trung bình tập ảnh ñầu vào
Khâu này cho ta xác ñịnh ñược gốc tọa ñộ của không gian vec-tơ biểu diễn các ảnh.
Ảnh trung bình ñược tính bằng trung bình cộng của tất cả các ảnh. Ảnh trung bình này
thể hiện những ñiểm giống nhau nhất giữa tất cả các khuôn mặt.
Gọi số ảnh học là N, mỗi ảnh có kích thước R C× .
{ }1 2 3, , ,..., MS = Γ Γ Γ Γ (3.9)
Trung bình N ảnh trên ñược tính theo công thức:
1
1 M
i
iM =
Ψ = Γ∑ (3.10)
Kết quả thực hiện trên 2 bộ dữ liệu:
Trung bình tập ảnh học của bộ 1 Trung bình tập ảnh học của bộ 2
Hình 3.12. Trung bình ảnh của các tập dữ liệu học.
Sau khi tính ñược ảnh trung bình của bộ ảnh học, các ảnh ñầu vào sẽ ñược so
sánh với ảnh trung bình này. Ảnh mới sẽ chứa những ñiểm khác nhau giữa ảnh ñầu
3. Thiết kế chi tiết và triển khai hệ thống
- 34 -
vào so với các ảnh còn lại. Ta có tập vec-tơ ñầu vào mới sau khi so sánh với trung
bình:
1 2[ , ,..., ]
, 1,
M
i i i M
= Φ Φ Φ
Φ = Γ −Ψ =
A
(3.11)
3.3.1.3. Tính eigenface
Ma trận Covariance (covariance matrix) thể hiện sự tương quan của từng vec-tơ
ñối với các vec-tơ còn lại trong không gian.
Cho 2 vec-tơ N chiều [ ]1 2, ,..., Nx x x=X và [ ]1 2, ,..., Ny y y=Y . Ta có tương quan
giữa 2 vec-tơ trên ñược tính theo công thức:
1
( )( )
cov( , )
1
N
i i
i
x y
N
=
− −
=
−
∑ X Y
X Y
(3.12)
Nếu hai véc tơ ñã ñược chuẩn hóa trước, ứng với 0, 0= =X Y , ta có:
1 1cov( , ) ( )
1 1
N
i i
Ti
x y
N N
== = ⋅
− −
∑
X Y X Y
(3.13)
Cho một tập M vec-tơ N chiều 1 2[ , ,..., ]MΦ Φ Φ , xếp thành một ma trận A kích
thước N M× , ta có covariance của ma trận A là một ma trận C có kích thước N N× ,
phần tử ( , )C i j ñược tính như sau:
( , ) cov( , )i jC i j = Φ Φ (3.13)
Vec-tơ riêng (eigenvector) và giá trị riêng (eigenvalue) :
Cho ma trận vuông N N×∈C ℝ , vec-tơ riêng u và giá trị riêng λ khi và chỉ khi:
λ⋅ = ⋅C u u (3.14)
Eigenface:
Theo lý thuyết, eigenface chính là các vec-tơ riêng u ứng với các giá trị riêng v có
giá trị lớn nhất của ma trận covariance:
1
1 M T T
i i
iM =
= Φ Φ = ⋅∑C A A
ðể tính nhanh các eigenface này, người ta chuyển sang tính toán với ma trận
T= ⋅L A A . Lựa chọn K vec-tơ riêng v ứng với K giá trị riêng lớn nhất của L. Ta có
3. Thiết kế chi tiết và triển khai hệ thống
- 35 -
công thức chuyển ñổi: = ⋅u A v . Các giá trị riêng của L cũng chính là các giá trị riêng
của C
Gọi các giá trị riêng của L là: { }1 2, ,..., Mλ λ λ λ= sắp xếp theo thứ tự giảm dần.
K giá trị riêng lớn nhất ñược lựa chọn theo công thức:
1
1
K
i
i
M
i
i
λ
ε
λ
=
=
≥
∑
∑
(3.15)
Trong ñó, ε là ngưỡng chọn. ðồ án lựa chọn 0,97ε =
Kết quả tính eigenface cho 2 bộ số liệu như sau:
Bộ 1: Theo công thức (3.15), 34 giá trị riêng cần tìm ñược thể hiện trên Hình 3.13.
10 20 30 40 50 60 70 80
0
5
10
15
x 10
4
Hình 3.13. Biều ñồ giá trị riêng của covariance matrix. Chọn 34 giá
trị riêng ñầu tiên ñể trích chọn ñặc tính.
Trong hình trên, các giá trị riêng biến thiên rất nhanh về 0. Tổng giá trị của 34 giá
trị riêng ñầu tiên chiếm hơn 97% tổng giá trị tất cả các giá trị riêng tìm ñược.
34 eigenface tương ứng với 34 giá trị riêng trên ñược thể hiện trên Hình 3.14 sau:
3. Thiết kế chi tiết và triển khai hệ thống
- 36 -
Hình 3.14. 34 eigenfaces tìm ñược.
Bộ 2: Theo công thức (3.15), 26 giá trị riêng cần tìm ñược thể hiện trên Hình 3.15.
10 20 30 40 50 60 70
0
0.5
1
1.5
2
2.5
x 10
5
Hình 3.15. Biều ñồ giá trị riêng của covariance matrix. Chọn 26 giá
trị riêng ñầu tiên ñể trích chọn ñặc tính.
Tương tự bộ 1, các giá trị riêng tìm ñược cũng biến thiên rất nhanh về 0. Tổng giá
trị 26 giá trị riêng ñầu tiên chiếm hơn 97% tổng giá trị tất cả các giá trị riêng tìm ñược.
Do ñó ta chọn 26 giá trị riêng ñầu tiên.
3. Thiết kế chi tiết và triển khai hệ thống
- 37 -
26 eigenface tương ứng với 26 giá trị riêng trên ñược thể hiện qua Hình 2.16
Hình 3.16. 26 eigenfaces tìm ñược.
Qua các Hình 3.14 và Hình 3.16, ta có thể thấy ñược sự biến thiên của các
eigenface tìm ñược.Các eigenface ñầu tiên rất rõ rệt, ñặc trưng cho chiều biến thiên
mạnh nhất của bộ dữ liệu học. Các eigenface sau “nhạt” dần, thể hiện cho các hướng
biến thiên giảm dần của bộ dữ liệu học. Các eigenface cuối cùng tương ứng với các giá
trị riêng gần bằng 0. Số lượng eigenface quyết ñịnh số chiều của vec-tơ ñặc tính.
Các eigenface tìm ñược là các vec-tơ tạo ra không gian mới ñể thực hiện nhiệm vụ
trích chọn ñặc tính. Vec-tơ ñặc tính của ñối tượng cần nhận dạng chính là hình chiếu
của ảnh ñầu vào lên không gian mới này. Từ ñây, các mô hình nhận dạng sẽ ñược áp
dụng ñể mang lại hiệu quả nhận dạng cao mà vẫn ñáp ứng ñược yêu cầu về thời gian
xử lý của hệ thống.
3.3.2. Quá trình tạo ñặc tính
Cho ảnh ñầu vào Γ .
Trong không gian ñược tạo bởi K eigenface, ảnh Γ sẽ ñược thể hiện bởi các hệ số
[ ]1 2, ,..., Kw w wω = ñược tính theo công thức sau:
3. Thiết kế chi tiết và triển khai hệ thống
- 38 -
( )Tkuω = Γ −Ψ (3.16)
Trong ñó, Ψ là trung bình các ảnh học ñã ñược tính trong phần học.
Trong không gian eigenface này, ảnh mới ′Γ sẽ ñược biểu diễn bởi công thức sau:
1 1 2 2 ... K Kw w w′Γ = Ψ + ⋅ + ⋅ + + ⋅u u u (3.17)
Trong ñó { }1 2, ,..., Ku u u u= là các eigenface.
Sai số ′Γ −Γ càng nhỏ thì lượng thông tin bị mất khi trích chọn ñặc tính càng nhỏ,
ñiều ñó có nghĩa là vec-tơ ñặc tính tạo ra có chất lượng tốt..
Theo công thức trên, kết quả thu ñược trên 2 bộ số liệu ñược minh họa trong Hình
3.17 sau:
Bộ 1
Bộ 2
Ảnh ñầu vào Ảnh tái tạo từ các vec-tơ ñặc tính.
Hình 3.17. Khôi phục ảnh từ các vec-tơ ñặc tính
Từ Hình 3.17 ta thấy, ảnh ñược khôi phục lại từ vec-tơ ñặc tính trong không gian
mới hầu như không bị mất thông tin. Từ ñây là có thể ñánh giá ñược chất lượng các
vec-tơ ñặc tính ñược tạo ra là tốt.
3. Thiết kế chi tiết và triển khai hệ thống
- 39 -
3.4. Quá trình nhận dạng
- ðầu vào: Vec-tơ ñặc tính của ảnh chứa ñối tượng cần nhận dạng
- ðầu ra: Trả lời ñối tượng “ñã ñược nhận biết” hay “chưa ñược biết”.
Quá trình nhận dạng ñược thực hiện bằng cách so sánh khoảng cách giữa vec tơ ñặc
tính của ảnh cần nhận dạng và vec-tơ ñặc tính của từng ảnh học, tìm ra ảnh học gần
với ảnh cần nhận dạng nhất. Nếu khoảng cách bé nhất ñó bé hơn một ngưỡng xác ñịnh,
ta kết luận là ñối tượng ñã ñược nhận biết.
Tập ảnh học { }1 2 3, , ,..., MS = Γ Γ Γ Γ lần lượt ñược chiếu vào không gian eigenface,
vec-tơ ñặc tính của các ảnh học lần lượt là: 1 2, ,..., Mω ω ω . Ảnh chứa ñối tượng cần
nhận dạng Γ , chiếu vào không gian eigenface ta ñược vec-tơ ñặc tính ω . Ta cần tìm
ảnh XΓ trong cơ sở dữ liệu học có khoảng cách ngắn nhất tới ñối tượng cần nhận dạng
theo công thức sau:
argminX k
ω
ω ω ω= −
Xσ ω ω= −
(3.18)
Nếu σ ε< , ñối tượng ñã ñược biết ñến, là người XΓ trong cơ sở dữ liệu học.
Nếu σ ε≥ , ñối tượng chưa ñược biết ñến.
Ảnh ñầu vào Ảnh tách ñược
61.6σ =
66.7σ =
94.8σ =
Các kết quả gần với ñối tượng nhất tương ứng với các giá trị σ
Hình 3.18. Nhận dạng theo khoảng cách Euclide.
Sau khi thiết kế và triển khai hệ thống, ñồ án sẽ ñi tới nhiệm vụ thiết kế giao diện và
kiểm tra sự hoạt ñộng của hệ thống. Các thiết bị lựa chọn, ngôn ngữ lập trình và các
3. Thiết kế chi tiết và triển khai hệ thống
- 40 -
chương trình tự viết sẽ ñược trình bày trong chương 4. Ngoài ra, chương 4 sẽ trình bày
về giao diện chương trình, các chức năng, cách sử dụng giao diện, các kết quả nhận
dạng cho từng bộ số liệu và phân tích các trường hợp dẫn ñến kết quả nhận dạng sai.
4. Các kết quả triển khai hệ thống và áp dụng
- 41 -
Chương 4. Các kết quả triển khai hệ thống và áp
dụng
4.1. Lựa chọn thiết bị và công cụ lập trình
Các thiết bị sử dụng trong triển khai hệ thống như sau:
4.1.1. Camera
- Tên Camera: Webcam Tako 10.
- ðặc ñiểm:
o Kết nối với máy tính theo chuẩn USB.
o Tốc ñộ truyền: 25 hình/s
o ðộ phân giải: 600×800 pixel, có thể ñiều chỉnh.
4.1.2. PC
Cấu hình máy:
- Chip Pentium IV 2.4GHz
- DDRAM 512GB
4.1.3. Công cụ lập trình
- Tên chương trình: MATLAB version 7.0.4 R2004
- Các thư viện:
o Image Acquisition Toolbox Version 1.8
o Image Processing Toobox, Version 5.0.2
4.2. Các hàm sử dụng
ðể phục vụ cho các tính toán và mô phỏng thuật toán, trong khuôn khổ ñồ án ñã có
nhiều hàm và chương trình ñược tự xây dựng. Các hàm và chương trình này ñược viết
bằng ngôn ngữ MATLAB. Một số hàm thư viện khác của MATLAB cũng ñược sử
dụng trong ñồ án sẽ ñược giới thiệu trong phần tài liệu tham khảo.
4.2.1. Khối tách ảnh ñối tượng
function res = SubImages(im,ba,thresh)
% Tru anh voi nen
% Input:
% + im: ảnh ñầu vào chứa ñối tượng.
% + ba: ảnh nền
% + thresh: ngưỡng trừ ảnh
% Output:
% + res: Kết quả của phép trừ ảnh
4. Các kết quả triển khai hệ thống và áp dụng
- 42 -
function res = OuterBox(x,T)
% Tạo mặt nạ ñối tượng
% + Lọc nhiễu
% + Bỏ phần chứa thân người
% Input:
% + x : ảnh cần xử lý (kết quả của phép trừ ảnh)
% + T : Thông số của hàm
% Ouput:
% + Ảnh ñã ñược xử lý
function res = FFE(im,ba)
% Face Frame Extraction
% Tách vùng chứa ñối tượng ra khỏi ảnh
% Input:
% + im: Ảnh ñầu vào
% + ba: Ảnh nền
% Output:
% + res: Ảnh chứa ñối tượng tách
4.2.2. Khối tiền xử lý
function [L1,L2, R1, R2] = LeftRight(im)
% Tìm tâm 2 mắt
% Input:
% +im: ảnh ñã ñược tách sau khối FFE.
% Output:
% + L1, L2: Tọa ñộ tâm mắt trái
% + R1, R2: Tọa ñộ tâm mắt phải
function res = RotTrans(im)
% Xoay và tách ñối tượng dựa vào ñường nối tâm 2 mắt
% Input:
% + anh sau ham FFE (Face Frame Extraction)
% Output:
% + res: Ảnh có kích thước không ñổi,
% bao trọn khuôn mặt ñối tượng.
4.2.3. Khối trích chọn ñặc tính
function [x,M] = PCA_input()
% ðọc dữ liệu ảnh cho quá trình học.
% Input:
% + Ảnh tại một thư mục mặc ñịnh của chương trình.
% Output:
% + x: Tập ảnh học
% + M: Số lượng ảnh.
function res = pre_processing(x)
% Khối tiền xử lý: Chuẩn hóa ánh sáng, san bằng mức xám và
% lọc nhiễu ảnh vào.
% Input:
% + Tập ảnh học
% Output:
% + res: Tập ảnh sau khi ñược tiền xử lý.
4. Các kết quả triển khai hệ thống và áp dụng
- 43 -
function S = normalization(x)
% Chuẩn hóa ma trận ñiểm ảnh
% Input:
% + Tập ảnh học ñã qua bước tiền xử lý
% Output:
% + S: Tập ảnh sau khi chuẩn hóa và
% ñược chuyển vào ma trận S.
function [res1, MEAN] = average(S)
% Tính ảnh trung bình, xác ñịnh sai lệch của từng ảnh học
% so với ảnh trung bình
% Input:
% + Ma trận tạo bởi các ảnh học sau bước chuẩn hóa
% (normalization)
% Output:
% + MEAN: Ảnh trung bình
% + res1: sai lệch của các ảnh so với ảnh trung bình
function [A,u,phi] = eigen(x)
% Tính các eigenface, ma trận chuyển ñổi và
% biểu diễn của các ảnh học trong không gian mới.
% Input:
% + Tập ảnh học sau khi ñược chuẩn hóa và
% và tính sai lệch so với ảnh trung bình.
% Output:
% + A : Ma trận chuyển ñổi
% + u : Tập các eigenface
% + phi: Biểu diễn của các ảnh học trong không gian
% eigenface (vec-tơ ñặc tính của các ảnh học)
4.2.4. Khối nhận dạng:
function [correct, MATCH1, MATCH2, MATCH3] = recognition(im)
% Nhận dạng
% Input:
% + ảnh chứa ñối tượng
% Output:
% + correct: Cho biết kết quả nhận dạng. correct nhận các giá
% trị 0 hoặc 1.
% correct = 0 ==> ảnh chưa ñược biết ñến.
% correct = 1 ==> ảnh ñã ñược biết ñến.
% + MATCH1, MATCH2, MATCH3: thứ tự 3 người trong
% tập ảnh học gần với ñối tượng nhất
function [name, age, offical_im] = info(K)
% ðọc thông tin về ñối tượng ñã nhận dạng ñược
% Input:
% + K: Số thứ tự của ảnh học gần với ñối tượng nhất.
% Output:
% + name: Tên của ñối tượng.
% + age : Tuổi của ñối tượng.
% + official_im: Ảnh ñại diện của ñối tượng.
4. Các kết quả triển khai hệ thống và áp dụng
- 44 -
4.3. Giao diện
Giao diện ñược thực hiện trên GUI (Graphical User Interface), trên nền MATLAB
version 7.0.4 R2004. Hiện tại, ñể chạy giao diện này ta phải thông qua MATLAB.
Các kết quả nhận dạng ñối tượng “ñã ñược nhận biết” và “chưa ñược nhận biết” sẽ
lần lượt ñược thể hiện trong các Hình 4.1 và Hình 4.2.
Hình 4.1. Giao diện chương trinh, với kết quả là nhận dạng ñược ñối tượng.
4. Các kết quả triển khai hệ thống và áp dụng
- 45 -
Hình 4.2. Giao diện chương trinh, với kết quả là không nhận dạng ñược ñối tượng.
Giao diện với 3 phần: phần hiển thị ñầu vào, phần hiển thị kết quả và panel ñiều
khiển.
Panel hiển thị ñầu vào:
- Input: Sau khi chọn Open File (với nhập ảnh từ CSDL có sẵn) hoặc Snapshot
(ñối với ảnh nhập trực tiếp từ webcam), ảnh chứa ñối tượng sẽ ñược hiển thị ở
ñây.
Panel hiển thị kết quả:
- Detected Image: Hiển thị khuôn mặt ñã ñược tách và xoay chuẩn.
- Comparision Result: Hiển thị 3 ảnh thuộc CSDL gần với ảnh cần nhận dạng
nhất, với Comp. Index là khoảng cách σ tương ứng. Comp.Index có màu xanh là
giá trị σ bé nhất.
- Recognition Result: Hiển thị kết quả nhận dạng.
o Nếu giá trị σ bé nhất bé hơn ngưỡng, kết quả sẽ là hình ảnh người ñược
nhận dạng và thông tin về người ñó (tên, tuổi). Nếu giá trị σ bé nhất lớn
hơn ngưỡng, kết quả trả lời là unknown face.
Panel ñiều khiển CONTROL PANEL có chức năng:
- ðiều khiển truy nhập dữ liệu. Có 2 chế ñộ là online bằng Camera, và offline
bằng file trong CSDL.
- Update CSDL, tạo CSDL mới.
4. Các kết quả triển khai hệ thống và áp dụng
- 46 -
- ðiều khiển quá trình học và lưu trữ dữ liệu.
Cho thực hiện nhập ảnh cần nhận dạng, có 2 chế ñộ ñể lựa chọn: lấy ảnh trực tiếp từ
camera và lấy ảnh từ file ñặt trong bộ nhớ PC.
- Lấy ảnh trực tiếp từ camera:
o Chọn phím Open Cam ñể mở Camera, lúc này phím Snapshot ñược kích
hoạt.
o Chọn phím Snapshot ñể lấy ảnh từ Camera.
- Lấy ảnh từ file: chọn phím Open File ñể chọn file.
ðể thực hiện nhận dạng, chọn phím Recognize.
Khi cần cập nhật hoặc học dữ liệu mới, ta sử dụng phím Learn Data.
Thực hiện tạo dữ liệu mới, chọn phím CreateData. Khi chọn phím này, chương
trình sẽ chuyển ñến của sổ Create Data:
Hình 4.3. Cửa sổ Create Data.
Tại của sổ Create Data, ta có các phím lựa chọn:
- Mở camera (Open Cam)
- Lựa chọn nền (Get Background)
- Chụp ảnh mới (Snapshot).
- Tách khuôn mặt (Extract)
- Lưu ảnh (Save Pic)
4. Các kết quả triển khai hệ thống và áp dụng
- 47 -
4.2. Kết quả nhận dạng
4.2.1. Test với bộ dữ liệu có sẵn
Với cơ sở dữ liệu là bộ mẫu có sẵn có 20 người, mỗi người có 5 ảnh, mỗi người
ñược chọn 2 ảnh học và 3 ảnh ñể test. Sau khi khảo sát, ngưỡng nhận dạng ñược
chọn là 100. Do chỉ có 2 ảnh học cho mỗi người, nên với bộ dữ liệu này ta chỉ ñưa
ra 2 người gần với ñối tượng nhất
Kết quả nhận dạng như sau:
- Kiểm tra với ñầu vào là các ảnh học:
Số ảnh: 40.
Nhận dạng ñúng: 40, tỉ lệ 100%
- Kiểm tra với các ảnh khác:
Số ảnh: 60
Nhận dạng ñúng: 53, tỉ lệ 88,3%.
Các ñối tượng có kết quả nhận dạng ñúng ñược chia là 2 trường hợp:
- Ảnh dễ nhận dạng: Kết quả nhận dạng là 2 ảnh trong CSDL học của ñúng người
ñó. Giá trị nhận dạng ứng với 2 ảnh tìm ñược ñều nhỏ hơn ngưỡng.
- Ảnh khó nhận dạng: Giá trị nhận dạng bé nhất nhỏ hơn ngưỡng nhận dạng và
ảnh trong CSDL học ứng với giá trị nhận dạng ñó ñúng là của ñối tượng. Giá trị
nhận dạng bé thứ 2 lớn hơn ngưỡng nhận dạng.
Các trường hợp nhận dạng ñúng trên ñược thể hiện trong các Hình 4.4 và Hình 4.5.
(a)
(b) 86σ =
(c) 91σ =
Hình 4.4. Kết quả nhận dạng ñúng, trường hợp “dễ nhận dạng”. a - ảnh cần nhận dạng, b,c – 2 ảnh
gần nhất với ñối tượng và các giá trị nhận dạng tương ứng.
(a)
(b) 71σ =
(c) 122σ =
Hình 4.5. Kết quả nhận dạng ñúng,trường hợp “khó nhận dạng”. a - ảnh cần nhận dạng, b,c – 2 ảnh
gần nhất với ñối tượng và các giá trị nhận dạng tương ứng.
4. Các kết quả triển khai hệ thống và áp dụng
- 48 -
Với các trường hợp sai:
- Sai hoàn toàn, mặc dù người trong ảnh ñã ñược học, nhưng trong các kết quả
ñưa ra không có cái nào trùng với người ñó.
- Sai do vượt ngưỡng: Ảnh ứng với giá trị nhận dạng nhỏ nhất của ñúng ñối tượng
cần nhận dạng, tuy nhiên giá trị nhận dạng lại lớn hơn ngưỡng.
Nguyên nhân dẫn ñến kết quả sai là do nét mặt và tư thế của người chụp ảnh biến
ñổi rất nhiều so với ảnh gốc (ví dụ, há miệng, nhăn nhó,...), và một số ảnh bị sai do
trang phục của người cần nhận dạng.
Các trường hợp trên sẽ ñược minh họa trong các Hình 4.6 và Hình 4.7.
118σ =
131σ =
(a) (b) (c)
Hình 4.6. Một số trường hợp nhận dạng sai hoàn toàn: (a) - ảnh gốc trong CSDL, (b) - ảnh ñầu
vào có “nhiễu” (hàng trên - ảnh nét mặt biến ñổi mạnh, hàng dưới - ảnh ñội mũ), (c) – ảnh nhận
dạng
(a)
(b) 123σ =
Hình 4.7. .Kết quả nhận dạng sai do vượt ngưỡng, a - ảnh cần nhận dạng, b - ảnh tương ứng với giá
trị nhận dạng bé nhất.
4. Các kết quả triển khai hệ thống và áp dụng
- 49 -
4.2.2. Test với bộ dữ liệu ñược lấy từ webcam hệ thống.
Bộ mẫu test ñược chụp trực tiếp từ webcam với 120 ảnh cho 6 người, mỗi người 20
ảnh. Với boọ dữ liệu này, kết quả sẽ ñưa ra 3 người trong ảnh học gần nhất với ñối
tượng. Qua khảo sát, ngưỡng nhận dạng sử dụng cho bộ 2 là 100.
Mỗi người ñược cho học 5 ảnh.
Kết quả nhận dạng như sau:
- Kiểm tra với ñầu vào là các ảnh học:
Số ảnh: 30,
Nhận dạng ñúng: 30, tỉ lệ 100%
- Kiểm tra với các ảnh khác:
Số ảnh: 90
nhận dạng ñúng: 82, tỉ lệ 91,11%.
Cũng giống như bộ 1, các trường hợp nhận dạng ñúng cũng ñược chia ra làm hai
trường hợp là “dễ nhận dạng” và “khó nhận dạng”. Hai trường hợp này sẽ ñược minh
họa trên Hình 4.8 và Hình 4.9
(a)
(b) 61σ =
(c) 88σ =
Hình 4.8. Kết quả nhận dạng ñúng,trường hợp “dễ nhận dạng”. a - ảnh cần nhận dạng, b,c – 2 ảnh
gần nhất với ñối tượng và các giá trị nhận dạng tương ứng.
(a)
(b) 98σ =
(c) 111σ =
Hình 4.9. Kết quả nhận dạng ñúng,trường hợp “khó nhận dạng”. a - ảnh cần nhận dạng, b,c – 2 ảnh
gần nhất với ñối tượng và các giá trị nhận dạng tương ứng.
Với trường hợp “khó nhận dạng”, ñể tăng ñộ tin cậy ta cần kết hợp thêm với các
phương pháp khác (ví dụ như so sánh lông mày, so sánh khoảng cách mắt, …). Các
phương án kết hợp này sẽ ñược trình bày ở phần hướng phát triển của ñồ án.
4. Các kết quả triển khai hệ thống và áp dụng
- 50 -
Với các kết quả nhận dạng sai, tương tự như bộ 1, cũng ñược phân thành 2 trường
hợp là “sai hoàn toàn” và “sai do vượt ngưỡng”.Những nguyên nhân chủ yếu là:
- Tư thế của người cần nhận dạng như mặt quá nghiêng, ñứng cách camera không
ñúng cự ly yêu cầu (1m).
- Trạng thái khuôn mặt của người chụp thay ñổi mạnh so với mẫu học (nhắm mắt,
cau mày,...)
- Các trường hợp Can not detect là do: chương trình không phát hiện ñược vùng
mắt ñối tượng khi ñối tượng nhắm mắt hoặc nghiêng mặt với ñộ nghiêng lớn,
dẫn ñến vị trí 2 mắt trong ảnh không còn cân ñối trong vùng mặt.
Các trường hợp sai ñược mô tả trong Hình 4.10 và Hình 4.11
(a)
(b)
(c)
113σ =
(d)
119σ =
(e)
130σ =
(f)
Hình 4.10. Trường hợp nhận dạng sai do vượt ngưỡng. a - ảnh chứa ñối tượng, b – ðối tượng ñược
tách khỏi nền, c - Ảnh sử dụng ñể nhận dạng, d,e,f – Ảnh trong CSDL học tương ứng với 3 giá trị nhận
dạng σ bé nhất.
(a)
(b)
(c)
117σ =
(d)
135σ =
(e)
180σ =
(f)
Hình 4.11. Trường hợp nhận dạng sai hoàn toàn do ñối tuợng ñứng quá gần camera a- ảnh ñầu vào,
b- ñối tượng ñược tách khỏi nền, c,d,e- ảnh dùng cho nhận dạng và các kết quả gần nhất.
4. Các kết quả triển khai hệ thống và áp dụng
- 51 -
Can not detect Unknow face
Can not detect Unknow face
(a) (b) (c) (d)
Hình 4.12. Các trường hợp nhận dạng sai hoàn toàn của bộ dữ liệu 2. a - Ảnh ñầu vào (khuôn mặt
quá lớn, nghiêng mặt quá nhiều, nhắm mắt), b – ðối tượng ñược tách khỏi nền, c - Ảnh ñể nhận dạng,
d - Kết quả nhận dạng.
Như vậy, ta có ñánh giá tổng thể như sau: kết quả nhận dạng ñối với bộ 2 là cao hơn
so với bộ 1, lý do là do bộ 2 có ñối tượng ít hơn, ñược chụp trong ñiều kiện biên ñã
hạn chế, tiền xử lý ñược áp dụng mạnh hơn so với bộ 1.
Sau các bước ñặt vấn ñề, phân tích, thiết kế, thi công và kiểm tra hoạt ñộng của hệ
thống, ñồ án sẽ tổng kết lại toàn bộ quá trình ñã thực hiện trên.
Chương 5 trình bày về các kết quả ñã ñạt ñược, tìm hiểu các tồn tại và ñề xuất các
hướng phát triển của ñồ án dựa trên việc khắc phục những tồn tại trên. Cạnh ñó,
chương 5 sẽ ñề xuất các hướng ứng dụng của hệ thống trong hai trường hợp nhận dạng
online và nhận dạng offline.
5. Kết luận và hướng phát triển
- 52 -
Chương 5. Kết luận và hướng phát triển
Với các kết quả ñã ñược trình bày ở các chương trên, qua thời gian thực hiện, ñồ án
ñã ñạt ñược một số kết quả sau:
- Nắm ñược các vấn ñề cơ bản của ảnh số và xử lý ảnh số
- Sử dụng thành thạo phần mềm MATLAB và ứng dụng của MATLAB trong thu
thập ảnh số và xử lý ảnh số.
- Nắm ñược các ñặc ñiểm của một bài toán nhận dạng nói chung và nhận dạng
khuôn mặt nói riêng.
- Tìm hiểu ñược một số phương pháp nhận dạng mặt người, nắm ñược ưu nhược
ñiểm của từng phương pháp. Test thử thành công trên các bộ số liệu mẫu.
- Xây dựng ñược hệ thống thu thập và nhận dạng ảnh số sử dụng PC và phần mềm
MATLAB.
- Giải quyết và phối hợp ñược 2 bài toán: Human Face Detecting và Human Face
Recognition: Bài toán tách mặt, tách các ñối tượng ñặc biệt (mắt, lông mày,…),
PCA, LDA, …
- Nắm ñược quy trình phân tích, thiết kế, triển khai một ñồ án nói riêng và một
công việc phức hợp nói chung.
Tuy ñã ñạt ñược một số kết quả nhất ñịnh nhưng trong ñồ án vẫn còn một số tồn tại
như:
- Chương trình ñang cần phải thông qua MATLAB và PC ñể thực hiện
- Số lượng người nhận dạng còn ít.
- Chương trình tách mặt chưa ñáp ứng ñược với ñối tượng có tư thế bất kỳ, các
ñối tượng có tóc phủ mắt, trang phục ñặc biệt (ñeo kính, ñội mũ,…).
- Quá trình trích chọn ñặc tính sử dụng PCA nên mang những nhược ñiểm của
phương pháp PCA. Nhược ñiểm lớn nhất của PCA là không phải trong mọi
trường hợp thì hướng biến thiên mạnh nhất cũng mang nhiều thông tin nhận
dạng nhất
- Thuật toán nhận dạng dựa trên mô hình khoảng cách ngắn nhất chưa thực sự ưu
việt.
- Chương trình chưa xử lý hiệu quả ñối với trường hợp nhận dạng sai do vượt
ngưỡng, các trường hợp mà ñối tượng có tâm trạng thay ñổi mạnh so với mẫu
học (cau có, há miệng,…)
- Quá trình tách mặt và nhận dạng còn phụ thuộc rất nhiều vào ñiều kiện ánh sáng,
môi trường xung quanh.
Từ những tồn tại trên ta có thể xác ñịnh ñược một số hướng phát triển của ñề tài như
sau:
5. Kết luận và hướng phát triển
- 53 -
Hướng phát triển:
- Mở rộng số lượng người cần nhận dạng
- Giải quyết mở rộng các khả năng xử lý của chương trình với các trường hợp
thay ñổi tư thế, trạng thái cảm xúc của ñối tượng và giảm thiểu ảnh hưởng của
phục trang.
- Thử nghiệm, phối hợp các mô hình nhận dạng khác nhau (mạng nơ-rôn,
SVM,…) và các phương pháp nhận dạng ảnh khác (LDA, ICA,…) ñể mang lại
ñộ tin cậy cao hơn cho hệ thống.
- Quy ñịnh ánh sáng tại những nơi có sử dụng hệ thống ñể giảm thiểu sai số nhận
dạng do cường ñộ sáng thay ñổi.
- “Nhúng” hệ thống xuống các hệ vi xử lý ñể ta có ñược một thệ thống chuyên
dụng và không phải phụ thuộc vào PC hay MATLAB.
Với những kết quả ñã ñạt ñược, các tồn tại và phương hướng giải quyết ñã nêu, hệ
thống hoàn thiện có thể ñược ứng dụng vào thực tế. Dựa trên những vấn ñề hiện nay,
ñồ án ñề xuất một số hướng ứng dụng cho hệ thống thu thập và nhận dạng mặt người
như sau:
Nhận dạng online:
- Theo dõi kín ñáo ñối tượng vào ra các khu vực ñặc biệt. Với các phương pháp
hiện có (vân tay, bàn tay, …), ñối tượng luôn chủ ñộng tiếp xúc với thiết bị nhận
dạng. Với hệ thống nhận dạng qua khuôn mặt, có thể thu thập và nhận dạng
ñược ñối tượng một cách kín ñáo.
- Sử dụng ñể kiểm soát vào ra các khu vực có nhiều người ra vào, các ñịa ñiểm
công cộng như sân bay, nhà ga, rạp chiếu phim,… Các phương pháp nhận dạng
khác ñã trình bày thường chỉ sử dụng trong các trường hợp ñặc biệt, số lượng
người ra vào ñược hạn chế (vân tay, bàn tay,…) hoặc phải là thành viên ñặc biệt
ñược cấp thẻ (sử dụng thẻ). Nhận dạng mặt người bằng camera số sẽ giúp cho
người quản lý kiểm soát ñược người vào ra, và khách hàng cũng không bị làm
phiền bởi việc bắt buộc phải kiểm tra vân tay,…
- Kết hợp với thẻ ñể tăng tính an toàn trong các dịch vụ như rút tiền tự ñộng. Sự
kết hợp này có thể hạn chế ñược việc ăn cắp thẻ. Người rút tiền ngoài việc phải
sử dụng thẻ, hệ thống còn ñối chiếu giữa khuôn mặt người ñang rút tiền với
những người ñược phép sử dụng tài khoản ñó. Việc kiểm tra khuôn mặt này sẽ
ñược thực hiện kín ñáo mà không gây phiền nhiễu cho khách hàng.
- Kết hợp với các phương pháp khác ñể có ñược các hệ thống khóa thông minh có
ñộ tin cậy cao.
- …
5. Kết luận và hướng phát triển
- 54 -
Nhận dạng offline:
- Phát hiện ra trong cơ sở dữ liệu các thông tin gần giống với ñối tượng cần xác
ñịnh nhất, trong trường hợp không có số liệu khác như vân tay, bàn tay,… Trong
ñiều kiện không có ñược ñầy ñủ các bộ số liệu vân tay, thì sử dụng nhận dạng
bằng khuôn mặt sẽ giúp nhà ñiều tra khoang vùng ñược ñối tượng.
- Kiểm tra người những người ra vào trong một thời gian như trong ngày, trong
tuần,… Người quản lý tại một thời ñiểm muốn kiểm tra những người ñã vào ra
một khu vực nào ñó (nhà riêng, cơ quan, …), hệ thống sẽ thực hiện việc nhận
dạng tự ñộng dựa trên các hình ảnh ñã thu thập từ trước ñó.
- 55 -
Tài liệu tham khảo
[1] Gonzalez R C., Wood R.E., “Digital Image Processing Using Matlab”, Prentice
Hall, 2004.
[2] Lương Mạnh Bá , Nguyễn Thanh Thủy. “Nhập môn xử lý ảnh số”, ðại học Bách
khoa Hà Nội, 2000
[3] Phạm Thế Bảo, Nguyễn Thành Nhựt, Cao Minh Thịnh, Trần Anh Tuấn, Phan Phúc
Doãn. “Tổng quan các phương pháp xác ñịnh khuôn mặt người”.
[4] Ilker Atalay – Computer Engineer M.Sc. “Face Recognition Using Eigenfaces”,
Istanbul Technical University , January 1996
[5] M. Tunk and A. Pentland. “Face recognition using eigenfaces”, Proc. of IEEE
Conference on Computer vision and Partten Recognition, pp.586-591, June 1991
[6] Lindsay I. Smith. “A tutorial on Principal Components Analysis”, February 26,
2002
[7] Alla Eleyan, Hasan Demirel. “PCA and LDA based Neural Networks for Human
Face Recognition”, Eastern Mediterranean University Northern Cyprus, 2007.
[8] Kamran Etemad ,Rama Chellappa. “Discriminant analysis for recognition of
human face images”, Department of Electrical Engineering and Center for
Automation Research, University of Maryland, College Park,Maryland, 1996
[9] A. Hossein Sahoolizadeh, B. Zargham Heidari, and C. Hamid Dehghan. “A New
Face Recognition Method using PCA, LDA and Neural Network”, Proceeding of
world Academy of Science, Engineering and Technology, Vol 31, 2008.
[10] Michelle M. Mendonça , Juliana G. Denipote, “Illumination Normalization
Methods for Face Recognition”, Universidade de São Paulo, 2006.
[11] Martin D. Levine, Maulin R. Gandhi, Jisnu Bhattacharyya. “Image Normalization
for Illumination Compensation in Facial Images”, Department of Electrical &
Computer Engineering & Center for Intelligent Machines McGill University,
Montreal, Canada, 2004.
[12] P. Campadelli, R. Lanzarotti G. Lipori. “Automatic Facial Feature Extraction for
Face Recognition”, University of Milan, Italy, 2008.
[13] Vo Dinh Minh Nhat, SungYoung Lee. “Image-based Subspace Analysis for Face
Recognition”, Kyung Hee University Korea, 2008.
[14] D. Sidibe, P. Montesinos, S. Janaqi. “A simple and efficient eye detection method
in color images”, LGI2P/EMA - Ales School of Mines, 2007
[15] Các tài liệu về Matlab tại:
Các file đính kèm theo tài liệu này:
- Nghiên cứu xây dựng hệ thống nhận dạng mặt người online.pdf