Luận văn Nghiên cứu một số phương pháp phát hiện biên và ứng dụng
Với mục đích là hệ thống hóa kiến thức về các phương pháp
phát hiện biên và ứng dụng với bài toán xác định góc nghiêng
văn bản. Luận văn đã đạt được một số kết quả như sau:
Trình bày các phương pháp phát hiện biên trực tiếp dựa vào
đạo hàm, phương pháp phát hiện biên dựa trên các kỹ thuật dò
biên, các kỹ thuật phân vùng ảnh
Áp dụng phương pháp dò biên cho bài toán xác định góc
nghiêng văn bản.
Cài đặt chương trình demo phát hiện góc nghiêng văn bản và
hiệu chỉnh lại văn bản.
13 trang |
Chia sẻ: lylyngoc | Lượt xem: 2888 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Luận văn Nghiên cứu một số phương pháp phát hiện biên và ứng dụng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP
PHÁT HIỆN BIÊN VÀ ỨNG DỤNG
Học viên : Nguyễn Mai Anh
Mã số : CH0302001
Người hướng dẫn khoa học : TS. Đỗ Năng Toàn
Luận văn tốt nghiệp
2
Nội dung trình bày
Đặt vấn đề
Các phương pháp phát hiện biên
Ứng dụng biên trong xác định góc nghiêng văn bản
Kết luận
3Đặt vấn đề
Mục tiêu của luận văn là nghiên cứu các phương pháp biểu diễn
biên, hệ thống hóa kiến thức về các phương pháp phát hiện biên,
và ứng dụng của nó trong xử lý ảnh văn bản
Biên là một vấn đề quan trọng trong xử lý ảnh vì các đặc điểm
trích chọn trong quá trình phân tích ảnh chủ yếu dựa vào biên.
Điểm biên là nơi có sự thay đổi sự thay đổi đột ngột về mức xám.
Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh.
4
Các phương pháp phát hiện biên
Phương pháp phát hiện biên trực tiếp: làm nổi biên dựa vào sự
biến thiên về giá trị độ sáng của điểm ảnh. Kỹ thuật chủ yếu dùng
phát hiện biên ở đây là kỹ thuật đạo hàm.
Phương pháp phát hiện biên gián tiếp: nếu bằng cách nào đấy,
ta phân được ảnh thành các vùng thì đường phân ranh giữa các
vùng đó chính là biên. Việc phân vùng ảnh thường dựa vào kết
cấu bề mặt của ảnh.
Một số phương pháp khác: Cách tiếp cận theo mô hình mặt dựa
vào việc thực hiện xấp xỉ đa thức trên ảnh gốc hay ảnh đã thực
hiện phép lọc Laplace. Cách tiếp cận tối ưu nhằm xác định một
hàm, làm giảm phương sai hoặc giảm một số điểm cực trị cục bộ
5Phương pháp phát hiện biên trực tiếp
Phương pháp Gradient: cho kết quả là ảnh biên dựa vào kỹ
thuật xác định các điểm có mức xám thay đổi đột ngột nhờ kỹ
thuật lấy đạo hàm bậc nhất. Theo định nghĩa, gradient là một
véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm
ảnh theo 2 hướng x và y
dx
yxfydxxff
x
yxf
x
),(),(),( −+≈=∂
∂
dy
yxfdyyxff
y
yxf
y
),(),(),( −+≈=∂
∂
Kỹ thuật Gradient: dùng toán tử gradient lấy đạo hàm
theo 2 hướng
Kỹ thuật la bàn: dùng toán tử la bàn lấy đạo hàm theo 8
hướng chính B, N, Đ, T, ĐB, TB, ĐN, TN.
6
Phương pháp phát hiện biên trực tiếp
-kỹ thuật gradient-
9Toán tử Robert
¾ Áp dụng trực tiếp của công thức đạo hàm tại điểm (x,y). Với mỗi
điểm ảnh I(x,y) của I, đạo hàm theo x, theo y được ký hiệu tương
ứng bởi gx, gy được tính:
⎩⎨
⎧
−+=
−+=
),()1,(
),(),1(
yxIyxIg
yxIyxIg
y
x
⎥⎦
⎤⎢⎣
⎡
−= 01
10
1H ⎥⎦
⎤⎢⎣
⎡
−
−=
10
01
2H
¾ Áp dụng toán tử Robert với ảnh nguồn I ta có ảnh kết quả Ikq như sau:
Ikq=I ⊗ H1 + I ⊗ H2
¾ Điều này tương đương với việc chập ảnh với 2 mặt nạ H1và H2:
7Phương pháp phát hiện biên trực tiếp
-kỹ thuật gradient-
9 Toán tử Sobel
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−
−
−
=
101
202
101
1H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡ −−−
=
121
000
121
2H
9 Toán tử Prewitt
9 Toán tử Frei-Chen
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡ −−−
=
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−
−
=
121
000
121
H
100
202
100
H cr
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−
−
−
=
101
101
101
1H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡ −−−
=
101
000
111
2H
8
Phương pháp phát hiện biên trực tiếp
-kỹ thuật la bàn-
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−−
−−=
333
303
555
1H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−−
−
−
=
333
503
553
2H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−
−
−−
=
533
503
533
3H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−
−
−−−
=
553
503
333
4H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−
−−−
=
555
303
333
5H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−
−
−−−
=
355
305
333
6H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−
−
−−
=
335
305
335
7H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−−
−
−
=
333
305
355
8H
9 Toán tử Kirsch
9Phương pháp phát hiện biên trực tiếp
-phương pháp Laplace-
Toán tử Laplace được định nghĩa:
≈[2f(x,y)-f(x-1,y)-f(x+1,y)]+[2f(x,y)-f(x,y-1)-f(x,y+1)]
≈f(x+1,y)+f(x-1,y)+f(x,y+1)+f(x,y-1)-4f(x,y)
2
2
2
2
2
y
f
x
ff ∂
∂+∂
∂=Δ
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−=
010
141
010
1H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−=
111
181
111
2H
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−
−
−−
=
121
242
121
3H
3 kiểu mặt nạ hay dùng:
10
Phương pháp phát hiện biên trực tiếp
Original image Sobel Operator
Prewitt Operator Frei-Chen Operator Roberts Operator
Laplacian Operator
Robinson Operator
Kirsh Operator
Hình ảnh nổi biên thu được từ việc áp dụng các toán tử
11
Phương pháp phát hiện biên gián tiếp
Phân vùng ảnh
Dò biên:
12
Phương pháp phát hiện biên gián tiếp
-Các kỹ thuật phân vùng ảnh-
Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh, nó là một
tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đấy:
mức xám, mức màu, độ nhám,…
Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám
tương đối đồng đều hay tính kết cấu (texture) tương đồng
Phân vùng ảnh dựa theo ngưỡng biên độ
Phân vùng theo miền đồng nhất
Phân vùng dựa theo kết cấu bề mặt (texture)
13
Phương pháp phát hiện biên gián tiếp
-Phân vùng ảnh dựa theo ngưỡng biên độ-
H(k)
T1 T2 T3 T4
L mức xám
Lược đồ hình rắn lượn và cách chọn ngưỡng
⎩⎨
⎧
<
>=
Tyxin
Tyxin
yxout
),(0
),(1
),(
Đặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ
của các tính chất vật lý của ảnh như: độ phản xạ, độ truyền sáng, màu
sắc hoặc đáp ứng đa phổ. Như vậy có thể dùng ngưỡng biên độ để
phân vùng khi mà biên độ đủ lớn đặc trưng cho ảnh
Quá trình nhị phân hóa ảnh, T là ngưỡng cần xác định
14
Phương pháp phát hiện biên gián tiếp
-Phân vùng theo miền đồng nhất-
Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào
các tính chất quan trọng nào đó của miền. Việc lựa chọn các
tính chất của miền sẽ xác định tiêu chuẩn phân vùng. Tính
đồng nhất của một miền của ảnh là điểm chủ yếu xác định
tính hiệu quả của việc phân vùng
Phương pháp phân tách - cây tứ phân (split - quad trees)
Phương pháp hợp (merge)
Phương pháp tách - hợp (split - merge)
15
Phương pháp phát hiện biên gián tiếp
-Phân vùng dựa theo kết cấu bề mặt (texture)-
Tiếp cận thống kê: các đặc trưng của kết cấu sợi như độ thô,
độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng
kỹ thuật lọc tuyến tính.
Tiếp cận cấu trúc: kết cấu sợi có cấu trúc thuần nhất là những
phần tử sợi xác định, mà sự xuất hiện lặp đi lặp lại tuân theo
một luật tất định hay ngẫu nhiên nào đấy
Phân đoạn theo tính kết cấu
ACF
Lọc dải tương quan Phân tích lược đồ
Trích chọn đặc tínhu(m,n)
Đặc tính sợi
Phân tích kết cấu sợi bằng dải tương quan
16
Phương pháp phát hiện biên gián tiếp
-kỹ thuật dò biên-
Dò biên tổng quát
Bước 1: Xác định cặp nền vùng xuất phát
Bước 2: Xác định cặp nền vùng tiếp theo
Bước 3: Lựa chọn điểm biên
Bước 4: Lặp lại bước 2 cho đến khi gặp cặp nền vùng
xuất phát
17
Phương pháp phát hiện biên gián tiếp
-kỹ thuật dò biên-
Dò biên theo quy hoạch động
"Con đường tối ưu giữa 2 điểm cho trước cũng là tối ưu giữa 2
điểm bất kỳ nằm trên đường tối ưu đó"
C
E
B
D
A
C
E
Minh họa nguyên lý Bellman
18
Bài toán phát hiện góc nghiêng văn bản
Phát hiện góc nghiêng và hiệu chỉnh góc nghiêng văn bản dựa vào
chu tuyến ngoài của các đối tượng ảnh và phép biến đối Hough.
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
19
Thuật toán phát hiện góc nghiêng văn bản
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Xác định các đối tượng ảnh và
hình chữ nhật nhỏ nhất chứa nó
Lấy điểm trung bình cạnh đáy của
từng hình chữ nhật
XĐ
đường
thẳng
Tìm các đối tượng ảnh mới
và các hình chữ nhật chứa nó
Xoay văn bản với góc
tìm được
Áp dụng biến đổi Hough để xác định
đường thẳng từ tập điểm vừa tìm
được
T
F
Mô tả thuật toán phát hiện góc nghiêng văn bản
20
Sử dụng kỹ thuật dò biên để tìm các hình chữ nhật nhỏ
nhất chứa các đối tượng ảnh
Bước 1: Tìm điểm bắt đầu của một vùng và ta tìm biên
của vùng đó (chữ trên dòng)
Bước 2: Xác định điểm xuất phát của vùng tiếp theo, nếu
gặp một điểm đã xét tìm một điểm ảnh trên cùng dòng có
nhãn bằng với điểm đang xét và tiến trình tiếp tục duyệt
từ đây.
Bước 3: Nếu như chạy ngang đến một giới hạn nào đó
không thấy điểm bắt đầu của một vùng mới thì thoát khỏi
việc các hình chữ nhật nhỏ nhất chứa các chữ. Ngược lại
ta quay lại bước 2.
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
21
Áp dụng biến đổi Hough xác định góc nghiêng văn bản
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Hough[ϕ][r2]=4
R2=x.cosϕ+y.sinϕ
R1=x.cosϕ+y.sinϕ
Hough[ϕ][r1]=3
ϕ
o
y
x
Hình 3.2: Ứng dụng biến đổi Hough trong phát hiện góc nghiêng
22
Thực nghiệm
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Ảnh gốc
23
Thực nghiệm
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Ảnh thu được sau khi dò biên
24
Thực nghiệm
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Ảnh thu được sau khi quay ảnh theo chiều kim đồng hồ
25
Thực nghiệm
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Ảnh thu được sau khi chỉnh góc nghiêng
26
Với mục đích là hệ thống hóa kiến thức về các phương pháp
phát hiện biên và ứng dụng với bài toán xác định góc nghiêng
văn bản. Luận văn đã đạt được một số kết quả như sau:
Trình bày các phương pháp phát hiện biên trực tiếp dựa vào
đạo hàm, phương pháp phát hiện biên dựa trên các kỹ thuật dò
biên, các kỹ thuật phân vùng ảnh
Áp dụng phương pháp dò biên cho bài toán xác định góc
nghiêng văn bản.
Cài đặt chương trình demo phát hiện góc nghiêng văn bản và
hiệu chỉnh lại văn bản.
Kết luận
Các file đính kèm theo tài liệu này:
- ch0302001_2053.pdf