Luận văn Nghiên cứu một số phương pháp phát hiện biên và ứng dụng

Với mục đích là hệ thống hóa kiến thức về các phương pháp phát hiện biên và ứng dụng với bài toán xác định góc nghiêng văn bản. Luận văn đã đạt được một số kết quả như sau: ŠTrình bày các phương pháp phát hiện biên trực tiếp dựa vào đạo hàm, phương pháp phát hiện biên dựa trên các kỹ thuật dò biên, các kỹ thuật phân vùng ảnh ŠÁp dụng phương pháp dò biên cho bài toán xác định góc nghiêng văn bản. ŠCài đặt chương trình demo phát hiện góc nghiêng văn bản và hiệu chỉnh lại văn bản.

pdf13 trang | Chia sẻ: lylyngoc | Lượt xem: 2879 | Lượt tải: 1download
Bạn đang xem nội dung tài liệu Luận văn Nghiên cứu một số phương pháp phát hiện biên và ứng dụng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN BIÊN VÀ ỨNG DỤNG Học viên : Nguyễn Mai Anh Mã số : CH0302001 Người hướng dẫn khoa học : TS. Đỗ Năng Toàn Luận văn tốt nghiệp 2 Nội dung trình bày ƒ Đặt vấn đề ƒ Các phương pháp phát hiện biên ƒ Ứng dụng biên trong xác định góc nghiêng văn bản ƒ Kết luận 3Đặt vấn đề ƒ Mục tiêu của luận văn là nghiên cứu các phương pháp biểu diễn biên, hệ thống hóa kiến thức về các phương pháp phát hiện biên, và ứng dụng của nó trong xử lý ảnh văn bản ƒ Biên là một vấn đề quan trọng trong xử lý ảnh vì các đặc điểm trích chọn trong quá trình phân tích ảnh chủ yếu dựa vào biên. ƒ Điểm biên là nơi có sự thay đổi sự thay đổi đột ngột về mức xám. Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh. 4 Các phương pháp phát hiện biên ƒ Phương pháp phát hiện biên trực tiếp: làm nổi biên dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh. Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm. ƒ Phương pháp phát hiện biên gián tiếp: nếu bằng cách nào đấy, ta phân được ảnh thành các vùng thì đường phân ranh giữa các vùng đó chính là biên. Việc phân vùng ảnh thường dựa vào kết cấu bề mặt của ảnh. ƒ Một số phương pháp khác: Cách tiếp cận theo mô hình mặt dựa vào việc thực hiện xấp xỉ đa thức trên ảnh gốc hay ảnh đã thực hiện phép lọc Laplace. Cách tiếp cận tối ưu nhằm xác định một hàm, làm giảm phương sai hoặc giảm một số điểm cực trị cục bộ 5Phương pháp phát hiện biên trực tiếp ƒ Phương pháp Gradient: cho kết quả là ảnh biên dựa vào kỹ thuật xác định các điểm có mức xám thay đổi đột ngột nhờ kỹ thuật lấy đạo hàm bậc nhất. Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh theo 2 hướng x và y dx yxfydxxff x yxf x ),(),(),( −+≈=∂ ∂ dy yxfdyyxff y yxf y ),(),(),( −+≈=∂ ∂ Š Kỹ thuật Gradient: dùng toán tử gradient lấy đạo hàm theo 2 hướng Š Kỹ thuật la bàn: dùng toán tử la bàn lấy đạo hàm theo 8 hướng chính B, N, Đ, T, ĐB, TB, ĐN, TN. 6 Phương pháp phát hiện biên trực tiếp -kỹ thuật gradient- 9Toán tử Robert ¾ Áp dụng trực tiếp của công thức đạo hàm tại điểm (x,y). Với mỗi điểm ảnh I(x,y) của I, đạo hàm theo x, theo y được ký hiệu tương ứng bởi gx, gy được tính: ⎩⎨ ⎧ −+= −+= ),()1,( ),(),1( yxIyxIg yxIyxIg y x ⎥⎦ ⎤⎢⎣ ⎡ −= 01 10 1H ⎥⎦ ⎤⎢⎣ ⎡ − −= 10 01 2H ¾ Áp dụng toán tử Robert với ảnh nguồn I ta có ảnh kết quả Ikq như sau: Ikq=I ⊗ H1 + I ⊗ H2 ¾ Điều này tương đương với việc chập ảnh với 2 mặt nạ H1và H2: 7Phương pháp phát hiện biên trực tiếp -kỹ thuật gradient- 9 Toán tử Sobel ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ − − − = 101 202 101 1H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −−− = 121 000 121 2H 9 Toán tử Prewitt 9 Toán tử Frei-Chen ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −−− = ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ − − = 121 000 121 H 100 202 100 H cr ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ − − − = 101 101 101 1H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −−− = 101 000 111 2H 8 Phương pháp phát hiện biên trực tiếp -kỹ thuật la bàn- ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −−− −−= 333 303 555 1H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −−− − − = 333 503 553 2H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −− − −− = 533 503 533 3H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ − − −−− = 553 503 333 4H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −− −−− = 555 303 333 5H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ − − −−− = 355 305 333 6H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −− − −− = 335 305 335 7H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −−− − − = 333 305 355 8H 9 Toán tử Kirsch 9Phương pháp phát hiện biên trực tiếp -phương pháp Laplace- ƒ Toán tử Laplace được định nghĩa: ≈[2f(x,y)-f(x-1,y)-f(x+1,y)]+[2f(x,y)-f(x,y-1)-f(x,y+1)] ≈f(x+1,y)+f(x-1,y)+f(x,y+1)+f(x,y-1)-4f(x,y) 2 2 2 2 2 y f x ff ∂ ∂+∂ ∂=Δ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −= 010 141 010 1H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −= 111 181 111 2H ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ −− − −− = 121 242 121 3H ƒ 3 kiểu mặt nạ hay dùng: 10 Phương pháp phát hiện biên trực tiếp Original image Sobel Operator Prewitt Operator Frei-Chen Operator Roberts Operator Laplacian Operator Robinson Operator Kirsh Operator Hình ảnh nổi biên thu được từ việc áp dụng các toán tử 11 Phương pháp phát hiện biên gián tiếp ƒ Phân vùng ảnh ƒ Dò biên: 12 Phương pháp phát hiện biên gián tiếp -Các kỹ thuật phân vùng ảnh- ƒ Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh, nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đấy: mức xám, mức màu, độ nhám,… ƒ Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu (texture) tương đồng Š Phân vùng ảnh dựa theo ngưỡng biên độ Š Phân vùng theo miền đồng nhất Š Phân vùng dựa theo kết cấu bề mặt (texture) 13 Phương pháp phát hiện biên gián tiếp -Phân vùng ảnh dựa theo ngưỡng biên độ- H(k) T1 T2 T3 T4 L mức xám Lược đồ hình rắn lượn và cách chọn ngưỡng ⎩⎨ ⎧ < >= Tyxin Tyxin yxout ),(0 ),(1 ),( ƒ Đặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ của các tính chất vật lý của ảnh như: độ phản xạ, độ truyền sáng, màu sắc hoặc đáp ứng đa phổ. Như vậy có thể dùng ngưỡng biên độ để phân vùng khi mà biên độ đủ lớn đặc trưng cho ảnh ƒ Quá trình nhị phân hóa ảnh, T là ngưỡng cần xác định 14 Phương pháp phát hiện biên gián tiếp -Phân vùng theo miền đồng nhất- ƒ Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền. Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng. Tính đồng nhất của một miền của ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Š Phương pháp phân tách - cây tứ phân (split - quad trees) Š Phương pháp hợp (merge) Š Phương pháp tách - hợp (split - merge) 15 Phương pháp phát hiện biên gián tiếp -Phân vùng dựa theo kết cấu bề mặt (texture)- ƒ Tiếp cận thống kê: các đặc trưng của kết cấu sợi như độ thô, độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng kỹ thuật lọc tuyến tính. ƒ Tiếp cận cấu trúc: kết cấu sợi có cấu trúc thuần nhất là những phần tử sợi xác định, mà sự xuất hiện lặp đi lặp lại tuân theo một luật tất định hay ngẫu nhiên nào đấy ƒ Phân đoạn theo tính kết cấu ACF Lọc dải tương quan Phân tích lược đồ Trích chọn đặc tínhu(m,n) Đặc tính sợi Phân tích kết cấu sợi bằng dải tương quan 16 Phương pháp phát hiện biên gián tiếp -kỹ thuật dò biên- ƒDò biên tổng quát Š Bước 1: Xác định cặp nền vùng xuất phát Š Bước 2: Xác định cặp nền vùng tiếp theo Š Bước 3: Lựa chọn điểm biên Š Bước 4: Lặp lại bước 2 cho đến khi gặp cặp nền vùng xuất phát 17 Phương pháp phát hiện biên gián tiếp -kỹ thuật dò biên- ƒ Dò biên theo quy hoạch động "Con đường tối ưu giữa 2 điểm cho trước cũng là tối ưu giữa 2 điểm bất kỳ nằm trên đường tối ưu đó" C E B D A C E Minh họa nguyên lý Bellman 18 ƒ Bài toán phát hiện góc nghiêng văn bản Phát hiện góc nghiêng và hiệu chỉnh góc nghiêng văn bản dựa vào chu tuyến ngoài của các đối tượng ảnh và phép biến đối Hough. ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH GÓC NGHIÊNG VĂN BẢN 19 ƒ Thuật toán phát hiện góc nghiêng văn bản ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH GÓC NGHIÊNG VĂN BẢN Xác định các đối tượng ảnh và hình chữ nhật nhỏ nhất chứa nó Lấy điểm trung bình cạnh đáy của từng hình chữ nhật XĐ đường thẳng Tìm các đối tượng ảnh mới và các hình chữ nhật chứa nó Xoay văn bản với góc tìm được Áp dụng biến đổi Hough để xác định đường thẳng từ tập điểm vừa tìm được T F Mô tả thuật toán phát hiện góc nghiêng văn bản 20 ƒ Sử dụng kỹ thuật dò biên để tìm các hình chữ nhật nhỏ nhất chứa các đối tượng ảnh Š Bước 1: Tìm điểm bắt đầu của một vùng và ta tìm biên của vùng đó (chữ trên dòng) Š Bước 2: Xác định điểm xuất phát của vùng tiếp theo, nếu gặp một điểm đã xét tìm một điểm ảnh trên cùng dòng có nhãn bằng với điểm đang xét và tiến trình tiếp tục duyệt từ đây. Š Bước 3: Nếu như chạy ngang đến một giới hạn nào đó không thấy điểm bắt đầu của một vùng mới thì thoát khỏi việc các hình chữ nhật nhỏ nhất chứa các chữ. Ngược lại ta quay lại bước 2. ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH GÓC NGHIÊNG VĂN BẢN 21 ƒ Áp dụng biến đổi Hough xác định góc nghiêng văn bản ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH GÓC NGHIÊNG VĂN BẢN Hough[ϕ][r2]=4 R2=x.cosϕ+y.sinϕ R1=x.cosϕ+y.sinϕ Hough[ϕ][r1]=3 ϕ o y x Hình 3.2: Ứng dụng biến đổi Hough trong phát hiện góc nghiêng 22 ƒ Thực nghiệm ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH GÓC NGHIÊNG VĂN BẢN Ảnh gốc 23 ƒ Thực nghiệm ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH GÓC NGHIÊNG VĂN BẢN Ảnh thu được sau khi dò biên 24 ƒ Thực nghiệm ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH GÓC NGHIÊNG VĂN BẢN Ảnh thu được sau khi quay ảnh theo chiều kim đồng hồ 25 ƒ Thực nghiệm ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH GÓC NGHIÊNG VĂN BẢN Ảnh thu được sau khi chỉnh góc nghiêng 26 ƒ Với mục đích là hệ thống hóa kiến thức về các phương pháp phát hiện biên và ứng dụng với bài toán xác định góc nghiêng văn bản. Luận văn đã đạt được một số kết quả như sau: Š Trình bày các phương pháp phát hiện biên trực tiếp dựa vào đạo hàm, phương pháp phát hiện biên dựa trên các kỹ thuật dò biên, các kỹ thuật phân vùng ảnh Š Áp dụng phương pháp dò biên cho bài toán xác định góc nghiêng văn bản. Š Cài đặt chương trình demo phát hiện góc nghiêng văn bản và hiệu chỉnh lại văn bản. Kết luận

Các file đính kèm theo tài liệu này:

  • pdfch0302001_2053.pdf