MỤC LỤC
Lời nói đầu
Chương I. TỔNG QUAN VỀ PHÂN TÍCH ẢNH
1.Khái quát về biên và phân loại các kỹ thuật dò biên
1.1. Khái niệm về biên
1.2. Phân loại các kỹ thuật phát hiện biên
2. Quá trình phát hiện biên
Chương II. CÁC PHƯƠNG PHÁP DÒ BIÊN
1. Sự phân đoạn và dò biên
1.1. Thao tác vùng
1.2. Dò biên thô
1.3. Kết hợp các vùng
2. Các phương pháp dò biên cơ bản
2.1. Phép lấy đạo hàm bậc nhất cho phương pháp dò biên
2.2. Phương pháp dò biên Sobel
2.3. Phép toán được quan tâm khác
3. Dò bậc hai
3.1. Xác định cắt điểm không
3.2. Dò biên màu
4. Phương pháp dò biên Phương pháp dò biên Laplace
5. Phương pháp dò biên hình chóp(pyramid EDGE detection)
6. Crack edge relation(Tách giới hạn biên)
7. Kỹ thuật đạo hàm tích chập – phương pháp Canny
8. Dò biên theo quy hoach động
8.1. Mô tả phương pháp
8.2. Thuật toán
9. Một số thuật toán khác
53 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 9222 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Xử lý ảnh các phương pháp dò biên, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ủa ảnh là điểm có sự biến đổi đột ngột về độ xám.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
Như vậy, phát hiện biên một cách lý tưởng là xác định được tất cả cả các đường
bao trong đối tượng. Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật
phát hiện biên. Điều quan trọng là sự biến thiên mức xám giữa các điểm ảnh trong
một vùng thường là nhỏ, trong khi đó biến thiên mức xám của điểm giáp ranh lại
khá hơn.
1.2. Phân loại các kỹ thuật phát hiện biên
Xuất phát từ định nghĩa toán học của biên người ta thường sử dụng 2 phương pháp
phát hiện biên sau:
- Phương pháp phát hiện biên trực tiếp: Phương pháp này nhằm làm nổi biên
dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh.Kỹ thuật chủ yếu dùng
phát hiện biên ở đây là kỹ thuật đạo hàm.Nếu lấy đạo hàm bậc nhất của ảnh, ta
có phương pháp Gradient.Nếu lấy đạo hàm bậc hai, ta có phương pháp
Laplace.Hai kỹ thuật trên gọi là phương pháp dò biên cục bộ.Ngoài ra, người ta
cũng sử dụng phương pháp “đi theo đường bao” : dựa vào nguyên lý quy hoạch
động và được gọi là phương pháp dò biên tổng thể.
- Phương pháp phát hiện biên gián tiếp: Bằng cách nào đó, ta phân được ảnh
thành các vùng thì đường phân ranh giữa các vùng đó chính là biên.Việc phân
vùng ảnh thường dựa vào kết cấu bề mặt ảnh.
Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu của nhau.Thực vậy, dò
biên để thực hiện phân lớp đối tượng và một khi đã phân lớp xong có nghĩa là đã
phân vùng được ảnh.Và ngược lại, khi đã phân vùng, ảnh đã phân lập được thành
các đối tượng, ta có thể phát hiện được biên.Phương pháp dò biên trực tiếp tỏ ra
khá hiệu quả vì ít chịu ảnh hưởng của nhiễu.Nếu biến đổi gián tiếp tuy khó cài đặt,
song lại áp dụng khá tốt khi sự biến thiên độ sáng nhỏ.
2.Quá trình phát hiện biên
-Vì ảnh thu nhận thường có nhiễu nên bước đầu tiên là khử nhiễu.
-Tiếp theo là tiến hành làm nổi biên bởi các toán tử đạo hàm.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
- Định vị điểm biên.Vì các kỹ thuật làm nổi biên có hiệu ứng phụ là tăng nhiễu,
do vậy sẽ có một điểm biên giả cần bị loại bỏ.
-Liên kết và trích chọn biên.
Chương II.Các phương pháp dò biên
1.Sự phân đoạn và dò biên
1.1.Thao tác vùng
Việc khám phá các vùng có thể là một việc rất đơn giản ,như được minh hoạ trong
mục 1.1.1.tuy nhiên thường không nhiều hơn ,những vùng được yêu cầu mà bao
trùm một vùng thật của ảnh hơn là mổh nhóm các diểm ảnh.
1.2.Dò biên thô
Sử dụng: xem xét một hình ảnh như là một tập hợp các vùng .
thuật toán:dò biên thô không phải là một phương pháp phức tạp .những vùng đơn
giản được xác định như vùng các điểm cùng mức xám , đường biên của các vùng là
tách những điểm ảnh hơn tại vị trí điểm.
như việc dò một vùng có thể đưa ra một số các vùng hữu ích (trừ khi số các mức
xám là tương đối nhỏ ).như vậy một phương pháp đơn giản là nhóm lại những điểm
ảnh vào trong hững phạm vi của những giá trị gần (q hoặc tự nhóm).các
vùng(miền) có thể là việc xem xét các biểu đồ hình ảnh để xác định tốt sự tự
nhhóm cho mục đích vùng kết quả trong việc kết hợp toàn bộ mức xám vùng cơ sở
nhiều hơn các mức xám của điểm ảnh mà nó gần với một vùng khác .
1.3. Kết hợp các vùng
Việc kết hợp các vùng là rất hữu ích cho việc tách thô các mức xám và thực hiện
một số kỹ thuật trên những vết rạn giữa những vùng_không làm tăng biên nhưng để
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
xác định khi toàn bộ các vùng cần phải nối (kết hợp_-như vậy làm giảm số các
vùng từ việc tìm vùng thô ở trên .
2. Các phương pháp dò biên cơ bản
Biên của một hình ảnh giữ nhiều thông tin trong hình ảnh đó .các biên cho biết các
đối tượng ở đâu ,hình dạng và kích thước của đối tượng,và cái gì đó để kết cấu của
đối tượng .biên là nơi cương độ của một hình ảnh di chuyển từ một giá trị thấp đến
giá trị cao.
Rất nhiều các ứng dụng cho phương pháp dò biên ,mà được sử dụng cho một số
hiệu ứng đặc biệt .những nghệ sỹ kỹ thuật số sử dụng nó để làm rõ nét các đường
nét của hình ảnh .kết quả của việc dò biên có thể đưa thêm vào hình ảnh để làm nổi
bật các đường biên.
Biên trong ảnh là những vùng có cường độ tương phản mạnh, một bước nhảy từ
điểm ảnh tới điểm ảnh kế tiếp.Dò biên một ảnh giúp giảm đáng kể số lượng và lọc
ra những thông tin không hữu ích, trong khi đó bảo quản được các thuộc tính cấu
trúc của ảnh.Có rất nhiều cách thực hiện dò biên.Tuy nhiên các phương pháp chính
khác nhau có thể được nhóm vào thành hai loại, Gradient và Laplacian.Phương
pháp Gradient dò biên bằng cách tìm kiếm giá trị lớn nhất và giá trị nhỏ nhất trong
đạo hàm bậc nhất của ảnh.Phương pháp Laplace tìm kiếm các vạch không trong
đạo hàm bậc hai của ảnh để tìm biên.Biên có dạng một chiều và tính toán đạo hàm
của ảnh có thể làm nổi vị trí đó.Chúng ta có thể sử dụng kí hiệu f(t) sau với biên chỉ
ra bước nhảy của cường độ bên dưới:
Nếu ta lấy gradient của kí hiệu này ở dạng một chiều, chỉ ra đạo hàm bậc một của
biến t, ta nhận được:
Rõ ràng đạo hàm bậc một cho xác định giá trị lớn nhất tại tâm của biên.Phương
pháp xác định biên này là đặc trưng của nhóm lọc gradient nếu giá trị của gradient
vượt quá vài ngưỡng.Như đã đề cập, biên sẽ có giá trị cường độ điểm ảnh cao hơn
so với các vùng khác.Nên mỗi lần, một ngưỡng được đặt, ta có thể so sánh giá trị
gradient với giá trị một ngưỡng và dò biên khi mà ngưỡng được mở rộng.Hơn nữa
khi mà đạo hàm bậc nhất đạt giá trị lớn nhất, đạo hàm bậc hai bằng 0.Một cách
khác để tìm ra vị trí của biên là xác định các giá trị 0 của đạo hàm bậc hai của hàm
bên dưới:
Phương pháp dò biên thường bước đầu tiên là việc phân vùng hình ảnh .phân vùng
ảnh là một lĩnh vực của phân tích ảnh , được sử dụng đểvnhóm những điểm vào
trong các vùng để xác định thành phần cấu tạo một ảnh .
một ví dụ phổ biến của phân vùng ảnh là”magic wand”( đũa thần ma thuật )công cụ
phần mền trong xử lý ảnh .công cụ này cho phép người dùng lựa chọn một diểm
trong một hình ảnh .phần mền này vẽ một đường bao quanh những điểm có giá trị
giống nhau.người dùng có thể lựa chọn một diểm trong vùng bầu trời và đuã thần
ma thuật sẽ vẽ một đường bao kín vùng bầu trời trong ảnh .người dùng có thể sửa
đổi màu của vùng trời mà không gây ra sự biến đổi màu cắc các dãy núi hoặc bất
cứ phần nào có mặt trong hình ảnh .
phương pháp dò biên cũng sử dụng đăng ký (registration) ảnh .việc đăng ký hình
ảnh sắp thẳng hàng hai hình ảnh mà có thể thu đựoc tại các phần mền riêng biệt
hoặt từ những phân tử nhảy khác nhau.
roof edge line edge step edge ramp edge
Hình1.1 Một số đường biên khác nhau.
K
IL
O
BO
O
K
S.
CO
M
Có rất nhiều các kiểu biên,về chiều và hình dạng (hình1.1).Một số biên là đường
thẳng trong khi những biên khác được uốn cong bằng việc thay đổi giá trị radian.có
rất nhiều phương pháp dò biên sử dụng tất cả ngững đường biên trên,từng cái có
những điểm mạnh của riêng nó .một vài phương pháp dò biêncó thể sử dụng tốt
trong một số ứng dụng và thực hiện kém (không hiệu quả)trong ứng dụng khác.
Đôi khi nó được sử dụng thí nghiệm để xác định đâu là phương pháp dò biên tốt
nhất cho một ứng dụng.
Phương pháp dò biên đơn giản nhất và nhanh nhất là xác định giá trị cực đằit một
loạt các phép thuần nhất (đồng nhất)trừ điểm ảnh.phép toán trừ mỗi 8 điểm ảnh phụ
cận (vây quanh)từ một điểm trung tâm của một cửa sổ 3x3 trong hình 1.2 đầu ra
của phép toán là giá trị tuyệt đối cực đại của mỗi phần khác nhau.
homogenety operator image
11
11
11
11
1216
16
13 15
Phép toán đồng nhất ảnh
Hình 1.2 sử dụng các thuật toán đồng nhất.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
điểm ảnh mới=max{|11-11|,|11-13|,|11-15|,|11-16|,|11-11|,|11-16|,|11-12|,|11-11|}=5
Tương tự thuật toán thuần nhất là thiết bị dò biên khác .các thao tác của nó nhanh
hơn bởi vì nó chỉ phụ thuộc vào 4 phép trừ mỗi điểm ảnh khác với thuật toán thuần
nhất cần 8 phép trừ.các phép trừ là phần trên trái -phần dưới phải,giữa trái -giữa
phải ,dưới trái –trên phải ,và giá trị giữa trên-giá trị dưới ở giữa(hình1.3)
homogenety operator image
11
11
11
11
1216
16
13 15
Thuật toán thuần nhất ảnh
Hình 1.3 Sử dụng thuật toán khác.
điểm ảnh mới=max{|11-11|,|13-12|,|15-16|,|11-16|}=5
2.1. Phép lấy đạo hàm bậc nhất cho phương pháp dò biên.
Nếu chúng ta đang tìm kiếm mọi đường biên nằm ngang nào nó sẽ nhận được tính
toán sự khác nhau giữa một giá trị điểm và giá trị điểm tiếp theo,hoặc lên trên hoặc
xuống từ đầu(được gọi là sự tách khác nhau)ví dụ giả thiết đỉnh trái gốc.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
Hc=yk(x,y)=(x,y)-(x,y+1)
trên thực tế nó tương đương với việc thu nhỏ hình với mẫu 2x1
1
-1
Tương tự
Hr=Xk(x,y)=(x,y)-(x-1,y)
Sử dụng kết quả
-1 1
Hc và Hr là các giá trị xác định cột và dòng. Đôi khi nó rất tiện lợi để phát hoạ cả Xk
và Yk việc kết hợp chúng tạo nên độ lớn gradien(ví dụ cường độ của biên).việc kết
hợp chúng bằng việc gộp hoàn toàn chúng có thể cho giá trị trung bình hai biên loại
bỏ ngoài lẫn nhau(một là xác thực,một là không xác thực),vì vậy nó là tốt nhất cho
việc tính tổng các giá trị thực(không cần quan tâm đến dấu )hoặc tính tông các bình
phương của nó và khi đó có thể lấy căn bậc hai bình phương của kết quả thu được .
Nó cũng chia Xk bởi Yk và xác định một chiều gradien(góc của biên ở giữa các
vùng):
=
−
y)ce(x,X_differen
y)ce(x,Y_differen
tanirectiongradient_d 1
Độ lớn có thể tính bằng tổng vectơ Hc và Hr:
)y,x(H)y,x(H)y,x(H 2c2r +=
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
Đôi khi cho việc tính toán đơn giản , độ lớn được tính là:
)y,x(H)y,x(H)y,x(H cr +=
Việc định hướng biên có thể tìm bởi
( )
( )y,xH
y,xH
tan
r
c1−
=θ
trong hình ảnh thực tế ,các hàng ít khi được định nghĩa tốt như vậy,thường thì sự
thay đổi giữa các vùng là từ từvà sặc sỡ hơn.
Hình ảnh sau đây là điển hình việc đọc biên.mẫu này đã càn để tính tỷung bình
gradien thông qua một số các điểm ảnh ,hơn là việc tính toán với hai con số
3444332100
2342334010
3333433100
3233430200
2420001000
3302000000
Các toán tử đạo hàm được áp dụng khá nhiều. Ở đây ta chỉ xét một số toán tử tiêu
biểu: Robert, Sobel,…
2.2. Phương pháp dò biên Sobel
Toán tử sobel nhạy cảm với các biên chéo hơn so với các biên thẳng đứng và các
biên nằm ngang.chuẩn sobel 3x3 thương đựoc sử dụng như:
X
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
121
000
121 −−−
Y
101
202
101
−
−
−
ảnh gốc :
3444332100
2342334010
3333433100
3233420200
2420001000
3302000000
|A|+|B|
8842212122
42421014104
061216201086
414121410464
giới hạn tại 12
0000110
00000100
00111002
11110000
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
Dựa trên phân tích một chiều, lý thuyết này có thể được áp dụng vào trường hợp
hai chiều, tính toán được chính xác xấp xỉ đạo hàm ảnh hai chiều.Toán tử Sobel
thực hiện phép đo gradient không gian hai chiều trong một ảnh. Điển hình nó được
sử dụng tìm ra giá trị tuyệt đối xấp xỉ độ rộng gradient tại mỗi điểm trong độ xám
ảnh đầu vào.Phương pháp dò biên Sobel sử dụng cặp mặt nạ xoắn 3X3, ước lượng
gradient theo cột x, hàng y.Một mặt nạ xoắn thường nhỏ hơn nhiều so với ảnh
thực.Mặt nạ là slide trên ảnh, thao tác thực hiện các điểm ảnh trên cùng một
lúc.Mặt nạ Sobel được chỉ ra ở hình dưới.
Độ dài đường dốc được tính bởi công thức:
Tính xấp xỉ:
K
IL
O
BO
O
K
S.
CO
M
|G| = |Gx| + |Gy|
Mã của phương pháp dò biên Sobel :
FILE: edgeSob.c - WORKS!!
AUTH: Bill Green
DESC: 2 3x3 Sobel masks for edge detection
DATE: 07/23/02
REFS: edgeLap.c
*/
#include
#include
#include
#include
/*-------STRUCTURES---------*/
typedef struct {int rows; int cols; unsigned char* data;} sImage;
/*-------PROTOTYPES---------*/
long getImageInfo(FILE*, long, int);
void copyImageInfo(FILE* inputFile, FILE* outputFile);
void copyColorTable(FILE* inputFile, FILE* outputFile, int nColors);
int main(int argc, char* argv[])
{
FILE *bmpInput, *bmpOutput;
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
sImage originalImage;
sImage edgeImage;
unsigned int X, Y;
int I, J;
long sumX, sumY;
int nColors, SUM;
unsigned long vectorSize;
unsigned long fileSize;
int GX[3][3];
int GY[3][3];
unsigned char *pChar, someChar;
unsigned int row, col;
someChar = '0'; pChar = &someChar;
/* 3x3 GX Sobel mask. Ref: www.cee.hw.ac.uk/hipr/html/sobel.html */
GX[0][0] = -1; GX[0][1] = 0; GX[0][2] = 1;
GX[1][0] = -2; GX[1][1] = 0; GX[1][2] = 2;
GX[2][0] = -1; GX[2][1] = 0; GX[2][2] = 1;
/* 3x3 GY Sobel mask. Ref: www.cee.hw.ac.uk/hipr/html/sobel.html */
GY[0][0] = 1; GY[0][1] = 2; GY[0][2] = 1;
GY[1][0] = 0; GY[1][1] = 0; GY[1][2] = 0;
GY[2][0] = -1; GY[2][1] = -2; GY[2][2] = -1;
if(argc < 2) {
printf("Usage: %s bmpInput.bmp\n", argv[0]);
exit(0);
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
};
printf("Reading filename %s\n", argv[1]);
/*-------DECLARE INPUT & OUTPUT FILES-------*/
bmpInput = fopen(argv[1], "rb");
bmpOutput = fopen("edgeSob.bmp", "wb");
/*---SET POINTER TO BEGINNING OF FILE----*/
fseek(bmpInput, 0L, SEEK_END);
/*-------GET INPUT BMP DATA--------*/
fileSize = getImageInfo(bmpInput, 2, 4);
originalImage.cols = (int)getImageInfo(bmpInput, 18, 4);
originalImage.rows = (int)getImageInfo(bmpInput, 22, 4);
edgeImage.rows = originalImage.rows;
edgeImage.cols = originalImage.cols;
/*--------PRINT DATA TO SCREEN----------*/
printf("Width: %d\n", originalImage.cols);
printf("Height: %d\n", originalImage.rows);
printf("File size: %lu\n", fileSize);
nColors = (int)getImageInfo(bmpInput, 46, 4);
printf("nColors: %d\n", nColors);
/*------ALLOCATE MEMORY FOR FILES--------*/
vectorSize = fileSize - (14+40+4*nColors);
printf("vectorSize: %lu\n", vectorSize);
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
edgeImage.data = farmalloc(vectorSize*sizeof(unsigned char));
if(edgeImage.data == NULL) {
printf("Failed to malloc edgeImage.data\n");
exit(0);
}
printf("%lu bytes malloc'ed for edgeImage.data\n", vectorSize);
originalImage.data = farmalloc(vectorSize*sizeof(unsigned char));
if(originalImage.data == NULL) {
printf("Failed to malloc originalImage.data\n");
exit(0);
}
printf("%lu bytes malloc'ed for originalImage.datt\n", vectorSize);
/*------COPY HEADER AND COLOR TABLE---------*/
copyImageInfo(bmpInput, bmpOutput);
copyColorTable(bmpInput, bmpOutput, nColors);
fseek(bmpInput, (14+40+4*nColors), SEEK_SET);
fseek(bmpOutput, (14+40+4*nColors), SEEK_SET);
/* Read input.bmp and store it's raster data into originalImage.data */
for(row=0; row<=originalImage.rows-1; row++) {
for(col=0; col<=originalImage.cols-1; col++) {
fread(pChar, sizeof(char), 1, bmpInput);
*(originalImage.data + row*originalImage.cols + col) = *pChar;
}
}
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
/*---------------------------------------------------
SOBEL ALGORITHM STARTS HERE
---------------------------------------------------*/
for(Y=0; Y<=(originalImage.rows-1); Y++) {
for(X=0; X<=(originalImage.cols-1); X++) {
sumX = 0;
sumY = 0;
/* image boundaries */
if(Y==0 || Y==originalImage.rows-1)
SUM = 0;
else if(X==0 || X==originalImage.cols-1)
SUM = 0;
/* Convolution starts here */
else {
/*-------X GRADIENT APPR XIMATION------*/
for(I=-1; I<=1; I++) {
for(J=-1; J<=1; J++) {
sumX = sumX + (int)( (*(originalImage.data + X + I + (Y +
J)*originalImage.cols)) * GX[I+1][J+1]);
}
}
if(sumX>255) sumX=255;
if(sumX<0) sumX=0;
/*-------Y GRADIENT APPROXIMATION-------*/
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
for(I=-1; I<=1; I++) {
for(J=-1; J<=1; J++) {
sumY = sumY + (int)( (*(originalImage.data + X + I + (Y +
J)*originalImage.cols)) * GY[I+1][J+1]);
}
}
if(sumY>255) sumY=255;
if(sumY<0) sumY=0;
SUM = abs(sumX) + abs(sumY); /*---GRADIENT MAGNITUDE
APPROXIMATION (Myler p.218)----*/
}
*(edgeImage.data + X + Y*originalImage.cols) = 255 - (unsigned
char)(SUM); /* make edges black and background white */
fwrite( (edgeImage.data + X + Y*originalImage.cols), sizeof(char), 1,
bmpOutput);
}
}
printf("See edgeSob.bmp for results\n");
fclose(bmpInput);
fclose(bmpOutput);
farfree(edgeImage.data); /* Finished with edgeImage.data */
farfree(originalImage.data); /* Finished with originalImage.data */
return 0;
}
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
/*----------GET IMAGE INFO SUBPROGRAM--------------*/
long getImageInfo(FILE* inputFile, long offset, int numberOfChars)
{
unsigned char *ptrC;
long value = 0L;
unsigned char dummy;
int i;
dummy = '0';
ptrC = &dummy;
fseek(inputFile, offset, SEEK_SET);
for(i=1; i<=numberOfChars; i++)
{
fread(ptrC, sizeof(char), 1, inputFile);
/* calculate value based on adding bytes */
value = (long)(value + (*ptrC)*(pow(256, (i-1))));
}
return(value);
} /* end of getImageInfo */
/*-------------COPIES HEADER AND INFO HEADER----------------*/
void copyImageInfo(FILE* inputFile, FILE* outputFile)
{
unsigned char *ptrC;
unsigned char dummy;
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
int i;
dummy = '0';
ptrC = &dummy;
fseek(inputFile, 0L, SEEK_SET);
fseek(outputFile, 0L, SEEK_SET);
for(i=0; i<=50; i++)
{
fread(ptrC, sizeof(char), 1, inputFile);
fwrite(ptrC, sizeof(char), 1, outputFile);
}
}
/*----------------COPIES COLOR TABLE-----------------------------*/
void copyColorTable(FILE* inputFile, FILE* outputFile, int nColors)
{
unsigned char *ptrC;
unsigned char dummy;
int i;
dummy = '0';
ptrC = &dummy;
fseek(inputFile, 54L, SEEK_SET);
fseek(outputFile, 54L, SEEK_SET);
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
for(i=0; i<=(4*nColors); i++) /* there are (4*nColors) bytesin color table */
{
fread(ptrC, sizeof(char), 1, inputFile);
fwrite(ptrC, sizeof(char), 1, outputFile);
}
}
Giải thích Sobel:
Mặt nạ Sobel được phủ trên một vùng của ảnh vào, thay đổi giá trị của điểm ảnh và
sau đó chuyển đổi ảnh sang phải và tiếp tục sang phải cho đến khi nó tìm ra vị trí
cuối cùng của hàng.Sau đó nó lại bắt đầu tại vị trí đầu của hàng kế tiếp.Ví dụ dưới
đây chỉ ra mặt nạ được phủ trên vùng trái phía đầu của ảnh và hiển thị bởi đường
màu xanh.Phương thức đó chỉ ra một điểm ảnh sẽ được tính toán.Tâm của mặt nạ
được xác định trên một điểm ảnh ta đang thao tác trên ảnh.Giá trị I và J được sử
dụng để chuyển file con trỏ.
Ví dụ: ảnh 22 tương ứng giá trị mặt nạ m22.
Chú ý rằng các điểm ảnh ở hàng đầu tiên và cuối cùng cũng như cột cuối cùng
không thể được thực hiện bởi mặt nạ 3X3.Bởi vì khi xác định điểm giữa của mặt nạ
trên một điểm ảnh ví dụ ở hàng đầu tiên, mặt nạ sẽ ở bên ngoài viền ảnh.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
Mặt nạ GX làm nổi biên theo hướng nằm ngang .Trong khi mặt nạ GY làm nổi biên
theo hướng thẳng đứng.Sau khi xác định độ lớn của cả 2, kết quả dò biên theo cả 2
hướng được đưa ra.
2.3 Phép toán được quan tâm khác :
Toán tử Roberts có hiểu quả nhỏ hơn so với các thuật toán khác ,nó dễ tạo ra các
tạp nhiễu.
−
=
−
=
000
010
001
H
000
010
100
H cr
Thuật toán Prewit nhạy cảm đối với các biên thẳng đứng và ngang hơn so với các
biên đường chéo.
−
−
−
=
−−−
=
101
101
101
H
111
000
111
H cr
K
IL
O
BO
O
K
S.
CO
M
mặy nạ Frei-chen.
−−−
=
−
−
=
121
000
121
H
100
202
100
H cr
3. Dò bậc hai
Trong nhiều ứng dụng ,chiều rông biên không được quan tâm
đến .trong những ứng dụng khác ,như các thiết bị dò tìm ,nó khá được chú trọng
đến .thuật toán gradien đã nói ở trên đã giải đáp giữa hai vẫn đề trên tại vùng mà
biên đang xét .nó là tốt nhất cho việc xây dựng dần các đường biên gốc . đúng như
ý tưởng ,việc tìm một đường biên cần phải chỉ ra mọi đường biên tại trung tâm của
một biên . được đề cập ở đây là sự định vị .nếu việc xác định một biên tạo ra một
bản đồ hình ảnh với các biên khác nhau mở rộng các điểm ảnh ,nó là khó khăn để
định vị các trung tâm của các biên .nó trở thành cần thiết để mượn một tiến trình
nghèo nàn để làm bớt bề rộng của biên tới một điểm ảnh .phần này cung cấp tốt
hơn sự định vị biên .
Ví dụ: Một hình ảnh như sau:
987654321
987654321
987654321
987654321
987654321
Toán tử cơ bản Sobel dò biên thẳng đứng như miêu tả ở trên sẽ nhượng bộ một giá
trị đúng kéo dài từ bên này sang bên kia hình ảnh.Ví dụ nếu:
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
101
202
101
−
−
−
được sử dụng thì kết quả là:
8888888
8888888
8888888
Thực hiện giống như chuẩn trên đây “tất cả 8 hình ảnh đã nhượng bộ “.
00000000
Nó không khác như các thuật toán khác với một đường thẳng ,ví dụ nếu y=3x-2
2
2
dx
yd
and3
dx
dy
=
Một lần chúng ta có đường dốc ,nếu đường dốc đã được phân biệt và kết quả là
không ,nó chỉ ra rằng đường gốc là đường thẳng .
Các hình ảnh thường là màu xám mức”khuynh hướng”với chúng ,…một mặt các
vùng là sáng hơn các vùng khác ,nhưng ở đó không có biên nào sẽ được tim ta
trong vùng ,hiệu ứng đánh bóng là trơn tru,nói ngắn gọn một nguồn sáng mà nó là
rõ ràng hơn ở thời điểm kết thúc ,hoặc thay đổi màu dần dần qua bề mặt.
điểm thuận lợi khác của phương pháp lấy đạo hàm bậc hai là dò các viền biên là
những đường cong khép kín . điều này rất quan trọng trong việc phân đoạn hình
ảnh .ngoài ra,nó không phản ứng lại các vùng của sự thay đổi tuyến tính smoot
trong cường độ .
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
kỹ thuật Laplace là một thí dụ trong kỹ thuật lấy đạo hàm bậc hai .nó tương đối như
những toán tử khác bởi vì nó tác dụng theo mọi hướng .nó sẽ tô sáng điểm biên
trong tất cả các hướng .toán tử laplace sẽ đưa ra các biên không chuẩn xác hơn (
sharper)so với đa số các kỹ thuật khác .các vùng sáng bao gồm giá trị dương và âm
của cường độ dốc(slope).
Biên laplace của một ảnh có thể tìm được bởi kết hợp với các mặt nạ như :
010
141
010
−
−−
−
or
111
181
111
−−−
−−
−−−
Tập hợp các toán tử laplace được sử dụng rông rãi .nó có hiệu quả loại bỏ gradient
tổng quát của ánh sáng hoặc màu từ một hình ảnh nó chỉ tìm ra và tăng sự thay đổi
rời rạc (chậm)hơn,cho thí dụ ,với toán tử sobel.nó không đưa ra mọi thông tin trên
hướng mà nó xem xét như một chức năng của sự dân dân thay đổi .nó làm tăng tạp
nhiễu ,mặc dù các toán tử laplace lớn hơn và những họ tương đồng của các toán tử
có khuynh hướng lờ đi tạp nhiễu .
3.1. Xác định cắt điểm không
Đối với biên đang xét phương thức của việc cắt điểm không với một vài yêu cầu
giới hạn là thông qua một mặt nạ 3x3 qua hình ảnh mà đang xác định giá trị max và
min.nếu sự khác nhau giữa các giá trị max và min vượt quá giới hạn định đã cho
trước .thông báo số lớn các biên với giới hạn nhỏ hơn.chú ý chiều rộng của tất cả
các biên là một điểm ảnh mở rộng .
một kỹ thuật dò biên lấy đạo hàm bậc hai là ít nhạy cảm với nhiễu là laplace của
gauss(log).dò biên LoG do gauss thực hiện làm nhẵn trước ứng dụng của
Laplace.cả hai toán tử có thể thực hiện bằng việc hợp với một mặt nạ của biểu mẫu:
2
22
2
)y(x
2
22
4 e2
yx11y)LoG(x, σ
+−
σ
+
−
piσ
=
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
ở đây x,y đang xét là các dòng và cột của một hình ảnh ,0 là một giá trị của sự tán
sắc mà các điều khiển có kết quả spread.
Do hình dạng của nó ,hàm này được gọi là lọc .hình biểu diễn đoạn của toán tử dò
biên LoG với các giá trị khác nhau của o .hàm được mở rộng hơn ,biên mở rộng mà
nó sẽ tìm được.thu hẹp một hàm sẽ tìm được hình dạng và các chi tiết các biên hơn.
Hình 1.4 Giao của LoG với giá trị
Giá trị lớn hơn của 0, mở rộng sự xoắn lại mặt nạ cần thiết .cắt điểm không đầu tiên
của hàm LoG tại σ2 .The width of the positive center lobe is twice that. để có một
cuộn mặt nạ mà chứa đựng nhứng giá trị khác không của hàmLoG yêu cầu chiều
rộng bằng ba lần chiều rộng của vành dương trung tâm.
Phương pháp dò biên dựa trên hàm nhẵn gauss nhằm giảm bớt tạo nhiễu trong hình
ảnh .nó sẽ làm giảm bớt đi các biên đã tìm không đúng và cũng tìm được các biên
mơ rộng .
Đa số các mặt nạ dò biên ít khi lớn hơn 7x7 .vì hình dạng của thuật toán LoG ,nó
yêu cầu nhiều mặt nạ kích thước lớn hơn .ban đầu phản đối (work in)sự phát triển
thuật toán log dã làm việc với một mặt nạ kích thước 35x35.
bởi vì những yêu cầu tính toán lớn của thuật toán log ,thuật toán khác của gauss
(dog)có thể sử dụng như một phép tính xấp xỉ cho log.dog có thể được cho:
2
2
2
yx
2
1
2
yx
2
e
2
ey)DoG(x,
2
2
22
2
1
22
piσ
−
piσ
=
piσ
+
−
piσ
+
−
Thuật toán dog đựoc thưc hiện bởi phép quẫn lại một hình ảnh với một mặt nạ bằng
kết quả của phép trừ hai mặt nạ gauss với các giá trị khác nhau.kết qua tỷ số 1/
2 = 1.6 thu được trong phép tính xấp xỉ của LoG.Hình 4.5 so sánh hàm LoG ( =
12.35) với hàm DoG (1 = 10, 2 = 16).
Hình 1.5 Hàm LoG và hàm DoG.
Một thuận lợi của DoG là khả năng định rõ bề rộng của các biên để dò tìm bằng các
giá trị khác nhau của và . ở đây xé một hai cặp mặt nạ .mạt nạ 9x9 sẽ tìm được
các biên rộng hơn mặt nạ 7x7.
Mặt nạ7x7,
K
IL
O
BO
O
K
S.
CO
M0011100
0233320
1355531
13516531
1355531
0233320
0011100
−−−
−−−−−
−−−−
−−−−
−−−−
−−−−−
−−−
Mặt nạ 9x9,
000111000
022333320
033111230
131999131
1319199131
131999131
033111230
022333320
000111000
−−−
−−−−−−−
−−−−−−−
−−−−−−
−−−−−−
−−−−−−
−−−−−−−
−−−−−−−
−−−
3.2. Dò biên màu
Phương thức của sự dò tìm các biên trong ảnh màu phụ thuộc vào việc định nghĩa
biên của bạn . định nghĩa một biên là gián đoạn (tính không liên tục ) độ chói trong
một hình ảnh . đò biên sẽ được thực hiện trê kênh cường độ của một màu trong
không gian HIS.
định nghĩa khác đòi hỏi rằng một biên tồn tại nếu có mặt kênh màu đỏ ,xanh lục và
xanh.dò biên có thể được làm bằng việc thực hiện trên mỗi màu thành phần của nó
,sau đó phối hợp các màu thành phần ,hình ảnh thu được màu vẫn giữ nguyên (still
color).xem hình 1.6.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
Hình 1.6(a)hình ảnh gốc ;(b)kênh màu đỏ ;(c)kênh màu xanh lục;(d) kênh màu
xanh;(e)biên kênh màu đỏ;(e)Biên kênh màu xanh lục ;(e)biên kênh màu xanh.
Dò biên cũng có thể thực hiện trên mỗi phần màu và các thành phần có thể được
tổng hợp lại đẻ tạo ra một bản đồ biên dải màu xám .ngoài ra ,các thành phần màu
có thể là tổng các vec to để tạo ra bản đồ biên dải màu xám.
2
blue
2
green
2
red GGGy)G(x, ++=
Nó đã được chỉ ra rằng phần lớn các biên dựa trên các phân tử màu của một hình
ảnh ngoài ra cũng dựa trên thành phần cường độ .
4. Phương pháp dò biên Phương pháp dò biên Laplace.
Ma trận Laplace 5 X 5 được sử dụng trong một mặt nạ xoắn để xấp xỉ đạo hàm bậc
hai.Không giống phương pháp Sobel xấp xỉ đường dốc, thay thế cho hai mặt nạ
Sobel 3 X 3 theo hướng x và y.Laplace sử dụng một mặt nạ 5 X 5 cho đạo hàm bậc
hai trong cả hướng x và y.Tuy nhiên bởi vì những mặt nạ này xấp xỉ phép đo đạo
hàm bậc hai trên ảnh.Chúng rất dễ bị hỏng, gây nhiễu. Đây được xem như so sánh
với phương pháp Sobel.Mặt nạ Laplace và mã dưới đây:
/*
FILE: edgeLap.c - WORKS!
AUTH: P.Oh
DESC: 5x5 Laplace mask for edge detection
DATE: 05/02/02 23:30
REFS: edgedeta.c
K
IL
O
BO
O
K
S.
CO
M
*/
#include
#include
#include
#include
/*-------STRUCTURES---------*/
typedef struct {int rows; int cols; unsigned char* data;} sImage;
/*-------PROTOTYPES---------*/
long getImageInfo(FILE*, long, int);
void copyImageInfo(FILE* inputFile, FILE* outputFile);
void copyColorTable(FILE* inputFile, FILE* outputFile, int nColors);
int main(int argc, char* argv[])
{
FILE *bmpInput, *bmpOutput;
sImage originalImage;
sImage edgeImage;
unsigned int X, Y;
int I, J;
long SUM;
int nColors;
unsigned long vectorSize;
unsigned long fileSize;
int MASK[5][5];
unsigned char *pChar, someChar;
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
unsigned int row, col;
someChar = '0'; pChar = &someChar;
/* 5x5 Laplace mask. Ref: Mysler Handbook p. 135 */
MASK[0][0] = -1; MASK[0][1] = -1; MASK[0][2] = -1; ASK[0][3] = -1;
MASK[0][4] = -1;
MASK[1][0] = -1; MASK[1][1] = -1; MASK[1][2] = -1; MASK[1][3] = -1;
MASK[1][4] = -1;
MASK[2][0] = -1; MASK[2][1] = -1; MASK[2][2] = 24; MASK[2][3] = -1;
MASK[2][4] = -1;
MASK[3][0] = -1; MASK[3][1] = -1; MASK[3][2] = -1; MASK[3][3] = -1;
MASK[3][4] = -1;
MASK[4][0] = -1; MASK[4][1] = -1; MASK[4][2] = -1; MASK[4][3] = -1;
MASK[4][4] = -1;
if(argc < 2) {
printf("Usage: %s bmpInput.bmp\n", argv[0]);
exit(0);
};
printf("Reading filename %s\n", argv[1]);
/* open files for reading and writing to */
bmpInput = fopen(argv[1], "rb");
bmpOutput = fopen("edgeLap.bmp", "wb");
/* start pointer at beginning of file */
fseek(bmpInput, 0L, SEEK_END);
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
/* retrieve and print filesize and number of cols and rows */
fileSize = getImageInfo(bmpInput, 2, 4);
originalImage.cols = (int)getImageInfo(bmpInput, 18, 4);
originalImage.rows = (int)getImageInfo(bmpInput, 22, 4);
edgeImage.rows = originalImage.rows;
edgeImage.cols = originalImage.cols;
printf("Width: %d\n", originalImage.cols);
printf("Height: %d\n", originalImage.rows);
printf("File size: %lu\n", fileSize);
/* retrieve and print Number of colors */
nColors = (int)getImageInfo(bmpInput, 46, 4);
printf("nColors: %d\n", nColors);
vectorSize = fileSize - (14+40+4*nColors);
printf("vectorSize: %lu\n", vectorSize);
edgeImage.data = farmalloc(vectorSize*sizeof(unsigned char));
if(edgeImage.data == NULL) {
printf("Failed to malloc edgeImage.data\n");
exit(0);
}
printf("%lu bytes malloc'ed for edgeImage.data\n", vectorSize);
originalImage.data = farmalloc(vectorSize*sizeof(unsigned char));
if(originalImage.data == NULL) {
printf("Failed to malloc originalImage.data\n");
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
exit(0);
}
printf("%lu bytes malloc'ed for originalImage.datt\n", vectorSize);
copyImageInfo(bmpInput, bmpOutput);
copyColorTable(bmpInput, bmpOutput, nColors);
fseek(bmpInput, (14+40+4*nColors), SEEK_SET);
fseek(bmpOutput, (14+40+4*nColors), SEEK_SET);
/* Read input.bmp and store it's raster data into originalImage.data */
for(row=0; row<=originalImage.rows-1; row++) {
for(col=0; col<=originalImage.cols-1; col++) {
fread(pChar, sizeof(char), 1, bmpInput);
*(originalImage.data + row*originalImage.cols + col) = *pChar;
}
}
for(Y=0; Y<=(originalImage.rows-1); Y++) {
for(X=0; X<=(originalImage.cols-1); X++) {
SUM = 0;
/* image boundaries */
if(Y==0 || Y==1 || Y==originalImage.rows-2 || Y==originalImage.rows-1)
SUM = 0;
else if(X==0 || X==1 || X==originalImage.cols-2 || X==originalImage.cols-
1)
SUM = 0;
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
/* Convolution starts here */
else {
for(I=-2; I<=2; I++) {
for(J=-2; J<=2; J++) {
SUM = SUM + (int)( (*(originalImage.data + X + I + (Y +
J)*originalImage.cols)) * MASK[I+2][J+2]);
}
}
}
if(SUM>255) SUM=255;
if(SUM<0) SUM=0;
*(edgeImage.data + X + Y*originalImage.cols) = 255 - (unsigned
char)(SUM); /* make edges black and background white */
fwrite( (edgeImage.data + X + Y*originalImage.cols), sizeof(char), 1,
bmpOutput);
}
}
printf("See edgeLap.bmp for results\n");
fclose(bmpInput);
fclose(bmpOutput);
farfree(edgeImage.data); /* Finished with edgeImage.data */
farfree(originalImage.data); /* Finished with originalImage.data */
return 0;
}
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
/*----------GET IMAGE INFO SUBPROGRAM--------------*/
long getImageInfo(FILE* inputFile, long offset, int numberOfChars)
{
unsigned char *ptrC;
long value = 0L;
unsigned char dummy;
int i;
dummy = '0';
ptrC = &dummy;
fseek(inputFile, offset, SEEK_SET);
for(i=1; i<=numberOfChars; i++)
{
fread(ptrC, sizeof(char), 1, inputFile);
/* calculate value based on adding bytes */
value = (long)(value + (*ptrC)*(pow(256, (i-1))));
}
return(value);
} /* end of getImageInfo */
/*-------------COPIES HEADER AND INFO HEADER----------------*/
void copyImageInfo(FILE* inputFile, FILE* outputFile)
{
unsigned char *ptrC;
unsigned char dummy;
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
int i;
dummy = '0';
ptrC = &dummy;
fseek(inputFile, 0L, SEEK_SET);
fseek(outputFile, 0L, SEEK_SET);
for(i=0; i<=50; i++)
{
fread(ptrC, sizeof(char), 1, inputFile);
fwrite(ptrC, sizeof(char), 1, outputFile);
}
}
/*----------------COPIES COLOR TABLE-----------------------------*/
void copyColorTable(FILE* inputFile, FILE* outputFile, int nColors)
{
unsigned char *ptrC;
unsigned char dummy;
int i;
dummy = '0';
ptrC = &dummy;
fseek(inputFile, 54L, SEEK_SET);
fseek(outputFile, 54L, SEEK_SET);
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
for(i=0; i<=(4*nColors); i++) /* there are (4*nColors) bytesin color table */
{
fread(ptrC, sizeof(char), 1, inputFile);
fwrite(ptrC, sizeof(char), 1, outputFile);
}
}
Giải thích Laplace:
Toán tử Laplace thực hiện chính xác như Sobel, phương pháp này có một chút đơn
giản bởi nó sử dụng một mặt nạ thay vì hai.
5. Phương pháp dò biên hình chóp(pyramid EDGE detection)
Nó thường xảy ra với các biên quan trọng trong hình ảnh đã được tách rời thành
các khoảng từ hình ảnh đó và tương đối dàng để xác định.Tuy nhiên, đó có thể là
một số các biên đậm trong hình ảnh đó và tương đối dễ dàng để xác định( từ hình
ảnh người sử dung j đang xét) bởi vì chúng ngắn hoặc rời rạc. Vấn đề là làm thế
nào để lảm nổi bật biên lớn (substantial) nhưng lờ đi biên không đạt(ngắn).
Sử dụng: làm tăng các biên lớn (đậm và dài) nhưng bỏ qua các biên mờ hoặc ngắn.
Nguyên lý: hình ảnh được cắt bớt thành bốn phần bằng việc cjia đôi chiều dài của
cạnh( cả chiều ngang và chiều dọc). Mỗi điểm trong một hình ảnh thu được bằng
trung bình của bốn điểm ảnh tương ứng trong hình ảnh đầy đủ.Lặp lại quá trình này
cho đến khi hình ảnh được tạo ra ở đây các biên lớn vãn còn rõ ràng nhưng các biên
khác đã được loại bỏ.
Hình chóp ở đây là đường ngang trong hướng khác. Việc dò biên đã áp dụng với
hình ảnh nhỏ và điểm ảnh biên đã tìm được ở đó, việc dò biên áp dụng bốn điểm
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
ảnh tương ứng trong hình ảnh lớp tiếp theo- và dựa trên hình ảnh có kích thước lớn
đầy đủ.
Thuật toán: Đặt kích thước của hình ảnh gốc m x n.
Tạo một hình ảnh tiếp theo có kích thước m/2 x n/2 bằng việc ước lượng giá trị cho
mỗi 0<i<m và <j<n.
[ ]1)j1,I(i1)jI(i,j)1,I(ij)I(i,
4
1
2
j
,
2
i
newI +++++++=
Bình phương tương ứng của bốn phần tử trong hình ảnh gốc đươc tính trung bình
để đưa giá trị và hình ảnh mới.
Lặp lại quá trình được lặp lại( có thể dùng để quy) x lần, và mỗi giữ lại hình ảnh
thu được.
Lúc này với hình ảnh nhỏ nhất, thực hiện một số thuật toán dò biên- như sobel.
Trong các điểm ảnh ở đây các biên đã đượ tìm ra khi thực hiện thuật toán dò biên
trên nhóm của bốn điểm ảnh tương ứng trong hình ảnh lốn nhất tiếp theo.Ta tiếp
tục thực hiện giảm bớt các biên tốt nhất đến cuối hình chóp của hình ảnh cho đến
khi các biên chính trong hình ảnh gốc đã tìm được.
6. Crack edge relation(Tách giới hạn biên)
Giới hạn biên hình ảnh:
Hầu hết các giá trị điểm ảnh là hiện hữu ở biên hình ảnh, những giá trị biên nhỏ
phù hợp cho mức xám không đáng kể, làm thay đổi kết quả từ lượng tạp nhiễu, ánh
sáng nhỏ không đều…
Chọn một giới hạn chung thích hợp thường là khó khăn và đôi khi không thể
đạt được; P-giới hạn xếp kề có thể áp dụng t ừ định nghĩa giới hạn.
Như một sự lựa chọn, không giảm độ lớn cực đại và hiện tượng trễ giới hạn
có thể được sử dụng như là đã đưa vào phép dò biên chi tiết.
Phục hồi biên:
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
Khung cuối cùng từ các phương pháp trước chịu ảnh hưởng lớn bởi hình ảnh
gốc.
Tất cả thuộc tính hình ảnh trong bối cảnh liên quan với nhau có thể tăng chất
lượng hình ảnh cuối cùng.
Hầu hết các thuộc tính hình ảnh, tính đến cả biên thực sự mờ là đánh giá
chính xác hơn trừ khi ngữ cảnh biên là hoàn toàn làm sạch – cơ bản trên độ dài của
các biên liên quan trong tìm kiếm đặc biệt, sự tin cậy của mỗi biên là tăng hay
giảm.
Một vị trí biên mờ giữa 2 biên rõ là một ví dụ cụ thể; nó là khả năng lớn dể
vị trí biên mờ là một phần của đường biên cuối cùng.
Nếu trong 1 trường hợp khác, một biên rõ vị trí của nó không tồn tại nó sẽ
không là phần nhỏ của bất kì đường biên nào.
Giãn đường biên là phương pháp lập đi lập lại để độ tin cậy của đường biên
hội tụ về 0 hay 1.
Sự tin cậy của mỗi đường biên e trong lần giãn đầu tiên là độ lớn bình
thường của đường biên rõ.
Thuật toán:
1. Đánh giá độ tin cậy C(1)(e) cho tất cả các đường biên e tách ra trong hình
ảnh.
2. Tìm kiểu đường biên của mỗi đường biên cơ bản trên đường biên tin cậy
trong nhóm liên quan.
3. cập nhật độ tin cậy C(k+1)(e) của mỗi đường biên e theo kiểu của nó và
theo độ tin cậy cho trước C(k)(e).
4. Dừng lại, nếu độ tin cậy đã hội tụ về 0 hay 1. Lặp lại bước (2) và (3) cho
các trường hợp khác.
- Các bước chính của thuật toán ở trên là ước lượng nhưng điểm tốt
nhất bởi ước lượng của kiểu đường biên và theo cách này độ tin cậy
của đường biên đã giảm bớt.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
- Ước lượng là tính toán ở kiểu i nếu:
Type(i)=max(type(k)) k=0,1,2,3
Type(0)=(m-a)(m-b)(m-c)
Type(1)=a(m-b)(m-c)
Type(2)=ab(m-c)
Type(i)=abc
a, b, c là giá trị thường thấy gắn liền với đường biên mẫu m=
max(a,b,c,q) đưa vào lượng q đảm bảo type(0) khác 0 và mang giá trị
a.
- Một ví dụ khi chọn q=0,1 một ước lượng (a,b,c)=(0.5,0.05,0.005) là
ước lượng kiểu 1 khi đó kiểu ước lượng (0.3,0.2,0.2) là ước lượng kiểu 3.
- Đánh giá kết quả đạt được bằng cách đếm đơn giản những con cố của
đường biên gốc từ ước lượng ở trên một giá trị giới hạn.
- Kiểu biên được tìm thấy khi móc nối đơn giản các kiểu biên và độ tin
cậy của đường biên là giảm đi trong lân cận tiếp theo.
- Tăng độ tin cậy C(k+1)(e) = min (1, C(k)(e)+δ)
- Giảm độ tin cậy C(k+1)(e) = min (1, C(k)(e)-δ)
- Sự giãn đường biên mô tả ở trên nhanh chóng được dùng tạo đường
biên ban đầu trong lần lặp đầu tiên.
- Nó thường hội tục chậm và cho kết quả xấu hơn mong muốn khi lặp
những số lớn.
- Nguyên nhân của nó được tìm từ toàn bộ số lớn nhất của đường biên
kiểm định nằm ngoài tiêu chuẩn của hình ảnh, điều không phải tìm kiếm cho kết
quả tốt nhất.
- Vấn đề là tìm đường biên tin cậy từ một giới hạn chắc chắn và nội giới
hạn khác, giới hạn làm tăng lên độ bóng bẩy của hình ảnh gốc.
- Một bước đã được thêm vào để tìm đường biên tin cậy:
Nếu C(k+1)(e)>T1 thì assign(C(k+1)(e))=1
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
Nếu C(k+1)(e)<T2 thì assign(C(k+1)(e))=0
T1,T2 là các tham số điều khiển sự hội tụ dần của phép giãn biên và độ chính
xác của đường biên cuối cùng.
7. Kỹ thuật đạo hàm tích chập – phương pháp Canny
Phương pháp này thực hiện cách lấy đạo hàm của một ảnh chập với bộ lọc
Gauss.
Đạo hàm của một ảnh được lọc:
yx ffIGf +=⊗∇=∇ )( (3.11) với fx, fy là đạo hàm theo x và y của f
Do vậy:
)()()()( IGIGIGIGf yxyx ⊗+⊗=⊗∇+⊗∇=∇ (3.12)
Lấy đạo hàm riêng theo x và y của G ta được:
)
2
exp(
2 2
22
),( σσ
yxx
x yxG
+
−
−
=
)
2
exp(
2 2
22
),( σσ
yxy
y yxG
+
−
−
=
Gx(x) G(y)
fx
fy
Gy(y) G(x)
Hình 5: Mô hình tính của phương pháp Canny
8. Dò biên theo quy hoach động
8.1. Mô tả phương pháp
I(x,y)
Arctan fy/fx
22
yx ff +
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
Dò biên theo phương pháp gradient là xác định cực trị cục bộ của gradient
theo các hướng; còn phương pháp Laplace dựa vào cắt điểm không của đạo hàm
bậc hai. Phương pháp dò biên theo quy hoạch động là phương pháp tìm cực trị tổng
thể của các quá trình nhiều bước. Nó dựa vào nguyên lý tối ưu của Bellman.
Nguyên lý Bellman phát biểu như sau: “con đường tối ưu giữa 2 điểm cho trước
cũng là tối ưu giữa 2 điểm bất kỳ nằm trên đường tối ưu đó”.
Thí dụ, nếu C là một điểm trên đường tối ưu giữa A và B thì đoạn CB cũng
là con đường tối ưu từ C đến B không kể đến C bằng cách nào.
E B
C
A
D
Trong kỹ thuật này, ta giả sử bản đồ biên đã được xác định và được biểu diễn
dưới dạng một đồ thị liên thông N chặng. Hơn nữa, giả sử hàm đánh giá
được tính theo công thức:
∑∑∑
=
−
=
−
=
−−−=
N
k
NN
N
k
kk
N
k
kN xxdxxxgNxxS
2
1
1
1
1
1 ),()()()(),,...,( βθθα
Với:
Xk, k=1,…,N: biểu diễn các đỉnh của đồ thị trong chặng thứ k;
d(x,y): khoảng cách giữa 2 đỉnh x và y tính theo các định nghĩa tương
ứng về khoảng cách;
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
|g(xk)| và θ(xk) là gradient biên độ và gradient hướng ở đỉnh xk;
α và β
là các tham số không âm.
Đường bao tối ưu sẽ nhân được bằng cách nối các đỉnh x , k=1,…,N
nào đó thỏa mãn, sao cho S(x1,…,xN) đạt cực đại.
Ta định nghĩa hàm như sau:
11 ,..
1 )},,..,({),(
−
=Φ
Nxx
NN NxxSMaxNx
Khi đó ta được:
),()()()()1,,..,(),,..,( 11111 −−− −−++−= NNkkNNN xxdxxxgNxxSNxxS βθθα
Với cách thức này, thay vì tìm tối ưu toàn cục của S(x1,,…,xN,N) một vấn đề
phức tạp, ta đi tìm tối ưu của N chặng của tối ưu 2 biến. Trong mỗi chặng, với mỗi
xk ta phải tìm tối ưu Φ(xk,k). Ví dụ:
Giả sử ta có bản đồ biên biểu diễn đồ thị liên thông sau:
D 4 7 Φ(xk
6 5 D(11,12) E(16) F(23)
A 5 B A 5 C B
3 2 6 I(8) (18,28)
2 3
G(8) H(8,10) j(13,10)
1 2 3 4 5 k
Theo phương pháp trên ta có Φ(xk,k)=5. với k=2 có Φ(D,2)=max(11,12)=12. Điều
đó có nghĩa là con đường từ A đến D di qua C và ACD là biên được chọn với k=2.
Một cách tương tự, với k=4 có 2 con đường được chọn là ACDEF và AGHJ. Tuy
nhiên, với k=5 thì đoạn JB bị loại và chỉ tồn tại con đường duy nhất với cực đại là
28. Như vậy biên được xác định là ADEFB.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
8.2. Thuật toán
Theo phân tích trên, thuật toán dò biên theo qui hoạch động được mô tả một
cách hình thức như sau:
• Xuất phát từ điểm ban đầu XA, ta xác định con đường gồm các đỉnh để
đạt đến đỉnh XB
• Việc dò tìm này giống như phép duyệt đồ thị theo bề sâu: tại thời điểm
hiện thời xi (lúc xuất phát là XA), ta xác định các điểm kế tiếp, dựa vào 8
lân cận theo hướng của điểm hiện tại và điểm trước đó. Nếu hướng đó
hợp lệ, ta chọn nó như một đỉnh trên con đường cần tìm. Ngược lại, để
tìm đỉnh có khả năng ta sẽ chọn 1 trong 8 lân cận của đỉnh đang xét với
chi phi lớn nhất. Có thể có nhiều đỉnh thỏa mãn và như vậy ta cần lưu trữ
các đỉnh này coi như các đỉnh có khả năng. Nếu không có đỉnh nào được
chọn trong 8 lân cận đó, ta phải quay lui và chọn đỉnh khác đã lưu trữ.
• Quá trình được lặp lại cho đến đỉnh được xem xét hiện tại chính là đích
X8
Để cài đặt giải thuật này, cần sử dụng các cấu trúc dữ liệu và các thủ tục sau:
Stack winerstack: lưu trữ các đỉnh trên con đường tối ưu từ đỉnh xuất phát
X đến đỉnh đích X8.
Stack tempstack: lưu trữ các đỉnh có khả năng để xem xét lúc quay lui
một khi thất bại tạm thời.
Véc tơ Index: gồm 9 phần tử. Mỗi phần tử của véc tơ gồm 3 trường: hàng,
cột và giá. Giá là tiêu chí xét điểm thỏa mãn;
Image: ảnh vào
XA, XB, last: có cấu trúc như một phần tử của véc tơ Index
Find_Direc (last, current): hàm cung cấp giá trị về hướng của điểm đang
xét và điểm trước nó.
- Thủ tục Find_Successor(ImageIn,X,last, Index): tìm các điểm tiếp
theo có thể và đặt vào véc tơ Index. Điểm tiếp theo này phải nằm
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
trong giới hạn của ảnh, khác với điểm hiện thời và điểm trước đó và
cường độ mức xám phải lớn hơn ngưỡng T. Khi điểm ảnh được chọn,
trường giá sẽ tăng lên một lượng: bằng mắc xám của điểm ảnh đó.
- Thủ tục Init_index(Index): đặt lại giá trị cho mỗi phần tử của véc tơ
Index bằng -1 mỗi khi khởi tạo một đợt tìm mới.
- Thủ tục sort_pixel(Index): sắp xếp lại véc tơ index theo trường giá
tăng dần để tìm các đỉnh có khả năng làm cực đạiΦ
Giải thuật dò biên theo qui hoạch động được viết như sau:
Edge_Dynamic(XA,XB,ImageIn,T,Index,Last,WinerStack)
/*XA, XB, T, ImageIn: các tham số vào
WinerStack” tham số ra. Chứa các đỉnh biên trên đường từ XA đến XB*/
1. if XA=XB then kết thúc;
2. khởi tạo ban đầu
Last=XA;
Push(WinerStack,XA);
ImageIn[XA]=0;{đánh dấu để không xét lại}
Init_Index(Index);
Find_Successor(ImageIn, Xi,T,Index, last);
Sort_pixel(Index);
If Index[8]=-1 then {điểm hiện tại không có điểm tiếp theo – đã xét hết}
Begin
Xi<-tiếp theo trong index
Init_Index(Index);
End
3. vòng lặp chính
While true do
Begin
Push(WinerStack,Xi);
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
ImageIn[Xi]=0;
If Xi=XB then exit; {kết thúc}
Find_Successor(ImageIn, Xi,T,Index, last);
D=Find_Direc(Last,Xi);
Last=Xi;
If (d>0) & (ImageIn[Index[d]] là thỏa then Xi=Index[d];
Sort_pixel(Index);
/* xác định đỉnh có khả năng*/
For i=1 to 8 do
If Index[i].gia-1 then Push(TempStack, Index[i]);
If Index[8]-1 & ImageIn[index[8]]=0 then Xi=Index[8];
Else
While (TempStack not Empty) & (ImageIn[Xi]=0) do
Begin
Xi=pop(TempStack);
If TempStack is Empty then quay lui;
While (WinerStack not Empty and XiX0 )do
X0=pop(winerStack);
End
Init_Index(Index);
End
4. Kết thúc
9. Một số thuật toán khác
• Thuật toán: tìm đường cong sử dụng biến đổi Hough
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
1. Lượng tử hóa không gian số tổng giới hạn của tham số a. Không
gian tham số với n chiều được cho bởi tham số của véc tơ a.
2. bộ nhớ n chiều là mảng A(a) với cấu trúc lượng tử hóa của không
gian tham số; tập hợp các phần tử tới 0.
3. Từ một điểm ảnh (x1,x2) trong độ dốc thích hợp của hình ảnh, tăng
tất cả các ô nhớ A(a) nếu f(x,a)=0
A(a)=A(a)+∆A
Cho tất cả giá trị a bên trong giới hạn dùng trong bước (1)
4. tìm số lớn nhất trong mảng A phù hợp với sự mô tả đường cong
f(x,a) hiện có trong hình ảnh gốc.
- Nếu chúng ta tìm được đường tròn, phân tích biểu thức f(x,a) được
hình tròn mong muốn là :
(x1-a)2 + (x2-b)2= r2
- bộ chứa cấu trúc dữ liệu phải là không gian 3 chiều
- phép biến đổi Hough là kĩ thuật mạnh cho phép tìm ra đường cong,
theo phát triển luật số mũ của bộ chứa cấu trúc dữ liệu sự ra tăng của
những hạn chế về tham số đường cong là điều kiện thuận lợi để tìm
ra đường cong có những tham số nhỏ.
- Nếu ưu tiên những thông tin về quản lý biên được sử dụng thì lượng
tính toán cần thiết có thể giảm đáng kể.
- Ngoài việc sử dụng thông tin đường biên định hướng, tất cả các ô bộ
chứa A(a,b) là tăng lên trong không gian tham số nếu con trỏ (a,b) là
một đường tròn với tâm x.
Sự hiểu biết mang tính định hướng chỉ là số nhỏ trong bộ nhớ cần tăng lên.
Nếu đường biên định hướng là lượng tử hóa 8 giá trị có thể, chỉ giá trị thứ 8
của đường tròn cần thêm phần nhỏ trong tăng dung lượng ô chứa
Sử dụng đường tròn định hướng, ứng với tham số a và b có thể được định
nghĩa từ công thức sau:
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
a=x1-R1cos(Ψ(x))
b=x1-Rsin(Ψ(x))
Ψ(x) })(,){( ∆Φ−Φ∆Φ−Φ∈ xx
∆Φ là số đường biên định hướng cũ trong ô x, ∆Φ là số lớn nhất đã biết của đường
cong định hướng
Ta tìm ra rằng vòng tròn tìm thấy có đóng góp lớn từ các ô bộ nhớ A(a) bằng dung
lượng đường biên trong ô x.
• Thuật toán: Tổng quan biến đổi Hough
1. đặt 1 bảng R mô tả yêu cầu của đối tượng
2. Dạng cấu trúc dữ liệu A miêu tả khả năng trước đó xem như những con trỏ
A(x1,x2,T). tập hợp ô nhớ giá trị A(x1,x2,T)=0
3. Từ một điểm (x1,x2) trong độ dốc giới hạn, hình ảnh đã được xác định
đường biên định hướng ∆Φ ; tìm tất cả các khả năng trước đó con trỏ xR và
tăng tất cả A(xR,T): A(xR,T)= A(xR,T)+ ∆A
Cho tất cả các giá trị đạt được của vòng lặp và cỡ thay đổi
))(cos()(11 TSxx R +ΦΦΓ+= α
))(sin()(22 TSxx R +ΦΦΓ+= α
4. Tìm những vùng phù hợp được cho bởi số lớn nhất trong ô A cấu trúc dữ
liệu.
• Thuật toán: Định dạng vùng từ từng phần các khung
Từ mỗi khung điểm x tìm một đường biên đối với a một khoảng cách không
vượt quá a cho giá trị lớn nhất M. Nếu 1 điểm biên đã tìm, đánh dấu một điểm trên
đường thẳng kết nối khi đó có một vùng nhớ tiềm năng.
Tính số đánh dấu cho mỗi điểm trong hình ảnh, số đánh dấu cho biết một
điểm là đường kết nối giữa các điểm biên. Lấy b(x) là số đánh dấu cho điểm x
Số đánh dấu b(x) là:
B(x) =0.0 từ b(x)=0
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
K
IL
O
BO
O
K
S.
CO
M
=0.1 từ b(x)=1
=0.2 từ b(x)=2
=0.5 từ b(x)=3
=1.0 từ b(x)>3
Phương pháp này là cách biểu diễn chính xác các điểm đường bao quanh.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN
Các file đính kèm theo tài liệu này:
- Báo cáo chuyên đề xử lý ảnh- Các phương pháp dò biên.pdf