BIẾN ĐỔI ĐA PHÂN GIẢI CÓ HƯỚNG ỨNG DỤNG TRONG PHÂN TÍCH VI ẢNH
 NGÔ QUỐC VIỆT
 Trang nhan đề
 
 Lời cam đoan
 Lời cảm ơn
 Mục lục
 Danh mục hình ảnh
 Chương 1:
Giới thiệu
 Chương 2:
 Xác định biên trong vi ảnh dựa trên cực trị Wavelet
 Chương 3:
 Các thuật giải phân đoạn ảnh
 Chương 4:
 Phép biến đổi đa phân giải có hướng cục bộ
 Chương 5:
 Phân tích vi ảnh dựa trên biến đổi đa phân giải có hướng
 Chương 6:
 Kết luận và hướng kiến nghị
 Danh mục công trình tác giả
 Tài liệu tham khảo
 Phụ lục
                
              
                                            
                                
            
 
            
                 13 trang
13 trang | 
Chia sẻ: lvcdongnoi | Lượt xem: 3490 | Lượt tải: 2 
              
            Bạn đang xem nội dung tài liệu Biến đổi đa phân giải có hướng ứng dụng trong phân tích vi ảnh, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
12 
CHƢƠNG 1: GIỚI THIỆU 
1.1. Mở đầu 
Giai đoạn gần đây, các nghiên cứu về cấu trúc nano ngày càng phát triển trong 
nhiều lĩnh vực. Đây là ngành khoa học nghiên cứu sự tác động của các cấu trúc ở 
kích thƣớc nano và đƣợc ứng dụng vào các lĩnh vực khác nhau nhƣ: điện tử nano, 
sinh học nano, vât liệu nano, v.v. Đây là lĩnh vực rất quan trọng và đƣợc dự báo là 
sẽ phát triển mạnh trong những năm tới [21], [78], trong đó vai trò của khoa học 
máy tính trợ giúp công nghệ nano ngày càng rõ nét. 
Sự phát triển khoa học công nghệ nano liên hệ mật thiết với các tiến bộ trong 
ngành khoa học máy tính. Việc quan sát, phân tích và thao tác đƣợc trên các đối 
tƣợng kích thƣớc nano mét, phân tử, sẽ đóng góp rất nhiều cho khoa học và công 
nghệ nano. Trong đó việc tạo ảnh chụp các đối tƣợng kích thƣớc nhỏ là yếu tố quan 
trọng cho các phân tích thủ công hay tự động ở các giai đoạn sau. Một số kỹ thuật 
tạo vi ảnh nhƣ Scanning Probe Microscopy (SPM) [25], hay Atomic Force 
Microscopy (AFM) [3][5], Scanning Tunneling Microscopy (STM) [8], AFM và 
Near-field Scanning Optical Microscopy (NSOM), Magnetic Force Microscopy 
(MFM), Lateral Force Microscopy (LFM), Electrostatic Force Microscopy (EFM), 
v.v. cho phép tạo đƣợc ảnh bề mặt ở độ phân giải nano. 
Các kỹ thuật tạo ảnh trên đã mở ra hướng nghiên cứu sử dụng vi ảnh để giải 
quyết các vấn đề trong rất nhiều lĩnh vực như công nghệ sinh học, bán dẫn, sản 
xuất vi mạch, v.v. 
Thuật ngữ vi ảnh đƣợc xem nhƣ ảnh chụp các đối tƣợng có kích thƣớc nhỏ (kích 
thƣớc nano mét hay micro mét) thông qua các kỹ thuật tạo ảnh đặc biệt. Trong luận 
án này, chúng tôi nghiên cứu và phát triển các thuật giải trên tập vi ảnh Scanning 
Electron Microscopy (SEM), STM chụp bề mặt wafer dùng trong công nghệ bán 
dẫn, ảnh DNA microarray, và vi ảnh huỳnh quang (fluorescence microscopy) dùng 
trong vi sinh học. 
13 
Trong ngành công nghệ bán dẫn, ảnh SPM đƣợc dùng để hỗ trợ một số công 
đoạn sản xuất wafer nhƣ giám sát quá trình phủ các lớp vật chất lên bề mặt, đo độ 
phẳng, xác định lỗi v.v. Trong lĩnh vực sinh học, SPM có thể cung cấp ảnh ba chiều 
các bề mặt phân tử trong môi trƣờng lỏng hay khí. Thông qua chuỗi các vi ảnh, ta 
có thể nghiên cứu các quá trình diễn ra trong DNA (nhƣ đột biến, lai ghép, v.v) ở 
mức độ phân tử. Việc chẩn đoán bệnh (nhƣ kiểm tra phổ gen) cũng đƣợc sự hỗ trợ 
bằng các kỹ thuật nhận dạng mẫu và tìm kiếm trong ngân hàng phổ gen. Với kỹ 
thuật SPM, ta có thể quan sát chuỗi ảnh thể hiện ở mức độ tế bào hay protein, cấu 
trúc màng tế bào và hơn nữa là hiểu tính năng của chúng thông qua các phƣơng 
pháp có sự trợ giúp của các kỹ thuật phân tích ảnh. Kỹ thuật AFM có thể tạo đƣợc 
ảnh trong môi trƣờng lỏng hay khí nhờ sự tƣơng tác của nó với các phân tử. Trong 
các ứng dụng polymer, SPM có thể giúp nghiên cứu ở mức hình thái hay cấu trúc 
nano. Ở độ phân giải cao, SPM cho phép „chụp‟ nhằm xác định đƣợc tính chất vật 
liệu, cấu tạo bề mặt ở mức độ định tính và định lƣợng thông qua một số phƣơng 
pháp trích đặc trƣng ảnh, đặc biệt là đặc trƣng đa tỉ lệ. 
Vấn đề khó khăn khi xử lý các lớp ảnh chụp bề mặt các wafer bán dẫn hay các tế 
bào là hầu nhƣ các đặc trƣng không thể mô tả tƣờng minh dạng nhƣ “chữ C có hình 
cong và hai đầu không chạm nhau” hay “hai mắt đối xứng qua trục dọc trên mặt 
ngƣời”, v.v. Các vi ảnh thƣờng có các tính chất sau 
 Màu sắc trải đều và phân bố ngẫu nhiên. 
 Các đối tƣợng hay đặc trƣng gần nhƣ không thể mô tả tƣờng minh. 
 Yếu tố nhiễu có tác động rất lớn đến quy trình xử lý. 
Đặc biệt trong lĩnh vực sản xuất vi mạch bán dẫn, phân biệt giữa vi lỗi và nhiễu 
là nhu cầu cần thiết. Hình 1.1 thể hiện sự khác biệt giữa vi lỗi và nhiễu có trong ảnh 
chẩn đoán lỗi của một trong các công đoạn của quy trình sản xuất vi mạch bán dẫn. 
Trong hình minh hoạ này, số lƣợng điểm ảnh của nhiễu hay vi lỗi có vẻ tƣơng 
đƣơng, nhƣng hình dáng hay hƣớng hoàn toàn khác nhau. Điều này có thể dẫn đến 
trở ngại khi phân tích trực tiếp trên dữ liệu ảnh. 
14 
Hình 1.1-Minh hoạ khác biệt giữa vi lỗi và nhiễu 
Trong ngành công nghệ sinh học, song song với vấn đề xây dựng bản đồ gen, 
một hƣớng nghiên cứu quan trọng khác hƣớng đến phân tích chức năng protein. Các 
tiếp cận trƣớc đây chủ yếu thực hiện nhu cầu này dựa trên việc phân tích chuỗi gen 
một chiều, sử dụng CSDL ngân hàng gen và đã đạt đƣợc một số kết quả khả quan. 
Tuy nhiên, kể từ sau năm 2000, hƣớng tiếp cận sử dụng vi ảnh hai chiều hoặc ba 
chiều cho xác định chức năng protein nhận đƣợc nhiều quan tâm từ các nhà nghiên 
cứu. 
Nhận xét rằng, giải quyết các vấn đề công nghệ trên thông qua phân tích dữ liệu 
ảnh không thể tách rời nhu cầu cần “làm rõ” hay “nhìn thấy” và đặc biệt là “hiểu” 
các đối tượng trong ảnh. Nhu cầu trên gắn liền với việc nghiên cứu, xây dựng các 
phép biến đổi và thực hiện các phân tích trên các hệ số biến đổi thay vì xử lý trực 
tiếp trên dữ liệu ảnh thô. Các ứng dụng có thể như: xác định tính chất bề mặt; trích 
đặc trưng; nâng cao chất lượng ảnh; khử nhiễu, v.v. Đây chính là định hướng cho 
chúng tôi thực hiện luận án này. 
Chúng tôi không nhằm nghiên cứu các vấn đề thuộc lĩnh vực khoa học và công 
nghệ nano, mà hƣớng đến các phương pháp sử dụng toán học, thống kê và khoa học 
máy tính xử lý, phân tích dữ liệu có được từ các tiến bộ của công nghệ tạo vi ảnh. 
1.2. Tình hình nghiên cứu trong và ngoài nƣớc 
Ở trong nước, xét trên khía cạnh công nghệ và sản xuất, việc nghiên cứu và ứng 
dụng CNTT vào một số công đoạn của quy trình sản xuất mạch tích hợp còn khá 
hạn chế. 
15 
Một số ít công ty nhƣ Global CyberSoft, SiGlaz, v.v.. đã tham gia vào lĩnh vực 
này nhƣng hầu hết chỉ giới hạn ở mức gia công phần mềm. Mục tiêu của các sản 
phẩm này là chẩn đoán lỗi trong quá trình sản xuất vi mạch. Cụ thể hơn, dữ liệu 
đƣợc lấy trực tiếp từ dây chuyền sản xuất hay vi ảnh và đƣợc phân tích. Một số 
nghiên cứu và phát triển có tiếp cận logic mờ để phân lớp lỗi. Một trong những kết 
quả chính của SiGlaz là sản phẩm IDA-Intelligence defect Analysis (tham khảo 
www.siglaz.com) . Sản phẩm này hỗ trợ trong dây chuyển sản xuất mạch bán dẫn. 
Dữ liệu lấy trực tiếp từ định dạng KLARF. Các giải pháp đƣợc sử dụng chủ yếu để 
phát hiện lỗi dựa trên phân loại các đặc trƣng trích rút trực tiếp trên dữ liệu. Theo 
tìm hiểu của chúng tôi, cách tiếp cận phân lớp lỗi của sản phẩm này dựa trên thuật 
giải k-NN. Việc xác định vi lỗi chỉ trên một số hƣớng cụ thể (nhƣ 0, 45, 90 độ). Ƣu 
thế của giải pháp này là ít tính toán và đáp ứng phần nào nhu cầu sản xuất công 
nghiệp. 
Sản phẩm thứ hai đƣợc nghiên cứu và phát triển trong nƣớc là FabSolve của 
công ty công nghệ Dolsoft, nhƣng đã đƣợc chuyển giao cho tập đoàn KLA-Tencor 
từ cuối những năm 2007. Mục tiêu của sản phẩm này là nhằm phục vụ trong công 
nghệ sản xuất vi mạch bán dẫn. Định hƣớng sản phẩm là tìm ra những lỗi hay 
những khác biệt nếu có giữa quá trình sản xuất wafer và bản thiết kế các vi mạch 
ban đầu đƣợc dự kiến sản xuất. Giải pháp là so sánh vi ảnh (bề mặt các khu vực hay 
toàn bộ các lớp phủ vật chất trên wafer) với bản thiết kế (tập tin định dạng GDSII- 
tham khảo trong  hoặc 
 Lỗi của wafer, hay của những con chip luôn có 
tỷ lệ rất cao vì quy trình quá tinh vi, phức tạp. Bài toán chính là thực hiện so khớp 
giữa một ảnh khu vực và bản thiết kế vô cùng lớn (kích thƣớc tập tin GDS có khi 
lên đến vài chục gigabyte). Ƣu điểm của phần mềm này là xử lý nhanh dữ liệu hình 
ảnh con chip trong quá trình chế tạo, đem so sánh tức thì với “bản đồ chip” theo 
thiết kế để xác định các khiếm khuyết của chip và phát lệnh hiệu chỉnh kịp thời sửa 
sai cho dây chuyền công nghệ. 
16 
Xét trên khía cạnh khai thác các công cụ toán học để giải quyết các bài toán 
CNTT, trƣờng ĐH KHTN TPHCM cũng đã có một số công trình sử dụng biến đổi 
wavelet, Radon cho các bài toán truy vấn hay xử lý ảnh. Luận án tiến sĩ của tác giả 
Nguyễn Đình Thúc (ĐH KHTN, ĐHQG. TPHCM) đã trình bày các cải tiến cũng 
nhƣ khai thác biến đổi Radon và ứng dụng. Tuy nhiên nhƣ chúng tôi đã nhận xét 
trong phần giới thiệu, việc khai thác thông tin ở các tỉ lệ khác nhau là cần thiết. Đối 
với yêu cầu này thì biến đổi Radon chƣa đáp ứng đầy đủ. 
Ngành công nghệ sinh học, gần đây đã đƣợc sự quan tâm nhiều từ cấp lãnh đạo 
cho đến các nhà khoa học. Phòng thí nghiêm tế bào gốc cũng đã đƣợc quyết định 
thành lập. Đây là tiền đề cho các nghiên cứu sâu hơn trong lĩnh vực công nghệ sinh 
học (CNSH). Ở đây, công cụ CNTT phục vụ cho nghiên cứu trong CNSH là thực sự 
cần thiết. 
Theo xu hƣớng này, các công trình nghiên cứu của nhóm tác giả Đỗ Phúc thuộc 
ĐH CNTT, ĐHQG TP.HCM đã khai thác tri thức dựa trên CSDL gen và đạt đƣợc 
một số thành công nhất định. Các công trình này sử dụng ngân hàng gen một chiều 
nhằm giải quyết các bài toán nhƣ xử lý, phân tích, nhận dạng gen hỗ trợ đào tạo và 
nghiên cứu trong ngành công nghệ sinh học. Tuy nhiên, các nghiên cứu này không 
dựa trên dữ liệu vi ảnh. 
Nhu cầu cấp thiết đặt ra là xây dựng các công cụ trợ giúp giải quyết các bài 
toán trong sinh học là phân tích dữ liệu ảnh. Các nhu cầu sử dụng CNTT từ đơn 
giản nhất nhƣ đếm các số lƣợng tế bào trong quá trình phân bào trên ảnh hay video 
cho đến phức tạp hơn nhƣ xác định hình dáng là rất cần thiết. Chúng tôi nhận thấy 
rằng, việc ứng dụng CNTT, đặc biệt là sử dụng dữ liệu ảnh hỗ trợ giải quyết các vấn 
đề trong CNSH còn hạn chế ở nƣớc ta. 
Ở ngoài nước, từ những năm 2000 các nghiên cứu trong lĩnh vực tin sinh học 
(bioinformatics) và sử dụng CNTT trong công nghệ bán dẫn phát triển rất mạnh, 
trong đó có khá nhiều nghiên cứu sử dụng CNTT trong bài toán tìm hiểu tính chất 
protein. Một tiếp cận phổ biến là hƣớng đến phân tích vị trí bào quan của protein 
17 
với mục tiêu chính là xác định đƣợc các sơ đồ định vị protein (protein location 
pattern). Yêu cầu đặt ra là dự đoán hay xác định đƣợc các sơ đồ vị trí của các 
protein, và xây dựng đƣợc tập chứa các sơ đồ vị trí có thể của protein. 
Theo định hƣớng của bài toán dự đoán protein, nhóm tác giả Harris (tham khảo 
81407) vào năm 2004 đã trình bày mô hình dự đoán sơ đồ vị trí của các protein dựa 
trên ontology các thành phần tế bào thuộc dự án Gene Ontology 
(www.geneontology.org). Nhóm tác giả đã sử dụng đồ thị có hƣớng (Directed 
Acyclic Graph-DAG), trong đó mô tả sơ đồ định vị các thành phần tế bào. Tuy 
nhiên, do bản chất của DAG với một nút con có thể có nhiều nút cha, vì vậy có thể 
dẫn đến suy diễn sai trên đồ thị trong quá trình dự đoán. 
Theo định hƣớng xác định sơ đồ định vị các thành phần tế bào, nhóm tác giả 
Lujan thuộc đại học Castilla-La Mancha, Albacete, Tây Ban Nha đã trình bày trong 
bài viết “Electron Microsopy Studies of Receptor Localization” phƣơng pháp sử 
dụng vi ảnh từ kính hiển vi điện tử để xác định sơ đồ định vị thụ thể (receptor). Tuy 
nhiên kỹ thuật này không thể làm việc với tế bào sống, vì vậy việc sử dụng vi ảnh 
huỳnh quang (fluorescence microscopy image) trở thành giải pháp phổ biến nhất 
trong bài toán nghiên cứu tính chất protein. 
Nổi bật theo định hƣớng sử dụng vi ảnh huỳnh quang là các công trình phân loại 
tính chất protein của nhóm tác giả M R. F. Murphy thuộc Đại học Carinegie 
Mellon, Pittsburgh, PA, USA [55]. Đây đƣợc xem là công trình tiên phong trong 
việc sử dụng vi ảnh định vị protein trong bào quan để khai thác tri thức protein 
trong CNSH. Cách giải quyết dựa trên mạng nơ-ron với tập đặc trƣng trích từ vi ảnh 
huỳnh quang. Đối với bài toán nhận dạng, bản chất vấn đề là xây dựng đƣợc tập đặc 
trƣng và phát triển mô hình phân lớp thích hợp. Trong công trình này, các tác giả đã 
xây dựng tập đặc trƣng dựa trên một số khái niệm cơ bản trong xử lý ảnh nhƣ: mật 
độ, số Euler, phƣơng sai, tỉ lệ về kích thƣớc giữa các “đối tƣợng”, tính đồng nhất, 
bao lồi, wavelet; và các tính chất lấy đƣợc từ vi ảnh huỳnh quang nhƣ: tâm (COF), 
18 
khoảng cách trung bình của các đối tƣợng đến COF, v.v.. và sử dụng mạng nơ-ron 
để dự đoán. Các đặc trƣng đƣợc nhóm tác giả gọi là các bộ SLF (Subcellular 
Location Features – các đặc trƣng định vị bào quan). Kết quả thực nghiệm phân lớp 
trên tập ảnh mẫu chụp tế bào Hela và CHO đƣợc nhóm tác giả công bố khoảng 
90%. 
Nhận xét rằng, tập đặc trƣng biểu diễn ảnh trong các công trình và sản phẩm trên 
dựa trên tri thức chuyên gia và các khái niệm đã đƣợc trình bày trong các bài viết về 
đặc trƣng vân (texture) hay mẫu tô (pattern). Nghĩa là, thực hiện trích rút thông tin 
trực tiếp trên ảnh gốc, sau đó, xây dựng mô hình phân lớp (dựa trên logic mờ, mạng 
nơ-ron hay SVM) trên tập đặc trƣng đã chọn để phân tích. 
 Trong lĩnh vực phân tích lỗi vi ảnh chụp wafer trong quá trình sản xuất vi mạch, 
vào năm 2000 nhóm tác giả Thomas P. Karnowski, Kenneth W. Tobin, Shaun S. 
Geason thuộc phòng thí nghiệm quốc gia OakRidge đã nghiên cứu, và công bố kết 
quả trong các bài viết “Fuzzy Logic Connectivity in Semiconductor Defect 
Clustering', và „Feature Analisys and Classfication of Manufacturing Signatures 
Based on Semiconductor Wafermaps (nguồn 
 đồng thời thực hiện thành công sản phẩm hỗ trợ 
trong dây chuyền sản xuất vi mạch. Giải pháp dựa trên vi ảnh xám đƣợc chuyển 
trực tiếp từ dữ liệu định dạng KLARF, và sử dụng k-NN hay logic mờ để phân loại 
lỗi. Nhu cầu này đã đƣợc các đơn vị trong nƣớc giải quyết thành công phần nào nhƣ 
đã trình bày ở phần „Tình hình nghiên cứu trong nước‟. 
Ở khía cạnh biểu diễn ảnh dựa trên các biến đổi giải tích, hầu hết các nghiên cứu 
đều tập trung vào biến đổi Fourier, wavelet. Nhiều công trình [31], [35] đã phân 
tích các ƣu điểm và nhƣợc điểm của các phép biến đổi trên. Cụ thể là biến đổi 
Fourier chỉ biểu diễn thông tin tần số, trong khi biến đổi wavelet hai chiều có thể 
biểu diễn thông tin tần số và vị trí và vì vậy chỉ thích hợp để khai thác dữ liệu dạng 
điểm ở các tỉ lệ khác nhau (đƣợc trình bày chi tiết trong chƣơng 4). Vì vậy, một số 
19 
nghiên cứu gần đây tập trung tìm kiếm các biến đổi sao cho có thể “biểu diễn” 
được các đối tượng cong trong ảnh. 
Trong luận án này, ngoài việc nghiên cứu và đề xuất các mô hình biểu diễn ảnh 
thông qua các hệ số thưa và các mô hình phân lớp, chúng tôi mong muốn bước đầu 
giải quyết một số vấn đề trong các ngành công nghệ mũi nhọn trên. 
1.3. Mục tiêu thực hiện của luận án 
Trong những năm 80 của thế kỷ trƣớc, biến đổi wavelet đƣợc giới thiệu nhƣ sự 
cải tiến của biến đổi Fourier và ngày càng đƣợc ứng dụng rộng rãi trong nhiều lĩnh 
vực. Lý do chính là dữ liệu biến đổi wavelet biểu diễn đƣợc thông tin trong cả miền 
tần số và không gian (trong khi biến đổi Fourier chỉ thể hiện trong miền tần số) nhờ 
vào xây dựng thông tin tần số xuất hiện ở các tỉ lệ và vị trí khác nhau. 
Trong xử lý ảnh, khái niệm đa phân giải đóng góp rất nhiều vào các kỹ thuật 
phân rã hay phân tích ảnh nhƣ wavelet, laplacian pyramid. Nhận xét là các thông tin 
ảnh xuất hiện ở một số tỉ lệ nhất định là khác nhau. Nhận xét này có thể quan sát 
đƣợc ở lĩnh vực bản đồ, trong đó một số chi tiết chỉ xuất hiện ở tỉ lệ nhỏ, nhƣng 
không xuất hiện ở tỉ lệ lớn và ngƣợc lại. Áp dụng ý tƣởng này trong ảnh sinh học, 
chúng ta có thể khai thác và phân tích thông tin ở mức độ phân tử hay tế bào. Từ 
nhận xét trên, ta thấy kỹ thuật đa phân giải rất thích hợp trong các bài toán phân tích 
vi ảnh sinh học hay trong ngành bán dẫn nhằm thực hiện các chẩn đoán, nhận dạng 
và các bài toán xử lý ảnh cổ điển nhƣ khử nhiễu, tái tạo và nén ảnh. Đặc biệt 
phƣơng pháp dựa trên biến đổi đa phân giải tỏ ra rất thích hợp khi chất lƣợng ảnh 
không tốt. 
Việc dùng các phƣơng pháp xử lý ảnh truyền thống để giải quyết vấn đề “làm 
rõ” đối tƣợng trong vi ảnh gặp một số nhƣợc điểm khó khắc phục nhƣ đƣợc trình 
bày ở các chƣơng sau. Cụ thể hơn, giải quyết vấn đề xác định biên dựa trên các 
phƣơng pháp sử dụng Canny, Robert, Sobel, v.v đều không đạt với vi ảnh nhiễu. 
20 
Tƣơng tự, với yêu cầu phân đoạn ảnh, các phƣơng pháp gom nhóm (cluster) hay 
loang vùng (region growing) đều không thực hiện đƣợc trên các tập vi ảnh nhƣ sẽ 
đƣợc trình bày trong chƣơng 3. 
Biến đổi wavelet là sự lựa chọn phổ biến để giải quyết nhiều vấn đề trong xử lý 
ảnh. Tuy vậy, biến đổi wavelet cũng thể hiện các hạn chế khi phân tích các đặc 
điểm cong tồn tại phổ biến trong ảnh. Nguyên nhân là vì các hệ số của biến đổi 
wavelet hai chiều chỉ chứa thông tin vị trí ở các tỉ lệ khác nhau, và hoàn toàn không 
có thông tin biểu diễn hƣớng hay góc. 
Từ những nhận xét trên, chúng tôi thấy rằng việc nghiên cứu và phát triển các 
biến đổi biểu diễn đặc trưng cong ở nhiều tỉ lệ sẽ giúp“dễ dàng nhìn thấy các đối 
tượng cong” trên ảnh với số lượng hệ số tối thiểu sẽ mang lại nhiều ưu điểm khi 
phân tích dữ liệu. Ngoài ra, việc khai thác các mô hình thống kê áp dụng trên ảnh 
sẽ mang lại các cải tiến trong lĩnh vực tiền xử lý, phân tích hay nhận dạng ảnh. 
Chúng tôi cũng nghiên cứu các phương pháp dựa trên các biến đổi toán học làm 
nền tảng cho hệ thống các ứng dụng phân tích vi ảnh từ giai đoạn xác định biên, 
phân đoạn lẫn tạo ra tập đặc trưng cho quá trình phân tích. 
Luận án tập trung nghiên cứu, xây dựng các mô hình và công cụ toán học hỗ trợ 
phân tích vi ảnh với các mục tiêu sau: 
Mục tiêu tổng quát 
 Nghiên cứu các biến đổi đa tỉ lệ có hƣớng nhằm xây dựng đƣợc tập hệ số thƣa 
có thể biểu diễn ảnh. 
 Xây dựng mô hình nhận dạng thích hợp dùng các hệ số thƣa của các biến đổi có 
hƣớng. 
 Sử dụng tập các hệ số thƣa của các biến đổi nhằm giải quyết các bài toán cơ bản 
trong xử lý ảnh nhƣ xác định biên, phân đoạn. 
21 
Mục tiêu cụ thể 
 Xây dựng các mô hình xác định biên dựa trên biến đổi wavelet với hàm phức, 
bảo toàn kích thƣớc mẫu, và ứng dụng làm rõ biên vùng tròn trong ảnh DNA 
microarray. 
 Nghiên cứu, cải tiến mô hình trƣờng ngẫu nhiên Markov, và ứng dụng vào bài 
toán phân đoạn vi ảnh. 
 Nghiên cứu và vận dụng biến đổi đa phân giải có hƣớng cục bộ vào bài toán 
phân tích vi ảnh. 
 Đề xuất mô hình nhận dạng đối tƣợng trong vi ảnh dựa trên các đặc trƣng giải 
tích và ứng dụng vào phân tích tính chất protein. 
1.4. Những đóng góp chính 
Luận án nghiên cứu và xây dựng một số phƣơng pháp dựa trên công cụ toán học 
và ứng dụng vào các công đoạn tiền xử lý và phân tích vi ảnh. Các đóng góp chính 
bao gồm: 
1. Đề xuất phƣơng pháp xác định biên dựa trên cực trị wavelet với hàm phức và 
bảo toàn kích thƣớc mẫu. Xây dựng một số mô hình xác định biên dựa trên ƣu 
điểm của các thuật giải a trous UWT và IUWT nhằm cải tiến chất lƣợng biên 
cũng nhƣ tốc độ thực hiện [CT.2]. 
2. Nghiên cứu và vận dụng trƣờng ngẫu nhiên Markov với các cải tiến về tốc độ 
hội tụ cho bài toán phân đoạn ảnh [CT.4]. Cũng nhƣ các phƣơng pháp ngẫu 
nhiên khác (thuật giải genetic, mạng nơ-ron), tốc độ hội tụ và chất lƣợng lời giải 
tối ƣu phụ thuộc vào lời giải khởi đầu và phƣơng pháp cập nhật lời giải. Chúng 
tôi đề xuất sử dụng thuật giải nung luyện mô phỏng cho quá trình Markov với 
hai đóng góp chính: 
22 
o Xác định nhiệt độ khởi đầu cho thuật giải nung luyện mô phỏng 
(Simulated Annealing-SA). 
o Công thức giảm nhiệt độ thích nghi bảo đảm cho thuật giải phân đoạn 
ảnh hội tụ đến lời giải tối ƣu. 
Bên cạnh đó, chúng tôi đề xuất các lƣợc đồ phân đoạn ảnh phân cấp dựa trên các 
kết hợp biến đổi Laplacian Pyramid (LP), wavelet, a trous wavelet với trƣờng 
ngẫu nhiên Markov (MRF) và đặc biệt là phân đoạn ảnh kết hợp giữa MRF và 
wavelet bất đẳng hƣớng trên hai dạng giảm hay giữ nguyên kích thƣớc mẫu 
nhằm cải tiến tốc độ cũng nhƣ chất lƣợng lời giải tối ƣu. 
Với bài toán cụ thể nhƣ phân đoạn ảnh chụp wafer bán dẫn, chúng tôi đề xuất sử 
dụng thuật giải „đƣờng thủy phân‟ (watershed) với các cải tiến kết hợp giữa 
thông tin topo và cƣờng độ xám của các điểm ảnh trong xác định biên, và khử 
phân đoạn quá nát [CT.3], [CT.7]. 
3. Đề xuất hai phép biến đổi tựa curvelet dựa trên kết hợp giữa ridgelet hữu hạn và 
phân rã LP hay wavelet packet. Ƣu điểm của các biến đổi đề xuất là giảm số 
lƣợng hệ số thƣa trong khi vẫn bảo toàn các tính chất của biến đổi có hƣớng cục 
bộ [CT.1], [CT.6]. 
4. Xây dựng tập các đặc trƣng bất đẳng hƣớng dựa trên các biến đổi đa phân giải 
có hƣớng cục bộ và làm đầu vào cho các hệ nhận dạng [CT.5]. 
o Sử dụng các hệ số của các biến đổi có hƣớng cục bộ. 
o Sử dụng hệ số của đa thức Zernike trên các vành tròn của các biến đổi tựa 
curvelet nhằm biểu diễn hình dáng của phần ảnh trên các vành tròn. 
Kết hợp giữa đặc trƣng đa phân giải và SVM phân cấp nhằm cải tiến tốc độ nhận 
dạng. Ứng dụng các nghiên cứu vào phân tích thông tin vi ảnh định vị protein 
trong bào quan nhằm dự đoán chức năng protein. 
23 
1.5. Cấu trúc luận án 
Chƣơng 1 giới thiệu nhu cầu, mục tiêu nghiên cứu của luận án. Trình bày các 
đóng góp, cũng nhƣ cấu trúc của luận án. 
Chƣơng 2 trình bày thuật giải xác định biên dựa trên biến đổi wavelet. Phần đầu 
trình bày tóm tắt biến đổi wavelet liên tục và rời rạc trong không gian một hoặc hai 
chiều. Phần kế tiếp trình bày thuật giải a trous cho biến đổi wavelet không giảm 
kích thƣớc mẫu. Phần kế tiếp trình bày phƣơng pháp xác định cực trị mô-đun của 
biến đổi wavelet theo các thuật giải wavelet gốc hoặc a trous dựa trên hàm wavelet 
thực hoặc phức. Sau cùng là ứng dụng cực trị wavelet để xác định biên các vùng 
tròn trong vi ảnh microarray sử dụng phân tích phổ gen. Đồng thời các thực nghiệm 
cũng đƣợc thực hiện trên ảnh y khoa. Cuối cùng là thực nghiệm so sánh giữa giải 
pháp đƣợc đề xuất trong luận án với các phƣơng pháp xác định biên cổ điển nhƣ 
Canny, Robert, và Sobel. 
Chƣơng 3 trình bày hai phƣơng pháp phân đoạn ảnh. Phƣơng pháp thứ nhất dựa 
trên thuật giải watershed cải tiến kết hợp giữa độ đo khoảng cách và giá trị cƣờng 
độ xám của từng điểm ảnh, đồng thời đề nghị thuật giải làm giảm tình trạng phân 
đoạn quá nát dựa trên thông tin vector topo kết hợp với cƣờng độ mức xám. Phƣơng 
pháp thứ hai dựa trên thống kê sử dụng mô hình trƣờng ngẫu nhiên Markov với 
thuật giải nung luyện mô phỏng có hàm giảm nhiệt độ thích nghi. Thuật giải SA cải 
tiến với phƣơng pháp tính nhiệt độ khởi đầu và hàm giảm nhiệt độ thích nghi và 
ứng dụng chúng vào phân đoạn ảnh. Sau cùng là các phƣơng pháp phân đoạn ảnh 
dựa trên MRF phân cấp với các dạng phân rã giảm hay giữ nguyên kích thƣớc mẫu. 
Chƣơng 4 trình bày các phép biến đổi đa phân giải cục bộ có hƣớng. Phần đầu 
tóm tắt biến đổi ridgelet liên tục và các dạng rời rạc dựa trên sự kết hợp giữa biến 
đổi Radon và wavelet một chiều trên các lát cắt chiếu trong miền Radon. Sơ lƣợc 
các phƣơng pháp rời rạc hoá biến đổi ridgelet nhƣ rectopolar và slantstack nhằm tạo 
lƣới phủ, cũng nhƣ biến đổi ridgelet trực giao. Phần kế tiếp trình bày hai dạng biến 
đổi đa phân giải cục bộ có hƣớng curvelet và contourlet và ứng dụng của chúng để 
24 
biểu diễn “đối tƣợng cong” trong ảnh. Xây dựng các mô hình kết hợp giữa ridgelet 
hữu hạn và các phân rã LP hay wavelet nhằm tạo ra các biến đổi tựa curvelet. Phần 
cuối của chƣơng minh hoạ ƣu điểm của các hệ số của các phép biến đổi tựa curvelet 
thông qua thực nghiệm tái tạo lại ảnh gốc. 
Chƣơng 5 trình bày phƣơng pháp phân tích vi ảnh dƣạ trên sự kết hợp giữa 
SVM cải tiến và các đặc trƣng đa phân giải với các hệ số của biến đổi trong chƣơng 
4. Phƣơng pháp xây dựng đặc trƣng bất biến với tịnh tiến, tỉ lệ, quay. Trình bày 
phƣơng pháp trích đặc trƣng Haralick và Zernike moment. Phƣơng pháp xây dựng 
đặc trƣng Zernike moment kết hợp biến đổi tựa curvelet nhằm xây dựng các đặc 
trƣng Zernike trên các vành tròn chứa các hệ số tựa curvelet. Trình bày phƣơng 
pháp giữ lại đặc trƣng có nghĩa dựa trên ma trận các giá trị riêng (eigen). Sau cùng 
là kết quả thực nghiệm thể hiện độ chính xác khi phân loại thực hiện trên tập ảnh 
chụp tế bào HELA, CHO, v.v. 
Chƣơng 6 trình bày kết luận và định hƣớng phát triển, và sau cùng là danh sách 
tài liệu tham khảo.