BIẾN ĐỔI ĐA PHÂN GIẢI CÓ HƯỚNG ỨNG DỤNG TRONG PHÂN TÍCH VI ẢNH
NGÔ QUỐC VIỆT
Trang nhan đề
Lời cam đoan
Lời cảm ơn
Mục lục
Danh mục hình ảnh
Chương 1:
Giới thiệu
Chương 2:
Xác định biên trong vi ảnh dựa trên cực trị Wavelet
Chương 3:
Các thuật giải phân đoạn ảnh
Chương 4:
Phép biến đổi đa phân giải có hướng cục bộ
Chương 5:
Phân tích vi ảnh dựa trên biến đổi đa phân giải có hướng
Chương 6:
Kết luận và hướng kiến nghị
Danh mục công trình tác giả
Tài liệu tham khảo
Phụ lục
13 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 3297 | Lượt tải: 2
Bạn đang xem nội dung tài liệu Biến đổi đa phân giải có hướng ứng dụng trong phân tích vi ảnh, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
12
CHƢƠNG 1: GIỚI THIỆU
1.1. Mở đầu
Giai đoạn gần đây, các nghiên cứu về cấu trúc nano ngày càng phát triển trong
nhiều lĩnh vực. Đây là ngành khoa học nghiên cứu sự tác động của các cấu trúc ở
kích thƣớc nano và đƣợc ứng dụng vào các lĩnh vực khác nhau nhƣ: điện tử nano,
sinh học nano, vât liệu nano, v.v. Đây là lĩnh vực rất quan trọng và đƣợc dự báo là
sẽ phát triển mạnh trong những năm tới [21], [78], trong đó vai trò của khoa học
máy tính trợ giúp công nghệ nano ngày càng rõ nét.
Sự phát triển khoa học công nghệ nano liên hệ mật thiết với các tiến bộ trong
ngành khoa học máy tính. Việc quan sát, phân tích và thao tác đƣợc trên các đối
tƣợng kích thƣớc nano mét, phân tử, sẽ đóng góp rất nhiều cho khoa học và công
nghệ nano. Trong đó việc tạo ảnh chụp các đối tƣợng kích thƣớc nhỏ là yếu tố quan
trọng cho các phân tích thủ công hay tự động ở các giai đoạn sau. Một số kỹ thuật
tạo vi ảnh nhƣ Scanning Probe Microscopy (SPM) [25], hay Atomic Force
Microscopy (AFM) [3][5], Scanning Tunneling Microscopy (STM) [8], AFM và
Near-field Scanning Optical Microscopy (NSOM), Magnetic Force Microscopy
(MFM), Lateral Force Microscopy (LFM), Electrostatic Force Microscopy (EFM),
v.v. cho phép tạo đƣợc ảnh bề mặt ở độ phân giải nano.
Các kỹ thuật tạo ảnh trên đã mở ra hướng nghiên cứu sử dụng vi ảnh để giải
quyết các vấn đề trong rất nhiều lĩnh vực như công nghệ sinh học, bán dẫn, sản
xuất vi mạch, v.v.
Thuật ngữ vi ảnh đƣợc xem nhƣ ảnh chụp các đối tƣợng có kích thƣớc nhỏ (kích
thƣớc nano mét hay micro mét) thông qua các kỹ thuật tạo ảnh đặc biệt. Trong luận
án này, chúng tôi nghiên cứu và phát triển các thuật giải trên tập vi ảnh Scanning
Electron Microscopy (SEM), STM chụp bề mặt wafer dùng trong công nghệ bán
dẫn, ảnh DNA microarray, và vi ảnh huỳnh quang (fluorescence microscopy) dùng
trong vi sinh học.
13
Trong ngành công nghệ bán dẫn, ảnh SPM đƣợc dùng để hỗ trợ một số công
đoạn sản xuất wafer nhƣ giám sát quá trình phủ các lớp vật chất lên bề mặt, đo độ
phẳng, xác định lỗi v.v. Trong lĩnh vực sinh học, SPM có thể cung cấp ảnh ba chiều
các bề mặt phân tử trong môi trƣờng lỏng hay khí. Thông qua chuỗi các vi ảnh, ta
có thể nghiên cứu các quá trình diễn ra trong DNA (nhƣ đột biến, lai ghép, v.v) ở
mức độ phân tử. Việc chẩn đoán bệnh (nhƣ kiểm tra phổ gen) cũng đƣợc sự hỗ trợ
bằng các kỹ thuật nhận dạng mẫu và tìm kiếm trong ngân hàng phổ gen. Với kỹ
thuật SPM, ta có thể quan sát chuỗi ảnh thể hiện ở mức độ tế bào hay protein, cấu
trúc màng tế bào và hơn nữa là hiểu tính năng của chúng thông qua các phƣơng
pháp có sự trợ giúp của các kỹ thuật phân tích ảnh. Kỹ thuật AFM có thể tạo đƣợc
ảnh trong môi trƣờng lỏng hay khí nhờ sự tƣơng tác của nó với các phân tử. Trong
các ứng dụng polymer, SPM có thể giúp nghiên cứu ở mức hình thái hay cấu trúc
nano. Ở độ phân giải cao, SPM cho phép „chụp‟ nhằm xác định đƣợc tính chất vật
liệu, cấu tạo bề mặt ở mức độ định tính và định lƣợng thông qua một số phƣơng
pháp trích đặc trƣng ảnh, đặc biệt là đặc trƣng đa tỉ lệ.
Vấn đề khó khăn khi xử lý các lớp ảnh chụp bề mặt các wafer bán dẫn hay các tế
bào là hầu nhƣ các đặc trƣng không thể mô tả tƣờng minh dạng nhƣ “chữ C có hình
cong và hai đầu không chạm nhau” hay “hai mắt đối xứng qua trục dọc trên mặt
ngƣời”, v.v. Các vi ảnh thƣờng có các tính chất sau
Màu sắc trải đều và phân bố ngẫu nhiên.
Các đối tƣợng hay đặc trƣng gần nhƣ không thể mô tả tƣờng minh.
Yếu tố nhiễu có tác động rất lớn đến quy trình xử lý.
Đặc biệt trong lĩnh vực sản xuất vi mạch bán dẫn, phân biệt giữa vi lỗi và nhiễu
là nhu cầu cần thiết. Hình 1.1 thể hiện sự khác biệt giữa vi lỗi và nhiễu có trong ảnh
chẩn đoán lỗi của một trong các công đoạn của quy trình sản xuất vi mạch bán dẫn.
Trong hình minh hoạ này, số lƣợng điểm ảnh của nhiễu hay vi lỗi có vẻ tƣơng
đƣơng, nhƣng hình dáng hay hƣớng hoàn toàn khác nhau. Điều này có thể dẫn đến
trở ngại khi phân tích trực tiếp trên dữ liệu ảnh.
14
Hình 1.1-Minh hoạ khác biệt giữa vi lỗi và nhiễu
Trong ngành công nghệ sinh học, song song với vấn đề xây dựng bản đồ gen,
một hƣớng nghiên cứu quan trọng khác hƣớng đến phân tích chức năng protein. Các
tiếp cận trƣớc đây chủ yếu thực hiện nhu cầu này dựa trên việc phân tích chuỗi gen
một chiều, sử dụng CSDL ngân hàng gen và đã đạt đƣợc một số kết quả khả quan.
Tuy nhiên, kể từ sau năm 2000, hƣớng tiếp cận sử dụng vi ảnh hai chiều hoặc ba
chiều cho xác định chức năng protein nhận đƣợc nhiều quan tâm từ các nhà nghiên
cứu.
Nhận xét rằng, giải quyết các vấn đề công nghệ trên thông qua phân tích dữ liệu
ảnh không thể tách rời nhu cầu cần “làm rõ” hay “nhìn thấy” và đặc biệt là “hiểu”
các đối tượng trong ảnh. Nhu cầu trên gắn liền với việc nghiên cứu, xây dựng các
phép biến đổi và thực hiện các phân tích trên các hệ số biến đổi thay vì xử lý trực
tiếp trên dữ liệu ảnh thô. Các ứng dụng có thể như: xác định tính chất bề mặt; trích
đặc trưng; nâng cao chất lượng ảnh; khử nhiễu, v.v. Đây chính là định hướng cho
chúng tôi thực hiện luận án này.
Chúng tôi không nhằm nghiên cứu các vấn đề thuộc lĩnh vực khoa học và công
nghệ nano, mà hƣớng đến các phương pháp sử dụng toán học, thống kê và khoa học
máy tính xử lý, phân tích dữ liệu có được từ các tiến bộ của công nghệ tạo vi ảnh.
1.2. Tình hình nghiên cứu trong và ngoài nƣớc
Ở trong nước, xét trên khía cạnh công nghệ và sản xuất, việc nghiên cứu và ứng
dụng CNTT vào một số công đoạn của quy trình sản xuất mạch tích hợp còn khá
hạn chế.
15
Một số ít công ty nhƣ Global CyberSoft, SiGlaz, v.v.. đã tham gia vào lĩnh vực
này nhƣng hầu hết chỉ giới hạn ở mức gia công phần mềm. Mục tiêu của các sản
phẩm này là chẩn đoán lỗi trong quá trình sản xuất vi mạch. Cụ thể hơn, dữ liệu
đƣợc lấy trực tiếp từ dây chuyền sản xuất hay vi ảnh và đƣợc phân tích. Một số
nghiên cứu và phát triển có tiếp cận logic mờ để phân lớp lỗi. Một trong những kết
quả chính của SiGlaz là sản phẩm IDA-Intelligence defect Analysis (tham khảo
www.siglaz.com) . Sản phẩm này hỗ trợ trong dây chuyển sản xuất mạch bán dẫn.
Dữ liệu lấy trực tiếp từ định dạng KLARF. Các giải pháp đƣợc sử dụng chủ yếu để
phát hiện lỗi dựa trên phân loại các đặc trƣng trích rút trực tiếp trên dữ liệu. Theo
tìm hiểu của chúng tôi, cách tiếp cận phân lớp lỗi của sản phẩm này dựa trên thuật
giải k-NN. Việc xác định vi lỗi chỉ trên một số hƣớng cụ thể (nhƣ 0, 45, 90 độ). Ƣu
thế của giải pháp này là ít tính toán và đáp ứng phần nào nhu cầu sản xuất công
nghiệp.
Sản phẩm thứ hai đƣợc nghiên cứu và phát triển trong nƣớc là FabSolve của
công ty công nghệ Dolsoft, nhƣng đã đƣợc chuyển giao cho tập đoàn KLA-Tencor
từ cuối những năm 2007. Mục tiêu của sản phẩm này là nhằm phục vụ trong công
nghệ sản xuất vi mạch bán dẫn. Định hƣớng sản phẩm là tìm ra những lỗi hay
những khác biệt nếu có giữa quá trình sản xuất wafer và bản thiết kế các vi mạch
ban đầu đƣợc dự kiến sản xuất. Giải pháp là so sánh vi ảnh (bề mặt các khu vực hay
toàn bộ các lớp phủ vật chất trên wafer) với bản thiết kế (tập tin định dạng GDSII-
tham khảo trong hoặc
Lỗi của wafer, hay của những con chip luôn có
tỷ lệ rất cao vì quy trình quá tinh vi, phức tạp. Bài toán chính là thực hiện so khớp
giữa một ảnh khu vực và bản thiết kế vô cùng lớn (kích thƣớc tập tin GDS có khi
lên đến vài chục gigabyte). Ƣu điểm của phần mềm này là xử lý nhanh dữ liệu hình
ảnh con chip trong quá trình chế tạo, đem so sánh tức thì với “bản đồ chip” theo
thiết kế để xác định các khiếm khuyết của chip và phát lệnh hiệu chỉnh kịp thời sửa
sai cho dây chuyền công nghệ.
16
Xét trên khía cạnh khai thác các công cụ toán học để giải quyết các bài toán
CNTT, trƣờng ĐH KHTN TPHCM cũng đã có một số công trình sử dụng biến đổi
wavelet, Radon cho các bài toán truy vấn hay xử lý ảnh. Luận án tiến sĩ của tác giả
Nguyễn Đình Thúc (ĐH KHTN, ĐHQG. TPHCM) đã trình bày các cải tiến cũng
nhƣ khai thác biến đổi Radon và ứng dụng. Tuy nhiên nhƣ chúng tôi đã nhận xét
trong phần giới thiệu, việc khai thác thông tin ở các tỉ lệ khác nhau là cần thiết. Đối
với yêu cầu này thì biến đổi Radon chƣa đáp ứng đầy đủ.
Ngành công nghệ sinh học, gần đây đã đƣợc sự quan tâm nhiều từ cấp lãnh đạo
cho đến các nhà khoa học. Phòng thí nghiêm tế bào gốc cũng đã đƣợc quyết định
thành lập. Đây là tiền đề cho các nghiên cứu sâu hơn trong lĩnh vực công nghệ sinh
học (CNSH). Ở đây, công cụ CNTT phục vụ cho nghiên cứu trong CNSH là thực sự
cần thiết.
Theo xu hƣớng này, các công trình nghiên cứu của nhóm tác giả Đỗ Phúc thuộc
ĐH CNTT, ĐHQG TP.HCM đã khai thác tri thức dựa trên CSDL gen và đạt đƣợc
một số thành công nhất định. Các công trình này sử dụng ngân hàng gen một chiều
nhằm giải quyết các bài toán nhƣ xử lý, phân tích, nhận dạng gen hỗ trợ đào tạo và
nghiên cứu trong ngành công nghệ sinh học. Tuy nhiên, các nghiên cứu này không
dựa trên dữ liệu vi ảnh.
Nhu cầu cấp thiết đặt ra là xây dựng các công cụ trợ giúp giải quyết các bài
toán trong sinh học là phân tích dữ liệu ảnh. Các nhu cầu sử dụng CNTT từ đơn
giản nhất nhƣ đếm các số lƣợng tế bào trong quá trình phân bào trên ảnh hay video
cho đến phức tạp hơn nhƣ xác định hình dáng là rất cần thiết. Chúng tôi nhận thấy
rằng, việc ứng dụng CNTT, đặc biệt là sử dụng dữ liệu ảnh hỗ trợ giải quyết các vấn
đề trong CNSH còn hạn chế ở nƣớc ta.
Ở ngoài nước, từ những năm 2000 các nghiên cứu trong lĩnh vực tin sinh học
(bioinformatics) và sử dụng CNTT trong công nghệ bán dẫn phát triển rất mạnh,
trong đó có khá nhiều nghiên cứu sử dụng CNTT trong bài toán tìm hiểu tính chất
protein. Một tiếp cận phổ biến là hƣớng đến phân tích vị trí bào quan của protein
17
với mục tiêu chính là xác định đƣợc các sơ đồ định vị protein (protein location
pattern). Yêu cầu đặt ra là dự đoán hay xác định đƣợc các sơ đồ vị trí của các
protein, và xây dựng đƣợc tập chứa các sơ đồ vị trí có thể của protein.
Theo định hƣớng của bài toán dự đoán protein, nhóm tác giả Harris (tham khảo
81407) vào năm 2004 đã trình bày mô hình dự đoán sơ đồ vị trí của các protein dựa
trên ontology các thành phần tế bào thuộc dự án Gene Ontology
(www.geneontology.org). Nhóm tác giả đã sử dụng đồ thị có hƣớng (Directed
Acyclic Graph-DAG), trong đó mô tả sơ đồ định vị các thành phần tế bào. Tuy
nhiên, do bản chất của DAG với một nút con có thể có nhiều nút cha, vì vậy có thể
dẫn đến suy diễn sai trên đồ thị trong quá trình dự đoán.
Theo định hƣớng xác định sơ đồ định vị các thành phần tế bào, nhóm tác giả
Lujan thuộc đại học Castilla-La Mancha, Albacete, Tây Ban Nha đã trình bày trong
bài viết “Electron Microsopy Studies of Receptor Localization” phƣơng pháp sử
dụng vi ảnh từ kính hiển vi điện tử để xác định sơ đồ định vị thụ thể (receptor). Tuy
nhiên kỹ thuật này không thể làm việc với tế bào sống, vì vậy việc sử dụng vi ảnh
huỳnh quang (fluorescence microscopy image) trở thành giải pháp phổ biến nhất
trong bài toán nghiên cứu tính chất protein.
Nổi bật theo định hƣớng sử dụng vi ảnh huỳnh quang là các công trình phân loại
tính chất protein của nhóm tác giả M R. F. Murphy thuộc Đại học Carinegie
Mellon, Pittsburgh, PA, USA [55]. Đây đƣợc xem là công trình tiên phong trong
việc sử dụng vi ảnh định vị protein trong bào quan để khai thác tri thức protein
trong CNSH. Cách giải quyết dựa trên mạng nơ-ron với tập đặc trƣng trích từ vi ảnh
huỳnh quang. Đối với bài toán nhận dạng, bản chất vấn đề là xây dựng đƣợc tập đặc
trƣng và phát triển mô hình phân lớp thích hợp. Trong công trình này, các tác giả đã
xây dựng tập đặc trƣng dựa trên một số khái niệm cơ bản trong xử lý ảnh nhƣ: mật
độ, số Euler, phƣơng sai, tỉ lệ về kích thƣớc giữa các “đối tƣợng”, tính đồng nhất,
bao lồi, wavelet; và các tính chất lấy đƣợc từ vi ảnh huỳnh quang nhƣ: tâm (COF),
18
khoảng cách trung bình của các đối tƣợng đến COF, v.v.. và sử dụng mạng nơ-ron
để dự đoán. Các đặc trƣng đƣợc nhóm tác giả gọi là các bộ SLF (Subcellular
Location Features – các đặc trƣng định vị bào quan). Kết quả thực nghiệm phân lớp
trên tập ảnh mẫu chụp tế bào Hela và CHO đƣợc nhóm tác giả công bố khoảng
90%.
Nhận xét rằng, tập đặc trƣng biểu diễn ảnh trong các công trình và sản phẩm trên
dựa trên tri thức chuyên gia và các khái niệm đã đƣợc trình bày trong các bài viết về
đặc trƣng vân (texture) hay mẫu tô (pattern). Nghĩa là, thực hiện trích rút thông tin
trực tiếp trên ảnh gốc, sau đó, xây dựng mô hình phân lớp (dựa trên logic mờ, mạng
nơ-ron hay SVM) trên tập đặc trƣng đã chọn để phân tích.
Trong lĩnh vực phân tích lỗi vi ảnh chụp wafer trong quá trình sản xuất vi mạch,
vào năm 2000 nhóm tác giả Thomas P. Karnowski, Kenneth W. Tobin, Shaun S.
Geason thuộc phòng thí nghiệm quốc gia OakRidge đã nghiên cứu, và công bố kết
quả trong các bài viết “Fuzzy Logic Connectivity in Semiconductor Defect
Clustering', và „Feature Analisys and Classfication of Manufacturing Signatures
Based on Semiconductor Wafermaps (nguồn
đồng thời thực hiện thành công sản phẩm hỗ trợ
trong dây chuyền sản xuất vi mạch. Giải pháp dựa trên vi ảnh xám đƣợc chuyển
trực tiếp từ dữ liệu định dạng KLARF, và sử dụng k-NN hay logic mờ để phân loại
lỗi. Nhu cầu này đã đƣợc các đơn vị trong nƣớc giải quyết thành công phần nào nhƣ
đã trình bày ở phần „Tình hình nghiên cứu trong nước‟.
Ở khía cạnh biểu diễn ảnh dựa trên các biến đổi giải tích, hầu hết các nghiên cứu
đều tập trung vào biến đổi Fourier, wavelet. Nhiều công trình [31], [35] đã phân
tích các ƣu điểm và nhƣợc điểm của các phép biến đổi trên. Cụ thể là biến đổi
Fourier chỉ biểu diễn thông tin tần số, trong khi biến đổi wavelet hai chiều có thể
biểu diễn thông tin tần số và vị trí và vì vậy chỉ thích hợp để khai thác dữ liệu dạng
điểm ở các tỉ lệ khác nhau (đƣợc trình bày chi tiết trong chƣơng 4). Vì vậy, một số
19
nghiên cứu gần đây tập trung tìm kiếm các biến đổi sao cho có thể “biểu diễn”
được các đối tượng cong trong ảnh.
Trong luận án này, ngoài việc nghiên cứu và đề xuất các mô hình biểu diễn ảnh
thông qua các hệ số thưa và các mô hình phân lớp, chúng tôi mong muốn bước đầu
giải quyết một số vấn đề trong các ngành công nghệ mũi nhọn trên.
1.3. Mục tiêu thực hiện của luận án
Trong những năm 80 của thế kỷ trƣớc, biến đổi wavelet đƣợc giới thiệu nhƣ sự
cải tiến của biến đổi Fourier và ngày càng đƣợc ứng dụng rộng rãi trong nhiều lĩnh
vực. Lý do chính là dữ liệu biến đổi wavelet biểu diễn đƣợc thông tin trong cả miền
tần số và không gian (trong khi biến đổi Fourier chỉ thể hiện trong miền tần số) nhờ
vào xây dựng thông tin tần số xuất hiện ở các tỉ lệ và vị trí khác nhau.
Trong xử lý ảnh, khái niệm đa phân giải đóng góp rất nhiều vào các kỹ thuật
phân rã hay phân tích ảnh nhƣ wavelet, laplacian pyramid. Nhận xét là các thông tin
ảnh xuất hiện ở một số tỉ lệ nhất định là khác nhau. Nhận xét này có thể quan sát
đƣợc ở lĩnh vực bản đồ, trong đó một số chi tiết chỉ xuất hiện ở tỉ lệ nhỏ, nhƣng
không xuất hiện ở tỉ lệ lớn và ngƣợc lại. Áp dụng ý tƣởng này trong ảnh sinh học,
chúng ta có thể khai thác và phân tích thông tin ở mức độ phân tử hay tế bào. Từ
nhận xét trên, ta thấy kỹ thuật đa phân giải rất thích hợp trong các bài toán phân tích
vi ảnh sinh học hay trong ngành bán dẫn nhằm thực hiện các chẩn đoán, nhận dạng
và các bài toán xử lý ảnh cổ điển nhƣ khử nhiễu, tái tạo và nén ảnh. Đặc biệt
phƣơng pháp dựa trên biến đổi đa phân giải tỏ ra rất thích hợp khi chất lƣợng ảnh
không tốt.
Việc dùng các phƣơng pháp xử lý ảnh truyền thống để giải quyết vấn đề “làm
rõ” đối tƣợng trong vi ảnh gặp một số nhƣợc điểm khó khắc phục nhƣ đƣợc trình
bày ở các chƣơng sau. Cụ thể hơn, giải quyết vấn đề xác định biên dựa trên các
phƣơng pháp sử dụng Canny, Robert, Sobel, v.v đều không đạt với vi ảnh nhiễu.
20
Tƣơng tự, với yêu cầu phân đoạn ảnh, các phƣơng pháp gom nhóm (cluster) hay
loang vùng (region growing) đều không thực hiện đƣợc trên các tập vi ảnh nhƣ sẽ
đƣợc trình bày trong chƣơng 3.
Biến đổi wavelet là sự lựa chọn phổ biến để giải quyết nhiều vấn đề trong xử lý
ảnh. Tuy vậy, biến đổi wavelet cũng thể hiện các hạn chế khi phân tích các đặc
điểm cong tồn tại phổ biến trong ảnh. Nguyên nhân là vì các hệ số của biến đổi
wavelet hai chiều chỉ chứa thông tin vị trí ở các tỉ lệ khác nhau, và hoàn toàn không
có thông tin biểu diễn hƣớng hay góc.
Từ những nhận xét trên, chúng tôi thấy rằng việc nghiên cứu và phát triển các
biến đổi biểu diễn đặc trưng cong ở nhiều tỉ lệ sẽ giúp“dễ dàng nhìn thấy các đối
tượng cong” trên ảnh với số lượng hệ số tối thiểu sẽ mang lại nhiều ưu điểm khi
phân tích dữ liệu. Ngoài ra, việc khai thác các mô hình thống kê áp dụng trên ảnh
sẽ mang lại các cải tiến trong lĩnh vực tiền xử lý, phân tích hay nhận dạng ảnh.
Chúng tôi cũng nghiên cứu các phương pháp dựa trên các biến đổi toán học làm
nền tảng cho hệ thống các ứng dụng phân tích vi ảnh từ giai đoạn xác định biên,
phân đoạn lẫn tạo ra tập đặc trưng cho quá trình phân tích.
Luận án tập trung nghiên cứu, xây dựng các mô hình và công cụ toán học hỗ trợ
phân tích vi ảnh với các mục tiêu sau:
Mục tiêu tổng quát
Nghiên cứu các biến đổi đa tỉ lệ có hƣớng nhằm xây dựng đƣợc tập hệ số thƣa
có thể biểu diễn ảnh.
Xây dựng mô hình nhận dạng thích hợp dùng các hệ số thƣa của các biến đổi có
hƣớng.
Sử dụng tập các hệ số thƣa của các biến đổi nhằm giải quyết các bài toán cơ bản
trong xử lý ảnh nhƣ xác định biên, phân đoạn.
21
Mục tiêu cụ thể
Xây dựng các mô hình xác định biên dựa trên biến đổi wavelet với hàm phức,
bảo toàn kích thƣớc mẫu, và ứng dụng làm rõ biên vùng tròn trong ảnh DNA
microarray.
Nghiên cứu, cải tiến mô hình trƣờng ngẫu nhiên Markov, và ứng dụng vào bài
toán phân đoạn vi ảnh.
Nghiên cứu và vận dụng biến đổi đa phân giải có hƣớng cục bộ vào bài toán
phân tích vi ảnh.
Đề xuất mô hình nhận dạng đối tƣợng trong vi ảnh dựa trên các đặc trƣng giải
tích và ứng dụng vào phân tích tính chất protein.
1.4. Những đóng góp chính
Luận án nghiên cứu và xây dựng một số phƣơng pháp dựa trên công cụ toán học
và ứng dụng vào các công đoạn tiền xử lý và phân tích vi ảnh. Các đóng góp chính
bao gồm:
1. Đề xuất phƣơng pháp xác định biên dựa trên cực trị wavelet với hàm phức và
bảo toàn kích thƣớc mẫu. Xây dựng một số mô hình xác định biên dựa trên ƣu
điểm của các thuật giải a trous UWT và IUWT nhằm cải tiến chất lƣợng biên
cũng nhƣ tốc độ thực hiện [CT.2].
2. Nghiên cứu và vận dụng trƣờng ngẫu nhiên Markov với các cải tiến về tốc độ
hội tụ cho bài toán phân đoạn ảnh [CT.4]. Cũng nhƣ các phƣơng pháp ngẫu
nhiên khác (thuật giải genetic, mạng nơ-ron), tốc độ hội tụ và chất lƣợng lời giải
tối ƣu phụ thuộc vào lời giải khởi đầu và phƣơng pháp cập nhật lời giải. Chúng
tôi đề xuất sử dụng thuật giải nung luyện mô phỏng cho quá trình Markov với
hai đóng góp chính:
22
o Xác định nhiệt độ khởi đầu cho thuật giải nung luyện mô phỏng
(Simulated Annealing-SA).
o Công thức giảm nhiệt độ thích nghi bảo đảm cho thuật giải phân đoạn
ảnh hội tụ đến lời giải tối ƣu.
Bên cạnh đó, chúng tôi đề xuất các lƣợc đồ phân đoạn ảnh phân cấp dựa trên các
kết hợp biến đổi Laplacian Pyramid (LP), wavelet, a trous wavelet với trƣờng
ngẫu nhiên Markov (MRF) và đặc biệt là phân đoạn ảnh kết hợp giữa MRF và
wavelet bất đẳng hƣớng trên hai dạng giảm hay giữ nguyên kích thƣớc mẫu
nhằm cải tiến tốc độ cũng nhƣ chất lƣợng lời giải tối ƣu.
Với bài toán cụ thể nhƣ phân đoạn ảnh chụp wafer bán dẫn, chúng tôi đề xuất sử
dụng thuật giải „đƣờng thủy phân‟ (watershed) với các cải tiến kết hợp giữa
thông tin topo và cƣờng độ xám của các điểm ảnh trong xác định biên, và khử
phân đoạn quá nát [CT.3], [CT.7].
3. Đề xuất hai phép biến đổi tựa curvelet dựa trên kết hợp giữa ridgelet hữu hạn và
phân rã LP hay wavelet packet. Ƣu điểm của các biến đổi đề xuất là giảm số
lƣợng hệ số thƣa trong khi vẫn bảo toàn các tính chất của biến đổi có hƣớng cục
bộ [CT.1], [CT.6].
4. Xây dựng tập các đặc trƣng bất đẳng hƣớng dựa trên các biến đổi đa phân giải
có hƣớng cục bộ và làm đầu vào cho các hệ nhận dạng [CT.5].
o Sử dụng các hệ số của các biến đổi có hƣớng cục bộ.
o Sử dụng hệ số của đa thức Zernike trên các vành tròn của các biến đổi tựa
curvelet nhằm biểu diễn hình dáng của phần ảnh trên các vành tròn.
Kết hợp giữa đặc trƣng đa phân giải và SVM phân cấp nhằm cải tiến tốc độ nhận
dạng. Ứng dụng các nghiên cứu vào phân tích thông tin vi ảnh định vị protein
trong bào quan nhằm dự đoán chức năng protein.
23
1.5. Cấu trúc luận án
Chƣơng 1 giới thiệu nhu cầu, mục tiêu nghiên cứu của luận án. Trình bày các
đóng góp, cũng nhƣ cấu trúc của luận án.
Chƣơng 2 trình bày thuật giải xác định biên dựa trên biến đổi wavelet. Phần đầu
trình bày tóm tắt biến đổi wavelet liên tục và rời rạc trong không gian một hoặc hai
chiều. Phần kế tiếp trình bày thuật giải a trous cho biến đổi wavelet không giảm
kích thƣớc mẫu. Phần kế tiếp trình bày phƣơng pháp xác định cực trị mô-đun của
biến đổi wavelet theo các thuật giải wavelet gốc hoặc a trous dựa trên hàm wavelet
thực hoặc phức. Sau cùng là ứng dụng cực trị wavelet để xác định biên các vùng
tròn trong vi ảnh microarray sử dụng phân tích phổ gen. Đồng thời các thực nghiệm
cũng đƣợc thực hiện trên ảnh y khoa. Cuối cùng là thực nghiệm so sánh giữa giải
pháp đƣợc đề xuất trong luận án với các phƣơng pháp xác định biên cổ điển nhƣ
Canny, Robert, và Sobel.
Chƣơng 3 trình bày hai phƣơng pháp phân đoạn ảnh. Phƣơng pháp thứ nhất dựa
trên thuật giải watershed cải tiến kết hợp giữa độ đo khoảng cách và giá trị cƣờng
độ xám của từng điểm ảnh, đồng thời đề nghị thuật giải làm giảm tình trạng phân
đoạn quá nát dựa trên thông tin vector topo kết hợp với cƣờng độ mức xám. Phƣơng
pháp thứ hai dựa trên thống kê sử dụng mô hình trƣờng ngẫu nhiên Markov với
thuật giải nung luyện mô phỏng có hàm giảm nhiệt độ thích nghi. Thuật giải SA cải
tiến với phƣơng pháp tính nhiệt độ khởi đầu và hàm giảm nhiệt độ thích nghi và
ứng dụng chúng vào phân đoạn ảnh. Sau cùng là các phƣơng pháp phân đoạn ảnh
dựa trên MRF phân cấp với các dạng phân rã giảm hay giữ nguyên kích thƣớc mẫu.
Chƣơng 4 trình bày các phép biến đổi đa phân giải cục bộ có hƣớng. Phần đầu
tóm tắt biến đổi ridgelet liên tục và các dạng rời rạc dựa trên sự kết hợp giữa biến
đổi Radon và wavelet một chiều trên các lát cắt chiếu trong miền Radon. Sơ lƣợc
các phƣơng pháp rời rạc hoá biến đổi ridgelet nhƣ rectopolar và slantstack nhằm tạo
lƣới phủ, cũng nhƣ biến đổi ridgelet trực giao. Phần kế tiếp trình bày hai dạng biến
đổi đa phân giải cục bộ có hƣớng curvelet và contourlet và ứng dụng của chúng để
24
biểu diễn “đối tƣợng cong” trong ảnh. Xây dựng các mô hình kết hợp giữa ridgelet
hữu hạn và các phân rã LP hay wavelet nhằm tạo ra các biến đổi tựa curvelet. Phần
cuối của chƣơng minh hoạ ƣu điểm của các hệ số của các phép biến đổi tựa curvelet
thông qua thực nghiệm tái tạo lại ảnh gốc.
Chƣơng 5 trình bày phƣơng pháp phân tích vi ảnh dƣạ trên sự kết hợp giữa
SVM cải tiến và các đặc trƣng đa phân giải với các hệ số của biến đổi trong chƣơng
4. Phƣơng pháp xây dựng đặc trƣng bất biến với tịnh tiến, tỉ lệ, quay. Trình bày
phƣơng pháp trích đặc trƣng Haralick và Zernike moment. Phƣơng pháp xây dựng
đặc trƣng Zernike moment kết hợp biến đổi tựa curvelet nhằm xây dựng các đặc
trƣng Zernike trên các vành tròn chứa các hệ số tựa curvelet. Trình bày phƣơng
pháp giữ lại đặc trƣng có nghĩa dựa trên ma trận các giá trị riêng (eigen). Sau cùng
là kết quả thực nghiệm thể hiện độ chính xác khi phân loại thực hiện trên tập ảnh
chụp tế bào HELA, CHO, v.v.
Chƣơng 6 trình bày kết luận và định hƣớng phát triển, và sau cùng là danh sách
tài liệu tham khảo.