Luận văn Xây dựng cơ sở dữ liệu phục vụ quá trình xử lý ảnh X quang vú trên máy tính

Bệnh ung thư vú là một căn bệnh rất phổ biến với nữ giới trên thế giới hiện nay. Ở các nước phát triển, quá trình chẩn đoán ảnh X quang vú được hỗ trợ rất nhiều từ hệ thống máy tính. Tuy nhiên, ở Việt Nam, công việc chẩn đoán vẫn còn được thực hiện thủ công, phụ thuộc chủ yếu vào kinh nghiệm của các bác sĩ.

103 trang | Chia sẻ: lylyngoc | Lượt xem: 2490 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng cơ sở dữ liệu phục vụ quá trình xử lý ảnh X quang vú trên máy tính, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

một chút, nhu mơ sáng hơn một chút nữa và cơ ngực là phần sáng nhất trên ảnh. Trong một số trường hợp, phân vùng ảnh cĩ thể được thực hiện chính xác bằng cách chia cường độ mức xám trên ảnh thành bốn khoảng cách đều nhau, sau đĩ phân ngưỡng dựa trên các khoảng này. Trên một bức ảnh với 256 mức xám, bốn khoảng cách đều nhau cĩ thể là: [0-63], [64-127], [128-191],, và [192-255]. Hình 4.2 minh họa một bức ảnh X quang vú từ Hình 4.1 sau quy trình đơn giản này. Hình 4.2 Ảnh đã phân vùng 55 Hình 4.3 là lược đồ xám của ảnh trên Hình 4.1. Nĩ cĩ 4 khoảng cường độ chủ yếu, tương ứng với bốn vùng chính trên ảnh: vùng nhu mơ của vú, vùng cơ ngực, vùng lớp mỡ dưới da và vùng nền ảnh màu đen. Mỗi bức ảnh X quang vú ta xét đều hiển thị một phân bố cường độ duy nhất nhưng tương tự nhau. Tuy nhiên, đường biên giữa các thành phần trên ảnh X quang vú thường khơng tương ứng chính xác với các khoảng cường độ đơn giản sử dụng cho phân vùng minh hoạ trên Hình 4.2. Ta cần một kỹ thuật phức tạp hơn để xác định các khoảng. Trong chương này, ta đưa ra một kỹ thuật phù hợp để thực hiện phân vùng như mong muốn. Kỹ thuật của chúng ta xác định các ranh giới cường độ phù hợp. Khi các dải cường độ đã được xác định, các pixel trong ảnh được nhĩm lại, khi đĩ phân vùng được thực hiện đầy đủ và hiệu quả. ðể ý các đường phân chia dọc trên Hình 4.3; chúng biểu diễn ranh giới cường độ giữa các thành phần khác nhau của vú. Nếu các ranh giới này được xác định đúng, chúng sẽ được sử dụng để phân vùng ảnh. Hình 4.3 Lược đồ xám của ảnh trên Hình 4.1 với 4 khoảng được đánh dấu 56 4.2.1 Phân vùng dựa trên lược đồ xám Các kỹ thuật phân vùng ảnh X quang vú khác thường chỉ dựa trên lược đồ xám của ảnh. Một vài kỹ thuật sử dụng các thơng tin về khơng gian, như hình dạng và kết cấu của ảnh để phân vùng ảnh. Kỹ thuật đưa ra ở đây kết hợp giữa cường độ và các thơng tin khơng gian. Bước đầu tiên của thuật tốn này sử dụng lược đồ xám để xác định các ranh giới về cường độ trên ảnh X quang vú. Các lược đồ xám dễ tính tốn, và chúng mang thơng tin về cường độ trên ảnh. (Vùng được sử dụng để tính lược đồ xám cĩ thể thay đổi để thay đổi phạm vi các đặc trưng cần phát hiện, nghĩa là phân vùng). Kỹ thuật của ta sử dụng lược đồ xám để hình thành một vector đặc trưng rồi sau đĩ là đại lượng về khoảng cách để phân vùng ảnh thành các thành phần. Kỹ thuật này nhanh hơn nhiều so với các phương pháp phức tạp hơn, ví dụ mạng nơron; đồng thời khơng địi hỏi một bộ dữ liệu đã được huấn luyện. Ranh giới các thành phần trên ảnh X quang vú được đặc trưng bởi những thay đổi về cường độ pixel trên các vùng cục bộ. Ví dụ, đường ranh giới giữa cơ ngực và nhu mơ thường được thể hiện bằng một thay đổi về cường độ từ 30% đến 60%. Ranh giới giữa nền ảnh và mơ vú cũng cĩ mức thay đổi tương tự, nhưng ranh giới giữa lớp mỡ dưới da với nhu mơ thì khĩ nhận biết hơn. Phương pháp của chúng ta đánh dấu các vùng trên ảnh hiển thị các vùng cĩ mức thay đổi cường độ tương đối cao. Các vùng này được dùng để xác định các khoảng cường độ cụ thể của ảnh và phân vùng ảnh. 4.2.2 Phương pháp chênh lệch lược đồ xám ðể tính thay đổi về cường độ, lược đồ xám của ảnh được hình thành cho một vùng trên ảnh bằng cách tổng kết tần suất xuất hiện các mức xám trong vùng đĩ. Ảnh sử dụng là ảnh mức xám 8 bit. Lược đồ xám cho một bức ảnh hồn chỉnh hoặc một bức ảnh con cĩ thể được coi như một vector. Trong trường hợp này, lược đồ xám cĩ 256 giá trị, bởi thế vector cĩ 256 chiều. Tích điểm chuẩn hố của hai vector sẽ cho cosin của gĩc giữa hai vector trong khơng gian đa chiều, cho ta một cách so sánh thuận tiện và hiệu quả 57 hai lược đồ xám. Tích điểm của hai vector 1 2( , ,..., )nv v v v= v và 1 2( , ,..., )nu u u u= v được định nghĩa là: ( ) 1 n i i i v u v u = = ∗∑ v v g (4.1) Gĩc θ giữa hai vector v v và u v được xác định bằng cos( ) | | | | v u v u θ = ∗ v v g v v (4.2) với ( )2 1 | | n i i v v = = ∑ v và ( )2 1 | | n i i u u = = ∑ v Tính cosθ khơng khĩ và nĩ cung cấp một đại lượng về “khoảng cách” giữa hai vector. Gĩc này được quan sát dưới dạng một tích điểm chuẩn hố; nĩ được sử dụng như một đại lượng về độ chênh lệch giữa các cặp lược đồ xám. Nếu hai lược đồ xám giống nhau, cos của gĩc bằng 1, nếu trực giao thì cos bằng 0. Với khái niệm này, ta phát triển một phương pháp phân loại các phần trên ảnh X quang vú dưới dạng độ chênh lệch giữa các cặp lược đồ xám. Người ta cũng cĩ thể sử dụng nhiều cách kiểm tra thống kê để so sánh các lược đồ xám, ví dụ tương quan thống kê. Một số các nhà nghiên cứu đã chứng minh rằng các phân bố thống kê, ví dụ phân bố Poisson, cĩ thể được dùng để tính lược đồ xám (Linnett et al.). Tuy nhiên, trong nghiên cứu này, ta chọn tích điểm chuẩn hố vì chúng đơn giản và tính tốn nhanh, và cho một giá trị giữa 0 và 1 trong tất cả các trường hợp. ðại lượng về độ lệch giữa hai lược đồ xám của các ảnh con liền kề cho ta một phương thức rất tốt để phát hiện các thay đổi dần dần trong mật độ quang của ảnh X quang vú. Ranh giới giữa cơ ngực và mơ vú, và giữa mơ vú và nền ảnh, cĩ thể bị nhiễu làm cho mờ đi. Nhưng so sánh các chênh lệch giữa các lược đồ xám sẽ cho ta một định vị chính xác ranh giới giữa cơ ngực, mơ vú, lớp mỡ dưới da và nền ảnh. 58 ðể cơng việc này được thực hiện hiệu quả, ta xây dựng phương pháp lấy mẫu. Ảnh X quang ban đầu được chia thành các hàng và các cột, tạo thành các bức ảnh con. Các ảnh con này cĩ thể gối hoặc khơng gối lên nhau. Kích thước ảnh con cĩ thể thay đổi để thu được độ phân giải mong muốn của thuật tốn. ðể xác định chính xác ranh giới giữa nhu mơ, cơ ngực, lớp mỡ và nền ảnh, các ảnh con liền kề được sử dụng xuất phát từ trái qua phải và trên xuống dưới. Hình 4.4 minh họa ảnh X quang vú trên Hình 4.1 được chia thành các ảnh con. ðây chỉ là ví dụ; trên thực tế số lượng ảnh con lớn hơn nhiều và kích thước của chúng nhỏ hơn nhiều. Sau quy trình lấy mẫu là tính tích điểm chuẩn hố giữa các lược đồ xám của các cặp ảnh con. Tích điểm này được dùng để xây dựng một bức ảnh mới nhận biết được các thay đổi về mật độ quang trên ảnh X quang ban đầu. Ảnh mới được giảm tỷ lệ xuống. Ví dụ, nếu ảnh ban đầu là 5000 × 5000 pixel sử dụng ảnh con cĩ kích thước 10, ảnh mới sẽ cĩ 499 × 499 pixel do cột cuối cùng khơng cĩ ảnh con nào ở bên phải nĩ để so sánh. Hình 4.5 biểu diễn kết quả của phương pháp chênh lệch lược đồ xám cho ảnh trên Hình 4.1. Hình 4.5 minh họa những thay đổi nhỏ trên ảnh đi từ trái sang phải và trên xuống dưới, nhưng khơng đưa ra ranh giới giữa cơ ngực, lớp mỡ và nền ảnh. Trên Hình 4.5 các pixel sáng hơn biểu diễn những thay đổi đột ngột trong kết cấu, tương ứng với các đặc trưng nhỏ trên ảnh hoặc ranh giới quan trọng giữa các vùng. Các vùng tối hơn trên Hình 4.5 biểu diễn các vùng với thay đổi ít hơn. Hình 4.4 Ảnh X quang chia thành các ảnh con 59 Hình 4.5 Chênh lệch lược đồ xám áp dụng cho ảnh X quang vú Hình 4.6 minh họa tốt hơn mức độ hiệu quả của phương pháp chênh lệch lược đồ xám. Nĩ biểu diễn kết quả của phương pháp này chỉ sử dụng lược đồ xám 4 giá trị, thay vì lược đồ xám 256 giá trị như trên Hình 4.5. Sử dụng lược độ xám 4 giá trị cĩ hiệu ứng làm nổi bật các thay đổi quan trọng nhất trong cường độ giữa các bức ảnh. Hình 4.7 biểu diễn kết quả của phương pháp chênh lệch lược đồ với lược đồ xám 4 giá trị nằm trên ảnh X quang vú mà từ đĩ nĩ được lấy. Chú ý rằng ranh giới phù hợp cho các thành phần trên ảnh được đánh dấu bằng đại lượng chênh lệch lược đồ xám. 60 Hình 4.6 Kết quả chênh lệch lược đồ cho lược đồ xám 4 giá trị Hình 4.7 ðưa chênh lệch lược đồ xám vào ảnh X quang vú Phương pháp chênh lệch lược đồ xám 4 giá trị hoạt động tốt trong trường hợp này, nhưng trong các trường hợp khác nĩ cĩ thể khơng phát hiện được chính xác ranh giới. Khi lược đồ xám của các ảnh con được nén từ 256 xuống 4 giá trị, 61 ranh giới mà sẽ được phát hiện được đưa vào trong các khoảng cường độ sau [0-63], [64-127], [128-191] và [192-255]. ðây là các khoảng được dùng để phân vùng ảnh trên Hình 4.2. Chúng hoạt động tốt trên ảnh này. Tuy nhiên, khơng phải tất cả các ảnh X quang vú đều giống nhau. Ví dụ, Hình 4.8 là ảnh X quang vú từ Hình 4.1 với tất cả các cường độ pixel tăng 15 %. Kiểu thay đổi cường độ này khơng phổ biến đối với ảnh X quang vú, ngay cả với các ảnh trong vùng một bộ. Hình 4.8 Ảnh X quang vú với cường độ tăng 15 % Hình 4.9 biểu diễn kết quả sau khi áp dụng chênh lệch lược đồ xám 4 giá trị cho ảnh trên Hình 4.8. Chú ý rằng cĩ một số vấn đề nảy sinh. Chỉ ba vùng được phát hiện. Ranh giới giữa cơ ngực và mơ vú khơng được xác định. ðồng thời, nhiễu nổi bật trên nền ảnh và sẽ khiến kết quả khơng ra được trong mơi trường tự động. Cuối cùng, ranh giới giữa phần mơ vú và lớp mỡ và ranh giới giữa lớp mỡ và nền ảnh là khơng chính xác. Vấn đề tương tự cũng gặp phải khi các cường độ pixel trên ảnh giảm 15 %. Hình 4.10 biểu diễn kết quả áp dụng chênh lệch lược đồ xám 4 giá trị cho ảnh giảm 62 về cường độ. Trong ví dụ này, tất cả các ranh giới đều bị xác định sai, và nhiễu ở phần mơ vú khiến khơng đưa ra được kết quả. Hình 4.9 ðưa chênh lệch lược đồ xám vào ảnh X quang vú tăng 15 % Hình 4.10 ðưa chênh lệch lược đồ xám vào ảnh X quang vú giảm 15 % 63 Sử dụng lược đồ xám 4 giá trị là khơng đủ để đưa ra ranh giới giữa các thành phần ảnh. Bởi vậy, ta phát triển một phương pháp định vị các ranh giới này sử dụng lược đồ xám 256 mức. 4.2.3 Tìm ranh giới giữa các thành phần Kết quả của phương pháp chênh lệch lược đồ xám 256 giá trị, như minh họa trên Hình 4.5, tạo ra một ảnh mới trong đĩ cường độ pixel tương ứng với lượng cường độ thay đổi trong khu vực đĩ. Tuy nhiên, nhiều khu vực thay đổi thể hiện các đặc trưng tỷ lệ nhỏ trên ảnh khơng phải là các ranh giới quan trọng giữa các thành phần ảnh. ðể đơn giản quy trình phân vùng, ta sử dụng một bộ lọc trung bình, như đã nĩi đến ở phần 3.3.3. Hình 4.11 biểu diễn ảnh X quang vú sau khi sử dụng bộ lọc trung bình 30 x 30. Hình 4.12 biểu diễn kết quả áp dụng chênh lệch lược đồ xám cho bức ảnh trên Hình 4.11. Trên Hình 4.12 các vùng thay đổi rõ ràng hơn trước và cũng phù hợp hơn với các đường ranh giới đáng kể giữa các thành phần ảnh. Ta định vị các ranh giới giữa các thành phần bằng cách tạo ra một lược đồ xám cĩ trọng số của bức ảnh ban đầu với các kết quả của đại lượng chênh lệch lược đồ xám hoạt động dưới vai trị các trọng số. Ta xây dựng lược đồ xám cho ảnh ban đầu, nhưng thay vì thêm 1 cho mỗi pixem trong bức ảnh ban đầu, phương pháp của ta thêm giá trị chênh lệch lược đồ xám vào pixel đĩ trên ảnh. Tất cả các giá trị này trải từ 0 đến 1. Việc này sinh ra một lược đồ xám đã được chỉnh sưae nhấn mạnh vào các cường độ xuất hiện trong các vùng thay đổi trên ảnh. Sau đĩ các giá trị cường độ trên lược đồ xám trọng số được chuẩn hố để loại bỏ bất cứ độ lệch nào từ các vùng biên giới lớn hơn. Hình 4.13 là lược đồ xám của bức ảnh ban đầu và Hình 4.14 là lược đồ xám trọng số tạo ra với ảnh chênh lệch lược đồ xám. 64 Hình 4.11 Ảnh X quang vú với các đặc trưng tỷ lệ nhỏ được loại bỏ Hình 4.12 Kết quả chênh lệch lược đồ xám trên ảnh X quang vú đã được làm nhẵn 65 Hình 4.13 Lược đồ xám của ảnh ban đầu Sử dụng lược đồ xám trọng số trên Hình 4.14, các ranh giới mong muốn được xác định rõ ràng. Hình 4.15 biểu diễn xấp xỉ đạo hàm bậc nhất đơn giản của lược đồ trọng số đã được lấy ngưỡng ở 0. Cực đại cục bộ từ đồ thị này là các vị trí ranh giới giữa các thành phần. Hình 4.16 biểu diễn mối quan hệ giữa lược đồ xám trọng số và ảnh chênh lệch lược đồ xám. Trên Hình 4.16, các vùng được khoanh trịn trong lược đồ xám trọng số là ranh giới giữa các thành phần trên ảnh. Các mũi tên biểu thị vị trí các ranh giới lược đồ xám trọng số trên ảnh chênh lệch lược đồ xám. Bằng cách sử dụng lược đồ xám trọng số, ta đã định ví chính xác ranh giới cường độ phù hợp cho các thành phần ảnh và phân vùng ảnh ban đầu. Hơn nữa, ảnh đã được điều chỉnh minh họa trên Hình 4.8 đến 4.10, khơng được phân vùng chính xác bằng phương pháp chênh lệch lược đồ xám 4 giá trị, cũng đã được phân vùng đúng. Các bức ảnh này giống như ảnh ban đầu, ngoại trừ việc các giá trị pixel đã thay đổi 15 %. Bởi vậy, các lược đồ xám trọng số gần như giữ nguyên. Sự khác biệt duy nhất là chúng dịch chuyển sang bên trái hoặc phải 15 %. Ranh giới được khoanh trịn trên Hình 4.15 biểu thị các cường độ pixel tương ứng với ranh giới của các thành phần trên ảnh. Trong ví dụ này, ranh giới giữa các cường độ là 45, 81, 188 và 244. Từ đĩ, các pixel cĩ giá trị từ 0 đến 45 là nền ảnh. Các pixel từ 45 đến 81 là lớp mỡ. Các pixel từ 81 đến 188 là phần mơ vú, cịn các pixel từ 188 đến 244 là cơ ngực. 66 Hình 4.14 Lược đồ xám trọng số của ảnh ban đầu Hình 4.15 Vị trí của các ranh giới giữa các phần (khoanh trịn) 67 Hình 4.16 Mối quan hệ giữa lược đồ xám trọng số và ảnh chênh lệch lược đồ xám 4.2.4 Thêm bối cảnh khơng gian Phương pháp chênh lệch lược đồ xám giới thiệu ở phần trên cho ra ranh giới giữa các thành phần trên ảnh X quang vú. Tuy nhiên, các ranh giới này cĩ dạng cường độ pixel. ðể phân vùng ảnh thành các phần riêng biệt, cường độ pixel phải được áp dụng cho ảnh X quang vú. 68 Sử dụng ranh giới về cường độ, ra phân ngưỡng ảnh X quang ban đầu. Quy trình này cho ra ảnh trên Hình 4.18. Chú ý rằng cĩ một số pixel bị phân loại nhầm. Các pixel này được định vị về khơng gian trong một thành phần nhưng giá trị cường độ của chúng lại nằm ngồi phạm vi phát hiện với thành phần đĩ. ðể phân vùng phù hợp và phân tích chuẩn, chúng cần được thay đổi để phù hợp với vùng chúng thuộc về. ðiều này dễ dàng được thực hiện bằng cách thực hiện phép tốn ăn mịn trên ảnh. Phép tốn ăn mịn kiểm tra từng pixel trên ảnh và nếu một pixel nào đĩ khác với 4 trong 8 pixel lân cận của nĩ, nĩ được thay đổi để phù hợp với 4 pixel đĩ. Nĩi cách khác, nếu pixel nổi bật lên trên nền của nĩ, nĩ sẽ được thay đổi cho phù hợp với nền. Việc này loại bỏ các pixel bị phân loại sau khỏi bức ảnh phân vùng. Hình 4.18 biểu diễn ảnh từ Hình 4.17 sau phép tốn ăn mịn. Nhiều pixel bị phân vùng sai đã được chỉnh lại, nhưng vẫn cịn một số. ðể hiệu chỉnh điều này, quy trình ăn mịn được lặp lại nhiều lần. Tuy nhiên, quy trình lặp này sinh ra độ lệch trên ảnh. ðộ lệch này xuất hiện từ trình tự mà các pixel được kiểm tra. Nếu ta bắt đầu ăn mịn các pixel bị phân loại sai từ gĩc trên cùng bên trái của bức ảnh, thì các pixel đĩ sẽ chi phối bức ảnh và kết quả là khơng thích hợp. ðộ lệch sinh ra khi thực hiện 10 phép tốn ăn mịn từ Hình 4.17 cĩ thể quan sát được trên Hình 4.19. ðể loại bỏ độ lệch, ta tạo ra một trình tự ngẫu nhiên của các pixel trên ảnh, sau đĩ ăn mịn ảnh theo trình tự ngẫu nhiên đĩ. Quy trình này đưa ra một bức ảnh đã được phân vùng khơng phụ thuộc vào độ lệch theo vị trí. Hình 4.20 biểu diễn ảnh phân vùng chính xác, tạo ra bằng cách thực hiện ăn mịn ngẫu nhiên 10 lần cho ảnh trên Hình 4.17. Ảnh đã được phân vùng đúng. Tuy nhiên, cịn một bước nữa trước khi các thành phần phân vùng cĩ thể được xử lý riêng biệt. Các vùng đã được phân ra cần được nhĩm lại thành các nhĩm riêng lẻ và trích chọn vào các ảnh khác nhau. ðiều này cho phép chúng được xử lý riêng biệt. Một thuật tốn để tạo các nhĩm pixel liền kề của các màu giống nhau được giới thiệu trong Chương 6. Thuật tốn nhĩm và trích chọn các thành phần đã phân vùng trên Hình 4.20. Các nhĩm trích chọn được minh họa trên Hình 4.21 và biểu diễn cơ ngực (trên bên trái), nhu mơ (trên bên phài), lớp mỡ (dưới bên trái) và nền (dưới bên phải). 69 Hình 4.17 Ảnh X quang vú phân ngưỡng theo ranh giới về cường độ Hình 4.18 Ảnh phân vùng đã giảm các pixel phân loại nhầm 70 Hình 4.19 Ảnh phân vùng bị lỗi Hình 4.20 Ảnh phân vùng chuẩn 71 Hình 4.21 Các thành phần ảnh trích thành các ảnh riêng biệt 4.2.5 Phân vùng các ảnh X quang vú đặc Một số ảnh X quang vú hiển thị mơ vú đặc (mật độ cao) gây khĩ khăn cho phân vùng và quét. Hình 4.22 là ảnh X quang cú cĩ mơ tuyến sợi đặc. Hình 4.23 là phân vùng của ảnh này. Trong ví dụ này các vùng mơ tuyến sợi đặc được phân vùng riêng biệt khỏi phần nhu mơ của vú. Việc này cho phép các thuật tốn quét ảnh X quang vú phân tích các vùng tách rời nhau. 72 Hình 4.22 Ảnh X quang vú với mơ tuyến sợi đậm đặc Hình 4.23 Ảnh phân vùng với mơ tuyến sợi đậm đặc 73 4.3 Tổng kết về quá trình phân vùng Thuật tốn phân vùng được cải tiến cho các ảnh X quang vú trình bày trong chương này thực hiện phân vùng chính xác ảnh X quang vú thành các thành phần nhu mơ, cơ ngực, lớp mỡ dưới da và nền ảnh. Phương pháp của chúng ta phù hợp để phân vùng một bộ nhiều ảnh, và khơng giống các kỹ thuật khác, nĩ khơng yêu cầu các dữ liệu đã được học. Các bước của quá trình phân vùng là: 1. Ảnh được làm trơn sử dụng bộ lọc trung bình để loại bỏ các đặc trưng tỷ lệ nhỏ. 2. Sử dụng phương pháp chênh lệch lược đồ xám để tạo ra một ảnh mới. 3. Lược đồ xám trọng số được tạo ra sử dụng ảnh chênh lệch lược đồ xám dưới dạng các trọng số. 4. Xấp xỉ đạo hàm bậc nhất của lược đồ xám trọng số cung cấp ranh giới về cường độ trên ảnh. 5. Ảnh được phân ngưỡng theo ranh giới về cường độ. 6. Ảnh phân vùng theo ngưỡng được ăn mịn nhiều lần để loại bỏ các pixel bị phân loại nhầm. 7. Các thành phần riêng biệt được trích từ ảnh phân vùng cuối cùng sử dụng thuật tốn miêu tả chi tiết ở Chương 6. 74 Chương 5 - PHÁT HIỆN CÁC KHỐI U TRÊN ẢNH X QUANG VÚ Các khối u vú cĩ thể được xác định trên các ảnh số X quang vú bằng cách phân tích trên máy tính nhiều thơng số thống kê về các đặc trưng từ ảnh này. Bất kỳ thuật tốn nào dùng để phân tích các ảnh X quang vú số hĩa đều cĩ thể vừa tốn thời gian vừa khơng thành cơng bởi cĩ nhiều vùng trên các bức ảnh này giống khối u nhưng lại khơng phải là khối u. Do đĩ, lỗi tích cực sai sẽ làm mất đi tính hiệu quả của thuật tốn. Chương này sẽ trình bày một thuật tốn đơn giản - hiệu quả để định vị và ghi lại các vùng nghi ngờ trên ảnh X quang vú. Thuật tốn đưa ra ở đây gồm 3 bước. ðầu tiên ta sử dụng một mẫu để xác định và ghi lại các pixel nghi ngờ. Sau đĩ là một nhĩm các pixel nghi ngờ, và cuối cùng nhĩm các pixel nghi ngờ này sẽ được kiểm tra lại bằng một mẫu điều chỉnh phù hợp với kích thước chính xác của khối cĩ thể là khối u. 5.1 Thuật tốn định vị khối u trong ảnh X quang vú số hĩa Cĩ nhiều phưong pháp sử dụng sự hỗ trợ của máy tính để phát hiện các khối u trong ảnh chụp vú số hĩa. Các phương pháp này cĩ thể được phân loại trên cơ sở các pixel hoặc các vùng. Phương pháp dựa trên pixel trích rút các đặc trưng cĩ tính thống kê từ mỗi pixel riêng biệt trong ảnh chụp vú và sử dụng sơ đồ phân loại để xác định và ghi lại các pixel quan tâm. Trong một số trường hợp, thực hiện kiểm tra sâu hơn cĩ thể biết được khối u biểu thị bởi các pixel này là lành tính hay ác tính. Một phương pháp khác là dựa trên vùng và nĩ kiểm tra tồn bộ các vùng của ảnh chụp vú để tìm khối u. Chương này trình bày một phương pháp lai giữa hai phương pháp nhằm kiểm tra cĩ máy tính hỗ trợ để tìm khối u. Ta áp dụng bước thu hẹp trọng tâm phân tích mọi pixel trong bức ảnh vào một nhĩm các pixel, đĩ là các vùng trên ảnh. Các vùng ảnh này được kiểm tra để xác định chúng cĩ chứa khối u hay khơng. Các vùng cĩ khả năng chứa khối u sau đĩ sẽ được trích rút và xử lý tiếp. Quá trình xử lý này sử dụng nhiều mức kiểm tra nhằm lọc ra các vùng nghi ngờ. Cách làm này làm tăng hiệu suất và giảm sai lệch cho các ảnh được kiểm tra. Kỹ thuật của ta sử dụng một dạng đối sánh mẫu ở các tỷ lệ khác nhau để định vị các pixel trên ảnh cĩ thể là một phần của khối u. Ảnh kết quả được phân ngưỡng phù hợp để xác định trước mức độ chính xác và sau đĩ các pixel cịn lại được nhĩm 75 với nhau và trích rút ra. Chương này đưa ra các mẫu, thuật tốn đối sánh mẫu, và phân ngưỡng thích hợp. Kỹ thuật của ta sử dụng một bộ 156 ảnh từ 39 ảnh chụp X quang vú. 5.2 Thuật tốn phát hiện khối u 5.2.1 Một mẫu cho các khối u trong ảnh X quang vú Một khối u trong một ảnh chụp vú cĩ thể là lành tính hoặc ác tính. ðể kiểm tra các khối u ác tính, chúng ta cần phải xây dựng một mẫu mà cĩ thể đối sánh với các tính chất của khối u trong cơ sở dữ liệu chúng ta đã xây dựng. Các khối u cĩ xu hướng cĩ cường độ lớn hơn các vùng xung quanh chúng. Chúng hơi trịn, cho dù chúng hiển thị yếu hoặc cĩ đường bao mờ với các mơ xung quanh. Hình 6.1 là một ví dụ về khối u ung thư được xác định bên trong vịng trịn đứt nét. Chúng ta chỉ ra và xác định các vật trong một ảnh chụp vú bằng cách so sánh ảnh này với mẫu đã chọn. Mẫu này được xây dựng từ một phần của ảnh khác, ảnh này cho biết các tính chất trực quan và thống kê của các đối tượng đang được tìm kiếm. Chúng tơi đã kiểm tra một cách kỹ lưỡng các mẫu cĩ thể và chọn ra các mẫu hiệu quả nhất đối với ảnh chụp vú trong nghiên cứu này. Hình 5.1 Ví dụ về khối ung thư 76 ðể kiểm tra các mẫu, ta thu thập một bộ ảnh chụp vú với các khối u ác tính. Các ảnh này đi kèm với bệnh lý học, điều này sẽ cho biết các đường bao của các khối u ác tính. Các ảnh chụp vú này cĩ tổng cộng 80 khối u ác tính (ung thư) do các bác sĩ X quang và khoa bệnh lý học xác định. Sử dụng 80 khối u này, ta sẽ ghi lại chất lượng của mỗi mẫu và đưa ra một lựa chọn dựa trên các kết quả này. Ta sử dụng một tương quan thống kê để so sánh một mẫu với khối u thực tế. Sự so sánh này sẽ được thảo luận chi tiết trong phần tiếp theo. Do kích thước vị trí của mỗi khối u thực tế là biết được, nên một mẫu cĩ cùng kích thước cĩ thể được tạo ra và đặt tại tâm của vị trí này để so sánh. Tuy nhiên, vẫn cĩ thể cĩ sai sĩt nhỏ trong khi so sánh, khi mà mẫu này khơng đặt chính xác tại tâm của khối u hoặc khi mẫu cĩ kích thước khác với kích thước của khối u đang được quan sát. Sử dụng kỹ thuật này để so sánh, bốn mẫu khác nhau được lựa chọn: một khối cầu chiếu theo 2 chiều, một hàm lượng giác hypecpol 2-D, một vịng trịn đơn, và một khối u ác tính trên thực tế, minh họa từ Hình 5.2 –đến Hình 5.5. Khối cầu này được chiếu theo 2 chiều (như minh họa ở Hình 5.2) được tạo ra từ phương trình (5.1) theo giả thiết của Brake và Karssemeijer. D là đường kính của mẫu. F(x,y) = D2 – x2 – y2 (5.1) Hàm lượng giác đường hypecbol 2-D được minh họa ở hình 5.3 được sinh ra từ phương trình 5.2 theo giả thuyết của Morrison và Linnett: F(x,y) = sec h(x+y) (5.2) Hình 5.2 Mẫu hình cầu 77 Hình 5.3 Mẫu hàm lượng giác 2-D Hình 5.4 Mẫu hình trịn đơn giản Hình 5.5 Mẫu khối u ác tính Các khối u trong ngực thường cĩ hình trịn và đối xứng. Các mẫu trong ví dụ này cũng đồng dạng và cĩ hình trịn; do đĩ, các lỗi về định hướng được bỏ qua. 78 Mọi điểm trong một ảnh X quang vú đều được tính đến trong quá trình đối sánh mẫu, cĩ nghĩa là tâm của bất kỳ một khối u cĩ thể tồn tại nào cũng được xét đến. ðiều này loại bỏ bất kỳ lỗi nào từ các so sánh mẫu mà khơng nằm tại tâm của khối u. Việc tiên lượng sơ bộ đối với sự lựa chọn các mẫu khác nhau là độ nhạy mẫu đối với các lỗi tỷ lệ. Khi một mẫu được so sánh với các phần của một ảnh chụp vú, thì người ta thường xác định cụ thể lại cỡ của mẫu. Quá trình định cỡ lại mẫu này cĩ thể sẽ khác với kích thước khối u thực tế trên ảnh. Quá trình định cỡ lại này sẽ tạo ra các lỗi mức. Trong một nghiên cứu khác, các mẫu của đa tỷ lệ được sử dụng như một phần của quá trình đối sánh mẫu (Brake và Karssemeijer); nĩ sẽ cĩ ít thuận lợi hơn đối với một đơn tỷ lệ. Do đĩ, khi một mẫu được lựa chọn và sau đĩ được sử dụng để kiểm tra một ảnh, một mẫu đơn, mà sẽ đối sánh các khối u với các kích thước thay đổi, là điều mong muốn. ðể đánh giá 4 mẫu đã chọn cho độ nhạy và mức phù hợp, mỗi mẫu đều được so sánh với tất cả 80 khối u trong thực tế. Một mẫu được tạo ra cĩ kích thước chính xác của một khối u và cho mỗi mức của đa mức được sử dụng. ðiều này cho phép đánh giá tính hiệu quả của mỗi mẫu đối với các khối u cĩ kích thước thay đổi. Sự tương quan thống kê giữa mẫu này và khối u thực tế tạo ra một giá trị trong khoảng –1 và 1, trong đĩ 1 chỉ ra một đối sánh chính xác. Bảng 5.1 cho thấy sự tương quan trung bình giữa mỗi mẫu với 80 khối u và trong đĩ các mẫu và các khối u này là cùng kích thước. Mẫu lượng giác cĩ sự tương quan cao nhất (tốt nhất). Nĩ là tốt nhất bởi vì sự tương quan càng cao thì các kết quả đặt ngưỡng càng tốt hơn, cụ thể chúng ta cĩ thể xác định các kết quả được kỳ vọng là đúng tốt hơn. Hình 5.6 cho thấy bốn mẫu tương quan với các khối u đã biết khi kích thước của chúng được định mức. Biểu đồ này cho thấy các kết quả của các mẫu tương quan phân chia từ 0,1 tới 2 lần kích thước của khối u thực tế. Mẫu thực hiện tốt nhất trong kiểm tra này cùng là mẫu lượng giác minh họa ở hình 5.6. Nĩ cĩ độ ổn định cao nhất (tốt nhất) và ít nhạy với các lỗi tỷ lệ. Chú ý: tất cả các mẫu kém hoạt động bất cứ khi nào mức này khác một cách đáng kể so với kích thước của chúng. ðặc biệt, khi kích thước mẫu nhỏ hơn vài lần kích thước khối u thực tế, các kết quả này khơng thỏa mãn. Tuy nhiên, khi các kích thước mẫu là lớn hơn các kích thước khối 79 u thực tế kết quả này sẽ giảm chậm và cĩ thể sử dụng được. Do đĩ, lựa chọn kích thước mẫu quá to sẽ tốt hơn chọn một cái quá bé. Từ điều này, mẫu lượng giác tốt hơn các mẫu khác đã được nghiên cứu. Bảng 5.1 Mẫu trung bình đối với các giá trị tương quan khối u Mẫu Tương quan trung bình Lượng giác 0,7992 Khối u 0,6470 Hình trịn 0,5480 Khối cầu 0,7502 5.2.2 Các phương pháp đối sánh mẫu Cĩ một vài cách so sánh một mẫu với một ảnh chụp X quang vú. Một số sử dụng tích chập hoặc một phương pháp dựa trên tương quan chéo, điều này sẽ hết sức hiệu quả khi sử dụng phương pháp biến đổi Fourier nhanh (FFT). Tuy nhiên, người thực hiện luận văn phát hiện ra rằng phương pháp tích chập với mẫu lượng giác cĩ thể bị lộn xộn do sự thay đổi trong cường độ ảnh chụp vú cục bộ. Ví dụ, một khối u cĩ thể xuất hiện sáng hơn một cách đáng kể so với cường độ trung bình của các vùng xung quanh nĩ, nhưng khi so sánh với tất cả các vùng và các mơ khác trong ảnh, nĩ cĩ thể tối hơn cường độ tổng thể trung bình của ảnh. Khối u này cĩ thể sẽ bị bỏ qua nếu đang sử dụng một tích chập dựa trên thuật tốn đối sánh mẫu. Hình 5.7 là một ví dụ, mà trong đĩ một khối u trên một vùng ảnh cục bộ được xác định đúng bằng một phương pháp tích chập sử dụng mẫu lượng giác. Hình bên trái của hình 5.7 là ảnh thực của khối u này và hình bên phải là kết quả từ việc định ngưỡng tích chập với mức thích hợp. 80 Hình 5.6 ðộ nhạy tỷ lệ của các mẫu Hình 5.7 Khối u (trái) và phát hiện khối sử dụng tích chập (phải) Kết quả này sẽ khơng hiệu quả như ví dụ này khi quá trình này được tiến hành trên tồn bộ ảnh chụp vú. Hình 5.8 cho thấy một ảnh chụp vú cĩ một khối u. Hình 5.9 minh họa các kết quả đặt ngưỡng của tích chập trên tồn bộ ảnh. Các kết 81 quả đã chập này phù hợp với các vùng cường độ cao, bao gồm vùng cơ ngực của ảnh. Trong tình huống này, khối u khơng được định vị một cách chính xác. Do đĩ, phương pháp tích chập khơng phù hợp như một thuật tốn xác định vị trí khối u hiệu quả với ảnh này. Một phương pháp thay thế khác cĩ thể sẽ tương quan giữa mẫu này và mỗi điểm ảnh trong ảnh, trong đĩ ảnh nhỏ bao quanh mỗi điểm ảnh là cùng kích thước với mẫu. Thuật tốn đối sánh mẫu dựa trên cơ sở tương quan khơng thiên về sự thay đổi cường độ và nhạy với các đặc trưng của hình dạng (Brake và Karssemeijer). Cơng thức được sử dụng cho sự tương quan giữa mẫu và ảnh gốc như sau: cov( , )( , ) cov( , ) x y xy x y x y cor x y x y σ σ µ µ µ ≡ ≡ − (5.3) trong đĩ cov(x,y) là liên hiệp biến của mẫu, x, và ảnh nhỏ, y, bao quanh điểm ảnh. σx và σy là các độ lệch chuẩn của mẫu này và ảnh nhỏ. µx và µy là trung bình của mẫu và ảnh nhỏ. µxy là trung bình của mỗi điểm ảnh trong mẫu nhân bởi mỗi điểm ảnh. Kết quả áp dụng sự tương quan ảnh này trở về một ảnh mới, nhận giá trị giữa -1 và 1. Khi giá trị tương quan càng gần với 1, sự tương tự giữa mẫu và các điểm ảnh đang được kiểm tra càng lớn. Nghĩa là các điểm ảnh tạo ra một giá trị tương quan gần với 1 tương tự với mẫu khối u. Hình 5.10 cho thấy các kết quả áp dụng sự tương quan này với ảnh minh họa trên hình 5.8. ðể xác định các vùng trên ảnh, vùng này chắc chắn cĩ khối u, một ngưỡng được sử dụng với các giá trị tương quan. Trong ví dụ này, các điểm ảnh với các giá trị tương quan là 0,75 hoặc lớn hơn cĩ khả năng xuất hiện khối u cao. Hình 5.11 biểu thị các kết quả của việc định ngưỡng này với ảnh minh họa trên hình 5.10. Mức ngưỡng giảm số lượng các giá trị điểm ảnh cần xem xét và định vị phần ảnh gốc mà cĩ khả năng xuất hiện khối u cao. Trong hình 5.11, vùng trắng cho thấy vị trí khối u trong ảnh X quang chụp vú. 82 Hình 5.8 Ảnh X quang vú cĩ chứa khối u Hình 5.9 Kết quả từ tích chập mẫu với ảnh trên Hình 5.8 83 Hình 5.10 Kết quả đối sánh mẫu dựa trên tương quan Hình 5.11 Kết quả được lấy mẫu và giãn của đối sánh mẫu tương quan 84 5.2.3 Nhĩm và phân vùng các vùng nghi ngờ Ví dụ ở phần trước đã mơ tả làm thế nào để định vị một khối u trong một ảnh X quang chụp vú bằng cách thực hiện một sự tương quan sau khi đặt ngưỡng. Mức ngưỡng trong ví dụ trước được chọn bằng tay. Trong thực tế, một ngưỡng sẽ cĩ giá trị thấp hơn mức tối ưu. Nĩ được thực hiện sao cho một vài khối u bị mất đi bởi sự phân tích. Khi một giá trị ngưỡng được giảm đi, người ta thường định vị được nhiều khối u hơn. Hình 5.12 cho thấy kết quả của việc đặt ngưỡng ảnh trên hình 5.11 với một giá trị ngưỡng là 0.60. ðiều này tạo ra một vài cụm của các điểm ảnh cĩ thể là khối u trong ảnh thu được. Chỉ cĩ duy nhất một khối u trong thực tế. ðối với điểm này, quá trình xử lý hồn tồn dựa trên các điểm ảnh. Mỗi điểm ảnh cần được xử lý độc lập với các điểm ảnh khác trên bức ảnh. Tuy nhiên, các điểm ảnh được minh họa trên hình 5.12 là các phần của các cụm khác nhau. Chương 6 trình bày một thuật tốn nhĩm và trích rút nhĩm các điểm ảnh liên quan. ðiều này cho phép các vùng chứa các điểm ảnh tương tự nhau được xử lý cùng với nhau. Hình 5.13 minh họa 4 cụm điểm ảnh phân biệt trong hình 5.12. Mỗi cụm cĩ khả năng là một khối u và cần được xử lý thêm và so sánh với bệnh lý học của nĩ. Hình 5.12 Các kết quả tương quan phân ngưỡng với 0.6 85 Hình 5.13 Các khối cĩ khả năng được trích rút 5.2.4 Cải thiện đa tỷ lệ Với các nhĩm pixel khác nhau, minh họa trên Hình 5.13, một bước đa tỷ lệ được thêm vào thuật tốn phát hiện khối u của ta. Phần 5.2 trình bày về các vấn đề lựa chọn mẫu cĩ kích thước khác với kích thước khối u được nghiên cứu. Khi mẫu lớn hơn hoặc nhỏ hơn nhiều khối u quan tâm, cĩ thể khối u khơng được phát hiện. Một giải pháp cho vấn đề này là kiểm tra tồn bộ ảnh với các mẫu kích thước khác nhau. Tuy nhiên, việc này mất thời gian và khơng hiệu quả. Cách giải quyết của ta là tương quan mẫu chỉ trên những nhĩm pixel và sử dụng các mẫu đa kích thước. Cách này cĩ những ưu điểm sau: • Các nhĩm pixel chỉ là một phần nhỏ trên ảnh và vì thế, kiểm tra đa tỷ lệ sẽ dễ dàng về tính tốn. • Kích thước chính xác của nhĩm pixel đã được xác định, vì thế một mẫu nào đĩ cĩ thể được tạo ra cho kích thước này và sử dụng với ảnh ban đầu để loại bỏ các sai số về tỷ lệ. • Vị trí chính xác của nhĩm pixel đã biết; vì thế, mẫu này cĩ thể được đặt vào tâm của nhĩm, thay vì ở một vị trí ngồi tâm. Việc này tăng tốc độ hiệu chỉnh. 86 ðể minh họa, 4 khối khả năng được biểu diễn trên Hình 5.13 được trích rút ra từ ảnh X quang vú trên Hình 5.14. Với mỗi khối trong số này, ta tạo ra một mẫu lượng giác. Sau đĩ tương quan thống kê được tính giữa mẫu kích thước chuẩn và đặt ở tâm với khối khả năng. Bảng 5.2 đưa ra các kết quả. Các khối khả năng cho giá trị tương quan nằm giữa 0.5448 và 0.8583. Khối thực tế cho giá trị tương quan cao nhất là 0.8583. Ba khối kia là lỗi tích cực sai. Các kết quả của quá trình đa tỷ lệ này phân biệt giữa khối thực (từ bệnh lý học) với các lỗi tích cực sai. Với ảnh X quang vú này, cĩ thể xác định và loại bỏ lỗi tích cực sai bằng cách dùng giá trị phân ngưỡng cao hơn. Lỗi tích cực sai cĩ thể được giảm đi bằng cách thêm vào ngưỡng này. Hình 5.14 Các khối khả năng trên ảnh X quang vú 87 Bảng 5.2 Các kết quả tương quan đa tỷ lệ với các khối khả năng ðối tượng Kích thước (pixel2) Tương quan mẫu (1) 30,000 0.6585 (2) 23,000 0.5448 (3) Khối thực tế 40,000 0.8583 (4) 60,000 0.5919 5.3 Tổng kết về định vị khối u Thuật tốn định vị khối u trên ảnh X quang vú số hố: 1. Tồn bộ bức ảnh X quang vú được xử lý với thuật tốn đối sánh mẫu dựa trên tương quan. 2. Kết quả của phép tương quan này được phân ngưỡng để xác định các pixel nghi ngờ. 3. Các pixel nghi ngờ được nhĩm thành các nhĩm và trích rút ra. 4. Các nhĩm trích rút được so sánh với một mẫu tạo ra với kích thước bằng kích thước nhĩm. 5. Sau đĩ, mỗi nhĩm được tương quan với mẫu của nĩ và kết quả của mỗi lần tương quan lại được phân ngưỡng để loại bỏ các lỗi tích cực sai. Thuật tốn này cĩ thể sử dụng để phát hiện khối u hoặc nĩ cĩ thể kết hợp với các bước khác để nâng cao hiệu suất. Ví dụ, thuật tốn phân vùng ở Chương 4 cĩ thể dùng để loại bỏ nền và các vùng khác khỏi sự quan tâm. ðiều này tiết kiệm thời gian và giảm các sai số khi sử dụng thuật tốn phát hiện khối u. Kết quả của thuật tốn này cũng được ghi lại ở dạng các vùng khả nghi trên ảnh. Các vùng này sau đĩ được phân loại để giảm sai số. 88 Chương 6 - HỆ THỐNG KIỂM TRA THUẬT TỐN QUÉT Một hệ thống kiểm tra thuật tốn quét được phát triển, là kết quả phụ của nghiên cứu này. Chương này giới thiệu về hệ thống làm cơng việc ghi và so sánh các kết quả từ ảnh X quang quét máy tính hỗ trợ với bệnh lý của chúng. Kỹ thuật này cung cấp các vùng khả nghi phát hiện được từ quá trình đối sánh mẫu để so sánh. Nhiều thuật tốn định vị khối u khơng cho các kết quả với dạng đơn giản “cĩ/ khơng” về vị trí và tính ác tính của khối u. Thay vì đĩ, nĩ đưa ra một gradient về “khả năng”. Một phần nào đĩ trên ảnh được xác định là cĩ nhiều khả năng chứa khối u hơn các phần khác của cùng bức ảnh. Một nhược điểm của phương thức này là hệ thống phức tạp hơn do cần cĩ thêm phương pháp phân ngưỡng các kết quả và chọn ngưỡng phù hợp. Sau đĩ, ngưỡng sẽ đưa ra câu trả lời “cĩ/ khơng” cho vùng cĩ nhiều khả năng là một khối u hơn. Một ưu điểm của phương thức này là ngưỡng cĩ thể điều chỉnh được để cho bất cứ mức độ chính xác nào theo mong muốn. Nhằm thiết lập một mức chính xác theo ý muốn cho một hệ thống quét tìm khối u, nhiều thơng số thuật tốn cần được xác định bằng cách lựa chọn bằng thực nghiệm các giá trị “tối ưu”. Thực nghiệm này rất tốn thời gian đặc biệt khi các kết quả của thuật tốn quét được lập bảng thủ cơng và so sánh với bệnh lý. Phương pháp giới thiệu ở chương này đưa ra một giải pháp cho vấn đề này. Nĩ cho phép giảm thời gian quét khối u và hầu hết các kết quả được kiểm tra tự động. Phương pháp này được dùng rộng rãi trong khi triển khai thuật tốn định vị khối u trình bày ở Chương 5. 6.1 Các kết quả lọc ảnh Thuật tốn phát hiện khối u trình bày trong Chương 5 cho ta một bức ảnh hồn tồn mới với các giá trị sinh ra tại vị trí của các giá trị pixel ban đầu. Các giá trị mới này biểu thị một đặc tính mà phương pháp này nhắm tới. Trong thuật tốn phát hiện khối u của chúng ta, các pixel sinh ra nằm giữa 0 và 1. Các pixel này là kết quả tương quan giữa mẫu lựa chọn cho khối u và các vùng khác trên ảnh X quang vú. 89 Các giá trị tương quan này được dịch dưới dạng “khả năng” mỗi pixel nằm ở tâm của khối u. Hình 6.1 minh họa một ảnh X quang vú và Hình 6.2 minh họa kết quả của thuật tốn phát hiện khối u với ảnh này. Vùng được khoanh trịn trên Hình 6.2 được hiểu là vị trí khối u ác tính. Các pixel trong vùng này thay đổi từ 0.0 đến 0.9; lý tưởng thì sẽ cĩ một pixel với giá trị 1 ở vị trí tâm của khối u này. Tuy nhiên, thuật tốn này khơng hồn hảo do khơng cĩ pixel cĩ giá trị 1. Thay vì đĩ, một nhĩm pixel trong vùng này cĩ giá trị gần 1. Tất cả các pixel cĩ giá trị gần 1 đều cĩ thể là tâm của khối u. Các pixel khác 0 khác cĩ trên ảnh ít cĩ khả năng trở thành tâm khối u hơn và cĩ thể là nhiễu ảnh, các đặc trưng vú bình thường hoặc các vùng khơng phải tâm khối u. Do việc định vị các khối u phát hiện được trên Hình 6.2 là khơng chính xác, nên cần các phân tích khác nữa để đưa ra kết quả cuối cùng. Cơng đoạn phân tích phụ này bắt đầu từ ảnh tạo ra được phân ngưỡng để loại bỏ các kết quả được xem là kém quan trọng. Ảnh tạo ra là ảnh nhị phân, nghĩa là tất cả các pixel bằng 0 hoặc 1. 0 biểu thị là khơng phải khối u, và 1 biểu thị vị trí khối u. Hình 6.3 minh họa kết quả của phép phân ngưỡng này cho Hình 6.2. Với Hình 6.3, các pixel với các giá trị lớn hơn 0.75 trên Hình 6.2 được gán cho giá trị 1 và các pixel cịn lại gán bằng 0. Nếu ngưỡng được lấy thấp hơn, sẽ phát hiện được nhiều chi tiết hơn, cịn nếu tăng ngưỡng lên thì sẽ phát hiện được ít chi tiết hơn. Cách kiểm tra này cho phép thay đổi các ngưỡng cũng như các thơng số hệ thốgn khác và kết quả được áp dụng tự động cho việc so sánh. Quy trình này tạo ra và cĩ thể chọn một ngưỡng tối ưu. 6.2 Nhĩm các nhĩm pixel Với đầu ra phân ngưỡng từ bộ lọc ảnh biểu diễn trên Hình 6.3, các vị trí của các khối u chưa được xác định hồn tồn. Mỗi pixel trắng trên Hình 6.3 biểu thị một vị trí cĩ thể của khối u; tuy nhiên, các pixel được nhĩm vào các nhĩm riêng biệt biểu diễn các phát hiện đơn. Các pixel này trong các nhĩm phân biệt cần được nhĩm lại và trích ra dưới dạng một khối u đơn để so sánh với bệnh lý. 90 Hình 6.1 Ảnh X quang vú Hình 6.2 Kết quả phát hiện khối u trên Hình 6.1 91 Hình 6.3 Ảnh phân ngưỡng từ Hình 6.2 Nhĩm các nhĩm pixel riêng biệt khơng phải là một nhiệm vụ đơn giản. Nĩ địi hịi kiểm tra từng pixel trên ảnh và nhĩm tất cả các pixel cĩ cùng cường độ là các lân cận gần nhất. Pixel A là lân cận gần nhất của pixel B khi pixel A là một trong tám pixel nằm ngay cạnh B; Hình 6.4 biểu diễn pixel này và tám pixel lân cận của nĩ. Hình 6.3 cĩ 4 nhĩm pixel riêng biệt và Hình 6.5 biểu diễn 4 nhĩm này đã được trích rút với ảnh riêng biệt cho mỗi nhĩm. Hình 6.4 Pixel (i, j) và các pixel lân cận 92 Hình 6.5 Bốn nhĩm pixel trên Hình 6.3 Thuật tốn nhĩm và trích các nhĩm pixel trên Hình 6.5 là một phần trong kết quả của nghiên cứu trong luận văn. Các bước của thuật tốn này như sau: Các bước nhĩm pixel 1. Tạo ra hai danh sách. Danh sách thứ nhất là danh sách pixel cho tất cả các pixel trên ảnh. Danh sách thứ hai là danh sách trống, chứa các nhĩm pixel đã nhĩm lại. 2. Pixel đầu tiên trong danh sách pixel được loại bỏ khỏi danh sách và xử lý. Quá trình này được lặp lại cho tới khi danh sách pixel trống. ðể xử lý một pixel, mỗi nhĩm trong danh sách nhĩm được kiểm tra. Nếu pixel được xử lý là lân cận gần nhất của bất cứ pixel nào trong một nhĩm trong số đĩ, nĩ sẽ được thêm vào nhĩm đĩ. Mỗi pixel sẽ chỉ được thêm vào một nhĩm trong danh sách nhĩm. 3. Khi danh sách nhĩm đã trống, tất cả các pixel đã được thêm vào một nhĩm nào đĩ. Tuy nhiên, trong hầu hết quy trình xử lý ảnh X quang vú, một số nhĩm trong danh sách nhĩm vẫn cĩ thể nhĩm lại được. Vì thế, bước tiếp theo địi hỏi mỗi nhĩm trong danh sách nhĩm được so sánh với các nhĩm khác. Các nhĩm chứa các lân cận gần nhất được kết hợp lại với nhau. 4. Cuối cùng, mỗi nhĩm trong danh sách nhĩm được định dạng và lưu trữ dưới dạng một bức ảnh riêng biệt. 93 Hình 6.6 minh họa sơ đồ của quy trình này. Mỗi ảnh X quang vú thường cĩ nhiều hơn một triệu pixel, và xử lý khơng hiệu quả sẽ dễ dàng tạo ra các yêu cầu tính tốn khơng thực tế. Nếu N là số lượng pixel trên ảnh; thuật tốn nhĩm pixel của ta cĩ hiệu suất là O(N) và cĩ thời gian chạy tuyến tính. Bất cứ ảnh X quang vú nào với N pixel đều cần một số lượng khơng đổi N phép tốn để nhĩm các pixel này vào các nhĩm. Lí do cho hiệu suất tuyến tính này là để hai pixel được nhĩm vào một nhĩm, chúng cần là các lân cận gần nhất của một kết hợp nào đĩ của các pixel. ðiều này cĩ nghĩa là để nhĩm một pixel đơn, khơng cần xét từng pixel trên ảnh mà chỉ tám lân cận của pixel đơn đĩ. Nếu một pixel thuộc về một nhĩm nào đĩ với bất cứ pixel nào khác, một pixel phải nằm trong số tám lân cận của nĩ. ðiều này cho phép xử lý danh sách tuyến tính các pixel chỉ một lần. Do số lượng pixel trên ảnh lớn hơn nhiều con số 8, nến nĩ vẫn được coi là bậc N. Quy trình xử lý danh sách pixel đầu tiên tạo ra một danh sách các nhĩm. ðộ dài của danh sách này nhỏ so với số lượng pixel trên ảnh. Bước 3 của thuật tốn kết hợp các nhĩm; tuy nhiên, một số trong các nhĩm này cĩ thể là các lân cận gần nhất. ðây là một tác động của quá trình đơn giản hố; nếu một pixel thuộc về một nhĩm nào đĩ với các pixel khác, một trong số chúng phải nằm trong số 8 lân cận gần nhất. Vì tám pixel lân cận gần nhất là các pixel duy nhất được kiểm tra, cĩ những trường hợp một nhĩm đơn các pixel bị phân loại nhầm vào hai nhĩm. Ví dụ, Hình 6.7 chỉ chứa một nhĩm phân biệt các lân cận gần nhất. Tuy nhiên, sau hai bước của thuật tốn, hai nhĩm khác nhau lại cĩ mặt trong danh sách nhĩm như minh họa trên Hình 6.8 và 6.9. 94 Hình 6.6 Sơ đồ thuật tốn nhĩm pixel Trình tự xử lý các pixel gây ra vấn đề này; tuy nhiên cũng dễ giải quyết. Mỗi nhĩm trong danh sách nhĩm được kiểm tra và nếu chúng cĩ chung các lân cận gần nhất, chúng được kết hợp lại. Quá trình này lặp cho tới khi các nhĩm phân biệt được. Quá trình kết hợp các nhĩm pixel cĩ lân cận gần nhất như sau: Thuật tốn kết hợp nhĩm pixel 1. Tạo một danh sách trống các nhĩm pixel 2. Nhĩm đầu tiên trong danh sách nhĩm ban đầu được thêm vào danh sách trống. 3. Các nhĩm cịn lại được loại bỏ khỏi danh sách ban đầu và thêm vào danh sách mới mỗi lần cho tới khi danh sách ban đầu trống. Khi mỗi nhĩm được 95 thêm vào danh sách mới, nĩ được kiểm tra với các nhĩm khác. Nếu nĩ cĩ chung các lân cận gần nhất với một nhĩm nào đĩ đã ở trong danh sách, nĩ được kết hợp vào nhĩm này. Khi một nhĩm như vậy được tìm thấy, quy trình xử lý nhĩm đĩ kết thúc và tiếp tục với nhĩm tiếp theo. Hình 6.7 Ví dụ về nhĩm pixel Hình 6.8 Nhĩm nhầm đầu tiên 96 Hình 6.9 Nhĩm phân loại nhầm thứ hai Khi đã thực hiện, vẫn cịn khả năng các nhĩm trong danh sách mới vẫn cĩ cùng các lân cận gần nhất. ðiều này cĩ thể xảy ra khi hai nhĩm được thêm vào danh sách mới, và một nhĩm thứ ba liên kết hai nhĩm ban đầu được thêm vào. Nĩ sẽ được kết hợp với chỉ một trong hai nhĩm ban đầu. Khả năng này yêu cầu quá trình xử lý phải được lặp lại cho tới khi số lượng các nhĩm trong danh sách ban đầu khơng thay đổi. Nghĩa là, khơng nhĩm nào được kết hợp nữa và vì thế khơng cịn nhĩm nào dùng chung các lân cận gần nhất. Thuật tốn nhĩm này cĩ thể cần một lượng thời gian tính tốn đáng kể, nhưng trên thực tế nĩ thực hiện một số ít các bước lặp. Nếu G là số lượng các nhĩm pixel sau quá trình xử lý ban đầu, mỗi bước kết hợp các nhĩm cần O(G2) bước. Tổng thể việc kết hợp các nhĩm cĩ thể lên tới O(G3) bước, và mỗi nhĩm cĩ N/G pixel. ðơn giản hố sao cho mỗi pixel chỉ cần kiểm tra đối với các lân cân ngay cạnh nĩ, mỗi lần so sánh nhĩm cần N/G bước. Vì thế, trường hợp xấu nhất đối với thuật tốn kết hợp nhĩm là O(G3) = O((N/G)3) = O(N3). ðiều này cĩ thể khơng chấp nhận được, nhưng cĩ một số điều kiện làm giảm bớt kết quả này. ðầu tiên, G thường luơn nhỏ hơn nhiều so với N. Vì G biểu diễn các vùng quan trọng trên ảnh X quang vú, nĩ thường nhỏ hơn 50 và số lượng pixel trên ảnh X quang vú cĩ thể lên tới 5 triệu. Khi quét một bức ảnh nào đĩ để tìm khối u, số lượng pixel được xử lý và số lượng các nhĩm pixel thường nhỏ (thậm chí bằng 0). Hơn nữa trong suốt quá trình xử lý các nhĩm, khi gặp một nhĩm cĩ cùng các lân cận gần nhất với một nhĩm khác, bước này kết thúc. Nghĩa là hầu hết các bước trong quy trình khơng yêu cầu số lượng phép tính cực đại. 97 Nĩi chung, cĩ đặc tính cố hữu trong thuật tốn này, nĩ ngăn chặn trường hợp xấu nhất. Nếu một bức ảnh chứa nhiều nhĩm nhỏ các pixel, việc kết hợp các nhĩm sẽ đươ đơn giản hố bởi số lượng nhỏ các pixel trong từng nhĩm. Khi bức ảnh bao gồm ít nhĩm lớn pixel, số lượng nhỏ các nhĩm thì cần ít phép tính. Bằng cách thiết kế, việc sử dụng thuật tốn này thường luơn thoả mãn một trong hai điều kiện trên. Hai ví dụ minh hoạ điều này, ví dụ đầu tiên trên hình 6.10 là một ảnh đầu ra của thuật tốn phân vùng của chúng ta. Mỗi vùng xám biểu diễn một thành phần trên ảnh X quang vú. Bằng cách áp dụng thuật tốn nhĩm pixel vừa trình bày, các vùng khác nhau này được trích rút. Hình 6.11 biểu diễn các ảnh riêng biệt, nền trên hình 6.10 được loại bỏ. Hình 6.10 Ảnh được phân vùng 98 Hình 6.11 Các thành phần trên ảnh Mỗi thành phần trong ví dụ này chứa rất nhiều pixel. Tuy nhiên, chỉ cĩ 4 vùng. Vì thế, bước cuối cùng chỉ yêu cầu O(N) bước. Vì G = 4, bước kết hợp O(G3) cần 64 so sánh nhĩm. Theo N, mỗi bước so sánh cần N/G bước, nghĩa là N/4. Vì thế bước so sánh nhĩm tổng thể cần: 64 16 ( ) 4 N N O N∗ = ∗ = (6.1) ðây là hiệu suất của bước đầu tiên trong thuật tốn nhĩm. Ví dụ thứ hai là ảnh đầu ra từ thuật tốn phát hiện khối u, minh họa trên Hình 6.12. Nĩ chứa 20 nhĩm khác nhau, và các nhĩm này chứa trung bình N/400 pixel. Vì thế tổng số lần so sánh nhĩm cho ví dụ này cần số lượng bước bằng: 320 20 ( ) 400 N N O N∗ = ∗ = (6.2) ðây cũng là hiệu suất của bước đầu tiên trong thuật tốn nhĩm. 99 Khi các kết quả phát hiện được nhĩm lại thành các nhĩm khác nhau, chúng được đặt trong các bức ảnh rời rạc và lưu trữ dưới dạng các file. ðây là một phép tốn đơn giản, nhưng nĩ cho phép so sánh nhanh với bệnh lý. Trong nghiên cứu này, các phát hiện về khối u được nhĩm lại được so sánh trực tiếp với bệnh lý của nĩ. Tuy nhiên, ta cĩ thể sử dụng các phát hiện này để trích rút các dữ liệu từ các ảnh X quang vú ban đầu để xử lý và phân loại sau này. Việc này làm tăng đáng kể hiệu suất do vùng tổng trong các vùng được phát hệin nhỏ hơn nhiều so với tồn bộ bức ảnh. Hình 6.12 Kết quả phát hiện khối u 100 Chương 7 - KẾT LUẬN 7.1 Tổng kết Luận văn đã trình bày một thuật tốn phân vùng ảnh X quang vú thành các thành phần nền, mơ vú, cơ ngực và lớp mỡ dưới da, cùng với các ví dụ minh họa và các kết quả. Thuật tốn phân vùng này đĩng vai trị bước tiền xử lý trong quy trình kiểm tra ảnh X quang. Nĩ giảm đáng kể số lượng các pixel cần sử dụng trong thuật tốn kiểm tra. Phưong pháp phân vùng này cho phép từng thành phần được kiểm tra độc lập với các thành phần khác, nĩ làm giảm sai số và đơn giản hố việc tìm kiếm. Luận văn cũng đã giới thiệu một phương pháp định vị khối u trên ảnh X quang vú. Kỹ thuật này sử dụng đối sánh mẫu để xác định các khối cĩ khả năng trên ảnh và sử dụng phương pháp đa tỷ lệ để giảm số lượng lỗi tích cực sai. Thuật tốn đối sánh mẫu được đánh giá với một vài mẫu khác nhau. Phương pháp này cũng được sử dụng với vai trị bước tiền xử lý. Khi cần, nĩ trích rút ra các vùng nghi ngờ để phân tích về sau. Nĩ tập trung và giới hạn vùng tìm kiếm khối u trên ảnh, làm giảm thời gian tìm kiếm. 7.2 Phương hướng trong tương lai Nghiên cứu trong tương lai sẽ chú trọng vào cách thức phân biệt chính xác giữa các khối u lành tính và ác tính. ðồng thời xây dựng một hệ thống hỗ trợ bác sĩ trong hoạt động kiểm tra và chẩn đốn hình ảnh ở Bệnh viện K Hà Nội. 101 TÀI LIỆU THAM KHẢO Tiếng Anh 1. John Terry Sample (2003), Computer assisted screening of digital mammogram images, University of Southern Mississippi. 2. 3. 4. 5. Ian T.Young, Jan J.Gerbrands, Lucas J. Van Vliet (1998), Fundamentals of Image Processing, Delf University of Technology. 6. Martin Masek (2004), Hierarchical segmentation of mammograms based on pixel intensity, The University of Western Australia. Tiếng Việt 7. Lương Mạnh Bá, Nguyễn Thanh Thuỷ (2003), Nhập mơn xử lý ảnh số, NXB Khoa học và Kỹ thuật. 8. Bích Thuỷ, Hải Yến (1997), Cẩm nang Vú và bệnh ung thư vú, NXB Y học. 102 XÂY DỰNG CƠ SỞ DỮ LIỆU PHỤC VỤ QUÁ TRÌNH XỬ LÝ ẢNH X QUANG VÚ TRÊN MÁY TÍNH TĨM TẮT Từ khố: Ảnh X quang vú, phân vùng ảnh, đối sánh mẫu, phát hiện khối u, bệnh ung thư vú. Bệnh ung thư vú là một căn bệnh rất phổ biến với nữ giới trên thế giới hiện nay. Ở các nước phát triển, quá trình chẩn đốn ảnh X quang vú được hỗ trợ rất nhiều từ hệ thống máy tính. Tuy nhiên, ở Việt Nam, cơng việc chẩn đốn vẫn cịn được thực hiện thủ cơng, phụ thuộc chủ yếu vào kinh nghiệm của các bác sĩ. Vì vậy, nhu cầu về một hệ thống chẩn đốn dựa trên máy tính với các thuật tốn xử lý ảnh nhằm hỗ trợ bác sĩ trở nên vơ cùng thiết yếu. Luận văn trình bày về một bước tiền xử lý với ảnh, bao gồm một thuật tốn phân vùng ảnh X quang vú và một phương pháp định vị khối u trên ảnh. Thuật tốn phân vùng ảnh X quang vú dựa trên lược đồ xám của ảnh. Thuật tốn phân vùng trình bày trong luận văn cĩ ưu thế hơn một số thuật tốn phân vùng khác do nĩ khơng địi hỏi một bộ dữ liệu đã được học. Phương pháp định vị khối u trên ảnh sử dụng các mẫu để đối sánh. Các mẫu này được trích từ các ảnh X quang vú chuẩn, với một số dạng đặc trưng và cĩ thể điều chỉnh đa tỷ lệ để phù hợp với kích thước thật của khối u. Cũng từ đĩ xuất hiện nhu cầu về một cơ sở dữ liệu sử dụng được cho các bệnh viện ở Việt Nam. Vì vậy, một cơ sở dữ liệu bao gồm các ảnh X quang đã được chẩn đốn đúng được thiết lập. Cơ sở dữ liệu này là cơ sở dữ liệu chuẩn, sử dụng để thiết lập các mẫu phục vụ cho quá trình xác định khối u trên các ảnh X quang vú thu thập từ Bệnh viện K Hà Nội.

Các file đính kèm theo tài liệu này:

Luận văn- Xây dựng cơ sở dữ liệu phục vụ quá trình xử lý ảnh X quang vú trên máy tính.pdf