Bệnh ung thư vú là một căn bệnh rất phổ biến với nữ giới trên thế giới hiện
nay. Ở các nước phát triển, quá trình chẩn đoán ảnh X quang vú được hỗ trợ rất
nhiều từ hệ thống máy tính. Tuy nhiên, ở Việt Nam, công việc chẩn đoán vẫn còn
được thực hiện thủ công, phụ thuộc chủ yếu vào kinh nghiệm của các bác sĩ.
103 trang |
Chia sẻ: lylyngoc | Lượt xem: 2323 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng cơ sở dữ liệu phục vụ quá trình xử lý ảnh X quang vú trên máy tính, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
một chút, nhu mơ
sáng hơn một chút nữa và cơ ngực là phần sáng nhất trên ảnh. Trong một số trường
hợp, phân vùng ảnh cĩ thể được thực hiện chính xác bằng cách chia cường độ mức
xám trên ảnh thành bốn khoảng cách đều nhau, sau đĩ phân ngưỡng dựa trên các
khoảng này. Trên một bức ảnh với 256 mức xám, bốn khoảng cách đều nhau cĩ thể
là: [0-63], [64-127], [128-191],, và [192-255]. Hình 4.2 minh họa một bức ảnh X
quang vú từ Hình 4.1 sau quy trình đơn giản này.
Hình 4.2 Ảnh đã phân vùng
55
Hình 4.3 là lược đồ xám của ảnh trên Hình 4.1. Nĩ cĩ 4 khoảng cường độ
chủ yếu, tương ứng với bốn vùng chính trên ảnh: vùng nhu mơ của vú, vùng cơ
ngực, vùng lớp mỡ dưới da và vùng nền ảnh màu đen.
Mỗi bức ảnh X quang vú ta xét đều hiển thị một phân bố cường độ duy nhất
nhưng tương tự nhau. Tuy nhiên, đường biên giữa các thành phần trên ảnh X quang
vú thường khơng tương ứng chính xác với các khoảng cường độ đơn giản sử dụng
cho phân vùng minh hoạ trên Hình 4.2. Ta cần một kỹ thuật phức tạp hơn để xác
định các khoảng. Trong chương này, ta đưa ra một kỹ thuật phù hợp để thực hiện
phân vùng như mong muốn.
Kỹ thuật của chúng ta xác định các ranh giới cường độ phù hợp. Khi các dải
cường độ đã được xác định, các pixel trong ảnh được nhĩm lại, khi đĩ phân vùng
được thực hiện đầy đủ và hiệu quả. ðể ý các đường phân chia dọc trên Hình 4.3;
chúng biểu diễn ranh giới cường độ giữa các thành phần khác nhau của vú. Nếu các
ranh giới này được xác định đúng, chúng sẽ được sử dụng để phân vùng ảnh.
Hình 4.3 Lược đồ xám của ảnh trên Hình 4.1 với 4 khoảng được đánh dấu
56
4.2.1 Phân vùng dựa trên lược đồ xám
Các kỹ thuật phân vùng ảnh X quang vú khác thường chỉ dựa trên lược đồ
xám của ảnh. Một vài kỹ thuật sử dụng các thơng tin về khơng gian, như hình dạng
và kết cấu của ảnh để phân vùng ảnh. Kỹ thuật đưa ra ở đây kết hợp giữa cường độ
và các thơng tin khơng gian. Bước đầu tiên của thuật tốn này sử dụng lược đồ xám
để xác định các ranh giới về cường độ trên ảnh X quang vú.
Các lược đồ xám dễ tính tốn, và chúng mang thơng tin về cường độ trên
ảnh. (Vùng được sử dụng để tính lược đồ xám cĩ thể thay đổi để thay đổi phạm vi
các đặc trưng cần phát hiện, nghĩa là phân vùng). Kỹ thuật của ta sử dụng lược đồ
xám để hình thành một vector đặc trưng rồi sau đĩ là đại lượng về khoảng cách để
phân vùng ảnh thành các thành phần. Kỹ thuật này nhanh hơn nhiều so với các
phương pháp phức tạp hơn, ví dụ mạng nơron; đồng thời khơng địi hỏi một bộ dữ
liệu đã được huấn luyện.
Ranh giới các thành phần trên ảnh X quang vú được đặc trưng bởi những
thay đổi về cường độ pixel trên các vùng cục bộ. Ví dụ, đường ranh giới giữa cơ
ngực và nhu mơ thường được thể hiện bằng một thay đổi về cường độ từ 30% đến
60%. Ranh giới giữa nền ảnh và mơ vú cũng cĩ mức thay đổi tương tự, nhưng ranh
giới giữa lớp mỡ dưới da với nhu mơ thì khĩ nhận biết hơn. Phương pháp của chúng
ta đánh dấu các vùng trên ảnh hiển thị các vùng cĩ mức thay đổi cường độ tương
đối cao. Các vùng này được dùng để xác định các khoảng cường độ cụ thể của ảnh
và phân vùng ảnh.
4.2.2 Phương pháp chênh lệch lược đồ xám
ðể tính thay đổi về cường độ, lược đồ xám của ảnh được hình thành cho một
vùng trên ảnh bằng cách tổng kết tần suất xuất hiện các mức xám trong vùng đĩ.
Ảnh sử dụng là ảnh mức xám 8 bit.
Lược đồ xám cho một bức ảnh hồn chỉnh hoặc một bức ảnh con cĩ thể được
coi như một vector. Trong trường hợp này, lược đồ xám cĩ 256 giá trị, bởi thế
vector cĩ 256 chiều. Tích điểm chuẩn hố của hai vector sẽ cho cosin của gĩc giữa
hai vector trong khơng gian đa chiều, cho ta một cách so sánh thuận tiện và hiệu quả
57
hai lược đồ xám. Tích điểm của hai vector 1 2( , ,..., )nv v v v=
v
và 1 2( , ,..., )nu u u u=
v
được
định nghĩa là:
( )
1
n
i i
i
v u v u
=
= ∗∑
v v
g (4.1)
Gĩc θ giữa hai vector v
v
và u
v
được xác định bằng
cos( ) | | | |
v u
v u
θ =
∗
v v
g
v v
(4.2)
với ( )2
1
| |
n
i
i
v v
=
= ∑
v
và ( )2
1
| |
n
i
i
u u
=
= ∑
v
Tính cosθ khơng khĩ và nĩ cung cấp một đại lượng về “khoảng cách” giữa
hai vector. Gĩc này được quan sát dưới dạng một tích điểm chuẩn hố; nĩ được sử
dụng như một đại lượng về độ chênh lệch giữa các cặp lược đồ xám. Nếu hai lược
đồ xám giống nhau, cos của gĩc bằng 1, nếu trực giao thì cos bằng 0. Với khái niệm
này, ta phát triển một phương pháp phân loại các phần trên ảnh X quang vú dưới
dạng độ chênh lệch giữa các cặp lược đồ xám.
Người ta cũng cĩ thể sử dụng nhiều cách kiểm tra thống kê để so sánh các
lược đồ xám, ví dụ tương quan thống kê. Một số các nhà nghiên cứu đã chứng minh
rằng các phân bố thống kê, ví dụ phân bố Poisson, cĩ thể được dùng để tính lược đồ
xám (Linnett et al.). Tuy nhiên, trong nghiên cứu này, ta chọn tích điểm chuẩn hố
vì chúng đơn giản và tính tốn nhanh, và cho một giá trị giữa 0 và 1 trong tất cả các
trường hợp.
ðại lượng về độ lệch giữa hai lược đồ xám của các ảnh con liền kề cho ta
một phương thức rất tốt để phát hiện các thay đổi dần dần trong mật độ quang của
ảnh X quang vú. Ranh giới giữa cơ ngực và mơ vú, và giữa mơ vú và nền ảnh, cĩ
thể bị nhiễu làm cho mờ đi. Nhưng so sánh các chênh lệch giữa các lược đồ xám sẽ
cho ta một định vị chính xác ranh giới giữa cơ ngực, mơ vú, lớp mỡ dưới da và nền
ảnh.
58
ðể cơng việc này được thực hiện hiệu quả, ta xây dựng phương pháp lấy
mẫu. Ảnh X quang ban đầu được chia thành các hàng và các cột, tạo thành các bức
ảnh con. Các ảnh con này cĩ thể gối hoặc khơng gối lên nhau. Kích thước ảnh con
cĩ thể thay đổi để thu được độ phân giải mong muốn của thuật tốn. ðể xác định
chính xác ranh giới giữa nhu mơ, cơ ngực, lớp mỡ và nền ảnh, các ảnh con liền kề
được sử dụng xuất phát từ trái qua phải và trên xuống dưới. Hình 4.4 minh họa ảnh
X quang vú trên Hình 4.1 được chia thành các ảnh con. ðây chỉ là ví dụ; trên thực tế
số lượng ảnh con lớn hơn nhiều và kích thước của chúng nhỏ hơn nhiều. Sau quy
trình lấy mẫu là tính tích điểm chuẩn hố giữa các lược đồ xám của các cặp ảnh con.
Tích điểm này được dùng để xây dựng một bức ảnh mới nhận biết được các thay đổi
về mật độ quang trên ảnh X quang ban đầu. Ảnh mới được giảm tỷ lệ xuống. Ví dụ,
nếu ảnh ban đầu là 5000 × 5000 pixel sử dụng ảnh con cĩ kích thước 10, ảnh mới sẽ
cĩ 499 × 499 pixel do cột cuối cùng khơng cĩ ảnh con nào ở bên phải nĩ để so sánh.
Hình 4.5 biểu diễn kết quả của phương pháp chênh lệch lược đồ xám cho ảnh trên
Hình 4.1.
Hình 4.5 minh họa những thay đổi nhỏ trên ảnh đi từ trái sang phải và trên
xuống dưới, nhưng khơng đưa ra ranh giới giữa cơ ngực, lớp mỡ và nền ảnh. Trên
Hình 4.5 các pixel sáng hơn biểu diễn những thay đổi đột ngột trong kết cấu, tương
ứng với các đặc trưng nhỏ trên ảnh hoặc ranh giới quan trọng giữa các vùng. Các
vùng tối hơn trên Hình 4.5 biểu diễn các vùng với thay đổi ít hơn.
Hình 4.4 Ảnh X quang chia thành các ảnh con
59
Hình 4.5 Chênh lệch lược đồ xám áp dụng cho ảnh X quang vú
Hình 4.6 minh họa tốt hơn mức độ hiệu quả của phương pháp chênh lệch
lược đồ xám. Nĩ biểu diễn kết quả của phương pháp này chỉ sử dụng lược đồ xám 4
giá trị, thay vì lược đồ xám 256 giá trị như trên Hình 4.5. Sử dụng lược độ xám 4
giá trị cĩ hiệu ứng làm nổi bật các thay đổi quan trọng nhất trong cường độ giữa các
bức ảnh. Hình 4.7 biểu diễn kết quả của phương pháp chênh lệch lược đồ với lược
đồ xám 4 giá trị nằm trên ảnh X quang vú mà từ đĩ nĩ được lấy. Chú ý rằng ranh
giới phù hợp cho các thành phần trên ảnh được đánh dấu bằng đại lượng chênh lệch
lược đồ xám.
60
Hình 4.6 Kết quả chênh lệch lược đồ cho lược đồ xám 4 giá trị
Hình 4.7 ðưa chênh lệch lược đồ xám vào ảnh X quang vú
Phương pháp chênh lệch lược đồ xám 4 giá trị hoạt động tốt trong trường
hợp này, nhưng trong các trường hợp khác nĩ cĩ thể khơng phát hiện được chính
xác ranh giới. Khi lược đồ xám của các ảnh con được nén từ 256 xuống 4 giá trị,
61
ranh giới mà sẽ được phát hiện được đưa vào trong các khoảng cường độ sau [0-63],
[64-127], [128-191] và [192-255]. ðây là các khoảng được dùng để phân vùng ảnh
trên Hình 4.2. Chúng hoạt động tốt trên ảnh này. Tuy nhiên, khơng phải tất cả các
ảnh X quang vú đều giống nhau. Ví dụ, Hình 4.8 là ảnh X quang vú từ Hình 4.1 với
tất cả các cường độ pixel tăng 15 %. Kiểu thay đổi cường độ này khơng phổ biến
đối với ảnh X quang vú, ngay cả với các ảnh trong vùng một bộ.
Hình 4.8 Ảnh X quang vú với cường độ tăng 15 %
Hình 4.9 biểu diễn kết quả sau khi áp dụng chênh lệch lược đồ xám 4 giá trị
cho ảnh trên Hình 4.8. Chú ý rằng cĩ một số vấn đề nảy sinh. Chỉ ba vùng được
phát hiện. Ranh giới giữa cơ ngực và mơ vú khơng được xác định. ðồng thời, nhiễu
nổi bật trên nền ảnh và sẽ khiến kết quả khơng ra được trong mơi trường tự động.
Cuối cùng, ranh giới giữa phần mơ vú và lớp mỡ và ranh giới giữa lớp mỡ và nền
ảnh là khơng chính xác.
Vấn đề tương tự cũng gặp phải khi các cường độ pixel trên ảnh giảm 15 %.
Hình 4.10 biểu diễn kết quả áp dụng chênh lệch lược đồ xám 4 giá trị cho ảnh giảm
62
về cường độ. Trong ví dụ này, tất cả các ranh giới đều bị xác định sai, và nhiễu ở
phần mơ vú khiến khơng đưa ra được kết quả.
Hình 4.9 ðưa chênh lệch lược đồ xám vào ảnh X quang vú tăng 15 %
Hình 4.10 ðưa chênh lệch lược đồ xám vào ảnh X quang vú giảm 15 %
63
Sử dụng lược đồ xám 4 giá trị là khơng đủ để đưa ra ranh giới giữa các thành phần
ảnh. Bởi vậy, ta phát triển một phương pháp định vị các ranh giới này sử dụng lược
đồ xám 256 mức.
4.2.3 Tìm ranh giới giữa các thành phần
Kết quả của phương pháp chênh lệch lược đồ xám 256 giá trị, như minh họa
trên Hình 4.5, tạo ra một ảnh mới trong đĩ cường độ pixel tương ứng với lượng
cường độ thay đổi trong khu vực đĩ. Tuy nhiên, nhiều khu vực thay đổi thể hiện các
đặc trưng tỷ lệ nhỏ trên ảnh khơng phải là các ranh giới quan trọng giữa các thành
phần ảnh. ðể đơn giản quy trình phân vùng, ta sử dụng một bộ lọc trung bình, như
đã nĩi đến ở phần 3.3.3. Hình 4.11 biểu diễn ảnh X quang vú sau khi sử dụng bộ lọc
trung bình 30 x 30. Hình 4.12 biểu diễn kết quả áp dụng chênh lệch lược đồ xám
cho bức ảnh trên Hình 4.11.
Trên Hình 4.12 các vùng thay đổi rõ ràng hơn trước và cũng phù hợp hơn với
các đường ranh giới đáng kể giữa các thành phần ảnh. Ta định vị các ranh giới giữa
các thành phần bằng cách tạo ra một lược đồ xám cĩ trọng số của bức ảnh ban đầu
với các kết quả của đại lượng chênh lệch lược đồ xám hoạt động dưới vai trị các
trọng số. Ta xây dựng lược đồ xám cho ảnh ban đầu, nhưng thay vì thêm 1 cho mỗi
pixem trong bức ảnh ban đầu, phương pháp của ta thêm giá trị chênh lệch lược đồ
xám vào pixel đĩ trên ảnh. Tất cả các giá trị này trải từ 0 đến 1. Việc này sinh ra
một lược đồ xám đã được chỉnh sưae nhấn mạnh vào các cường độ xuất hiện trong
các vùng thay đổi trên ảnh.
Sau đĩ các giá trị cường độ trên lược đồ xám trọng số được chuẩn hố để loại
bỏ bất cứ độ lệch nào từ các vùng biên giới lớn hơn. Hình 4.13 là lược đồ xám của
bức ảnh ban đầu và Hình 4.14 là lược đồ xám trọng số tạo ra với ảnh chênh lệch
lược đồ xám.
64
Hình 4.11 Ảnh X quang vú với các đặc trưng tỷ lệ nhỏ được loại bỏ
Hình 4.12 Kết quả chênh lệch lược đồ xám trên ảnh X quang vú đã được làm nhẵn
65
Hình 4.13 Lược đồ xám của ảnh ban đầu
Sử dụng lược đồ xám trọng số trên Hình 4.14, các ranh giới mong muốn
được xác định rõ ràng. Hình 4.15 biểu diễn xấp xỉ đạo hàm bậc nhất đơn giản của
lược đồ trọng số đã được lấy ngưỡng ở 0. Cực đại cục bộ từ đồ thị này là các vị trí
ranh giới giữa các thành phần. Hình 4.16 biểu diễn mối quan hệ giữa lược đồ xám
trọng số và ảnh chênh lệch lược đồ xám. Trên Hình 4.16, các vùng được khoanh
trịn trong lược đồ xám trọng số là ranh giới giữa các thành phần trên ảnh. Các mũi
tên biểu thị vị trí các ranh giới lược đồ xám trọng số trên ảnh chênh lệch lược đồ
xám.
Bằng cách sử dụng lược đồ xám trọng số, ta đã định ví chính xác ranh giới
cường độ phù hợp cho các thành phần ảnh và phân vùng ảnh ban đầu. Hơn nữa, ảnh
đã được điều chỉnh minh họa trên Hình 4.8 đến 4.10, khơng được phân vùng chính
xác bằng phương pháp chênh lệch lược đồ xám 4 giá trị, cũng đã được phân vùng
đúng. Các bức ảnh này giống như ảnh ban đầu, ngoại trừ việc các giá trị pixel đã
thay đổi 15 %. Bởi vậy, các lược đồ xám trọng số gần như giữ nguyên. Sự khác biệt
duy nhất là chúng dịch chuyển sang bên trái hoặc phải 15 %.
Ranh giới được khoanh trịn trên Hình 4.15 biểu thị các cường độ pixel tương
ứng với ranh giới của các thành phần trên ảnh. Trong ví dụ này, ranh giới giữa các
cường độ là 45, 81, 188 và 244. Từ đĩ, các pixel cĩ giá trị từ 0 đến 45 là nền ảnh.
Các pixel từ 45 đến 81 là lớp mỡ. Các pixel từ 81 đến 188 là phần mơ vú, cịn các
pixel từ 188 đến 244 là cơ ngực.
66
Hình 4.14 Lược đồ xám trọng số của ảnh ban đầu
Hình 4.15 Vị trí của các ranh giới giữa các phần (khoanh trịn)
67
Hình 4.16 Mối quan hệ giữa lược đồ xám trọng số và ảnh chênh lệch lược đồ xám
4.2.4 Thêm bối cảnh khơng gian
Phương pháp chênh lệch lược đồ xám giới thiệu ở phần trên cho ra ranh giới
giữa các thành phần trên ảnh X quang vú. Tuy nhiên, các ranh giới này cĩ dạng
cường độ pixel. ðể phân vùng ảnh thành các phần riêng biệt, cường độ pixel phải
được áp dụng cho ảnh X quang vú.
68
Sử dụng ranh giới về cường độ, ra phân ngưỡng ảnh X quang ban đầu. Quy
trình này cho ra ảnh trên Hình 4.18. Chú ý rằng cĩ một số pixel bị phân loại nhầm.
Các pixel này được định vị về khơng gian trong một thành phần nhưng giá trị cường
độ của chúng lại nằm ngồi phạm vi phát hiện với thành phần đĩ. ðể phân vùng phù
hợp và phân tích chuẩn, chúng cần được thay đổi để phù hợp với vùng chúng thuộc
về. ðiều này dễ dàng được thực hiện bằng cách thực hiện phép tốn ăn mịn trên
ảnh. Phép tốn ăn mịn kiểm tra từng pixel trên ảnh và nếu một pixel nào đĩ khác
với 4 trong 8 pixel lân cận của nĩ, nĩ được thay đổi để phù hợp với 4 pixel đĩ. Nĩi
cách khác, nếu pixel nổi bật lên trên nền của nĩ, nĩ sẽ được thay đổi cho phù hợp
với nền. Việc này loại bỏ các pixel bị phân loại sau khỏi bức ảnh phân vùng.
Hình 4.18 biểu diễn ảnh từ Hình 4.17 sau phép tốn ăn mịn. Nhiều pixel bị
phân vùng sai đã được chỉnh lại, nhưng vẫn cịn một số. ðể hiệu chỉnh điều này,
quy trình ăn mịn được lặp lại nhiều lần. Tuy nhiên, quy trình lặp này sinh ra độ lệch
trên ảnh. ðộ lệch này xuất hiện từ trình tự mà các pixel được kiểm tra. Nếu ta bắt
đầu ăn mịn các pixel bị phân loại sai từ gĩc trên cùng bên trái của bức ảnh, thì các
pixel đĩ sẽ chi phối bức ảnh và kết quả là khơng thích hợp. ðộ lệch sinh ra khi thực
hiện 10 phép tốn ăn mịn từ Hình 4.17 cĩ thể quan sát được trên Hình 4.19. ðể loại
bỏ độ lệch, ta tạo ra một trình tự ngẫu nhiên của các pixel trên ảnh, sau đĩ ăn mịn
ảnh theo trình tự ngẫu nhiên đĩ. Quy trình này đưa ra một bức ảnh đã được phân
vùng khơng phụ thuộc vào độ lệch theo vị trí. Hình 4.20 biểu diễn ảnh phân vùng
chính xác, tạo ra bằng cách thực hiện ăn mịn ngẫu nhiên 10 lần cho ảnh trên Hình
4.17.
Ảnh đã được phân vùng đúng. Tuy nhiên, cịn một bước nữa trước khi các
thành phần phân vùng cĩ thể được xử lý riêng biệt. Các vùng đã được phân ra cần
được nhĩm lại thành các nhĩm riêng lẻ và trích chọn vào các ảnh khác nhau. ðiều
này cho phép chúng được xử lý riêng biệt. Một thuật tốn để tạo các nhĩm pixel liền
kề của các màu giống nhau được giới thiệu trong Chương 6. Thuật tốn nhĩm và
trích chọn các thành phần đã phân vùng trên Hình 4.20. Các nhĩm trích chọn được
minh họa trên Hình 4.21 và biểu diễn cơ ngực (trên bên trái), nhu mơ (trên bên
phài), lớp mỡ (dưới bên trái) và nền (dưới bên phải).
69
Hình 4.17 Ảnh X quang vú phân ngưỡng theo ranh giới về cường độ
Hình 4.18 Ảnh phân vùng đã giảm các pixel phân loại nhầm
70
Hình 4.19 Ảnh phân vùng bị lỗi
Hình 4.20 Ảnh phân vùng chuẩn
71
Hình 4.21 Các thành phần ảnh trích thành các ảnh riêng biệt
4.2.5 Phân vùng các ảnh X quang vú đặc
Một số ảnh X quang vú hiển thị mơ vú đặc (mật độ cao) gây khĩ khăn cho
phân vùng và quét. Hình 4.22 là ảnh X quang cú cĩ mơ tuyến sợi đặc. Hình 4.23 là
phân vùng của ảnh này. Trong ví dụ này các vùng mơ tuyến sợi đặc được phân vùng
riêng biệt khỏi phần nhu mơ của vú. Việc này cho phép các thuật tốn quét ảnh X
quang vú phân tích các vùng tách rời nhau.
72
Hình 4.22 Ảnh X quang vú với mơ tuyến sợi đậm đặc
Hình 4.23 Ảnh phân vùng với mơ tuyến sợi đậm đặc
73
4.3 Tổng kết về quá trình phân vùng
Thuật tốn phân vùng được cải tiến cho các ảnh X quang vú trình bày trong
chương này thực hiện phân vùng chính xác ảnh X quang vú thành các thành phần
nhu mơ, cơ ngực, lớp mỡ dưới da và nền ảnh. Phương pháp của chúng ta phù hợp để
phân vùng một bộ nhiều ảnh, và khơng giống các kỹ thuật khác, nĩ khơng yêu cầu
các dữ liệu đã được học.
Các bước của quá trình phân vùng là:
1. Ảnh được làm trơn sử dụng bộ lọc trung bình để loại bỏ các đặc trưng tỷ lệ
nhỏ.
2. Sử dụng phương pháp chênh lệch lược đồ xám để tạo ra một ảnh mới.
3. Lược đồ xám trọng số được tạo ra sử dụng ảnh chênh lệch lược đồ xám dưới
dạng các trọng số.
4. Xấp xỉ đạo hàm bậc nhất của lược đồ xám trọng số cung cấp ranh giới về
cường độ trên ảnh.
5. Ảnh được phân ngưỡng theo ranh giới về cường độ.
6. Ảnh phân vùng theo ngưỡng được ăn mịn nhiều lần để loại bỏ các pixel bị
phân loại nhầm.
7. Các thành phần riêng biệt được trích từ ảnh phân vùng cuối cùng sử dụng
thuật tốn miêu tả chi tiết ở Chương 6.
74
Chương 5 - PHÁT HIỆN CÁC KHỐI U TRÊN ẢNH X QUANG VÚ
Các khối u vú cĩ thể được xác định trên các ảnh số X quang vú bằng cách
phân tích trên máy tính nhiều thơng số thống kê về các đặc trưng từ ảnh này. Bất kỳ
thuật tốn nào dùng để phân tích các ảnh X quang vú số hĩa đều cĩ thể vừa tốn thời
gian vừa khơng thành cơng bởi cĩ nhiều vùng trên các bức ảnh này giống khối u
nhưng lại khơng phải là khối u. Do đĩ, lỗi tích cực sai sẽ làm mất đi tính hiệu quả
của thuật tốn. Chương này sẽ trình bày một thuật tốn đơn giản - hiệu quả để định
vị và ghi lại các vùng nghi ngờ trên ảnh X quang vú.
Thuật tốn đưa ra ở đây gồm 3 bước. ðầu tiên ta sử dụng một mẫu để xác
định và ghi lại các pixel nghi ngờ. Sau đĩ là một nhĩm các pixel nghi ngờ, và cuối
cùng nhĩm các pixel nghi ngờ này sẽ được kiểm tra lại bằng một mẫu điều chỉnh
phù hợp với kích thước chính xác của khối cĩ thể là khối u.
5.1 Thuật tốn định vị khối u trong ảnh X quang vú số hĩa
Cĩ nhiều phưong pháp sử dụng sự hỗ trợ của máy tính để phát hiện các khối
u trong ảnh chụp vú số hĩa. Các phương pháp này cĩ thể được phân loại trên cơ sở
các pixel hoặc các vùng. Phương pháp dựa trên pixel trích rút các đặc trưng cĩ tính
thống kê từ mỗi pixel riêng biệt trong ảnh chụp vú và sử dụng sơ đồ phân loại để
xác định và ghi lại các pixel quan tâm. Trong một số trường hợp, thực hiện kiểm tra
sâu hơn cĩ thể biết được khối u biểu thị bởi các pixel này là lành tính hay ác tính.
Một phương pháp khác là dựa trên vùng và nĩ kiểm tra tồn bộ các vùng của ảnh
chụp vú để tìm khối u. Chương này trình bày một phương pháp lai giữa hai phương
pháp nhằm kiểm tra cĩ máy tính hỗ trợ để tìm khối u. Ta áp dụng bước thu hẹp
trọng tâm phân tích mọi pixel trong bức ảnh vào một nhĩm các pixel, đĩ là các vùng
trên ảnh. Các vùng ảnh này được kiểm tra để xác định chúng cĩ chứa khối u hay
khơng. Các vùng cĩ khả năng chứa khối u sau đĩ sẽ được trích rút và xử lý tiếp.
Quá trình xử lý này sử dụng nhiều mức kiểm tra nhằm lọc ra các vùng nghi ngờ.
Cách làm này làm tăng hiệu suất và giảm sai lệch cho các ảnh được kiểm tra.
Kỹ thuật của ta sử dụng một dạng đối sánh mẫu ở các tỷ lệ khác nhau để định
vị các pixel trên ảnh cĩ thể là một phần của khối u. Ảnh kết quả được phân ngưỡng
phù hợp để xác định trước mức độ chính xác và sau đĩ các pixel cịn lại được nhĩm
75
với nhau và trích rút ra. Chương này đưa ra các mẫu, thuật tốn đối sánh mẫu, và
phân ngưỡng thích hợp. Kỹ thuật của ta sử dụng một bộ 156 ảnh từ 39 ảnh chụp X
quang vú.
5.2 Thuật tốn phát hiện khối u
5.2.1 Một mẫu cho các khối u trong ảnh X quang vú
Một khối u trong một ảnh chụp vú cĩ thể là lành tính hoặc ác tính. ðể kiểm
tra các khối u ác tính, chúng ta cần phải xây dựng một mẫu mà cĩ thể đối sánh với
các tính chất của khối u trong cơ sở dữ liệu chúng ta đã xây dựng. Các khối u cĩ xu
hướng cĩ cường độ lớn hơn các vùng xung quanh chúng. Chúng hơi trịn, cho dù
chúng hiển thị yếu hoặc cĩ đường bao mờ với các mơ xung quanh. Hình 6.1 là một
ví dụ về khối u ung thư được xác định bên trong vịng trịn đứt nét. Chúng ta chỉ ra
và xác định các vật trong một ảnh chụp vú bằng cách so sánh ảnh này với mẫu đã
chọn. Mẫu này được xây dựng từ một phần của ảnh khác, ảnh này cho biết các tính
chất trực quan và thống kê của các đối tượng đang được tìm kiếm. Chúng tơi đã
kiểm tra một cách kỹ lưỡng các mẫu cĩ thể và chọn ra các mẫu hiệu quả nhất đối
với ảnh chụp vú trong nghiên cứu này.
Hình 5.1 Ví dụ về khối ung thư
76
ðể kiểm tra các mẫu, ta thu thập một bộ ảnh chụp vú với các khối u ác tính.
Các ảnh này đi kèm với bệnh lý học, điều này sẽ cho biết các đường bao của các
khối u ác tính. Các ảnh chụp vú này cĩ tổng cộng 80 khối u ác tính (ung thư) do các
bác sĩ X quang và khoa bệnh lý học xác định. Sử dụng 80 khối u này, ta sẽ ghi lại
chất lượng của mỗi mẫu và đưa ra một lựa chọn dựa trên các kết quả này.
Ta sử dụng một tương quan thống kê để so sánh một mẫu với khối u thực tế.
Sự so sánh này sẽ được thảo luận chi tiết trong phần tiếp theo. Do kích thước vị trí
của mỗi khối u thực tế là biết được, nên một mẫu cĩ cùng kích thước cĩ thể được
tạo ra và đặt tại tâm của vị trí này để so sánh. Tuy nhiên, vẫn cĩ thể cĩ sai sĩt nhỏ
trong khi so sánh, khi mà mẫu này khơng đặt chính xác tại tâm của khối u hoặc khi
mẫu cĩ kích thước khác với kích thước của khối u đang được quan sát. Sử dụng kỹ
thuật này để so sánh, bốn mẫu khác nhau được lựa chọn: một khối cầu chiếu theo 2
chiều, một hàm lượng giác hypecpol 2-D, một vịng trịn đơn, và một khối u ác tính
trên thực tế, minh họa từ Hình 5.2 –đến Hình 5.5. Khối cầu này được chiếu theo 2
chiều (như minh họa ở Hình 5.2) được tạo ra từ phương trình (5.1) theo giả thiết của
Brake và Karssemeijer. D là đường kính của mẫu.
F(x,y) = D2 – x2 – y2 (5.1)
Hàm lượng giác đường hypecbol 2-D được minh họa ở hình 5.3 được sinh ra từ
phương trình 5.2 theo giả thuyết của Morrison và Linnett:
F(x,y) = sec h(x+y) (5.2)
Hình 5.2 Mẫu hình cầu
77
Hình 5.3 Mẫu hàm lượng giác 2-D
Hình 5.4 Mẫu hình trịn đơn giản
Hình 5.5 Mẫu khối u ác tính
Các khối u trong ngực thường cĩ hình trịn và đối xứng. Các mẫu trong ví dụ
này cũng đồng dạng và cĩ hình trịn; do đĩ, các lỗi về định hướng được bỏ qua.
78
Mọi điểm trong một ảnh X quang vú đều được tính đến trong quá trình đối
sánh mẫu, cĩ nghĩa là tâm của bất kỳ một khối u cĩ thể tồn tại nào cũng được xét
đến. ðiều này loại bỏ bất kỳ lỗi nào từ các so sánh mẫu mà khơng nằm tại tâm của
khối u.
Việc tiên lượng sơ bộ đối với sự lựa chọn các mẫu khác nhau là độ nhạy mẫu
đối với các lỗi tỷ lệ. Khi một mẫu được so sánh với các phần của một ảnh chụp vú,
thì người ta thường xác định cụ thể lại cỡ của mẫu. Quá trình định cỡ lại mẫu này cĩ
thể sẽ khác với kích thước khối u thực tế trên ảnh. Quá trình định cỡ lại này sẽ tạo
ra các lỗi mức. Trong một nghiên cứu khác, các mẫu của đa tỷ lệ được sử dụng như
một phần của quá trình đối sánh mẫu (Brake và Karssemeijer); nĩ sẽ cĩ ít thuận lợi
hơn đối với một đơn tỷ lệ. Do đĩ, khi một mẫu được lựa chọn và sau đĩ được sử
dụng để kiểm tra một ảnh, một mẫu đơn, mà sẽ đối sánh các khối u với các kích
thước thay đổi, là điều mong muốn.
ðể đánh giá 4 mẫu đã chọn cho độ nhạy và mức phù hợp, mỗi mẫu đều được
so sánh với tất cả 80 khối u trong thực tế. Một mẫu được tạo ra cĩ kích thước chính
xác của một khối u và cho mỗi mức của đa mức được sử dụng. ðiều này cho phép
đánh giá tính hiệu quả của mỗi mẫu đối với các khối u cĩ kích thước thay đổi.
Sự tương quan thống kê giữa mẫu này và khối u thực tế tạo ra một giá trị
trong khoảng –1 và 1, trong đĩ 1 chỉ ra một đối sánh chính xác. Bảng 5.1 cho thấy
sự tương quan trung bình giữa mỗi mẫu với 80 khối u và trong đĩ các mẫu và các
khối u này là cùng kích thước. Mẫu lượng giác cĩ sự tương quan cao nhất (tốt nhất).
Nĩ là tốt nhất bởi vì sự tương quan càng cao thì các kết quả đặt ngưỡng càng tốt
hơn, cụ thể chúng ta cĩ thể xác định các kết quả được kỳ vọng là đúng tốt hơn.
Hình 5.6 cho thấy bốn mẫu tương quan với các khối u đã biết khi kích thước
của chúng được định mức. Biểu đồ này cho thấy các kết quả của các mẫu tương
quan phân chia từ 0,1 tới 2 lần kích thước của khối u thực tế. Mẫu thực hiện tốt nhất
trong kiểm tra này cùng là mẫu lượng giác minh họa ở hình 5.6. Nĩ cĩ độ ổn định
cao nhất (tốt nhất) và ít nhạy với các lỗi tỷ lệ. Chú ý: tất cả các mẫu kém hoạt động
bất cứ khi nào mức này khác một cách đáng kể so với kích thước của chúng. ðặc
biệt, khi kích thước mẫu nhỏ hơn vài lần kích thước khối u thực tế, các kết quả này
khơng thỏa mãn. Tuy nhiên, khi các kích thước mẫu là lớn hơn các kích thước khối
79
u thực tế kết quả này sẽ giảm chậm và cĩ thể sử dụng được. Do đĩ, lựa chọn kích
thước mẫu quá to sẽ tốt hơn chọn một cái quá bé. Từ điều này, mẫu lượng giác tốt
hơn các mẫu khác đã được nghiên cứu.
Bảng 5.1 Mẫu trung bình đối với các giá trị tương quan khối u
Mẫu Tương quan trung bình
Lượng giác 0,7992
Khối u 0,6470
Hình trịn 0,5480
Khối cầu 0,7502
5.2.2 Các phương pháp đối sánh mẫu
Cĩ một vài cách so sánh một mẫu với một ảnh chụp X quang vú. Một số sử
dụng tích chập hoặc một phương pháp dựa trên tương quan chéo, điều này sẽ hết
sức hiệu quả khi sử dụng phương pháp biến đổi Fourier nhanh (FFT). Tuy nhiên,
người thực hiện luận văn phát hiện ra rằng phương pháp tích chập với mẫu lượng
giác cĩ thể bị lộn xộn do sự thay đổi trong cường độ ảnh chụp vú cục bộ. Ví dụ, một
khối u cĩ thể xuất hiện sáng hơn một cách đáng kể so với cường độ trung bình của
các vùng xung quanh nĩ, nhưng khi so sánh với tất cả các vùng và các mơ khác
trong ảnh, nĩ cĩ thể tối hơn cường độ tổng thể trung bình của ảnh. Khối u này cĩ
thể sẽ bị bỏ qua nếu đang sử dụng một tích chập dựa trên thuật tốn đối sánh mẫu.
Hình 5.7 là một ví dụ, mà trong đĩ một khối u trên một vùng ảnh cục bộ được xác
định đúng bằng một phương pháp tích chập sử dụng mẫu lượng giác. Hình bên trái
của hình 5.7 là ảnh thực của khối u này và hình bên phải là kết quả từ việc định
ngưỡng tích chập với mức thích hợp.
80
Hình 5.6 ðộ nhạy tỷ lệ của các mẫu
Hình 5.7 Khối u (trái) và phát hiện khối sử dụng tích chập (phải)
Kết quả này sẽ khơng hiệu quả như ví dụ này khi quá trình này được tiến
hành trên tồn bộ ảnh chụp vú. Hình 5.8 cho thấy một ảnh chụp vú cĩ một khối u.
Hình 5.9 minh họa các kết quả đặt ngưỡng của tích chập trên tồn bộ ảnh. Các kết
81
quả đã chập này phù hợp với các vùng cường độ cao, bao gồm vùng cơ ngực của
ảnh. Trong tình huống này, khối u khơng được định vị một cách chính xác. Do đĩ,
phương pháp tích chập khơng phù hợp như một thuật tốn xác định vị trí khối u hiệu
quả với ảnh này.
Một phương pháp thay thế khác cĩ thể sẽ tương quan giữa mẫu này và mỗi
điểm ảnh trong ảnh, trong đĩ ảnh nhỏ bao quanh mỗi điểm ảnh là cùng kích thước
với mẫu. Thuật tốn đối sánh mẫu dựa trên cơ sở tương quan khơng thiên về sự thay
đổi cường độ và nhạy với các đặc trưng của hình dạng (Brake và Karssemeijer).
Cơng thức được sử dụng cho sự tương quan giữa mẫu và ảnh gốc như sau:
cov( , )( , )
cov( , )
x y
xy x y
x y
cor x y
x y
σ σ
µ µ µ
≡
≡ −
(5.3)
trong đĩ cov(x,y) là liên hiệp biến của mẫu, x, và ảnh nhỏ, y, bao quanh điểm ảnh.
σx và σy là các độ lệch chuẩn của mẫu này và ảnh nhỏ. µx và µy là trung bình của
mẫu và ảnh nhỏ. µxy là trung bình của mỗi điểm ảnh trong mẫu nhân bởi mỗi điểm
ảnh.
Kết quả áp dụng sự tương quan ảnh này trở về một ảnh mới, nhận giá trị giữa
-1 và 1. Khi giá trị tương quan càng gần với 1, sự tương tự giữa mẫu và các điểm
ảnh đang được kiểm tra càng lớn. Nghĩa là các điểm ảnh tạo ra một giá trị tương
quan gần với 1 tương tự với mẫu khối u. Hình 5.10 cho thấy các kết quả áp dụng sự
tương quan này với ảnh minh họa trên hình 5.8.
ðể xác định các vùng trên ảnh, vùng này chắc chắn cĩ khối u, một ngưỡng
được sử dụng với các giá trị tương quan. Trong ví dụ này, các điểm ảnh với các giá
trị tương quan là 0,75 hoặc lớn hơn cĩ khả năng xuất hiện khối u cao. Hình 5.11
biểu thị các kết quả của việc định ngưỡng này với ảnh minh họa trên hình 5.10. Mức
ngưỡng giảm số lượng các giá trị điểm ảnh cần xem xét và định vị phần ảnh gốc mà
cĩ khả năng xuất hiện khối u cao. Trong hình 5.11, vùng trắng cho thấy vị trí khối u
trong ảnh X quang chụp vú.
82
Hình 5.8 Ảnh X quang vú cĩ chứa khối u
Hình 5.9 Kết quả từ tích chập mẫu với ảnh trên Hình 5.8
83
Hình 5.10 Kết quả đối sánh mẫu dựa trên tương quan
Hình 5.11 Kết quả được lấy mẫu và giãn của đối sánh mẫu tương quan
84
5.2.3 Nhĩm và phân vùng các vùng nghi ngờ
Ví dụ ở phần trước đã mơ tả làm thế nào để định vị một khối u trong một ảnh
X quang chụp vú bằng cách thực hiện một sự tương quan sau khi đặt ngưỡng. Mức
ngưỡng trong ví dụ trước được chọn bằng tay. Trong thực tế, một ngưỡng sẽ cĩ giá
trị thấp hơn mức tối ưu. Nĩ được thực hiện sao cho một vài khối u bị mất đi bởi sự
phân tích.
Khi một giá trị ngưỡng được giảm đi, người ta thường định vị được nhiều
khối u hơn. Hình 5.12 cho thấy kết quả của việc đặt ngưỡng ảnh trên hình 5.11 với
một giá trị ngưỡng là 0.60. ðiều này tạo ra một vài cụm của các điểm ảnh cĩ thể là
khối u trong ảnh thu được. Chỉ cĩ duy nhất một khối u trong thực tế.
ðối với điểm này, quá trình xử lý hồn tồn dựa trên các điểm ảnh. Mỗi điểm
ảnh cần được xử lý độc lập với các điểm ảnh khác trên bức ảnh. Tuy nhiên, các
điểm ảnh được minh họa trên hình 5.12 là các phần của các cụm khác nhau. Chương
6 trình bày một thuật tốn nhĩm và trích rút nhĩm các điểm ảnh liên quan. ðiều này
cho phép các vùng chứa các điểm ảnh tương tự nhau được xử lý cùng với nhau.
Hình 5.13 minh họa 4 cụm điểm ảnh phân biệt trong hình 5.12. Mỗi cụm cĩ
khả năng là một khối u và cần được xử lý thêm và so sánh với bệnh lý học của nĩ.
Hình 5.12 Các kết quả tương quan phân ngưỡng với 0.6
85
Hình 5.13 Các khối cĩ khả năng được trích rút
5.2.4 Cải thiện đa tỷ lệ
Với các nhĩm pixel khác nhau, minh họa trên Hình 5.13, một bước đa tỷ lệ
được thêm vào thuật tốn phát hiện khối u của ta. Phần 5.2 trình bày về các vấn đề
lựa chọn mẫu cĩ kích thước khác với kích thước khối u được nghiên cứu. Khi mẫu
lớn hơn hoặc nhỏ hơn nhiều khối u quan tâm, cĩ thể khối u khơng được phát hiện.
Một giải pháp cho vấn đề này là kiểm tra tồn bộ ảnh với các mẫu kích thước khác
nhau. Tuy nhiên, việc này mất thời gian và khơng hiệu quả.
Cách giải quyết của ta là tương quan mẫu chỉ trên những nhĩm pixel và sử
dụng các mẫu đa kích thước. Cách này cĩ những ưu điểm sau:
• Các nhĩm pixel chỉ là một phần nhỏ trên ảnh và vì thế, kiểm tra đa tỷ lệ sẽ dễ
dàng về tính tốn.
• Kích thước chính xác của nhĩm pixel đã được xác định, vì thế một mẫu nào
đĩ cĩ thể được tạo ra cho kích thước này và sử dụng với ảnh ban đầu để loại
bỏ các sai số về tỷ lệ.
• Vị trí chính xác của nhĩm pixel đã biết; vì thế, mẫu này cĩ thể được đặt vào
tâm của nhĩm, thay vì ở một vị trí ngồi tâm. Việc này tăng tốc độ hiệu
chỉnh.
86
ðể minh họa, 4 khối khả năng được biểu diễn trên Hình 5.13 được trích rút ra
từ ảnh X quang vú trên Hình 5.14. Với mỗi khối trong số này, ta tạo ra một mẫu
lượng giác. Sau đĩ tương quan thống kê được tính giữa mẫu kích thước chuẩn và
đặt ở tâm với khối khả năng. Bảng 5.2 đưa ra các kết quả. Các khối khả năng cho
giá trị tương quan nằm giữa 0.5448 và 0.8583. Khối thực tế cho giá trị tương quan
cao nhất là 0.8583. Ba khối kia là lỗi tích cực sai. Các kết quả của quá trình đa tỷ lệ
này phân biệt giữa khối thực (từ bệnh lý học) với các lỗi tích cực sai. Với ảnh X
quang vú này, cĩ thể xác định và loại bỏ lỗi tích cực sai bằng cách dùng giá trị phân
ngưỡng cao hơn. Lỗi tích cực sai cĩ thể được giảm đi bằng cách thêm vào ngưỡng
này.
Hình 5.14 Các khối khả năng trên ảnh X quang vú
87
Bảng 5.2 Các kết quả tương quan đa tỷ lệ với các khối khả năng
ðối tượng Kích thước (pixel2) Tương quan mẫu
(1) 30,000 0.6585
(2) 23,000 0.5448
(3) Khối thực tế 40,000 0.8583
(4) 60,000 0.5919
5.3 Tổng kết về định vị khối u
Thuật tốn định vị khối u trên ảnh X quang vú số hố:
1. Tồn bộ bức ảnh X quang vú được xử lý với thuật tốn đối sánh mẫu dựa
trên tương quan.
2. Kết quả của phép tương quan này được phân ngưỡng để xác định các pixel
nghi ngờ.
3. Các pixel nghi ngờ được nhĩm thành các nhĩm và trích rút ra.
4. Các nhĩm trích rút được so sánh với một mẫu tạo ra với kích thước bằng kích
thước nhĩm.
5. Sau đĩ, mỗi nhĩm được tương quan với mẫu của nĩ và kết quả của mỗi lần
tương quan lại được phân ngưỡng để loại bỏ các lỗi tích cực sai.
Thuật tốn này cĩ thể sử dụng để phát hiện khối u hoặc nĩ cĩ thể kết hợp với
các bước khác để nâng cao hiệu suất. Ví dụ, thuật tốn phân vùng ở Chương 4 cĩ
thể dùng để loại bỏ nền và các vùng khác khỏi sự quan tâm. ðiều này tiết kiệm thời
gian và giảm các sai số khi sử dụng thuật tốn phát hiện khối u. Kết quả của thuật
tốn này cũng được ghi lại ở dạng các vùng khả nghi trên ảnh. Các vùng này sau đĩ
được phân loại để giảm sai số.
88
Chương 6 - HỆ THỐNG KIỂM TRA THUẬT TỐN QUÉT
Một hệ thống kiểm tra thuật tốn quét được phát triển, là kết quả phụ của
nghiên cứu này. Chương này giới thiệu về hệ thống làm cơng việc ghi và so sánh
các kết quả từ ảnh X quang quét máy tính hỗ trợ với bệnh lý của chúng. Kỹ thuật
này cung cấp các vùng khả nghi phát hiện được từ quá trình đối sánh mẫu để so
sánh.
Nhiều thuật tốn định vị khối u khơng cho các kết quả với dạng đơn giản
“cĩ/ khơng” về vị trí và tính ác tính của khối u. Thay vì đĩ, nĩ đưa ra một gradient
về “khả năng”. Một phần nào đĩ trên ảnh được xác định là cĩ nhiều khả năng chứa
khối u hơn các phần khác của cùng bức ảnh. Một nhược điểm của phương thức này
là hệ thống phức tạp hơn do cần cĩ thêm phương pháp phân ngưỡng các kết quả và
chọn ngưỡng phù hợp. Sau đĩ, ngưỡng sẽ đưa ra câu trả lời “cĩ/ khơng” cho vùng
cĩ nhiều khả năng là một khối u hơn. Một ưu điểm của phương thức này là ngưỡng
cĩ thể điều chỉnh được để cho bất cứ mức độ chính xác nào theo mong muốn.
Nhằm thiết lập một mức chính xác theo ý muốn cho một hệ thống quét tìm
khối u, nhiều thơng số thuật tốn cần được xác định bằng cách lựa chọn bằng thực
nghiệm các giá trị “tối ưu”. Thực nghiệm này rất tốn thời gian đặc biệt khi các kết
quả của thuật tốn quét được lập bảng thủ cơng và so sánh với bệnh lý. Phương
pháp giới thiệu ở chương này đưa ra một giải pháp cho vấn đề này. Nĩ cho phép
giảm thời gian quét khối u và hầu hết các kết quả được kiểm tra tự động. Phương
pháp này được dùng rộng rãi trong khi triển khai thuật tốn định vị khối u trình bày
ở Chương 5.
6.1 Các kết quả lọc ảnh
Thuật tốn phát hiện khối u trình bày trong Chương 5 cho ta một bức ảnh
hồn tồn mới với các giá trị sinh ra tại vị trí của các giá trị pixel ban đầu. Các giá
trị mới này biểu thị một đặc tính mà phương pháp này nhắm tới. Trong thuật tốn
phát hiện khối u của chúng ta, các pixel sinh ra nằm giữa 0 và 1. Các pixel này là
kết quả tương quan giữa mẫu lựa chọn cho khối u và các vùng khác trên ảnh X
quang vú.
89
Các giá trị tương quan này được dịch dưới dạng “khả năng” mỗi pixel nằm ở
tâm của khối u. Hình 6.1 minh họa một ảnh X quang vú và Hình 6.2 minh họa kết
quả của thuật tốn phát hiện khối u với ảnh này. Vùng được khoanh trịn trên Hình
6.2 được hiểu là vị trí khối u ác tính. Các pixel trong vùng này thay đổi từ 0.0 đến
0.9; lý tưởng thì sẽ cĩ một pixel với giá trị 1 ở vị trí tâm của khối u này. Tuy nhiên,
thuật tốn này khơng hồn hảo do khơng cĩ pixel cĩ giá trị 1. Thay vì đĩ, một nhĩm
pixel trong vùng này cĩ giá trị gần 1. Tất cả các pixel cĩ giá trị gần 1 đều cĩ thể là
tâm của khối u. Các pixel khác 0 khác cĩ trên ảnh ít cĩ khả năng trở thành tâm khối
u hơn và cĩ thể là nhiễu ảnh, các đặc trưng vú bình thường hoặc các vùng khơng
phải tâm khối u.
Do việc định vị các khối u phát hiện được trên Hình 6.2 là khơng chính xác,
nên cần các phân tích khác nữa để đưa ra kết quả cuối cùng. Cơng đoạn phân tích
phụ này bắt đầu từ ảnh tạo ra được phân ngưỡng để loại bỏ các kết quả được xem là
kém quan trọng. Ảnh tạo ra là ảnh nhị phân, nghĩa là tất cả các pixel bằng 0 hoặc 1.
0 biểu thị là khơng phải khối u, và 1 biểu thị vị trí khối u. Hình 6.3 minh họa kết
quả của phép phân ngưỡng này cho Hình 6.2. Với Hình 6.3, các pixel với các giá trị
lớn hơn 0.75 trên Hình 6.2 được gán cho giá trị 1 và các pixel cịn lại gán bằng 0.
Nếu ngưỡng được lấy thấp hơn, sẽ phát hiện được nhiều chi tiết hơn, cịn nếu tăng
ngưỡng lên thì sẽ phát hiện được ít chi tiết hơn. Cách kiểm tra này cho phép thay
đổi các ngưỡng cũng như các thơng số hệ thốgn khác và kết quả được áp dụng tự
động cho việc so sánh. Quy trình này tạo ra và cĩ thể chọn một ngưỡng tối ưu.
6.2 Nhĩm các nhĩm pixel
Với đầu ra phân ngưỡng từ bộ lọc ảnh biểu diễn trên Hình 6.3, các vị trí của
các khối u chưa được xác định hồn tồn. Mỗi pixel trắng trên Hình 6.3 biểu thị một
vị trí cĩ thể của khối u; tuy nhiên, các pixel được nhĩm vào các nhĩm riêng biệt
biểu diễn các phát hiện đơn. Các pixel này trong các nhĩm phân biệt cần được nhĩm
lại và trích ra dưới dạng một khối u đơn để so sánh với bệnh lý.
90
Hình 6.1 Ảnh X quang vú
Hình 6.2 Kết quả phát hiện khối u trên Hình 6.1
91
Hình 6.3 Ảnh phân ngưỡng từ Hình 6.2
Nhĩm các nhĩm pixel riêng biệt khơng phải là một nhiệm vụ đơn giản. Nĩ
địi hịi kiểm tra từng pixel trên ảnh và nhĩm tất cả các pixel cĩ cùng cường độ là
các lân cận gần nhất. Pixel A là lân cận gần nhất của pixel B khi pixel A là một
trong tám pixel nằm ngay cạnh B; Hình 6.4 biểu diễn pixel này và tám pixel lân cận
của nĩ. Hình 6.3 cĩ 4 nhĩm pixel riêng biệt và Hình 6.5 biểu diễn 4 nhĩm này đã
được trích rút với ảnh riêng biệt cho mỗi nhĩm.
Hình 6.4 Pixel (i, j) và các pixel lân cận
92
Hình 6.5 Bốn nhĩm pixel trên Hình 6.3
Thuật tốn nhĩm và trích các nhĩm pixel trên Hình 6.5 là một phần trong kết
quả của nghiên cứu trong luận văn. Các bước của thuật tốn này như sau:
Các bước nhĩm pixel
1. Tạo ra hai danh sách. Danh sách thứ nhất là danh sách pixel cho tất cả các
pixel trên ảnh. Danh sách thứ hai là danh sách trống, chứa các nhĩm pixel đã
nhĩm lại.
2. Pixel đầu tiên trong danh sách pixel được loại bỏ khỏi danh sách và xử lý.
Quá trình này được lặp lại cho tới khi danh sách pixel trống. ðể xử lý một
pixel, mỗi nhĩm trong danh sách nhĩm được kiểm tra. Nếu pixel được xử lý
là lân cận gần nhất của bất cứ pixel nào trong một nhĩm trong số đĩ, nĩ sẽ
được thêm vào nhĩm đĩ. Mỗi pixel sẽ chỉ được thêm vào một nhĩm trong
danh sách nhĩm.
3. Khi danh sách nhĩm đã trống, tất cả các pixel đã được thêm vào một nhĩm
nào đĩ. Tuy nhiên, trong hầu hết quy trình xử lý ảnh X quang vú, một số
nhĩm trong danh sách nhĩm vẫn cĩ thể nhĩm lại được. Vì thế, bước tiếp theo
địi hỏi mỗi nhĩm trong danh sách nhĩm được so sánh với các nhĩm khác.
Các nhĩm chứa các lân cận gần nhất được kết hợp lại với nhau.
4. Cuối cùng, mỗi nhĩm trong danh sách nhĩm được định dạng và lưu trữ dưới
dạng một bức ảnh riêng biệt.
93
Hình 6.6 minh họa sơ đồ của quy trình này.
Mỗi ảnh X quang vú thường cĩ nhiều hơn một triệu pixel, và xử lý khơng
hiệu quả sẽ dễ dàng tạo ra các yêu cầu tính tốn khơng thực tế. Nếu N là số lượng
pixel trên ảnh; thuật tốn nhĩm pixel của ta cĩ hiệu suất là O(N) và cĩ thời gian
chạy tuyến tính. Bất cứ ảnh X quang vú nào với N pixel đều cần một số lượng
khơng đổi N phép tốn để nhĩm các pixel này vào các nhĩm.
Lí do cho hiệu suất tuyến tính này là để hai pixel được nhĩm vào một nhĩm,
chúng cần là các lân cận gần nhất của một kết hợp nào đĩ của các pixel. ðiều này cĩ
nghĩa là để nhĩm một pixel đơn, khơng cần xét từng pixel trên ảnh mà chỉ tám lân
cận của pixel đơn đĩ. Nếu một pixel thuộc về một nhĩm nào đĩ với bất cứ pixel nào
khác, một pixel phải nằm trong số tám lân cận của nĩ. ðiều này cho phép xử lý
danh sách tuyến tính các pixel chỉ một lần. Do số lượng pixel trên ảnh lớn hơn nhiều
con số 8, nến nĩ vẫn được coi là bậc N.
Quy trình xử lý danh sách pixel đầu tiên tạo ra một danh sách các nhĩm. ðộ
dài của danh sách này nhỏ so với số lượng pixel trên ảnh. Bước 3 của thuật tốn kết
hợp các nhĩm; tuy nhiên, một số trong các nhĩm này cĩ thể là các lân cận gần nhất.
ðây là một tác động của quá trình đơn giản hố; nếu một pixel thuộc về một nhĩm
nào đĩ với các pixel khác, một trong số chúng phải nằm trong số 8 lân cận gần nhất.
Vì tám pixel lân cận gần nhất là các pixel duy nhất được kiểm tra, cĩ những trường
hợp một nhĩm đơn các pixel bị phân loại nhầm vào hai nhĩm. Ví dụ, Hình 6.7 chỉ
chứa một nhĩm phân biệt các lân cận gần nhất. Tuy nhiên, sau hai bước của thuật
tốn, hai nhĩm khác nhau lại cĩ mặt trong danh sách nhĩm như minh họa trên Hình
6.8 và 6.9.
94
Hình 6.6 Sơ đồ thuật tốn nhĩm pixel
Trình tự xử lý các pixel gây ra vấn đề này; tuy nhiên cũng dễ giải quyết. Mỗi
nhĩm trong danh sách nhĩm được kiểm tra và nếu chúng cĩ chung các lân cận gần
nhất, chúng được kết hợp lại. Quá trình này lặp cho tới khi các nhĩm phân biệt
được. Quá trình kết hợp các nhĩm pixel cĩ lân cận gần nhất như sau:
Thuật tốn kết hợp nhĩm pixel
1. Tạo một danh sách trống các nhĩm pixel
2. Nhĩm đầu tiên trong danh sách nhĩm ban đầu được thêm vào danh sách
trống.
3. Các nhĩm cịn lại được loại bỏ khỏi danh sách ban đầu và thêm vào danh
sách mới mỗi lần cho tới khi danh sách ban đầu trống. Khi mỗi nhĩm được
95
thêm vào danh sách mới, nĩ được kiểm tra với các nhĩm khác. Nếu nĩ cĩ
chung các lân cận gần nhất với một nhĩm nào đĩ đã ở trong danh sách, nĩ
được kết hợp vào nhĩm này. Khi một nhĩm như vậy được tìm thấy, quy trình
xử lý nhĩm đĩ kết thúc và tiếp tục với nhĩm tiếp theo.
Hình 6.7 Ví dụ về nhĩm pixel
Hình 6.8 Nhĩm nhầm đầu tiên
96
Hình 6.9 Nhĩm phân loại nhầm thứ hai
Khi đã thực hiện, vẫn cịn khả năng các nhĩm trong danh sách mới vẫn cĩ
cùng các lân cận gần nhất. ðiều này cĩ thể xảy ra khi hai nhĩm được thêm vào danh
sách mới, và một nhĩm thứ ba liên kết hai nhĩm ban đầu được thêm vào. Nĩ sẽ
được kết hợp với chỉ một trong hai nhĩm ban đầu. Khả năng này yêu cầu quá trình
xử lý phải được lặp lại cho tới khi số lượng các nhĩm trong danh sách ban đầu
khơng thay đổi. Nghĩa là, khơng nhĩm nào được kết hợp nữa và vì thế khơng cịn
nhĩm nào dùng chung các lân cận gần nhất.
Thuật tốn nhĩm này cĩ thể cần một lượng thời gian tính tốn đáng kể,
nhưng trên thực tế nĩ thực hiện một số ít các bước lặp. Nếu G là số lượng các nhĩm
pixel sau quá trình xử lý ban đầu, mỗi bước kết hợp các nhĩm cần O(G2) bước.
Tổng thể việc kết hợp các nhĩm cĩ thể lên tới O(G3) bước, và mỗi nhĩm cĩ N/G
pixel. ðơn giản hố sao cho mỗi pixel chỉ cần kiểm tra đối với các lân cân ngay
cạnh nĩ, mỗi lần so sánh nhĩm cần N/G bước. Vì thế, trường hợp xấu nhất đối với
thuật tốn kết hợp nhĩm là O(G3) = O((N/G)3) = O(N3). ðiều này cĩ thể khơng
chấp nhận được, nhưng cĩ một số điều kiện làm giảm bớt kết quả này. ðầu tiên, G
thường luơn nhỏ hơn nhiều so với N. Vì G biểu diễn các vùng quan trọng trên ảnh X
quang vú, nĩ thường nhỏ hơn 50 và số lượng pixel trên ảnh X quang vú cĩ thể lên
tới 5 triệu. Khi quét một bức ảnh nào đĩ để tìm khối u, số lượng pixel được xử lý và
số lượng các nhĩm pixel thường nhỏ (thậm chí bằng 0). Hơn nữa trong suốt quá
trình xử lý các nhĩm, khi gặp một nhĩm cĩ cùng các lân cận gần nhất với một nhĩm
khác, bước này kết thúc. Nghĩa là hầu hết các bước trong quy trình khơng yêu cầu
số lượng phép tính cực đại.
97
Nĩi chung, cĩ đặc tính cố hữu trong thuật tốn này, nĩ ngăn chặn trường hợp
xấu nhất. Nếu một bức ảnh chứa nhiều nhĩm nhỏ các pixel, việc kết hợp các nhĩm
sẽ đươ đơn giản hố bởi số lượng nhỏ các pixel trong từng nhĩm. Khi bức ảnh bao
gồm ít nhĩm lớn pixel, số lượng nhỏ các nhĩm thì cần ít phép tính. Bằng cách thiết
kế, việc sử dụng thuật tốn này thường luơn thoả mãn một trong hai điều kiện trên.
Hai ví dụ minh hoạ điều này, ví dụ đầu tiên trên hình 6.10 là một ảnh đầu ra
của thuật tốn phân vùng của chúng ta. Mỗi vùng xám biểu diễn một thành phần
trên ảnh X quang vú. Bằng cách áp dụng thuật tốn nhĩm pixel vừa trình bày, các
vùng khác nhau này được trích rút. Hình 6.11 biểu diễn các ảnh riêng biệt, nền trên
hình 6.10 được loại bỏ.
Hình 6.10 Ảnh được phân vùng
98
Hình 6.11 Các thành phần trên ảnh
Mỗi thành phần trong ví dụ này chứa rất nhiều pixel. Tuy nhiên, chỉ cĩ 4
vùng. Vì thế, bước cuối cùng chỉ yêu cầu O(N) bước. Vì G = 4, bước kết hợp O(G3)
cần 64 so sánh nhĩm. Theo N, mỗi bước so sánh cần N/G bước, nghĩa là N/4. Vì thế
bước so sánh nhĩm tổng thể cần:
64 16 ( )
4
N N O N∗ = ∗ = (6.1)
ðây là hiệu suất của bước đầu tiên trong thuật tốn nhĩm.
Ví dụ thứ hai là ảnh đầu ra từ thuật tốn phát hiện khối u, minh họa trên Hình
6.12. Nĩ chứa 20 nhĩm khác nhau, và các nhĩm này chứa trung bình N/400 pixel.
Vì thế tổng số lần so sánh nhĩm cho ví dụ này cần số lượng bước bằng:
320 20 ( )
400
N N O N∗ = ∗ = (6.2)
ðây cũng là hiệu suất của bước đầu tiên trong thuật tốn nhĩm.
99
Khi các kết quả phát hiện được nhĩm lại thành các nhĩm khác nhau, chúng
được đặt trong các bức ảnh rời rạc và lưu trữ dưới dạng các file. ðây là một phép
tốn đơn giản, nhưng nĩ cho phép so sánh nhanh với bệnh lý.
Trong nghiên cứu này, các phát hiện về khối u được nhĩm lại được so sánh
trực tiếp với bệnh lý của nĩ. Tuy nhiên, ta cĩ thể sử dụng các phát hiện này để trích
rút các dữ liệu từ các ảnh X quang vú ban đầu để xử lý và phân loại sau này. Việc
này làm tăng đáng kể hiệu suất do vùng tổng trong các vùng được phát hệin nhỏ hơn
nhiều so với tồn bộ bức ảnh.
Hình 6.12 Kết quả phát hiện khối u
100
Chương 7 - KẾT LUẬN
7.1 Tổng kết
Luận văn đã trình bày một thuật tốn phân vùng ảnh X quang vú thành các
thành phần nền, mơ vú, cơ ngực và lớp mỡ dưới da, cùng với các ví dụ minh họa và
các kết quả. Thuật tốn phân vùng này đĩng vai trị bước tiền xử lý trong quy trình
kiểm tra ảnh X quang. Nĩ giảm đáng kể số lượng các pixel cần sử dụng trong thuật
tốn kiểm tra. Phưong pháp phân vùng này cho phép từng thành phần được kiểm tra
độc lập với các thành phần khác, nĩ làm giảm sai số và đơn giản hố việc tìm kiếm.
Luận văn cũng đã giới thiệu một phương pháp định vị khối u trên ảnh X
quang vú. Kỹ thuật này sử dụng đối sánh mẫu để xác định các khối cĩ khả năng trên
ảnh và sử dụng phương pháp đa tỷ lệ để giảm số lượng lỗi tích cực sai. Thuật tốn
đối sánh mẫu được đánh giá với một vài mẫu khác nhau. Phương pháp này cũng
được sử dụng với vai trị bước tiền xử lý. Khi cần, nĩ trích rút ra các vùng nghi ngờ
để phân tích về sau. Nĩ tập trung và giới hạn vùng tìm kiếm khối u trên ảnh, làm
giảm thời gian tìm kiếm.
7.2 Phương hướng trong tương lai
Nghiên cứu trong tương lai sẽ chú trọng vào cách thức phân biệt chính xác
giữa các khối u lành tính và ác tính. ðồng thời xây dựng một hệ thống hỗ trợ bác sĩ
trong hoạt động kiểm tra và chẩn đốn hình ảnh ở Bệnh viện K Hà Nội.
101
TÀI LIỆU THAM KHẢO
Tiếng Anh
1. John Terry Sample (2003), Computer assisted screening of digital mammogram
images, University of Southern Mississippi.
2.
3.
4.
5. Ian T.Young, Jan J.Gerbrands, Lucas J. Van Vliet (1998), Fundamentals of
Image Processing, Delf University of Technology.
6. Martin Masek (2004), Hierarchical segmentation of mammograms based on pixel
intensity, The University of Western Australia.
Tiếng Việt
7. Lương Mạnh Bá, Nguyễn Thanh Thuỷ (2003), Nhập mơn xử lý ảnh số, NXB
Khoa học và Kỹ thuật.
8. Bích Thuỷ, Hải Yến (1997), Cẩm nang Vú và bệnh ung thư vú, NXB Y học.
102
XÂY DỰNG CƠ SỞ DỮ LIỆU PHỤC VỤ QUÁ TRÌNH XỬ LÝ ẢNH
X QUANG VÚ TRÊN MÁY TÍNH
TĨM TẮT
Từ khố:
Ảnh X quang vú, phân vùng ảnh, đối sánh mẫu, phát hiện khối u, bệnh ung thư vú.
Bệnh ung thư vú là một căn bệnh rất phổ biến với nữ giới trên thế giới hiện
nay. Ở các nước phát triển, quá trình chẩn đốn ảnh X quang vú được hỗ trợ rất
nhiều từ hệ thống máy tính. Tuy nhiên, ở Việt Nam, cơng việc chẩn đốn vẫn cịn
được thực hiện thủ cơng, phụ thuộc chủ yếu vào kinh nghiệm của các bác sĩ.
Vì vậy, nhu cầu về một hệ thống chẩn đốn dựa trên máy tính với các thuật
tốn xử lý ảnh nhằm hỗ trợ bác sĩ trở nên vơ cùng thiết yếu. Luận văn trình bày về
một bước tiền xử lý với ảnh, bao gồm một thuật tốn phân vùng ảnh X quang vú và
một phương pháp định vị khối u trên ảnh.
Thuật tốn phân vùng ảnh X quang vú dựa trên lược đồ xám của ảnh. Thuật
tốn phân vùng trình bày trong luận văn cĩ ưu thế hơn một số thuật tốn phân vùng
khác do nĩ khơng địi hỏi một bộ dữ liệu đã được học. Phương pháp định vị khối u
trên ảnh sử dụng các mẫu để đối sánh. Các mẫu này được trích từ các ảnh X quang
vú chuẩn, với một số dạng đặc trưng và cĩ thể điều chỉnh đa tỷ lệ để phù hợp với
kích thước thật của khối u.
Cũng từ đĩ xuất hiện nhu cầu về một cơ sở dữ liệu sử dụng được cho các
bệnh viện ở Việt Nam. Vì vậy, một cơ sở dữ liệu bao gồm các ảnh X quang đã được
chẩn đốn đúng được thiết lập. Cơ sở dữ liệu này là cơ sở dữ liệu chuẩn, sử dụng để
thiết lập các mẫu phục vụ cho quá trình xác định khối u trên các ảnh X quang vú thu
thập từ Bệnh viện K Hà Nội.
Các file đính kèm theo tài liệu này:
- Luận văn- Xây dựng cơ sở dữ liệu phục vụ quá trình xử lý ảnh X quang vú trên máy tính.pdf