MỞ ĐẦU
Với sự phát triển vũ bão của Internet, các phương tiện kĩ thuật số như phương tiện lưu trữ, phương tiện truyền thông, kỉ nguyên thông tin số đã được hình thành. Hầu hết thông tin ngày nay được lưu trữ dưới dạng số hoá trước khi trở thành một vật phẩm thông thường như sách báo, tạp chí. Việc trao đổi, phân bố, sao chép và xử lý các sản phẩm số này ngày càng nhanh chóng, đơn giản nằm ngoài tầm kiểm soát của các tổ chức. Và do đó, tình trạng xâm phạm bản quyền, sao chép lậu các sản phẩm kĩ thuật số đã xảy ra ở nhiều nơi. Tháng 3/1998 ở Hồng Kông, chính quyền đã tịch thu một số lượng đĩa CD âm nhạc lậu trị giá 85 triệu đôla, và vào 6/1998, ở Đức cũng đã tịch thu các sản phẩm phần mềm và kĩ thuật số lậu trị giá 1,9 triệu đô la.
Trong năm này, quốc hội Mỹ thông qua dự luật về “Hành động bảo vệ bản quyền kỷ nguyên kĩ thuật số” (Digital Millenium Copyright Act) để bảo vệ quyền sở hữu trí tuệ với các sản phẩm kĩ thuật số. Tất cả các việc đó nói lên sự cần thiết phải có một cách để bảo vệ các sản phẩm kĩ thuật số khỏi các thao tác sao chép, xử lý trái phép và ngăn chặn các hoạt động này xảy ra. Một phương pháp chống sao chép trái phép và bảo vệ bản quyền cho các sản phẩm số – thuỷ vân số (digital watermarking) - đã ra đời trong hoàn cảnh này.
Thuỷ vân số là một phương pháp dùng để bảo vệ các sản phẩm số. Nó có thể được dùng trong các lĩnh vực bảo vệ bản quyền, chống sao chép, phân biệt giả mạo, Các sản phẩm số này có thể là văn bản, audio, video, phần mềm, ảnh, .
Thuỷ vân số là một phương pháp mới dựa trên lý thuyết tổng hợp của nhiều lĩnh vực khác nhau như mật mã học, lý thuyết thông tin, lý thuyết truyền thông và xử lý tín hiệu số, xử lý ảnh. Mục đích của phương pháp này là dấu thêm một lượng thông tin có ích vào sản phẩm số và lượng thông tin này được gọi là thuỷ vân.
Chính vì tính hữu ích trong ứng dụng thực tiễn của thủy vân số nên em quyết định lựa chọn đề tài tiểu luận là: “Nghiên cứu kỹ thuật thủy vân số trong việc bảo vệ bản quyền ảnh số”.
MỤC LỤC
MỤC LỤC 2
MỞ ĐẦU 3
CHƯƠNG I: THUỶ VÂN ẢNH SỐ, PHÂN LOẠI, CÁC ỨNG DỤNG VÀ YÊU CẦU 4
1. Thủy vân 4
2. Phân loại thủy vân 4
3. Các ứng dụng của thuỷ vân với ảnh số 5
4. Yêu cầu đối với phương pháp thuỷ vân số 7
CHƯƠNG II: MÔ HÌNH HỆ THỐNG THUỶ VÂN VÀ MỘT SỐ VẤN ĐỀ LIÊN QUAN 10
1. Các bước chính trong hệ thống thuỷ vân 10
2. Phân loại hệ thống thuỷ vân 13
3. Miền không gian và miền biến đổi 14
4. Hệ thống thị giác người 15
CHƯƠNG III: KẾT QUẢ THỰC NGHIỆM NHÚNG THUỶ VÂN TRONG MIỀN LSB CỦA ẢNH 19
1. Giới thiệu bài toán 19
2. Giải thuật chi tiết 20
3. Kết quả thực hiện 25
KẾT LUẬN 33
PHỤ LỤC 34
TÀI LIỆU THAM KHẢO 35
36 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 4162 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Nghiên cứu kỹ thuật thủy vân số trong việc bảo vệ bản quyền ảnh số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
------ & ------
BÀI TIỂU LUẬN
NGHIÊN CỨU KỸ THUẬT THỦY VÂN SỐ TRONG VIỆC
BẢO VỆ BẢN QUYỀN ẢNH SỐ
HẢI PHÒNG, THÁNG 06/2010
MỤC LỤC
MỞ ĐẦU
Với sự phát triển vũ bão của Internet, các phương tiện kĩ thuật số như phương tiện lưu trữ, phương tiện truyền thông, kỉ nguyên thông tin số đã được hình thành. Hầu hết thông tin ngày nay được lưu trữ dưới dạng số hoá trước khi trở thành một vật phẩm thông thường như sách báo, tạp chí. Việc trao đổi, phân bố, sao chép và xử lý các sản phẩm số này ngày càng nhanh chóng, đơn giản nằm ngoài tầm kiểm soát của các tổ chức. Và do đó, tình trạng xâm phạm bản quyền, sao chép lậu các sản phẩm kĩ thuật số đã xảy ra ở nhiều nơi. Tháng 3/1998 ở Hồng Kông, chính quyền đã tịch thu một số lượng đĩa CD âm nhạc lậu trị giá 85 triệu đôla, và vào 6/1998, ở Đức cũng đã tịch thu các sản phẩm phần mềm và kĩ thuật số lậu trị giá 1,9 triệu đô la.
Trong năm này, quốc hội Mỹ thông qua dự luật về “Hành động bảo vệ bản quyền kỷ nguyên kĩ thuật số” (Digital Millenium Copyright Act) để bảo vệ quyền sở hữu trí tuệ với các sản phẩm kĩ thuật số. Tất cả các việc đó nói lên sự cần thiết phải có một cách để bảo vệ các sản phẩm kĩ thuật số khỏi các thao tác sao chép, xử lý trái phép và ngăn chặn các hoạt động này xảy ra. Một phương pháp chống sao chép trái phép và bảo vệ bản quyền cho các sản phẩm số – thuỷ vân số (digital watermarking) - đã ra đời trong hoàn cảnh này.
Thuỷ vân số là một phương pháp dùng để bảo vệ các sản phẩm số. Nó có thể được dùng trong các lĩnh vực bảo vệ bản quyền, chống sao chép, phân biệt giả mạo, …Các sản phẩm số này có thể là văn bản, audio, video, phần mềm, ảnh,...
Thuỷ vân số là một phương pháp mới dựa trên lý thuyết tổng hợp của nhiều lĩnh vực khác nhau như mật mã học, lý thuyết thông tin, lý thuyết truyền thông và xử lý tín hiệu số, xử lý ảnh. Mục đích của phương pháp này là dấu thêm một lượng thông tin có ích vào sản phẩm số và lượng thông tin này được gọi là thuỷ vân.
Chính vì tính hữu ích trong ứng dụng thực tiễn của thủy vân số nên em quyết định lựa chọn đề tài tiểu luận là: “Nghiên cứu kỹ thuật thủy vân số trong việc bảo vệ bản quyền ảnh số”.
CHƯƠNG I: THUỶ VÂN ẢNH SỐ, PHÂN LOẠI, CÁC ỨNG DỤNG VÀ YÊU CẦU
1. Thủy vân
Thuỷ vân (Watermark): là một thuật ngữ dùng để mô tả việc nhúng một đoạn dữ liệu vào sản phẩm số. Trong đề tài tiểu luận này, sản phẩm số là ảnh số.
2. Phân loại thủy vân
Thủy vân số
Watermark
Thủy vân trong suốt
Invisible Watermark
Thủy vân hữu hình
Visible Watermark
Thủy vân dễ vỡ
Fragile Watermark
Thủy vân bền bững
Robust Watermark
Hình 1: Phân loại thủy vân số
Thủy vân nhúng vào ảnh có thể tồn tại 1 trong 2 dạng: Trong suốt (Invisible) hoặc hữu hình (Visible).
Trong suốt nghĩa là không nhìn thấy thủy vân trong ảnh, kỹ thuật này yêu cầu quan tâm đến tính vô hình trong lược đồ nhúng.
Dựa vào khả năng tồn tại mà thủy vân trong suốt được chia ra làm hai loại: thủy vân dễ vỡ (Fragile watermark) và thủy vân bền vững (Robust watermark).
Thủy vân dễ vỡ (Fragile): là kỹ thuật nhúng thủy vân sao cho khi phân phối sản phẩm trong môi trường mở nếu có bất cứ một sự biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thủy vân đã được giấu trong đối tượng sẽ không còn nguyên vẹn như trước khi giấu nữa. Tức là nó có đặc tính dễ dàng bị vỡ. Các kỹ thuật thủy vân này được sử dụng trong các ứng dụng xác thực thông tin (authentication) và phát hiện xuyên tạc thông tin (tamper detection) bằng cách nhúng vào các check-sum trong các bit LSB - Least Significant Bit. Cái khó của đầu đọc là phân biệt giữa sai lệch thủy vân do xuyên tạc và sai lệch do đường truyền.
Thủy vân bền vững (Robust): là kỹ thuật nhúng thủy vân tồn tại lâu dài với sản phẩm dưới tác động của môi trường. thủy vân bền vững được áp dụng trong các ứng dụng bảo vệ bản quyền, chống việc tẩy xóa, làm giả hoặc biến đổi phá hủy thủy vân.
Thủy vân hữu hình là vẫn nhìn thấy thủy vân trên ảnh tại vị trí nào đó, nhưng không ảnh hưởng nhiều đến tính mỹ thuật của ảnh. Thủy vân này chỉ mang ý nghĩa nhận biết. Thủy vân hữu hình ít được quan tâm hơn so với thủy vân vô hình.
Nếu dựa vào quá trình xác nhận thủy vân, có thể chia thủy vân làm 2 loại là thủy vân cần bản gốc (non-oblivious watermark) và thủy vân không cần bản gốc (oblivious watermark).
3. Các ứng dụng của thuỷ vân với ảnh số
Các ứng dụng của thuỷ vân đối với ảnh số bao gồm các lĩnh vực như bảo vệ bản quyền, xác thực ảnh và bảo toàn dữ liệu, dấu dữ liệu và gán nhãn ảnh, ta sẽ lần lượt đề cập từng ứng dụng.
3.1 Bảo vệ bản quyền
Mục đích của thuỷ vân với bảo vệ bản quyền là gắn một “dấu hiệu” vào dữ liệu ảnh mà có thể xác định được người nắm giữ bản quyền. Và ta cũng có thể gắn thêm một dấu hiệu khác gọi là vân tay để xác định người dùng của sản phẩm. Dấu hiệu có thể là một dãy số như mã hàng hoá quốc tế, một message hoặc một logo… Thuật ngữ thuỷ vân xuất phát từ phương thức đánh dấu giấy tờ với một logo từ thời xa xưa với mục đích tương tự.
(a) Sản phẩm dạng vật lý (b) Sản phẩm dạng số
(c) Tính hợp lệ của sản phẩm (d) Sản phẩm được bảo vệ
Hình 2
Ở các hình 2 trên mô tả quá trình sở hữu trí tuệ giữa người tạo ra sản phẩm và khách hàng. Trong đó:
(a) Bức ảnh được trao đổi thông thường và không thể nhân đôi hoặc xử lý.
(b) Bức ảnh được phân bố dưới dạng số, rất dễ sao chép và trao đổi
(c) Người sở hữu sản phẩm rất khó theo dõi các bản sao chép của sản phẩm số của anh ta.
(d) Thuỷ vân được sử dụng để đảm bảo và ngăn chặn sao chép và phân bố lậu sản phẩm.
3.2 Xác thực ảnh và bảo toàn dữ liệu
Một ứng dụng khác của thuỷ vân là xác thực ảnh và phát hiện giả mạo. Ảnh số ngày càng được sử dụng như các bằng chứng trước pháp luật ngày nay. Vấn đề là cần xác thực được tính hợp pháp của ảnh này. Thuỷ vân được sử dụng ở đây để xác định xem ảnh là nguyên bản hay đã chịu tác động của con người, bằng các ứng dụng xử lý ảnh. Thuỷ vân được dấu lúc đầu phải mang tính chất không bền vững, để bất kỳ sự thay đổi nhỏ nào tới ảnh cũng có thể làm hỏng thuỷ vân hoặc phát hiện được thay đổi đối với thuỷ vân này. Tuy vậy, thuỷ vân vẫn phải tồn tại với các phép biến đổi ảnh thông thường như chuyển đổi định dạng, lấy mẫu, nén…
(a) Bức ảnh số 1 (b) Bức ảnh số 2
Hình 3: Khó có thể đánh giá ảnh nào trong hai ảnh trên là giả mạo
3.3 Dấu dữ liệu và gán nhãn ảnh
Dấu dữ liệu là nhằm trao đổi dữ liệu bí mật thông qua một bức ảnh. Điều này cho phép trao đổi thông tin mà không gây chú ý đối với người ngoài. Khối lượng dữ liệu dấu được là quan trọng nhất đối với mục đích này.
Còn gán nhãn ảnh là ứng dụng dùng để cung cấp thêm thông tin cho người dùng hoặc để phục hồi ảnh từ cơ sở dữ liệu.
4. Yêu cầu đối với phương pháp thuỷ vân số
Tuỳ thuộc vào từng loại thuỷ vân số và ứng dụng của nó mà ta có các yêu cầu khác nhau đối với các phương pháp tạo thuỷ vân. Ở đây chỉ đề cập đến yêu cầu đối với thuỷ vân số ẩn.
Đối với loại thuỷ vân này, ba yêu cầu sau đây là cơ bản và cần thiết đối với các ứng dụng bảo vệ bản quyền.
4.1. Tính ẩn
Thứ nhất, thuỷ vân phải ẩn đối với trực giác của con người (imperceptibility hay perceptual tranperancy), tức là con người phải không nhận biết được sự có mặt của thuỷ vân trong ảnh. Điều này cũng có nghĩa là việc dấu thuỷ vân chỉ gây ra sự thay đổi rất nhỏ đối với ảnh, không ảnh hưởng đến chất lượng ảnh.
4.2. Tính bền vững
Yêu cầu thứ hai là thuỷ vân phải bền vững (robustness), thuỷ vân phải có khả năng tồn tại cao với các tấn công có chủ đích và không có chủ đích. Các tấn công không có chủ đích đối với ảnh số bao gồm như nén ảnh, lấy mẫu, lọc, chuyển đổi A/D và D/A … còn các tấn công có chủ đích có thể là việc xoá, thay đổi hoặc làm nhiễu thuỷ vân trong ảnh. Để thực hiện được điều này, thuỷ vân phải được dấu trong các vùng quan trọng đối với trực giác (perceptual significant). Phương pháp thuỷ vân số phải đảm bảo sao cho việc không thể lấy lại thuỷ vân tương đương với việc ảnh đã bị biến đổi quá nhiều, không còn giá trị về thương mại.
4.3. Khả năng mang tin cao
Với yêu cầu này, lượng tin cần thêm vào ảnh phải đủ dùng trong ứng dụng mà không làm thay đổi quá nhiều chất lượng ảnh.
Tuy vậy, việc làm tốt cả ba yêu cầu trên là một điều rất khó. Để dấu thuỷ vân trong ảnh thì ta bắt buộc phải thay đổi dữ liệu ảnh. Ta có thể tăng tính bền vững cho thuỷ vân bằng cách tăng lượng thay đổi ảnh cho mỗi đơn vị tin cần dấu. Nhưng, nếu thay đổi quá nhiều thì tính ẩn không còn được đảm bảo nữa. Còn nếu thay đổi ảnh quá ít thì các yếu tố dùng để xác định thuỷ vân trong ảnh sau các phép tấn công có thể không đủ để xác định thuỷ vân. Nếu thông tin được dấu quá nhiều thì cũng dễ làm thay đổi chất lượng ảnh, và làm giảm tính bền vững. Vì vậy, lượng thay đổi ảnh lớn nhất có thể chấp nhận và tính bền vững là hai nhân tố quyết định cho khối lượng tin được dấu trong ảnh.
Còn đối với các ứng dụng để phát hiện giả mạo ảnh gốc thì thuỷ vân nhúng vào phải có tính giòn (fragile) nghĩa là sẽ bị vỡ nếu chịu sự biến đổi mất thông tin. Một cách thực hiện điều này mà vẫn đảm bảo tính ẩn của thuỷ vân là dấu nó vào các phần dữ liệu ít đáng chú ý về mặt trực giác (perceptual insignificant). Đối với ảnh, đó có thể là các bít thấp của các điểm ảnh (LSB).
Loại thuỷ vân nửa giòn (semi-fragile) được dùng trong việc phân biệt các loại biến đổi mất thông tin đã được sử dụng: Biến đổi mất thông tin nhưng không thay đổi nội dung và biến đổi mất thông tin gây thay đổi nội dung. Ví dụ, với các ứng dụng xác thực thì cần có loại thuỷ vân phân biệt giữa các biến đổi mất thông tin như nén nhưng vẫn đảm bảo tính nguyên vẹn dữ liệu và biến đổi làm thay đổi tính toàn vẹn dữ liệu như các việc xử lý ảnh có mục đích. Và yêu cầu đối với loại ứng dụng này là phải chỉ ra được vùng ảnh đã chịu các biến đổi đó.
4.4. Ứng dụng trong thực tế
Với các ứng dụng xác thực ảnh, thuỷ vân phải ẩn đối với quan sát của con người và phải bị thay đổi với bất kỳ sự thay đổi có mục đích nào đối với ảnh. Ngoải ra, không thể nhúng thuỷ vân giả vào và cơ chế thuỷ vân phải xác định được vùng ảnh đã bị biến đổi.
Với các ứng dụng bảo vệ bản quyền thì các trường hợp sau có thể xảy ra. Thứ nhất, chủ sở hữu ảnh có thể nhúng một thuỷ vân ẩn, bền vững, tách được nhanh chóng để xác định các sao chép trái phép. Ngoài yêu cầu bền vững, cơ chế thuỷ vân phải là không thể đảo ngược được và bí mật.
Cuối cùng, người sở hữu bản quyền (người bán sản phẩm) có thể muốn biết khách hàng nào đã đưa ra các bản sao dữ liệu trái phép. Kỹ thuật vân tay và theo dõi vòng tròn được sử dụng để xác định không chỉ là người bán mà cả người mua sản phẩm. Để đạt được mục đích này, ta cần đáp ứng một số yêu cầu bổ sung. Ví dụ là ta phải có khả năng tạo ra nhiều thuỷ vân khác nhau và việc nhúng nhiều thuỷ vân phải được xử lý cẩn thận.
Với các ứng dụng dấu tin và gán nhãn ảnh, lượng tin cực đại nhúng được là điều quan trọng nhất. Ứng dụng gán nhãn ảnh yêu cầu cao tính địa phương hoá việc nhúng thuỷ vân, loại bỏ các phương pháp thao tác trên toàn bộ ảnh.
Lượng tin hay số lượng bit mà có thể nhúng một cách chắc chắn trong dữ liệu ảnh bị giới hạn một cách rõ rệt. Với các ứng dụng bảo vệ bản quyền mà liên quan đến việc xác thực chủ sở hữu cũng như xác thực sự đăng ký của ảnh, một số giới hạn các cận dưới đã được đưa như theo Piva (300 bit) hoặc Kutter (64 bit).
CHƯƠNG II: MÔ HÌNH HỆ THỐNG THUỶ VÂN VÀ MỘT SỐ VẤN ĐỀ LIÊN QUAN
Chương này giới thiệu mô hình hệ thống thuỷ vân và một số kiến thức cơ sở liên quan và cần thiết cho việc tạo thuỷ vân có tính bền vững cao. Các bước chính trong hệ thống thuỷ vân được đề cập chi tiết trong phần đầu của chương. Tiếp theo là sự phân loại các hệ thống thuỷ vân, định nghĩa về các miền biến đổi và cuối cùng là một số đặc điểm về hệ thống thị giác người và tầm quan trọng của chúng trong việc thiết kế các kĩ thuật thuỷ vân.
1. Các bước chính trong hệ thống thuỷ vân
Hình 4: Mô hình hệ thống thuỷ vân ảnh số
Trên đây là mô hình hệ thống thuỷ vân đối với ảnh số. Quá trình liên quan đến xử lý thuỷ vân gồm 4 bước chính mà ta có thể mô tả như sau:
1.1. Tạo thuỷ vân
Thuỷ vân có thể là một logo hoặc một dãy nhị phân với độ dài cho trước. Có nhiều thuật toán sử dụng thuỷ vân được sinh ra từ phân bố Gauss như của Marco Corvi và Gianuca Niochinotti, Rakesh Dugad, … hoặc logo. Thuỷ vân có thể được biến đổi trước khi đem dấu vào ảnh bằng cách mã hoá, hoặc chuyển đổi định dạng. Các thuật toán nhúng thuỷ vân là một logo được gọi là thuật toán thuỷ vân hợp nhất ảnh (image-fusion). Thuỷ vân là một logo có một lợi ích rõ ràng là dễ dàng nhận biết về mặt trực giác và đưa ra một chứng minh đúng đắn về quyền sở hữu ảnh. Bình thường sẽ có một khoá bí mật K dùng để mã hoá dữ liệu trước khi nhúng.
1.2. Nhúng thuỷ vân
Thuỷ vân có thể được nhúng trực tiếp vào ảnh hoặc vào dạng biến đổi của nó. Đối với các ứng dụng bảo vệ bản quyền thì việc nhúng thuỷ vân vào dạng biến đổi của ảnh là điều cần thiết để đảm bảo tính bền vững của thuỷ vân trước các biến đổi như nén ảnh. Các biến đổi là các thuật toán biến đổi ảnh của xử lý ảnh như biến đổi Fourier rời rạc (DFT – Discrete Fourier Transform), biến đổi cosine rời rạc (DCT – Discrete Cosine Transform), và biến đổi sóng rời rạc (Discrete Wavelet Tranform)… Ngoài ra, còn một số biến đổi khác như biến đổi Haar, Hardamard, CWT ,… Thông tin về các biến đổi này có thể tham khảo trong các sách về xử lý ảnh. Biến đổi hay được sử dụng nhất là biến đổi DCT vì biến đổi này là bước tiền xử lý quan trọng của nén JPEG, loại nén thông dụng nhất hiện nay. Gần đây, chuẩn nén mới JPEG2000 được sử dụng và phép biển đổi DWT liên quan đến chuẩn nén này cũng đã được ứng dụng vào quá trình nhúng thuỷ vân vào ảnh số.
Để đảm bảo sự thay đổi ít nhất về chất lượng ảnh, thuỷ vân nên được nhúng vào thành phần tần số giữa của ảnh sau khi biến đổi ảnh. Đó là vì các thành phần tần số thấp rất nhạy cảm đối với các thay đổi và vì vậy sẽ tạo ra sự biến đổi đáng kể chất lượng ảnh còn thành phần tần số cao thường bị loại trong quá trình nén ảnh mà không làm giảm chất lượng ảnh, do đó thuỷ vân sẽ dễ dàng bị
mất.
Để tăng cường chất lượng ảnh hơn nữa, mô hình hệ thống thị giác người (HVS – Human Visual System Model) cũng được áp dụng trong quá trình nhúng thuỷ vân. Nếu phép biến đổi ảnh có nhiều tính chất giống mô hình thị giác người thì ta có thể dấu thêm nhiều tin mà không gây ra sự nhận biết. Một số đặc điểm quan trọng của hệ thống thị giác người được nêu vắn tắt ở dưới đây và sẽ được mô tả rõ hơn ở phần 4.
Tương phản: Mắt người nhạy cảm với sự có mặt của một tín hiệu trong một tín hiệu khác.
Tần số: mắt người đặc biệt nhạy cảm với tần số thấp.
Độ chói: Sự thay đổi đối với các giá trị độ chói cao hay thấp rất dễ nhận biết.
Vùng góc cạnh hoặc có cấu trúc: hệ thống thị giác ít nhận thấy sự biến đổi trên các vùng này hơn là các vùng nhẵn, phẳng.
Ta có thể kết hợp các tính chất trên để tạo ra mặt nạ trực giác dùng để xác đinh khối lượng thay đổi cho phép cho mỗi vùng dữ liệu ảnh. Điều này làm tăng tính bền vững và khối lượng tin được nhúng.
1.3. Tách thuỷ vân
Để tách thuỷ vân ra khỏi ảnh, ta sẽ dùng khoá K trong quá trình nhúng, và ảnh cần tách thuỷ vân. Thuật toán tách thuỷ vân có các bước ngược với thuật toán nhúng ở trên.
1.4. Phát hiện thuỷ vân và giải mã
Đối với thuỷ vân là một logo thì sau khi giải mã, việc xác định thuỷ vân có tồn tại hay không là đơn giản. Còn nếu thuỷ vân là một dãy số có phân bố Gauss thì có thể dựa vào kiểu tương quan, kiểu phân bố của dãy số thu được để đánh giá sự tồn tại thuỷ vân.
Đối với ứng dụng nhằm xác thực ảnh thì cần phải xác định xem là có thuỷ vân hay không. Điều này dẫn đến mô hình kiểm chứng giả thiết và hiệu quả của hệ thống thuỷ vân có thể được đánh giá theo thuật ngữ lỗi loại I và lỗi loại II. Lỗi loại I ứng với trường hợp thuỷ vân được tìm thấy mặc dù nó không tồn tại. Còn lỗi loại II ứng với trường hợp thuỷ vân tồn tại nhưng không tìm thấy.
Ta có thể dùng một số tiêu chuẩn sau để làm phép đo cho sự thành công của việc tách thuỷ vân.
Tỉ số của tín hiệu nhọn đối với nhiễu - PSNR (Peak Signal to Noise Ratio)
Với MSE là sai số bình phương trung bình (mean-square error). Với ảnh kích thước MxN thì MSE được định nghĩa như sau:
Với X(i,j) và XW(i,j) là các giá trị của điểm ảnh (i,j) trong ảnh ban đầu và ảnh đã được thuỷ vân tương ứng.
Một giá trị khác hay được sử dụng đó là hệ số tương quan chuẩn – NC (Normarlized Correlation), được định nghĩa như sau
Câu trả lời về sự tồn tại của thuỷ vân có thể được xác định bằng một ngưỡng thích hợp t, nếu NC>t thì là tìm thấy thuỷ vân ngược lại là thủy vân không tìm thấy trong ảnh.
Các ứng dụng gán nhãn ảnh hoặc dấu dữ liệu thường cố gắng trả về nguyên vẹn thông tin (thuỷ vân) được nhúng ban đầu. Vì thông tin có thể bị sai lệnh nên người ta thường sử dụng các loại mã sửa sai với các ứng dụng này.
Cơ chế thuỷ vân cho các ứng dụng xác thực ảnh hoặc bảo toàn dữ liệu thì đưa ra câu trả lời có/không về việc ảnh có bị giả mạo, đưa ra xác định về nguồn dữ liệu hợp pháp hoặc chỉ ra các vùng dữ liệu đã bị thay đổi.
2. Phân loại hệ thống thuỷ vân
Quan hệ giữa mã hoá và thuỷ vân số xuất phát từ sự chia sẻ thuật ngữ chung: Hệ thống mã hoá cá nhân và mã hoá công khai với hệ thống thuỷ vân cá nhân và hệ thống thuỷ vân công khai. Trong hệ thống mã hoá cá nhân, một khoá được dùng chung cho cả việc mã hoá và giải mã còn trong hệ thống mã hoá công khai, khoá để mã hoá và giải mã là khác nhau.
2.1. Hệ thống thuỷ vân công khai
Trong hệ thống này, một đối tượng được thuỷ vân hoá với một khoá cá nhân nhưng sự tồn tại của thuỷ vân có thể kiểm tra bằng cách sử dụng khoá công khai. Tất nhiên là sự tính toán để dò tìm khoá cá nhân là không thể thực hiện được, mặc dù đã biết khoá công khai và thuật toán dùng trong hệ thống thuỷ vân. Khoá công khai chỉ cho phép đọc thuỷ vân nhưng không cho phép xoá thuỷ vân. Hệ thống thuỷ vân công khai thường không đòi hỏi ảnh gốc phải có mặt trong quá trình dò tìm và tách thuỷ vân.
Hệ thống khoá công khai phải cho phép thuỷ vân có thể được xác nhận một cách an toàn bởi một tổ chức thứ ba. Nhưng cho đến nay, chưa một hệ thống thuỷ vân công khai nào tồn tại vì cách tiếp cận hiện thời không chịu được các thiết bị tấn công dò tìm công khai được mô tả bởi Kalker và Linartz.
Hệ thống thuỷ vân không đối xứng là một dạng khác của hệ thống thuỷ vân công khai. Hệ thống này không sử dụng ảnh gốc và dùng một tham số khác với tham số được dùng trong quá trình nhúng. Hai thuật ngữ trên được dùng trong một văn cảnh. Còn nếu để thấy sự khác biệt thì đối với hệ thống thủy vân không đối xứng thì khoá để tách thuỷ vân khác với khoá dùng đề nhúng thuỷ vân, còn với hệ thống thuỷ vân công khai thì khoá tách thuỷ vân được công khai. Điều này cho phép mọi người, kể cả các kẻ tấn công, có thể biết được thuỷ vân.
Thiết bị tấn công dò tìm công khai được của Kalker và Linnartz không làm việc trên các hệ thống thuỷ vân không đối xứng.
2.2. Hệ thống thuỷ vân cá nhân
Hệ thống thuỷ vân cổ điển sử dụng khoá cá nhân, đối xứng hầu như luôn cho phép xoá hoặc thêm thuỷ vân giả. Do đó việc đảm bảo lưu giữ bí mật khoá dùng trong phép nhúng là điều rất cần thiết.
3. Miền không gian và miền biến đổi
3.1 Miền không gian
Miền không gian (spatial domain) là miền dữ liệu ảnh ban đầu. Miền này chỉ thích hợp cho các ứng dụng dấu tin vì yêu cầu về tính bền vững của thuỷ vân (tin được dấu) là không quan trọng.
Hình 5: Chia ảnh thành các khối để thực hiện biến đổi
3.2. Miền biến đổi
Miền biến đổi (transform domain) hay còn được gọi là miền tần số (frequency domain) là miền nhận được sau khi đã biến đổi miền dữ liệu ảnh. Ảnh sẽ được thực hiện một phép biến đổi toán học và sau đó thuỷ vân sẽ được dấu vào miền này. Sau đó, thực hiện phép biến đổi ngược lên miền biến đổi để nhận được ảnh sau khi đã dấu thuỷ vân.
Miền biến đổi có thể nhận được sau các phép biến đổi tuyến tính hai chiều hoặc biến đổi phi tuyến hai chiều, đó có thể là DFT, DCT, DWT, Haar, CWT … Ta có thể thực hiện một phép biến đổi duy nhất trên cả ảnh hoặc chia ảnh ra làm các khối không giao nhau và thực hiện biến đổi trên các khối này (hình 2.2).
4. Hệ thống thị giác người
Sự hiểu biết về hệ thống thị giác người sẽ góp một phần không nhỏ trong việc cải tiến và nâng cấp các thuật toán về thuỷ vân số.
Võng mạc của mặt chia tín hiệu nhận được thành các thành phần khác nhau và mỗi thành phần kích thích não thông qua các kênh khác nhau. Mỗi thành phần có các đặc tính sau:
Vị trí về không gian trong ảnh.
Tần số của ảnh.
Hướng của tín hiệu (dọc, ngang và chéo).
Dựa vào các kiến thức về mắt người và hệ thống thị giác người, một biến đổi giả thiết Cortex đã được đưa ra để mô hình các tính chất đã biết. Khi hai tín hiệu có cùng các đặc tính thành phần thì chúng cùng kích thích một kênh trong vỏ não nhưng lại phụ thuộc vào hiệu ứng mặt nạ ảnh. Mặt nạ ảnh được xây dựng từ các tín hiệu mạnh lấy từ các tín hiệu có cùng đặc tính. Ta nhắc lại một số hiệu ứng của HVS mà đã được mô tả ở trên.
Mặt nạ tương phản: Khả năng dò tìm một tín hiệu trong biểu diễn một tín hiệu khác. Kết quả là tốt nhất khi hai tín hiệu cùng một tần số, hướng và vị trí.
Nhạy cảm về tần số: Mắt người nhạy cảm với các sóng hình sin với các tần số khác nhau. Sự nhạy cảm này chỉ phụ thuộc vào chức năng truyền sự điều biên của mắt và không phụ thuộc vào dữ liệu ảnh.
Nhạy cảm về độ chói: Ngưỡng dò tìm một nhiễu trên một nền nhận giá trị bất biến. Đối với mắt người thì đó là một hàm không tuyến tính và phụ thuộc vào các đặc tính địa phương của ảnh.
Ngưỡng JND (just –noticeable-difference): Ngưỡng mà sự thay đổi hệ số nhỏ hơn ngưỡng này sẽ hầu như không nhận biết được.
Do đó, mô hình thị giác trong miền tần số có thể được thực hiện như sau:
Áp dụng lọc băng thông cho ảnh gốc để lấy năng lượng của ảnh có trong mỗi thành phần không gian và tần số.
Chia năng lượng của thuỷ vân để dấu vào các thành phần sao cho sự biến đổi nằm trong ngưỡng cho phép.
Để hiểu rõ hơn các hiệu ứng trên, ta cần có một mô hình về xử lý thông tin và biểu diễn thị giác trong bộ não. Khi đó, các kiến thức này có thể cải tiến chất lượng của cơ chế dấu thuỷ vân một cách đáng kể.
4.1. Nhạy cảm về sự tương phản
Nhạy cảm về sự tương phản hay nhạy cảm về mật độ mô tả tính thấy được của nhiễu trên ảnh gốc. Giả sử, mắt người đã quen với độ chói Io của nền, mục đích là tìm lượng khác biệt nhỏ nhất DI giữa điểm ở tâm và các điểm xung quanh để mắt người có thể phân biệt được. Sự khác biệt này thường được gọi là sự khác biệt nhỏ nhất có thể thấy được (JND) (hình 2.4.1).
JND
Hình 6: Test dùng để xác định ngưỡng biến đổi bé nhất mà con người cảm nhận được đối với các các độ chói I khác nhau.
Hình 7: Hàm biểu diễn sự nhạy cảm về tương phản trong hình 6
Hình 7 chỉ ra mối quan hệ giữa mật độ bao quanh I và tỉ lệ tương phản nhỏ nhất tương ứng . Với miền độ chói giữa, tỉ lệ tương phản xấp xỉ là hằng số, còn với các độ chói cao và độ chói thấp, sự tương phản tăng lên, có nghĩa là JND lớn. Điều này có nghĩa là sự nhạy cảm về sự biến đổi độ chói giảm nhanh với các độ chói cao và độ chói thấp.
Hình 8: Hiệu ứng dải băng Mach, mặc dù mỗi bước đều có cùng độ chói nhưng chúng ta cảm thấy độ chói là thấp bên trái và sáng dần về bên phải trong cùng một bước.
4.2. Nhạy cảm về tần số
Không gian tần số cũng có ảnh hưởng đáng chú ý về sự nhạy cảm về mắt người. Mắt người rất nhạy cảm với các nhiễu ở tần số thấp, và không nhạy cảm với các nhiễu ở tần số cao. Phản ứng của mắt người với các tần số là không đồng nhất mà ta có thể nhận thấy qua nhiều hiện tượng, ví dụ như quá nhạy cảm với các vùng đối lập cao và đặc biệt là tại các cạnh. Một hiện tượng được gọi là “hiệu ứng dải băng Mach” được chỉ ra trong hình 8. Mặc dù mỗi bước đều có cùng độ chói nhưng chúng ta cảm thấy độ chói là thấp ở bên trái và sáng dần về bên phải trong cùng một bước.
4.3. Mặt nạ
Mặt nạ thị giác là hiện tượng trực giác mà khung của ảnh bị che bởi ảnh. Ảnh được coi là tín hiệu nền mà làm giảm khả năng nhìn thấy khung của ảnh. Với một ảnh bị biến đổi bởi nhiễu cộng, chúng ta có thể thấy rằng nhiễu dễ dàng nhìn thấy ở vùng bằng phằng, không gồ ghề hơn là các vùng góc cạnh, có cấu trúc.
4.4. Kết luận
Các kết luận sau được Kutter rút ra từ các kiến thức về hệ thống thị giác người có ích đối với thuỷ vân số:
Tần số cao ít được thấy hơn các tần số thấp.
Nghiên cứu về thị giác của bộ não chỉ ra đặc tính về đa độ phân giải của hệ thống thị giác.
Để việc nhúng thuỷ vân được tốt, sự biến đổi phải nằm trong ngưỡng cho phép, nghĩa là nhỏ hơn JND.
Sự phân bố của các que hình nón màu xanh ít dày đặc hơn so với sự phân bố các que màu đỏ và màu xanh trong mắt người. Vì vậy, nên dấu nhiều nhất thuỷ vân vào các thành phần màu xanh da trời.
CHƯƠNG III: KẾT QUẢ THỰC NGHIỆM NHÚNG THUỶ VÂN TRONG MIỀN LSB CỦA ẢNH
Bit LSB là bit có ảnh hưởng ít nhất tới việc quyết định tới màu sắc của mỗi điểm ảnh, vì vậy khi ta thay đổi bit ít quan trọng của một điểm ảnh thì màu sắc của mỗi điểm ảnh mới sẽ tương đối gần với điểm ảnh cũ.
Ở phía dưới, em xin trình bày bài toán nhúng thủy vân trong miền LSB của một ảnh. Dữ liệu nhúng có thể là một đoạn văn bản, một hình ảnh,…
1. Giới thiệu bài toán
a) Xét bài toán có:
- Input: + Một File ảnh màu gốc
+ Thông điệp cần giấu (S) là: một chuỗi đoạn ký tự hoặc một ảnh
- Output: + Một File ảnh đã giấu tin S.
b) Ý tưởng:
- Tách ra các bit ít quan trọng LSB của mỗi điểm ảnh, sau đó ta sẽ giấu thông điệp tại mỗi bit không quan trọng đó
c) Các bước thực hiện giấu thông điệp:
- Chuyển thông điệp cần giấu S sang dạng nhị phân.
- Đọc dữ liệu của ảnh (sử dụng kỹ thuật Lockbits để tăng tốc độ xử lý).
- Tại mỗi điểm ảnh, xét thành phần Blue (thành phần mắt người khó có thể phân biệt nhất), và nhúng bit thông điệp cần giấu vào. Cụ thể:
+ Biến đổi giá trị của Blue của điểm ảnh sang dạng nhị phân 8 bít (B) và tính tổng số bít 1 (T)
+ Thực hiện nhúng dữ liệu cần giấu:
Nhúng bít 1:
* Khi T=1, ta không thay đổi giá trị bít cuối cùng của B;
* Khi T=0, ta đổi bít cuối của B (nếu đang là 1 thì chuyển thành 0 và ngược lại)
Nhúng bít 0:
* Khi T=1, ta đổi bít cuối của B (nếu đang là 1 thì chuyển thành 0 và ngược lại)
* Khi T=0, ta không thay đổi giá trị bít cuối cùng của B;
+ Trả lại giá trị mới cho thành phần Blue của điểm ảnh đang xét.
- Quá trình được thực hiện cho đến khi giấu hết các bit thông điệp vào trong ảnh.
- Như vậy ta đảm bảo được khi xét đến mỗi thành phần Blue của một điểm ảnh đã biến đổi. Nếu:
+ Tổng số bít 1 là chẵn à bít ta giấu là 0
+ Tổng số bít 1 là lẻ à bít ta giấu là 1
d) Các bước lấy lại thông điệp:
- Xét thành phần Blue của những điểm ảnh đã thực hiện biến đổi theo trình tự đã giấu. Căn cứ theo quy tắc:
+ Nếu tổng số bít 1 là chẵn à tức bít ta giấu là 0
+ Nếu tổng số bít 1 là lẻ à tức bít ta giấu là 1
- Lưu các giá trị đó lại ta sẽ tách ra được thông điệp đã giấu.
2. Giải thuật chi tiết
Chuyển dữ liệu cần giấu sang dạng nhị phân:
- Dữ liệu TEXT à NHỊ PHÂN
- Dữ liệu HÌNH ẢNH à NHỊ PHÂN
Nạp ảnh GÔC:
Nhúng DỮ LIỆU NHỊ PHÂN vào ẢNH GỐC
Hàm đọc dữ liệu nhúng trong ẢNH
- Dữ liệu VĂN BẢN
- Dữ liệu HÌNH ẢNH
3. Kết quả thực hiện
3.1 Giao diện và chức năng của chương trình:
Hình 9: Giao diện chính của chương trình
Hình 10: Các chức năng chính của chương trình
3.2 Thử nghiệm THỦY VÂN là dữ liệu VĂN BẢN:
Hình 11: Ảnh GỐC
Hình 12: Nội dung THỦY VÂN dạng VĂN BẢN
Hình 13: Ảnh sau khi nhúng THỦY VÂN dạng VĂN BẢN
Hình 14: Kết quả sau khi GIẢI MÃ
Hình 15: Ảnh sau khi nhúng THỦY VÂN dạng VĂN BẢN bị VẼ ngẫu nhiên
Hình 16: Kết quả sau khi GIẢI MÃ
Hình 17: Ảnh sau khi nhúng THỦY VÂN dạng VĂN BẢN bị VẼ ngẫu nhiên nhiều hơn
Hình 18: Kết quả sau khi GIẢI MÃ
Hình 19: Ảnh sau khi nhúng THỦY VÂN dạng VĂN BẢN bị CẮT ngẫu nhiên
Hình 20: Kết quả sau khi GIẢI MÃ
Hình 21: Ảnh sau khi nhúng THỦY VÂN dạng VĂN BẢN bị CẮT ngẫu nhiên nhiều hơn
Hình 22: Kết quả sau khi GIẢI MÃ
3.3 Thử nghiệm THỦY VÂN là dữ liệu HÌNH ẢNH:
Hình 23: Ảnh GỐC
Hình 24: Nội dung THỦY VÂN dạng HÌNH ẢNH
Hình 25: Ảnh sau khi nhúng THỦY VÂN dạng HÌNH ẢNH
Hình 26: Kết quả sau khi GIẢI MÃ
Hình 27: Ảnh sau khi nhúng THỦY VÂN dạng HÌNH ẢNH bị VẼ ngẫu nhiên
Hình 28: Kết quả sau khi GIẢI MÃ
Hình 29: Ảnh sau khi nhúng THỦY VÂN dạng HÌNH ẢNH bị CẮT ngẫu nhiên
Hình 30: Kết quả sau khi GIẢI MÃ
Nhận xét: Thủy vân dạng ảnh có khả năng chống chịu lại các phép xử lý tốt hơn nhiều hơn so với thủy vân dạng ký tự. Do tính chất bền vững được đảm bảo hơn nên thủy vân dạng ảnh được sử dụng nhiều hơn.
KẾT LUẬN
Sau một thời gian nghiên cứu và thực tế bắt tay xây dựng đề tài tiểu luận. Hệ thống do em thực hiện đã đạt được những yêu cầu:
Nhúng được dữ liệu của một đoạn văn hoặc một hình ảnh vào trong ảnh gốc. Tương ứng với mỗi lần thực hiện thủy ký lên đối tượng gốc, đều đưa ra một khóa giải mã.
Với một ảnh bất kỳ đã nhúng thủy ký của chương trình (nhúng văn bản hoặc hình ảnh). Hệ thống tách được ra dữ liệu nhúng phù hợp.
Kết quả của ảnh gốc và ảnh đã nhúng thủy ký gần như không có sự khác biệt nào đáng chú ý.
Giao diện chương trình thân thiện, dễ sử dụng.
Trong thời gian tới, em sẽ tiếp tục hoàn thiện đề tài hơn nữa nhằm mục tiêu hướng đến việc triển khai sử dụng trong thực tế.
Cuối cùng, em xin chân thành cảm ơn thày PGS TS. Trịnh Nhật Tiến đã tận tình hướng dẫn, giúp đỡ em hoàn thành tốt nhiệm vụ học tập và thực hiện tốt đề tài tiểu luận này.
PHỤ LỤC
Watermark: Thủy vân số, Thủy ký, Thủy ấn.
DCT: Discrete Cosine Transform - Biến đổi cosi rời rạc.
FFT: Fast Fourier Transform - Biến đổi Fourier nhanh.
HVS: Human Vision System - Hệ thống quan sát của con người.
HAS: Human Auditory System - Hệ thống nghe của con người.
Checksum: Mã kiểm tra.
LSB: Least Significant Bit - Bít ít quan trọng nhất.
TÀI LIỆU THAM KHẢO
Nguyễn Xuân Huy, Trần Quốc Dũng, Một Số Kỹ Thuật Giấu Tin Và Thủy Ấn Trong Ảnh, 2003.