Tóm tắt Luận án Nghiên cứu phương pháp xử lý ảnh trong phát hiện, bám một số chủng loại mục tiêu và áp dụng trong điều khiển vũ khí tự động

Để biểu diễn một vùng ảnh hình chữ nhật B có kích thước mxn, chúng tôi sử dụng hai đặc trưng ảnh: đặc trưng màu và đặc trưng hướng cạnh (HoG – Histogram of Oriented Gradient). - Đặc trưng màu của vùng ảnh B là vector hc có kích thước 1 3  K được kết hợp bởi 3 lược đồ (histogram) h1, h2, h3 của các thành phần màu (R, G, B) ở các vị trí điểm ảnh trong vùng ảnh B như công thức (3.7), K là kích thước của các vector h1, h2, h3. h h h h c    1 2 3 (3.7) - Đặc trưng hướng cạnh h của vùng ảnh B là lược đồ hướng (HoG) của các điểm ảnh cạnh trong vùng ảnh B. Các đặc trưng mẫu (templates) của mục tiêu được tính là một tập các đặc trưng màu hc và đặc trưng hướng cạnh h cho các vùng ảnh bao mục tiêu được ác định trong các khung ảnh trước (các khung ảnh thứ j T-1). Đối với khung ảnh mới thứ t, các đặc trưng hc và h được tính cho các vùng ảnh B có tâm là các vị trí POI ành được trong Phần 3.2.2.2

27 trang | Chia sẻ: tueminh09 | Lượt xem: 751 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Nghiên cứu phương pháp xử lý ảnh trong phát hiện, bám một số chủng loại mục tiêu và áp dụng trong điều khiển vũ khí tự động, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

quân sự Luận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp Viện họp tại Viện KH&CNQS Vào hồi giờ ngày tháng năm 2017 Có thể tìm hiểu luận án tại thư viện: - Thư viện Viện Khoa học và Công nghệ quân sự - Thư viện Quốc gia Việt Nam 1 MỞ ĐẦU Phân hệ tự động trinh sát phát hiện mục tiêu là một thành phần then chốt trong các hệ thống vũ khí công nghệ cao. Nó góp phần tăng cường đáng kể hiệu quả hoạt động của các hệ thống vũ khí, và giảm thiểu sự tham gia trực tiếp của con người, đặc biệt trong các môi trường khắc nghiệt. Việc nghiên cứu và xây dựng phân hệ trinh sát phát hiện tự động mục tiêu có vai trò quan trọng trong việc nâng cấp, cải tiến các hệ thống vũ khí thế hệ cũ, là cơ sở phát triển các hệ thống vũ khí thế hệ mới. Luận án “Nghiên cứu phương pháp xử lý ảnh trong phát hiện, bám một số chủng loại mục tiêu và áp dụng trong điều khiển vũ khí tự động” nhằm đáp ứng nhu cầu thực tiễn này của quân đội ta.  Mục tiêu chính của luận án là nghi n cứu â ựng hệ thống tự động phát hiện và ám các mục tiêu quân sự ( e tăng, e cơ giới) sử dụng công nghệ xử lý ảnh và các thuật toán nhận dạng, phục vụ cho việc điều khiển vũ khí khí tài, tự động tiêu diệt mục tiêu.  Đối tượng nghiên cứu chính là hệ thống trinh sát phát hiện mục tiêu của các hệ thống vũ khí. Các hệ thống vũ khí nà có mục tiêu cần tiêu diệt là các đối tượng quân sự mặt đất như e tăng và các loại e cơ giới.  Phạm vi nghiên cứu của luận án tập trung giải quyết các câu hỏi nghiên cứu như sau: - Các đối tượng mục ti u của các loại vũ khí là gì? Chúng có đặc trưng gì nổi ật so với các đối tượng nền trong ảnh? - Làm thế nào để phát hiện và nhận ạng tự động mục ti u trong ảnh ưới các điều kiện tạo ảnh khác nhau? - Làm thế nào để ám chính ác mục ti u được phát hiện, với thời gian thực?  Ý nghĩa khoa học của luận án: - Đề xuất một giải pháp xây dựng hệ thống trinh sát phát hiện mục tiêu cho các hệ thống vũ khí, sử dụng công nghệ xử lý ảnh và các thuật toán nhận dạng thông minh. - Đề xuất một giải pháp mới, phát hiện tự động các mục tiêu quân sự trong chuỗi khung ảnh video. - Đề xuất một giải pháp mới, bám tự động mục tiêu quân sự trong chuỗi khung ảnh video.  Ý nghĩa thực tiễn: - Kết quả của luận án là cơ sở lý thuyết quan trọng để xây dựng các hệ thống trinh sát phát hiện và bám các mục tiêu quân sự: phục vụ cho nhu cầu cải tiến, nâng cấp các hệ thống vũ khí thế hệ cũ và phát triển các hệ thống vũ khí công nghệ cao. - Luận án cũng là một giải pháp phục vụ cho việc thay thế phân hệ trinh sát phát hiện mục tiêu trong các hệ thống vũ khí công nghệ cao. 2 Chương 1: TỔNG QUAN VỀ PHÁT HIỆN VÀ BÁM MỤC TIÊU TỪ CHUỖI ẢNH Chương nà trình à tổng quan về phát hiện, bám mục tiêu trong chuỗi ảnh video, hướng tiếp cận giải quyết bài toán phát hiện và bám các mục tiêu quân sự trong chuỗi ảnh video. 1.1. Phát hiện mục tiêu từ chuỗi ảnh 1.1.1. Bài toán phát hiện mục tiêu Bài toán phát hiện mục ti u có đầu vào là các khung ảnh được thu thập từ camera, đầu ra là các vùng ảnh chứa mục tiêu nằm trong các khung ảnh đầu vào. Trong hệ thống tự động dò bám theo mục tiêu, phát hiện mục tiêu là bài toán đầu tiên cần phải giải quyết. Nó được em như là ước đầu tiên của tiến trình bám theo mục tiêu. Xác định mục tiêu Xây dựng mô hình toán biểu diễn mục tiêu qua các đặc trưng ảnh Tập ảnh học Trích chọn đặc trưng ảnh Trích chọn đặc trưng ảnh Ảnh đầu vào Mục tiêu trong ảnh Hình 1.1. Sơ đồ khối các bước thực hiện trong phát hiện mục tiêu. Tr n cơ sở nghiên cứu các phương pháp phát hiện mục tiêu đã được công bố. Để ác định mục tiêu trong các ảnh đầu vào, mỗi phương pháp nà đều gồm hai pha thực hiện như trong Hình 1.1: Pha 1: Xác định mô hình toán học biểu diễn mục tiêu. Pha nà được thực hiện trên tập ảnh mẫu (tập ảnh học) để xây dựng mô hình toán biểu diễn đối tượng bằng các đặc trưng ảnh. Pha 2: Tìm mục tiêu trong ảnh đầu vào. Pha này thực hiện việc dò tìm các vùng ảnh mục tiêu trên các ảnh đầu vào bằng cách sử dụng mô hình toán biểu diễn đối tượng được ác định trong Pha 1. Phần ưới đâ chúng tôi sẽ trình bày chi tiết về các loại đặc trưng ảnh, các phương pháp phát hiện mục tiêu với các mô hình toán khác nhau. 1.1.2. Các đặc trưng ảnh Phần nà trình à các kiểu đặc trưng ảnh thường được sử ụng để iểu iễn đối tượng trong phát hiện mục ti u tự động. Có ba loại đặc trưng chính: 1.1.2.1. Đặc trưng màu sắc: Đặc trưng màu là một trong những đặc trưng quan trọng để mô tả đặc tính bề ngoài của mục tiêu. Đặc trưng màu của một điểm ảnh P là một vector f = ( f1, f2, ,fn ), trong đó fi là giá trị một thành phần màu i ở vị trí P trong một không gian màu nhất định hoặc trong nhiều không gian màu khác nhau. Đối 3 với một vùng ảnh R, đặc trưng màu được sử dụng phổ biến để biểu diễn R trong phát hiện mục tiêu là lược đồ màu (Color Histogram). 1.1.2.2. Đặc trưng kết cấu Đặc trưng kết cấu (Texture) biểu thị mối quan hệ của một nhóm điểm ảnh lân cận nhau (một điểm ảnh với các điểm ảnh lân cận nó), nó phản ánh cấu trúc cục bộ của đối tượng. Các đặc trưng kết cấu được sử dụng phổ biến trong phát hiện mục tiêu gồm: i) đặc trưng gradient; ii) đặc trưng mẫu nhị phân cục bộ LBP (Local Binary Pattern); iii) đặc trưng Haar-like; iv) đặc trưng phổ tần số. 1.1.2.3. Đặc trưng hình dạng Hình ạng là một đặc trưng quan trọng của một mục ti u và nó là đặc trưng được sử ụng phổ iến trong các ứng ụng phát hiện và ám mục ti u trong các ảnh vi eo đầu vào. Dựa vào cách tính toán, đặc trưng hình ạng được phân làm hai loại chính: i) đặc trưng hình dạng dựa vào đường bao được trích chọn ựa vào các điểm ảnh nằm tr n các đường ao đối tượng; ii) đặc trưng hình dạng dựa vào vùng trong đường bao được trích chọn ựa vào thông tin của cả các điểm ảnh nằm tr n đường ao và n trong đường ao mục ti u. 1.1.3. Các giải pháp phát hiện mục tiêu Một số tác giả phân loại các giải pháp phát hiện mục tiêu dựa vào đặc trưng ảnh [52], [106], trong khi nhiều tác giả khác lại phân loại dựa vào mô hình toán học biểu diễn mục tiêu [87], [107], [108]. Trong luận án này, chúng tôi dựa trên cả các đặc trưng ảnh và các mô hình toán để phân loại các giải pháp thành bốn loại như sau: 1.1.3.1. Phát hiện mục tiêu dựa vào phân vùng ảnh Các giải pháp thuộc nhóm nà ác định các vùng ảnh mục tiêu trong ảnh đầu vào bằng các kỹ thuật phân vùng ảnh. Các kỹ thuật phân vùng ảnh khai thác thông tin (màu sắc và kết cấu) ở cấp độ điểm ảnh để phân tách ảnh đầu vào thành các các vùng ảnh chứa các điểm ảnh có các đặc tính giống nhau. Đánh giá: Nhìn chung, các giải pháp dựa vào phân vùng ảnh có độ chính xác phát hiện mục tiêu cao và có quá trình học các tham số cho mô hình biểu diễn mục ti u đơn giản. Tuy nhiên, nó có một số nhược điểm chính như sau: - Tốc độ tính toán chậm, bởi vì quá trình phân vùng ảnh phải xem xét tất cả các khả năng của mỗi điểm ảnh. - Hiệu quả của việc phát hiện mục tiêu phụ thuộc rất lớn vào kỹ thuật phân vùng ảnh. 1.1.3.2. Phát hiện mục tiêu dựa vào chuyển động Giải quyết bài toán phát hiện mục tiêu bằng cách đi tìm các vùng ảnh chuyển động [52], [106]. Có hai cách tiếp cận chính để ác định vùng ảnh 4 chuyển động: 1) Dựa vào tốc độ và hướng dịch chuyển của mục tiêu (Optical Flow); 2) Dựa vào mô hình nền tham chiếu (Background Model). Đánh giá: - Các thuật toán có ưu điểm là chúng thích nghi với sự thay đổi của đối tượng nền trong cảnh, nhưng độ chính xác thấp khi mục tiêu bị tha đổi bởi các điều kiện chiếu sáng khác nhau hoặc có tốc độ và hướng dịch chuyển thay đổi đột ngột. - Các thuật toán dựa vào mô hình nền có tốc độ tính toán cao và rất hiệu quả trong các trường hợp mà cảnh nền ít bị tha đổi. Tuy nhiên, các thuật toán nà có độ chính xác phát hiện mục tiêu thấp khi mà đối tượng nền trong cảnh tha đổi nhiều. 1.1.3.3. Phát hiện mục tiêu dựa vào các bộ phân lớp Các giải pháp phát hiện mục tiêu theo nhóm này sử dụng các bộ phân lớp học có giám sát để ác định vùng ảnh mục tiêu từ các điểm ảnh nền trong ảnh đầu vào [125], [126], [127], [128], [129], [130]. Các bộ phân lớp học có giám sát được sử dụng rộng rãi trong phát hiện mục tiêu gồm có: i) Mạng nơ ron (Neural Networks); ii) Máy hỗ trợ vector (Support Vectors Machine SVM); iii) Kết hợp đa bộ phân lớp yếu (AdaBoost). Đánh giá: Giải pháp trên dễ thực hiện và có hiệu quả cao đối với các trường hợp mà mục ti u có các đặc trưng ảnh khác biệt rõ ràng so với các đối tượng nền. Các nhược điểm chính là: - Nó yêu cầu các tập dữ liệu mẫu của mục ti u và các đối tượng nền dùng cho huấn luyện phải đủ lớn. Đâ là điều rất khó thực hiện. - Độ chính xác phát hiện mục tiêu sẽ thấp khi sự khác biệt giữa các đặc trưng ảnh biểu diễn mục ti u và các đặc trưng ảnh biểu diễn các đối tượng nền là nhỏ. 1.1.3.4. Phát hiện mục tiêu dựa vào so khớp mẫu Trong các giải pháp thuộc nhóm này [131], [132], [133], [134], thuật toán ác định mục ti u được thực hiện với hai ước chính: - Bước 1: Xây dựng các bộ đặc tả mục tiêu hoặc các thành phần của mục ti u như các ộ đặc trưng ảnh mẫu từ tập dữ liệu học. - Bước 2: Ảnh đầu vào được quét bằng một cửa sổ trượt, vùng ảnh trong cửa sổ trượt được biểu diễn bởi các đặc trưng ảnh và so sánh với các bộ mẫu đặc trưng của mục tiêu bằng phép đo. Nếu giá trị của phép đo lớn thì vùng ảnh đó là mục ti u, ngược lại nó là đối tượng nền. Đánh giá: Các giải pháp trên được sử dụng khá phổ biến bởi chúng có độ chính xác cao. Hiệu quả của các giải pháp này phụ thuộc chủ yếu vào bộ đặc trưng mẫu biểu diễn mục ti u. Nhược điểm lớn nhất của các giải pháp này là chúng có tốc độ tính toán chậm, đặc biệt trong trường hợp kích thước và số lượng của các bộ đặc tả mục tiêu lớn. 5 1.2. Bám mục tiêu từ chuỗi ảnh 1.2.1. Bài toán bám mục tiêu Bám mục tiêu là một ài toán ác định qũy đạo chuyển động của một hoặc nhiều mục tiêu theo thời gian, được thực hiện bằng việc ác định các vị trí mục tiêu trong mỗi khung ảnh [52]. Các đặc điểm chính của bài toán bám mục tiêu là: - Đầu vào: các chuỗi ảnh theo thời gian; thông tin về mục tiêu; thông tin về đối tượng nền. - Đầu ra: vị trí của mục tiêu thuộc quỹ đạo chuyển động trong ảnh đầu vào. 1.2.2. Các giải pháp bám mục tiêu Dựa vào đặc trưng sử dụng để biểu diễn mục tiêu và mô hình biểu diễn quỹ đạo chuyển động của mục tiêu [52], các giải pháp bám mục ti u được phân thành ba dạng chính như sau: 1.2.2.1. Bám mục tiêu theo điểm Các giải pháp ám theo điểm biểu diễn mục tiêu cần tìm trong ảnh như một điểm (điểm tâm của mục tiêu) hoặc một tập điểm (sử dụng các điểm đặc biệt tr n đường bao mục tiêu). Có nhiều thuật toán ám theo điểm khác nhau và lớp thuật toán nà được chia thành 2 nhóm: các thuật toán tất định (Deterministic Algorithms) và các thuật toán thống kê xác suất (Statistical Algorithms). Đánh giá: Ưu điểm của các thuật toán bám theo điểm là có tốc độ tính toán nhanh, phù hợp với các ứng dụng mà tốc độ và quỹ đạo dịch chuyển của mục ti u tha đổi chậm theo thời gian. Tuy nhiên, các thuật toán nà có độ chính xác không cao khi mục ti u tha đổi liên tục về tốc độ và quỹ đạo dịch chuyển. Mặt khác việc sử dụng thông tin ở một số điểm ảnh để ác định mục tiêu sẽ dễ bị nhạy cảm với nhiễu nền. 1.2.2.2. Các giải pháp bám theo đặc trưng bề mặt Các giải pháp thuộc lớp này xấp xỉ vùng ảnh mục ti u như một vùng ảnh hình chữ nhật hoặc hình ellip và sử dụng các đặc trưng ề ngoài (đặc trưng màu sắc và kết cấu) để biểu diễn mục tiêu. Hầu hết các giải pháp bám truyền thống sử dụng các thông tin mức ám để biểu diễn mục tiêu và sử dụng kỹ thuật đối sánh tương quan chéo để ác định mục tiêu. Thay vì chỉ sử dụng các giá trị mức xám, các giải pháp bám mục tiêu gần đâ đã kết hợp nhiều đặc trưng ề mặt khác nhau. Đánh giá: Các giải pháp bám dựa vào đặc trưng ề mặt giải quyết bài toán ám như ài toán phát hiện mục tiêu dựa vào đặc tính chuyển động, do vậy mà nó thích nghi được với sự thay về đổi tốc độ và hướng dịch chuyển của mục ti u. Tu nhi n, độ chính xác và tốc độ tính toán của các giải pháp này phụ thuộc lớn vào việc lựa chọn các đặc trưng ảnh biểu diễn mục tiêu. Nếu chỉ sử dụng đặc trưng màu hoặc mức ám thì độ chính xác bám mục tiêu sẽ thấp khi các điều kiện ánh sáng tha đổi trong cảnh. Nếu sử dụng đặc trưng quá phức tạp, thì thời gian tính toán sẽ chậm. 6 1.2.2.3. Các giải pháp bám theo hình dạng Lớp giải pháp này có thể được chia thành hai nhóm chính. - Nhóm thứ nhất sử dụng một bộ đặc tả hình dạng để biểu diễn mục tiêu như các mẫu trong các khung ảnh đầu tiên dựa trên các mục tiêu được phát hiện và sau đó áp ụng kỹ thuật so khớp mẫu để bám mục tiêu trong các khung ảnh tiếp theo. - Nhóm thứ hai biểu diễn sự dịch chuyển trong không gian của các đường bao mục tiêu giữa các khung ảnh liên tiếp nhau bằng một mô hình không gian trạng thái. Đánh giá: Các giải pháp bám mục tiêu dựa vào đặc trưng hình ạng có độ chính ác cao. Tu nhi n, các phương pháp nà có độ phức tạp cao và tốc độ tính toán chậm. 1.3. Đặc điểm của bài toán phát hiện và bám mục tiêu quân sự Việc phát hiện và bám các mục tiêu quân sự so với các đối tượng mục tiêu dân sự có những đặc điểm nổi bật như sau: - Thứ nhất, các mục tiêu quân sự thường được ngụ trang để màu sắc tương đối giống với các đối tượng nền như các vùng cỏ và cây, do vậy rất khó phân tách các mục tiêu quân sự từ các đối tượng nền trong ảnh. - Thứ hai, việc phát hiện và bám các mục tiêu quân sự thường phải thực hiện ở một khoảng cách a hàng trăm mét đến hàng cây số, cho nên các ảnh thu thập thường chứa nhiều đối tượng nền, nhiễu trong ảnh. - Thứ ba, hệ thống phát hiện và bám mục tiêu quân sự phải có tốc độ tính toán thời gian thực và có độ chính xác cao. Các đặc điểm tr n cũng chính là u cầu cần phải giải quyết trong bài toán phát hiện và bám mục tiêu trong luận án này. 1.4. Hướng tiếp cận của luận án 1.4.1. Sơ đồ khối của hệ thống phát hiện và bám các mục tiêu quân sự Hệ thống phát hiện và bám các mục tiêu quân sự được thiết kế bao gồm ba thành phần chính như trong sơ đồ khối như sau: Hình 1.5. Sơ đồ khối của hệ thống phát hiện và bám mục tiêu quân sự 1- Khối thu nhận ảnh: khối này là các camera chuyên dụng có khả năng chụp được các cảnh ở xa với chất lượng ảnh tốt. 2- Khối phát hiện mục tiêu: từ chuỗi ảnh vi eo được thu thập từ khối thu nhận ảnh, khối này có nhiệm vụ nhận diện sự xuất hiện của các mục tiêu quân Chuỗi ảnh video Phát hiện mục tiêu Bám mục tiêu Vị trí mục tiêu trong mỗi ảnh 7 sự (người, e tăng và e cơ giới quân sự) trong cảnh. Đầu ra của khối này là đầu vào cho ước khởi tạo an đầu của khối bám mục tiêu. 3- Khối bám đối tượng: khi đầu ra của khối phát hiện mục tiêu chỉ ra rằng có sự uất hiện các mục quân sự trong cảnh. Trong các chuỗi ảnh vi eo tiếp theo, hệ thống sẽ chu ển sang ám mục ti u và khối phát hiện mục tiêu sẽ ừng hoạt động. 1.4.2. Đinh hướng nhiệm vụ của luận án Do vậy, các giải pháp phát hiện và bám mục tiêu trong ảnh được đề xuất trong luận án này phải giải quyết được các khó khăn trong mục 1.3. Các nhiệm vụ chính của luận án được ác định là: Nhiệm vụ 1: Nghiên cứu và xây dựng một giải pháp phát hiện mục tiêu quân sự có hiệu quả và tốc độ tính toán nhanh từ chuỗi ảnh vi eo được thu thập từ xa. Nhiệm vụ 2: Từ vùng ảnh mục tiêu được ác định trong các chuỗi ảnh đầu tiên, nghiên cứu và xây dựng một giải pháp bám mục tiêu quân sự có tốc độ tính toán và độ chính xác cao trong các chuỗi ảnh video tiếp theo. 1.4.3. Hướng giải quyết bài toán phát hiện và bám mục tiêu quân sự Như đã trình à trong mục 1.1 và 1.2 sẽ không đáp ứng được yêu cầu của bài toán phát hiện và bám mục tiêu quân sự. Tr n cơ sở nghiên cứu, phân tích các ưu điểm của giải pháp đã có và các đặc trưng mục tiêu quân sự, chúng tôi ác định hướng giải quyết bài toán phát hiện và bám các mục tiêu quân sự trong chuỗi ảnh vi eo đầu vào như sau: - Thứ nhất là thu hẹp không gian tìm kiếm mục tiêu trong ảnh đầu vào sử dụng các đặc trưng ảnh và các đặc tính chuyển động của mục tiêu. - Thứ hai là lựa chọn đặc trưng ảnh phản ánh được các đặc tính riêng biệt của mục tiêu so với các đối tượng nền. Trong luận án này, chúng tôi sử dụng kết hợp các loại đặc trưng ảnh khác nhau để biểu diễn mục tiêu gồm: 1) Đặc trưng màu, 2) Đặc trưng hướng cạnh và 3) Đặc trưng đặc tả hình dạng. Sự kết hợp các loại đặc trưng nà sẽ phản ánh được cả các đặc điểm cục bộ và toàn cục của mục tiêu. - Thứ ba là lựa chọn mô hình toán biểu diễn các đặc trưng ảnh có tốc độ tính toán nhanh và độ chính xác cao. Các mô hình toán biểu diễn đặc trưng ảnh được tập trung nghiên cứu là các mô hình xác suất, các phép đo toán học trong so khớp mẫu và các mô hình phân lớp được sử dụng trong các thuật toán nhận dạng. - Thứ tư là thu thập các tập dữ liệu đủ lớn chứa các cảnh môi trường khác nhau, ưới các điều kiện tạo ảnh khác nhau để: 1) Xây dựng các tập mẫu dữ liệu mục tiêu phục vụ cho việc học; 2) Đánh giá, phân tích hiệu quả của các thuật toán phát hiện và bám mục tiêu. 8 Kết luận Chương 1: - Chương nà đã trình à tổng quan về các giải pháp phát hiện và bám mục tiêu từ video. - Chương nà cũng đã mô tả hướng tiếp cận của luận án để giải quyết các nhiệm vụ nghiên cứu. Chương 2: PHÁT HIỆN MỤC TIÊU TRONG ẢNH VIDEO SỬ DỤNG CÁC ĐẶC TRƯNG CHUYỂN ĐỘNG, MÀU SẮC VÀ HÌNH DẠNG 2.1. Đặt vấn đề phát hiện mục tiêu Chương nà trình à một giải pháp mới để phát hiện các mục tiêu quân sự từ chuỗi ảnh video. Giải pháp đề xuất để phát hiện mục tiêu trong các ảnh đầu vào bằng hai ước chính: - Bước 1: Trích chọn các vùng ảnh có khả năng chứa các điểm ảnh mục tiêu, các vùng ảnh nà được gọi là các vùng quan tâm, kí hiệu là ROI. Các ROI được ác định dựa tr n đặc trưng chu ển động. - Bước 2: Xác định mục ti u tr n các ROI. Để tìm mục tiêu trên các ROI, chúng tôi sử dụng kết hợp đặc trưng màu và đặc trưng hình dạng để biểu diễn các vùng ảnh trong một mô hình toán học. Mô hình toán học đo sự giống nhau giữa các đặc trưng ảnh của các vùng ảnh so sánh với các đặc trưng mẫu của mục ti u được ác định trong tập học. Giải pháp đề xuất được đánh giá tr n các tập dữ liệu lớn của các loại mục tiêu quân sự khác nhau như e tăng và các loại e cơ giới. Ngoài ra, giải pháp đề xuất cũng được được đánh giá thông qua kết quả thực nghiệm trong so sánh với các giải pháp phát hiện mục tiêu khác. 2.2. Giải pháp đề xuất phát hiện mục tiêu quân sự Giải pháp đề xuất phát hiện các mục tiêu quân sự bao gồm 02 ước chính: Trích chọn ROI và Xác định mục tiêu như trong sơ đồ khối Hình 2.1. Hình 2.1. Sơ đồ khối của giải pháp phát hiện mục tiêu quân sự. 2.2.1. Trích chọn ROI Trích chọn ROI được thực hiện bằng việc đi tìm các vùng ảnh chuyển động của mục tiêu. Gọi Fi và Fj là hai khung ảnh trong chuỗi ảnh video thu nhận được từ camera, các chỉ số i và j thỏa mãn j > i. Sự khác nhau D(x,y) ở mỗi vị trí điểm ảnh (x,y) giữa hai khung ảnh được tính như sau: ( ) √( ( ) ( ) ( )) (2.1) Chuỗi ảnh đầu vào Trích chọn ROI Xác định mục tiêu Vùng ảnh mục tiêu 9 { ( ) [ ( ) ( )] ( ) [ ( ) ( )] ( ) [ ( ) ( )] (2.2) Trong đó: ( ) , ( ), ( ) là ba giá trị màu điểm ảnh (x,y) trên Fi , là một hằng số chuẩn hóa D(x,y). D(x,y) có giá trị nằm trong dải [0,1]. là các trọng số màu, thỏa mãn . Mặt nạ chuyển động của các đối tượng trong cảnh được trích chọn như sau: ( ) { ( ) ( ) (2.3) Hình 2.2. Ví dụ minh họa bước trích chọn ROI. Trong (2.3), là giá trị ngưỡng được chọn qua thực nghiệm ( ). Cuối cùng, các thao tác nhị phân Morpholog được áp dụng trên ảnh mặt nạ M(x,y) để nối các điểm ảnh sáng liền kề nhau thành các vùng ROI, các vùng có diện tích quá nhỏ so với kích thước ảnh được lọc bỏ. Hình 2.2 (b) minh họa kết quả trích chọn ROI từ hai khung ảnh đầu vào trong Hình 2.2 (a). 2.2.2. Xác định đối tượng từ các vùng đồng mầu 2.2.2.1. Phương pháp xác định mục tiêu Gọi R = {R1, R2,..., RN} là tập hợp các ROI được trích trọn trong Mục 2.2.1. Quá trình ác định mục tiêu được thực hiện lần lượt trên mỗi Rj. Đối với mỗi vùng quan tâm (ROI) Ri, một vùng ảnh hình chữ nhật W được ác định từ Fi+k với điểm tâm trùng với điểm tâm của Rj (xem Hình 2.3). Vùng ảnh W sau đó được phân mảnh thành các vùng đồng nhất về màu sắc S = {S1,S2, ..., SM}. Từ Khung ảnh Fi Khung ảnh Fi+k Mặt nạ chuyển động Các vùng quan tâm (ROI) (a) hai khung ảnh vi eo đầu vào (b) mặt nạ chuyển động và các vùng quan tâm ROI. 10 tập các vùng S, mục ti u được ác định như là vùng ảnh Z S, Z là tập các vùng đồng màu {Sk, Sg,...} kết nối với nhau thành một vùng ảnh lớn, thỏa mãn 02 điều kiện trong (2.4) và (2.5): ( ) (2.4) ( ) (2.5) Trong công thức (2.4) và (2.5), theo công thức (2.17) ( ) là hàm đo sự giống nhau giữa một vùng ảnh X với lớp mục tiêu O, là một giá trị ngưỡng. Thuật toán tổng quát ác định mục tiêu được viết ưới dạng giả mã như sau: Thuật toán 1: Xác định mục tiêu Đầu vào: R = {R1, R2,..., RN} Đầu ra: mặt nạ nhị phân B các mục tiêu trong ảnh For each RjR 1. Xác định vùng ảnh W trên ảnh đầu vào Fj, W có tâm là tâm của Rj 2. Phân vùng W thành tập hợp các vùng đồng màu S = {S1, S2, ..., SM} 3. Tìm vùng ảnh Z S từ các tập con X S sao cho Z có độ đo giống nhau lớn nhất về đặc trưng ảnh so với mục tiêu (thỏa mãn điều kiện trong (2.4)) 4. Nếu vùng Z là mục tiêu, thỏa mãn điều kiện trong (2.5) Thì B End For Độ phức tạp thuật toán: O(N*nlogn), trong đó N là số vùng ROI, n là số điểm ảnh trong vùng. (a) Mặt nạ các ROI (b) Các vùng ảnh W (khung màu đỏ) Vùng chuyển động (ROI) Vùng ảnh W Kết quả phân vùng Mục tiêu được xác định 11 (c) Kết quả các bước trong mỗi vòng lặp của Thuật toán 1 (d) Mặt nạ mục tiêu và mục tiêu tìm được trên ảnh đầu vào. Hình 2.3. Kết quả các bước thực hiện trong Thuật toán 1. 2.2.2.2. Thuật toán phân vùng ảnh Chúng tôi sử dụng thuật toán dựa vào lý thuyết đồ thị được đề xuất trong [68] để phân mảnh ảnh đầu vào thành các vùng đồng nhất về màu sắc. Thuật 12 toán nà độ chính xác cao và thời gian tính toán nhanh. Kết quả phần vùng ảnh được minh họa trong Hình 2.3c. 2.2.2.3. Trích chọn đặc trưng ảnh  Trích chọn đặc trưng màu: Đặc trưng màu của một vùng ảnh SkS, là một vector ck = {rk, gk, bk}, trong đó rk, gk, và bk là các giá trị màu Red, Green và Blue trung bình của các điểm ảnh thuộc vùng Sk. Để đo sự giống nhau về màu sắc của một vùng ảnh lớn X với lớp đối tượng O cần tìm, luận án sử dụng hàm g(X,O) được tính như sau: ( ) | | ∑ ( | ) (2.11) Trong (2.11), |X| là tổng số vùng đồng màu trong X, ( | ) là hàm mật độ xác suất điều kiện lớp của vector màu cR thuộc về mục tiêu lớp O được xác định qua tập dữ liệu học.  Trích chọn đặc trưng hình dạng: Đặc trưng hình ạng của mục tiêu được ác định bằng việc sử dụng các bộ đặc tả về hình dạng (shape context) được đề xuất trong [69], chúng bất biến khi đối tượng bị xoay, dịch chuyển, méo, biến đổi theo tỷ lệ. Đặc trưng hình ạng của một mục tiêu bao gồm các đặc tả hình dạng của các điểm ảnh nằm tr n đường biên ngoài của đối tượng. Xét một mục tiêu có các điểm mẫu tr n đường viền. Đặc tả hình dạng của một điểm là một lược đồ của các tọa độ cực tương đối giữa và điểm còn lại tr n đường viền của mục tiêu như sau: * ( ) ( ) + (2.13) Sự khác nhau giữa hai bộ đặc tả hình dạng của hai điểm và được tính như sau: ( ) ∑ ( ) (2.14) Gọi * + là tập các hình dạng mẫu của mục tiêu cần tìm. Đối với mỗi một vùng ảnh X (nó có thể bao gồm nhiều vùng đồng màu), thì đặc trưng hình ạng của là các đặc tả hình dạng của các điểm mẫu nằm trên đường bao ngoài của . Sự khác nhau về hình dạng giữa một vùng ảnh và một hình dạng mẫu của mục tiêu được tính như sau: ( ) | | ∑ ( ) (2.15) Trong công thức (2.15), | | biểu thị cho tổng số điểm mẫu trong X. Hàm đo sự giống nhau về đặc trưng hình ạng của một vùng ảnh với lớp đối tượng O được tính: ( ) , ( )- (2.16) Trong (2.16), là tham số tỷ lệ được ác định thông qua tập dữ liệu mẫu.  Kết hợp các đặc trưng ảnh: Từ việc trích chọn các đặc trưng màu và hình ạng ở trên, chúng tôi tính toán hàm f(X,O) trong (2.4) và (2.5), để đo sự giống nhau giữa một vùng ảnh X với lớp mục tiêu O như sau: 13 ( ) ( ) ( ) (2.17) Trong đó các tham số và là các trọng số ương ( ) để ác định mức độ quan trọng của đặc trưng ảnh tương ứng trong phép đo độ giống nhau giữa vùng ảnh X và lớp mục tiêu O. 2.2.2.4. Thuật toán tìm vùng ảnh đối tượng tối ưu Như đã trình à ở trên, việc đi tìm tập trong (2.4) có thể được ác định bằng phương pháp vét cạn với việc tìm tất cả các tập con trong . Tuy nhiên phương pháp nà sẽ mất nhiều thời gian tính toán, độ phức tạp tính toán của nó là ( | |) với | | là tổng số thành phần của Để giảm thời gian tính toán, luận án đề xuất một thuật toán thêm bớt vùng tối ưu như sau: Thuật toán 3: Thuật toán thêm bớt vùng Đầu vào: Tập các vùng đồng màu * + Đầu ra: Vùng ảnh Các bước của thuật toán: 1. Lọc các vùng có giá trị g(X,O) thấp, ta được tập : * | ( ) + 2. Chọn sao cho: ( | ) 3. Thêm các vùng X liên thông với vào * | * + là một vùng li n thông + 4. Vòng lặp loại vùng While (Temp) do Sr * * + là một vùng li n thông+ S - (* + ) if (* + ) ( ) Else End if End while Độ phức tạp của thuật toán: O(2logL), L là số phần tử của tập đồng màu. Trong thuật toán 3, ở mỗi ước thêm hoặc bớt một vùng cho thì tính liên thông của tập * } và * } được kiểm tra. Một tập các thành phần được xem là liên thông với nhau nếu như kết hợp tất cả các thành phần của nó tạo nên ít nhất một đường đi giữa các vùng. 2.3. Thực nghiệm và kết quả 2.3.1. Dữ liệu ảnh Để đánh giá phương pháp đề xuất, chúng tôi đã thu thập 03 tập dữ liệu video cho 03 loại mục tiêu quân sự khác nhau: e tăng, e tải và xe u-oát. Cụ thể, tập dữ liệu cho e tăng có 102 file vi eo, tập dữ liệu cho xe tải quân sự có 14 128 file video, tập dữ liệu cho xe u-oát có 101 file video. Mỗi file vi eo tương ứng với một cảnh thực tế, chứa khoảng 3000 khung ảnh. Mỗi loại mục tiêu, chúng tôi lấy 2/3 tổng số ảnh làm tập học (training) và 1/3 tổng số ảnh ùng để đánh giá kết quả. Với mỗi ảnh dữ liệu, chúng tôi ác định mục tiêu bằng phương pháp thủ công (bằng tay) để tạo nên các tập dữ liệu mục tiêu, các tập nà được gọi là ground_truth, làm cơ sở đánh giá các thuật toán phát hiện mục tiêu. 2.3.2. Phương pháp đánh giá hiệu quả phát hiện mục tiêu Để đánh giá hiệu quả của việc phát hiện mục tiêu trong mỗi ảnh, chúng tôi so sánh vùng ảnh đối tượng được phát hiện bằng máy với vùng ảnh mục tiêu được ác định bằng tay trong tập dữ liệu Ground_truth. Chúng tôi sử dụng 03 phép đo recall, precision và F-measure để đánh giá hiệu của các thuật toán. 2.3.3. Kết quả thực nghiệm 2.3.3.1. Phân tích hiệu quả của việc sử dụng trích chọn ROI Giải pháp đề xuất được phát triển dựa trên công việc trước đâ của chúng tôi trong [P7]. Giải pháp trong [7] giống như giải pháp đề xuất nhưng không sử dụng ước trích chọn ROI. Để đánh giá tính hiệu quả của việc trích chọn ROI, luận án đã cài đặt giải pháp trong [P7] và chạy trên 03 tập dữ liệu. Kết quả được mô tả trong Bảng 2.1, 2.2 và 2.3. Bảng 2.1. Kết quả phát hiện mục tiêu tập dữ liệu u-oát quân sự STT Các giải pháp Recall (%) Precision (%) F_measure (%) T.gian (giây) 1 Không trích chọn ROI [P7] 78,2 92,5 84,7 1,25 2 Giải pháp đề xuất 90,3 97,6 93,8 0,38 Bảng 2.2. Kết quả phát hiện mục tiêu tập dữ liệu xe tải quân sự STT Các giải pháp Recall (%) Precision (%) F_measure (%) T.gian (giây) 1 Không trích chọn ROI [P7] 73,1 75,8 73,9 1,28 2 Giải pháp đề xuất 89,3 96,6 92,8 0,41 Bảng 2.3. Kết quả phát hiện mục tiêu tập dữ liệu xe tăng STT Các giải pháp Recall (%) Precision (%) F_measure (%) T.gian (giây) 1 Không trích chọn ROI [P7] 83,1 90,2 86,5 1,26 2 Giải pháp đề xuất 92,2 95,9 94,0 0,39 2.3.3.2. So sánh với các giải pháp khác Giải pháp đề xuất được so sánh với 04 giải pháp tiêu biểu sử dụng phổ biến cho phát hiện mục tiêu trong chuỗi khung ảnh video: 1) Giải pháp trừ nền cơ ản (BBS) [101]; 2) Giải pháp pháp hiện mục tiêu dựa trên mô hình Gauss đơn (SGM)[102]; 3) Giải pháp phát hiện mục tiêu dựa trên mô hình Gauss hỗn hợp (MGM) [103]; 4) Giải pháp phát hiện mục tiêu dựa trên mô hình nền thích nghi (LOTS) [104]. Kết quả thực hiện trên 03 tập dữ liệu được tóm tắt trong các Bảng 2.4, 2.5 và 2.6. 15 Bảng 2.4. Kết quả phát hiện mục tiêu tập dữ liệu u-oát quân sự STT Các giải pháp Recall (%) Precision (%) F_measure (%) T.gian (giây) 1 BBS [101] 68,1 75,6 71,7 0,15 2 SGM [102] 78,1 82,8 80,4 0,19 3 MGM [103] 86,6 88,5 87,5 0,27 4 LOTS [104] 88,7 90,8 89,7 0,25 5 Giải pháp đề xuất 90,3 97,6 93,8 0,38 Bảng 2.5. Kết quả phát hiện mục tiêu tập dữ liệu xe tải quân sự STT Các giải pháp Recall (%) Precision (%) F_measure (%) T.gian (giây) 1 BBS [101] 58,1 65,6 61,6 0,17 2 SGM [102] 64,1 79,8 71,1 0,20 3 MGM [103] 76,6 74,5 75,5 0,26 4 LOTS [104] 78,7 85,8 82,1 0,28 5 Giải pháp đề xuất 89,3 96,6 92,8 0,41 Bảng 2.6. Kết quả phát hiện mục tiêu tập dữ liệu xe tăng STT Các giải pháp Recall (%) Precision (%) F_measure (%) T.gian trung bình (giây) 1 BBS [101] 61,1 68,6 64,6 0,18 2 SGM [102] 68,1 81,8 74,3 0,21 3 MGM [103] 74,6 79,5 77,0 0,28 4 LOTS [104] 81,7 87,8 84,6 0,26 5 Giải pháp đề xuất 92,2 95,9 94,0 0,39 Kết luận Chương 2: Trong chương 2, chúng tôi đã đề xuất một giải pháp mới có hiệu quả cao cho phát hiện các mục tiêu quân sự trong các khung ảnh vi eo. Các đóng góp khoa học cụ thể là: 1. Đề xuất việc ác định mục tiêu dựa trên các vùng ROI. 2. Đề xuất mô hình toán ác định mục tiêu từ các vùng đồng màu (supper- pixel) với sự kết hợp đặc trưng màu sắc và đặc trưng hình ạng. 3. Đề xuất Thuật toán tối ưu tìm mục tiêu từ các vùng đồng màu. Chương 3: BÁM MỤC TIÊU SỬ DỤNG CÁC ĐẶC TRƯNG MẪU HỌC TRỰC TUYẾN 3.1. Đặt vấn đề bám mục tiêu Bài toán bám mục tiêu quân sự có thể được giải quyết bằng việc sử dụng thuật toán phát hiện mục tiêu ở chương 2. Dựa vào vị trí mục tiêu ở khung ảnh thứ t-1 và tốc độ dịch chuyển cực đại của mục ti u, chúng ta ác định được vùng ảnh W chứa mục tiêu ở khung ảnh thứ t. Sau đó áp ụng Thuật toán 1 trong chương 2 để ác định mục tiêu từ các vùng ảnh đồng màu trong W. Tuy nhiên, giải pháp này có tốc độ tính toán không đủ nhanh để ác định vị trí mục tiêu trong mọi khung ảnh thu được. Chương nà trình à một giải pháp bám mục tiêu mới. Giải pháp đề xuất khai thác các ưu điểm của các giải pháp bám mục tiêu theo hình dạng và các giải pháp bám mục tiêu dựa tr n các đặc trưng ề ngoài. Cụ thể, giải pháp đề xuất sử dụng các đặc trưng hình ạng và các đặc trưng màu sắc để biểu diễn mục tiêu. Việc ác định vị trí mục tiêu trong khung ảnh mới được thực hiện 16 bằng kỹ thuật đối sánh mẫu. Các mẫu đặc trưng ảnh biểu diễn mục ti u được cập nhật trực tuyến từ kết quả bám mục tiêu trên từng khung ảnh. Hơn nữa, để tăng tốc độ tính toán, luận án sử dụng các đặc tính dịch chuyển của mục tiêu (ví dụ như tốc độ chuyển động), và mô hình phân lớp xác suất để giảm không gian tìm kiếm mục tiêu trong khung ảnh mới thay vì tìm kiếm trong không gian toàn bộ ảnh. 3.2. Giải pháp bám mục tiêu đề xuất Giải pháp đề xuất được mô tả tóm tắt trong Thuật toán ưới đâ : Thuật toán 4: Bám đối tượng dựa trên các đặc trưng mẫu học trực tuyến Input: - Khung ảnh video thứ t, Ft. - Vùng ảnh mục tiêu trên khung ảnh Ft-1 Output: Vị trí mục tiêu Lt trên khung ảnh thứ t. 1. Thực hiện tiền xử lý ảnh cho Ft. 2. Xác định ROI từ vị trí mục tiêu Lt-1 cho khung ảnh Ft-1 và Ft. 3. Tính toán hoặc cập nhật các hàm mật độ xác suất điều kiện lớp: 3.1. Tính toán và cập nhật hàm pdf(c|O) dựa trên các điểm ảnh thuộc về mục tiêu trong ROI của khung ảnh Ft-1. 3.2. Tính toán và cập nhật hàm pdf(c|non_obj) dựa trên các điểm ảnh không thuộc về mục tiêu trong ROI của khung ảnh Ft-1. 4. Tính toán hoặc cập nhật các đặc trưng ảnh mẫu từ vùng ảnh mục tiêu trên khung ảnh Ft-1. 5. Trích chọn các điểm ảnh thuộc về mục tiêu trong ROI của Ft, các POI. 6. Trích chọn các đặc trưng ảnh cho mỗi vị trí POI. 7. Xác định vị trí mục tiêu Lt bằng so khớp mẫu các đặc trưng ảnh. Độ phức tạp thuật toán: O(n*m* Nobj* Mobj), trong đó n*m là kích thước khung ảnh đầu vào, Nobj* Mobj là kích thước ảnh mục tiêu. 3.2.1. Tiền xử lý ảnh Để giảm thiểu sự ảnh hưởng của nguồn ánh sáng, chúng tôi sử dụng bộ lọc Homomorphic cho ước tiền xử lý ảnh như Hình 3.2. f(x,y) Log DFT H(u,v) IDFT exp g(x,y) Hình 3.2. Sơ đồ khối bộ lọc Homomorphic. 3.2.2. Xác định các vị trí POI Tiến trình ác định các điểm ảnh thuộc về mục tiêu, các POI (point of interest), được thực hiện bởi 02 ước chính: 1)Xác định vùng ảnh ROI mà mục tiêu có thể định vị dựa vào tốc độ dịch chuyển cực đại; 2) Trích chọn các POI trong vùng ROI bằng kỹ thuật phân lớp. 3.2.2.1. Xác định vùng ROI Vùng ROI được ác định như là một vùng ảnh hình vuông hoặc hình tròn có tâm là vị trí tâm của mục tiêu trong khung ảnh liền kề trước, khung ảnh thứ t-1. Trong luận án, ROI là một hình vuông có khoảng cách từ tâm đến các 17 cạnh là R được tính bởi (3.3). Hình 3.4 minh họa việc ác định ROI cho khung ảnh thứ t, dựa vào mục tiêu được ác định trong khung ảnh thứ t-1. m tR V D  (3.3) Hình 3.4. Ví dụ trích chọn ROI. 3.2.2.2. Trích chọn các POI Việc ác định các vị trí POI trong vùng ROI được thực hiện bằng kỹ thuật phân lớp. Gọi pdf(c|O) và pdf(c|non_obj) là các hàm mật độ xác suất điều kiện lớp của màu c (trong không gian màu R, G, B) cho hai lớp: mục tiêu và nền. Các hàm nà được ước lượng bằng phương pháp tính lược đồ màu 3D (Histogram) của các điểm ảnh thuộc về mục tiêu và các điểm ảnh nền trong ROI của các khung ảnh trước thứ t-k,,t-1. Ban đầu, các hàm nà được tính từ vùng ROI được ác định dựa trên kết quả phát hiện mục tiêu sử dụng giải pháp ở chương 2. Sau đó, chúng được cập nhật từ các vùng ROI được ác định từ kết quả bám mục tiêu ở các khung ảnh trước. Hình 3.6. Minh họa kết quả trích chọn các POI. Từ ROI của khung ảnh mới thứ t (xem Hình 3.4 b), các điểm ảnh trong ROI được phân lớp bằng việc áp dụng luật quyết định Bayes. Một điểm ảnh x được coi là thuộc lớp mục tiêu hoặc là một POI, nếu: ( | ) ( | ) (3.4) Trong đó ( | ) và p( | ) là sắc xuất tại cx là vector màu tại điểm ảnh x được tính theo pdf(c|O) và pdf(c|non_obj), là giá trị ngưỡng được thiết lập bằng thực nghiệm trên tập dữ liệu ảnh học. Các POI trích chọn theo (3.4) sẽ được hậu xử lý bằng việc sử dụng các thao tác xử lý hình thái nhị (a) Mục tiêu được ác định ở khung ảnh thứ t-1 (b) Vùng ảnh ROI được ác định trên khung ảnh thứ t ROI được trích chọn (a) ROI được trích chọn trên khung ảnh (b) Mặt nạ các POI được trích chọn sử (c) Mặt nạ các POI sau khi xử lý hình thái nhị 18 phân (Morpholog ) để làm trơn vùng và trơn i n. Kết quả sẽ tạo nên nhiều vùng con chứa các POI, vùng có diện tích quá nhỏ sẽ được coi là nhiễu và bị loại bỏ. Hình 3.6 minh họa một ví dụ trích chọn các POI theo công thức (3.4). 3.2.3. Trích chọn đặc trưng ảnh Để biểu diễn một vùng ảnh hình chữ nhật B có kích thước mxn, chúng tôi sử dụng hai đặc trưng ảnh: đặc trưng màu và đặc trưng hướng cạnh (HoG – Histogram of Oriented Gradient). - Đặc trưng màu của vùng ảnh B là vector hc có kích thước 1 3K được kết hợp bởi 3 lược đồ (histogram) h1, h2, h3 của các thành phần màu (R, G, B) ở các vị trí điểm ảnh trong vùng ảnh B như công thức (3.7), K là kích thước của các vector h1, h2, h3. 1 2 3ch h h h   (3.7) - Đặc trưng hướng cạnh h của vùng ảnh B là lược đồ hướng (HoG) của các điểm ảnh cạnh trong vùng ảnh B. Các đặc trưng mẫu (templates) của mục tiêu được tính là một tập các đặc trưng màu hc và đặc trưng hướng cạnh h cho các vùng ảnh bao mục tiêu được ác định trong các khung ảnh trước (các khung ảnh thứ jT-1). Đối với khung ảnh mới thứ t, các đặc trưng hc và h được tính cho các vùng ảnh B có tâm là các vị trí POI ành được trong Phần 3.2.2.2. 3.2.4. Xác định mục tiêu dựa vào so khớp mẫu Mục tiêu trong khung ảnh đầu vào được ác định từ tập điểm POI dành được trong Phần 2.2.2.2, P = {P1, P2, ...,PN}. Gọi Hc và H là các tập đặc trưng mẫu của mục tiêu, chúng là các đặc trưng màu và đặc trưng hướng cạnh của vùng ảnh bao mục tiêu được ác định trong các khung ảnh trước thứ 1t-1. Đối tượng trong khung ảnh thứ t có vị trí tâm *P được ác định thỏa mãn công thức (3.11) như sau: * ( (p), )* ( (p), )argmin p c cP s s    h H h H P (3.11) Trong (3.11), ( )ch p và ( )h p là các đặc trưng màu và đặc trưng hướng cạnh của vùng ảnh B có tâm tại điểm ảnh p P. Hàm s(x,H) đo sự giống nhau giữa vector đặc trưng x với tập các vector H, được tính như sau: ( ) ( ) (3.12) Hàm d(x,y) được tính bằng phép đo khoảng cách Bhattacharyya giữa hai vector x và y như (3.13). Trong (3.13), ix và iy là các thành phần thứ i của vector x và y. ( ) √ ∑ √ (3.13) 19 Hình 3.10. Kết quả xác định mục tiêu trên khung ảnh thứ t. Vùng ảnh có tâm là P* được em như là vùng ảnh của mục tiêu nếu: * *( (p ), )* ( (p ), )c c os s   h H h H (3.14) với o là một giá trị ngưỡng được ước lượng từ thực nghiệm. Hình 3.10 minh họa kết quả ác định mục tiêu trong khung ảnh mới. 3.3. Thực nghiệm và kết quả 3.3.1. Dữ liệu ảnh video Dữ liệu ảnh video là 03 tập tương ứng với 03 đối tượng quân sự như trình bày trong Chương 2. Dữ liệu ground-truth để so sánh đánh giá: Đối với mỗi file video, luận án phân tách thành các khung ảnh riêng biệt và thực hiện ác định vùng ảnh bao mục tiêu bằng tay (vùng ảnh hình chữ nhật). 3.3.2. Phương pháp đánh giá Việc đánh giá hiệu quả các thuật toán bám cho mỗi khung ảnh video, luận án cũng sử dụng 03 phép đo như trong Chương 2: recall, precision và F- measure 3.3.3. Phân tích tính hiệu quả của giải pháp đề xuất Hiệu quả của giải pháp đề xuất cho bám các mục tiêu quân sự nằm ở hai yếu tố chính: 1) Xác định mục tiêu dựa vào POI; 2) Sự kết hợp các đặc trưng ảnh sử dụng cho ác định mục tiêu 3.3.3.1. Tính hiệu quả khi dùng các POI Để đánh giá hiệu quả của việc sử dụng các POI cho việc ác đinh mục tiêu trong khung ảnh đầu vào, luận án tiến hành làm các thực nghiệm với 03 phương như sau: - Phương án 1: Không sử dụng ROI và các POI cho việc ác định mục tiêu. Trên mỗi vị trí điểm ảnh, một vùng ảnh B được ác định và được biểu diễn bởi các đặc trưng màu và đặc trưng hướng cạnh. Mục tiêu được tìm sử dụng công thức (3.11) và (3.14) nhưng tập điểm P là toàn bộ không gian ảnh thay vì chỉ các điểm POI. (a) Mục tiêu được ác định trong ROI (vùng ao màu đỏ) (b) Mục tiêu được ác định trên ảnh đầu vào 20 - Phương án 2: Xác định mục tiêu trên các vị trí điểm ảnh nằm trong ROI, không sử dụng các điểm POI. - Phương án 3: Xác định mục tiêu dựa vào các điểm POI, tức là bám mục tiêu sử dụng đầ đủ các ước của thuật toán đề xuất. Kết quả của các thực nghiệm tr n được tóm tắt trong các Bảng 3.1 trên 3 tập dữ liệu. Bảng 3.1. Kết quả bám mục tiêu của ba phương án sử dụng và không sử dụng các POI để tìm mục tiêu trên các tập dữ liệu khác nhau. Tập dữ liệu Phương án Recall (%) Precision (%) F_measure (%) T.gian TB (ms) Xe tăng Phương án 1 85,6 81,7 83,6 1370 Phương án 2 90,0 95,2 92,5 165 Phương án 3 97,5 98,8 98,2 32 Xe tải Phương án 1 85,6 81,7 83,6 1370 Phương án 2 90,0 95,2 92,5 165 Phương án 3 96,7 98,1 97,4 33 Xe u-oát Phương án 1 85,6 81,7 83,6 1370 Phương án 2 90,0 95,2 92,5 165 Phương án 3 97,1 98,3 97,7 31 3.3.3.2. Phân tích tính hiệu của việc sử dụng các đặc trưng ảnh Để đánh giá tính hiệu quả của sự kết hợp đặc trưng màu và đặc trưng hướng cạnh trong đề xuất giải pháp bám mục tiêu, luận án tiến hành làm các thực nghiệm với giải pháp đề xuất (có các ước thực hiện giống nhau nhưng sử dụng đặc trưng ảnh khác nhau) như sau: 1- Sử dụng đặc trưng màu (Hcolor) để đi tìm mục tiêu trên các vị trí POI. 2- Sử dụng đặc trưng hướng cạnh (HoG) để tìm mục tiêu trên các vị trí POI. 3- Sử dụng kết hợp Hcolor và HoG để tìm mục tiêu trên các vị trí POI. Bảng 3.2 tóm tắt kết quả thực hiện của các thực nghiệm trên cả 03 tập dữ liệu thu từ thực địa. Bảng 3.2. Kết quả bám mục tiêu của thuật toán đề xuất sử dụng các đặc trưng ảnh khác nhau . Tập dữ liệu Đặc trưng Recall (%) Precision (%) F_measure (%) T.gian TB (ms) Xe tăng Hcolor 93,1 95,5 94,3 28 HoG 83,0 85,2 84,1 30 Hcolor + HoG 97,5 98,8 98,2 32 Xe tải Hcolor 92,6 94,7 93,6 29 HoG 80,8 84,2 82,5 31 Hcolor + HoG 96,7 98,1 97,4 33 Xe u- oát Hcolor 93,6 95,8 94,7 27 HoG 84,7 86,1 85,4 28 Hcolor + HoG 97,1 98,3 97,7 31 3.3.4. Kết quả so sánh với các giải pháp khác Giải pháp đề xuất được so sánh với 03 giải pháp bám mục tiêu đã công ố trên các tạp chí có chất lượng cao, gồm có: 1) P-N Learning (PNL) [81]; 2) 21 Ensemble Tracking (ET) [82]; 3) Multiple Instance Learning (MIL) [83]. Bảng 3.5 trình bày các kết quả thực nghiệm của giải pháp đề xuất và các giải pháp bám mục tiêu khác trên 03 tập dữ liệu. Bảng 3.3. Bảng kết quả của các giải bám mục tiêu trên các tập dữ liệu Tập dữ liệu Các giải pháp Recall (%) Precision (%) F_measure (%) T.gian TB (ms) Xe tăng PNL [81] 80,2 88,1 84,0 37 ET [82] 75,8 85,2 80,2 40 MIL [83] 72,1 78,3 75,1 34 Đề xuất 97,5 98,8 98,2 32 Xe tải PNL [81] 88,2 92,1 90,1 39 ET [82] 77,1 88,3 82,3 41 MIL [83] 85,8 88,2 87,0 35 Đề xuất 96,7 98,1 97,4 33 Xe u-oát PNL [81] 83,2 85,1 84,1 35 ET [82] 75,1 79,8 77,4 38 MIL [83] 84,8 84,2 84,5 33 Đề xuất 97,1 98,3 97,7 31 Kết luận Chương 3: Trong chương 3, chúng tôi đã đề xuất một giải pháp mới có tốc độ tính toán và độ chính xác cao cho việc bám các mục tiêu quân sự trong các khung ảnh vi eo. Các đóng góp khoa học cụ thể là: 1) Đề xuất một giải pháp mới có hiệu quả và tính khả thi cao trong việc bám các mục tiêu quân sự. Giải pháp đề xuất cũng hoàn toàn có thể ứng dụng cho việc bám các mục tiêu dân sự. 2) Đề xuất việc sử dụng ROI và các POI để hạn chế không gian tìm kiếm đối tượng góp phần cải thiện đáng kể tốc độ tính toán và độ chính xác trong phát hiện mục tiêu. 3) Đề xuất một mô hình toán sử dụng kết hợp đặc trưng màu và đặc trưng hướng cạnh để bám mục tiêu với các đặc trưng mẫu học trực tuyến. Chương 4. THIẾT KẾ HỆ THỐNG BÁM TỰ ĐỘNG CHO HỆ VŨ KHÍ DỰA TRÊN PHÁT HIỆN VÀ BÁM MỤC TIÊU TRONG ẢNH 4.1. Đặt vấn đề hệ thống bám tự động cho hệ vũ khí Sử dụng công nghệ xử lý ảnh và các thuật toán nhận dạng thông minh trong hệ thống trinh sát phát hiện mục tiêu cho các hệ thống vũ khí. Chương nà trình bày các bộ phận cấu thành của một hệ thống vũ khí có điều khiển. Đề xuất một mô hình động học của hệ thống bám cho hệ vũ khí, ác định mối liên hệ giữa vị trí tâm mục tiêu và tham số điều khiển (góc tầm, gốc hướng) của giá súng. 4.2. Mô tả hệ thống tự động bám mục tiêu di động Hệ giá vũ khí ám mục ti u i động được thể hiện bằng sơ đồ khối ở Hình 4.1. Hệ thống bao gồm một bệ giá quay theo hai kênh tầm và hướng, camera gắn cố định song song với trục nòng súng chuyển động đồng thời theo súng. Tâm nòng súng được quy chính trùng với tâm khung hình quan sát. 22 Hình 4.1. Sơ đồ khối hệ thống bám mục tiêu di động 4.3. Triển khai giải pháp phát hiện, bám mục tiêu trong hệ thống Phần này chỉ ra vị trí áp dụng kết quả lý thuyết vào hệ thống bám tự động cho hệ vũ khí ựa trên phát hiện và bám mục tiêu trong ảnh được trình bầ theo sơ đồ khối hình 1.5 và cụ thể trong thuật toán 4 của chương 3. 4.4. Xây dựng mô hình động học giá điều khiển Hình 4.3. Mô hình động học của hệ vũ khí khảo sát Để hướng tâm ảnh mục tiêu về tâm ảnh, chúng ta thiết lập mối quan hệ tương đối giữa biến quan sát được X0 và Y0 là tọa độ của mục tiêu trên hệ tọa độ gắn với mặt phẳng ảnh (IP), đối với biến điều khiển của giá φ và θ. Trong Hình 4.3, ta có thể nhìn thấy rằng φ và θ là các góc qua ung quanh 23 trục tương ứng là OZ và OZ’, sao cho, sau khi i chu ển tâm của mục tiêu di động có tọa độ P(X, Y, Z) sẽ được ánh xạ lên tâm của mặt phẳng ảnh. 4.5. Thử nghiệm trường bắn 4.5.1 Mô tả phương pháp thử nghiệm Thử nghiệm được thực hiện tr n trường bắn, bắn đạn thật vào mô hình bia e tăng đặt cách xa 600 m và chạy với vận tốc 25 m/s. Hình 4.5 là một số hình ảnh thử nghiệm tại trường bắn a) Trận địa bắn b) Màn hình phần mềm Hình 4.5. Hình ảnh thử nghiệm trên trường bắn 4.5.2. Quy trình tiến hành thử nghiệm Quy trình thử nghiệm được thực hiện 06 bước:Bước 1: Phổ iến các qu định và thống nhất kế hoạch ắn thử nghiệm. Bước 2: Chuẩn ị súng cấp 2, cho ảo ưỡng, kiểm tra các cơ cấu ảo đảm hoạt động ình thường theo Hình 4.5; Bước 3: Tiến hành lắp chạ thử toàn ộ hệ thống; Bước 4: Kiểm tra các vị trí lắp đặt theo đúng sơ đồ. Kích hoạt phần mềm FSCapture ghi lại kết quả bám trên màn hình; Bước 5: Tiến hành ắn theo kế hoạch, ghi lại kết quả và đặt t n cho file kết quả để thực hiện so sánh đánh giá. (Bước nà lặp lại cho tới khi kết thúc thực nghiệm); Bước 6: Kết thúc thử nghiệm. 4.5.3. Kết quả thử nghiệm Quá trình phát hiện và ám mục ti u chúng tôi ùng phần mềm lưu lại màn hình để về ử lý và đánh giá. Kết quả thu được là 100% ám được mục ti u trong quá trình thử nghiệm. Bi n ản thử nghiệm của 02 đề tài: 1. Đề tài cấp cơ sở “Giá điều khiển đa năng cho súng 14,5mm và 12,7mm”; 2. Đề tài cấp thành phố mã số “ 01C-02/02-2014-2” t n “Tổ hợp súng 12,7 điều khiển từ a phục vụ nhiệm vụ phòng không nhân ân tr n địa àn thủ đô” đạt kết quả tốt. 4.5. Kết luận chương 4 Trong chương nà trình ày nghiên cứu thử nghiệm kết quả lý thuyết trên chương 2, 3 vào một hệ giá điều khiển cho súng 14,5 mm và 12,7 mm. Kết quả 24 thử nghiệm bắn đối chứng với bắn trực tiếp bằng tay cho thấy hệ thống được bắn thông qua phần mềm phát hiện và bám ảnh mục ti u đạt kết quả tốt hơn. Đặc biệt khẳng định kết quả bắn không phụ thuộc vào yếu lĩnh của xạ thủ. KẾT LUẬN 1. Các kết quả chính của luận án Kết quả nghi n cứu của luận án được trình ầ tr n 132 trang, cấu trúc chia thành 4 chương nội ung chính, phần mở đầu, phần kết luận và kiến nghị, tài liệu tham khảo. Về phát hiện mục tiêu chuyển động, luận án đề xuất một giải pháp phát hiện mục tiêu quân sự, dùng các đặc trưng chu ển động, mầu sắc và hình dạng. Về bám mục tiêu, luận án đã đề xuất một giải pháp mới thực hiện việc bám mục tiêu quân sự dựa tr n các đặc trưng ảnh mẫu được học online. Cuối cùng, ứng ụng kết quả luận án cho 02 đề tài: 1. Đề tài cấp cơ sở “Giá điều khiển đa năng cho súng 14,5mm và 12,7mm”; 2. Đề tài cấp thành phố mã số “01C-02/02-2014-2” t n “Tổ hợp súng 12,7 điều khiển từ a phục vụ nhiệm vụ phòng không nhân ân tr n địa àn thủ đô” đạt kết quả tốt. Như vậ với giải pháp đề uất của luận án có thể áp ụng vào thực tế. 2. Những đóng góp mới Luận án với 03 đóng góp chính: 1- Đề xuất mới một giải pháp tự động phát hiện mục tiêu quân sự trong dãy ảnh động, bằng việc sử dụng đặc trưng chu ển động để ác định vùng ROI, sau đó kết hợp đặc trưng màu sắc và hình dạng để phát hiện mục tiêu. 2- Đề xuất mới một giải pháp tự động bám mục tiêu quân sự trong dãy ảnh động, từ vị trí mục ti u được phát hiện trong khung ảnh trước, để khoanh vùng mục tiêu làm giảm không gian tìm kiếm và dùng lý thuyết xác xuất để trích chọn các điểm POI, sau đó ác định mục tiêu bằng các đặc trưng ảnh. 3- Tích hợp hai giải pháp trên vào hệ thống tự động điều khiển giá súng 12,7mm và súng 14,5mm trên giải pháp tự động phát hiện, bám ảnh mục tiêu. 3. Hướng phát triển của luận án - Tích hợp hoàn chỉnh phân hệ trinh sát phát hiện tự động mục ti u cho các hệ vũ khí. Để tăng tốc độ tính toán cho phương pháp đề uất ở tr n ùng các thuật toán song song tr n các o mạch FPGA. Nghi n cứu giải pháp tái cấu trúc cảnh 3D để tăng độ chính ác ác định vị trí đối tượng mục ti u, thông qua việc sử ụng nhiều camera tha vì một camera. DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ [1]. Nguyễn Văn Hùng, 2012. Nghiên cứu thiết kế, chế tạo hệ giá điều khiển đa năng cho súng 12,7mm và 14,5 mm tự động bám ảnh mục tiêu. Tạp chí Kỹ thuật & Trang bị, số 137 - 2 [2]. Nguyễn Văn Hùng, 2013. Một phương pháp bám mục tiêu dựa trên các đặc trưng biểu đồ thu từ ảnh camera không tĩnh. Tạp chí khoa học trường Đại học Sư phạm Hà Nội, số 58. [3]. Nguyễn Văn Hùng, 2013. Về một phương pháp phát hiện đối tượng chuyển động. Tạp chí khoa học trường Đại học Sư phạm Hà Nội, số 58. [4]. Nguyễn Văn Hùng, 2013. Phương pháp phát hiện đối tượng chuyển động. Tạp chí nghiên cứu khoa học và công nghệ quân sự số 25, 06-2013. [5]. Nguyễn Văn Hùng, Trần Hoài Linh, Cao Minh Trí, 2015, Graph segmentation based method in thermal camera object detection.The 9 th SEATUC symposium, Thai Lan. [6]. Nguyễn Văn Hùng, Trần Hoài Linh, 2015, Application of Graph segmentation based method in thermal camera object detection. The 20 th IEEE International Conference on Methods and Models in Automation & Robotics – MMAR, Ba Lan. [7]. Nguyễn Văn Hùng, Nguyễn Văn Xuất, Lê Mạnh Cường, 2015, Một phương pháp phát hiện đối tượng ứng dụng trong hệ thống tự động bám mục tiêu. Kỷ yếu hội nghị quốc gia lần thứ VIII “Nghiên cứu cơ bản và ứng dụng công nghệ thông tin, VNU 9-10 tháng 7 năm 2015”. [8]. Nguyễn Văn Hùng, Nguyễn Chí Thành, Nguyễn Văn Xuất, 2015, Research design and manufacture complete system drives a versatile price for 12.7 mm and 14.5 mm gun automatically bind the target image. Hội nghị toàn quốc lần thứ 3 về Điều khiển và Tự động hoá - VCCA-2015.

Các file đính kèm theo tài liệu này:

tom_tat_luan_an_nghien_cuu_phuong_phap_xu_ly_anh_trong_phat.pdf
TomTat LuanAn NCS NguyenVanHung_English.pdf