Luận án Nghiên cứu phát triển một số thuật toán phát hiện và phân loại phương tiện từ dữ liệu video giao thông

Điều này cho thấy giá trị trọng số phân phối Gauss phù hợp với Xt có thể được tăng lên, và các giá trị phân phối khác đều giảm. Khi không có bất kỳ một phân phối Gauss trong bộ sưu tập phù hợp với các giá trị điểm ảnh mới Xt, có nghĩa là phân phối mới được tạo ra và phân phối phải ở trong các bộ sưu tập đa chế độ. Vì vậy, cần thêm một mô hình mới đơn và trong thời gian trung bình loại bỏ phân phối Gauss từ bộ sưu tập mô hình ban đầu. Phương pháp cụ thể là để loại bỏ sự phân bố Gauss với trọng lượng tối thiểu trong bộ sưu tập đa hiện tại và giới thiệu một phân phối Gauss mới trong bộ sưu tập đa theo Xt và cũng thiết lập một giá trị trọng số tương đối nhỏ và phương sai tương đối lớn

pdf136 trang | Chia sẻ: tueminh09 | Ngày: 25/01/2022 | Lượt xem: 615 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu phát triển một số thuật toán phát hiện và phân loại phương tiện từ dữ liệu video giao thông, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hị đã được cải thiện ít hơn. Lý do chính do sự thay đổi tỷ lệ học α phù hợp với sự thay đổi ánh sáng, nên số bước lặp sẽ giảm xuống, tốc độ phát hiện nền nhanh hơn. 91 Nhận xét về phương pháp: - Lựa chọn mô hình hỗn hợp Gauss, cải tiến việc lựa chọn tham số học để thích nghi với sự thay đổi ánh sáng. - Kết hợp với lưu lượng dòng quang học để phát hiện xe và đếm xe. - Vấn đề chính là lựa chọn ngưỡng để theo dõi đối tượng (độ rộng, độ dài) của khung bao đối tượng. Nếu chọn mức bé thì ảnh hưởng đến tốc độ tính toán, nếu chọn lớn thì ảnh hưởng đến độ chính xác. Với ngưỡng lớn thì những đốm sáng (lưu lượng quang học) của hai phương tiện gần nhau có thể hợp thành một, tạo ra sự phát hiện sai. - Một vấn đề đặt ra, thực hiện theo giải pháp này thì chưa có tính phân loại đối tượng. Giải pháp này mới dừng lại ở việc trả lời cho câu hỏi: có bao nhiêu đối tượng đang chuyển động trong khung hình quan tâm. 2.4. Kết luận chương 2. Chương 2 đã trình bày và đề xuất trích chọn đặc trưng đối tượng chuyển động theo BSM; phân tích đặc điểm từng phương pháp, rút ra để giảm bớt sự ảnh hưởng của ánh sáng trong môi trường ngoài trời của video giao thông cần sử dụng mô hình GMM cải tiến; trình bày phương pháp mô hình nền GMM và cải tiến mô hình nền GMM thích nghi với sự thay đổi ánh sáng. Bao gồm: 1. Trình bày nội dung và đánh giá một số thuật toán phát hiện đối tượng chuyển động bằng phương pháp trừ nền. Bao gồm 5 thuật toán: Thuật toán trừ nền cơ bản; Thuật toán trừ nền trung bình; Thuật toán -; Thuật toán - cải tiến; Thuật toán thống kê khác biệt cơ bản. Cả 5 thuật toán đều có những mặt ưu điểm và hạn chế, tùy theo điều kiện cụ thể mà có thể áp dụng. Tuy nhiên đối với bài toán phát hiện phương tiện chuyển động trong video giao thông, với điều kiện ngoài trời thì cần có sự xem xét đến yếu tố tác động của thay đổi ánh sáng. 2. Đề xuất phương pháp mô hình nền GMM thích nghi với sự thay đổi ánh sáng. Sử dụng mô hình GMM thích nghi với tham số ánh sáng để trích chọn khối đối tượng chuyển động phù hợp với môi trường ngoài trời, trong bài toán xác 92 định mật độ phương tiện giao thông. Việc tính toán tham số α được thực hiện là một hàm thông qua phân tích chế độ ánh sáng , sẽ mang lại sự phản ứng của mô hình tốt hơn về thích nghi nhanh với ánh sáng thay đổi. Hệ số  được tính thông qua công thức (2.33) và (2.34); Hệ số α được tính theo công thức (2.38); Trong đó i là hệ số thể hiện sự thay đổi ánh sáng (đột ngột i=1; dần dần i=0) ở công thức (2.37); Sự thay đổi dần dần, hay đột ngột được tính toán công thức (2.36). 3. Đề xuất phương pháp áp dụng thuật toán GMM thích nghi thay đổi ánh sáng kết hợp luồng quang học để đếm số lượng xe chuyển động trên đường cao tốc. Kết quả thực nghiệm cho thấy hệ thống phản ứng tốt với sự thay đổi ánh sáng, phù hợp với điều kiện thời tiết ngoài trời. Các kết quả được công bố tại công trình công bố số 3. 93 Chương 3. PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TỪ VIDEO DỰA TRÊN ĐẶC TRƯNG HÌNH DẠNG Chương này trình bày một số phương pháp phân loại phương tiện: Phân loại dựa trên hình dạng; Phân loại dựa trên độ dài dựa trên cơ sở lý thuyết mô- men bất biến; Phân tích và biểu diễn đường viền phương tiện trên trường số phức; Phương pháp nhận dạng phương tiện dựa trên biểu diễn đường viền trên trường số phức. 3.1. Phân đoạn khối phương tiện dựa trên kích thước Phân tích kích thước phương tiện 3.1.1. Ảnh thu được từ phép trừ nền, trong đó các phương tiện có thể tạo thành một khối, gây ra việc đếm sai, cần phải theo dõi và phân tách chúng riêng ra. Một trong những cách giải quyết là theo dõi đối tượng chuyển động dựa trên độ dài. (a) ô tô con (b) 2 ô tô dọc (c) 2 ô tô lệch phải (d) 2 ô tô lệch phải (e) 1 xe máy (f) 2 xe máy trước sau (g) 2 xe máy ngang nhau Hình 3.1. Phân tích kích thước khối xe ô tô con Phương pháp phân đoạn và nhận dạng khối ô tô sử dụng chiều dài và chiều rộng để phát hiện và nhận dạng các loại ô tô khác nhau từ các đối tượng trong khối, hoặc đối tượng đơn lẻ. 94 Do chiều dài và rộng của xe thay đổi theo kiểu xe, nên phân loại sơ bộ bằng chiều dài và chiều rộng. Nếu chiều dài của một đối tượng chuyển động là khoảng 15-17m, chiều rộng vào khoảng 3-4m, thì đối tượng đó được phân loại là một ô tô to như xe bus hay xe tải. Nếu chiều dài của đối tượng giữa khoảng 4,5-7,5m, chiều rộng giữa khoảng 1,4-3,0m, đối tượng chuyển động đó được xem như xe nhỏ, ví dụ như VAN, chuyên dùng, sedan, hay xe tải nhỏ1. Sau khi phân loại sơ bộ, phương pháp nhận dạng sẽ phân loại chính xác các xe nhỏ. Mệnh đề 3.1. Tỷ lệ chiều dài/rộng của xe Gọi U={ui, i=1..n} và V={vi, i=1..n} là tập chiều dài và tập chiều rộng của xe (ô tô, xe máy), tương ứng. K={ki=ui/vi, i=1..n} là tập tỷ lệ giữa chiều dài và chiều rộng của xe. Bộ số liệu Z=KV={zj, j=1..nn} có tính chất zizj, với  ij, (i,j  [1..nn]). Bằng thực nghiệm thống kê (Phụ lục 1) hoàn toàn có thể kiểm nghiệm được mệnh đề trên là đúng. Tỷ lệ chiều dài xe/rộng kết hợp với xem xét chiều rộng xe mang lại các bộ số liệu khác nhau, có thể phân loại được loại của phương tiện (O) là xe máy (XM), xe con (XC), xe tải (XT). Kết quả phân tích thống kê trong phụ lục 1. Gọi: d1=[1.44  1.55] ; d2 =[0.8  1.00] ; d3=[1.451.55] ; v1=[0.6750.740] ; v2=[1.4951.910] ; v3=[2.2402.500]. Ta có: { ( ) ( ) ( ) ( ) ( ) ( ) (3.1) Hình 3.11a thể hiện hình ảnh một xe con, hình 3.11g thể hiện hình ảnh của một cặp xe máy dính khối. Trong một số trường hợp khi mà tỷ lệ cao/rộng và chiều rộng của khối có thể nhập nhằng giữa một khối là ô tô với một khối là tập hợp xe máy thì xác định thêm thông số diện tích của đường viền bao quanh khối. Mệnh đề 3.2. [Diện tích đối tượng ảnh] 1 Xem “Các dạng xe” ở phụ lục 2 95 Gọi A và B là ảnh của xe một ô tô và một khối xe máy có cùng kích thước hộp bao C(l, w) có chiều dài l và chiều rộng w, gọi DT(A) và DT(B) là diện tích của A và B trong ảnh, tương ứng, gọi CV(A) và CV(B) là chu vi đường bao của khối ô tô và khối xe máy tương ứng. Ta có: ( ) ( ) ( ) ( ) (3.2) Hình chiếu của khối ô tô lên không gian 2D gần với đa giác lồi hơn so với hình chiếu của khối xe máy, hay nói cách khác khối xe máy trong không gian 2D có hình chiếu gần với đa giác lõm hơn. Do vậy, khi hai khối xe ô tô và xe máy có cùng kích thước chiều dài, chiều rộng, thì tỷ lệ giữa diện tích và chu vi của khối ô tô sẽ lớn hơn tỷ lệ của khối xe máy tương ứng (Theo tính chất của đa giác lồi, đa giác lõm). Thuật toán phân loại theo kích thước 3.1.2. Hình 3.2. Sơ đồ tổng quát phân giải theo độ dài Khối phương tiện Tính toán tham số khối 1 xe máy 1 xe con 1 xe tải 2 xe máy 2 xe con 2 xe tải Kết thúc Lớn hơn khối đôi Tách khối Không phân loại Khối đôi Bắt đầu Đúng Đúng Được Không được Sai Sai 96 Thuật toán phân loại phương tiện dựa trên kích thước (CVIL) Input: Các khối chuyển động (kết quả thuật toán EMB) Output: Loại phương tiện (ô tô con, ô tô tải, xe máy) Nội dung thuật toán: 1. Trích chọn các khối chuyển động //Sử dụng thuật toán EMB => danh sách các khối Block[i] n=DemSoKhoi(FG) For i = 1 to n Block[i] = XacDinhKhoi(FG) 2. Đối với mỗi khối chuyển động Block[i], tính toán tham số khối For i = 1 to n { u= ChieuDai(Block[i]) v= ChieuRong(Block[i]) } 3. Phân giải khối - Tỷ lệ chiều dài/chiều rộng k=u/v - Nếu thuộc khối xe máy if (v v1){ if (k  d1)  XM if (|k - Max{d1}| ≤  )  2XM if (|k =Max{d1}/2| ≤  )  2XM } - Xử lý khi thuộc khối xe con if (v v2) { if (k  d2)  XM if (|k - Max{d2}| ≤  )  2XC if (|k - Max{d2}/2| ≤  )  2XC } - Xử lý khi thuộc khối xe tải if (v v3){ if (k  d3)  XT if (|k - Max{d3}| ≤  )  2XT 97 if (|k =Max{d3}/2| ≤  )  2XT } - Nếu v không thuộc v1,v2,v3 thì: If (v<v1) loại bỏ khối If (v>v3) Phân tách khối 4. Phân tách khối If (Phantach(Block) = True)  Quay lại bước 3 else  Stop. Độ phức tạp của thuật toán CVIL: - Độ phức tạp của thuật toán CVIL phụ thuộc chính vào thuật toán EMB, do đó ta có độ phức tạp của thuật toán CVIL là O(NF  n  m). - Sai số cho phép  là giá trị sai khác về kích thước cho phép khi tính toán. Tham số này có thể được chọn qua phương pháp thực nghiệm. - Kỹ thuật phân tách khối liên quan nhiều đến kỹ thuật ghép biên, chia cắt biên, nối liền biên,... được xem như là một thách thức cho bài toán nghiên cứu tiếp tục. Một phương pháp tách khối ô tô được trình bày trong phần 3.3. - Trong một số trường hợp cụ thể có thể dùng phương pháp máy học để nhận dạng và phân loại trực tiếp những khối không rõ ràng này. Vấn đề này được trình bày trong mục 3.4. Kết quả thực nghiệm: Hệ thống thực nghiệm được cài đặt trên môi trường Microsoft Vision Studio 12 và thư viện mã nguồn mở EMGU. Sử dụng kết quả của thực nghiệm ở chương 2 để xác định các khối phương tiện (ô tô). Tham số chiều rộng, chiều dài trung bình một số loại xe của nhà sản xuất trong phụ lục 1. Dữ liệu đầu vào sử dụng bộ dữ liệu như đã sử dụng trong thực nghiệm ở chương 1, được thu thập thực tế tại 4 cung đường: Cao tốc Bắc Thăng Long - Nội bài; Đại lộ Thăng Long; Quốc lộ 1 khu vực cầu Bò Sơn - Bắc Ninh. Mỗi cung đường bao gồm 7 đoạn video thu thập dưới các điều kiện thời tiết khác nhau. 98 Bảng 3.1. Kết quả thực nghiệm thuật toán CVIL TT Cung đường Số khung hình theo dõi (Frame) Thực hiện đếm Tỷ lệ chính xác TB (%) Trực tiếp bởi người Bằng hệ thống Xe tải lớn Xe tải nhỏ Xe con Xe tải lớn Xe tải nhỏ Xe con 1 Bắc Thăng Long 1500 2 3 10 2 5 12 81.11 2 Đại lộ Thăng Long 2250 2 5 14 2 6 16 90.27 3 Quốc lộ 1 1500 4 5 11 4 6 13 89.31 4 Quốc lộ 5 1650 5 8 17 5 10 21 86.98 Bảng 3.1 cho thấy khi giao thông đông đúc (số lượng phương tiện tăng lên trong cùng một đơn vị thời gian) các ảnh chứa nhiều khối ô tô chồng lấp nhau liên tiếp, độ chính xác của hệ thống giảm. Thuật toán CVIL chỉ dựa trên hai tham số của xe đó là chiều dài và chiều rộng của các xe đơn, xe dính khối, chưa quan tâm đến vấn đề trọng tâm và vector khoảng cách từ tâm tới đường biên của khối. Một hạn chế nữa CVIL chưa xét đến phân loại xe máy và tập hợp xe máy, một loại phương tiện khá phổ biến ở Việt Nam hiện nay. Trong phần tiếp theo, trình bày thuật toán tương tự nhưng tham khảo thêm các tập huấn luyện tính thêm cả véc tơ khoảng cách để nhận diện thêm các phương tiện xe máy. 3.2. Phân loại phương tiện bằng kết hợp kích thước ảnh và hình chiếu hình dạng khối phương tiện Năm 2012, nhóm nghiên cứu Wei Zhan, Junkai Yang trong công trình nghiên cứu "Thiết kế hệ thống nhận dạng loại xe tự động, thời gian thực và ứng dụng của nó" [25] cũng đã sử dụng kết hợp hình dạng và khoảng cách nhưng các tác giả đã sử dụng kích thước ảnh và véc tơ hình dạng để phân loại và đếm xe. Trên thực tế có thể dùng kích thước tính xấp xỉ để phân loại. Cách tiếp cận được trình bày ở các mục dưới đây. 99 Ý tưởng phương pháp 3.2.1. Ảnh đối tượng chuyển động thu được từ BSM tồn tại các khối đối tượng phương tiện chuyển động. Dùng thuật toán loại bỏ nhiễu qua xác định kích thước khối để loại bỏ những khối nhỏ ra khỏi ảnh đối tượng. Dùng thuật toán gán nhãn hoàn toàn có thể tách và đánh số các khối đối tượng này. Với mỗi khối hoàn toàn xác định được độ dài, độ rộng của khối, vector biểu diễn hình dạng của đối tượng. Gọi l, w là chiều dài, chiều rộng của khối; gọi tập {d1, d2,...dn} là vector biểu diễn hình dạng đối tượng theo vector khoảng cách từ tâm khối đến đường biên của khối. Tập thuộc tính của khối được xác định là: (l, w, d1, d2,...,dn). Nếu chỉ dựa trên tập vector khoảng cách {d1, d2,...dn} hoàn toàn có thể phân loại được khối thuộc tập hợp phương tiện gì (xe máy; ô tô; tập hợp xe ô tô, xe máy,...). Tuy nhiên với dựa trên tính chất độ dài, rộng (l,w) của từng khối phương tiện, có thể kết luận nhanh khối đối tượng là khối gì. Hình 3.3. Sơ đồ tổng quát phân loại theo hình dạng Phương pháp đề nghị phối hợp phân loại dựa trên hình dạng (hình chiếu, trọng tâm và khoảng cách) kết hợp với phân tích độ dài, độ rộng khối đối tượng mang lại sự phân loại nhanh chóng và chính xác, phân loại được đa dạng hơn về chủng loại phương tiện, đặc biệt là ô tô con, xe tải, xe máy, và tập hợp các đối tượng dính khối trong trường hợp đông đúc. - Khối (1), xử lý theo phương pháp đề xuất ở chương 2; a.Hình mẫu các dạng khối b.Biểu diễn hình dạng khối CSDL hình dạng 1. Thu nhận Video, Xác định ROI, Trích chọn khung hình, Tìm đối khối, Tìm khối và gán nhãn 2. Tính toán tham số khối 3. Phân giải hình dạng 4.Phân loại 100 - Khối (2), biểu diễn hình dạng theo vector khoảng cách, độ dài, độ rộng. - Khối (3), so khớp độ dài, độ rộng ảnh và so khớp vector khoảng cách theo các chỉ số xác định trước trong CSDL. - Khối (a) và (b), huấn luyện các hình dạng, độ dài, độ rộng đối tượng trước và lưu trữ vào CSDL trong hệ thống. Giai đoạn chuẩn bị CSDL 3.2.2. Các bước tiến hành: Sưu tập hình mẫu; Xác định kích thước chiều dài, chiều rộng; Vector hóa hình chiếu đối tượng; Đánh chỉ số Index cho các Template trong tập mẫu đối sánh; Đưa ra một tập luật để so sánh nhanh theo khoảng cách, kích thước khối. Bước 1. Sưu tập hình mẫu  1 xe máy độc lập: một số loại xe như xe tay ga, xe nam, vespa,...  2,3,4,5 xe máy hợp khối theo các hình dạng khác nhau  1 xe ô tô hợp với 1,2,3,4,5 xe máy  Số mẫu sưu tập gọi là n.  Xác định kiểu hình mẫu: BlockStyle (0,1,2,3,4 tương ứng với: chưa phân loại; 1 xe máy; 1 ô tô con; 1 xe tải; hỗn hợp xe máy và ô tô). Bước 2. Xác định kích thước chiều dài, chiều rộng của khối  Xác định chiều rộng, chiều dài của khối (width, length)  Chuẩn hóa tỉ lệ kích thước tương ứng giữa chiều dài và chiều rộng. Ví dụ, độ rộng của khối là 2, độ dài là 5, chuẩn hóa tỷ lệ là [0.286, 0.714]. Bước 3. Vector hóa hình chiếu đối tượng (đa giác)  Xác định số đỉnh của đa giác: m  Xác định trọng tâm của đa giác (xc, yc)  Xác định độ dài khoảng cách từ tâm tới các đỉnh của đa giác [s1,s2,...,sm]  Chuẩn hóa vector khoảng cách [d1,d2,...,dm] Bước 4. Đánh chỉ số Index cho các Template trong tập mẫu đối sánh  Gọi tập mẫu là Template, cấu trúc của 1 Template thông qua các chỉ số, kiểu khối, độ rộng, độ dài khối và giá trị khoảng cách tương ứng. 101  Template(Index, BlockStyle, width, length, d1,d2,...,dm) o Index: 0,1,..., n; tương ứng với số lượng mẫu. o BlockStyle: 0, 1, 2 Bước 5. Đưa ra một tập luật để so sánh nhanh theo khoảng cách, kích thước khối và loại phương tiện. Bảng số liệu thống kê một số giá trị thực về độ dài, rộng, cao của phương tiện do các nhà sản xuất ô tô, xe máy được thu thập và thống kê trong bảng 1 (phần phụ lục).  Tập luật nhận dạng xe ô tô hay xe máy o 1 Xe máy: Tỷ lệ cao/rộng  [1.441.55], rộng  [0.6750.740] o 1 Xe con: Tỷ lệ cao/rộng  [0.801.00], rộng[1.4951.910] o 1 Xe tải: Tỷ lệ cao/rộng  [1.451.55], rộng [2.2402.500] Thuật toán phân loại dựa trên độ dài và hình chiếu đối tượng 3.2.3. Thuật toán phân loại xe VCALOS Đầu vào: Video Đầu ra: Loại xe/Nhóm loại xe Các bước thực hiện: Bước 1. Nhận dữ liệu khối đối tượng chuyển động từ giai đoạn phát hiện. //Phát hiện khối chuyển động Frames  Trunc(Video) Foreground  EMB (Frames) //Chỉ số hóa/gán nhãn cho các block Block[i]  Foreground Bước 2. Đối với mỗi khối, xác định đặc tính tham số từng khối //Tính toán tham số khối For each Block[i] { - Tính chiều dài Length của Block[i] - Tính chiều rộng Weight của Block - Tính trọng tâm của Block - Tính chiều dài khoảng cách từ tâm tới đường biên của Block d1, d2,..., dm - Cập nhật thuộc tính của Block 102 Properties(i, 0, width, length, d1,d2,...,dm)  Block[i] //BlockStyle, mặc định là 0, vì chưa phân loại } // Cập nhật loại khối (BlockStyle) For each Properties[i] { - Tính tỷ lệ Height/width; - Xác định BlockStyle qua tập luật; Update Properties(i, BlockStyle, width, length, d1,d2,...,dm)} Bước 3. Phân giải khối phương tiện For each Properties[i] { - Nếu width không thuộc v1,v2,v3 thì: If (v<v1) loại bỏ khối If (v>v3)  Chuyển bước 4 } Bước 4. So khớp hình dạng For each Properties[i] { For each Template[Index] { Compare Properties[i] ? Template[Index] Loại xe/Nhóm loại xe }} Return Loại xe/Nhóm loại xe Độ phức tạp tính toán: - Theo thuật toán EMB, thì bước 1 và 2 số phép tính ước tính tương đương với O(NFnm), với NF là số khung hình; n là chiều dài, m là chiều rộng của mỗi khung hình. - Tại bước 3, kích thước tối đa của mỗi Block là một khung hình, số điểm ảnh thuộc Block cần duyệt qua tối đa là nm ~ O(n2). - Tại bước 4 và 5, số phép toán < O(n2). - Tổng số phép tính ước tính: O(NFnm) + O(n2) + O(n2) ~ O(NFnm) Kết luận, độ phức tạp ước tính của thuật toán VCALOS là O(NFnm), với NF là số khung hình, n và m là kích thước ảnh từng khung hình. Kết quả thực nghiệm: 103 Phương pháp thực nghiệm tương tự như đã thực hiện đối với thuật toán CVIL. Dữ liệu cũng sử dụng lại bộ dữ liệu thu thập được như với thuật toán CVIL. Tuy nhiên đối với các video ở cung đường Đại lộ Thăng Long, không có phương tiện xe máy tham gia giao thông, nên không thực hiện trong thực nghiệm. Bảng 3.2. Bảng kết quả thực nghiệm thuật toán VCALOS TT Cung đường Số khung hình theo dõi (Frame) Thực hiện đếm Tỷ lệ chính xác TB (%) Trực tiếp bởi người Bằng hệ thống Xe tải lớn Xe tải nhỏ Xe con Xe máy Xe tải lớn Xe tải nhỏ Xe con Xe máy 1 Bắc Thăng Long 1500 2 3 10 19 2 5 12 20 84.58 2 Quốc lộ 1 1500 4 5 11 25 4 6 13 27 90.13 3 Quốc lộ 5 1650 5 8 17 24 5 10 21 26 88.31 Từ kết quả Bảng 3.2 cho thấy độ chính xác trung bình tăng lên so với thuật toán CVIL. Sự phân loại xe tải lớn về số lượng vẫn chính xác, sự biến động nhiều vẫn nằm nhiều ở xe tải nhỏ và xe con, và đối với xe máy cũng có nhiều sự sai số. 3.3. Phân loại phương tiện dựa trên đường viền biểu diễn bằng số phức Đường viền của đối tượng là một đường khép kín sau khi thực hiện các phương pháp trích chọn và xấp xỉ đường viền. Mô tả hình dạng đường viền bằng VC trên trường số phức, đồng thời áp dụng một số tính chất của vector số phức tương tự như tính chất của mô-men, dẫn đến khả năng so sánh và phân loại đường viền với nhau. Từ kết quả này có thể áp dụng để tiến hành nhận dạng các tập đường viền theo phương pháp máy học. Trước tiên huấn luyện và tạo ra 1 tập CSDL đối sánh tạo trước ở giai đoạn offline, sau đó giai đoạn online trích đường viền ra từ khối chuyển động và so sánh, đưa ra kết luận về số lượng phương tiện. 104 Sơ đồ khái quát 3.3.1. Hình 3.4. Sơ đồ khối tổng quát phân loại theo đường viền Phân loại dựa trên đường viền được chia thành 2 pha: Pha huấn luyện và Pha phân loại. Sơ đồ khái quát được minh họa trong Hình 3.4. Các khối tăng cường ảnh, tìm đường viền áp dụng các thuật toán đã có trong xử lý ảnh. Điều quan trọng ở đây là tính toán đặc trưng của đường viền. Tuy nhiên để chuẩn hóa đường viền ở cả pha huấn luyện cũng như pha phân loại cần phải thực hiện phép cân bằng hóa đường viền hay còn gọi là xấp xỉ độ dài đường viền. Xấp xỉ độ dài đường viền và thuật toán Douglas Peucker 3.3.2.  Thuật toán Douglas Peucker Ý tưởng cơ bản của thuật toán Douglas-Peucker [29] là xét xem khoảng cách lớn nhất từ đường cong tới đoạn thẳng nối hai đầu mút đường cong (Hình 3.5) có lớn hơn ngưỡng θ không. Nếu điều này đúng thì điểm xa nhất được giữ lại làm điểm chia đường cong và thuật toán được thực hiện h > θ tương tự với hai đường cong vừa tìm được. Trong trường hợp ngược lại, kết quả của thuật toán đơn giản hoá là hai điểm đầu mút của đường cong. 105 Hình 3.5 Đơn giản hóa đường công theo thuật toán Douglas Peucker Các bước thực hiện thuật toán Douglas-Peucker: • Bước 1: Chọn ngưỡng θ. • Bước 2: Tìm khoảng cách lớn nhất từ đường cong tới đoạn thẳng nối hai đầu đoạn đường cong h. • Bước 3: Nếu h ≤ θ thì dừng. • Bước 4: Nếu h > θ thì giữ lại điểm đạt cực đại này và quay trở lại bước 1. Thuật toán Douglas-Peucker: //Hàm tính đường cao từ dinh đến đoạn thẳng nối hai điểm dau, cuoi float Tinhduongcao (POINT dau, POINT cuoi, POINT dinh) { floot h; || tính đường cao returm h ; } //Hàm đệ quy nhằm đánh dấu loại bỏ các điểm trong đường cong void DPSimple(POINT *pLINE,int dau,int cuoi,BOOL *chiso,float θ) { int i, index = dau; float h, hmax = 0; for(i = dau + 1; i < cuoi; i++) { h= Tinhduongcao(pLINE[dau], pLINE[cuoi]; pLINE[i]); if(h > hmax) { hmax = h; index = i; } } if(hmax ≤ θ) for(i= dau + 1; i < cuoi, i++) chiso[i] = FALSE; else { DPSimple(PLINE, dau, index, chiso, θ); DPSimple(PLINE, index, cuoi, chiso, θ) ; } 106 } //Hàm rút gọn số lượng điểm DouglasPeucker int DouglasPeucker(POINT *pLINE, int n, float θ){ int i, j; BOOL chiso [MAX_PT]; for(i = 0; i < m; i++) //Tất cả các điểm được giữ lại chiso[i] = TRUE; DPSimple(pLINE, 0, n – 1, chiso, θ); for(i = j = 0; i < n; i ++) if (chiso [i] ==TRUE) pLINE[j++] = pLINE[i]; return j; } Theo [29] thì thuật toán DouglasPeucker có độ phức tạp tính toán là O(nlog2(n)) với n là số đỉnh của đường cong cần đơn giản hóa.  Xấp xỉ độ dài đường viền Hình 3.6. Xấp xỉ hóa đường viền Như đã trình bày ở trên về phương pháp CA, cần xác định độ dài của đường viền.Trong một bức ảnh thực, đường viền có độ dài bất kỳ. Do đó việc tìm kiếm và so sánh đường viền, tất cả chúng cần có số đỉnh đồng nhất. Quá trình này gọi là quá trình cân bằng. Đầu tiên sẽ cố định số đỉnh của VC chuẩn (ở pha huấn luyện) sẽ sử dụng trong hệ thống nhận diện, ký hiệu là p. Sau đó với mỗi đường viền A mới được tạo ra, ta tạo một đường viền vector N với độ dài p. Và có thể có 2 biến thể, hoặc đường viền ban đầu có số đỉnh lớn hơn số p hoặc nhỏ hơn số p. Nếu một đường viền ban đầu cần thiết để được sắp xếp bởi EV, ta sẽ quan tâm tới thành phần N như tổng của các EV. Quá trình cân bằng hóa, tương tự như quá trình thực hiện đơn giản hóa đường cong Douglas Peucker [29] (Hình 3.6). 107 Giảm số đỉnh của đường cong: Complex[] newPoint = new Complex[newCount]; for (int i = 0; i < newCount; i++) { double index = 1d * i * Count / newCount; int j = (int)index; double p = index - j; newPoint[i] = this[j] * (1 - p) + this[j + 1] * p; } Vấn đề là cần chọn giá trị p. Độ dài p lớn có nghĩa là tiêu tốn một lượng phí lớn vào việc đánh giá. Còn giá trị p nhỏ cần ít thông tin, độ chính xác của việc nhận dạng cũng giảm và việc nhận dạng nhiễu tăng lên. Thuật toán CCAVC 3.3.3. CCAVC (Classification based on Contour Analysis Vector Complex) Pha huấn luyện. Chuẩn bị cơ sở dữ liệu Template (Thực hiện thủ công). Thuật toán huấn luyện đặc trưng phương tiện Input: Hình ảnh (Image), Ngưỡng đường viền (ThresoldContour), Số đỉnh đường viền (d) Output: Template(i) //Tập mẫu, số lượng mẫu tùy thuộc vào dữ liệu thực tế trong quá trình huấn luyện Nội dung thuật toán: 1. Chuẩn hóa về độ phân giải mong muốn Image  ChuanHoaDoPhanGiai(Image) 2. Tìm các đường viền n  SoDuongVien(Image) Contour(i)  TimDuongVien(Image), i=1..n 3. Chuẩn hóa các đường viền For i=1 to n {//Áp dụng thuật toán đơn giản hóa 108 Contour(i) DonGianHoa(Contour(i), d)} For i=1 to n {//Tính chu vi ChuVi(i)  TinhChuVi(Contour(i))} For i=1 to n {//Loại đường viền quá nhỏ ji if ChuVi(i)> ThresoldContour then { Countour(j)  Countour(i); j++}} m=j; //m là số đường viền sau khi loại bỏ đường viền nhỏ 4. Tìm đặc trưng các đường viền For i=1 to m {//Tính toán tham số đặc trưng CV(i)  Chuvi(Contour(i)) DT(i)DienTich(Contour(i)) for j=1 to d {//Tính góc tại các đỉnh goc(i,j)=TinhGoc(Contour(i),j) } 5. Cập nhật Template For i=1 to m { Template(i)  Template(i) + (i, CV(i), DT(i)) For j=1 to d Template(i)  Template(i)+ goc(i,j) } 6. Retrurn Template (i), i=1..m ______________________________________________________________ Pha phân loại. Nhận dạng trên các tập ảnh thực tế (Thực hiện online – thời gian thực): Thuật toán phân loại phương tiện dựa trên đường viền (CCAVC) Classification based on Contour Analysis Vector Complex Input: Video/Ảnh Output: ImageCountour (Ảnh có chứa đường viền phương tiện) 109 Nội dung thuật toán: 1. Thu nhận và Xử lý sơ bộ ảnh (Làm mịn, lọc nhiễu, tăng độ tương phản) Image  Capture(Video) Image  ChuanHoaAnh(Image) 2. Tìm các đường viền n  SoDuongVien(Image) Contour(i)  TimDuongVien(Image), i=1..n 3. Chuẩn hóa các đường viền For i=1 to n {//Áp dụng thuật toán đơn giản hóa Contour(i) DonGianHoa(Contour(i), d)} For i=1 to n {//Tính chu vi ChuVi(i)  TinhChuVi(Contour(i))} For i=1 to n {//Loại đường viền quá nhỏ ji if ChuVi(i)> ThresoldContour then { Countour(j)  Countour(i); j++}} m=j; //m là số đường viền sau khi loại bỏ đường viền nhỏ 4. Tìm đặc trưng các đường viền For i=1 to m {//Tính toán tham số đặc trưng CV(i)  Chuvi(Contour(i)) DT(i)DienTich(Contour(i)) for j=1 to d {//Tính góc tại các đỉnh goc(i,j)=TinhGoc(Contour(i),j) } 5. So sánh đường viền với Template. For each đường viền phát hiện { Chọn vùng chi vi để đối sánh Chọn vùng diện tích để đối sánh 110 So sánh sự đồng dạng giữa 2 đường viền} 6. Return Độ phức tạp thuật toán: Giả sử bức ảnh đã được nhị phân hóa có kích thước n*n pixels, tìm đường viền bằng cách duyệt qua toàn bộ ảnh 2 chiều, do đó độ phức tạp tương ứng là O(n 2 ). Giả sử p là độ dài đường viền, t là số các đường viền có trong ảnh. Đối với một đường viền, độ dài của nó kiểm tra thông qua phép tích vô hướng chuẩn hóa trong tập huấn luyện và do đó mỗi đường viền chi phí hết p2 phép so sánh. Thuật toán so sánh đường viền có độ phức tạp ước tính là: O(n2p2t), với n là kích thước ảnh, t là số đường viền phát hiện được và p là độ dài đường viền. Hạn chế của phương pháp phân tích đường viền: - Hạn chế đầu tiên có liên quan tới vấn đề lựa chọn đường viền trên ảnh. Đường viền được giới hạn với một cấu trúc rời rạc nhất định. Tuy nhiên các đối tượng này được thể hiện trong môi trường thực có thể xảy ra những trường hợp: + Có một số lượng lớn các đường viền liên quan và không liên quan đến đối tượng nhận dạng. + Đối tượng trong ảnh không thể có đường biên rõ ràng, có thể nhận diện dựa trên độ sáng hoặc màu sắc so với nền, có thể bị nhiễu Tất cả những nhân tố trên dẫn tới việc đường viền không thể được lựa chọn hoặc được chọn không chính xác, không tương đồng với đường bao của đối tượng. - Hạn chế thứ hai, gây phức tạp cho phương pháp CA có liên quan tới các quy tắc của phân tích đường viền. Phương pháp CA giả sử rằng đường viền mô tả khung của các đối tượng và không quan tâm đến các phần phía sau hoặc các phần nhìn thấy không hoàn toàn của đối tượng. Do đó CA có độ ổn định kém trong các trường hợp nhiễu, không hỗ trợ sự giao cắt hoặc các phần nhìn thấy của đối tượng. 111 Kết quả thực nghiệm 3.3.4. Hình 3.7. Giao diện hệ thống thực nghiệm thuật toán CCAVC Thực nghiệm được thiết kế trên 2 dự án. Dự án 1, ContourAnalysis, thực hiện các chức năng cơ bản của phân tích đường viền, tạo được viền, TVH của đường viền, cân bằng hóa, đánh giá ICF và ACF, so sánh và tìm kiếm các mẫu. Dự án 2, ContourAnalysisProcessing , chứa các phương pháp để xử lý sơ bộ ảnh, chọn đường viền, lọc và nhận dạng. Đồng thời nó cũng chứa các công cụ để tự động tạo ra các mẫu cho việc nhận dạng các đường viền phương tiện. Dự án sử dụng thư viện OpenCV (EmguCV.NET wrapper) để xử lý. Các tham số trong thực nghiệm: Độ dài đường viền nhỏ nhất (Min contour length) = 30; Diện tích đường viền nhỏ nhất (Min contour area) = 10; Độ phân giải ảnh đầu vào: 640 x 480 (pixel). CSDL mẫu: Thực hiện tạo ra một CSDL tập mẫu các đường viền gồm 30 mẫu đường viền khác nhau từ các hình dạng 1 xe máy, 1 xe ô tô, 2 xe máy, 2 ô tô. Đường viền mẫu của xe máy được tập trung lưu trữ toàn bộ hình dạng đường viền bao quanh xe máy. Thêm một số mẫu về đường viền phần nửa trên người đi xe máy. Đối với ô tô, tập mẫu tạo ra bằng cách lưu trữ khung đường viền của kính trước ô tô. (Hình 3.9). 1. Ô tô đứng độc lập 2. Hai ô tô trước sau thẳng 3. Hai ô tô trước sau lệch trái 112 4. Hai ô tô trước sau lệch phải 5. Hai ô tô ngang nhau 6. Hai ô tô ngang nhau lệch trái 7. Hai ô tô ngang nhau lệch phải 8. Người đi xe máy chụp thẳng 9. Hai người đi xe máy trước sau thẳng hàng 10. Hai người đi xe máy trước sau lệch trái 11. Hai người đi xe máy trước sau lệch phải 12. Hai người đi xe máy ngang thẳng hàng 13. Ba người đi xe máy ngang nhau 14. Ba người đi xe máy lệch trái 15. Xe máy đi trước ô tô Hình 3.8. Giao diện hệ thống thực nghiệm thuật toán CCAVC 113 Trong quá trình nhận dạng, gán nhãn cho đường viền phát hiện được tương ứng là 1xm (một xe máy), 1oto (một ô tô), 2xm (hai xe máy), 2oto (hai ô tô),... Phương pháp đã được thực nghiệm với các ảnh tự nhiên và trong bài toán xác định mật độ phương tiện giao thông, so sánh và nhận dạng ra nhanh một xe máy, 1 ô tô, 2 xe máy dính liền nhau, 2 ô tô dính liền nhau, 1 ô tô và 1 xe máy dính liền nhau trong ảnh (Hình 3.9b). a) một xe máy; b) 2 xe máy; c) một ô tô Hình 3.9. Ví dụ về tập mẫu để so sánh Dữ liệu thực nghiệm sử dụng lại bộ dữ liệu quay trực tiếp tại các điểm cầu vượt đường cao tốc như đã trình bày trong chương 2 (Hình 2.3). Việc kiểm nghiệm phương pháp CA bằng cách kiểm thử cho ra kết quả 80% hình dạng được nhận diện. Và kết quả này chứa một số lượng các ảnh đọc xấu của các phương tiện. Do đó CA xử lý 249 ảnh với các kích thước khác nhau (từ 400*400 tới 1280*960) trong vòng 30 giây. Bên cạnh việc nhận dạng các ảnh khung hình cố định, thực hiện tốc độ cao của CA cho phép xử lý video trong chế độ thời gian thực. Thuật toán hoạt động với tốc độ 10-14Hz trên máy tính Pentium IV, 2.6GHz phù hợp với các ứng dụng thời gian thực. Độ chính xác của thuật toán đã được kiểm nghiệm thông qua việc đối sánh ảnh giao thông chụp tại một số cung đường ở Việt Nam. 114 Hướng phát triển tiếp theo là: 1) loại bỏ nhanh một số lỗi bằng cách xem xét kích thước chiều dài, chiều rộng đối tượng, ngưỡng xấp xỉ hình dạng đường viền mịn hơn, sau đó thử nghiệm giải thuật đối sánh ảnh trong một hệ thống giám sát giao thông thời gian thực; 2) xem xét đến trường hợp một đối tượng có nhiều đường viền để tăng độ chính xác và khả năng nhận dạng đối tượng đa dạng hơn. a) Nhận dạng được 2 đường viền, gán nhãn cho mỗi xe một nhãn là 1xm. b) Nhận dạng được 3 xe máy. 2 xe theo đường viền toàn bộ, 1 xe theo phần trên xe. c) Nhận dạng được một ô tô và 1 xe máy đi gần nhau. Hình 3.10. Ví dụ kết quả nhận dạng xe ô tô và xe máy 3.4. Kết luận chương 3 Trên cơ sở lý thuyết về mô-men bất biến, trong đó có các tính chất bất biến tỷ lệ, bất biến dịch chuyển và bất biến quay áp dụng cho xử lý ảnh và nhận dạng, phân loại đối tượng theo phương pháp hình dạng cho thấy một số đặc trưng về hình dạng cho phép sử dụng để phân loại phương tiện giao thông như: - Kích thước các khối đối tượng (phương tiện) trong ảnh; - Trọng tâm và khoảng cách từ trọng tâm tới đường biên; - Đường viền và phân tích các đặc trưng của đường viền biểu diễn trên trường số phức để nhận dạng và phân loại. Các phương pháp, công thức tính toán trọng tâm đa giác xấp xỉ hình dạng đối tượng, tính độ dài khoảng cách từ tâm tới cạnh đa giác xấp xỉ; Phương pháp đã được triển khai thực nghiệm cho kết quả phân loại được các loại xe con, xe tải (công trình công bố số 1). 115 Đề xuất 3 thuật toán về phân loại phương tiện trong đó có ô tô và xe máy dựa trên kích thước và hình dạng. Bao gồm: - Thuật toán phân loại theo kích thước (thuật toán CVIL); (công bố công trình số 1). - Thuật toán phân loại dựa trên kết hợp độ dài và hình chiếu đối tượng (thuật toán VCALOS). (công bố công trình số 4). - Thuật toán phân loại dựa trên đường viền biểu diễn bằng vector số phức. (công bố công trình số 2) Phương pháp phân loại dựa trên CA, có khả năng ứng dụng vào các bài toán đối sánh ảnh đòi hỏi thời gian thực. Đóng góp chính đưa ra là đề xuất sử dụng thuật toán CA, tìm kiếm độ dài đường viền để thực hiện tìm kiếm và đối sánh hai đường viền. Trong điều kiện giao thông phức tạp, các đối tượng có thể chồng lấp, nối đuôi nhau hoặc sánh ngang nhau, hoặc so le nhau tạo thành những đường viền phức tạp, việc áp dụng phương pháp CA gặp phải những khó khăn. 116 KẾT LUẬN I. Các kết quả chính của luận án Kết quả nghiên cứu của luận án được trình bày trên 121 trang, cấu trúc chia thành 3 chương nội dung chính, phần mở đầu, phần kết luận, tài liệu tham khảo và phụ lục. Về phát hiện phương tiện chuyển động, luận án đã trình bày về 05 thuật toán phát hiện đối tượng chuyển động bằng phương pháp trừ nền; phân tích và đưa ra những ưu khuyết điểm từng phương pháp, phân tích và đưa ra yêu cầu của mô hình hóa nền đối với video giao thông; đề xuất mô hình GMM thích ứng với sự thay đổi ánh sáng; áp dụng mô hình đề xuất trong thực nghiệm hệ thống đếm xe trên đường cao tốc. Về phân loại phương tiện chuyển động, luận án phân tích và đưa ra các đặc trưng quan trọng của hình dạng để áp dụng cho việc phân loại phương tiện giao thông đó là: kích thước đối; các đặc trưng hình dạng như đa giác xấp xỉ phương tiện, trọng tâm và khoảng cách từ tâm đến cạnh đa giác; chu vi đường viền. Luận án đã phân tích và xây dựng thuật toán phát hiện đối tượng chuyển động bằng mô hình GMM thích ứng thay đổi ánh sáng (chương 2); thuật toán phân loại phương tiện dựa trên kích thước và hình dạng, thuật toán phân tích đường viền phục vụ cho nhận dạng (chương 3). Các kết quả phân tích và thực nghiệm một số thuật toán được công bố trong 04 bài báo trên các tạp chí chuyên ngành và hội nghị khoa học về công nghệ thông tin. Nội dung của luận án đề cập và các kết quả được công bố phù hợp và đáp ứng được mục tiêu luận án đề ra. II. Những đóng góp mới Luận án với 03 đóng góp chính:  Cải tiến mô hình GMM thích ứng với sự biến đổi ánh sáng, bằng việc thêm tham số để ứng phó với việc thay đổi ánh sáng trong môi trường 117 thực. Kết hợp mô hình nền GMM thích ứng thay đổi ánh sáng và luồng quang học để giải quyết việc xác định mật độ xe ô tô cải thiện tốc độ tính toán và tăng độ chính xác trong trường hợp giao thông trên các đường cao tốc ở Việt Nam.  Đề xuất phương pháp phân loại kết hợp giữa phân tích hình dạng đối tượng và độ dài của đối tượng. Phương pháp nhận dạng và phân loại nhanh dựa trên cơ sở phân tích và lập chỉ mục theo các tham số đặc trưng loại, độ dài, độ rộng.  Đề xuất phương pháp phân loại dựa trên phân tích đường viền. Trích chọn đặc trưng đường viền, biểu diễn trên trường số phức, tiến hành phân loại dựa trên độ dài và hình dáng đường viền. III. Hướng nghiên cứu tiếp theo Mặc dù, tất cả các đề xuất trong nghiên cứu này có thể làm việc tốt trong một số trường hợp, các mô hình vẫn còn dễ bị lỗi và tốn thời gian. Các nghiên cứu trong tương lai có thể kiểm tra chi tiết cấu trúc không gian của khu vực quan sát; áp dụng trong học máy, được gọi là học cao cấp; xem xét trường hợp nhiều đường viền tích hợp trên một đối tượng. Đây có thể là một hướng đi mới để phát triển các hệ thống giám sát đối tượng chuyển động trên máy tính với độ chính xác cao và tỷ lệ sai số thấp. 118 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ 1. Nguyễn Văn Căn, Vũ Tuấn (2013), “Giám sát giao thông tự động dựa trên độ dài thị giác”. Tạp chí Khoa học và Công nghệ quân sự. Số 5/2013, trang 69-81. 2. Nguyễn Văn Căn, Nguyễn Đăng Tiến, Phạm Việt Trung (2014), “Phương pháp biểu diễn đường viền trên trường số phức, áp dụng cho bài toán phân loại phương tiện giao thông”. Tạp chí Khoa học và Công nghệ quân sự. Số 10/2014, trang 58-65. 3. Can Nguyen Van, Huy Huynh Van, Tao Ngo Quoc (2014), “Car counting method using Gaussian Mixture Model and Optical Flow”. The 3rd Solid State Systems Symposium-VLSIs and Semiconductor Related Technologies & The 17 th International Conference on Analog VLSI Circuits-Analog Signal and Information Processing Applications. Ho Chi Minh City, 10/2014. Proceeding, pages 192-198. 4. Can Nguyen Van, Cuong Nguyen Ngoc (2014), “Vehicle Classification in Video Based on Shape Analysis”. UKSim-AMS 8th European Modelling Symposium on Mathematical Modeling and Computer simulation Proceeding EMS '14 Proceedings of the 2014 European Modelling Symposium. IEEE Computer Society Washington, DC, USA ©2014. ISBN: 978-1-4799-7412-2, pages 151- 157. ( 119 TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Phạm Hồng Quang, Tạ Tuấn Anh (2014), Xây dựng cấu trúc hệ thống giao thông thông minh và các quy chuẩn công nghệ thông tin, truyền thông, điều khiển áp dụng trong hệ thống giao thông thông minh tại Việt Nam. Đề tài KC01.14/11-15. Trung tâm Tin học và Tính Toán, Viện Hàn lâm KHCN Việt Nam. [2] Phạm Hồng Quang (2014), Xây dựng mạng camera với hệ thống xử lý hình ảnh thông minh phục vụ điều khiển giao thông và giám sát an ninh. KC03.DA06/11- 15. Công ty Cổ phần Phần mềm - Tự động hóa - Điều khiển. [3] Trần Thanh Việt, Trần Công Chiến, Huỳnh Cao Tuấn, Nguyễn Hữu Nam, Đỗ Năng Toàn, Trần Hành (2011), Một kỹ thuật bám đối tượng và ứng dụng. Kỷ yếu hội thảo quốc gia lần thứ XIV, Cần Thơ, 10/2011. Nhà Xuất bản Khoa học và Kỹ thuật. Trang 238-247. Tiếng Anh: [4] Ahmed Elgammal (2010), Computer Vision 3D Model-based recognition. Dept of Computer Science, Rutgers University. [5] Amol A. Ambardekar (2007), Efficient Vehicle Tracking and Classification for an Automated Traffic Surveillance System, A thesis submitted in partial fulfillment of the requirements for the degree of Master of Science in Computer Science. [6] Chee-Way Chong and at al (2004), Translation and scale invariants of Legender moments, Pattern Recognition (Vol 37), pp.119-129. [7] Chung-Cheng Chiu and et al (2010), Automatic Traffic Surveillance System for Vision-Based Vehicle Recognition and Tracking. Department of Electrical and Electronic Engineering, Chung Cheng Institute of Technology National, Defense University Taoyuan, Taiwan. [8] Clement Chun Cheong Pang and at al (2007), A Method for Vehicle Count in the Presence of Multiple-Vehicle Occlusions in Traffic Images, IEEE transactions on intelligent transportation systems, (Vol. 8, No. 3). [9] Collins R. T. (2000), A system for video surveillance and monitoring: VSAM final report, Technical report (CMU-RI-TR-00-12), Robotics Institute, Carnegie Mellon University. [10] Cucchiara R. (2000), Statistic and Knowledge-based Moving Object Detection in Traffic Scenes. D.S.I. University of Modena. [11] George S.K. Fung and at al (2001), Vehicle Shape Approximation from Motion for Visual Traffic Surveillance. IEEE Intelligent Transportation Systems Conference Proceedings, USA. [12] Guohui Zhang and et al (2007), A Video-based Vehicle Detection and Classification System for Real-time Traffic Data Collection Using Uncalibrated 120 Video Cameras, Department of Civil and Environmental Engineering University of Washington. [13] Hu M. K. (1962), Moments and Moment Invariants in Pattern Recognition, IRE Trans. Info. Theory (vol.IT-8), pp.179–187. [14] Jean-Yves Bouguet (2002), Pyramidal Implementation of the Lucas Kanade Feature Tracker Description of the algorithm, Intel Corporation, Microprocessor Research Labs. [15] Lai A. H. S. (2000), An effective methodology for visual traffic surveillance, Hong Kong University. [16] Lipton A. J. (1999), Moving target classification and tracking from real-time video. In Proc. of Workshop Applications of Computer Vision, pages 129-136. [17] Massimo Piccardi (2004), Background subtraction techniques: a review, Computer Vision Research Group (CVRG), University of Technology, Sydney (UTS). [18] Nilesh J. Uke (2013), Moving Vehicle Detection for Measuring Traffic Count Using OpenCV, Journal of Automation and Control Engineering (Vol.1, No.4). [19] Nikolaos P. (2000), Algorithms for Vehicle Classification, Artificial Intelligence, Robotics and Vision Laboratory, University of Minnesota. [20] Sagar Deb (2005), Video data management and information retrieval. University Southem Queensland, Australia. [21] Shireen Y. Elhabian (2007), Moving Object Detection in Spatial Domain using Background Removal Techniques - State-of-Art, Cairo University, Egypt. [22] Sigari M., Fuzzy Running Average and Fuzzy Background Subtraction: Concepts and Application, International Journal of Computer Science and Network Security, 2008, Volume 8, No. 2, pages 138-143. [23] Stauffer C. (1999), Adaptive background mixture models for real-time tracking, Technical report (CVPR 1999), pages 246-252. [24] Thierry Bouwmans (2013), Recent Advanced Statistical Background Modeling for Foreground Detection - A Systematic Survey, Laboratoire MIA, Université de La Rochelle, France. [25] Wei Zhan, Junkai Yang (2012), Real Time and Automatic Vehicle Type Recognition System Design and Its Application, International Conference on Mechanical Engineering and Automation. [26] Yigithan Dedeoglu (2004), Moving object detection, tracking and classification for smart video surveillance, Univeristy of Bilkent. [27] Xue Mei and at al (2007), Integrated Detection, Tracking and Recognition for IR Video-based Vehicle Classification, Journal of computers (Vol.2, No.6). [28] Yu-Kumg Chen, Tung-Yi Cheng, Shuo-Tsung Chiu (2009), Motion Detection with Using Theory of Entropy. IEEE International Symposium on Industrial Electronics (ISlE 2009). 121 [29] Wu, Shin-Ting and Márquez (2004), Mercedes R. G (2004), A non-self- intersection Douglas-Peucker Algorithm, Proceedings of Sibgrapi. © 2004 IEEE. [30] Jitendra Malik, Serge Belongie, Thomas Leung, Jianbo Shi (2001), Contour and Texture Analysis for Image Segmentation. International Journal of Computer Vision, June 2001, Volume 43, Issue 1, pp 7-27. [31] Rohit Kolar, Akshay Thakar, Muzaffar Shabad (2014), Image Segmentation for Text Recognition using Boundary Analysis. International Journal of Emerging Technology and Advanced Engineering. ISSN 2250-2459, ISO 9001:2008 Certified Journal, Volume 4, Issue 2, February 2014) 294. [32] Corentin Lallier, Emanuelle Reynaud, Lionel Robinault, Laure Tougne (2011), A Testing Framework for Background Subtraction Algorithms Comparison in Intrusion Detection Context. 8 th IEEE International Conference on Advanced Video and Signal-Based Surveillance. [33] Andrews Sobral, Antoine Vacavant (2014), A comprehensive review of background subtraction algorithms evaluated with synthetic and real videos. Computer Vision and Image Understanding 122. [34] A. Vacavant, T. Chateau, A. Wilhelm, L. Lequièvre (2012), A benchmark dataset for foreground/background extraction, in: Background Models Challenge (BMC). Asian Conference on Computer Vision (ACCV), LNCS, vol. 7728, Springer, 2012, pp. 291–300. [35] Y. Dhome, N. Tronson, A. Vacavant, T. Chateau, C. Gabard, Y. Goyat, D. Gruyer (2010), A benchmark for background subtraction algorithms in monocular vision: a comparative study. IEEE International Conference on Image Processing Theory, Tools and Applications (IPTA), 2010, pp. 66– 71. [36] A. Sobral (2013), BGSLibrary: an opencv c++ background subtraction library. IX Workshop de Viso Computacional. Rio de Janeiro, Brazil. [37] Jean Dieudonné (1960), Foundations of Modern Analysis, Academic Press. 1 PHỤ LỤC Phụ lục 1. Dữ liệu kích thước các loại xe Nguồn: Internet, Đơn vị tính: mm TT Xe ô tô Dài Rộng Cao Cao/rộng 1 Xe con Toyota Camry 2.5Q AT 4825 1825 1470 0.805479 2 Xe con Chevrolet Spark Van 3495 1495 1500 1.003344 3 Xe tải Hyundai JAC 1T5 5480 1940 2140 1.103093 4 Xe tải Hyundai JAC 1T8 5710 1865 2210 1.184987 5 Xe tải Hyundai JAC 1T95 5710 1910 2250 1.17801 6 Xe tải HINO - WU422L 7160 2240 3270 1.459821 7 Xe tải HINO - FC9JJSA 6T2 8250 2400 3680 1.533333 8 Xe tải HINO - FG8JPSB 9T2 9550 2500 3950 1.58 9 Xe tải HINO - FL8JTSL 16T 11450 2500 3930 1.572 TT Xe máy Dài Rộng Cao Cao/rộng 1 Honda Future 1932 711 1092 1.535865 2 Yamaha Sirius 1890 675 1030 1.525926 3 DaeHan Exciter GP 1776 697 1005 1.441894 4 Honda SH 150i và SH 125i 2034 740 1152 1.556757 5 Honda Lead 125cc Fi 1832 680 1120 1.647059 6 Suzuki Hayate 125 1935 670 1070 1.597015 7 Suzuki Hayate SS 125 FI 1925 660 1070 1.621212 8 Honda Wave 110 S Deluxe 1925 710 1090 1.535211 9 Honda SH125 Mode 1930 669 1105 1.651719 10 Honda Wave Alpha 1910 700 1065 1.521429 11 Honda Air Blade Fi 125cc 1901 670 1115 1.664179 12 Honda Vision 110cc Fi 1841 667 1094 1.64018 13 Suzuki X-Bike 125 1905 715 1070 1.496503 14 Honda Lead 110cc 1835 670 1125 1.679104 15 SYM Attila Elizabeth EFI 1795 668 1100 1.646707 16 Yamaha Nouvo SX RC 1955 705 1080 1.531915 17 Yamaha Exciter 1960 695 1080 1.553957 18 Honda Wave 110 RSX 1898 709 1080 1.523272 19 Suzuki Smash Revo 110 1920 655 1050 1.603053 20 Honda SH150i 2020 700 1140 1.628571 21 Suzuki X-Bike 125 1905 715 1070 1.496503 22 Honda Future 125 FI 1932 711 1092 1.535865 23 Yamaha Luvias GTX125 Fi 1855 700 1070 1.528571 24 Honda Super Dream 1915 696 1052 1.511494 25 Suzuki Smash Revo 1920 655 1055 1.610687 26 HONDA SCR 1830 681 1125 1.651982 27 Sym Shark 170cc 2090 730 1160 1.589041 28 Yamaha Nozza 1795 685 1080 1.576642 2 29 Honda Click Forward 125i 1904 689 1103 1.600871 30 Suzuki UA 125T Fi 1860 700 1095 1.564286 31 Honda CBR150R 1977 695 1130 1.625899 32 Suzuki GZ150–A 150cc 2250 900 1160 1.288889 33 Yamaha Luvias GTX 1850 685 1060 1.547445 34 Honda Click 125i Idling 1919 689 1103 1.600871 35 Yamaha Cuxi 1750 635 1055 1.661417 36 Suzuki Axelo 125 1895 715 1075 1.503497 37 Suzuki Viva 115 Fi 1910 690 1085 1.572464 38 Honda Scoopy FI Club 1856 694 1060 1.527378 39 Honda Spacy 125 1795 690 1070 1.550725 40 SYM Joyride EFI 1900 680 1100 1.617647 41 Piaggio Liberty RST 125 1935 760 1120 1.473684 42 Yamaha Mio Classico 1830 675 1040 1.540741 43 Honda Mojet 125 1814 675 1100 1.62963 44 Honda Taranis 110 TQuốc 1890 680 1110 1.632353 45 Honda PCX 1917 738 1094 1.482385 46 SYM ElegantSR 1910 680 1100 1.617647 47 Suzuki EN150-A 2055 730 1050 1.438356 48 Honda Scoopy i S12 1856 694 1060 1.527378 49 Kymco Candy 50cc 1815 675 1108 1.641481 50 Kymco Candy Hi 110cc 1820 680 1100 1.617647 51 Honda Super Cub 110 1915 700 1050 1.5 52 Honda Giorno 50cc Fi 1685 650 1035 1.592308 53 Honda PS150i 1990 700 1150 1.642857 54 Suzuki SkyDrive 125 1900 655 1050 1.603053 55 Honda Diamond Blue 125 1800 733 1150 1.568895 Nhỏ nhất 1685 635 1005 1.288889 Lớn nhất 2250 900 1160 1.679104 Trung bình 1897.436 695.0182 1088.182 1.568584 3 Phụ lục 2. Một số kiểu xe ô tô (Nguồn thu thập trên Internet) 1. VAN: Van là một loại xe tải nhỏ, khoang chở người và trở hàng chung một không gian kín. Loại xe này có đặc điểm là khi không trở người các hàng ghế sau có thể gập lại thành khoang chứa hàng. Cửa bên thông thường là cửa lùa tạo điều kiện hoạt động trong không gian hẹp. Vì là loại xe có tải trọng thường chỉ từ 500 – 1.000 kg nên công suất không lớn. Ở Việt Nam dòng xe VAN (thực chất là minivan) có khá nhiều, có thể nêu lên một vài loại xe mang tên VAN sau đây: Xe Daihatsu Citivan – có hình dáng mẫu mã rất bắt mắt, kết hợp hài hoà tính năng dòng xe du lịch với xe VAN. Xe Daihatsu Citivan lắp động cơ xăng kiểu HD-C có dung tích công tác 0,6 lít, xi-lanh thẳng hàng, 6 xu- páp bố trí trục cam kiểu SOHC. Mô men xoắn Nm, 5 số tay. Số ghế: 7. Hai cửa lùa bên hông, cửa sau mở lên. Hàng ghế thứ. tháo lắp dễ dàng để tạo khoang chứa hàng hoá. Ngoài Daihatsu Citivan ra, loại xe Devan chở hàng thùng kín, cửa lùa bên hông cũng lắp động cơ HD-C cùng loại với Citivan. Loại xe Toyota Hiace Glass VAN. Đây là dòng xe VAN cao cấp, hàng ghế sau gập lại rất dễ tạo khoang hàng rộng rãi. Hai cửa hông là loại cửa lùa, cửa sau mở bằng khí nén. Xe Hiace Glass VAN dùng động cơ phun xăng điện tử. Hộp số 5 số tay. Hai điều hoà nhiệt độ. Loại xe SUZUKI Super Carry VAN. Đây là loại xe nhỏ nhất hiện đang sử dụng ở nước ta, xe SUZUKI VAN có hai loại: xe khách 7 chỗ Windowvan và xe tải cửa lùa Blindvan. Hai loại xe trên đều dùng động cơ xăng F.0A, xi-lanh thẳng hàng, dung tích công tác 70cm. Mômen xoắn 75Nm. Hộp số 5 số tay. Số ghế 7. Hai hàng ghế sau có thể gập lại để tạo khoang chứa hành lý. 2. SUV 4 SUV được EuroNCAP xếp vào nhóm xe địa hình loại lớn. SUV khá quen thuộc hơn với thị trường Việt Nam với các model như Mitsubishi Pajero, Toyota Land Cruiser, Mercedes-Benz M-Class. SUV là loại xe dẫn động 4 bánh (còn gọi là xe hai cầu) có thể chạy trên nhiều loại địa hình, có hệ thống treo cao. Trọng tâm cao là một điểm bất lợi của loại xe này vì làm cho nó dễ bị lăn khi chẳng may gặp tai nạn. Vì thiết kế lớn hơn nên SUV cũng sử dụng nhiều nhiên liệu hơn. 3. Sedan Sedan là một loại xe khách mà thân xe đại thể chia làm ba khoang: khoang động cơ, khoang hành khách và khoang hành lý. Ở Anh, người ta gọi loại xe này là xe saloon. Khoang hành khách thường gồm hai dãy ghế. Khoang động cơ thường ở phía trước. Còn khoang hành lý thường ở phía sau. Cũng có một số xe sedan mà khoang động cơ lại ở phía sau như Renault Dauphine, Tatra T613, Volkswagen Type 3 và Chevrolet Corvair. Sedan là loại thân xe khách phổ biến nhất.

Các file đính kèm theo tài liệu này:

  • pdfluan_an_nghien_cuu_phat_trien_mot_so_thuat_toan_phat_hien_va.pdf
Luận văn liên quan