Điều này cho thấy giá trị trọng số phân phối Gauss phù hợp với Xt có thể
được tăng lên, và các giá trị phân phối khác đều giảm.
Khi không có bất kỳ một phân phối Gauss trong bộ sưu tập phù hợp với các
giá trị điểm ảnh mới Xt, có nghĩa là phân phối mới được tạo ra và phân phối phải
ở trong các bộ sưu tập đa chế độ. Vì vậy, cần thêm một mô hình mới đơn và
trong thời gian trung bình loại bỏ phân phối Gauss từ bộ sưu tập mô hình ban
đầu. Phương pháp cụ thể là để loại bỏ sự phân bố Gauss với trọng lượng tối
thiểu trong bộ sưu tập đa hiện tại và giới thiệu một phân phối Gauss mới trong
bộ sưu tập đa theo Xt và cũng thiết lập một giá trị trọng số tương đối nhỏ và
phương sai tương đối lớn
136 trang |
Chia sẻ: tueminh09 | Ngày: 25/01/2022 | Lượt xem: 615 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu phát triển một số thuật toán phát hiện và phân loại phương tiện từ dữ liệu video giao thông, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hị đã
được cải thiện ít hơn. Lý do chính do sự thay đổi tỷ lệ học α phù hợp với sự thay
đổi ánh sáng, nên số bước lặp sẽ giảm xuống, tốc độ phát hiện nền nhanh hơn.
91
Nhận xét về phương pháp:
- Lựa chọn mô hình hỗn hợp Gauss, cải tiến việc lựa chọn tham số học để
thích nghi với sự thay đổi ánh sáng.
- Kết hợp với lưu lượng dòng quang học để phát hiện xe và đếm xe.
- Vấn đề chính là lựa chọn ngưỡng để theo dõi đối tượng (độ rộng, độ dài)
của khung bao đối tượng. Nếu chọn mức bé thì ảnh hưởng đến tốc độ tính toán,
nếu chọn lớn thì ảnh hưởng đến độ chính xác. Với ngưỡng lớn thì những đốm
sáng (lưu lượng quang học) của hai phương tiện gần nhau có thể hợp thành một,
tạo ra sự phát hiện sai.
- Một vấn đề đặt ra, thực hiện theo giải pháp này thì chưa có tính phân loại
đối tượng. Giải pháp này mới dừng lại ở việc trả lời cho câu hỏi: có bao nhiêu
đối tượng đang chuyển động trong khung hình quan tâm.
2.4. Kết luận chương 2.
Chương 2 đã trình bày và đề xuất trích chọn đặc trưng đối tượng chuyển
động theo BSM; phân tích đặc điểm từng phương pháp, rút ra để giảm bớt sự
ảnh hưởng của ánh sáng trong môi trường ngoài trời của video giao thông cần sử
dụng mô hình GMM cải tiến; trình bày phương pháp mô hình nền GMM và cải
tiến mô hình nền GMM thích nghi với sự thay đổi ánh sáng. Bao gồm:
1. Trình bày nội dung và đánh giá một số thuật toán phát hiện đối tượng
chuyển động bằng phương pháp trừ nền. Bao gồm 5 thuật toán: Thuật toán trừ
nền cơ bản; Thuật toán trừ nền trung bình; Thuật toán -; Thuật toán - cải
tiến; Thuật toán thống kê khác biệt cơ bản. Cả 5 thuật toán đều có những mặt ưu
điểm và hạn chế, tùy theo điều kiện cụ thể mà có thể áp dụng. Tuy nhiên đối với
bài toán phát hiện phương tiện chuyển động trong video giao thông, với điều
kiện ngoài trời thì cần có sự xem xét đến yếu tố tác động của thay đổi ánh sáng.
2. Đề xuất phương pháp mô hình nền GMM thích nghi với sự thay đổi ánh
sáng.
Sử dụng mô hình GMM thích nghi với tham số ánh sáng để trích chọn khối
đối tượng chuyển động phù hợp với môi trường ngoài trời, trong bài toán xác
92
định mật độ phương tiện giao thông. Việc tính toán tham số α được thực hiện là
một hàm thông qua phân tích chế độ ánh sáng , sẽ mang lại sự phản ứng của
mô hình tốt hơn về thích nghi nhanh với ánh sáng thay đổi.
Hệ số được tính thông qua công thức (2.33) và (2.34);
Hệ số α được tính theo công thức (2.38);
Trong đó i là hệ số thể hiện sự thay đổi ánh sáng (đột ngột i=1; dần dần
i=0) ở công thức (2.37);
Sự thay đổi dần dần, hay đột ngột được tính toán công thức (2.36).
3. Đề xuất phương pháp áp dụng thuật toán GMM thích nghi thay đổi ánh
sáng kết hợp luồng quang học để đếm số lượng xe chuyển động trên đường cao
tốc. Kết quả thực nghiệm cho thấy hệ thống phản ứng tốt với sự thay đổi ánh
sáng, phù hợp với điều kiện thời tiết ngoài trời.
Các kết quả được công bố tại công trình công bố số 3.
93
Chương 3. PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TỪ VIDEO DỰA
TRÊN ĐẶC TRƯNG HÌNH DẠNG
Chương này trình bày một số phương pháp phân loại phương tiện: Phân
loại dựa trên hình dạng; Phân loại dựa trên độ dài dựa trên cơ sở lý thuyết mô-
men bất biến; Phân tích và biểu diễn đường viền phương tiện trên trường số
phức; Phương pháp nhận dạng phương tiện dựa trên biểu diễn đường viền trên
trường số phức.
3.1. Phân đoạn khối phương tiện dựa trên kích thước
Phân tích kích thước phương tiện 3.1.1.
Ảnh thu được từ phép trừ nền, trong đó các phương tiện có thể tạo thành
một khối, gây ra việc đếm sai, cần phải theo dõi và phân tách chúng riêng ra.
Một trong những cách giải quyết là theo dõi đối tượng chuyển động dựa trên độ
dài.
(a) ô tô con (b) 2 ô tô dọc (c) 2 ô tô lệch phải (d) 2 ô tô lệch phải
(e) 1 xe máy (f) 2 xe máy trước sau (g) 2 xe máy ngang nhau
Hình 3.1. Phân tích kích thước khối xe ô tô con
Phương pháp phân đoạn và nhận dạng khối ô tô sử dụng chiều dài và chiều
rộng để phát hiện và nhận dạng các loại ô tô khác nhau từ các đối tượng trong
khối, hoặc đối tượng đơn lẻ.
94
Do chiều dài và rộng của xe thay đổi theo kiểu xe, nên phân loại sơ bộ bằng
chiều dài và chiều rộng. Nếu chiều dài của một đối tượng chuyển động là
khoảng 15-17m, chiều rộng vào khoảng 3-4m, thì đối tượng đó được phân loại
là một ô tô to như xe bus hay xe tải. Nếu chiều dài của đối tượng giữa khoảng
4,5-7,5m, chiều rộng giữa khoảng 1,4-3,0m, đối tượng chuyển động đó được
xem như xe nhỏ, ví dụ như VAN, chuyên dùng, sedan, hay xe tải nhỏ1. Sau khi
phân loại sơ bộ, phương pháp nhận dạng sẽ phân loại chính xác các xe nhỏ.
Mệnh đề 3.1. Tỷ lệ chiều dài/rộng của xe
Gọi U={ui, i=1..n} và V={vi, i=1..n} là tập chiều dài và tập chiều rộng của
xe (ô tô, xe máy), tương ứng. K={ki=ui/vi, i=1..n} là tập tỷ lệ giữa chiều dài và
chiều rộng của xe. Bộ số liệu Z=KV={zj, j=1..nn} có tính chất zizj, với
ij, (i,j [1..nn]).
Bằng thực nghiệm thống kê (Phụ lục 1) hoàn toàn có thể kiểm nghiệm
được mệnh đề trên là đúng.
Tỷ lệ chiều dài xe/rộng kết hợp với xem xét chiều rộng xe mang lại các bộ
số liệu khác nhau, có thể phân loại được loại của phương tiện (O) là xe máy
(XM), xe con (XC), xe tải (XT). Kết quả phân tích thống kê trong phụ lục 1.
Gọi: d1=[1.44 1.55] ; d2 =[0.8 1.00] ; d3=[1.451.55] ;
v1=[0.6750.740] ; v2=[1.4951.910] ; v3=[2.2402.500].
Ta có:
{
(
) ( )
(
) ( )
(
) ( )
(3.1)
Hình 3.11a thể hiện hình ảnh một xe con, hình 3.11g thể hiện hình ảnh của
một cặp xe máy dính khối. Trong một số trường hợp khi mà tỷ lệ cao/rộng và
chiều rộng của khối có thể nhập nhằng giữa một khối là ô tô với một khối là tập
hợp xe máy thì xác định thêm thông số diện tích của đường viền bao quanh khối.
Mệnh đề 3.2. [Diện tích đối tượng ảnh]
1
Xem “Các dạng xe” ở phụ lục 2
95
Gọi A và B là ảnh của xe một ô tô và một khối xe máy có cùng kích thước
hộp bao C(l, w) có chiều dài l và chiều rộng w, gọi DT(A) và DT(B) là diện tích
của A và B trong ảnh, tương ứng, gọi CV(A) và CV(B) là chu vi đường bao của
khối ô tô và khối xe máy tương ứng. Ta có:
( )
( )
( )
( )
(3.2)
Hình chiếu của khối ô tô lên không gian 2D gần với đa giác lồi hơn so với
hình chiếu của khối xe máy, hay nói cách khác khối xe máy trong không gian
2D có hình chiếu gần với đa giác lõm hơn. Do vậy, khi hai khối xe ô tô và xe
máy có cùng kích thước chiều dài, chiều rộng, thì tỷ lệ giữa diện tích và chu vi
của khối ô tô sẽ lớn hơn tỷ lệ của khối xe máy tương ứng (Theo tính chất của đa
giác lồi, đa giác lõm).
Thuật toán phân loại theo kích thước 3.1.2.
Hình 3.2. Sơ đồ tổng quát phân giải theo độ dài
Khối phương tiện
Tính toán tham số khối
1 xe máy
1 xe con
1 xe tải
2 xe máy 2 xe con 2 xe tải
Kết thúc
Lớn hơn khối
đôi
Tách khối
Không phân loại
Khối đôi
Bắt đầu
Đúng
Đúng
Được
Không
được
Sai
Sai
96
Thuật toán phân loại phương tiện dựa trên kích thước (CVIL)
Input: Các khối chuyển động (kết quả thuật toán EMB)
Output: Loại phương tiện (ô tô con, ô tô tải, xe máy)
Nội dung thuật toán:
1. Trích chọn các khối chuyển động
//Sử dụng thuật toán EMB => danh sách các khối Block[i]
n=DemSoKhoi(FG)
For i = 1 to n
Block[i] = XacDinhKhoi(FG)
2. Đối với mỗi khối chuyển động Block[i], tính toán tham số
khối
For i = 1 to n {
u= ChieuDai(Block[i])
v= ChieuRong(Block[i])
}
3. Phân giải khối
- Tỷ lệ chiều dài/chiều rộng k=u/v
- Nếu thuộc khối xe máy
if (v v1){
if (k d1) XM
if (|k - Max{d1}| ≤ ) 2XM
if (|k =Max{d1}/2| ≤ ) 2XM
}
- Xử lý khi thuộc khối xe con
if (v v2) {
if (k d2) XM
if (|k - Max{d2}| ≤ ) 2XC
if (|k - Max{d2}/2| ≤ ) 2XC
}
- Xử lý khi thuộc khối xe tải
if (v v3){
if (k d3) XT
if (|k - Max{d3}| ≤ ) 2XT
97
if (|k =Max{d3}/2| ≤ ) 2XT
}
- Nếu v không thuộc v1,v2,v3 thì:
If (v<v1) loại bỏ khối
If (v>v3) Phân tách khối
4. Phân tách khối
If (Phantach(Block) = True) Quay lại bước 3
else Stop.
Độ phức tạp của thuật toán CVIL:
- Độ phức tạp của thuật toán CVIL phụ thuộc chính vào thuật toán EMB,
do đó ta có độ phức tạp của thuật toán CVIL là O(NF n m).
- Sai số cho phép là giá trị sai khác về kích thước cho phép khi tính toán.
Tham số này có thể được chọn qua phương pháp thực nghiệm.
- Kỹ thuật phân tách khối liên quan nhiều đến kỹ thuật ghép biên, chia cắt
biên, nối liền biên,... được xem như là một thách thức cho bài toán nghiên cứu
tiếp tục. Một phương pháp tách khối ô tô được trình bày trong phần 3.3.
- Trong một số trường hợp cụ thể có thể dùng phương pháp máy học để
nhận dạng và phân loại trực tiếp những khối không rõ ràng này. Vấn đề này
được trình bày trong mục 3.4.
Kết quả thực nghiệm:
Hệ thống thực nghiệm được cài đặt trên môi trường Microsoft Vision
Studio 12 và thư viện mã nguồn mở EMGU. Sử dụng kết quả của thực nghiệm ở
chương 2 để xác định các khối phương tiện (ô tô). Tham số chiều rộng, chiều dài
trung bình một số loại xe của nhà sản xuất trong phụ lục 1.
Dữ liệu đầu vào sử dụng bộ dữ liệu như đã sử dụng trong thực nghiệm ở
chương 1, được thu thập thực tế tại 4 cung đường: Cao tốc Bắc Thăng Long -
Nội bài; Đại lộ Thăng Long; Quốc lộ 1 khu vực cầu Bò Sơn - Bắc Ninh. Mỗi
cung đường bao gồm 7 đoạn video thu thập dưới các điều kiện thời tiết khác
nhau.
98
Bảng 3.1. Kết quả thực nghiệm thuật toán CVIL
TT
Cung đường
Số
khung
hình
theo dõi
(Frame)
Thực hiện đếm Tỷ lệ
chính
xác
TB
(%)
Trực tiếp bởi người Bằng hệ thống
Xe tải
lớn
Xe tải
nhỏ
Xe
con
Xe tải
lớn
Xe tải
nhỏ
Xe
con
1 Bắc Thăng
Long
1500 2 3 10 2 5 12 81.11
2 Đại lộ
Thăng Long
2250 2 5 14 2 6 16 90.27
3 Quốc lộ 1 1500 4 5 11 4 6 13 89.31
4 Quốc lộ 5 1650 5 8 17 5 10 21 86.98
Bảng 3.1 cho thấy khi giao thông đông đúc (số lượng phương tiện tăng
lên trong cùng một đơn vị thời gian) các ảnh chứa nhiều khối ô tô chồng lấp
nhau liên tiếp, độ chính xác của hệ thống giảm.
Thuật toán CVIL chỉ dựa trên hai tham số của xe đó là chiều dài và chiều
rộng của các xe đơn, xe dính khối, chưa quan tâm đến vấn đề trọng tâm và
vector khoảng cách từ tâm tới đường biên của khối. Một hạn chế nữa CVIL chưa
xét đến phân loại xe máy và tập hợp xe máy, một loại phương tiện khá phổ biến
ở Việt Nam hiện nay.
Trong phần tiếp theo, trình bày thuật toán tương tự nhưng tham khảo thêm
các tập huấn luyện tính thêm cả véc tơ khoảng cách để nhận diện thêm các
phương tiện xe máy.
3.2. Phân loại phương tiện bằng kết hợp kích thước ảnh và hình chiếu hình
dạng khối phương tiện
Năm 2012, nhóm nghiên cứu Wei Zhan, Junkai Yang trong công trình
nghiên cứu "Thiết kế hệ thống nhận dạng loại xe tự động, thời gian thực và ứng
dụng của nó" [25] cũng đã sử dụng kết hợp hình dạng và khoảng cách nhưng các
tác giả đã sử dụng kích thước ảnh và véc tơ hình dạng để phân loại và đếm xe.
Trên thực tế có thể dùng kích thước tính xấp xỉ để phân loại. Cách tiếp cận được
trình bày ở các mục dưới đây.
99
Ý tưởng phương pháp 3.2.1.
Ảnh đối tượng chuyển động thu được từ BSM tồn tại các khối đối tượng
phương tiện chuyển động. Dùng thuật toán loại bỏ nhiễu qua xác định kích
thước khối để loại bỏ những khối nhỏ ra khỏi ảnh đối tượng. Dùng thuật toán
gán nhãn hoàn toàn có thể tách và đánh số các khối đối tượng này.
Với mỗi khối hoàn toàn xác định được độ dài, độ rộng của khối, vector
biểu diễn hình dạng của đối tượng. Gọi l, w là chiều dài, chiều rộng của khối;
gọi tập {d1, d2,...dn} là vector biểu diễn hình dạng đối tượng theo vector khoảng
cách từ tâm khối đến đường biên của khối. Tập thuộc tính của khối được xác
định là: (l, w, d1, d2,...,dn).
Nếu chỉ dựa trên tập vector khoảng cách {d1, d2,...dn} hoàn toàn có thể phân
loại được khối thuộc tập hợp phương tiện gì (xe máy; ô tô; tập hợp xe ô tô, xe
máy,...). Tuy nhiên với dựa trên tính chất độ dài, rộng (l,w) của từng khối
phương tiện, có thể kết luận nhanh khối đối tượng là khối gì.
Hình 3.3. Sơ đồ tổng quát phân loại theo hình dạng
Phương pháp đề nghị phối hợp phân loại dựa trên hình dạng (hình chiếu,
trọng tâm và khoảng cách) kết hợp với phân tích độ dài, độ rộng khối đối tượng
mang lại sự phân loại nhanh chóng và chính xác, phân loại được đa dạng hơn về
chủng loại phương tiện, đặc biệt là ô tô con, xe tải, xe máy, và tập hợp các đối
tượng dính khối trong trường hợp đông đúc.
- Khối (1), xử lý theo phương pháp đề xuất ở chương 2;
a.Hình mẫu các dạng khối
b.Biểu diễn hình dạng khối
CSDL hình dạng
1. Thu nhận Video,
Xác định ROI,
Trích chọn khung hình,
Tìm đối khối,
Tìm khối và gán nhãn
2. Tính toán tham số khối
3. Phân giải hình dạng
4.Phân
loại
100
- Khối (2), biểu diễn hình dạng theo vector khoảng cách, độ dài, độ rộng.
- Khối (3), so khớp độ dài, độ rộng ảnh và so khớp vector khoảng cách theo
các chỉ số xác định trước trong CSDL.
- Khối (a) và (b), huấn luyện các hình dạng, độ dài, độ rộng đối tượng trước
và lưu trữ vào CSDL trong hệ thống.
Giai đoạn chuẩn bị CSDL 3.2.2.
Các bước tiến hành: Sưu tập hình mẫu; Xác định kích thước chiều dài,
chiều rộng; Vector hóa hình chiếu đối tượng; Đánh chỉ số Index cho các
Template trong tập mẫu đối sánh; Đưa ra một tập luật để so sánh nhanh theo
khoảng cách, kích thước khối.
Bước 1. Sưu tập hình mẫu
1 xe máy độc lập: một số loại xe như xe tay ga, xe nam, vespa,...
2,3,4,5 xe máy hợp khối theo các hình dạng khác nhau
1 xe ô tô hợp với 1,2,3,4,5 xe máy
Số mẫu sưu tập gọi là n.
Xác định kiểu hình mẫu: BlockStyle (0,1,2,3,4 tương ứng với: chưa phân
loại; 1 xe máy; 1 ô tô con; 1 xe tải; hỗn hợp xe máy và ô tô).
Bước 2. Xác định kích thước chiều dài, chiều rộng của khối
Xác định chiều rộng, chiều dài của khối (width, length)
Chuẩn hóa tỉ lệ kích thước tương ứng giữa chiều dài và chiều rộng. Ví
dụ, độ rộng của khối là 2, độ dài là 5, chuẩn hóa tỷ lệ là [0.286, 0.714].
Bước 3. Vector hóa hình chiếu đối tượng (đa giác)
Xác định số đỉnh của đa giác: m
Xác định trọng tâm của đa giác (xc, yc)
Xác định độ dài khoảng cách từ tâm tới các đỉnh của đa giác [s1,s2,...,sm]
Chuẩn hóa vector khoảng cách [d1,d2,...,dm]
Bước 4. Đánh chỉ số Index cho các Template trong tập mẫu đối sánh
Gọi tập mẫu là Template, cấu trúc của 1 Template thông qua các chỉ số,
kiểu khối, độ rộng, độ dài khối và giá trị khoảng cách tương ứng.
101
Template(Index, BlockStyle, width, length, d1,d2,...,dm)
o Index: 0,1,..., n; tương ứng với số lượng mẫu.
o BlockStyle: 0, 1, 2
Bước 5. Đưa ra một tập luật để so sánh nhanh theo khoảng cách, kích thước
khối và loại phương tiện.
Bảng số liệu thống kê một số giá trị thực về độ dài, rộng, cao của phương
tiện do các nhà sản xuất ô tô, xe máy được thu thập và thống kê trong bảng 1
(phần phụ lục).
Tập luật nhận dạng xe ô tô hay xe máy
o 1 Xe máy: Tỷ lệ cao/rộng [1.441.55], rộng [0.6750.740]
o 1 Xe con: Tỷ lệ cao/rộng [0.801.00], rộng[1.4951.910]
o 1 Xe tải: Tỷ lệ cao/rộng [1.451.55], rộng [2.2402.500]
Thuật toán phân loại dựa trên độ dài và hình chiếu đối tượng 3.2.3.
Thuật toán phân loại xe VCALOS
Đầu vào: Video
Đầu ra: Loại xe/Nhóm loại xe
Các bước thực hiện:
Bước 1. Nhận dữ liệu khối đối tượng chuyển động từ giai đoạn phát hiện.
//Phát hiện khối chuyển động
Frames Trunc(Video)
Foreground EMB (Frames)
//Chỉ số hóa/gán nhãn cho các block
Block[i] Foreground
Bước 2. Đối với mỗi khối, xác định đặc tính tham số từng khối
//Tính toán tham số khối
For each Block[i] {
- Tính chiều dài Length của Block[i]
- Tính chiều rộng Weight của Block
- Tính trọng tâm của Block
- Tính chiều dài khoảng cách từ tâm tới đường biên của Block
d1, d2,..., dm
- Cập nhật thuộc tính của Block
102
Properties(i, 0, width, length, d1,d2,...,dm) Block[i]
//BlockStyle, mặc định là 0, vì chưa phân loại
}
// Cập nhật loại khối (BlockStyle)
For each Properties[i] {
- Tính tỷ lệ Height/width;
- Xác định BlockStyle qua tập luật;
Update Properties(i, BlockStyle, width, length, d1,d2,...,dm)}
Bước 3. Phân giải khối phương tiện
For each Properties[i] {
- Nếu width không thuộc v1,v2,v3 thì:
If (v<v1) loại bỏ khối
If (v>v3) Chuyển bước 4
}
Bước 4. So khớp hình dạng
For each Properties[i] {
For each Template[Index] {
Compare Properties[i] ? Template[Index] Loại xe/Nhóm loại xe
}}
Return Loại xe/Nhóm loại xe
Độ phức tạp tính toán:
- Theo thuật toán EMB, thì bước 1 và 2 số phép tính ước tính tương đương
với O(NFnm), với NF là số khung hình; n là chiều dài, m là chiều rộng của
mỗi khung hình.
- Tại bước 3, kích thước tối đa của mỗi Block là một khung hình, số điểm
ảnh thuộc Block cần duyệt qua tối đa là nm ~ O(n2).
- Tại bước 4 và 5, số phép toán < O(n2).
- Tổng số phép tính ước tính: O(NFnm) + O(n2) + O(n2) ~ O(NFnm)
Kết luận, độ phức tạp ước tính của thuật toán VCALOS là O(NFnm), với
NF là số khung hình, n và m là kích thước ảnh từng khung hình.
Kết quả thực nghiệm:
103
Phương pháp thực nghiệm tương tự như đã thực hiện đối với thuật toán
CVIL. Dữ liệu cũng sử dụng lại bộ dữ liệu thu thập được như với thuật toán
CVIL. Tuy nhiên đối với các video ở cung đường Đại lộ Thăng Long, không có
phương tiện xe máy tham gia giao thông, nên không thực hiện trong thực
nghiệm.
Bảng 3.2. Bảng kết quả thực nghiệm thuật toán VCALOS
TT
Cung
đường
Số
khung
hình
theo
dõi
(Frame)
Thực hiện đếm Tỷ lệ
chính
xác
TB
(%)
Trực tiếp bởi người Bằng hệ thống
Xe
tải
lớn
Xe
tải
nhỏ
Xe
con
Xe
máy
Xe
tải
lớn
Xe
tải
nhỏ
Xe
con
Xe
máy
1 Bắc Thăng
Long
1500 2 3 10 19 2 5 12 20 84.58
2 Quốc lộ 1 1500 4 5 11 25 4 6 13 27 90.13
3 Quốc lộ 5 1650 5 8 17 24 5 10 21 26 88.31
Từ kết quả Bảng 3.2 cho thấy độ chính xác trung bình tăng lên so với thuật
toán CVIL. Sự phân loại xe tải lớn về số lượng vẫn chính xác, sự biến động
nhiều vẫn nằm nhiều ở xe tải nhỏ và xe con, và đối với xe máy cũng có nhiều sự
sai số.
3.3. Phân loại phương tiện dựa trên đường viền biểu diễn bằng số phức
Đường viền của đối tượng là một đường khép kín sau khi thực hiện các
phương pháp trích chọn và xấp xỉ đường viền. Mô tả hình dạng đường viền bằng
VC trên trường số phức, đồng thời áp dụng một số tính chất của vector số phức
tương tự như tính chất của mô-men, dẫn đến khả năng so sánh và phân loại
đường viền với nhau. Từ kết quả này có thể áp dụng để tiến hành nhận dạng các
tập đường viền theo phương pháp máy học. Trước tiên huấn luyện và tạo ra 1
tập CSDL đối sánh tạo trước ở giai đoạn offline, sau đó giai đoạn online trích
đường viền ra từ khối chuyển động và so sánh, đưa ra kết luận về số lượng
phương tiện.
104
Sơ đồ khái quát 3.3.1.
Hình 3.4. Sơ đồ khối tổng quát phân loại theo đường viền
Phân loại dựa trên đường viền được chia thành 2 pha: Pha huấn luyện và
Pha phân loại. Sơ đồ khái quát được minh họa trong Hình 3.4. Các khối tăng
cường ảnh, tìm đường viền áp dụng các thuật toán đã có trong xử lý ảnh. Điều
quan trọng ở đây là tính toán đặc trưng của đường viền. Tuy nhiên để chuẩn hóa
đường viền ở cả pha huấn luyện cũng như pha phân loại cần phải thực hiện phép
cân bằng hóa đường viền hay còn gọi là xấp xỉ độ dài đường viền.
Xấp xỉ độ dài đường viền và thuật toán Douglas Peucker 3.3.2.
Thuật toán Douglas Peucker
Ý tưởng cơ bản của thuật toán Douglas-Peucker [29] là xét xem khoảng
cách lớn nhất từ đường cong tới đoạn thẳng nối hai đầu mút đường cong (Hình
3.5) có lớn hơn ngưỡng θ không. Nếu điều này đúng thì điểm xa nhất được giữ
lại làm điểm chia đường cong và thuật toán được thực hiện h > θ tương tự với
hai đường cong vừa tìm được. Trong trường hợp ngược lại, kết quả của thuật
toán đơn giản hoá là hai điểm đầu mút của đường cong.
105
Hình 3.5 Đơn giản hóa đường công theo thuật toán Douglas Peucker
Các bước thực hiện thuật toán Douglas-Peucker:
• Bước 1: Chọn ngưỡng θ.
• Bước 2: Tìm khoảng cách lớn nhất từ đường cong tới đoạn thẳng nối hai
đầu đoạn đường cong h.
• Bước 3: Nếu h ≤ θ thì dừng.
• Bước 4: Nếu h > θ thì giữ lại điểm đạt cực đại này và quay trở lại bước 1.
Thuật toán Douglas-Peucker:
//Hàm tính đường cao từ dinh đến đoạn thẳng nối hai điểm dau, cuoi float
Tinhduongcao (POINT dau, POINT cuoi, POINT dinh) {
floot h; || tính đường cao
returm h ;
}
//Hàm đệ quy nhằm đánh dấu loại bỏ các điểm trong đường cong
void DPSimple(POINT *pLINE,int dau,int cuoi,BOOL *chiso,float θ) {
int i, index = dau;
float h, hmax = 0;
for(i = dau + 1; i < cuoi; i++) {
h= Tinhduongcao(pLINE[dau], pLINE[cuoi]; pLINE[i]);
if(h > hmax) { hmax = h; index = i; }
}
if(hmax ≤ θ)
for(i= dau + 1; i < cuoi, i++)
chiso[i] = FALSE;
else {
DPSimple(PLINE, dau, index, chiso, θ);
DPSimple(PLINE, index, cuoi, chiso, θ) ;
}
106
}
//Hàm rút gọn số lượng điểm DouglasPeucker
int DouglasPeucker(POINT *pLINE, int n, float θ){
int i, j;
BOOL chiso [MAX_PT];
for(i = 0; i < m; i++) //Tất cả các điểm được giữ lại
chiso[i] = TRUE;
DPSimple(pLINE, 0, n – 1, chiso, θ);
for(i = j = 0; i < n; i ++)
if (chiso [i] ==TRUE)
pLINE[j++] = pLINE[i];
return j;
}
Theo [29] thì thuật toán DouglasPeucker có độ phức tạp tính toán là
O(nlog2(n)) với n là số đỉnh của đường cong cần đơn giản hóa.
Xấp xỉ độ dài đường viền
Hình 3.6. Xấp xỉ hóa đường viền
Như đã trình bày ở trên về phương pháp CA, cần xác định độ dài của
đường viền.Trong một bức ảnh thực, đường viền có độ dài bất kỳ. Do đó việc
tìm kiếm và so sánh đường viền, tất cả chúng cần có số đỉnh đồng nhất. Quá
trình này gọi là quá trình cân bằng. Đầu tiên sẽ cố định số đỉnh của VC chuẩn (ở
pha huấn luyện) sẽ sử dụng trong hệ thống nhận diện, ký hiệu là p. Sau đó với
mỗi đường viền A mới được tạo ra, ta tạo một đường viền vector N với độ dài p.
Và có thể có 2 biến thể, hoặc đường viền ban đầu có số đỉnh lớn hơn số p hoặc
nhỏ hơn số p. Nếu một đường viền ban đầu cần thiết để được sắp xếp bởi EV, ta
sẽ quan tâm tới thành phần N như tổng của các EV.
Quá trình cân bằng hóa, tương tự như quá trình thực hiện đơn giản hóa
đường cong Douglas Peucker [29] (Hình 3.6).
107
Giảm số đỉnh của đường cong:
Complex[] newPoint = new Complex[newCount];
for (int i = 0; i < newCount; i++) {
double index = 1d * i * Count / newCount;
int j = (int)index;
double p = index - j;
newPoint[i] = this[j] * (1 - p) + this[j + 1] * p;
}
Vấn đề là cần chọn giá trị p. Độ dài p lớn có nghĩa là tiêu tốn một lượng phí
lớn vào việc đánh giá. Còn giá trị p nhỏ cần ít thông tin, độ chính xác của việc
nhận dạng cũng giảm và việc nhận dạng nhiễu tăng lên.
Thuật toán CCAVC 3.3.3.
CCAVC (Classification based on Contour Analysis Vector Complex)
Pha huấn luyện. Chuẩn bị cơ sở dữ liệu Template (Thực hiện thủ công).
Thuật toán huấn luyện đặc trưng phương tiện
Input:
Hình ảnh (Image),
Ngưỡng đường viền (ThresoldContour),
Số đỉnh đường viền (d)
Output:
Template(i) //Tập mẫu, số lượng mẫu tùy thuộc vào dữ liệu
thực tế trong quá trình huấn luyện
Nội dung thuật toán:
1. Chuẩn hóa về độ phân giải mong muốn
Image ChuanHoaDoPhanGiai(Image)
2. Tìm các đường viền
n SoDuongVien(Image)
Contour(i) TimDuongVien(Image), i=1..n
3. Chuẩn hóa các đường viền
For i=1 to n {//Áp dụng thuật toán đơn giản hóa
108
Contour(i) DonGianHoa(Contour(i), d)}
For i=1 to n {//Tính chu vi
ChuVi(i) TinhChuVi(Contour(i))}
For i=1 to n {//Loại đường viền quá nhỏ
ji
if ChuVi(i)> ThresoldContour then { Countour(j)
Countour(i); j++}}
m=j; //m là số đường viền sau khi loại bỏ đường viền
nhỏ
4. Tìm đặc trưng các đường viền
For i=1 to m {//Tính toán tham số đặc trưng
CV(i) Chuvi(Contour(i))
DT(i)DienTich(Contour(i))
for j=1 to d {//Tính góc tại các đỉnh
goc(i,j)=TinhGoc(Contour(i),j)
}
5. Cập nhật Template
For i=1 to m {
Template(i) Template(i) + (i, CV(i), DT(i))
For j=1 to d
Template(i) Template(i)+ goc(i,j)
}
6. Retrurn Template (i), i=1..m
______________________________________________________________
Pha phân loại. Nhận dạng trên các tập ảnh thực tế (Thực hiện online – thời gian
thực):
Thuật toán phân loại phương tiện dựa trên đường viền (CCAVC)
Classification based on Contour Analysis Vector Complex
Input: Video/Ảnh
Output: ImageCountour (Ảnh có chứa đường viền phương tiện)
109
Nội dung thuật toán:
1. Thu nhận và Xử lý sơ bộ ảnh (Làm mịn, lọc nhiễu, tăng
độ tương phản)
Image Capture(Video)
Image ChuanHoaAnh(Image)
2. Tìm các đường viền
n SoDuongVien(Image)
Contour(i) TimDuongVien(Image), i=1..n
3. Chuẩn hóa các đường viền
For i=1 to n {//Áp dụng thuật toán đơn giản hóa
Contour(i) DonGianHoa(Contour(i), d)}
For i=1 to n {//Tính chu vi
ChuVi(i) TinhChuVi(Contour(i))}
For i=1 to n {//Loại đường viền quá nhỏ
ji
if ChuVi(i)> ThresoldContour then { Countour(j)
Countour(i); j++}}
m=j; //m là số đường viền sau khi loại bỏ đường viền
nhỏ
4. Tìm đặc trưng các đường viền
For i=1 to m {//Tính toán tham số đặc trưng
CV(i) Chuvi(Contour(i))
DT(i)DienTich(Contour(i))
for j=1 to d {//Tính góc tại các đỉnh
goc(i,j)=TinhGoc(Contour(i),j)
}
5. So sánh đường viền với Template.
For each đường viền phát hiện {
Chọn vùng chi vi để đối sánh
Chọn vùng diện tích để đối sánh
110
So sánh sự đồng dạng giữa 2 đường viền}
6. Return
Độ phức tạp thuật toán:
Giả sử bức ảnh đã được nhị phân hóa có kích thước n*n pixels, tìm đường
viền bằng cách duyệt qua toàn bộ ảnh 2 chiều, do đó độ phức tạp tương ứng là
O(n
2
).
Giả sử p là độ dài đường viền, t là số các đường viền có trong ảnh. Đối với
một đường viền, độ dài của nó kiểm tra thông qua phép tích vô hướng chuẩn hóa
trong tập huấn luyện và do đó mỗi đường viền chi phí hết p2 phép so sánh.
Thuật toán so sánh đường viền có độ phức tạp ước tính là: O(n2p2t), với n
là kích thước ảnh, t là số đường viền phát hiện được và p là độ dài đường viền.
Hạn chế của phương pháp phân tích đường viền:
- Hạn chế đầu tiên có liên quan tới vấn đề lựa chọn đường viền trên ảnh.
Đường viền được giới hạn với một cấu trúc rời rạc nhất định. Tuy nhiên các đối
tượng này được thể hiện trong môi trường thực có thể xảy ra những trường hợp:
+ Có một số lượng lớn các đường viền liên quan và không liên quan đến
đối tượng nhận dạng.
+ Đối tượng trong ảnh không thể có đường biên rõ ràng, có thể nhận diện
dựa trên độ sáng hoặc màu sắc so với nền, có thể bị nhiễu Tất cả những nhân
tố trên dẫn tới việc đường viền không thể được lựa chọn hoặc được chọn không
chính xác, không tương đồng với đường bao của đối tượng.
- Hạn chế thứ hai, gây phức tạp cho phương pháp CA có liên quan tới các
quy tắc của phân tích đường viền. Phương pháp CA giả sử rằng đường viền mô
tả khung của các đối tượng và không quan tâm đến các phần phía sau hoặc các
phần nhìn thấy không hoàn toàn của đối tượng. Do đó CA có độ ổn định kém
trong các trường hợp nhiễu, không hỗ trợ sự giao cắt hoặc các phần nhìn thấy
của đối tượng.
111
Kết quả thực nghiệm 3.3.4.
Hình 3.7. Giao diện hệ thống thực nghiệm thuật toán CCAVC
Thực nghiệm được thiết kế trên 2 dự án.
Dự án 1, ContourAnalysis, thực hiện các chức năng cơ bản của phân tích
đường viền, tạo được viền, TVH của đường viền, cân bằng hóa, đánh giá ICF và
ACF, so sánh và tìm kiếm các mẫu.
Dự án 2, ContourAnalysisProcessing , chứa các phương pháp để xử lý sơ
bộ ảnh, chọn đường viền, lọc và nhận dạng. Đồng thời nó cũng chứa các công cụ
để tự động tạo ra các mẫu cho việc nhận dạng các đường viền phương tiện. Dự
án sử dụng thư viện OpenCV (EmguCV.NET wrapper) để xử lý.
Các tham số trong thực nghiệm: Độ dài đường viền nhỏ nhất (Min contour
length) = 30; Diện tích đường viền nhỏ nhất (Min contour area) = 10; Độ phân
giải ảnh đầu vào: 640 x 480 (pixel).
CSDL mẫu: Thực hiện tạo ra một CSDL tập mẫu các đường viền gồm 30
mẫu đường viền khác nhau từ các hình dạng 1 xe máy, 1 xe ô tô, 2 xe máy, 2 ô
tô. Đường viền mẫu của xe máy được tập trung lưu trữ toàn bộ hình dạng đường
viền bao quanh xe máy. Thêm một số mẫu về đường viền phần nửa trên người đi
xe máy. Đối với ô tô, tập mẫu tạo ra bằng cách lưu trữ khung đường viền của
kính trước ô tô. (Hình 3.9).
1. Ô tô đứng độc lập 2. Hai ô tô trước sau thẳng 3. Hai ô tô trước sau lệch trái
112
4. Hai ô tô trước sau lệch phải
5. Hai ô tô ngang nhau
6. Hai ô tô ngang nhau lệch
trái
7. Hai ô tô ngang nhau lệch phải
8. Người đi xe máy chụp thẳng
9. Hai người đi xe máy trước
sau thẳng hàng
10. Hai người đi xe máy trước sau
lệch trái
11. Hai người đi xe máy trước
sau lệch phải
12. Hai người đi xe máy
ngang thẳng hàng
13. Ba người đi xe máy ngang nhau
14. Ba người đi xe máy lệch trái
15. Xe máy đi trước ô tô
Hình 3.8. Giao diện hệ thống thực nghiệm thuật toán CCAVC
113
Trong quá trình nhận dạng, gán nhãn cho đường viền phát hiện được tương
ứng là 1xm (một xe máy), 1oto (một ô tô), 2xm (hai xe máy), 2oto (hai ô tô),...
Phương pháp đã được thực nghiệm với các ảnh tự nhiên và trong bài toán
xác định mật độ phương tiện giao thông, so sánh và nhận dạng ra nhanh một xe
máy, 1 ô tô, 2 xe máy dính liền nhau, 2 ô tô dính liền nhau, 1 ô tô và 1 xe máy
dính liền nhau trong ảnh (Hình 3.9b).
a) một xe máy;
b) 2 xe máy;
c) một ô tô
Hình 3.9. Ví dụ về tập mẫu để so sánh
Dữ liệu thực nghiệm sử dụng lại bộ dữ liệu quay trực tiếp tại các điểm cầu
vượt đường cao tốc như đã trình bày trong chương 2 (Hình 2.3).
Việc kiểm nghiệm phương pháp CA bằng cách kiểm thử cho ra kết quả
80% hình dạng được nhận diện. Và kết quả này chứa một số lượng các ảnh đọc
xấu của các phương tiện. Do đó CA xử lý 249 ảnh với các kích thước khác nhau
(từ 400*400 tới 1280*960) trong vòng 30 giây.
Bên cạnh việc nhận dạng các ảnh khung hình cố định, thực hiện tốc độ cao
của CA cho phép xử lý video trong chế độ thời gian thực.
Thuật toán hoạt động với tốc độ 10-14Hz trên máy tính Pentium IV,
2.6GHz phù hợp với các ứng dụng thời gian thực. Độ chính xác của thuật toán
đã được kiểm nghiệm thông qua việc đối sánh ảnh giao thông chụp tại một số
cung đường ở Việt Nam.
114
Hướng phát triển tiếp theo là:
1) loại bỏ nhanh một số lỗi bằng cách xem xét kích thước chiều dài, chiều
rộng đối tượng, ngưỡng xấp xỉ hình dạng đường viền mịn hơn, sau đó thử
nghiệm giải thuật đối sánh ảnh trong một hệ thống giám sát giao thông thời gian
thực;
2) xem xét đến trường hợp một đối tượng có nhiều đường viền để tăng độ
chính xác và khả năng nhận dạng đối tượng đa dạng hơn.
a) Nhận dạng được 2 đường
viền, gán nhãn cho mỗi xe
một nhãn là 1xm.
b) Nhận dạng được 3 xe máy.
2 xe theo đường viền toàn bộ,
1 xe theo phần trên xe.
c) Nhận dạng được một ô tô
và 1 xe máy đi gần nhau.
Hình 3.10. Ví dụ kết quả nhận dạng xe ô tô và xe máy
3.4. Kết luận chương 3
Trên cơ sở lý thuyết về mô-men bất biến, trong đó có các tính chất bất
biến tỷ lệ, bất biến dịch chuyển và bất biến quay áp dụng cho xử lý ảnh và nhận
dạng, phân loại đối tượng theo phương pháp hình dạng cho thấy một số đặc
trưng về hình dạng cho phép sử dụng để phân loại phương tiện giao thông như:
- Kích thước các khối đối tượng (phương tiện) trong ảnh;
- Trọng tâm và khoảng cách từ trọng tâm tới đường biên;
- Đường viền và phân tích các đặc trưng của đường viền biểu diễn trên
trường số phức để nhận dạng và phân loại.
Các phương pháp, công thức tính toán trọng tâm đa giác xấp xỉ hình dạng
đối tượng, tính độ dài khoảng cách từ tâm tới cạnh đa giác xấp xỉ; Phương pháp
đã được triển khai thực nghiệm cho kết quả phân loại được các loại xe con, xe
tải (công trình công bố số 1).
115
Đề xuất 3 thuật toán về phân loại phương tiện trong đó có ô tô và xe máy
dựa trên kích thước và hình dạng. Bao gồm:
- Thuật toán phân loại theo kích thước (thuật toán CVIL); (công bố công
trình số 1).
- Thuật toán phân loại dựa trên kết hợp độ dài và hình chiếu đối tượng
(thuật toán VCALOS). (công bố công trình số 4).
- Thuật toán phân loại dựa trên đường viền biểu diễn bằng vector số phức.
(công bố công trình số 2)
Phương pháp phân loại dựa trên CA, có khả năng ứng dụng vào các bài
toán đối sánh ảnh đòi hỏi thời gian thực. Đóng góp chính đưa ra là đề xuất sử
dụng thuật toán CA, tìm kiếm độ dài đường viền để thực hiện tìm kiếm và đối
sánh hai đường viền.
Trong điều kiện giao thông phức tạp, các đối tượng có thể chồng lấp, nối
đuôi nhau hoặc sánh ngang nhau, hoặc so le nhau tạo thành những đường viền
phức tạp, việc áp dụng phương pháp CA gặp phải những khó khăn.
116
KẾT LUẬN
I. Các kết quả chính của luận án
Kết quả nghiên cứu của luận án được trình bày trên 121 trang, cấu trúc chia
thành 3 chương nội dung chính, phần mở đầu, phần kết luận, tài liệu tham khảo
và phụ lục.
Về phát hiện phương tiện chuyển động, luận án đã trình bày về 05 thuật
toán phát hiện đối tượng chuyển động bằng phương pháp trừ nền; phân tích và
đưa ra những ưu khuyết điểm từng phương pháp, phân tích và đưa ra yêu cầu
của mô hình hóa nền đối với video giao thông; đề xuất mô hình GMM thích ứng
với sự thay đổi ánh sáng; áp dụng mô hình đề xuất trong thực nghiệm hệ thống
đếm xe trên đường cao tốc.
Về phân loại phương tiện chuyển động, luận án phân tích và đưa ra các đặc
trưng quan trọng của hình dạng để áp dụng cho việc phân loại phương tiện giao
thông đó là: kích thước đối; các đặc trưng hình dạng như đa giác xấp xỉ phương
tiện, trọng tâm và khoảng cách từ tâm đến cạnh đa giác; chu vi đường viền.
Luận án đã phân tích và xây dựng thuật toán phát hiện đối tượng chuyển
động bằng mô hình GMM thích ứng thay đổi ánh sáng (chương 2); thuật toán
phân loại phương tiện dựa trên kích thước và hình dạng, thuật toán phân tích
đường viền phục vụ cho nhận dạng (chương 3).
Các kết quả phân tích và thực nghiệm một số thuật toán được công bố trong
04 bài báo trên các tạp chí chuyên ngành và hội nghị khoa học về công nghệ
thông tin.
Nội dung của luận án đề cập và các kết quả được công bố phù hợp và đáp
ứng được mục tiêu luận án đề ra.
II. Những đóng góp mới
Luận án với 03 đóng góp chính:
Cải tiến mô hình GMM thích ứng với sự biến đổi ánh sáng, bằng việc
thêm tham số để ứng phó với việc thay đổi ánh sáng trong môi trường
117
thực. Kết hợp mô hình nền GMM thích ứng thay đổi ánh sáng và
luồng quang học để giải quyết việc xác định mật độ xe ô tô cải thiện
tốc độ tính toán và tăng độ chính xác trong trường hợp giao thông trên
các đường cao tốc ở Việt Nam.
Đề xuất phương pháp phân loại kết hợp giữa phân tích hình dạng đối
tượng và độ dài của đối tượng. Phương pháp nhận dạng và phân loại
nhanh dựa trên cơ sở phân tích và lập chỉ mục theo các tham số đặc
trưng loại, độ dài, độ rộng.
Đề xuất phương pháp phân loại dựa trên phân tích đường viền. Trích
chọn đặc trưng đường viền, biểu diễn trên trường số phức, tiến hành
phân loại dựa trên độ dài và hình dáng đường viền.
III. Hướng nghiên cứu tiếp theo
Mặc dù, tất cả các đề xuất trong nghiên cứu này có thể làm việc tốt trong
một số trường hợp, các mô hình vẫn còn dễ bị lỗi và tốn thời gian. Các nghiên
cứu trong tương lai có thể kiểm tra chi tiết cấu trúc không gian của khu vực quan
sát; áp dụng trong học máy, được gọi là học cao cấp; xem xét trường hợp nhiều
đường viền tích hợp trên một đối tượng. Đây có thể là một hướng đi mới để phát
triển các hệ thống giám sát đối tượng chuyển động trên máy tính với độ chính
xác cao và tỷ lệ sai số thấp.
118
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ
1. Nguyễn Văn Căn, Vũ Tuấn (2013), “Giám sát giao thông tự động dựa trên độ
dài thị giác”. Tạp chí Khoa học và Công nghệ quân sự. Số 5/2013, trang 69-81.
2. Nguyễn Văn Căn, Nguyễn Đăng Tiến, Phạm Việt Trung (2014), “Phương pháp
biểu diễn đường viền trên trường số phức, áp dụng cho bài toán phân loại
phương tiện giao thông”. Tạp chí Khoa học và Công nghệ quân sự. Số 10/2014,
trang 58-65.
3. Can Nguyen Van, Huy Huynh Van, Tao Ngo Quoc (2014), “Car counting
method using Gaussian Mixture Model and Optical Flow”. The 3rd Solid State
Systems Symposium-VLSIs and Semiconductor Related Technologies & The
17
th
International Conference on Analog VLSI Circuits-Analog Signal and
Information Processing Applications. Ho Chi Minh City, 10/2014. Proceeding,
pages 192-198.
4. Can Nguyen Van, Cuong Nguyen Ngoc (2014), “Vehicle Classification in Video
Based on Shape Analysis”. UKSim-AMS 8th European Modelling Symposium on
Mathematical Modeling and Computer simulation Proceeding EMS '14
Proceedings of the 2014 European Modelling Symposium. IEEE Computer
Society Washington, DC, USA ©2014. ISBN: 978-1-4799-7412-2, pages 151-
157. (
119
TÀI LIỆU THAM KHẢO
Tiếng Việt:
[1] Phạm Hồng Quang, Tạ Tuấn Anh (2014), Xây dựng cấu trúc hệ thống giao thông
thông minh và các quy chuẩn công nghệ thông tin, truyền thông, điều khiển áp
dụng trong hệ thống giao thông thông minh tại Việt Nam. Đề tài KC01.14/11-15.
Trung tâm Tin học và Tính Toán, Viện Hàn lâm KHCN Việt Nam.
[2] Phạm Hồng Quang (2014), Xây dựng mạng camera với hệ thống xử lý hình ảnh
thông minh phục vụ điều khiển giao thông và giám sát an ninh. KC03.DA06/11-
15. Công ty Cổ phần Phần mềm - Tự động hóa - Điều khiển.
[3] Trần Thanh Việt, Trần Công Chiến, Huỳnh Cao Tuấn, Nguyễn Hữu Nam, Đỗ
Năng Toàn, Trần Hành (2011), Một kỹ thuật bám đối tượng và ứng dụng. Kỷ yếu
hội thảo quốc gia lần thứ XIV, Cần Thơ, 10/2011. Nhà Xuất bản Khoa học và Kỹ
thuật. Trang 238-247.
Tiếng Anh:
[4] Ahmed Elgammal (2010), Computer Vision 3D Model-based recognition. Dept
of Computer Science, Rutgers University.
[5] Amol A. Ambardekar (2007), Efficient Vehicle Tracking and Classification for
an Automated Traffic Surveillance System, A thesis submitted in partial
fulfillment of the requirements for the degree of Master of Science in Computer
Science.
[6] Chee-Way Chong and at al (2004), Translation and scale invariants of Legender
moments, Pattern Recognition (Vol 37), pp.119-129.
[7] Chung-Cheng Chiu and et al (2010), Automatic Traffic Surveillance System for
Vision-Based Vehicle Recognition and Tracking. Department of Electrical and
Electronic Engineering, Chung Cheng Institute of Technology National, Defense
University Taoyuan, Taiwan.
[8] Clement Chun Cheong Pang and at al (2007), A Method for Vehicle Count in the
Presence of Multiple-Vehicle Occlusions in Traffic Images, IEEE transactions on
intelligent transportation systems, (Vol. 8, No. 3).
[9] Collins R. T. (2000), A system for video surveillance and monitoring: VSAM
final report, Technical report (CMU-RI-TR-00-12), Robotics Institute, Carnegie
Mellon University.
[10] Cucchiara R. (2000), Statistic and Knowledge-based Moving Object Detection in
Traffic Scenes. D.S.I. University of Modena.
[11] George S.K. Fung and at al (2001), Vehicle Shape Approximation from Motion
for Visual Traffic Surveillance. IEEE Intelligent Transportation Systems
Conference Proceedings, USA.
[12] Guohui Zhang and et al (2007), A Video-based Vehicle Detection and
Classification System for Real-time Traffic Data Collection Using Uncalibrated
120
Video Cameras, Department of Civil and Environmental Engineering University
of Washington.
[13] Hu M. K. (1962), Moments and Moment Invariants in Pattern Recognition, IRE
Trans. Info. Theory (vol.IT-8), pp.179–187.
[14] Jean-Yves Bouguet (2002), Pyramidal Implementation of the Lucas Kanade
Feature Tracker Description of the algorithm, Intel Corporation, Microprocessor
Research Labs.
[15] Lai A. H. S. (2000), An effective methodology for visual traffic surveillance,
Hong Kong University.
[16] Lipton A. J. (1999), Moving target classification and tracking from real-time
video. In Proc. of Workshop Applications of Computer Vision, pages 129-136.
[17] Massimo Piccardi (2004), Background subtraction techniques: a review,
Computer Vision Research Group (CVRG), University of Technology, Sydney
(UTS).
[18] Nilesh J. Uke (2013), Moving Vehicle Detection for Measuring Traffic Count
Using OpenCV, Journal of Automation and Control Engineering (Vol.1, No.4).
[19] Nikolaos P. (2000), Algorithms for Vehicle Classification, Artificial Intelligence,
Robotics and Vision Laboratory, University of Minnesota.
[20] Sagar Deb (2005), Video data management and information retrieval. University
Southem Queensland, Australia.
[21] Shireen Y. Elhabian (2007), Moving Object Detection in Spatial Domain using
Background Removal Techniques - State-of-Art, Cairo University, Egypt.
[22] Sigari M., Fuzzy Running Average and Fuzzy Background Subtraction: Concepts
and Application, International Journal of Computer Science and Network
Security, 2008, Volume 8, No. 2, pages 138-143.
[23] Stauffer C. (1999), Adaptive background mixture models for real-time tracking,
Technical report (CVPR 1999), pages 246-252.
[24] Thierry Bouwmans (2013), Recent Advanced Statistical Background Modeling
for Foreground Detection - A Systematic Survey, Laboratoire MIA, Université de
La Rochelle, France.
[25] Wei Zhan, Junkai Yang (2012), Real Time and Automatic Vehicle Type
Recognition System Design and Its Application, International Conference on
Mechanical Engineering and Automation.
[26] Yigithan Dedeoglu (2004), Moving object detection, tracking and classification
for smart video surveillance, Univeristy of Bilkent.
[27] Xue Mei and at al (2007), Integrated Detection, Tracking and Recognition for IR
Video-based Vehicle Classification, Journal of computers (Vol.2, No.6).
[28] Yu-Kumg Chen, Tung-Yi Cheng, Shuo-Tsung Chiu (2009), Motion Detection
with Using Theory of Entropy. IEEE International Symposium on Industrial
Electronics (ISlE 2009).
121
[29] Wu, Shin-Ting and Márquez (2004), Mercedes R. G (2004), A non-self-
intersection Douglas-Peucker Algorithm, Proceedings of Sibgrapi. © 2004 IEEE.
[30] Jitendra Malik, Serge Belongie, Thomas Leung, Jianbo Shi (2001), Contour and
Texture Analysis for Image Segmentation. International Journal of Computer
Vision, June 2001, Volume 43, Issue 1, pp 7-27.
[31] Rohit Kolar, Akshay Thakar, Muzaffar Shabad (2014), Image Segmentation for
Text Recognition using Boundary Analysis. International Journal of Emerging
Technology and Advanced Engineering. ISSN 2250-2459, ISO 9001:2008
Certified Journal, Volume 4, Issue 2, February 2014) 294.
[32] Corentin Lallier, Emanuelle Reynaud, Lionel Robinault, Laure Tougne (2011), A
Testing Framework for Background Subtraction Algorithms Comparison in
Intrusion Detection Context. 8
th
IEEE International Conference on Advanced
Video and Signal-Based Surveillance.
[33] Andrews Sobral, Antoine Vacavant (2014), A comprehensive review of
background subtraction algorithms evaluated with synthetic and real videos.
Computer Vision and Image Understanding 122.
[34] A. Vacavant, T. Chateau, A. Wilhelm, L. Lequièvre (2012), A benchmark
dataset for foreground/background extraction, in: Background Models
Challenge (BMC). Asian Conference on Computer Vision (ACCV), LNCS, vol.
7728, Springer, 2012, pp. 291–300.
[35] Y. Dhome, N. Tronson, A. Vacavant, T. Chateau, C. Gabard, Y. Goyat, D.
Gruyer (2010), A benchmark for background subtraction algorithms in
monocular vision: a comparative study. IEEE International Conference on
Image Processing Theory, Tools and Applications (IPTA), 2010, pp. 66–
71.
[36] A. Sobral (2013), BGSLibrary: an opencv c++ background subtraction
library. IX Workshop de Viso Computacional. Rio de Janeiro, Brazil.
[37] Jean Dieudonné (1960), Foundations of Modern Analysis, Academic Press.
1
PHỤ LỤC
Phụ lục 1. Dữ liệu kích thước các loại xe
Nguồn: Internet, Đơn vị tính: mm
TT Xe ô tô Dài Rộng Cao Cao/rộng
1 Xe con Toyota Camry 2.5Q AT 4825 1825 1470 0.805479
2 Xe con Chevrolet Spark Van 3495 1495 1500 1.003344
3 Xe tải Hyundai JAC 1T5 5480 1940 2140 1.103093
4 Xe tải Hyundai JAC 1T8 5710 1865 2210 1.184987
5 Xe tải Hyundai JAC 1T95 5710 1910 2250 1.17801
6 Xe tải HINO - WU422L 7160 2240 3270 1.459821
7 Xe tải HINO - FC9JJSA 6T2 8250 2400 3680 1.533333
8 Xe tải HINO - FG8JPSB 9T2 9550 2500 3950 1.58
9 Xe tải HINO - FL8JTSL 16T 11450 2500 3930 1.572
TT Xe máy Dài Rộng Cao Cao/rộng
1 Honda Future 1932 711 1092 1.535865
2 Yamaha Sirius 1890 675 1030 1.525926
3 DaeHan Exciter GP 1776 697 1005 1.441894
4 Honda SH 150i và SH 125i 2034 740 1152 1.556757
5 Honda Lead 125cc Fi 1832 680 1120 1.647059
6 Suzuki Hayate 125 1935 670 1070 1.597015
7 Suzuki Hayate SS 125 FI 1925 660 1070 1.621212
8 Honda Wave 110 S Deluxe 1925 710 1090 1.535211
9 Honda SH125 Mode 1930 669 1105 1.651719
10 Honda Wave Alpha 1910 700 1065 1.521429
11 Honda Air Blade Fi 125cc 1901 670 1115 1.664179
12 Honda Vision 110cc Fi 1841 667 1094 1.64018
13 Suzuki X-Bike 125 1905 715 1070 1.496503
14 Honda Lead 110cc 1835 670 1125 1.679104
15 SYM Attila Elizabeth EFI 1795 668 1100 1.646707
16 Yamaha Nouvo SX RC 1955 705 1080 1.531915
17 Yamaha Exciter 1960 695 1080 1.553957
18 Honda Wave 110 RSX 1898 709 1080 1.523272
19 Suzuki Smash Revo 110 1920 655 1050 1.603053
20 Honda SH150i 2020 700 1140 1.628571
21 Suzuki X-Bike 125 1905 715 1070 1.496503
22 Honda Future 125 FI 1932 711 1092 1.535865
23 Yamaha Luvias GTX125 Fi 1855 700 1070 1.528571
24 Honda Super Dream 1915 696 1052 1.511494
25 Suzuki Smash Revo 1920 655 1055 1.610687
26 HONDA SCR 1830 681 1125 1.651982
27 Sym Shark 170cc 2090 730 1160 1.589041
28 Yamaha Nozza 1795 685 1080 1.576642
2
29 Honda Click Forward 125i 1904 689 1103 1.600871
30 Suzuki UA 125T Fi 1860 700 1095 1.564286
31 Honda CBR150R 1977 695 1130 1.625899
32 Suzuki GZ150–A 150cc 2250 900 1160 1.288889
33 Yamaha Luvias GTX 1850 685 1060 1.547445
34 Honda Click 125i Idling 1919 689 1103 1.600871
35 Yamaha Cuxi 1750 635 1055 1.661417
36 Suzuki Axelo 125 1895 715 1075 1.503497
37 Suzuki Viva 115 Fi 1910 690 1085 1.572464
38 Honda Scoopy FI Club 1856 694 1060 1.527378
39 Honda Spacy 125 1795 690 1070 1.550725
40 SYM Joyride EFI 1900 680 1100 1.617647
41 Piaggio Liberty RST 125 1935 760 1120 1.473684
42 Yamaha Mio Classico 1830 675 1040 1.540741
43 Honda Mojet 125 1814 675 1100 1.62963
44 Honda Taranis 110 TQuốc 1890 680 1110 1.632353
45 Honda PCX 1917 738 1094 1.482385
46 SYM ElegantSR 1910 680 1100 1.617647
47 Suzuki EN150-A 2055 730 1050 1.438356
48 Honda Scoopy i S12 1856 694 1060 1.527378
49 Kymco Candy 50cc 1815 675 1108 1.641481
50 Kymco Candy Hi 110cc 1820 680 1100 1.617647
51 Honda Super Cub 110 1915 700 1050 1.5
52 Honda Giorno 50cc Fi 1685 650 1035 1.592308
53 Honda PS150i 1990 700 1150 1.642857
54 Suzuki SkyDrive 125 1900 655 1050 1.603053
55 Honda Diamond Blue 125 1800 733 1150 1.568895
Nhỏ nhất 1685 635 1005 1.288889
Lớn nhất 2250 900 1160 1.679104
Trung bình 1897.436 695.0182 1088.182 1.568584
3
Phụ lục 2. Một số kiểu xe ô tô
(Nguồn thu thập trên Internet)
1. VAN:
Van là một loại xe tải nhỏ, khoang chở người và trở hàng chung một không
gian kín. Loại xe này có đặc điểm là khi không trở người các hàng ghế sau có
thể gập lại thành khoang chứa hàng. Cửa bên thông thường là cửa lùa tạo điều
kiện hoạt động trong không gian hẹp. Vì là loại xe có tải trọng thường chỉ từ 500
– 1.000 kg nên công suất không lớn. Ở Việt Nam dòng xe VAN (thực chất là
minivan) có khá nhiều, có thể nêu lên một vài loại xe mang tên VAN sau đây:
Xe Daihatsu Citivan – có hình dáng mẫu mã rất bắt mắt, kết hợp hài hoà tính
năng dòng xe du lịch với xe VAN.
Xe Daihatsu Citivan lắp động cơ xăng kiểu HD-C có dung tích công tác 0,6
lít, xi-lanh thẳng hàng, 6 xu- páp bố trí trục cam kiểu SOHC. Mô men xoắn Nm,
5 số tay. Số ghế: 7. Hai cửa lùa bên hông, cửa sau mở lên. Hàng ghế thứ. tháo
lắp dễ dàng để tạo khoang chứa hàng hoá.
Ngoài Daihatsu Citivan ra, loại xe Devan chở hàng thùng kín, cửa lùa bên
hông cũng lắp động cơ HD-C cùng loại với Citivan.
Loại xe Toyota Hiace Glass VAN. Đây là dòng xe VAN cao cấp, hàng ghế
sau gập lại rất dễ tạo khoang hàng rộng rãi. Hai cửa hông là loại cửa lùa, cửa sau
mở bằng khí nén.
Xe Hiace Glass VAN dùng động cơ phun xăng điện tử. Hộp số 5 số tay.
Hai điều hoà nhiệt độ.
Loại xe SUZUKI Super Carry VAN. Đây là loại xe nhỏ nhất hiện đang sử
dụng ở nước ta, xe SUZUKI VAN có hai loại: xe khách 7 chỗ Windowvan và xe
tải cửa lùa Blindvan. Hai loại xe trên đều dùng động cơ xăng F.0A, xi-lanh
thẳng hàng, dung tích công tác 70cm. Mômen xoắn 75Nm. Hộp số 5 số tay. Số
ghế 7. Hai hàng ghế sau có thể gập lại để tạo khoang chứa hành lý.
2. SUV
4
SUV được EuroNCAP xếp vào nhóm xe địa hình loại lớn. SUV khá quen
thuộc hơn với thị trường Việt Nam với các model như Mitsubishi Pajero, Toyota
Land Cruiser, Mercedes-Benz M-Class. SUV là loại xe dẫn động 4 bánh (còn
gọi là xe hai cầu) có thể chạy trên nhiều loại địa hình, có hệ thống treo cao.
Trọng tâm cao là một điểm bất lợi của loại xe này vì làm cho nó dễ bị lăn khi
chẳng may gặp tai nạn. Vì thiết kế lớn hơn nên SUV cũng sử dụng nhiều nhiên
liệu hơn.
3. Sedan
Sedan là một loại xe khách mà thân xe đại thể chia làm ba khoang:
khoang động cơ, khoang hành khách và khoang hành lý. Ở Anh, người ta gọi
loại xe này là xe saloon. Khoang hành khách thường gồm hai dãy ghế. Khoang
động cơ thường ở phía trước. Còn khoang hành lý thường ở phía sau. Cũng có
một số xe sedan mà khoang động cơ lại ở phía sau như Renault Dauphine, Tatra
T613, Volkswagen Type 3 và Chevrolet Corvair. Sedan là loại thân xe khách
phổ biến nhất.
Các file đính kèm theo tài liệu này:
- luan_an_nghien_cuu_phat_trien_mot_so_thuat_toan_phat_hien_va.pdf