Luận án đã tiến hành tìm hiểu, thu thập, khảo sát tính chất của dữ
liệu cảm biến, các kỹ thuật phân tích dữ liệu áp dụng cho loại dữ liệu đặc
thù này. Qua đó, xây dựng hệ thống nhận dạng và đề xuất giải pháp nhận
dạng hành vi dựa trên hệ thống nhận dạng này.
Luận án đã thu được một số kết quả như sau: Xây dựng được tập
thuộc tính đặc trưng phù hợp gồm 59 thuộc tính trên các miền thời gian,
tần số cũng như thuộc tính Hjorth. Đề xuất giải pháp nhận dạng hành động
giao thông cơ bản. Đề xuất giải pháp nhận dạng hành vi bất thường dựa
trên các hành động cơ bản đã được xây dựng ở chương 2.
Bên cạnh một số kết quả đã thu được, vẫn còn một số nội dung mà
Luận án chưa thực hiện được, bao gồm: Xây dựng hệ thống hiển thị và và
giám sát giao thông. Từ đó, có thể nghiên cứu phân tích các tình huống
giao thông khác nhau. Đối với hành vi bất thường, Luận án mới chỉ dừng ở
việc xây dựng mô hình nhận dạng hành vi bất thường, thực hiện khảo sát
với loại hành vi lạng lách của phương tiện xe máy mà chưa có điều kiện
thu thập, phân tích nhiều dạng hành vi bất thường khác nhau, đối với các
loại phương tiện khác nhau trong hệ thống giao thông. Số lượng các mẫu
hành vi cũng chưa được thu thập đa dạng, đủ lớn từ nhiều đối tượng thực
nghiệm, phủ hết các cảnh huống, điều kiện và trên các loại phương tiện
khác nhau.
Trong thời gian tới, chúng tôi sẽ tiếp tục hoàn thiện nghiên cứu của
mình theo một số cách tiếp cận khác nhau như: Áp dụng các phương pháp
lọc, đánh giá tập thuộc tính đặc trưng với mong muốn nâng cao hiệu quả
của mô hình phát hiện, nhận dạng, phát hiện hành động và hành vi bất
thường. Tiến hành thực nghiệm, đánh giá trên các loại phương tiện khác
như ô tô, xe buýt, xe đạp cũng như một số phương tiện phổ thông khác ở
đô thị của Việt nam. Xây dựng ứng dụng với dữ liệu theo thời gian thực.
Mở rộng nghiên cứu xây dựng hệ thống mô phỏng, giám sát giao thông
trực tuyến. Đây cũng là cơ sở để xây dựng các giải pháp quản trị giao
thông thông minh cũng như hỗ trợ người dân đô thị khi tham gia giao
thông.
27 trang |
Chia sẻ: yenxoi77 | Lượt xem: 632 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Nhận dạng hành vi của người tham gia giao thông dựa trên cảm biến điện thoại, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
LỮ ĐĂNG NHẠC
NHẬN DẠNG HÀNH VI CỦA NGƯỜI THAM GIA GIAO
THÔNG DỰA TRÊN CẢM BIẾN ĐIỆN THOẠI
Chuyên ngành: Hệ thống Thông tin
Mã số: 9480401.01
TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội – 2018
Công trình được hoàn thành tại: Trường Đại học Công nghệ, Đại học Quốc gia Hà
Nội
Người hướng dẫn khoa học: PGS. TS. Nguyễn Hà Nam
PGS.TS. Phan Xuân Hiếu
Phản biện: PGS.TS. Nguyễn Quốc Cường
Phản biện: PGS.TS. Bùi Thu Lâm
Phản biện: PGS.TS. Đỗ Trung Tuấn
Luận án được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến
sĩ họp tại Phòng 212, Nhà E3, Đại học Công nghệ, ĐHQG Hà Nội
vào hồi 14 giờ 00’ ngày 28 tháng 12 năm 2018
Có thể tìm hiểu luận án tại:
- Thư viện Quốc gia Việt Nam
- Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội
1
MỞ ĐẦU
Tính cấp thiết của luận án
Trong hệ thống giao thông đô thị, có nhiều yếu tố tác động đến vấn
đề quản lý và an toàn giao thông. Trong đó, thái độ và hành vi của người
tham gia giao thông có tác động trực tiếp hệ thống. Do đó, việc nhận dạng
hành vi của người tham gia giao thông bao gồm cả nhận dạng các hành
động và hành vi bất thường có một ý nghĩa rất lớn trong việc xây dựng giải
pháp, ứng dụng hỗ trợ người tham gia giao thông. Vì vậy, chủ đề này đã và
đang thu hút được sự quan tâm nghiên cứu của nhiều nhà khoa học, các
phòng thí nghiệm trên thế giới. Hơn thế nữa, những thông tin về hành vi
của người tham gia giao thông sẽ rất hữu ích cho những nhà quản lý trong
việc quy hoạch hệ thống và xây dựng chính sách quản lý giao thông và các
chính sách an sinh xã hội khác. Ngoài ra, mô hình nhận dạng hành vi
người tham gia giao thông còn trợ giúp đánh giá mức độ rủi ro trong các
lĩnh vực bảo hiểm cũng như có thể ước tính mức độ tiêu thụ năng lượng và
ô nhiễm môi trường của hệ thống giao thông.
Để xây dựng được mô hình nhận dạng hành vi của người tham gia
giao thông các thông tin, dữ liệu của người tham gia được thu thập bằng
nhiều cách khác nhau. Thí nghiệm ban đầu đã thu thập dữ liệu bằng các
thiết bị cảm biến cố định trên đối tượng nghiên cứu. Nhờ sự phát triển của
công nghệ phần cứng, nhiều loại cảm biến khác nhau được tích hợp đã cho
phép điện thoại thông minh trở thành công cụ hữu ích trong việc thu thập
dữ liệu từ người dùng. Chính vì vậy, trong thời gian gần đây, nhiều công
trình nghiên cứu về nhận dạng hành vi người dùng bao gồm cả hành vi cử
chỉ và hành vi trong giao thông dựa trên cảm biến điện thoại thông minh
được công bố. Tuy nhiên, để đảm bảo độ chính xác cao trong kết quả của
mô hình nhận dạng thì hầu hết các nghiên cứu được thực hiện với vị trí
điện thoại cố định trên phương tiện giao thông hoặc sử dụng tập thuộc tính
đặc trưng có số lượng lớn nhằm trích xuất dữ liệu từ nhiều nguồn cảm biến
khác nhau của điện thoại. Điều này làm cho mô hình xây dựng giảm tính
tiện dụng cũng như giảm khả năng ứng dụng trong thực tế. Điều này dẫn
2
đến hướng nghiên cứu về nhận dạng hành vi của người dùng khi vị trí điện
thoại người dùng không cố định trong quá trình tham gia giao thông.
Ngoài ra, những nghiên cứu đã công bố về nhận dạng hành vi giao
thông được thực hiện trong các điều kiện hoàn cảnh khác nhau. Trong đó,
có sự khác nhau về yếu tố khu vực địa lý, hạ tầng giao thông và văn hóa so
với các điều kiện và môi trường giao thông tại Việt Nam. Do vậy, những
mô hình nhận dạng đã được xây dựng gặp nhiều khó khăn khi phát triển và
áp dụng trong điều kiện cụ thể của Việt Nam. Sự khác biệt này xuất phát
từ một số yếu tố quan trọng bao gồm cả yếu tố khách quan và yếu tố chủ
quan. Thứ nhất, đó là các nghiên cứu về bài toán nhận dạng thường tập
trung vào các phương tiện giao thông phổ biến tại các nước phát triển với
đa số phương tiện sử dụng cho thực nghiệm là xe ô tô, xe buýt và tàu điện
ngầm mà ít khi xét đến các phương tiện thô sơ. Trong khi đó, hệ thống
giao thông đô thị tại các nước đang phát triển hoặc chậm phát triển, trong
đó có Việt nam, các phương tiện giao thông được người dân sử dụng chủ
yếu vẫn là xe máy và xe đạp cùng một số phương tiện công cộng khác.
Hơn thế nữa, phần lớn các nghiên cứu trước đây thực hiện trong điều kiện
hạ tầng giao thông ổn định hơn so với tính đa dạng điều kiện giao thông
như ở Việt Nam. Thứ hai, về yếu tố chủ quan đó là văn hóa và thói quen di
chuyển của người dân khi tham gia giao thông. Với những phương tiện
như ô tô hay xe buýt trong các nghiên cứu, dữ liệu cảm biến được thu thập
trong điều kiện phương tiện di chuyển trên các làn đường riêng, hoặc hay
đường chạy xác định trước. Điều kiện này không thể thực hiện được với
hiện trạng giao thông đô thị của Việt Nam. Tất cả những yếu tố cơ bản kể
trên là những lý do giải thích tại sao cần có các nghiên cứu mô hình nhận
dạng hành vi giao thông phù hợp với tính chất đặc thù tại Việt Nam.
Để hỗ trợ được người tham gia giao thông, một trong những mục
đích quan trọng, cấp thiết của mô hình phát hiện hành vi đó là khả năng
phát hiện được các hành vi giao thông bất thường. Các nghiên cứu về vấn
đề này thường tập trung vào phương tiện ô tô; các phương tiện có những
thiết kế, đặc tính khác nhau nên rất khó có một mô hình phù hợp với tất cả
các loại phương tiện khác nhau. Các nghiên cứu này cũng thường sử dụng
3
hướng tiếp cận kết hợp nhiều loại cảm biến để thu thập, phân tích dữ liệu
cho quá trình nhận dạng. Bên cạnh các cảm biến chuyển động thì các cảm
biến khác như GPS, camera hình ảnh và cảm biến âm thanh cũng có thể
được sử dụng nhằm nâng cao độ chính xác trong nhận dạng các hành vi
bất thường khi lái xe. Việc sử dụng đồng thời nhiều dữ liệu cảm biến cùng
một thời điểm dẫn đến tiêu tốn nhiều năng lượng của điện thoại thông
minh và khó có thể áp dụng trong thực tế. Hướng tiếp cận lựa chọn thu
thập, phân tích dữ liệu cảm biến chuyển động như cảm biến gia tốc sẽ có
mức tiêu tốn năng lượng thấp nhất nhưng cần phải xây dựng một mô hình
phù hợp để đảm bảo độ chính xác nhận dạng trên các loại phương tiện giao
thông khác nhau. Một trong những giải pháp căn cốt cho vấn đề này đó là
cần xác định, lựa chọn được tập thuộc tính đặc trưng phù hợp cho các loại
phương tiện, thể hiện rõ đặc trưng của hành vi sao cho nhận dạng, phát
hiện không làm tăng độ phức tạp tính toán của mô hình mà vẫn đảm bảo
kết quả phát hiện hành động, hành vi bất thường.
Với mong muốn xây dựng mô hình phát hiện và đoán nhận hành vi
bất thường sử dụng cảm biết gia tốc của điện thoại thông minh, chúng tôi
chọn đề tài: “Nhận dạng hành vi của người tham gia giao thông dựa trên
cảm biến điện thoại” làm đề tài nghiên cứu trong khuôn khổ luận án tiến sĩ
chuyên ngành Hệ thống Thông tin nhằm giải quyết một số vấn đề đã đặt
ra.
Mục tiêu của luận án
Mục tiêu chính của Luận án tập trung vào phân tích dữ liệu cảm biến
thu được từ điện thoại của người tham gia giao thông nhằm nhận dạng
được các hành vi giao thông bất thường.
Để giải quyết được mục tiêu của Luận án, chúng tôi tập trung vào
giải quyết các vấn đề chính sau:
Khảo sát các kỹ thuật phân tích dữ liệu trong và ngoài nước. Tìm
hiểu các kỹ thuật thu thập và biến đổi dữ liệu áp dụng cho các loại cảm
biến khác nhau, trong đó tập trung vào cảm biến gia tốc có mức tiêu thụ
năng lượng thấp nhằm tìm ra tập thuộc tính đặc trưng phù hợp cho hệ
thống nhận dạng hành động và hành vi.
4
Xây dựng hệ thống nhận dạng hành động giao thông cơ bản (đi
thẳng, dừng, rẽ trái, rẽ phải) của người điều khiển phương tiện dựa trên dữ
liệu cảm biến gia tốc được biến đổi từ tập thuộc tính lựa chọn.
Dựa trên hệ thống nhận dạng hành động, nghiên cứu, đề xuất giải
pháp phát hiện hành vi giao thông bất thường, chủ yếu là với phương tiện
xe máy. Trong một thời gian ngắn tương ứng với một hành động cơ bản
xảy ra, nếu phát hiện thấy có các hành động sai khác xảy ra thì xác định là
một hành vi bất thường. Sự bất thường được đánh giá bằng việc phân đoạn
cửa sổ hành động giao thông cơ bản thành các cửa sổ dữ liệu có kích thước
nhỏ hơn rồi so sánh nhãn hành động nhận dạng được của các cửa sổ này so
với nhãn của hành động giao thông cơ bản đó để xác định sự bất thường
hay bình thường dựa trên việc so sánh tỉ lệ sai khác với một tỉ lệ cho trước
Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của Luận án là phân tích, nhận dạng hành vi,
hành vi giao thông bất thường của người điều khiển phương tiện. Dựa trên
cảm biến gia tốc thu được từ điện thoại thông minh của các đối tượng sử
dụng phương tiện để đưa ra giải pháp nhận dạng hành động cơ bản làm cơ
sở cho nhận dạng hành vi giao thông bất thường ở đô thị của Việt Nam.
Phương pháp nghiên cứu
Luận án sử dụng các phương pháp khảo sát, tổng hợp, phân tích
thông tin cần thiết; tham khảo, đánh giá các nghiên cứu liên quan để từ đó
tìm ra hướng giải quyết vấn đề. Xác định rõ đối tượng và phạm vi nghiên
cứu để từ đó xây dựng mô hình nhận dạng hành động và hành vi giao
thông.
Khảo sát các kỹ thuật thu thập, xử lý dữ liệu cảm biến, phân tích các
đặc điểm của phương tiện, hành động giao thông để từ đó đề xuất giải
pháp nhận dạng hành động, hành vi giao thông bất thường dựa trên cảm
biến thu được. Phương pháp phân tích sử dụng lý thuyết và chứng minh
bằng thực nghiệm được áp dụng để thực hiện yêu cầu bài toán đặt ra
Đóng góp của luận án
Đóng góp thứ nhất của luận án: là đề xuất tập thuộc tính đặc trưng
dựa trên miền thời gian và miền tần số nhằm biến đổi dữ liệu cảm biến
5
thành dữ liệu đặc trưng phục vụ cho nhận dạng hành động và hành vi bất
thường. Kết quả đọ đo phân lớp dữ liệu được sử dụng để đánh giá, lựa
chọn tập thuộc tính. Trong đó, sử dụng tham số Hjorth cho các đại lượng
khác nhau nhằm thu được các thuộc tính phù hợp để biến đổi dữ liệu cảm
biến thành dữ liệu đặc trưng. Tập thuộc tính đặc trưng phù hợp sẽ sử dụng
làm cơ sở cho việc xây dựng hệ thống nhận dạng bằng phương pháp phân
lớp [CT2], [CT4].
Khảo sát, lựa chọn kích thước cửa sổ và tỉ lệ chồng dữ liệu để phân
tích tìm ra các giá trị tương ứng, phù hợp với các hành động. Qua đó, hỗ
trợ hệ thống nhận dạng các hành động giao thông có hiệu quả hơn [CT1],
[CT2], [CT4]. Kết quả nhận dạng bằng hệ thống đề xuất cao hơn so với
một số nghiên cứu đã được công bố đã có [CT4].
Đóng góp thứ hai của luận án: đề xuất giải pháp phát hiện hành vi
giao thông bất thường theo một hướng tiếp cận mới, hướng tiếp cận này
dựa trên kết quả nhận dạng hành động cơ bản. Trong thời gian ngắn mà
một hành động cơ bản xảy ra, nếu hệ thống nhận dạng được chuỗi các
hành động bất thường thì xác định đây là hành vi bất thường. Các giải
pháp, kết quả thu được của luận án được trình bày trong 4 công trình đã
được công bố. Trong đó có 1 bài báo quốc tế có chỉ số SCIE; 3 bài báo
hội nghị quốc tế có phản biện và có chỉ số Scopus được thể hiện ở các
công trình [CT1], [CT2], [CT3] và [CT4].
Bố cục của luận án
Ngoài phần mở đầu, mục lục, kết luận và tài liệu tham khảo, nội
dung chính của luận án được chia thành 3 chương, cụ thể như sau:
Chương 1: Giới thiệu một số khái niệm cơ bản về hành động, hành vi
giao thông và bài toán nhận dạng hành vi giao sử dụng dữ liệu cảm biến.
Chương 2: Xây dựng hệ thống nhận dạng hành động giao thông cơ
bản dựa trên cảm biến điện thoại.
Chương 3: Dựa trên kết quả của hệ thống nhận dạng hành động, đề
xuất giải pháp nhận dạng hành vi giao thông, hành vi bất thường.
6
Chương 1. TỔNG QUAN VỀ PHÂN TÍCH HÀNH VI
1.1 Giới thiệu
Cảm biến thu được từ điện thoại được dùng phân tích trong nhiều bài
toán khác nhau. Trong đó có bài toán nhận dạng hành vi. Vì điện thoại
thông minh được sử dụng cho nhiều mục đích cá nhân khác nhau cũng như
có giới hạn về năng lượng, sự đa dạng về chủng loại, chất lượng của thiết
bị phần cứng dẫn đến yêu cầu cần phải xây dựng hệ thống, giải pháp phân
tích, phát hiện hành động, hành vi sao cho phù hợp là một bài toán đặt ra
cần được giải quyết.
1.2 Một số khái niệm cơ bản
1.2.1 Hành động giao thông
Hành động giao thông là việc người điều khiển thay đổi trạng thái
của phương tiện trong quá trình tham gia giao thông[10].
1.2.2 Hành vi giao thông
Hành vi giao thông là sự biểu hiện thay đổi trạng thái của phương
tiện theo những cách thức, mức độ, tính chất khác nhau trong quá trình lưu
thông [10][11][12] [13].
1.3 Sử dụng dữ liệu cảm biến để phân tích hành vi
Cảm biến điện thoại thông minh hiện nay ngày càng đa dạng. Khi sử
dụng kết hợp nhiều cảm biến sẽ làm tiêu hao năng lượng nên lựa chọn cảm
biến gia tốc có ưu điểm tốn ít tài nguyên của thiết bị để xây dựng hệ thống
là một trong hướng tiếp cận phù hợp đáp ứng được yêu cầu của bài toán
phân tích, nhận dạng hành vi giao thông dựa trên điện thoại thông minh
của người điều khiển phương tiện mang theo trong điều kiện, môi trường
giao thông đô thị Việt Nam.
1.4 Một số nghiên cứu liên quan
Các nghiên cứu công bố gần đây đã chỉ ra hiệu quả của việc kết hợp
nhiều loại cảm biến khác nhau trong bài toán phân tích hành vi. Tuy nhiên,
7
việc chỉ sử dụng dữ liệu cảm biến gia tốc sẽ phù hợp với các điện thoại
phổ biến và ít tiêu hao năng lượng. Cũng như hướng tiếp cận sử dụng tập
đặc trưng và phương pháp phân lớp cho dạng bài toán này.
1.5 Phương pháp nhận dạng hành vi giao thông dựa trên cảm biến
Từ những vấn đề trên chúng tôi đề xuất phương phân tích, pháp
nhận dạng hành vi giao thông bất thường dựa trên cảm biến gia tốc như
Hình 1-1 dưới đây:
THU THẬP
TIỀN XỬ LÝ
DỮ LIỆU
NHẬN DẠNG
HÀNH ĐỘNG
Chương 2
PHÂN TÍCH
HÀNH VI BẤT
THƯỜNG
Chương 3
LOẠI HÀNH VI
BẤT THƯỜNG
Hành động
Hành vi
bất thường
Hình 1-1. Hệ thống phân tích hành vi bất thường
1.6 Kết luận
Trong chương này, chúng tôi đã tìm hiểu, khảo sát các nghiên cứu
liên quan đến bài toán nhận dạng hành vi. Làm rõ một số khái niệm cơ bản
về hành động, hành vi, hành vi bất thường trong lĩnh vực giao thông. Tìm
hiểu phương pháp, kỹ thuật phân tích, nhận dạng hành vi, đặc biệt là
hướng tiếp cận sử dụng dữ liệu cảm biến điện thoại thông minh thu được
của người điều khiển phương tiện
8
Chương 2. NHẬN DẠNG HÀNH ĐỘNG GIAO THÔNG
2.1 Giới thiệu
Trong chương này, Luận án tập trung vào việc xây dựng hệ thống
nhận dạng hành động cơ bản của các đối tượng điều khiển phương tiện
giao thông dựa trên tín hiệu cảm biến thu được từ điện thoại mang theo.
Hướng tiếp cận sử dụng biến đổi dữ liệu cảm biến thô thành dữ liệu đặc
trưng áp dụng kỹ thuật cửa sổ dữ liệu với tập thuộc tính đặc trưng được
khảo sát và lựa chọn. Sau đó, nhận dạng bằng phương pháp phân lớp.
2.2 Sử dụng dữ liệu cảm biến để nhận dạng hành động giao thông
Sử dụng tín hiệu cảm biến của điện thoại mang theo để phân tích,
nhận dạng ngày càng được phổ biến và sử dụng với các yêu cầu khác nhau
trong nhiều hệ thống thông minh. Một số hướng nghiên cứu đã sử dụng
cảm biến hình ảnh thu được từ camera hoặc kết hợp nhiều cảm biến khác
nhau để nhận dạng hành động. Tuy nhiên, hướng tới sự thuận lợi và tiết
kiệm năng lượng của thiết bị. Chúng tôi chỉ sử dụng thông tin, dữ liệu đầu
vào là cảm biến gia tốc thu được từ điện thoại thông minh mang theo của
người tham gia giao thông, vị trí của điện thoại có thể thay đổi trong hành
trình[CT2], [CT4].
2.3 Một số nghiên cứu liên quan
Đối với bài toán nhận dạng hành động giao thông, một số sự kiện,
hành động, hành vi cơ bản của người điều khiển được thể hiện ở công bố
của một số nghiên cứu liên quan. Trong đó, các hành hành động, hành vi
thường được nhận dạng với các vị trí điện thoại được cố định hoặc biết
trước góc xoay so với chuyển động nhằm thu được dữ liệu mẫu ổn định.
Ngoài phương pháp so khớp, phương pháp phân lớp cũng thường được sử
dụng cho bài toán này dựa trên hướng tiếp cận trích xuất đặc trưng.
9
2.4 Hệ thống nhận dạng hành động sử dụng cảm biến gia tốc
2.4.1 Một số kiến thức cơ sở
2.4.1.1 Tiền xử lý dữ liệu
Chuẩn bị dữ liệu là một bước quan trọng trong khai phá dữ liệu, dữ
liệu được chuẩn bị tốt sẽ giúp hệ thống thực hiện hiệu quả hơn [36][37].
Trong bài toán nhận dạng hành động giao thông sử dụng dữ liệu cảm biến
từ điện thoại sau khi tiền xử lý, biến đổi thành dữ liệu đặc trưng và nhận
dạng dựa trên phương pháp phân lớp
2.4.1.2 Cửa sổ dữ liệu
Trong hệ thống nhận dạng đề xuất, cửa sổ dữ liệu được khảo sát
nhằm chọn ra kích thước phù hợp với từng loại hành động với mục đích
nâng cao kết quả nhận dạng được trình bày như Hình 2-2 dưới đây:
1 2 k-1 k k+1 N-1 N
w =Độ dài của cửa sổ
Cửa sổ i-1 Cửa sổ i+1Cửa sổ i
Chồng dữ liệu
Hình 2-2. Phân đoạn chuỗi thành các cửa sổ dữ liệu
2.4.1.3 Biến đổ hệ tọa độ
Phương pháp biến đổi hệ tọa độ của thiết bị sang hệ tọa độ trái đất
cũng thường được áp dụng trong phân tích dữ liệu cảm biến gia
tốc[41][42] khi thiết bị cảm biến không cố định theo hướng chuyển động
của phương tiện.Phương pháp biến đổi hệ tọa độ của thiết bị cảm biến về
hệ trục tọa độ của trái đất được thể hiện như
(a) (b)
Hình 2-3. (a) Hướng của điện thoại được xác định bởi hệ tọa độ (X, Y, Z). (b) Hướng di
chuyển của phương tiện theo hệ tọa độ trái đất (X’, Y’, Z’)
10
2.4.1.4 Biến đổi dữ liệu đặc trưng
Trong kỹ thuật xử lý tín hiệu cảm biến, các thuộc tính đặc trưng
thường được lựa chọn dựa trên tính chất thời gian và tần số [44][45].
Phương pháp kết hợp thuộc tính trên các miền thường được sử dụng để
phân tích, nhận dạng hành động, hành vi được biểu diễn như trong Hình
2-4 dưới đây [46].
Hình 2-4. Kết hợp biểu diễn thông tin trên miền thời gian và miền tần số [46]
2.4.1.5 Thuộc tính trên miền thời gian
Các thuộc tính trong miền thời gian có đặc điểm tính toán nhanh,
thực hiện với các giá trị thống kê, so sánh sự khác biệt của các mẫu dữ
liệu. Do tính chất dữ liệu cảm biến thu được của các hành động, hành vi
thay đổi theo thời gian.
2.4.1.6 Thuộc tính trên miền tần số
Các kỹ thuật miền tần số thường được sử dụng để xác định bản chất lặp
lại của tín hiệu cảm biến. Tính lặp lại này thường tương quan với bản chất
tuần hoàn của một hành động, hành vi nào đó cần nhận dạng.
2.4.1.7 Tham số Hjorth
Tham số Hjorth [49] là đại lượng thường được sử dụng trong phân
tích các tín hiệu y sinh. Đại lượng này chỉ ra tính chất thống kê của một tín
hiệu trong miền thời gian gồm ba loại tham số là tính hoạt động (Activity),
tính di động (Mobility) và độ phức tạp (Complexity).
11
The parameters
Mô hình
Nhận dạng
PHÂN LỚP
Dữ liệu
gia tốc
(gán nhãn)
TIỀN XỬ LÝ DỮ LIỆU
- Kỹ thuật cửa sổ
- Biến đổi dữ liệu
Dữ liệu
gia tốc
(phát hiện)
Tham số mô
hình
Hành động
Pha huấn luyện
Pha pha phát hiện
`
LOẠI
HÀNH ĐỘNG
TIỀN XỬ LÝ DỮ LIỆU
- Kỹ thuật cửa sổ
- Biến đổi dữ liệu
2.4.1.8 Phương pháp đánh giá phân lớp bằng AUC
Các phương pháp đánh giá mô hình thường được sử dụng khi đánh
giá với mô hình phân lớp dữ liệu đó là dựa trên ma trận nhầm lẫn. Có hai
độ đo thường được sử dụng để đánh giá mô hình phân lớp đó là độ chính
xác (Accuracy) và độ đo AUC sử dụng CV10.
2.4.2 Tập thuộc tính đặc trưng
Sự di chuyển của phương tiện giao thông làm thay đổi gia tốc nên
các thuộc tính trong miền thời gian có ý nghĩa và hàm chứa những thông
tin hữu ích khi phân tích các hành động, hành vi. Tập thuộc tính kết hợp
cho nhận dạng được thể hiện như bảng dưới đây:
Miền, tham số Hjorth Tên tập thuộc tính
Thời gian T2
Tần số F2
Hjorth H2
Thời gian + Tần số TF2
Thời gian + Hjorth TH2
Thời gian + Tần số + Hojrth TFH2
Bảng 2-1. Tập thuộc tính sử dụng nhận dạng
2.4.3 Đề xuất hệ thống nhận dạng hành động
Việc nhận dạng hành động, hành vi cần có những giải pháp, kỹ thuật
phù hợp với yêu cầu thực tiễn của bài toán. Do vậy, chúng tôi xây dựng hệ
thống nhận dạng như Hình 2- nhằm nhận dạng hành động giao thông cơ
bản (Dừng, Đi thẳng, Rẽ trái, Rẽ phải) được biểu diễn như Hình 2-7 dưới
đây:
Hình 2-7. Hệ thống nhận dạng hành động giao thông
12
Hệ thống nhận dạng bao gồm Pha huấn luyện để xây dựng mô hình
nhận dạng. Pha thứ hai: nhận dạng các hành động dựa trên dữ liệu cảm
biến phát hiện thu được từ điện thoại của đối tượng đang tham gia giao
thông dựa trên mô hình đã xây dựng được. Giải pháp nâng cao kết quả
nhận dạng thông qua lựa chọn kích thước cửa sổ cho từng hành động dựa
trên độ đo AUC được trình bày trong Hình 2- 8 sau đây:
Hình 2-8. Thuật toán tối ưu kích thước cửa sổ và chồng dữ liệu theo AUC
Trong đó pha phát hiện với N nhãn lớp hành động khi sử dụng giải
pháp tối ưu cửa sổ sẽ có N kích thước cửa sổ khác nhau, đồng thời cần
phải thực hiện N lần phân lớp để xác định kết quả nhãn lớp để đưa ra nhãn
lớp phù hợp theo Hình 2-9 như sau:
DỮ LIỆU PHÁT
HIỆN
MÔ HÌNH
PHÂN LỚP M1
MÔ HÌNH
PHÂN LỚP Mi
MÔ HÌNH
PHÂN LỚP MN
NHÃN LỚP
Xử lý với kích thước
Wi ĐÁNH GIÁ
NHÃN LỚP
X C ĐỊNH
Hình 2-9. Nhận dạng hành động với các kích thước cửa sổ đã được lựa chọn.
Tại một thời điểm, dữ liệu được tiền xử lý với N kích thước cửa sổ
tối ưu và được nhận dạng nhãn lớp tương ứng. Sử dụng kỹ thuận nhận
dạng như trên sẽ cho kết quả nhãn lớp phù hợp với cửa sổ dữ liệu đầu vào.
13
2.5 Thực nghiệm và đánh giá
2.5.1 Môi trường thực nghiệm
Hệ thống thu thập và phân tích dữ liệu cảm biến của điện thoại được
xây dựng dựa trên hệ điều hành Android phiên bản 4.5 đến 6.0; ngôn ngữ
Java và bộ công cụ WEKA [53] để phân tích, thực nghiệm. Các đối tượng
tham gia thực nghiệm mang điện thoại khi điều khiển phương tiện hoặc
ngồi sau các phương tiện do người khác điều khiển trong quá trình tham
gia giao thông trên đường phố. Vị trí điện thoại có thể thay đổi tùy ý khi
tiến hành thực nghiệm khi đi xe máy.
2.5.2 Dữ liệu thực nghiệm
Hệ thống nhận dạng hành động giao thông được thực hiện để nhận
dạng 4 hành động cơ bản là: đi thẳng, dừng, rẽ trái và rẽ phải. Số lượng
các mẫu thu được cho thực nghiệm được thể hiện ở bảng sau:
Hành động Dừng Đi thẳng Rẽ trái Rẽ phải
Số lượng mẫu 361 3797 1750 1656
Bảng 2-5. Tập mẫu dữ liệu đặc trưng sử dụng nhận dạng hành động giao thông cơ bản
2.5.3 Lựa chọn tập thuộc tính
Để đánh giá, lựa chọn tập thuộc tính phù hợp, chúng tôi sử dụng cách
kết hợp các tập thuộc tính với nhau. Thực nghiệm với các tập thuộc tính
trên thu được các kết quả về độ chính xác Accuracy và AUC như sau:
Random Forest J48 Naïve Bayes KNN SVM
ACC AUC ACC AUC ACC AUC ACC AUC ACC AUC
H2 82,39% 0,9531 65,57% 0,8881 65,57% 0,8326 66,89% 0,8153 65,41% 0,7273
F2 82,85% 0,9530 79,16% 0,8690 54,29% 0,7970 75,99% 0,8120 51,12% 0,6551
T2 88,79% 0,9730 69,90% 0,9213 69,90% 0,8546 73,91% 0,8596 70,86% 0,7506
TH2 88,39% 0,975 82,06% 0,8620 38,19% 0,8440 78,56% 0,8400 76,45% 0,8090
TF2 88,85% 0,9752 70,60% 0,9134 70,60% 0,8462 74,08% 0,8481 70,99% 0,7384
TFH2 88,32% 0,9768 70,36% 0,9104 70,36% 0,8479 72,39% 0,8406 69,64% 0,7384
Bảng 2-11, Kết quả phân lớp hành động trên các tập thuộc tính
Kết quả thực nghiệm cho thấy, tập thuộc tính TFH2 kết hợp từ các
tập thuộc tính khác cho kết quả cao nhất. Thực nghiệm với dữ liệu đã biến
đổi hệ tọa độ thu được kết quả ở bảng sau:
RF J48 NB KNN SVM
AUC ACC AUC ACC AUC ACC AUC ACC AUC ACC
DL thô 0,97676 88,32% 0,910449 85,55% 0,84794 70,36% 0,84058 72,39% 0,73837 69,64%
DL- CT 0,98541 90,97% 0,95921 89,94% 0,94450 86,05% 0,93778 86,40% 0,81313 74,87%
Bảng 2-12. Kết quả so sánh dữ liệu thô và dữ liệu đã biến đổi hệ tọa độ
14
Kết quả thực nghiệm cho thấy, sau khi chuyển trục, kết quả nhận
dạng hành động thu được cao hơn so với kết quả sử dụng dữ liệu thô ở trên
cả 5 thuật toán nên dữ liệu chuyển trục được sử dụng cho nhận dạng hành
động và hành vi giao thông.
2.5.4 Khảo sát thuật toán phân lớp
Thực nghiệm cũng được tiến hành bằng dữ liệu thô trên các thuật
toán thường được sử dụng trong phân tích hành động người là Random
Forest, Naïve Bayes, J48, KNN và SVM với các giá trị mặc định thường
dùng cho mỗi thuật toán với phương pháp kiểm chứng chéo CV10 cho kết
quả như trong hình dưới đây:
Hình 2-11. Kết quả phân lớp với các thuật toán khác nhau
Qua thực nghiệm này chúng tôi lựa chọn được thuật toán RF là phù
hợp cho hệ thống nhận dạng.
2.5.5 Xây dựng dữ liệu huấn luyện
Thực nghiệm tiến hành trên tập thuộc tính TFH2 cùng với và kết quả
phân lớp sử dụng thuật toán rừng ngẫu nhiên tìm ra kích thước cửa sổ khảo
sát trong khoảng từ 1 giây, đến 6 giây được sử dụng với mục đích tìm ra
kích thước cửa sổ phù hợp nhất đối trên từng nhãn lớp. Kết quả thu được
là bộ tham số kích thước cửa sổ và chồng dữ liệu được thể hiện ở Bảng
2-17 dưới đây:
Hành động S G L R
Của sổ (giây) 4 6 5 6
Chồng dữ liệu 75% 75% 50% 50%
AUC 0,999422 0,992828 0,996841 0,987251
Bảng 2-17. Kích thước cửa sổ được tối ưu theo độ đo AUC
Để đánh giá kết quả nhận dạng với tập dữ liệu đặc trưng có được với
dữ liệu đã chuyển trục và xây dựng được từ tập dữ liệu huấn luyện với
50%
70%
90%
110%
RF J48 NB KNN SVM
Đ
ộ
đ
o
A
cc
u
ra
cy
Thuật toán
H2 F2 T2 TH2 TF2 TFH2
0.5
0.7
0.9
RF J48 NB KNN SVM
Đ
ộ
đ
o
A
U
C
Thuật toán
H2 F2 T2 TH2 TF2 TFH2
15
kích thước đã tối ưu sử dụng phương pháp kiểm chứng chéo CV10 trên hai
tập TF2 và TFH2 thu được kết quả ở Bảng 2-18 dưới đây:
RF J48 NB KNN SVM
ACC AUC ACC AUC ACC AUC ACC AUC ACC AUC
TF2 95,78% 0,998550 94,78% 0,978238 90,44% 0,967257 92,04% 0,965410 80,40% 0,836312
TFH2 98,95% 0,999852 98.38% 0,995950 95,25% 0,989185 95,73% 0,982722 83,35% 0,850271
Bảng 2-18. Kết quả phân lớp với tham số tối ưu trên hai tập TF2 và TFH2
Từ kết quả trên cho thấy, khi bổ sung tham số Hjorth vào tập thuộc
tính TF2 ta thu được tập thuộc tính TFH2 mới cho kết quả độ đo Accuracy
lớn hơn độ đo trên tập TF2 cùng một thuật toán phân lớp RF được lựa
chọn là 3,17% và giá trị độ đo AUC lớn hơn là 0,0013.
2.5.6 Đánh giá hệ thống đề xuất so với một số nghiên cứu hiện tại[CT4].
Để đánh giá hệ thống nhận dạng được đề xuất, qua tìm hiểu thu thập,
chúng tôi tiến hành thực nghiệm đánh giá hệ thống dựa trên tập dữ liệu
được thu thập bởi công ty HTC của Đài Loan được công bố trong [56].
Thực nghiệm so sánh phương pháp chúng tôi đề xuất so với một số nghiên
cứu trên cùng tập dữ liệu này thể hiện ở bảng dưới đây:
Nghiên cứu Kết quả phân lớp accuracy
Fang et al, [31] (Sử dụng KNN) 83,57%
Guvensan et al [32], (Sử dụng RF) 91,63%
Phương pháp đề xuất (sử dụng RF) 97,33%
Bảng 2-19. Kết quả so sánh tập thuộc tính với các phương pháp khác trên cùng bộ dữ liệu
HTC [56] [CT4]
2.6 Kết luận
Trong chương này chúng tôi đề xuất hệ thống nhận dạng để thực hiện
nhận dạng hành động giao thông cơ bản là {Dừng, Đi thẳng, Rẽ trái, Rẽ
phải} dựa trên cảm biến gia tốc thu được từ điện thoại thông minh của
người sử dụng phương tiện khi vị trí điện thoại không cố định. Lựa chọn
được tập thuộc tính TFH2 và thuật toán RF cho nhận dạng hành động.
Thực nghiệm với hệ thống đề xuất cũng cho kết quả cao hơn so với một số
công bố đã có trên cùng một tập dữ liệu.
16
Chương 3. NHẬN DẠNG HÀNH VI BẤT THƯỜNG
3.1 Giới thiệu
Luận án đã tìm hiểu, khảo sát các kỹ thuật phân tích dữ liệu cảm biến
sử dụng cho bài toán nhận dạng hành vi. Từ đó, đề xuất giải pháp nhận
dạng ra hành vi bất thường dựa trên hệ thống nhận dạng hành động đã
được trình bày trong chương 2,
3.2 Bài toán nhận dạng hành vi bất thường
3.2.1 Nhận dạng bất thường
3.2.1.1 Dữ liệu bình thường và bất thường
Một dữ liệu bất thường là một dạng mẫu mà nó khác với định nghĩa
của mẫu dữ liệu bình thường. Tuy nhiên, trong thực tế việc định nghĩa một
mẫu bất thường khó hơn rất nhiều so với việc định nghĩa mẫu bình thường.
Do đó, một trong những hướng tiếp cận và định nghĩa một mẫu bất thường
phổ biến đó là dựa vào định nghĩa của mẫu bình thường.
3.2.1.2 Một số kỹ thuật gán nhãn bất thường
Nhãn của dữ liệu thường được gán bởi các chuyên gia trong lĩnh vực
đó. Gán nhãn bất thường khó hơn rất nhiều so với việc gán nhãn bình
thường. Do nhãn bất thường luôn thay đổi và phát sinh nên rất khó gán
nhãn từ tập dữ liệu huấn luyện. Một số kỹ thuật nhận dạng bất thường cơ
bản sử dụng phương pháp gán nhãn được chia thành 3 dạng cơ bản đó
là[58][59]: Dạng 1: Phát hiện bởi phương pháp có giám sát. Dạng 2: Phát
hiện bất thường sử dụng phương pháp bán giám sát. Dạng 3: Sử dụng
phương pháp phát hiện bất thường không giám sát.
3.2.1.3 Phương pháp đánh giá nhận dạng bất thường
Do sự khó khăn về xác định tính chất bất thường và tính chất bình
thường cũng như áp dụng các phương pháp gán nhãn bất thường cho dữ
liệu. Việc đánh giá hệ thống phát hiện bất thường được thiết kế cho từng
17
miền, lĩnh vực khác nhau và phổ biến ở hai dạng sau[58]: Đánh giá dựa
vào kỹ thuật cho điểm và đánh giá dựa vào kỹ thuật gán nhãn..
3.2.2 Sử dụng cảm biến điện thoại để nhận dạng hành vi bất thường
Các đối tượng tham gia giao thông chịu nhiều tác động từ chính yếu
tố tâm lý cá nhân cũng như các yếu tố bên ngoài như hạ tầng giao thông,
yếu tố môi trường, đặc tính của phương tiện và cả hiện trạng giao thông
trong từng thời điểm. Hướng tiếp cận sử dụng cảm biến điện thoại để nhận
dạng hành vi bất thường đang được cộng đồng các nhà nghiên cứu quan
tâm. Tuy nhiên, sử dụng chỉ mình cảm biến gia tốc để nhận dạng hành vi
được chúng tôi lựa chọn thực hiện trong đề tài nghiên cứu này. Với giải
pháp nhận dạng hành vi bất thường là: Nếu chuỗi hành động xảy ra trong
khoảng một thời gian ngắn có sự sai khác so với thời gian một hành động
cơ bản tương ứng xảy ra thì xác định đây là một hành vi bất thường.
3.3 Một số nghiên cứu liên quan
Các phương pháp, kỹ thuật phát hiện hành vi bất thường trong các
nghiên cứu trên gặp phải vấn đề khó khăn đó là làm thế nào để xác định,
thu thập các mẫu dữ liệu bất thường, trong khi dữ liệu cảm biến gia tốc có
nhiều nhiễu từ thiết bị cũng như vị trí điện thoại. Do vậy, để vượt qua được
việc phụ thuộc vào mẫu dữ liệu bất thường, chúng tôi đề xuất hướng tiếp
cận mới để có thể xác định hành vi giao thông bất thường dựa trên phân
tích chuỗi các hành động trong khoảng thời gian ngắn tương ứng một hành
động cơ bản diễn ra.
3.4 Giải pháp nhận dạng hành vi bất thường dựa trên hệ thống nhận
dạng hành động
3.4.1 Một số kỹ thuật nhận dạng hành vi bất thường
3.4.1.1 Kỹ thuật so khớp DTW
Kỹ thuật so khớp thường sử dụng để tìm sự tương đồng giữa hai
chuỗi. Chúng tôi sử dụng phương pháp này để phát hiện hành vi bất
thường dựa trên cảm biến gia tốc được mô tả như Hình 3-1 dưới đây:
18
Cảm biến gia
tốc
(Mẫu dữ liệu
bất thường)
DTW dst > εDTW ?
(Mẫu bất
thường) Hành vi bất
thường
Dữ liệu phát
hiện hành vi
Độ
tương
tự dst
Đúng
Chuyển đổi dữ liệu
Chuyển đổi dữ liệu
Hành vi bình
thường
Sai
Pha huấn luyện
Pha nhận dạng
Mô hình
Nhận dạng
Dữ liệu cảm biến
(Được gán nhãn)
TIỀN XỬ LÝ DỮ LIỆU
- Cửa sổ dữ liệu
- Biến đổi dữ liệu
Dữ liệu đặc
trưng
(Huấn luyện)
Loại hành vi
PHÁT HIỆN HÀNH VI
Dữ liệu cảm biến
(Phát hiện hành
vi)
TIỀN XỬ LÝ DỮ LIỆU
- Cửa sổ dữ liệu
- Biến đổi dữ liệu
Dữ liệu đặc trưng
Tham số mô hình
Hình 3-1. Sử dụng DTW để phát hiện hành vi bất thường
3.4.1.2 Phân lớp dữ liệu với RF và kỹ thuật học sâu
Thuật toán RF và kỹ thuật học sâu được phát triển dựa trên ANN
đang được nhiều sự quan tâm của cộng đồng nghiên cứu. Do vậy, chúng
tôi sử dụng bộ phân lớp Dl4jMlpClassifier được tích hợp trong gói học sâu
WekaDeeplearning4J để nhận dạng hành vi của người tham gia giao thông
với tập dữ liệu huấn luyện được gán nhãn bình thường/ bất thường.
Phương pháp này được thực hiện như mô tả của hình dưới đây:
Hình 3-2. Phát hiện bất thường sử dụng
3.4.2 Giải pháp đề xuất nhận dạng hành vi bất thường dựa trên hệ thống
nhận dạng hành động
Các kỹ thuật trên gặp sự khó khăn chung đó là sự phụ thuộc vào cách
xác định và thu thập mẫu dữ liệu hành vi bất thường. Do vậy, chúng tôi đề
xuất giải pháp nhận dạng hành vi như hình dưới đây:
19
Dữ liệu
cảm biến
gia tốc
Phát hiện
TIỀN XỬ LÝDỮ LIỆU
TRÍCH XUẤT ĐẶC TRƯNG
- W1,W2,W3,...,Wi,...Wn
- F1,F2,F3,...,Fi,...,Fn
W’i
Đúng
PHÁT HIỆN
HÀNH ĐỘNG
TIỀN XỬ LÝDỮ LIỆU
TRÍCH XUẤT ĐẶC TRƯNG
- W’1,W’2,W’3,...,W’k
- F’1,F’2,F’3,...,F’k
PHÁT HIỆN
HÀNH ĐỘNG
ri > ε
Hành vi
bất thường
Wi
Pha 1
Pha 2
k - W’i
Hành vi
bình thường
Sai
Tính rd
`
NHẬN DẠNG
HÀNH ĐỘNG
Dữ liệu
huấn luyện
(Hành vi
giao thông)
W
NHẬN DẠNG
HÀNH ĐỘNG
r > ε
Đánh giá,
lựa chọn
bộ tham số với
hàm
y = f(W, W’, ε )
W’
Đúng
Sai
NHẬN DẠNG
HÀNH ĐỘNG
Dữ liệu
phát hiện
Hành vi
bất thường
W
NHẬN DẠNG
HÀNH ĐỘNG
r > ε W’
Đúng
Sai Hành vi
bình thường
Hành vi
được phát hiện
PHA HUẤN LUYỆN
PHA PHÁT HIỆN Tham số tối ưu: (Wb,Wb’, εb )
Tập tham số
{W, W’, ε}
r
r
Hình 3-3.Sơ đồ hệ thống phát hiện hành vi bất thường
Trong hệ thống nhận dạng hành vi này gồm hai pha: pha thứ nhất là
pha huấn luyện, pha thứ hai là pha nhận dạng hành vi bất thường. Trong
pha huấn luyện được thực hiện dựa trên dữ liệu huấn luyện với mục đích
tìm ra bộ tham số cho kết quả nhận dạng hành vi tốt nhất: '( , , )b b b bt W W
tương ứng với max( )
ib t
y y ; 1,...,i n và n là số các bộ giá trị '( , , )W W tham gia
thực hiện trong pha huấn luyện.
- Trong Pha nhận dạng, sử dụng các tham số '( , , )b b b bt W W đã nhận
được từ Pha huấn luyện để thực hiện các bước thực hiện nhận dạng hành vi
được mô tả như trong Hình 3-4 sau đây:
Hình 3-4. Phát hiện hành vi bất thường dựa trên hành động giao thông cơ bản
20
G G G G G GL R R L L R
3.5 Thực nghiệm và đánh giá
3.5.1 Môi trường thực nghiệm
Chương trình thu dữ liệu cảm biến được xây dựng và thực hiện trên
hệ điều hành Android phiên bản 4.5 đến 6.0. Ngôn ngữ Java được sử dụng
để xây dựng hệ thống, thực hiện quy trình tiền xử lý dữ liệu, các mô hình
phân lớp trong Bộ công cụ WEKA được sử dụng để phát hiện, nhận dạng
phương tiện, hành động hành vi như trong chương 2.
3.5.2 Dữ liệu thực nghiệm
Thực nghiệm thực hiện với phương tiện đặc thù, phổ thông là xe
máy. Hành vi bất thường được xác định nhận dạng trong thực nghiệm đó
là “hành vi lạng lách”. Hành vi này liên quan đến thay đổi hướng điều
khiển phương tiện trong một khoảng thời gian ngắn. Thực nghiệm được
tiến hành trên 8 đối tượng là các cán bộ, nhân viên văn phòng và sinh viên.
Dữ liệu mẫu về hành vi bất thường thực hiện ở các cung đường vắng, theo
cảnh huống giả định của hành vi bất thường đặt ra cùng với các hành vi
bình thường. Vị trí của điện thoại khi thu dữ liệu thể hiện ở Bảng 3-1 sau:
Hành động Số lượng Thời gian Vị trí của điện thoại
Bình thường 15 phút Cầm tay khi lái xe, cầm tay ngồi sau
Bất thường 10 phút Cầm tay khi lái xe, cầm tay ngồi sau, bỏ túi
Bảng 3-1. Thực nghiệm thu dữ liệu nhận dạng hành vi bất thường
Hành vi bất thường – “lạng lách” và hành vi bình thường – “đi
thẳng” xảy ra khi người điều khiển phương tiện rẽ trái và rẽ phải liên tục
theo dạng mẫu biểu diễn ở Hình 3-5 sau:
(a)
(b)
Hình 3-5. Mẫu dữ liệu cảm biến gia tốc của hành vi bất thường (lạng lách): (a); Hành vi bình
thường
21
Trong mẫu dữ liệu cảm biến gia tốc về “hành vi lạng lách”, người
điều khiển phương tiện thực hiện đồng thời chuỗi sáu hành động rẽ trái ký
hiệu là “L” và hành động rẽ phải “R” lần lượt là: “L, R, R, L, L, R” như
Hình 3-5 (a). Bên cạnh đó, chúng tôi giả định một “hành vi bình thường”
gồm 6 hành động di chuyển thẳng. Dữ liệu mẫu cảm biến gia tốc của hành
vi này có dạng như Hình 3-5 (b). Trong đó, các ký hiệu “G” mô tả một
hành động phương tiện di chuyển thẳng theo hướng chuyển động.
Dữ liệu cảm biến gia tốc của các hành vi thu thập được sử dụng với
các kỹ thuật nhận dạng (DTW, kỹ thuật học sâu, Kỹ thuật đề xuất) nhằm
khảo sát, đánh giá tìm ra phương pháp nhận dạng hành vi giao thông phù
hợp. Tập mẫu dữ liệu cảm biến gia tốc về hai loại hành vi bình thường và
bất thường thu được sử dụng cho thực nghiệm theo từng kích thước cửa sổ
dữ liệu được biểu diễn như ở trong Bảng 3-2 dưới đây:
Mẫu DL bất thường Mẫu DL bình thường Tổng số mẫu
4 giây 433 830 1263
5 giây 326 660 986
6 giây 260 546 806
Bảng 3-2. Số lượng các mẫu dữ liệu thực nghiệm
Tùy vào các kỹ thuật nhận dạng hành vi khác nhau, thực nghiệm sẽ
sử dụng các định dạng dữ liệu cảm biến gia tốc thô hoặc đã biến đổi để
phù hợp với đặc điểm và yêu cầu đặt ra.
3.5.3 Kết quả thực nghiệm với DTW
3.5.3.1 Dữ liệu thực nghiệm
Kỹ thuật so khớp DTW dựa trên độ đo khoảng cách để đánh giá sự
tương tự giữa hai chuỗi dữ liệu. Do vậy, dữ liệu cảm biến gia tốc thô
thường được sử dụng để nhận dạng các hành động, hành vi. Tập dữ liệu
được chia thành 70% cho thực nghiệm và 30% cho huấn luyện.
Kết quả thực nghiệm với tập dữ liệu huấn luyện sử dụng kích thước
của sổ lần lượt là 5 giây, 6 giây và 7 giây. Các giá trị ngưỡng được khảo
sát và lựa chọn từ việc đánh giá kết quả tương ứng với các giá trị ngưỡng
{j| j=1,...,10}DTW . Kết quả nhận dạng thu được trên tập dữ liệu huấn luyện
22
cao nhất với kích thước cửa sổ 6 giây, giá trị ngưỡng 5DTW . Và trên tập
dữ liệu kiểm tra thu được kết quả tỉ lệ phát hiện chính xác là 59,6%.
3.5.4 Kết quả thực nghiệm với RF và Dl4jMlpClassifier
3.5.4.1 Dữ liệu thực nghiệm
Dữ liệu huấn luyện sử dụng xây dựng mô hình phân lớp được thu
thập là dữ liệu cảm biến gia tốc với hai nhãn lớp bất thường “lạng lách” và
bình thường “đi thẳng” trên tần số 50Hz. Sau khi tiền xử lý, biến đổi thu
được dữ liệu đặc trưng dựa trên tập thuộc tính đặc trưng TFH2 được lựa
chọn để nhận dạng hành động như trong Chương 2. Thực nghiệm thực
hiện với 3 tập dữ liệu thu được từ các kích thước cửa sổ 4 giây, 5 giây và 6
giây bằng thuật toán RF và kỹ thuật học sâu, sử dụng đánh giá với CV10.
3.5.4.2 Kết quả thực nghiệm
- Thực nghiệm phân lớp dữ liệu với thuật toán RF và bộ phân lớp
Dl4jMlpClassifier với phương pháp kiểm chứng chéo CV10 thu được kết
quả phân lớp với độ đo Accuracy như Bảng 3-3 dưới đây:
Kích thước cửa sổ RF Dl4jMlpClassifier
4 giây 81,19% 89,33%
5 giây 81,12% 86,57%
6 giây 80,97% 89,13%
Bảng 3-3. Kết quả nhận dạng sử dụng CV10
Từ kết quả thu được khi sử dụng phương pháp phân lớp trên tập dữ
liệu kiểm tra cho kết quả phân lớp tốt nhất ở kích thước cửa sổ 4 giây. Với
tập dữ liệu hành vi có nhãn bình thường/ bất thường. Kỹ thuật học sâu cho
kết quả cao hơn so với RF là 8,14% .
3.5.5 Kết quả thực nghiệm với giải pháp đề xuất
3.5.5.1 Dữ liệu thực nghiệm
Phương pháp nhận dạng hành vi bất thường đề xuất với hướng tiếp
cận đánh giá hành vi bất thường dựa trên hệ thống nhận dạng hành động
cơ bản được trình bày ở Chương 2. Tập dữ liệu cảm biến gia tốc thu được
23
chia thành hai phần với 70% là dữ liệu huấn luyện, phần còn lại sử dụng
làm dữ liệu để kiểm tra.
3.5.5.2 Kết quả thực nghiệm
Với kết quả thu được khi thực nghiệm trên tập dữ liệu huấn luyện
cho bộ tham số kích thước cửa sổ W = 6 giây, W’ = 2 giây và ngưỡng giá
trị {0, 5; 0, 6 ; 0, 7} là phù hợp cho nhận dạng hành vi. Kết quả thực nghiệm
trên tập kiểm tra với các tham số này cho kết quả thu được tỉ lệ nhận dạng
hành vi bất thường như trong Bảng 3-4 dưới đây:
S(W, ε) HV bất thường HV bình thường Trung bình
S(6, 5) 90,86% 90,00% 90.43%
S(6, 6) 80,00% 90,81% 85.41%
S(6, 7) 66,28% 95,90% 81.09%
Bảng 3-4. Kết quả phát hiện hành vi của giải pháp đề xuất trên tập dữ liệu kiểm tra
Từ kết quả trong Bảng 3-4 ta thấy, với kích thước 6 giây và giá trị
ngưỡng 0,5 cho kết quả là 90,43%; kết quả này cũng cao hơn phương
pháp sử dụng DTW và phương pháp phân lớp sử dụng Dl4jMlpClassifier
được trình bày trong Bảng 3-5 dưới đây:
Phương pháp DTW Dl4jMlpClassifier RF Phương pháp đề xuất
Tỉ lệ phát hiện 59,6% 89,33% 81.19% 90,43%
Bảng 3-5. Kết quả phát hiện hành vi của các phương pháp khác nhau
Giải pháp đề xuất nhận dạng hành vi bất thường dựa vào đánh giá
một số hành động thay đổi bất thường trong khoảng thời gian ngắn bởi hệ
thống nhận dạng hành động sẽ ít lệ thuộc vào việc xác định mẫu hành vi
bất thường khi nhận dạng nên cho kết quả cao hơn.
3.6 Kết luận
Trong chương này, luận án tập trung nghiên cứu, khảo sát các kỹ
thuật, phương pháp xác định tính bình thường và bất thường của hành vi
giao thông. Từ đó đề xuất giải pháp nhận dạng hành vi giao thông bất
thường dựa trên hệ thống nhận dạng. Thực nghiệm phát hiện hành vi bất
thường với giải phát đề xuất cho thấy kết quả thu được cao hơn phương
pháp sử dụng Dl4jMlpClassifier là 1.1% và so với DTW là 30,83%.
Phương pháp này có thể thực hiện nhận dạng cho một số hành vi bất
thường khác.
24
KẾT LUẬN
Luận án đã tiến hành tìm hiểu, thu thập, khảo sát tính chất của dữ
liệu cảm biến, các kỹ thuật phân tích dữ liệu áp dụng cho loại dữ liệu đặc
thù này. Qua đó, xây dựng hệ thống nhận dạng và đề xuất giải pháp nhận
dạng hành vi dựa trên hệ thống nhận dạng này.
Luận án đã thu được một số kết quả như sau: Xây dựng được tập
thuộc tính đặc trưng phù hợp gồm 59 thuộc tính trên các miền thời gian,
tần số cũng như thuộc tính Hjorth. Đề xuất giải pháp nhận dạng hành động
giao thông cơ bản. Đề xuất giải pháp nhận dạng hành vi bất thường dựa
trên các hành động cơ bản đã được xây dựng ở chương 2.
Bên cạnh một số kết quả đã thu được, vẫn còn một số nội dung mà
Luận án chưa thực hiện được, bao gồm: Xây dựng hệ thống hiển thị và và
giám sát giao thông. Từ đó, có thể nghiên cứu phân tích các tình huống
giao thông khác nhau. Đối với hành vi bất thường, Luận án mới chỉ dừng ở
việc xây dựng mô hình nhận dạng hành vi bất thường, thực hiện khảo sát
với loại hành vi lạng lách của phương tiện xe máy mà chưa có điều kiện
thu thập, phân tích nhiều dạng hành vi bất thường khác nhau, đối với các
loại phương tiện khác nhau trong hệ thống giao thông. Số lượng các mẫu
hành vi cũng chưa được thu thập đa dạng, đủ lớn từ nhiều đối tượng thực
nghiệm, phủ hết các cảnh huống, điều kiện và trên các loại phương tiện
khác nhau.
Trong thời gian tới, chúng tôi sẽ tiếp tục hoàn thiện nghiên cứu của
mình theo một số cách tiếp cận khác nhau như: Áp dụng các phương pháp
lọc, đánh giá tập thuộc tính đặc trưng với mong muốn nâng cao hiệu quả
của mô hình phát hiện, nhận dạng, phát hiện hành động và hành vi bất
thường. Tiến hành thực nghiệm, đánh giá trên các loại phương tiện khác
như ô tô, xe buýt, xe đạp cũng như một số phương tiện phổ thông khác ở
đô thị của Việt nam. Xây dựng ứng dụng với dữ liệu theo thời gian thực.
Mở rộng nghiên cứu xây dựng hệ thống mô phỏng, giám sát giao thông
trực tuyến. Đây cũng là cơ sở để xây dựng các giải pháp quản trị giao
thông thông minh cũng như hỗ trợ người dân đô thị khi tham gia giao
thông.
25
DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN
LUẬN ÁN
[CT1]. Lu DN., Nguyen TT., Ngo TTT., Nguyen TH., Nguyen HN. (2016)
Mobile Online Activity Recognition System Based on Smartphone
Sensors. In: Advances in Information and Communication
Technology. ICTA 2016. Advances in Intelligent Systems and
Computing, vol 538. Springer, Cham. (SCOPUS)
[CT2]. Lu DN., Ngo TTT., Nguyen DN., Nguyen TH., Nguyen HN.
(2017) A Novel Mobile Online Vehicle Status Awareness Method
Using Smartphone Sensors. In: Information Science and
Applications 2017. ICISA 2017. Lecture Notes in Electrical
Engineering, vol 424. Springer, Singapore. (SCOPUS)
[CT3]. Lu DN., Tran TB., Nguyen DN., Nguyen TH., Nguyen HN. (2018)
Abnormal Behavior Detection Based on Smartphone Sensors. In:
Context-Aware Systems and Applications, and Nature of
Computation and Communication. ICCASA 2017, ICTCC 2017.
Lecture Notes of the Institute for Computer Sciences, Social
Informatics and Telecommunications Engineering, vol 217. Springer,
Cham.(SCOPUS).
[CT4].Lu, D.-N.; Nguyen, D.-N.; Nguyen, T.-H.; Nguyen, H.-N. Vehicle
Mode and Driving Activity Detection Based on Analyzing Sensor
Data of Smartphones. Sensors 2018, 18, 1036. (SCIE).
Các file đính kèm theo tài liệu này:
- tom_tat_luan_an_nhan_dang_hanh_vi_cua_nguoi_tham_gia_giao_th.pdf