Tóm tắt Luận án Nhận dạng hành vi của người tham gia giao thông dựa trên cảm biến điện thoại

Luận án đã tiến hành tìm hiểu, thu thập, khảo sát tính chất của dữ liệu cảm biến, các kỹ thuật phân tích dữ liệu áp dụng cho loại dữ liệu đặc thù này. Qua đó, xây dựng hệ thống nhận dạng và đề xuất giải pháp nhận dạng hành vi dựa trên hệ thống nhận dạng này. Luận án đã thu được một số kết quả như sau: Xây dựng được tập thuộc tính đặc trưng phù hợp gồm 59 thuộc tính trên các miền thời gian, tần số cũng như thuộc tính Hjorth. Đề xuất giải pháp nhận dạng hành động giao thông cơ bản. Đề xuất giải pháp nhận dạng hành vi bất thường dựa trên các hành động cơ bản đã được xây dựng ở chương 2. Bên cạnh một số kết quả đã thu được, vẫn còn một số nội dung mà Luận án chưa thực hiện được, bao gồm: Xây dựng hệ thống hiển thị và và giám sát giao thông. Từ đó, có thể nghiên cứu phân tích các tình huống giao thông khác nhau. Đối với hành vi bất thường, Luận án mới chỉ dừng ở việc xây dựng mô hình nhận dạng hành vi bất thường, thực hiện khảo sát với loại hành vi lạng lách của phương tiện xe máy mà chưa có điều kiện thu thập, phân tích nhiều dạng hành vi bất thường khác nhau, đối với các loại phương tiện khác nhau trong hệ thống giao thông. Số lượng các mẫu hành vi cũng chưa được thu thập đa dạng, đủ lớn từ nhiều đối tượng thực nghiệm, phủ hết các cảnh huống, điều kiện và trên các loại phương tiện khác nhau. Trong thời gian tới, chúng tôi sẽ tiếp tục hoàn thiện nghiên cứu của mình theo một số cách tiếp cận khác nhau như: Áp dụng các phương pháp lọc, đánh giá tập thuộc tính đặc trưng với mong muốn nâng cao hiệu quả của mô hình phát hiện, nhận dạng, phát hiện hành động và hành vi bất thường. Tiến hành thực nghiệm, đánh giá trên các loại phương tiện khác như ô tô, xe buýt, xe đạp cũng như một số phương tiện phổ thông khác ở đô thị của Việt nam. Xây dựng ứng dụng với dữ liệu theo thời gian thực. Mở rộng nghiên cứu xây dựng hệ thống mô phỏng, giám sát giao thông trực tuyến. Đây cũng là cơ sở để xây dựng các giải pháp quản trị giao thông thông minh cũng như hỗ trợ người dân đô thị khi tham gia giao thông.

27 trang | Chia sẻ: yenxoi77 | Lượt xem: 898 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Tóm tắt Luận án Nhận dạng hành vi của người tham gia giao thông dựa trên cảm biến điện thoại, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LỮ ĐĂNG NHẠC NHẬN DẠNG HÀNH VI CỦA NGƯỜI THAM GIA GIAO THÔNG DỰA TRÊN CẢM BIẾN ĐIỆN THOẠI Chuyên ngành: Hệ thống Thông tin Mã số: 9480401.01 TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2018 Công trình được hoàn thành tại: Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Người hướng dẫn khoa học: PGS. TS. Nguyễn Hà Nam PGS.TS. Phan Xuân Hiếu Phản biện: PGS.TS. Nguyễn Quốc Cường Phản biện: PGS.TS. Bùi Thu Lâm Phản biện: PGS.TS. Đỗ Trung Tuấn Luận án được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp tại Phòng 212, Nhà E3, Đại học Công nghệ, ĐHQG Hà Nội vào hồi 14 giờ 00’ ngày 28 tháng 12 năm 2018 Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam - Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội 1 MỞ ĐẦU Tính cấp thiết của luận án Trong hệ thống giao thông đô thị, có nhiều yếu tố tác động đến vấn đề quản lý và an toàn giao thông. Trong đó, thái độ và hành vi của người tham gia giao thông có tác động trực tiếp hệ thống. Do đó, việc nhận dạng hành vi của người tham gia giao thông bao gồm cả nhận dạng các hành động và hành vi bất thường có một ý nghĩa rất lớn trong việc xây dựng giải pháp, ứng dụng hỗ trợ người tham gia giao thông. Vì vậy, chủ đề này đã và đang thu hút được sự quan tâm nghiên cứu của nhiều nhà khoa học, các phòng thí nghiệm trên thế giới. Hơn thế nữa, những thông tin về hành vi của người tham gia giao thông sẽ rất hữu ích cho những nhà quản lý trong việc quy hoạch hệ thống và xây dựng chính sách quản lý giao thông và các chính sách an sinh xã hội khác. Ngoài ra, mô hình nhận dạng hành vi người tham gia giao thông còn trợ giúp đánh giá mức độ rủi ro trong các lĩnh vực bảo hiểm cũng như có thể ước tính mức độ tiêu thụ năng lượng và ô nhiễm môi trường của hệ thống giao thông. Để xây dựng được mô hình nhận dạng hành vi của người tham gia giao thông các thông tin, dữ liệu của người tham gia được thu thập bằng nhiều cách khác nhau. Thí nghiệm ban đầu đã thu thập dữ liệu bằng các thiết bị cảm biến cố định trên đối tượng nghiên cứu. Nhờ sự phát triển của công nghệ phần cứng, nhiều loại cảm biến khác nhau được tích hợp đã cho phép điện thoại thông minh trở thành công cụ hữu ích trong việc thu thập dữ liệu từ người dùng. Chính vì vậy, trong thời gian gần đây, nhiều công trình nghiên cứu về nhận dạng hành vi người dùng bao gồm cả hành vi cử chỉ và hành vi trong giao thông dựa trên cảm biến điện thoại thông minh được công bố. Tuy nhiên, để đảm bảo độ chính xác cao trong kết quả của mô hình nhận dạng thì hầu hết các nghiên cứu được thực hiện với vị trí điện thoại cố định trên phương tiện giao thông hoặc sử dụng tập thuộc tính đặc trưng có số lượng lớn nhằm trích xuất dữ liệu từ nhiều nguồn cảm biến khác nhau của điện thoại. Điều này làm cho mô hình xây dựng giảm tính tiện dụng cũng như giảm khả năng ứng dụng trong thực tế. Điều này dẫn 2 đến hướng nghiên cứu về nhận dạng hành vi của người dùng khi vị trí điện thoại người dùng không cố định trong quá trình tham gia giao thông. Ngoài ra, những nghiên cứu đã công bố về nhận dạng hành vi giao thông được thực hiện trong các điều kiện hoàn cảnh khác nhau. Trong đó, có sự khác nhau về yếu tố khu vực địa lý, hạ tầng giao thông và văn hóa so với các điều kiện và môi trường giao thông tại Việt Nam. Do vậy, những mô hình nhận dạng đã được xây dựng gặp nhiều khó khăn khi phát triển và áp dụng trong điều kiện cụ thể của Việt Nam. Sự khác biệt này xuất phát từ một số yếu tố quan trọng bao gồm cả yếu tố khách quan và yếu tố chủ quan. Thứ nhất, đó là các nghiên cứu về bài toán nhận dạng thường tập trung vào các phương tiện giao thông phổ biến tại các nước phát triển với đa số phương tiện sử dụng cho thực nghiệm là xe ô tô, xe buýt và tàu điện ngầm mà ít khi xét đến các phương tiện thô sơ. Trong khi đó, hệ thống giao thông đô thị tại các nước đang phát triển hoặc chậm phát triển, trong đó có Việt nam, các phương tiện giao thông được người dân sử dụng chủ yếu vẫn là xe máy và xe đạp cùng một số phương tiện công cộng khác. Hơn thế nữa, phần lớn các nghiên cứu trước đây thực hiện trong điều kiện hạ tầng giao thông ổn định hơn so với tính đa dạng điều kiện giao thông như ở Việt Nam. Thứ hai, về yếu tố chủ quan đó là văn hóa và thói quen di chuyển của người dân khi tham gia giao thông. Với những phương tiện như ô tô hay xe buýt trong các nghiên cứu, dữ liệu cảm biến được thu thập trong điều kiện phương tiện di chuyển trên các làn đường riêng, hoặc hay đường chạy xác định trước. Điều kiện này không thể thực hiện được với hiện trạng giao thông đô thị của Việt Nam. Tất cả những yếu tố cơ bản kể trên là những lý do giải thích tại sao cần có các nghiên cứu mô hình nhận dạng hành vi giao thông phù hợp với tính chất đặc thù tại Việt Nam. Để hỗ trợ được người tham gia giao thông, một trong những mục đích quan trọng, cấp thiết của mô hình phát hiện hành vi đó là khả năng phát hiện được các hành vi giao thông bất thường. Các nghiên cứu về vấn đề này thường tập trung vào phương tiện ô tô; các phương tiện có những thiết kế, đặc tính khác nhau nên rất khó có một mô hình phù hợp với tất cả các loại phương tiện khác nhau. Các nghiên cứu này cũng thường sử dụng 3 hướng tiếp cận kết hợp nhiều loại cảm biến để thu thập, phân tích dữ liệu cho quá trình nhận dạng. Bên cạnh các cảm biến chuyển động thì các cảm biến khác như GPS, camera hình ảnh và cảm biến âm thanh cũng có thể được sử dụng nhằm nâng cao độ chính xác trong nhận dạng các hành vi bất thường khi lái xe. Việc sử dụng đồng thời nhiều dữ liệu cảm biến cùng một thời điểm dẫn đến tiêu tốn nhiều năng lượng của điện thoại thông minh và khó có thể áp dụng trong thực tế. Hướng tiếp cận lựa chọn thu thập, phân tích dữ liệu cảm biến chuyển động như cảm biến gia tốc sẽ có mức tiêu tốn năng lượng thấp nhất nhưng cần phải xây dựng một mô hình phù hợp để đảm bảo độ chính xác nhận dạng trên các loại phương tiện giao thông khác nhau. Một trong những giải pháp căn cốt cho vấn đề này đó là cần xác định, lựa chọn được tập thuộc tính đặc trưng phù hợp cho các loại phương tiện, thể hiện rõ đặc trưng của hành vi sao cho nhận dạng, phát hiện không làm tăng độ phức tạp tính toán của mô hình mà vẫn đảm bảo kết quả phát hiện hành động, hành vi bất thường. Với mong muốn xây dựng mô hình phát hiện và đoán nhận hành vi bất thường sử dụng cảm biết gia tốc của điện thoại thông minh, chúng tôi chọn đề tài: “Nhận dạng hành vi của người tham gia giao thông dựa trên cảm biến điện thoại” làm đề tài nghiên cứu trong khuôn khổ luận án tiến sĩ chuyên ngành Hệ thống Thông tin nhằm giải quyết một số vấn đề đã đặt ra. Mục tiêu của luận án Mục tiêu chính của Luận án tập trung vào phân tích dữ liệu cảm biến thu được từ điện thoại của người tham gia giao thông nhằm nhận dạng được các hành vi giao thông bất thường. Để giải quyết được mục tiêu của Luận án, chúng tôi tập trung vào giải quyết các vấn đề chính sau: Khảo sát các kỹ thuật phân tích dữ liệu trong và ngoài nước. Tìm hiểu các kỹ thuật thu thập và biến đổi dữ liệu áp dụng cho các loại cảm biến khác nhau, trong đó tập trung vào cảm biến gia tốc có mức tiêu thụ năng lượng thấp nhằm tìm ra tập thuộc tính đặc trưng phù hợp cho hệ thống nhận dạng hành động và hành vi. 4 Xây dựng hệ thống nhận dạng hành động giao thông cơ bản (đi thẳng, dừng, rẽ trái, rẽ phải) của người điều khiển phương tiện dựa trên dữ liệu cảm biến gia tốc được biến đổi từ tập thuộc tính lựa chọn. Dựa trên hệ thống nhận dạng hành động, nghiên cứu, đề xuất giải pháp phát hiện hành vi giao thông bất thường, chủ yếu là với phương tiện xe máy. Trong một thời gian ngắn tương ứng với một hành động cơ bản xảy ra, nếu phát hiện thấy có các hành động sai khác xảy ra thì xác định là một hành vi bất thường. Sự bất thường được đánh giá bằng việc phân đoạn cửa sổ hành động giao thông cơ bản thành các cửa sổ dữ liệu có kích thước nhỏ hơn rồi so sánh nhãn hành động nhận dạng được của các cửa sổ này so với nhãn của hành động giao thông cơ bản đó để xác định sự bất thường hay bình thường dựa trên việc so sánh tỉ lệ sai khác với một tỉ lệ cho trước Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu của Luận án là phân tích, nhận dạng hành vi, hành vi giao thông bất thường của người điều khiển phương tiện. Dựa trên cảm biến gia tốc thu được từ điện thoại thông minh của các đối tượng sử dụng phương tiện để đưa ra giải pháp nhận dạng hành động cơ bản làm cơ sở cho nhận dạng hành vi giao thông bất thường ở đô thị của Việt Nam. Phương pháp nghiên cứu Luận án sử dụng các phương pháp khảo sát, tổng hợp, phân tích thông tin cần thiết; tham khảo, đánh giá các nghiên cứu liên quan để từ đó tìm ra hướng giải quyết vấn đề. Xác định rõ đối tượng và phạm vi nghiên cứu để từ đó xây dựng mô hình nhận dạng hành động và hành vi giao thông. Khảo sát các kỹ thuật thu thập, xử lý dữ liệu cảm biến, phân tích các đặc điểm của phương tiện, hành động giao thông để từ đó đề xuất giải pháp nhận dạng hành động, hành vi giao thông bất thường dựa trên cảm biến thu được. Phương pháp phân tích sử dụng lý thuyết và chứng minh bằng thực nghiệm được áp dụng để thực hiện yêu cầu bài toán đặt ra Đóng góp của luận án Đóng góp thứ nhất của luận án: là đề xuất tập thuộc tính đặc trưng dựa trên miền thời gian và miền tần số nhằm biến đổi dữ liệu cảm biến 5 thành dữ liệu đặc trưng phục vụ cho nhận dạng hành động và hành vi bất thường. Kết quả đọ đo phân lớp dữ liệu được sử dụng để đánh giá, lựa chọn tập thuộc tính. Trong đó, sử dụng tham số Hjorth cho các đại lượng khác nhau nhằm thu được các thuộc tính phù hợp để biến đổi dữ liệu cảm biến thành dữ liệu đặc trưng. Tập thuộc tính đặc trưng phù hợp sẽ sử dụng làm cơ sở cho việc xây dựng hệ thống nhận dạng bằng phương pháp phân lớp [CT2], [CT4]. Khảo sát, lựa chọn kích thước cửa sổ và tỉ lệ chồng dữ liệu để phân tích tìm ra các giá trị tương ứng, phù hợp với các hành động. Qua đó, hỗ trợ hệ thống nhận dạng các hành động giao thông có hiệu quả hơn [CT1], [CT2], [CT4]. Kết quả nhận dạng bằng hệ thống đề xuất cao hơn so với một số nghiên cứu đã được công bố đã có [CT4]. Đóng góp thứ hai của luận án: đề xuất giải pháp phát hiện hành vi giao thông bất thường theo một hướng tiếp cận mới, hướng tiếp cận này dựa trên kết quả nhận dạng hành động cơ bản. Trong thời gian ngắn mà một hành động cơ bản xảy ra, nếu hệ thống nhận dạng được chuỗi các hành động bất thường thì xác định đây là hành vi bất thường. Các giải pháp, kết quả thu được của luận án được trình bày trong 4 công trình đã được công bố. Trong đó có 1 bài báo quốc tế có chỉ số SCIE; 3 bài báo hội nghị quốc tế có phản biện và có chỉ số Scopus được thể hiện ở các công trình [CT1], [CT2], [CT3] và [CT4]. Bố cục của luận án Ngoài phần mở đầu, mục lục, kết luận và tài liệu tham khảo, nội dung chính của luận án được chia thành 3 chương, cụ thể như sau: Chương 1: Giới thiệu một số khái niệm cơ bản về hành động, hành vi giao thông và bài toán nhận dạng hành vi giao sử dụng dữ liệu cảm biến. Chương 2: Xây dựng hệ thống nhận dạng hành động giao thông cơ bản dựa trên cảm biến điện thoại. Chương 3: Dựa trên kết quả của hệ thống nhận dạng hành động, đề xuất giải pháp nhận dạng hành vi giao thông, hành vi bất thường. 6 Chương 1. TỔNG QUAN VỀ PHÂN TÍCH HÀNH VI 1.1 Giới thiệu Cảm biến thu được từ điện thoại được dùng phân tích trong nhiều bài toán khác nhau. Trong đó có bài toán nhận dạng hành vi. Vì điện thoại thông minh được sử dụng cho nhiều mục đích cá nhân khác nhau cũng như có giới hạn về năng lượng, sự đa dạng về chủng loại, chất lượng của thiết bị phần cứng dẫn đến yêu cầu cần phải xây dựng hệ thống, giải pháp phân tích, phát hiện hành động, hành vi sao cho phù hợp là một bài toán đặt ra cần được giải quyết. 1.2 Một số khái niệm cơ bản 1.2.1 Hành động giao thông Hành động giao thông là việc người điều khiển thay đổi trạng thái của phương tiện trong quá trình tham gia giao thông[10]. 1.2.2 Hành vi giao thông Hành vi giao thông là sự biểu hiện thay đổi trạng thái của phương tiện theo những cách thức, mức độ, tính chất khác nhau trong quá trình lưu thông [10][11][12] [13]. 1.3 Sử dụng dữ liệu cảm biến để phân tích hành vi Cảm biến điện thoại thông minh hiện nay ngày càng đa dạng. Khi sử dụng kết hợp nhiều cảm biến sẽ làm tiêu hao năng lượng nên lựa chọn cảm biến gia tốc có ưu điểm tốn ít tài nguyên của thiết bị để xây dựng hệ thống là một trong hướng tiếp cận phù hợp đáp ứng được yêu cầu của bài toán phân tích, nhận dạng hành vi giao thông dựa trên điện thoại thông minh của người điều khiển phương tiện mang theo trong điều kiện, môi trường giao thông đô thị Việt Nam. 1.4 Một số nghiên cứu liên quan Các nghiên cứu công bố gần đây đã chỉ ra hiệu quả của việc kết hợp nhiều loại cảm biến khác nhau trong bài toán phân tích hành vi. Tuy nhiên, 7 việc chỉ sử dụng dữ liệu cảm biến gia tốc sẽ phù hợp với các điện thoại phổ biến và ít tiêu hao năng lượng. Cũng như hướng tiếp cận sử dụng tập đặc trưng và phương pháp phân lớp cho dạng bài toán này. 1.5 Phương pháp nhận dạng hành vi giao thông dựa trên cảm biến Từ những vấn đề trên chúng tôi đề xuất phương phân tích, pháp nhận dạng hành vi giao thông bất thường dựa trên cảm biến gia tốc như Hình 1-1 dưới đây: THU THẬP TIỀN XỬ LÝ DỮ LIỆU NHẬN DẠNG HÀNH ĐỘNG Chương 2 PHÂN TÍCH HÀNH VI BẤT THƯỜNG Chương 3 LOẠI HÀNH VI BẤT THƯỜNG Hành động Hành vi bất thường Hình 1-1. Hệ thống phân tích hành vi bất thường 1.6 Kết luận Trong chương này, chúng tôi đã tìm hiểu, khảo sát các nghiên cứu liên quan đến bài toán nhận dạng hành vi. Làm rõ một số khái niệm cơ bản về hành động, hành vi, hành vi bất thường trong lĩnh vực giao thông. Tìm hiểu phương pháp, kỹ thuật phân tích, nhận dạng hành vi, đặc biệt là hướng tiếp cận sử dụng dữ liệu cảm biến điện thoại thông minh thu được của người điều khiển phương tiện 8 Chương 2. NHẬN DẠNG HÀNH ĐỘNG GIAO THÔNG 2.1 Giới thiệu Trong chương này, Luận án tập trung vào việc xây dựng hệ thống nhận dạng hành động cơ bản của các đối tượng điều khiển phương tiện giao thông dựa trên tín hiệu cảm biến thu được từ điện thoại mang theo. Hướng tiếp cận sử dụng biến đổi dữ liệu cảm biến thô thành dữ liệu đặc trưng áp dụng kỹ thuật cửa sổ dữ liệu với tập thuộc tính đặc trưng được khảo sát và lựa chọn. Sau đó, nhận dạng bằng phương pháp phân lớp. 2.2 Sử dụng dữ liệu cảm biến để nhận dạng hành động giao thông Sử dụng tín hiệu cảm biến của điện thoại mang theo để phân tích, nhận dạng ngày càng được phổ biến và sử dụng với các yêu cầu khác nhau trong nhiều hệ thống thông minh. Một số hướng nghiên cứu đã sử dụng cảm biến hình ảnh thu được từ camera hoặc kết hợp nhiều cảm biến khác nhau để nhận dạng hành động. Tuy nhiên, hướng tới sự thuận lợi và tiết kiệm năng lượng của thiết bị. Chúng tôi chỉ sử dụng thông tin, dữ liệu đầu vào là cảm biến gia tốc thu được từ điện thoại thông minh mang theo của người tham gia giao thông, vị trí của điện thoại có thể thay đổi trong hành trình[CT2], [CT4]. 2.3 Một số nghiên cứu liên quan Đối với bài toán nhận dạng hành động giao thông, một số sự kiện, hành động, hành vi cơ bản của người điều khiển được thể hiện ở công bố của một số nghiên cứu liên quan. Trong đó, các hành hành động, hành vi thường được nhận dạng với các vị trí điện thoại được cố định hoặc biết trước góc xoay so với chuyển động nhằm thu được dữ liệu mẫu ổn định. Ngoài phương pháp so khớp, phương pháp phân lớp cũng thường được sử dụng cho bài toán này dựa trên hướng tiếp cận trích xuất đặc trưng. 9 2.4 Hệ thống nhận dạng hành động sử dụng cảm biến gia tốc 2.4.1 Một số kiến thức cơ sở 2.4.1.1 Tiền xử lý dữ liệu Chuẩn bị dữ liệu là một bước quan trọng trong khai phá dữ liệu, dữ liệu được chuẩn bị tốt sẽ giúp hệ thống thực hiện hiệu quả hơn [36][37]. Trong bài toán nhận dạng hành động giao thông sử dụng dữ liệu cảm biến từ điện thoại sau khi tiền xử lý, biến đổi thành dữ liệu đặc trưng và nhận dạng dựa trên phương pháp phân lớp 2.4.1.2 Cửa sổ dữ liệu Trong hệ thống nhận dạng đề xuất, cửa sổ dữ liệu được khảo sát nhằm chọn ra kích thước phù hợp với từng loại hành động với mục đích nâng cao kết quả nhận dạng được trình bày như Hình 2-2 dưới đây: 1 2 k-1 k k+1 N-1 N w =Độ dài của cửa sổ Cửa sổ i-1 Cửa sổ i+1Cửa sổ i Chồng dữ liệu Hình 2-2. Phân đoạn chuỗi thành các cửa sổ dữ liệu 2.4.1.3 Biến đổ hệ tọa độ Phương pháp biến đổi hệ tọa độ của thiết bị sang hệ tọa độ trái đất cũng thường được áp dụng trong phân tích dữ liệu cảm biến gia tốc[41][42] khi thiết bị cảm biến không cố định theo hướng chuyển động của phương tiện.Phương pháp biến đổi hệ tọa độ của thiết bị cảm biến về hệ trục tọa độ của trái đất được thể hiện như (a) (b) Hình 2-3. (a) Hướng của điện thoại được xác định bởi hệ tọa độ (X, Y, Z). (b) Hướng di chuyển của phương tiện theo hệ tọa độ trái đất (X’, Y’, Z’) 10 2.4.1.4 Biến đổi dữ liệu đặc trưng Trong kỹ thuật xử lý tín hiệu cảm biến, các thuộc tính đặc trưng thường được lựa chọn dựa trên tính chất thời gian và tần số [44][45]. Phương pháp kết hợp thuộc tính trên các miền thường được sử dụng để phân tích, nhận dạng hành động, hành vi được biểu diễn như trong Hình 2-4 dưới đây [46]. Hình 2-4. Kết hợp biểu diễn thông tin trên miền thời gian và miền tần số [46] 2.4.1.5 Thuộc tính trên miền thời gian Các thuộc tính trong miền thời gian có đặc điểm tính toán nhanh, thực hiện với các giá trị thống kê, so sánh sự khác biệt của các mẫu dữ liệu. Do tính chất dữ liệu cảm biến thu được của các hành động, hành vi thay đổi theo thời gian. 2.4.1.6 Thuộc tính trên miền tần số Các kỹ thuật miền tần số thường được sử dụng để xác định bản chất lặp lại của tín hiệu cảm biến. Tính lặp lại này thường tương quan với bản chất tuần hoàn của một hành động, hành vi nào đó cần nhận dạng. 2.4.1.7 Tham số Hjorth Tham số Hjorth [49] là đại lượng thường được sử dụng trong phân tích các tín hiệu y sinh. Đại lượng này chỉ ra tính chất thống kê của một tín hiệu trong miền thời gian gồm ba loại tham số là tính hoạt động (Activity), tính di động (Mobility) và độ phức tạp (Complexity). 11 The parameters Mô hình Nhận dạng PHÂN LỚP Dữ liệu gia tốc (gán nhãn) TIỀN XỬ LÝ DỮ LIỆU - Kỹ thuật cửa sổ - Biến đổi dữ liệu Dữ liệu gia tốc (phát hiện) Tham số mô hình Hành động Pha huấn luyện Pha pha phát hiện ` LOẠI HÀNH ĐỘNG TIỀN XỬ LÝ DỮ LIỆU - Kỹ thuật cửa sổ - Biến đổi dữ liệu 2.4.1.8 Phương pháp đánh giá phân lớp bằng AUC Các phương pháp đánh giá mô hình thường được sử dụng khi đánh giá với mô hình phân lớp dữ liệu đó là dựa trên ma trận nhầm lẫn. Có hai độ đo thường được sử dụng để đánh giá mô hình phân lớp đó là độ chính xác (Accuracy) và độ đo AUC sử dụng CV10. 2.4.2 Tập thuộc tính đặc trưng Sự di chuyển của phương tiện giao thông làm thay đổi gia tốc nên các thuộc tính trong miền thời gian có ý nghĩa và hàm chứa những thông tin hữu ích khi phân tích các hành động, hành vi. Tập thuộc tính kết hợp cho nhận dạng được thể hiện như bảng dưới đây: Miền, tham số Hjorth Tên tập thuộc tính Thời gian T2 Tần số F2 Hjorth H2 Thời gian + Tần số TF2 Thời gian + Hjorth TH2 Thời gian + Tần số + Hojrth TFH2 Bảng 2-1. Tập thuộc tính sử dụng nhận dạng 2.4.3 Đề xuất hệ thống nhận dạng hành động Việc nhận dạng hành động, hành vi cần có những giải pháp, kỹ thuật phù hợp với yêu cầu thực tiễn của bài toán. Do vậy, chúng tôi xây dựng hệ thống nhận dạng như Hình 2- nhằm nhận dạng hành động giao thông cơ bản (Dừng, Đi thẳng, Rẽ trái, Rẽ phải) được biểu diễn như Hình 2-7 dưới đây: Hình 2-7. Hệ thống nhận dạng hành động giao thông 12 Hệ thống nhận dạng bao gồm Pha huấn luyện để xây dựng mô hình nhận dạng. Pha thứ hai: nhận dạng các hành động dựa trên dữ liệu cảm biến phát hiện thu được từ điện thoại của đối tượng đang tham gia giao thông dựa trên mô hình đã xây dựng được. Giải pháp nâng cao kết quả nhận dạng thông qua lựa chọn kích thước cửa sổ cho từng hành động dựa trên độ đo AUC được trình bày trong Hình 2- 8 sau đây: Hình 2-8. Thuật toán tối ưu kích thước cửa sổ và chồng dữ liệu theo AUC Trong đó pha phát hiện với N nhãn lớp hành động khi sử dụng giải pháp tối ưu cửa sổ sẽ có N kích thước cửa sổ khác nhau, đồng thời cần phải thực hiện N lần phân lớp để xác định kết quả nhãn lớp để đưa ra nhãn lớp phù hợp theo Hình 2-9 như sau: DỮ LIỆU PHÁT HIỆN MÔ HÌNH PHÂN LỚP M1 MÔ HÌNH PHÂN LỚP Mi MÔ HÌNH PHÂN LỚP MN NHÃN LỚP Xử lý với kích thước Wi ĐÁNH GIÁ NHÃN LỚP X C ĐỊNH Hình 2-9. Nhận dạng hành động với các kích thước cửa sổ đã được lựa chọn. Tại một thời điểm, dữ liệu được tiền xử lý với N kích thước cửa sổ tối ưu và được nhận dạng nhãn lớp tương ứng. Sử dụng kỹ thuận nhận dạng như trên sẽ cho kết quả nhãn lớp phù hợp với cửa sổ dữ liệu đầu vào. 13 2.5 Thực nghiệm và đánh giá 2.5.1 Môi trường thực nghiệm Hệ thống thu thập và phân tích dữ liệu cảm biến của điện thoại được xây dựng dựa trên hệ điều hành Android phiên bản 4.5 đến 6.0; ngôn ngữ Java và bộ công cụ WEKA [53] để phân tích, thực nghiệm. Các đối tượng tham gia thực nghiệm mang điện thoại khi điều khiển phương tiện hoặc ngồi sau các phương tiện do người khác điều khiển trong quá trình tham gia giao thông trên đường phố. Vị trí điện thoại có thể thay đổi tùy ý khi tiến hành thực nghiệm khi đi xe máy. 2.5.2 Dữ liệu thực nghiệm Hệ thống nhận dạng hành động giao thông được thực hiện để nhận dạng 4 hành động cơ bản là: đi thẳng, dừng, rẽ trái và rẽ phải. Số lượng các mẫu thu được cho thực nghiệm được thể hiện ở bảng sau: Hành động Dừng Đi thẳng Rẽ trái Rẽ phải Số lượng mẫu 361 3797 1750 1656 Bảng 2-5. Tập mẫu dữ liệu đặc trưng sử dụng nhận dạng hành động giao thông cơ bản 2.5.3 Lựa chọn tập thuộc tính Để đánh giá, lựa chọn tập thuộc tính phù hợp, chúng tôi sử dụng cách kết hợp các tập thuộc tính với nhau. Thực nghiệm với các tập thuộc tính trên thu được các kết quả về độ chính xác Accuracy và AUC như sau: Random Forest J48 Naïve Bayes KNN SVM ACC AUC ACC AUC ACC AUC ACC AUC ACC AUC H2 82,39% 0,9531 65,57% 0,8881 65,57% 0,8326 66,89% 0,8153 65,41% 0,7273 F2 82,85% 0,9530 79,16% 0,8690 54,29% 0,7970 75,99% 0,8120 51,12% 0,6551 T2 88,79% 0,9730 69,90% 0,9213 69,90% 0,8546 73,91% 0,8596 70,86% 0,7506 TH2 88,39% 0,975 82,06% 0,8620 38,19% 0,8440 78,56% 0,8400 76,45% 0,8090 TF2 88,85% 0,9752 70,60% 0,9134 70,60% 0,8462 74,08% 0,8481 70,99% 0,7384 TFH2 88,32% 0,9768 70,36% 0,9104 70,36% 0,8479 72,39% 0,8406 69,64% 0,7384 Bảng 2-11, Kết quả phân lớp hành động trên các tập thuộc tính Kết quả thực nghiệm cho thấy, tập thuộc tính TFH2 kết hợp từ các tập thuộc tính khác cho kết quả cao nhất. Thực nghiệm với dữ liệu đã biến đổi hệ tọa độ thu được kết quả ở bảng sau: RF J48 NB KNN SVM AUC ACC AUC ACC AUC ACC AUC ACC AUC ACC DL thô 0,97676 88,32% 0,910449 85,55% 0,84794 70,36% 0,84058 72,39% 0,73837 69,64% DL- CT 0,98541 90,97% 0,95921 89,94% 0,94450 86,05% 0,93778 86,40% 0,81313 74,87% Bảng 2-12. Kết quả so sánh dữ liệu thô và dữ liệu đã biến đổi hệ tọa độ 14 Kết quả thực nghiệm cho thấy, sau khi chuyển trục, kết quả nhận dạng hành động thu được cao hơn so với kết quả sử dụng dữ liệu thô ở trên cả 5 thuật toán nên dữ liệu chuyển trục được sử dụng cho nhận dạng hành động và hành vi giao thông. 2.5.4 Khảo sát thuật toán phân lớp Thực nghiệm cũng được tiến hành bằng dữ liệu thô trên các thuật toán thường được sử dụng trong phân tích hành động người là Random Forest, Naïve Bayes, J48, KNN và SVM với các giá trị mặc định thường dùng cho mỗi thuật toán với phương pháp kiểm chứng chéo CV10 cho kết quả như trong hình dưới đây: Hình 2-11. Kết quả phân lớp với các thuật toán khác nhau Qua thực nghiệm này chúng tôi lựa chọn được thuật toán RF là phù hợp cho hệ thống nhận dạng. 2.5.5 Xây dựng dữ liệu huấn luyện Thực nghiệm tiến hành trên tập thuộc tính TFH2 cùng với và kết quả phân lớp sử dụng thuật toán rừng ngẫu nhiên tìm ra kích thước cửa sổ khảo sát trong khoảng từ 1 giây, đến 6 giây được sử dụng với mục đích tìm ra kích thước cửa sổ phù hợp nhất đối trên từng nhãn lớp. Kết quả thu được là bộ tham số kích thước cửa sổ và chồng dữ liệu được thể hiện ở Bảng 2-17 dưới đây: Hành động S G L R Của sổ (giây) 4 6 5 6 Chồng dữ liệu 75% 75% 50% 50% AUC 0,999422 0,992828 0,996841 0,987251 Bảng 2-17. Kích thước cửa sổ được tối ưu theo độ đo AUC Để đánh giá kết quả nhận dạng với tập dữ liệu đặc trưng có được với dữ liệu đã chuyển trục và xây dựng được từ tập dữ liệu huấn luyện với 50% 70% 90% 110% RF J48 NB KNN SVM Đ ộ đ o A cc u ra cy Thuật toán H2 F2 T2 TH2 TF2 TFH2 0.5 0.7 0.9 RF J48 NB KNN SVM Đ ộ đ o A U C Thuật toán H2 F2 T2 TH2 TF2 TFH2 15 kích thước đã tối ưu sử dụng phương pháp kiểm chứng chéo CV10 trên hai tập TF2 và TFH2 thu được kết quả ở Bảng 2-18 dưới đây: RF J48 NB KNN SVM ACC AUC ACC AUC ACC AUC ACC AUC ACC AUC TF2 95,78% 0,998550 94,78% 0,978238 90,44% 0,967257 92,04% 0,965410 80,40% 0,836312 TFH2 98,95% 0,999852 98.38% 0,995950 95,25% 0,989185 95,73% 0,982722 83,35% 0,850271 Bảng 2-18. Kết quả phân lớp với tham số tối ưu trên hai tập TF2 và TFH2 Từ kết quả trên cho thấy, khi bổ sung tham số Hjorth vào tập thuộc tính TF2 ta thu được tập thuộc tính TFH2 mới cho kết quả độ đo Accuracy lớn hơn độ đo trên tập TF2 cùng một thuật toán phân lớp RF được lựa chọn là 3,17% và giá trị độ đo AUC lớn hơn là 0,0013. 2.5.6 Đánh giá hệ thống đề xuất so với một số nghiên cứu hiện tại[CT4]. Để đánh giá hệ thống nhận dạng được đề xuất, qua tìm hiểu thu thập, chúng tôi tiến hành thực nghiệm đánh giá hệ thống dựa trên tập dữ liệu được thu thập bởi công ty HTC của Đài Loan được công bố trong [56]. Thực nghiệm so sánh phương pháp chúng tôi đề xuất so với một số nghiên cứu trên cùng tập dữ liệu này thể hiện ở bảng dưới đây: Nghiên cứu Kết quả phân lớp accuracy Fang et al, [31] (Sử dụng KNN) 83,57% Guvensan et al [32], (Sử dụng RF) 91,63% Phương pháp đề xuất (sử dụng RF) 97,33% Bảng 2-19. Kết quả so sánh tập thuộc tính với các phương pháp khác trên cùng bộ dữ liệu HTC [56] [CT4] 2.6 Kết luận Trong chương này chúng tôi đề xuất hệ thống nhận dạng để thực hiện nhận dạng hành động giao thông cơ bản là {Dừng, Đi thẳng, Rẽ trái, Rẽ phải} dựa trên cảm biến gia tốc thu được từ điện thoại thông minh của người sử dụng phương tiện khi vị trí điện thoại không cố định. Lựa chọn được tập thuộc tính TFH2 và thuật toán RF cho nhận dạng hành động. Thực nghiệm với hệ thống đề xuất cũng cho kết quả cao hơn so với một số công bố đã có trên cùng một tập dữ liệu. 16 Chương 3. NHẬN DẠNG HÀNH VI BẤT THƯỜNG 3.1 Giới thiệu Luận án đã tìm hiểu, khảo sát các kỹ thuật phân tích dữ liệu cảm biến sử dụng cho bài toán nhận dạng hành vi. Từ đó, đề xuất giải pháp nhận dạng ra hành vi bất thường dựa trên hệ thống nhận dạng hành động đã được trình bày trong chương 2, 3.2 Bài toán nhận dạng hành vi bất thường 3.2.1 Nhận dạng bất thường 3.2.1.1 Dữ liệu bình thường và bất thường Một dữ liệu bất thường là một dạng mẫu mà nó khác với định nghĩa của mẫu dữ liệu bình thường. Tuy nhiên, trong thực tế việc định nghĩa một mẫu bất thường khó hơn rất nhiều so với việc định nghĩa mẫu bình thường. Do đó, một trong những hướng tiếp cận và định nghĩa một mẫu bất thường phổ biến đó là dựa vào định nghĩa của mẫu bình thường. 3.2.1.2 Một số kỹ thuật gán nhãn bất thường Nhãn của dữ liệu thường được gán bởi các chuyên gia trong lĩnh vực đó. Gán nhãn bất thường khó hơn rất nhiều so với việc gán nhãn bình thường. Do nhãn bất thường luôn thay đổi và phát sinh nên rất khó gán nhãn từ tập dữ liệu huấn luyện. Một số kỹ thuật nhận dạng bất thường cơ bản sử dụng phương pháp gán nhãn được chia thành 3 dạng cơ bản đó là[58][59]: Dạng 1: Phát hiện bởi phương pháp có giám sát. Dạng 2: Phát hiện bất thường sử dụng phương pháp bán giám sát. Dạng 3: Sử dụng phương pháp phát hiện bất thường không giám sát. 3.2.1.3 Phương pháp đánh giá nhận dạng bất thường Do sự khó khăn về xác định tính chất bất thường và tính chất bình thường cũng như áp dụng các phương pháp gán nhãn bất thường cho dữ liệu. Việc đánh giá hệ thống phát hiện bất thường được thiết kế cho từng 17 miền, lĩnh vực khác nhau và phổ biến ở hai dạng sau[58]: Đánh giá dựa vào kỹ thuật cho điểm và đánh giá dựa vào kỹ thuật gán nhãn.. 3.2.2 Sử dụng cảm biến điện thoại để nhận dạng hành vi bất thường Các đối tượng tham gia giao thông chịu nhiều tác động từ chính yếu tố tâm lý cá nhân cũng như các yếu tố bên ngoài như hạ tầng giao thông, yếu tố môi trường, đặc tính của phương tiện và cả hiện trạng giao thông trong từng thời điểm. Hướng tiếp cận sử dụng cảm biến điện thoại để nhận dạng hành vi bất thường đang được cộng đồng các nhà nghiên cứu quan tâm. Tuy nhiên, sử dụng chỉ mình cảm biến gia tốc để nhận dạng hành vi được chúng tôi lựa chọn thực hiện trong đề tài nghiên cứu này. Với giải pháp nhận dạng hành vi bất thường là: Nếu chuỗi hành động xảy ra trong khoảng một thời gian ngắn có sự sai khác so với thời gian một hành động cơ bản tương ứng xảy ra thì xác định đây là một hành vi bất thường. 3.3 Một số nghiên cứu liên quan Các phương pháp, kỹ thuật phát hiện hành vi bất thường trong các nghiên cứu trên gặp phải vấn đề khó khăn đó là làm thế nào để xác định, thu thập các mẫu dữ liệu bất thường, trong khi dữ liệu cảm biến gia tốc có nhiều nhiễu từ thiết bị cũng như vị trí điện thoại. Do vậy, để vượt qua được việc phụ thuộc vào mẫu dữ liệu bất thường, chúng tôi đề xuất hướng tiếp cận mới để có thể xác định hành vi giao thông bất thường dựa trên phân tích chuỗi các hành động trong khoảng thời gian ngắn tương ứng một hành động cơ bản diễn ra. 3.4 Giải pháp nhận dạng hành vi bất thường dựa trên hệ thống nhận dạng hành động 3.4.1 Một số kỹ thuật nhận dạng hành vi bất thường 3.4.1.1 Kỹ thuật so khớp DTW Kỹ thuật so khớp thường sử dụng để tìm sự tương đồng giữa hai chuỗi. Chúng tôi sử dụng phương pháp này để phát hiện hành vi bất thường dựa trên cảm biến gia tốc được mô tả như Hình 3-1 dưới đây: 18 Cảm biến gia tốc (Mẫu dữ liệu bất thường) DTW dst > εDTW ? (Mẫu bất thường) Hành vi bất thường Dữ liệu phát hiện hành vi Độ tương tự dst Đúng Chuyển đổi dữ liệu Chuyển đổi dữ liệu Hành vi bình thường Sai Pha huấn luyện Pha nhận dạng Mô hình Nhận dạng Dữ liệu cảm biến (Được gán nhãn) TIỀN XỬ LÝ DỮ LIỆU - Cửa sổ dữ liệu - Biến đổi dữ liệu Dữ liệu đặc trưng (Huấn luyện) Loại hành vi PHÁT HIỆN HÀNH VI Dữ liệu cảm biến (Phát hiện hành vi) TIỀN XỬ LÝ DỮ LIỆU - Cửa sổ dữ liệu - Biến đổi dữ liệu Dữ liệu đặc trưng Tham số mô hình Hình 3-1. Sử dụng DTW để phát hiện hành vi bất thường 3.4.1.2 Phân lớp dữ liệu với RF và kỹ thuật học sâu Thuật toán RF và kỹ thuật học sâu được phát triển dựa trên ANN đang được nhiều sự quan tâm của cộng đồng nghiên cứu. Do vậy, chúng tôi sử dụng bộ phân lớp Dl4jMlpClassifier được tích hợp trong gói học sâu WekaDeeplearning4J để nhận dạng hành vi của người tham gia giao thông với tập dữ liệu huấn luyện được gán nhãn bình thường/ bất thường. Phương pháp này được thực hiện như mô tả của hình dưới đây: Hình 3-2. Phát hiện bất thường sử dụng 3.4.2 Giải pháp đề xuất nhận dạng hành vi bất thường dựa trên hệ thống nhận dạng hành động Các kỹ thuật trên gặp sự khó khăn chung đó là sự phụ thuộc vào cách xác định và thu thập mẫu dữ liệu hành vi bất thường. Do vậy, chúng tôi đề xuất giải pháp nhận dạng hành vi như hình dưới đây: 19 Dữ liệu cảm biến gia tốc Phát hiện TIỀN XỬ LÝDỮ LIỆU TRÍCH XUẤT ĐẶC TRƯNG - W1,W2,W3,...,Wi,...Wn - F1,F2,F3,...,Fi,...,Fn W’i Đúng PHÁT HIỆN HÀNH ĐỘNG TIỀN XỬ LÝDỮ LIỆU TRÍCH XUẤT ĐẶC TRƯNG - W’1,W’2,W’3,...,W’k - F’1,F’2,F’3,...,F’k PHÁT HIỆN HÀNH ĐỘNG ri > ε Hành vi bất thường Wi Pha 1 Pha 2 k - W’i Hành vi bình thường Sai Tính rd ` NHẬN DẠNG HÀNH ĐỘNG Dữ liệu huấn luyện (Hành vi giao thông) W NHẬN DẠNG HÀNH ĐỘNG r > ε Đánh giá, lựa chọn bộ tham số với hàm y = f(W, W’, ε ) W’ Đúng Sai NHẬN DẠNG HÀNH ĐỘNG Dữ liệu phát hiện Hành vi bất thường W NHẬN DẠNG HÀNH ĐỘNG r > ε W’ Đúng Sai Hành vi bình thường Hành vi được phát hiện PHA HUẤN LUYỆN PHA PHÁT HIỆN Tham số tối ưu: (Wb,Wb’, εb ) Tập tham số {W, W’, ε} r r Hình 3-3.Sơ đồ hệ thống phát hiện hành vi bất thường Trong hệ thống nhận dạng hành vi này gồm hai pha: pha thứ nhất là pha huấn luyện, pha thứ hai là pha nhận dạng hành vi bất thường. Trong pha huấn luyện được thực hiện dựa trên dữ liệu huấn luyện với mục đích tìm ra bộ tham số cho kết quả nhận dạng hành vi tốt nhất: '( , , )b b b bt W W  tương ứng với max( ) ib t y y ; 1,...,i n và n là số các bộ giá trị '( , , )W W  tham gia thực hiện trong pha huấn luyện. - Trong Pha nhận dạng, sử dụng các tham số '( , , )b b b bt W W  đã nhận được từ Pha huấn luyện để thực hiện các bước thực hiện nhận dạng hành vi được mô tả như trong Hình 3-4 sau đây: Hình 3-4. Phát hiện hành vi bất thường dựa trên hành động giao thông cơ bản 20 G G G G G GL R R L L R 3.5 Thực nghiệm và đánh giá 3.5.1 Môi trường thực nghiệm Chương trình thu dữ liệu cảm biến được xây dựng và thực hiện trên hệ điều hành Android phiên bản 4.5 đến 6.0. Ngôn ngữ Java được sử dụng để xây dựng hệ thống, thực hiện quy trình tiền xử lý dữ liệu, các mô hình phân lớp trong Bộ công cụ WEKA được sử dụng để phát hiện, nhận dạng phương tiện, hành động hành vi như trong chương 2. 3.5.2 Dữ liệu thực nghiệm Thực nghiệm thực hiện với phương tiện đặc thù, phổ thông là xe máy. Hành vi bất thường được xác định nhận dạng trong thực nghiệm đó là “hành vi lạng lách”. Hành vi này liên quan đến thay đổi hướng điều khiển phương tiện trong một khoảng thời gian ngắn. Thực nghiệm được tiến hành trên 8 đối tượng là các cán bộ, nhân viên văn phòng và sinh viên. Dữ liệu mẫu về hành vi bất thường thực hiện ở các cung đường vắng, theo cảnh huống giả định của hành vi bất thường đặt ra cùng với các hành vi bình thường. Vị trí của điện thoại khi thu dữ liệu thể hiện ở Bảng 3-1 sau: Hành động Số lượng Thời gian Vị trí của điện thoại Bình thường 15 phút Cầm tay khi lái xe, cầm tay ngồi sau Bất thường 10 phút Cầm tay khi lái xe, cầm tay ngồi sau, bỏ túi Bảng 3-1. Thực nghiệm thu dữ liệu nhận dạng hành vi bất thường Hành vi bất thường – “lạng lách” và hành vi bình thường – “đi thẳng” xảy ra khi người điều khiển phương tiện rẽ trái và rẽ phải liên tục theo dạng mẫu biểu diễn ở Hình 3-5 sau: (a) (b) Hình 3-5. Mẫu dữ liệu cảm biến gia tốc của hành vi bất thường (lạng lách): (a); Hành vi bình thường 21 Trong mẫu dữ liệu cảm biến gia tốc về “hành vi lạng lách”, người điều khiển phương tiện thực hiện đồng thời chuỗi sáu hành động rẽ trái ký hiệu là “L” và hành động rẽ phải “R” lần lượt là: “L, R, R, L, L, R” như Hình 3-5 (a). Bên cạnh đó, chúng tôi giả định một “hành vi bình thường” gồm 6 hành động di chuyển thẳng. Dữ liệu mẫu cảm biến gia tốc của hành vi này có dạng như Hình 3-5 (b). Trong đó, các ký hiệu “G” mô tả một hành động phương tiện di chuyển thẳng theo hướng chuyển động. Dữ liệu cảm biến gia tốc của các hành vi thu thập được sử dụng với các kỹ thuật nhận dạng (DTW, kỹ thuật học sâu, Kỹ thuật đề xuất) nhằm khảo sát, đánh giá tìm ra phương pháp nhận dạng hành vi giao thông phù hợp. Tập mẫu dữ liệu cảm biến gia tốc về hai loại hành vi bình thường và bất thường thu được sử dụng cho thực nghiệm theo từng kích thước cửa sổ dữ liệu được biểu diễn như ở trong Bảng 3-2 dưới đây: Mẫu DL bất thường Mẫu DL bình thường Tổng số mẫu 4 giây 433 830 1263 5 giây 326 660 986 6 giây 260 546 806 Bảng 3-2. Số lượng các mẫu dữ liệu thực nghiệm Tùy vào các kỹ thuật nhận dạng hành vi khác nhau, thực nghiệm sẽ sử dụng các định dạng dữ liệu cảm biến gia tốc thô hoặc đã biến đổi để phù hợp với đặc điểm và yêu cầu đặt ra. 3.5.3 Kết quả thực nghiệm với DTW 3.5.3.1 Dữ liệu thực nghiệm Kỹ thuật so khớp DTW dựa trên độ đo khoảng cách để đánh giá sự tương tự giữa hai chuỗi dữ liệu. Do vậy, dữ liệu cảm biến gia tốc thô thường được sử dụng để nhận dạng các hành động, hành vi. Tập dữ liệu được chia thành 70% cho thực nghiệm và 30% cho huấn luyện. Kết quả thực nghiệm với tập dữ liệu huấn luyện sử dụng kích thước của sổ lần lượt là 5 giây, 6 giây và 7 giây. Các giá trị ngưỡng được khảo sát và lựa chọn từ việc đánh giá kết quả tương ứng với các giá trị ngưỡng {j| j=1,...,10}DTW  . Kết quả nhận dạng thu được trên tập dữ liệu huấn luyện 22 cao nhất với kích thước cửa sổ 6 giây, giá trị ngưỡng 5DTW  . Và trên tập dữ liệu kiểm tra thu được kết quả tỉ lệ phát hiện chính xác là 59,6%. 3.5.4 Kết quả thực nghiệm với RF và Dl4jMlpClassifier 3.5.4.1 Dữ liệu thực nghiệm Dữ liệu huấn luyện sử dụng xây dựng mô hình phân lớp được thu thập là dữ liệu cảm biến gia tốc với hai nhãn lớp bất thường “lạng lách” và bình thường “đi thẳng” trên tần số 50Hz. Sau khi tiền xử lý, biến đổi thu được dữ liệu đặc trưng dựa trên tập thuộc tính đặc trưng TFH2 được lựa chọn để nhận dạng hành động như trong Chương 2. Thực nghiệm thực hiện với 3 tập dữ liệu thu được từ các kích thước cửa sổ 4 giây, 5 giây và 6 giây bằng thuật toán RF và kỹ thuật học sâu, sử dụng đánh giá với CV10. 3.5.4.2 Kết quả thực nghiệm - Thực nghiệm phân lớp dữ liệu với thuật toán RF và bộ phân lớp Dl4jMlpClassifier với phương pháp kiểm chứng chéo CV10 thu được kết quả phân lớp với độ đo Accuracy như Bảng 3-3 dưới đây: Kích thước cửa sổ RF Dl4jMlpClassifier 4 giây 81,19% 89,33% 5 giây 81,12% 86,57% 6 giây 80,97% 89,13% Bảng 3-3. Kết quả nhận dạng sử dụng CV10 Từ kết quả thu được khi sử dụng phương pháp phân lớp trên tập dữ liệu kiểm tra cho kết quả phân lớp tốt nhất ở kích thước cửa sổ 4 giây. Với tập dữ liệu hành vi có nhãn bình thường/ bất thường. Kỹ thuật học sâu cho kết quả cao hơn so với RF là 8,14% . 3.5.5 Kết quả thực nghiệm với giải pháp đề xuất 3.5.5.1 Dữ liệu thực nghiệm Phương pháp nhận dạng hành vi bất thường đề xuất với hướng tiếp cận đánh giá hành vi bất thường dựa trên hệ thống nhận dạng hành động cơ bản được trình bày ở Chương 2. Tập dữ liệu cảm biến gia tốc thu được 23 chia thành hai phần với 70% là dữ liệu huấn luyện, phần còn lại sử dụng làm dữ liệu để kiểm tra. 3.5.5.2 Kết quả thực nghiệm Với kết quả thu được khi thực nghiệm trên tập dữ liệu huấn luyện cho bộ tham số kích thước cửa sổ W = 6 giây, W’ = 2 giây và ngưỡng giá trị {0, 5; 0, 6 ; 0, 7}  là phù hợp cho nhận dạng hành vi. Kết quả thực nghiệm trên tập kiểm tra với các tham số này cho kết quả thu được tỉ lệ nhận dạng hành vi bất thường như trong Bảng 3-4 dưới đây: S(W, ε) HV bất thường HV bình thường Trung bình S(6, 5) 90,86% 90,00% 90.43% S(6, 6) 80,00% 90,81% 85.41% S(6, 7) 66,28% 95,90% 81.09% Bảng 3-4. Kết quả phát hiện hành vi của giải pháp đề xuất trên tập dữ liệu kiểm tra Từ kết quả trong Bảng 3-4 ta thấy, với kích thước 6 giây và giá trị ngưỡng 0,5  cho kết quả là 90,43%; kết quả này cũng cao hơn phương pháp sử dụng DTW và phương pháp phân lớp sử dụng Dl4jMlpClassifier được trình bày trong Bảng 3-5 dưới đây: Phương pháp DTW Dl4jMlpClassifier RF Phương pháp đề xuất Tỉ lệ phát hiện 59,6% 89,33% 81.19% 90,43% Bảng 3-5. Kết quả phát hiện hành vi của các phương pháp khác nhau Giải pháp đề xuất nhận dạng hành vi bất thường dựa vào đánh giá một số hành động thay đổi bất thường trong khoảng thời gian ngắn bởi hệ thống nhận dạng hành động sẽ ít lệ thuộc vào việc xác định mẫu hành vi bất thường khi nhận dạng nên cho kết quả cao hơn. 3.6 Kết luận Trong chương này, luận án tập trung nghiên cứu, khảo sát các kỹ thuật, phương pháp xác định tính bình thường và bất thường của hành vi giao thông. Từ đó đề xuất giải pháp nhận dạng hành vi giao thông bất thường dựa trên hệ thống nhận dạng. Thực nghiệm phát hiện hành vi bất thường với giải phát đề xuất cho thấy kết quả thu được cao hơn phương pháp sử dụng Dl4jMlpClassifier là 1.1% và so với DTW là 30,83%. Phương pháp này có thể thực hiện nhận dạng cho một số hành vi bất thường khác. 24 KẾT LUẬN Luận án đã tiến hành tìm hiểu, thu thập, khảo sát tính chất của dữ liệu cảm biến, các kỹ thuật phân tích dữ liệu áp dụng cho loại dữ liệu đặc thù này. Qua đó, xây dựng hệ thống nhận dạng và đề xuất giải pháp nhận dạng hành vi dựa trên hệ thống nhận dạng này. Luận án đã thu được một số kết quả như sau: Xây dựng được tập thuộc tính đặc trưng phù hợp gồm 59 thuộc tính trên các miền thời gian, tần số cũng như thuộc tính Hjorth. Đề xuất giải pháp nhận dạng hành động giao thông cơ bản. Đề xuất giải pháp nhận dạng hành vi bất thường dựa trên các hành động cơ bản đã được xây dựng ở chương 2. Bên cạnh một số kết quả đã thu được, vẫn còn một số nội dung mà Luận án chưa thực hiện được, bao gồm: Xây dựng hệ thống hiển thị và và giám sát giao thông. Từ đó, có thể nghiên cứu phân tích các tình huống giao thông khác nhau. Đối với hành vi bất thường, Luận án mới chỉ dừng ở việc xây dựng mô hình nhận dạng hành vi bất thường, thực hiện khảo sát với loại hành vi lạng lách của phương tiện xe máy mà chưa có điều kiện thu thập, phân tích nhiều dạng hành vi bất thường khác nhau, đối với các loại phương tiện khác nhau trong hệ thống giao thông. Số lượng các mẫu hành vi cũng chưa được thu thập đa dạng, đủ lớn từ nhiều đối tượng thực nghiệm, phủ hết các cảnh huống, điều kiện và trên các loại phương tiện khác nhau. Trong thời gian tới, chúng tôi sẽ tiếp tục hoàn thiện nghiên cứu của mình theo một số cách tiếp cận khác nhau như: Áp dụng các phương pháp lọc, đánh giá tập thuộc tính đặc trưng với mong muốn nâng cao hiệu quả của mô hình phát hiện, nhận dạng, phát hiện hành động và hành vi bất thường. Tiến hành thực nghiệm, đánh giá trên các loại phương tiện khác như ô tô, xe buýt, xe đạp cũng như một số phương tiện phổ thông khác ở đô thị của Việt nam. Xây dựng ứng dụng với dữ liệu theo thời gian thực. Mở rộng nghiên cứu xây dựng hệ thống mô phỏng, giám sát giao thông trực tuyến. Đây cũng là cơ sở để xây dựng các giải pháp quản trị giao thông thông minh cũng như hỗ trợ người dân đô thị khi tham gia giao thông. 25 DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN [CT1]. Lu DN., Nguyen TT., Ngo TTT., Nguyen TH., Nguyen HN. (2016) Mobile Online Activity Recognition System Based on Smartphone Sensors. In: Advances in Information and Communication Technology. ICTA 2016. Advances in Intelligent Systems and Computing, vol 538. Springer, Cham. (SCOPUS) [CT2]. Lu DN., Ngo TTT., Nguyen DN., Nguyen TH., Nguyen HN. (2017) A Novel Mobile Online Vehicle Status Awareness Method Using Smartphone Sensors. In: Information Science and Applications 2017. ICISA 2017. Lecture Notes in Electrical Engineering, vol 424. Springer, Singapore. (SCOPUS) [CT3]. Lu DN., Tran TB., Nguyen DN., Nguyen TH., Nguyen HN. (2018) Abnormal Behavior Detection Based on Smartphone Sensors. In: Context-Aware Systems and Applications, and Nature of Computation and Communication. ICCASA 2017, ICTCC 2017. Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering, vol 217. Springer, Cham.(SCOPUS). [CT4].Lu, D.-N.; Nguyen, D.-N.; Nguyen, T.-H.; Nguyen, H.-N. Vehicle Mode and Driving Activity Detection Based on Analyzing Sensor Data of Smartphones. Sensors 2018, 18, 1036. (SCIE).

Các file đính kèm theo tài liệu này:

tom_tat_luan_an_nhan_dang_hanh_vi_cua_nguoi_tham_gia_giao_th.pdf