Đề tài Ứng dụng nguyên tắc sáng tạo trong sự phát triển hệ thống hỏi - Đáp

Một nhu cầu thực tế đặt ra, người dùng muốn rằng khi họ đưa câu hỏi của họ bằng ngôn ngữ tự nhiên thì một hệ thống nào đó có thể trả ra ngay những thông tin họ cần, câu trả lời ngắn gọn, cô đọng cho câu hỏi của họ mà không cần các tập tài liệu. Những hệ thống như vậy gọi là hệ thống hỏi đáp QA (Question Answering). QA là một loại của IR (Information Retrieval). QA quan tâm yêu cầu các kỹ thuật xử lý ngôn ngữ tự nhiên phức tạp hơn các loại khác của IR như tìm kiếm tài liệu (document retrieval). Hệ thống QA chấp nhận các câu hỏi dạng ngôn ngữ tự nhiên, tìm kiếm các câu trả lời từ một tập các tài liệu rút trích và đưa ra những câu trả lời ngắn gọn, súc tích. Các hệ thống QA được phân làm hai loại chính: hệ thống QA miền mở (open-domain) và hệ thống QA miền đóng (closed-domain).

pdf26 trang | Chia sẻ: lvcdongnoi | Lượt xem: 2170 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Đề tài Ứng dụng nguyên tắc sáng tạo trong sự phát triển hệ thống hỏi - Đáp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
.............................................................................. 5 1.5. Nguyên tắc kết hợp: .................................................................................................................... 5 1.6. Nguyên tắc vạn năng: .................................................................................................................. 6 1.7. Nguyên tắc “chứa trong”: ........................................................................................................... 6 1.8. Nguyên tắc phản trọng lượng: ................................................................................................... 7 1.9. Nguyên tắc gây ứng suất sơ bộ: .................................................................................................. 7 1.10. Nguyên tắc thực hiện sơ bộ: ................................................................................................... 8 1.11. Nguyên tắc dự phòng: ............................................................................................................. 8 1.12. Nguyên tắc đẳng thể:............................................................................................................... 8 1.13. Nguyên tắc đảo ngược: ........................................................................................................... 9 1.14. Nguyên lý cầu hóa: .................................................................................................................. 9 1.15. Nguyên lý năng động: ........................................................................................................... 10 1.16. Nguyên lý tác động bộ phần và dư thừa: ............................................................................ 10 1.17. Nguyên tắc bổ sung chiều khác nhau: ................................................................................. 10 1.18. Sự dao động cơ học: .............................................................................................................. 11 1.19. Nguyên tắc tác động theo chu kỳ: ........................................................................................ 11 1.20. Nguyên tắc tác động liên tục hữu hiệu: ............................................................................... 12 1.21. Nguyên tắc vượt nhanh: ....................................................................................................... 12 1.22. Nguyên tắc chuyển bại thành thắng: ................................................................................... 12 1.23. Nguyên tắc quan hệ phản hồi: .............................................................................................. 13 1.24. Nguyên tắc sử dụng trung gian: ........................................................................................... 13 1.25. Nguyên tắc tự phục vụ: ......................................................................................................... 14 1.26. Nguyên tắc sao chép: ............................................................................................................. 14 1.27. Nguyên tắc rẻ thay cho đắt: .................................................................................................. 15 1.28. Nguyên tắc thay thế sơ đồ cơ học:........................................................................................ 15 1.29. Nguyên tắc sử dụng các kết cấu thủy và khí: ...................................................................... 16 Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 3 1.30. Sử dụng vỏ mềm dẻo và màng mỏng: .................................................................................. 16 1.31. Sử dụng vật liệu nhiều lỗ: ..................................................................................................... 16 1.32. Nguyên tắc đổi màu: ............................................................................................................. 16 1.33. Nguyên tắc đồng nhất: .......................................................................................................... 17 1.34. Nguyên tắc loại bỏ và tái sinh từng phần: ........................................................................... 17 1.35. Đổi các thông số hóa lý của đối tượng: ................................................................................ 18 1.36. Sử dụng chuyển pha: ............................................................................................................. 18 1.37. Sử dụng nở nhiệt: .................................................................................................................. 18 1.38. Sử dụng các chất oxy hóa: .................................................................................................... 18 1.39. Sử dụng môi trường trơ: ....................................................................................................... 19 1.40. Sử dụng vật liệu tổng hợp:.................................................................................................... 19 2. Ứng dụng nguyên tắc sáng tạo trong phát triển hệ thống hỏi đáp (QA: Question Answering): 19 2.1. Sơ lược quá trình phát triển hệ thống hỏi đáp (QA): ............................................................ 19 2.2. Ứng dụng nguyên tắc sáng tạo cho sự phát triển hệ thống QA trong tương lai: ................. 24 2.2.1. Nguyên tắc chia nhỏ: ......................................................................................................... 24 2.2.2. Nguyên tắc kết hợp: .......................................................................................................... 24 2.2.3. Nguyên tắc vạn năng: ........................................................................................................ 25 2.2.4. Nguyên tắc chứa trong: ..................................................................................................... 25 2.2.5. Nguyên tắc trung gian: ..................................................................................................... 25 2.2.6. Nguyên tắc vượt nhanh: ................................................................................................... 26 2.2.7. Nguyên tắc tự phục vụ: ..................................................................................................... 26 2.2.8. Nguyên tắc nhiều lỗ: .......................................................................................................... 26 3. Tài liệu tham khảo: ........................................................................................................................... 26 Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 4 1. 40 nguyên tắc sáng tạo và các ví dụ trong tin học: 1.1. Nguyên tắc chia nhỏ: Chia đối tượng thành các thành phần độc lập. Làm cho đối tượng thành các thành phần thao ráp. Tăng mức độ phân nhỏ đối tượng. Ví dụ: Phương pháp đệ qui chia để trị trong tin học. Chẳng hạn tìm kiếm phần tử bằng Thuật toán tìm kiếm nhị phân trong một mảng có thứ tự. Đầu tiên ta xác định phần tử trung bình và so sánh với phần tử trung bình đó, nếu nó không phải khóa cần tìm thì tìm nửa trái và nửa phải của phần tử đó. Việc thực hiện tìm kiếm trên nửa trái và nửa phải của dãy giống như dãy ban đầu (nhưng giảm bớt không gian tìm kiếm). Công việc đó thực hiện cho đến khi tìm thấy phần tử đó hoặc không thể chia nhỏ ra nửa. Mô hình phát triển phần mềm MVC (Model-View-Controller), chia chương trình thành các ba phần chính là Model, View và Controller, mỗi phần đảm nhiệm một nhiệm vụ riêng giúp cho việc phát triển và kiểm tra ứng dụng có thể tiến hành hiệu quả. Do sự kếp hợp “lỏng” giữa các thành phần trong mô hình MVC nên nó làm tăng khả năng phát triển song song của ứng dụng. Trong lập trình, khi viết chương trình cồng kềnh phức tạp, người ta thương chia nhỏ chương trình bằng cách viết các hàm và thủ tục. 1.2. Nguyên tắc “tách khỏi”: Tách các phần gây phiền phức ra khỏi đối tượng hoặc ngược lại. Tránh lấy phần cần thiết. Ví dụ: Trong lĩnh vực xử lý ngôn ngữ tự nhiên Tiếng Việt, ta thường có giai đoạn là khử nhập nhằng trong văn bản đầu vào, chẳng hạn nhập nhằng ranh giới từ, nhập nhằng từ đa nghĩa, nhập nhằng từ đồng âm, ... Để tránh tiếng ốn ảnh hướng đến người khác, người ta dùng có thể tách âm thành bằng cách dùng headphone. Gần đây một nhà cung cấp phụ tùng ô tô Hàn Quốc Mando Corp đã sản xuất chiếc xe đạp mang tên Mondo Footloose đầu tiên trên thế giới không dùng xích. Hãng này cho rằng xích là bộ phần phiền hà trên xe đạp nên thay vì dùng xích để quay bánh xe, bàn đạp của xe chuyển năng lượng của người đạp trực tiếp thành điện thông qua một máy phát điện, Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 5 được tích lũy trong pin gắn trong khung xe, rồi sẽ được mô tơ điện chuyển thành động năng giúp xe quay bánh. Một số trình duyệt web như IE9, FireFox13, hay Chrome 13 đã gỡ bỏ thanh menu chiếm không gian hiển thị trên trình duyệt và chỉ còn giữ lại thành địa chỉ và khi người dùng cần vẫn có thể cho hiển thị thanh menu. 1.3. Nguyên tắc phẩm chất cục bộ: Chuyển đối tượng (hay môi trường bên ngoài, tác động bên ngoài) có cấu trúc đồng nhất thành không đồng nhất. Các phần khác nhau của đối tượng phải có các chất năng khác nhau. Ví dụ: Một số trang web tin tức, nghe nhạc, bán hàng, ... thường trang bị layout giao diện của trang web mỗi mùa mỗi khác, mỗi dịp lễ lớn thì có layout khác. Một sự sửa đổi nhỏ đó trên web, sẽ tạo cho người truy cập cảm giác hứng thu, vui thích hơn trong những dịp lễ yêu thích của họ, chẳng hạn dịp lễ tết thì layout được thay đổi có hình hoa mai, đào, bánh chưng, bánh tét, ... Cơ sở dữ liệu phân tán giúp giảm chi phí truyền thông vì chương trình ứng dụng truy cấp vào server đặt tại địa phương và khai thay cơ sở dữ liệu tại chổ thay vì phải kết nối đến một server chung (có thể ở một vị trì địa lý rất xa) như cơ sở dữ liệu tập trung. 1.4. Nguyên tắc phản đối xứng: Chuyển đối tượng có hình dạng, tính chất đối xứng thành phản đối xứng. Ví dụ: Trong hệ điều hành Window 7, có chức năng thực hiện “slide show” hình ảnh trên destop, ta được qui định sau thời gian bao lâu thì chuyển sang ảnh khác. Để tiết kiệm pin thì chức năng “slide show” cung cấp một lựa chọn checkbox. Nếu ta check vào đó thì khi đang sử dụng pin thì chức năng “slide show” sẽ không thực hiện mà chỉ hiển thị ảnh hiện tại, còn nếu đang dùng điện bình thường thì chức năng này sẽ hoạt động bình thường. 1.5. Nguyên tắc kết hợp: Kết hợp các đối tượng đồng nhất hoặc các đối tượng dùng cho các hoạt động kế cận. Kết hợp về mặt thời gian các hoạt động đồng nhất và kế cận. Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 6 Ví dụ: Trong thế hệ web 2.0, người ta thường phát triển các trang web mashup để tổng hợp nhiều thông tin từ nhiều nguồn khác nhau. Chẳng hạn trang web so sánh giá cả của các sản phẩm điện tử của các cửa hàng lớn hay các trang tin tực này này thường có tích hợp thêm các thông tin xổ số, chứng khoán, giá vàng, thời tiết, ... Để phục vụ cho thuyết trình, báo cáo,... thông qua máy chiếu. Người ta thường kết nối máy tính với máy chiếu để trình chiếu các slides hoặc phim, hình ảnh minh họa. Trong tin học, thuật toán tìm kiếm nhị phân có độ phức tạp thấp hơn so với phương pháp tìm kiếm tuyến tính. Nhưng một vấn đề của thuật toán tìm kiếm nhị phân này chỉ áp dụng cho dãy có thứ tự. Do đó để thuật toán tìm kiếm nhị phân phát huy hiệu quả thì ta nên kết hợp với một thuật toán sắp xếp hiệu quả. Các ứng dụng thương mại điển tử, các trang web mua bán hàng trực tuyến thường kết hợp với các ngân hàng để thực hiện việc chứng thực và thanh toán trực tuyến. 1.6. Nguyên tắc vạn năng: Đối tượng có thể thực hiện nhiều chức năng khác nhau mà không cần sự tham gia của các đối tượng khác. Ví dụ: Các loại điện thoại di động ngày nay, ngoài các chức năng cơ bản gọi và nhắn tín thì còn tích hợp các chức năng nghe nhạc, xem phim, xem ảnh, đọc tin tức, chụp ảnh, quay phim... Chức năng xem ảnh trên facebook, ngoài việc chính là hiển thị hình ảnh chia sẻ cho người bạn bè thì nó còn tự động xác định khuôn mặt ngượi trong ảnh, nhận dạng mặt người trong ảnh, tag bạn bè vào ảnh, các chức năng quay ảnh và cho phép bạn bè like và comment vào ảnh. Hệ điều hành có chức năng đa nhiệm có thể xử lý nhiều tiến trình cùng lúc. Trong các ngôn ngữ lập trình cấp cao như C#, Java, ... cho phép định nghĩa hàm chồng, tức là các hàm cùng tên nhưng việc thực thi bên trong là khác nhau. 1.7. Nguyên tắc “chứa trong”: Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 7 Tổ chức một đối tượng này bên trong đối tượng kia, hoặc có thể vận động bên trong đối tượng khác. Một đối tượng đặt bên trong một đối tượng khác, và bản thân nó lại chứa đối tượng thứ ba. Một đối tượng chuyển động xuyên suốt trong đối tượng khác. Ví dụ: Môi trường lập trình Visual Studio.Net là công cụ ưa dùng của các lập trình viên .NET. Bên trong phần mêm này cũng chứa các tool như Connection Database để ta có thể kết nối đến database trực tiếp và được phép thao tác lên database ngay tại môi trường Visual Studio.Net hay công cụ để ta thanh tra mã nguồn, ... Các USB 3G là thiết bị kết nối Internet không dây qua sóng di động sử dụng mạng 3G. Ngoài ra, nó còn có thể chứa thẻ nhớ nên cũng có thể thực hiện một chức năng như usb thông thường. Hệ thống tập tin trên máy tính, thì một thư một có thể chứa các tập tin hoặc các thư mục khác. Hệ điều hành là nới chứa rất nhiều các ứng dụng khác trên máy tính. 1.8. Nguyên tắc phản trọng lượng: Nếu một đối tượng có nhược điểm, thì ta cần liên kết đối tượng với một đối tượng khác có ưu điểm nhằm bù trừ nhược điểm đó. Ví dụ: Theo nguyên lý các ngôn ngữ lập trình thì thường có hai phương thức thực thi chính: biên dịch và thông dịch. Đặc điểm của biên dịch là dịch chậm nhưng thực thi rất nhanh vì chỉ cần dịch một lần, các lần sau chỉ cần dùng tập tin thực thi mà không cần dịch lại. Còn đặc điểm của trình thông dịch thì có thể thực thi chương trình dễ dàng hơn nhưng thực thi của nó chậm hơn và thường yêu cầu nhiều không gian. Do đó, một số ngôn ngữ cấp cao như Java, Perl,... đã kết hợp trình biên dịch và thông dịch. Chương trình sẽ được dịch thành ngôn ngữ trung gian (Intermediate language) để cho phép thông dịch được dễ dàng. 1.9. Nguyên tắc gây ứng suất sơ bộ: Nếu điều kiện của bài toán cần thực hiện tác động nào đó, yêu cầu thực hiện phản tác động trước. Ví dụ: Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 8 Một máy tính mới mua về, muốn sử dụng các chức năng máy tính thì công việc đầu tiên là ta phải cài hệ điều hành cho máy tính đó. Trong lập trình C, ta muốn sử dụng các con trỏ thì ta phải cấp phát vùng nhớ cho con trỏ đó. 1.10. Nguyên tắc thực hiện sơ bộ: Thực hiện sự thay đổi cần có (hoàn toàn hoặc một phần) đối với một đối tượng. Cấn sắp xếp đối tượng trước, sao cho chúng có thể hoạt động từ vị trí thuận lợi nhất, không mất thời gian di chuyển. Ví dụ: Trong qui trình phát triển phần mềm thì sau khi lấy yêu cầu của người dùng thì ta thường có một thao tác là xây dựng một prototype mô phỏng các chức năng và giao diện hệ thống để người dùng xem qua. Nếu khách hàng chấp nhận thì ta tiến thành thiết kế và lập trình theo prototype đã làm sẵn, tránh trường hợp làm xong dự án mà không đúng yêu cầu khách hàng. 1.11. Nguyên tắc dự phòng: Bù đắp độ tin cậy không lớn của đối tượng bằng cách chuẩn bị các phương tiện báo động, ứng cứu, an toàn. Ví dụ: Trong các ứng dụng giao dịch ngân hàng trực tuyến, mỗi người dùng được cung cấp một tài khoản để truy cập. Nếu người dùng nhập tài khoản vào hơn 5 lần không đúng thì tài khoản sẽ bị khóa để đảm bảo an toàn cho tài khoàn người dùng, dự phòng trường hợp tài khoản của người dùng đang bị hacker tấn công (có thể bị hacker cố tính giả lập để login vào, ...). Người dùng có thể phục hổi lại tài khoản mình bằng cách đến gặp nhân viên ngân hàng đó để yêu cầu thiết lập lại. UPS: dùng dự phòng khi cúp điện đột ngột. Khi điện bị ngắt thì nó vẫn còn giữ điện trong thời gian cần thiết để người dùng có thể lưu trữ lại các thông tin cần thiết. Trong các hệ quản trị cơ sở dữ liệu, mỗi thao tác của người dùng truy cập vào cơ sở dữ liệu điều được ghi vào tập tin nhật ký (log). Tập tin nhật ký này có tác dụng trong việc phục hồi tính nhất quán của hệ thống nếu có sự cố bất ngờ xảy ra khi đang truy cập đến cơ sở dữ liệu. 1.12. Nguyên tắc đẳng thể: Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 9 Thay đổi điều kiện làm việc để không phải nâng lên hạ xuống một đối tượng. Ví dụ: Trong thiết kế web, người ta thường ưu tiên scroll trang web theo chiều dọc hơn là theo chiều ngang. Chẳng hạn, một bài tin tức quá dài, mà người đọc thích scroll theo chiều dọc hơn là chiều ngang. Thường scroll theo chiều ngang sẽ gây cảm giác khó chịu, thiếu tự nhiên cho người đọc. 1.13. Nguyên tắc đảo ngược: Thay vì hành động như bình thường thì ta hành động ngược lại. Làm phần chuyển động của đối tượng (hay môi trường bên ngoài) thành đứng yên và ngược lại, phần đứng yên thành chuyển động. Lật ngược đối tượng. Ví dụ: Trong mạng noron, ta có thuật toán lan truyền ngược với luật học tổng quát delta. Ý tưởng thuật toán này là đầu tiên tính giá trị sai số cho các noron ở lớp xuất, kết quả này được dùng để tính sai số cho các noron ở lớp ẩn cao nhất và lớp ẩn kế tiếp thì tính theo kết quả của lớp ẩn cao hơn nó. Cứ lan truyền ngược cho như thế cho đến khi đến lớp xuất. Phương pháp chứng minh phản chứng được vận dụng rất nhiều trong toán học và tin học. Thay vì chứng minh kết luận đúng thì ta giả thiết kết luận là sai và lý luận dựa trên giả thiết các tính chất và định lý liên quan ta đi đến một mâu thuẫn nào đó rồi kết luận giả thiết của ta là sai, tức là kết luận bài toán là đúng. 1.14. Nguyên lý cầu hóa: Chuyển các phần thẳng có đối tượng thành cong, mặt phẳng thành mặt cầu, kết cấu hình hộp thành kết cấu hình cầu. Chuyển cách tiếp cận thông thường (thẳng) sang cách tiếp cận khác (vòng). Ví dụ: Khi thiết kế trang web với css2 thì việc tạo các điều khiển có phần cong ở các góc là rất nhập nhằng. Tuy nhiên với css3 thì việc đó hoàn toàn đơn giản, nó cho phép tạo các điều khiển công ở các góc của điều khiển. Ứng dụng việc xây dựng các phần mềm và xử lý các tín hiệu được thu nhận từ vệ tinh, sử dụng các mặt cầu để xác định các điểm giao nhau thay vì sử dụng các đường tròn. Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 10 1.15. Nguyên lý năng động: Chuyển một đối tượng từ trạng thái không thay đổi trong suốt quá trình hoạt động sang thay đổi để phù hợp với từng giai đoạn khác nhau của quá trình đó. Ví dụ: Chuột không dây giúp cho việc sử dụng chuột máy tính uyển chuyển dễ dàng hơn, đặc biệt là khi sử dụng máy tính thuyết trình, báo cáo,... Máy tính xách tay nhỏ gọn, giúp người dùng có thể di chuyển dễ dàng. 1.16. Nguyên lý tác động bộ phần và dư thừa: Nếu như khó nhận được 100% hiệu quả cần thiết nên nhận ít hơn hay nhiều hơn “một chút”. Lúc đó bài toán có thể trở nên đơn giản hơn. Ví dụ: Trong lập trình có bài toán tính diện tích tam giác bất kỳ thì người ta đưa phương pháp, lập cái lưới phủ đa giác đó. Ta tiến hạnh duyệt tình hình vuông trong lướng nếu hình vuông nào thuộc miền trong đa giá thị cộng vảo tổng, tổng cuối cùng là diện tích đa giác. Việc xác định hịnh vuông nằm trong đa giác, sẽ có những hình vuông nửa nằm trong nửa nằm ngoài đa giác thì quyết định hình vuông đó nằm trong hay ngoài đa giác thì tùy vào qui ước kiểm tra của từng lập trịnh viên. Nhưng chung qui thì diện tích tổng cuối cùng tích được chắc chắn sẽ có thể cao hơn hoặc thấp hơn diện tích thực đa giác “một chút”. Các thuật toán heutistic cho ta kết quả gần đúng, chấp nhận được nhưng không thể cho ta kết quả chính xác 100%. Chẳng hạn các bài toán trong xử lý ảnh, nhận dạng giọng nói, nhận dạng mặt người, ... 1.17. Nguyên tắc bổ sung chiều khác nhau: Thay vì nhìn đối tượng theo cách thông thường thì ta nhìn đối tượng ở những góc độ khác nhau có trong đối tượng và môi trường. Ví dụ: Khi phát triển phần mềm ta cần đứng ở vị trí của nhiều người dùng khác nhau như người quản lý, người dùng thông thường, người quản trị hệ thống hay lập trình viên để ta có những thiết kế hợp lý và chỉ hiển thị những chức năng mà người dùng đó được phép truy cập. Khi thiết kế giao diện của trang web, sử dụng các css hay javascript, ta cần chú ý trên các trình duyệt khác nhau có thể sẽ không chấp nhận một số css và javascript nào đó. Do đó, ta cần xém xét nhiều trình duyệt khi Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 11 thiết kế web, ít nhất là các trình duyệt thông dụng như FireFox, Chrome, IE, Safari, Opera, ... 1.18. Sự dao động cơ học: Làm đối tượng giao động. Nếu đã có giao động, tăng tấn số giao động (đến tấn số siêu âm) Sử dụng tần số cộng hưởng. Thay vì dùng các bộ rung cơ học, dùng các bộ rung áp điện. Sử dụng siêu âm kết hợp với trường điện từ. Dao động theo nghĩa đối tượng có thể dễ dàng thay đổi xung quanh các trạng thái cân bằng của mình. Những đối tượng có khả năng đó thường có sức sống cao, dễ thích nghi với môi trường. Ví dụ: Các thiết bị công nghệ cao như Iphone, Samsung Galaxy, ... khi ta quay nó theo chiều ngang hay chiều dọc thì màn hình ứng dụng cũng quay theo. Trong lập trình C/C++, khi ta dùng mãng ta thường dùng con trỏ và cấp phát động vùng nhớ cho nó mỗi khi sử dụng hơn là khai báo mãng tĩnh vì có khi khai báo mảng tính có thể thừa nếu ta không dùng hết chiều dài đã khai báo gây lãng phí bộ nhớ hoặc thiếu nếu ta dùng nhiều hơn khai báo ban đầu gây hiện tượng tràng bộ nhớ. Do đó, cách dùng mãng cấp phát động là cách làm linh hoạt và hiệu quả hơn. 1.19. Nguyên tắc tác động theo chu kỳ: Chuyển tác động liên tục thành tác động theo chu kỳ. Nếu đã có tác động theo chu kỳ, hãy thay đổi chu kỳ. Sử dụng các khoảng thời gian giữa các chu kỳ để thực hiện tác động khác. Ví dụ: Các trang web thường thiết lập chu kỳ thời gian (timeout) sau khi người dùng đăng nhập mà không có thao tác gì trên trang web, thì hệ thống sẽ tự động đăng xuất. Thời gian timeout hoàn toàn có thể thiết lập theo ý muốn. Ajax là một kỹ thuật phát triển web được sử dụng khá phổ biến, thay vì nạp lại toàn bộ trang web thì ajax cho phép chỉ nạp lại phần cần thiết trên trên web, và trong thời gian chờ phản ứng từ server khi có yêu cầu bất đồng bộ thì hệ thống hoàn toàn có thể làm các công việc khác cho đến khi nhận được phản ứng từ server thì hệ thống quay lại xử lý. Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 12 1.20. Nguyên tắc tác động liên tục hữu hiệu: Nguyên tắc này đòi hỏi các tác động có ích phải xãy ra liên tục và tính có ích của tác động phải càng ngày càng tăng. Ví dụ: Khi ta xem phim online thì thường giựt hình vì chờ nạp dữ liệu xuống từ server, tạo cảm giác xem phim không thoải mái. Ta thường giải quyết bằng cách cho phim tạm dừng để chờ nó nạp dữ liệu. Sau khi ta bấm nút dừng thì dữ liệu vẫn được nạp xuống liên tục, sau 1 hoăc 2 phút ta bấm cho phim hoạt động lại thì hiện tượng đó ít diễn ra, vì đã có dữ liệu dữ trữ được nạp trong lúc dừng và trong lúc ta đang xem những phần này thì những phần còn lại của phim vẫn tiếp tục được nạp mà không ảnh hướng đến việc xem phim hiện tại. 1.21. Nguyên tắc vượt nhanh: Vượt qua các giai đoạn có hại hoặc nguy hiểm với vận tốc nhanh. Vượt nhanh để có được hiệu ứng cần thiết. Ví dụ: Trong lập trình có các cấu trúc rẻ nhánh (if... else if...else) giúp cho chương trình hoạt động hiệu quả, bỏ qua các trường hợp không thoả. Hay các lệnh break dùng ngắn vòng lặp và lệnh switch nếu có điều kiện không thỏa,... Khi ta chơi một số game, khi tham giá bắt đầu trò chơi thường có phần demo cách chơi game đó. Nêu ta thấy không cần thiết thì bấm nút bỏ qua để “vượt nhanh” qua phần xem demo. Trong lập trình hướng đối tượng có một khái niệm là trựu tượng hóa, tức là ta bỏ qua phần chi tiết thực hiện của một chức năng mà ta chỉ cần biết nó làm gì và gọi nó để thực hiện chức năng đó mà ta không cần quan tâm việc cài đặt nhập nhằng bên dưới của nó. 1.22. Nguyên tắc chuyển bại thành thắng: Sử dụng các tác nhân có hại để thu được hiệu ứng có lợi. Khắc phục tác nhân có hại bằng cách kết hợp với tác nhân có hại khác. Tăng cường tác nhân có hại đến mức không còn có hại nữa. Ví dụ: Trong phát triển phần mềm theo qui trình XP, có một tính chất là lặp trình cặp đối. Cách thức này tuy tốn nhân lực nhưng nó sẽ hiệu quả hơn Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 13 so với 2 người phát triển độc lập. Việc quay vòng các cặp thường xuyên như vậy sẽ phổ biến được kinh nghiệm và kiến thức cho toàn nhóm. Mã nguồn sẽ được xem lại liên tục. Trong lập trình khi gặp lỗi (bug) là một điều khó chịu đối với lập trình viên. Nhưng nhớ có các lỗi đó mà lập trình viên sẽ tăng kinh nghiệm lập trình, hiểu rõ hơn hệ thống mình phát triển và hạn chế được những lỗi đó xảy ra trong các lần sau. 1.23. Nguyên tắc quan hệ phản hồi: Phản hồi hiểu theo nghĩa là đối tượng A tác động lên đối tượng B và sau đó đối tượng B cũng tác động ngược lại đối tượng A. Nếu không có quan hệ phản hối thì thiết lập quan hệ phản hồi, còn nếu có thì thay đổi và hoàn thiện nó. Ví dụ: Trong các ứng dụng web, khi nhận được request từ client server sẽ tiếp nhận và thực hiện các xử lý cần thiết rồi phản ứng lại kết quả hiển thị cho người dùng. Trong các ứng dụng tin học, khi người dùng thực hiện một chức năng nào liên quan đến xóa, hay cập nhật dữ liệu thì thường có hiển thị một dialog box để người dùng xác nhận là có chắc chắn thực hiện chức năng đó không. Trong một số trang web, khi người dùng đăng kí một tài khoản trên trang web thì được trang web đó gửi một link vào mail của người đăng ký và yêu cầu người đăng ký vào mail và click vào link đó để kích hoạt tài khoản. 1.24. Nguyên tắc sử dụng trung gian: Sử dụng đối tượng trung gian chuyển tiếp. Ví dụ: Trong các mẫu thiết kế hướng đối tượng (design pattern), có mẫu tên là adapter. Chẳng hạn, hai lập trình viên dùng 2 nền tảng phát triển ngôn ngữ khác nhau, người dùng C# còn người kia thì dùng VB.Net. Trong khi đó một số chức năng của người thứ hai có thể dùng cho người thứ nhất mà người thứ nhất không đủ điều kiện để hoàn thành nó, để người thứ nhất có thể sử dụng các phương thức mà người thứ hai viết trên nền tảng khác thì người ta đưa ra mẫu adapter. Adapter có nhiệm vụ tích hợp những những phương thức của người thứ hai đề người thứ nhất có Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 14 thể dùng được các phương thức đó trên nền tảng mà mình đang phát triển. Trong quá trình biên dịch mã nguồn, sau khi phân tích tự vựng và xây dựng cây phân tích. Trình biên dịch dùng cây phân tích này biến thành mã trung gian. Từ mã trung gian này sẽ được dịch thành mã máy để máy hiểu được nó. Trong lập trình, thuật toán hoán vị hai phần tử thông dụng thường ta dùng một biết trung gian để thực hiện thuật toán này. void swap(int &a, int &b){ int x = a; a = b; b = x; } x chính là biến trung gian dùng để hoán vị a và b. 1.25. Nguyên tắc tự phục vụ: Đối tượng phải tự phục vụ bằng cách thực hiện các thao tác phụ trợ. Sử dụng phế liệu, chất thải và năng lượng dư thừa. Ví dụ: Các hệ cơ sở dữ liệu quan hệ có khả năng tự phục hồi sau khi có sự cố xảy ra trong hệ thống. Trong một số thể loại game như đá bóng, đánh cờ, ... nếu ta chơi 1 người thì máy vẫn có thể tạo một người chơi tự động để chơi với ta. Đối với người dùng điện thoại bàn, khi nhận cuộc gọi, người dùng nhấc máy lên thì lo xo bên trong mấy đẩy lên nối công tắc, người gọi điện thoại có thể sử dụng ngay. Ngược lại, khi gác máy thì lo xo nén xuống và ngắt mạch. Trong phần mềm MS Outlook có chức năng là hẹn giờ gửi mail, ta cứ soạn mail bình thường và thiết lập thời gian muốn gửi. Khi đến thời gian đã thiết lập thì hệ thống sẽ tự động gửi mail. 1.26. Nguyên tắc sao chép: Thay vì sử dụng những cái không được phép, phức tạp, đắt tiền, không tiện lợi và dễ vỡ, sử dụng bản sao. Thay thế đối tượng hoặc hệ các đối tượng bằng bản sao quang học (ảnh, hình vẻ) với các tỷ lệ cần thiết. Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 15 Nếu không sử dụng bản sao quang học ở vùng biểu kiến (vùng ánh sáng nhìn thấy được bằng mắt thường), chuyển sang sử dụng bản sao hông ngoại hay từ ngoại. Ví dụ: Mạng nơron nhân tạo mô phỏng bộ não của con người trên máy tính. Thuật toán di truyền học là thuật toán mô phỏng lại một quá trình sinh học trong tự nhiên: từ chọn lọc các cá thể trong quần thể rồi lai ghép các các thể và thực hiện đột biến cá thể với hi vọng các thể hệ con cho kết quả tốt hơn. Thao tác copy/paste là thao tác rất quan trọng và hậu như không thể thiếu trong các hoạt động của máy tính. 1.27. Nguyên tắc rẻ thay cho đắt: Thay thế đối tượng đắc tiền bằng các đối tượng rẻ có chất lượng kém hơn. Ví dụ: Khi sử dụng phần mềm nếu không có nhu cầu sử dụng hết tất cả chức năng của phần mềm mà chỉ cần dùng một phần cần thiết hay chỉ để học tập thì ta có thể chọn bản trial để sử dụng hơn là chọn bản lisence. Chẳng hạn SQLEXPRESS 2008, thông thường phục vụ cho việc học tập và lập trình bình thường SQLEXPRESS 2008 đủ đáp ứng yêu cầu người dùng mà không nhất thiết phải dùng bản thương mại hóa của nó. Trong lập trình các bài toán đồ họa máy tính hay xử lý ảnh, người ta thường ưu tiên sử dụng phép toán công hơn là phép toán nhân vì chi phí thực hiện phép toán cộng ít hơn phép toán nhân và thực thi nhanh hơn phép toán nhân. 1.28. Nguyên tắc thay thế sơ đồ cơ học: Thay thế sơ đồ cơ học bằng điện, quang, nhiệt, âm hoặc mùi vị. Sử dụng điện trường, từ trường và điện từ trường trong tương tác với đối tượng. Chuyển các trường đứng yên sang chuyển động, các trường cố định sang thay đổi theo thời gian, các trường đồng nhất sang cấu trúc nhất định. Sử dụng các trường kết hợp với các hạt sắc từ. Ví dụ: Nút bấm điện thoại di động dùng phím được thay thế bằng cảm ứng – chạm tay vào màn hình. Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 16 Bàn tính, máy tính quay tay cơ học chuyển sang máy tính điện, điện tử, quang-điện tử. 1.29. Nguyên tắc sử dụng các kết cấu thủy và khí: Thay cho các phần của đối tượng ở thể rắn, sử dụng các chất khi và chất lỏng: nạp khí, nạp chất lỏng, đệm không khí, thủy tinh, thủy phản lực. Ví dụ: Các hệ thống đóng mở tự động (cửa trên xe buýt chẳng hạn) dùng khí nén hay nói chung là các loại thiết bị dùng khí nén trong kỹ thuật. Việc sử dụng internet truyền thống là dùng dây cáp mạng với router để kết nối internet với nhà cung cấp dịch vụ. Với sự phát triển của công nghệ, người ta phát triển các công nghệ kết nối internet không dây như wireless, USB 3G, ... 1.30. Sử dụng vỏ mềm dẻo và màng mỏng: Sử dụng các vỏ dẻo và màng mỏng thay cho các kết cấu khối. Cách ly đối tượng với môi trường bên ngoài bằng các vỏ dẻo và màng mỏng. Ví dụ: Để bảo vệ điện thoại hay laptop hạn chế bị trầy xướt thì người ta thường dán giấy trong suốt hoặc giấy dán có hoa văn xung quanh và màn hình của điện thoại hay laptop. Ngoài ra nó cũng tăng tính thẩm mỹ của thiết bị. 1.31. Sử dụng vật liệu nhiều lỗ: Làm đối tượng có nhiều lỗ hoặc sử dụng thêm những chi tiết có nhiều lỗ. Nếu đối tượng đã có nhiều lỗ, thì sơ bộ tẩm nó bằng chất nào đó. Ví dụ: Trên máy tính có nhiều cổng (lổ) cắm khác nhau như cổng kết nối USB, công kết nối máy chiếu, cổng kết nối loa, cổng kết nối internet, nối adapter ... Dây cáp điện thoại có vỏ bọc xốp, tạo lớp không khí cách điện lý tưởng. 1.32. Nguyên tắc đổi màu: Thay đổi màu sắc của đối tượng hay môi trường bên ngoài. Thay đổi độ trong suốt của đối tượng hay môi trường bên ngoài. Để có thể quan sát được những đối tượng hoặc những quá trình, sử dụng các chất phụ gia màu, huỳnh quang. Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 17 Nếu các chất phụ gia đã được sử dụng, dùng các nguyên tử đánh dấu. Sử dụng các hình vẽ và ký hiệu thích hợp. Ví dụ: Trong các trình soạn thảo cho lập trình (C/C++, Java, C#, ...), thường thiết lập màu sắc riêng cho các từ khóa, tên hàm, biến, ... Công việc đó giúp cho việc lập trình dễ dàng hơn, hứng thứ hơn, ... Trong các phần mềm thực hiện Unit test thì sau khi thực thi Unit test xong thì nó sẽ hiển thị màu đỏ cho các testcase có lỗi, màu xanh cho các testcase thành công và màu vàng để đưa cảnh báo nào đó. Trong phát triển các ứng dụng, trên thanh menu, bên cạnh các item của menu người ta thường để thêm một hình icon đại diện cho chức năng của item đó. Chẳng hạn, chức năng mã hóa thì có hình chiếc ổ khóa hay chìa khóa bên cạnh hay chức năng thoát thì có hình “x” bên cạnh, ... 1.33. Nguyên tắc đồng nhất: Những đối tượng, tương tác với các đối tượng cho trước, phải được làm từ cùng một vật liệu (hoặc từ vật liệu gần về các tính chất) với vật liệu chế tạo đối tượng cho trước. Ví dụ: Xét lĩnh vực cơ cở dữ liệu, khi thực hiện các phép toán quan hệ (giao, hợp) hai tập hợp thì phải đảm bảo điều kiện hai tập hợp đó tương thích, tức là cùng lực lượng và miền giá trị trên các cột tương ứng là giống nhau. Muốn mở các tập tin nhạc, phim (.mp3, .mp4, .flv, ...) thì phải dùng các chương trình chuyên dụng như Window media, Classic 321, ... Chứ không thể dùng các phần mềm như Notepad, MS Word,... để mở các tập tin như thế. 1.34. Nguyên tắc loại bỏ và tái sinh từng phần: Phần đối tượng đã hoàn thành nhiệm vụ hoặc trở nên không cần thiết phải tự phân hủy hoặc phải biến dạng. Các phần mất mát của đối tượng phải được phục hồi trực tiếp trong quá trình làm việc. Ví dụ: Việc đăng kí học phần lúc trước tại Đại học Khoa học Tự nhiên tp.HCM rất nhập nhằng, sinh viên phải đến phòng đạo tạo điền vào giấy đăng kí và nộp lại. Công việc này gây đến tính trạng chen lấn, chờ đợi, quá tải Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 18 khi số lượng sinh viên đến phòng đăng kí quá đông, hơn nữa còn gây khó khăn cho các nhân viên phòng đào tạo quản lý thông tin đăng kí của sinh viên. Do đó, hệ thống đăng kí học phần trực tuyến của trường ra đời, ban đầu được đưa vào thử nghiệm ở một số khoa, sau đó nó dần thay thế hình thức đăng kí học phần củ. 1.35. Đổi các thông số hóa lý của đối tượng: Thay đổi trạng thái của đối tượng. Thay đổi nồng độ hay độ đậm đặc của đối tượng. Thay đổi độ dẻo. Thay đổi nhiệt độ và thể tích. Ví dụ: Để máy tính có thể lưu trữ nhiều dữ liệu hơn thì ta phải nâng cấp ổ cứng. Để tăng tính linh hoạt và hiệu quả của máy tính xách tay, thì chúng được thiết kế ngày càng mỏng, nhỏ gọn hơn. Các loại usb ngày nay được thế kế theo nhiều chất liệu và hình dạng khác nhau, có cả hình dạng của các đối tượng trong thực tế. Điều đó tạo hứng thú hơn cho người sử dụng. 1.36. Sử dụng chuyển pha: Sử dụng các hiện tượng nảy sinh trong quá trình chuyển pha như: thay đổi thể tích, tỏa hay hấp thụ nhiệt lượng. 1.37. Sử dụng nở nhiệt: Sử dụng sự nở (hay co) nhiệt của các vật liệu. Nếu đã dùng sự nở nhiệt, sử dụng vài vật liệu có các hệ số nở nhiệt khác nhau. 1.38. Sử dụng các chất oxy hóa: Thay đổi không khí thường bằng không khi giàu oxy. Thay đổi không khí giàu oxy bằng chính oxy. Dùng các bức xạ ion hóa tác động lên không khi hay oxy. Thay đổi oxy giàu ozon (hoặc oxy bị ion hóa) bằng chính ozon. Ví dụ: Sử dụng các chất oxy hóa mạnh để chế tạo ra các bộ vi xử lý, các loại RAM, ROM. Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 19 1.39. Sử dụng môi trường trơ: Thay đổi môi trường thông thường bằng môi trường trung hòa. Đưa thêm vào đối tượng các phần, các chất, phụ gia trung hòa. Thực hiện quá trình trong chân không. 1.40. Sử dụng vật liệu tổng hợp: Chuyển từ các vật liệu đồng nhất sang sử dụng những vật liệu hợp thành. Hay nói chung, sử dụng các vật liệu mới. 2. Ứng dụng nguyên tắc sáng tạo trong phát triển hệ thống hỏi đáp (QA: Question Answering): 2.1. Sơ lược quá trình phát triển hệ thống hỏi đáp (QA): Quá trình phát triển hệ thống QA (Question Answering) liên quan đến nhiều lĩnh vực khác nhau như: xử lý ngôn ngữ tự nhiên, các hệ thống tìm kiếm thông tin (IR: Information Retrieval), các hệ thống rút trích thông tin (IE: Information Extraction), khai thác văn bản và tri thức, web ngữ nghĩa, ... Ở đây, trước tiên xin giới thiệu sơ lược về các hệ thống “đàn anh” của hệ thống QA là IR và IE. Hệ thống IR (Information Retrieval) là tìm kiếm tài liệu (thường là văn bản) của loại không câu trúc (thường là văn bản) để thoả mãn nhu cầu thông tin trong một tập dữ liệu lớn. Hệ thống IR (Information Retrieval) cho phép ta xác định các tài liệu thích hợp liên quan phù hợp nhất câu hỏi truy vấn, nhưng không chỉ ra chính xác câu trả lời. Trong IR, các tài liệu thích hợp được tìm ra bằng cách so khớp (matching) các từ khóa của câu truy vấn với index của tập tài liệu. Trong hệ thống IR có hai nhiệm vụ chính là: indexing và searching.  Indexing: Nhiệm vụ của indexing là tạo thể hiện của tài liệu bằng những đặc trưng chính của nó với mục đích tăng tốc việc tìm kiếm nó khi câu truy vấn được thực thi. Hệ thống IR chỉ dựa vào index của tài liệu để xác định tài liệu đó có liên quan đến câu truy vấn của người dùng hay không.  Searching: Mục đích của searching là định vị được những tài liệu thích hợp nhất và sắp xếp chúng theo thứ tự giảm dần sự phù hợp (matching) với câu truy vấn. Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 20 Hình 1. Hoạt động của hệ thống IR Một số hệ thống IR nổi tiếng như: Google, Bing, Yahoo, … Hình 2. Hệ thống IR của Google Hệ thống IE (Information Extraction) là hệ thống rút trích thông tin từ tập tài liệu khớp với một mẫu (template) được định nghĩa trước. Rõ ràng, những thông tin này phải chứa nhiều thực thể và các mổi liên hệ giữa các thực thể dạng như một người (who) làm cái gì (what) cho ai (whom), làm khi nào (when), làm như thế nào (how), ở đâu (where). Ngày nay Internet trở thành kho thông tin khổng lồ không thể thiếu trong nhiều hoạt động kinh tế, giáo dục, nghiên cứu, .... Nhu cầu tìm kiếm thông tin trên Internet của con người ngày càng tăng và diễn ra ngày càng thường xuyên trong các hoạt động thực tiễn và yêu cầu tìm kiếm của người dùng cũng ngày Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 21 càng cao với việc tìm kiếm thông tin trên Internet, họ muốn tìm kiếm thông tin trong kho thông tin đồ xộ của Internet thật nhanh và chính xác nhất có thể. Các hệ thống IR (Information Retrieval) hay máy tìm kiếm (search engine) ra đời để đáp ứng nhu cầu tìm kiếm thông tin của người dùng trong một kho dữ liệu khổng lổ trên Internet. Tuy nhiên, với các hệ thống IR hiện tại khi nhận vào một truy vấn của người dùng thì thường chúng chỉ trả về một danh sách các tài liệu chứa các từ trong câu truy vấn của người dùng. Người dùng sẽ tự mình vào từng kết quả trả về để tìm thông tin mà mình cần từ hàng ngàn kết quả trả về từ hệ thống IR. Trong nhiều trường hợp, công việc tìm kiếm này sẽ tốn không ít thời gian của người dùng mà người dùng cũng không chắc chắn họ sẽ tìm thấy được thông tin mà họ cần trong tập các kết quả trả về từ các máy tìm kiếm (search engine). Một nhu cầu thực tế đặt ra, người dùng muốn rằng khi họ đưa câu hỏi của họ bằng ngôn ngữ tự nhiên thì một hệ thống nào đó có thể trả ra ngay những thông tin họ cần, câu trả lời ngắn gọn, cô đọng cho câu hỏi của họ mà không cần các tập tài liệu. Những hệ thống như vậy gọi là hệ thống hỏi đáp QA (Question Answering). QA là một loại của IR (Information Retrieval). QA quan tâm yêu cầu các kỹ thuật xử lý ngôn ngữ tự nhiên phức tạp hơn các loại khác của IR như tìm kiếm tài liệu (document retrieval). Hệ thống QA chấp nhận các câu hỏi dạng ngôn ngữ tự nhiên, tìm kiếm các câu trả lời từ một tập các tài liệu rút trích và đưa ra những câu trả lời ngắn gọn, súc tích. Các hệ thống QA được phân làm hai loại chính: hệ thống QA miền mở (open-domain) và hệ thống QA miền đóng (closed-domain).  QA miền mở nhằm mục đích trả về câu trả lời tương ứng với câu hỏi của người dùng hơn là một tập các tài liệu liên quan.  QA miền đóng giải quyết các câu hỏi với một miền dữ liệu được chỉ định (chẳng hạn chỉ trong y học hay dự báo thời tiết, ...). Ban đầu, các hệ thống QA bị hạn chế chỉ phát triển trên miền đóng, nhưng do nhu cầu phát triển thực tế nên hệ thống này dần phát triển trên miền mở. Một hệ thống QA có thể có nhiều kiểu kiến trúc khác nhau. Chúng bao gồm các phần chính của kiến trúc chung cho tất cả các hệ thống QA và các phần tùy chọn khác. Các môđun chung trong một hệ thống QA thông thường gồm 3 modun chính: xử lý câu hỏi (question processing), Xác định các tài liệu ứng viên (document retrieval), rút tríchvà đánh giá câu trả lời (answer extraction). Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 22 Hình 3. Kiến trúc một hệ thống QA tổng quát Có rất nhiều các hệ thống QA phát triển dựa trên ngôn ngữ Latin. Trong đó,  Hệ thống START được phát triển bởi MIT là một trong các hệ thống hỏi đáp dựa trên web đầu tiên. Nó được triển khai đầu tiên 1993, hệ thống này tiếp tục được phát triển và lần triển khai mới nhất là năm 2007. Khi hệ thống này được test trên TREC’08 thì điểm của hệ thống START là 14/5% và thời gian trả lời trung bình là 9.84s. Hình 4. Hệ thống Start Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 23  Một hệ thống QA miền mở khác là AnswerBus được phát triển bởi trường đại học Michigan, chấp nhận câu hỏi tiếng Anh, tiếng Đức, tiếng Tây Ban Nha, tiếng Pháp, tiếng Ý và tiếng Thổ Nhĩ Kỳ và nó rút trích câu trả lời từ web. Khi test các câu hỏi trong TREC’08, điểm của AnswerBus là 64.18% và thời gian phản ứng trung bình là 7.2s. Hình 5. Hệ thống Answer Bus  Một hệ thống QA mã nguồn mở QANUS được phát triển bởi Đại học Quốc Gia Singapore (QANUS, 2010). Lý do để hệ thống QA này được nhiều người quan tâm vì nó là hệ thống QA nguồn mở và vì thế có điểm bắt đầu tốt để phát triển hệ thống QA tốt hơn. Hình 6. QANUS Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 24 Ngoài ra, các hệ thống QA tiếng Ả-rập cũng được phát triển.  AQAS là một trong các hệ thống QA tiếng Ả-rập sớm nhất, đây là một hệ thống dựa trên tri thức. Nó chấp nhận câu truy vấn tiếng Ả-rập theo các luật và phù hợp các khung (frame) trong tri thức. Hệ thống này được ứng dụng trong lĩnh vực bức xạ nên nó là một hệ thống QA miền đóng. Kiến trúc hệ thống này giống với kiến trúc các hệ thống QA tiếng Anh.  QARAB là một hệ thống QA sử dụng rút trích từ tời váo tiếng Ả-rập để trả lời cho câu truy vấn ngôn ngữ tự nhiên được gửi bởi người dùng. Hệ thống này cũng có thể được xem xét là một hệ thống QA miền đóng. Hệ thống này tìm kiếm các đoạn văn bản ngắn chứa câu trả cho câu truy vấn của người dùng hơn là rút trích câu trả lời.  Hệ thống ArabiQA (Benajiba at al, 2007) là một hệ thống QA tiếng Ả Rập tập trung câu hỏi dang factorid. Hệ thống này sử dụng hệ thống tìm kiếm thông tin Java, hệ thống tìm kiếm đoạn văn (Passage Retrieval), các modun xác định thực thể tong câu và một modun rút trích câu trả lời. Các tác giả của hệ thống này báo cáo độ chính xác là 83,3% trên dữ liệu test họ đã làm. 2.2. Ứng dụng nguyên tắc sáng tạo cho sự phát triển hệ thống QA trong tương lai: 2.2.1. Nguyên tắc chia nhỏ: Để giải quyết bài toán hệ thống QA liên quan đến rất nhiều bài toán khác trong xử lý ngôn ngữ tự nhiên, do đó ta có thể chia nhỏ nghiên cứu QA thành một số phân nhóm nhỏ nghiên cứu:  Bài toán tách câu trong văn bản.  Bài toán xác định từ loại các từ trong văn bản.  Bài toán phân cụm các từ trong văn bản.  Bài toán xác định các thực thể xuất hiện trong văn bản (như tên người, tên tổ chức, ...)  Bài toán phân đoạn trong văn bản.  Bài toán rút trích thông tin văn bản.  Bài toán xác định ngữ nghĩa của từ trong văn bản, …. 2.2.2. Nguyên tắc kết hợp: Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 25 Kết hợp hệ thống QA với các ứng dụng công nghệ cao khác như robot, máy giặt, điện thoại di động, .... để hệ thống QA có thể trở nên gần gủi với con người hơn. Hệ thống QA có thể kết hợp với các hệ thống nhận dạng giọng nói để phát triển lên hệ thống thông minh hơn. Khi đó dữ liệu đầu vào của hệ thống QA không đơn thuần là văn bản nhập vào từ bàn phím mà có thể là giọng nói của con người và dữ liệu ra cũng có thể là giọng nói phản ứng lại thay vì là văn bản thô. Hệ thống QA kết hợp các ứng dụng trong xử lý ảnh như nhận dạng khuôn mặt, xác nhận chữ ký điện tử, ... để nguồn thông tin tìm kiếm không chỉ là các văn bản mà có thể là các video hay hình ảnh. Chẳng hạn người dùng có thể đặt câu hỏi cho QA trên youtube là tìm video có chứa ảnh Iphone5, ... Hơn nữa, ta cũng có thể kết hợp tất cả các thành phần trên với QA để tạo nên những sản phầm công nghệ thật sự gần gủi và hữu ích với con người. Và rõ ràng nếu những thiết bị như thế ra đời sẽ phục vụ rất nhiều lĩnh vực trong cuộc sống từ cuộc sống sinh hoạt hằng ngày đến các lĩnh vực quan trọng như giáo dục đào tạo, khoa học công nghệ, giao thông vận tải,... 2.2.3. Nguyên tắc vạn năng: Hệ thống QA trong tương lai cần phát triển đa ngôn ngữ. Hơn thế nữa, hệ thống QA có thể đóng vai trò một máy dịch ngôn ngữ, với dạng các câu hỏi yêu cầu dịch một câu sang một ngôn ngữ nào đó chẳng hạn. Hệ thống QA cũng có thể đóng vai trò là một hệ thống IR (Information Retrieval) hay hệ thống rút trích thông tin (Information Extraction). 2.2.4. Nguyên tắc chứa trong: Hệ thống QA có thể nhúng trong các ứng dụng thông minh, tương tác người máy như robot, máy ATM, máy giặt, tủ lạnh, .... 2.2.5. Nguyên tắc trung gian: Hệ thống QA có thể trở thành đối tượng trung gian cho các nghiệp vụ trả lời, tư vấn tự động. Khi nhập đến câu hỏi thông qua điện thoại của người dùng hệ thống này nhận dạng giọng nói và Ứng dụng nguyên tắc sáng tạo trong sự phát triển của hệ thống hỏi - đáp Bài thu hoạch phương pháp nghiên cứu khoa học Trang 26 tìm câu trả lời trong kho dữ liệu đã được huấn luyện sẵn và trả lời cho người dùng. 2.2.6. Nguyên tắc vượt nhanh: Khi nhận dữ liệu vào của người dùng, nếu đó là câu hỏi mang tính thông dụng thì hệ thống sẽ tiến hành tìm kiếm trên một tập dữ liệu huấn luyện sẵn đã được đánh index trên máy tính (vượt nhanh qua câu hỏi thông dụng), trong trường hợp không tìm thấy thì ta mới kết nối đến internet và tìm kiếm các trang web để xác định câu trả lời. 2.2.7. Nguyên tắc tự phục vụ: Khi người dùng nhập vào một câu hỏi mà hệ thống không thể xác định được loại câu hỏi hoặc không thể tìm thấy câu trả lời, có thể do dữ liệu hệ thống không đủ hoặc do người dùng nhập sai từ ngữ chẳng hạn, thì hệ thống phải có khả năng phân tích dựa trên câu mà người dùng nhập và đề xuất được các câu hỏi có khả năng là câu hỏi thật sự mà người dùng muốn hỏi. 2.2.8. Nguyên tắc nhiều lỗ: Đế có thể giảm bớt không gian tìm kiếm, hệ thống có thể tự đề nghị phân mục thành các dạng câu hỏi, chẳng hạn mục cho câu hỏi who, mục cho câu hỏi what, mục cho câu hỏi why, .... Nếu người dùng có thể xác định được loại câu hỏi này thì người dùng có thể tự chọn loại câu hỏi cần thiết, làm như vậy có thể giảm bớt thời gian xử lý xác định loại câu hỏi của hệ thống, mà con giảm bớt không gian tìm kiếm cho hệ thống. Ngoài ra, hệ thống có thể cung cấp thêm chức năng cho phép người dùng nhập vào đường dẫn tới một nguồn dữ liệu nào đó và chỉ tìm câu trả lời cho câu hỏi của người dùng trên nguồn dữ liệu đó mà thôi. 3. Tài liệu tham khảo:  Dương Hữu Thành, Nguyễn Thanh Tòng - Nghiên cứu sử dụng Wikipedia trong xây dựng hệ thống hỏi đạp - luận văn Cử Nhân, Đại học Khoa học Tự nhiên TPHCM.   .htm

Các file đính kèm theo tài liệu này:

  • pdfk22_1212035_duonghuuthanh_6413.pdf