Tiểu luận Phương pháp nguyên cứu khoa học trong tin học ứng dụng vào việc xây dựng phương pháp trả lời các truy vấn tiếng việt cho hệ thống tìm kiếm thư viện phim

Quá trình xử lý cuối cùng là phát sinh câu trả lời dựa vào câu truy vấn tiếng Việt và các thông tin có được từ việc thực hiện truy vấn trên ontology. Chẳng hạn, đối với một câu truy vấn “Ai là đạo diễn phim chòm sao tình yêu ?” thì chúng ta có thể chỉ cần trả lời đơn giản là “Từ Ngộ An”. Tuy nhiên, để tăng tính tự nhiên và thân thiện hơn với người dùng, các kết quả có được từ truy vấn ontology sẽ thông qua bộ phát sinh câu trả lời và cho ra câu trả lời tự nhiên nhất. Ví dụ như với câu truy vấn “Ai là đạo diễn phim chòm sao tình yêu” thay vì chỉ đơn thuần trả về kết quả là “Từ Ngộ An” thì thông qua bộ phát sinh câu trả lời người sử dụng sẽ nhận được kết quả là “Phim chòm sao tình yêu có đạo diễn là Từ Ngộ An”.

pdf37 trang | Chia sẻ: lylyngoc | Lượt xem: 2480 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Tiểu luận Phương pháp nguyên cứu khoa học trong tin học ứng dụng vào việc xây dựng phương pháp trả lời các truy vấn tiếng việt cho hệ thống tìm kiếm thư viện phim, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ghiệp, cũng như sau này khi làm việc trong môi trường khoa học. Nhóm cũng dành sự cảm ơn đến các thành viên trong lớp đã tạo ra môi trường học thuận lợi trong quá trình tiếp thu các bài giảng. Một lần nữa, nhóm chúng em xin chân thành cảm ơn sự tận tình truyền đạt kiến thức của thầy. Kính chúc thầy mạnh khỏe, tiếp tục đạt được nhiều thắng lợi trong nghiên cứu khoa học và công cuộc giảng dạy. Học viên: Nguyễn Khắc Mẫn - Ngô Ngọc Thơ NHẬN XÉT ……………………………………………………………………………………… …………………………………………………………………….……………………… ………………………………………………………….………………………………… ……………………………………………….…………………………………………… …………………………………….……………………………………………………… ………………………….………………………………………………………………… ……………….…………………………………………………………………………… …….………………………………………………………………………………….…… …………………………………………………………………………….……………… ………………………………………………………………….………………………… ……………………………………………………….…………………………………… …………………………………………….……………………………………………… ………………………………….………………………………………………………… ……………………….…………………………………………………………………… …………….……………………………………………………………………………… ….………………………………………………………………………………….……… ………………………………………………………………………….………………… ……………………………………………………………….…………………………… …………………………………………………….……………………………………… ………………………………………….………………………………………………… ……………………………….…………………………………………………………… …………………….……………………………………………………………………… ………….…………………………………………………………………………………. ……………………………………………………………………………….…………… …………………………………………………………………….……………………… ………………………………………………………… PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 1 Mục Lục: CHƯƠNG 1: CƠ SỚ LÝ THUYẾT CHO CÁC NGHIÊN CỨU KHOA HỌC .............................3 I. VẤN ĐỀ KHOA HỌC VÀ CÁC PHƯƠNG PHÁP GIẢI QUYẾT ...................................3 1.1. Khái niệm ..................................................................................................................3 1.2. Phân loại ...................................................................................................................3 1.3. Các tình huống vấn đề ...............................................................................................3 1.4. Các phương pháp phát hiện vấn đề khoa học .............................................................4 1.5. Phương pháp giải quyết vấn đề theo khoa học về phát minh, sáng chế .......................4 II. CÁC BƯỚC TIẾN HÀNH MỘT CÔNG TRÌNH NGHIÊN CỨU KHOA HỌC ...............6 2.1. Thế nào là một nghiên cứu khoa học ..........................................................................6 2.2. Các tiêu chí cần đáp ứng trong nghiên cứu khoa học ..................................................6 2.3. Trình tự các bước cần tiến hành khi nghiên cứu khoa học ..........................................7 2.4. Các khó khăn gặp phải và cách khắc phục .................................................................9 2.5. Những điều nên không nên trong nghiên cứu khoa học ............................................ 12 CHƯƠNG 2: PHÂN TÍCH QUÁ TRÌNH PHÁT TRIỂN CỦA NGHÀNH CÔNG NGHIỆP GAME & VIỆC ỨNG DỤNG CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC TRONG ĐÓ .... 16 I. SƠ LƯỢC QUÁ TRÌNH PHÁT TRIỂN CỦA NGÀNH CÔNG NGHIỆP GAME .......... 16 1.1. Khái niệm video game ............................................................................................. 16 1.2. Lịch sử phát triển của ngành công nghiệp game ....................................................... 17 II. PHÂN TÍCH CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC ĐƯỢC ÁP DỤNG TRONG QUÁ TRÌNH PHÁT TRIỂN CỦA NGÀNH CÔNG NGHIỆP GAME .................................. 18 2.1. Nguyên lý phân nhỏ................................................................................................. 18 2.2. Nguyên tắc kết hợp .................................................................................................. 19 2.3. Nguyên tắc vạn năng ............................................................................................... 19 III. ÁP DỤNG CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC KỸ THUẬT TRONG VẬN HÀNH GAME....................................................................................................................... 20 3.1. Nguyên tắc thực hiện sơ bộ ...................................................................................... 20 3.2. Nguyên tắc dự phòng ............................................................................................... 20 3.3. Nguyên tắc linh động ............................................................................................... 21 3.4. Nguyên tắc biến hại thành lợi .................................................................................. 21 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 2 CHƯƠNG 3: ỨNG DỤNG CƠ SỞ LÝ THUYẾT NGHIÊN CỨU KHOA HỌC VÀO CÔNG VIỆC NGHIÊN CỨU THỰC TIỄN CỦA BẢN THÂN ............................................................ 22 I. GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU ............................................................................ 22 1.1. Mục tiêu đề tài ......................................................................................................... 22 1.2. Phạm vi nghiên cứu ................................................................................................. 22 1.3. Nội dung nghiên cứu ............................................................................................... 23 1.4. Những đóng góp mới ............................................................................................... 23 1.5. Mô hình kiến trúc hệ thống đã xây dựng được ......................................................... 24 II. ÁP DỤNG CÁC NGUYÊN LÝ NGHIÊN CỨU KHOA HỌC TRONG QUÁ TRÌNH NGHIÊN CỨU ...................................................................................................................... 25 2.1. Nguyên lý phân nhỏ................................................................................................. 25 2.2. Nguyên lý thực hiện sơ bộ ....................................................................................... 26 2.3. Nguyên lý linh động ................................................................................................ 27 2.4. Nguyên lý hoạt động theo chu kỳ ............................................................................. 28 2.5. Nguyên lý phản hồi ................................................................................................. 30 PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 3 CHƯƠNG 1: CƠ SỚ LÝ THUYẾT CHO CÁC NGHIÊN CỨU KHOA HỌC I. VẤN ĐỀ KHOA HỌC VÀ CÁC PHƯƠNG PHÁP GIẢI QUYẾT 1.1. Khái niệm Vấn đề khoa học (scientific problem) cũng được gọi là vấn đề nghiên cứu (research problem) hoặc câu hỏi nghiên cứu là câu hỏi được đặt ra khi người nghiên cứu đứng trước mâu thuẫn giữa tính hạn chế của tri thức khoa học hiện có với yêu cầu phát triển tri thức đó ở trình độ cao hơn. 1.2. Phân loại Nghiên cứu khoa học luôn tồn tại hai vấn đề : - Vấn đề về bản chất sự vật đang tìm kiếm - Vấn đề về phương pháp nghiên cứu để làm sáng tỏ về lý thuyết và thực tiễn những vấn đề thuộc lớp thứ nhất. 1.3. Các tình huống vấn đề Có ba tình huống : Có vấn đề , không có vấn đề, giả vấn đề được cho trong hình dưới đây: Hình 1.1: Sơ đồ phân loại PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 4 1.4. Các phương pháp phát hiện vấn đề khoa học Có sáu phương pháp: 1) Tìm những kẻ hở, phát hiện những vấn đề mới 2) Tìm những bất đồng 3) Nghĩ ngược lại quan niệm thông thường 4) Quan sát những vướng mắc trong thực tiễn 5) Lắng nghe lời kêu ca phàn nàn 6) Cảm hứng : những câu hỏi bất chợt xuất hiện khi quan sát sự kiện nào đó. 1.5. Phương pháp giải quyết vấn đề theo khoa học về phát minh, sáng chế 1.5.1. Có 5 phương pháp:  Dựng Vepol đầy đủ  Chuyển sang Fepol  Phá vở Vepol  Xích Vepol  Liên trường 1.5.2. Có 40 thủ thuật:  Nguyên lý phân nhỏ.  Nguyên lý “tách khỏi”.  Nguyên lý phẩm chất cục bộ.  Nguyên lý (phản) bất đối xứng.  Nguyên lý kết hợp.  Nguyên lý vạn năng.  Nguyên lý “chứa trong”.  Nguyên lý phản trọng lượng.  Nguyên lý gây ứng suất (phản tác động) sơ bộ. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 5  Nguyên lý thực hiện sơ bộ.  Nguyên lý dự phòng.  Nguyên lý đẳng thế.  Nguyên lý đảo ngược.  Nguyên lý cầu (tròn) hóa.  Nguyên lý linh động.  Nguyên lý giải (tác động) “thiếu” hoặc “thừa”.  Nguyên lý chuyển sang chiều khác.  Sử dụng các dao động cơ học.  Nguyên lý hoạt động theo chu kỳ.  Nguyên lý liên tục các tác động có ích.  Nguyên lý “vượt nhanh”.  Nguyên lý biến hại thành lợi.  Nguyên lý quan hệ phản hồi.  Nguyên lý sử dụng trung gian.  Nguyên lý tự phục vụ.  Nguyên lý sao chép.  Nguyên lý “rẻ’ thay cho “đắt”.  Thay thế sơ đồ (kết cấu) cơ học.  Sử dụng các kết cấu khí và lỏng.  Sử dụng vỏ dẻo và màng mỏng.  Sử dụng các vật liệu nhiều lỗ.  Nguyên lý thay đổi màu sắc.  Nguyên lý đồng nhất.  Nguyên lý phân hủy hoặc tái sinh các phần.  Thay đổi các thông số hóa lý của đối tượng.  Sử dụng chuyển pha. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 6  Sử dụng sự nở nhiệt.  Sử dụng các chất ôxy hóa mạnh.  Thay đổi độ trơ.  Sử dụng các vật liệu hợp thành (composite). II. CÁC BƯỚC TIẾN HÀNH MỘT CÔNG TRÌNH NGHIÊN CỨU KHOA HỌC 2.1. Thế nào là một nghiên cứu khoa học Nghiên cứu khoa học là hoạt động tìm kiếm, xem xét, điều tra hoặc thử nghiệm để phát hiện ra những cái mới về bản chất sự vật, về thế giới tự nhiên và xã hội, và để sáng tạo phương pháp và phương tiện kỹ thuật mới cao hơn, giá trị hơn. 2.2. Các tiêu chí cần đáp ứng trong nghiên cứu khoa học Một nghiên cứu khoa học cần đáp ứng ít nhất một trong các tiêu chísau đây: - Phát hiện điều mới trong các quy luật và đặc tính của tự nhiên hoặc của xã hội. - So sách giữa hai hoặc nhiều hiện tượng của tự nhiên hoặc của xã hội để chỉ ra sự giống nhau và khác nhau giữa chúng. - Tìm kiếm phương pháp để giải quyết các khó khăn, trục trặc đang cản trở sự phát triển của tự nhiên và xã hội. - Thay đổi hoặc lợi dụng các hiện tượng tự nhiên hoặc xã hội để phục vụ tốt hơn cho con người và môi trường xung quanh. - Nghiên cứu các hiện tượng / công việc đã xảy ra / thực hiện trong quá khứ để rút ra bài học cho hiện tại và tương lai. - Dự đoán tương lai để có các hành động phù hợp trong hiện tại. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 7 2.3. Trình tự các bước cần tiến hành khi nghiên cứu khoa học Hình 1.2 Thứ tự các bước thực hiện khi tiến hành nghiên cứu khoa học Bước 1: Mô tả các khó khăn trên thực tế Trong thực tế khi gặp khó khăn thì lúc đó mới cần tiến hành nghiên cứu khoa học với mục đích là giải quyết các khó khăn đó. Vậy có thể nói việc mô tả các khó khăn đang gặp phải chính là sự mở đầu cho một nghiên cứu. Bước 2: Tổng quan về các nghiên cứu liên quan Đây là thời gian tìm hiểu xem vấn đề dự định nghiên cứu đã và đang được nghiên cứu bởi các học giả khác chưa, ở mức độ nào qua đó có thể học những điều hay và tránh được việc lặp lại trong nghiên cứu trước. Bước 3: Xác định mục tiêu nghiên cứu Mục tiêu nghiên cứu là những dự định đặt ra để giải quyết được các khó khăn đã chỉ ra ở bước 1. Nghiên cứu viên phải luôn bám theo các mục tiêu đã đề ra PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 8 trong suốt quá trình và phải hoàn thành chúng trước khi nghiên cứu được khép lại. Các nghiên cứu hiện nay thường thể hiện rất rõ ràng phần này Bước 4: Phương pháp nghiên cứu Đây là phần chỉ ra hướng nghiên cứu mà nghiên cứu viên muốn tiến hành để đạt được mục tiêu đề ra trong bước 3. Thông thường, các phương pháp thu thập dữ liệu hay thí nghiệm và phân tích chúng phải được thể hiện rõ. Ngoài ra, các giả thuyết và phạm vi nghiên cứu, kinh phí và thời gian cần thiết, các đề xuất dự định, … cũng cần phải được chỉ ra một cách rõ ràng. Bước 5: Dữ liệu thực tế hoặc giả định cụ thể Dữ liệu là phần rất quan trọng trong nghiên cứu khoa học. Chúng có thể được thu thập qua quá trình điều tra tại hiện trường hoặc là dữ liệu giả định thu được từ thí nghiệm, mô phỏng. Những dữ liệu này có thể chỉ ra những phát triển của thực tế trong quá khứ và hiện tại, qua đó có thể dự đoán tương lai, so sánh với lý thuyết,…Thông thường, giai đoạn thu thập dữ liệu tiêu tốn rất nhiều thời gian và tiền bạc của người nghiên cứu và sự chính xác của dữ liệu sẽ ảnh hưởng lớn đến kết quả cuối cùng của nghiên cứu. Bước 6: Phân tích dữ liệu hoặc chạy chương trình Đến đây nghiên cứu khoa học sẽ có 2 hướng đi. Một là phân tích các dữ liệu thu thập được để có các kết luận cho những điều đã và đang xẩy ra trong thực tế, từ đó có các đề xuất cho tương lai. Một cách khác là lập ra các chương trình máy tính để mô phỏng, tính toán lý thuyết dựa vào hoặc so sánh với các dữ liệu thực tế. Phần này thường liên quan tới các chuyên môn sâu nên chỉ có những người có cùng lĩnh vực nghiên cứu mới hiểu và quan tâm đến. Bước 7: Phát hiện hoặc đề xuất cái mới PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 9 Thường mỗi nghiên cứu khoa học sẽ tiến đến kết thúc sau khi một vài phát hiện hoặc đề xuất mới được đưa ra. Những điều mới này chính là kết quả cuối cùng của nghiên cứu có thể áp dụng làm cho thực tế hiện tại và tương lai tốt hơn và phải thỏa mãn được các mục tiêu nghiên cứu đề ra trong bước 3. Bước 8: Kết luận Đây là phần cuối cùng và được độc giả chú ý đến trước tiên để xem kết quả của nghiên cứu rồi sau đó mới đến các phần khác nếu có quan tâm. Từ “kết luận” cũng đã thể hiện rõ ý nghĩa của nó. Từ “kết” có nghĩa là kết thúc, tổng kết. Người nghiên cứu phải đúc kết lại toàn bộ nghiên cứu theo một trình tự khoa học và ngắn nhất để người đọc có thể hình dung tổng thể toàn bộ quá trình. Từ “luận” là bình luận các kết quả thu được về thực tế nghiên cứu xem tốt hay xấu, thỏa mãn hay chưa thỏa mãn, … . Ngoài phần kết luận, các nghiên cứu nên có thêm các phần bổ trợ như đề xuất áp dụng kết quả nghiên cứu vào thực tế, các nghiên cứu cần được tiến hành trong tương lai, những hạn chế của nghiên cứu, … . Các phần bổ trợ này dùng để nhấn mạnh phần nghiên cứu chính, thể hiện tính khả thi và khả năng áp dụng kết quả đạt được để củng cố, làm tốt hơn thực tế hiện tại và tương lai. 2.4. Các khó khăn gặp phải và cách khắc phục Thông thường, mọi nghiên cứu đều có khó khăn trong quá trình thực hiện do nhiều nguyên nhân và người nghiên cứu phải nỗ lực giải quyết chúng để có được thành công cuối cùng. Sau đây là một số khó khăn điển hình trong nghiên cứu khoa học: Mối quan hệ với thầy giáo hướng dẫn Các giảngviên hướng dẫn thì mỗi người một tính, người thì khắt khe, người thì dễ dàng, người thì chẳng để tâm đến sinh viên,… Nói chung họ là những người cá PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 10 tính và nhiều khi gây khó chịu cho sinh viên trong cuộc sống hàng ngày cũng như trong nghiên cứu. Thông thường các giáo viên thì cũng là con người và có các tính cách khác nhau, nhưng nói chung là họ luôn thương sinh viên, chỉ có cách dạy bảo là khác nhau thôi. Khi vượt qua được rào cản trong các yêu cầu và tính cách của giảng viên hướng dẫn cũng chính là lúc ta đã học được trường phái nghiên cứu của họ. Khó khăn trong thu thập dữ liệu thực tế Các dữ liệu thực tế trong quá khứ và hiện tại thường rất khó xin được, đặc biệt là các số liệu nhạy cảm, có liên quan tới các cơ quan khác. Để vượt qua khó khăn này, việc đầu tiên là phải nghĩ đến điều này ngay trong giai đoạn thiết kế cách thu thập dữ liệu để tránh các dữ liệu không thể có được. Nghĩa là nghiên cứu chỉ tập trung đến các dữ liệu có sẵn hoặc có thể thu thập được. Ngoài ra, nguồn dữ liệu có sẵn không chỉ một nơi mà thường có ở nhiều nơi khác nhau. Vì vậy người nghiên cứu cần đa dạng cách thu thập dữ liệu, tập trung vào nhiều nguồn khác nhau. Không xác định được hướng nghiên cứu Nhiều người nghiên cứu phải loay hoay tìm hướng nghiên cứu trong thời gian dài hoặc phải đổi đề tài và hướng nghiên cứu sau một thời gian. Điều này làm ảnh hưởng đến toàn bộ quá trình nghiên cứu do thời gian và nguồn lực cho phép bị giảm đi. Thông thường trước khi bắt tay vào nghiên cứu cần phải đọc thật nhiều các nghiên cứu có sẵn về chủ đề liên quan để có được hiểu biết tổng quan về lĩnh vực đấy. Phần phương pháp nghiên cứu phải được chú ý đúng mức để chỉ ra các bước tuần tự thực hiện của đề tài với mục đích đạt được mục tiêu đề ra ban đầu. Việc tham khảo, tranh luận với giảng viên hướng dẫn, đồng nghiệp nghiên cứu, bạn bè, … cũng rất quan trọng để củng cố, chỉnh sửa hướng nghiên cứu cho phù hợp. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 11 Đăng báo không được chấp nhận hoặc phải đợi lâu Gặp rất nhiều khó khăn trong việc đăng báo để đủ tiêu chuẩn tốt nghiệp. Thông thường yêu cầu là bài báo quốc tế cũng tương đối khó cho nhiều người vì nhiều lý do. Bài báo của hội thảo thì dễ hơn và nhiều người dễ dàng có được. Thường các yêu cầu đầu tiên là phải đúng chủ đề của tạp chí đấy. Trước khi gửi bài đi đăng thì cần phải kiểm tra xem bài báo có đúng chủ đề yêu cầu không, đã có ai đăng nghiên cứu tương tự chưa, v.v… Một lời khuyên là nên gửi bài đến tạp chí càng sớm càng tốt vì quá trình xem xét thường mất ít nhất là 6 tháng đến 1 năm. Ngoài ra nên viết bài theo các hướng khác nhau và gửi cho nhiều tạp chí vì tiêu chí lựa chọn của các tạp chí thường khác nhau nên nếu may mắn thì sẽ được một tạp chí chấp nhận cho đăng. Khả năng tiếng Anh kém Người Việt nói chung khả năng tiếng Anh kém hơn các nước khác nên cũng gây ra nhiều khó khăn trong nghiên cứu và viết báo vì hầu hết tài liệu tham khảo hoặc các hội thảo, tạp chí đều yêu cầu tiếng Anh cả. Nên tìm kiếm những người nói tiếng Anh gốc để giúp chỉnh sửa bài viết. Một cách nữa là lựa chọn những đoạn viết trong các sách báo đã đăng để đưa vào bài viết của mình, nhưng sử dụng cho hợp lý với hoàn cảnh và chủ đề nghiên cứu. Một lời khuyên nữa là câu văn cần đơn giản vì trong nghiên cứu khoa học một đoạn viết chỉ có mục đích truyền đi ý nghĩa nghiên cứu. Không nên để một câu văn là tập hợp của vài câu văn, nghĩa là chỉ nên có 1 chủ ngữ - vị ngữ và không nên dài quá 3 dòng viết. Bị áp lực, quá lo lắng, mất ngủ trong giai đoạn đầu nghiên cứu Nhiều người nghiên cứu thường bị áp lực trong nghiên cứu và ảnh hưởng tới cuộc sống hàng ngày như mất ngủ, lo lắng ra mặt, trầm cảm,… Những điều này PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 12 nếu xảy ra trong thời gian dài và lặp lại nhiều lần dễ gây ra các bệnh về thần kinh hoặc tâm lý. Hầu hết ai cũng bị áp lực lớntrong giai đoạn đầu nghiên cứu. Vì vậy dù có lo lắng thêm nữa thì việc nghiên cứu cũng không thể tiến triển thêm được. Do đó khi có biểu hiện của áp lực nghĩa là nghiên cứu đang đi vào hướng bế tắc. Lúc này nên dừng nghiên cứu trong một thời gian ngắn để nghỉ ngơi, chơi thể thao, dành thời gian cho gia đình và bạn bè,… để có thể tạm thời quên đi các khó khăn hiện tại. Khi đã vượt qua giai đoạn áp lực này thì dành thời gian kiểm tra tổng thể nghiên cứu để xác định lại hướng đi cho đúng hơn và có thể xin ý kiến của giảng viên hướng dẫn. 2.5. Những điều nên không nên trong nghiên cứu khoa học Khi tiến hành nghiên cứu khoa học, việc định hướng ban đầu và chỉnh sửa hướng đi là rất quan trọng cho thành công cuối cùng. Có nhiều điều nên làm nhưng cũng có nhiều điều không nên làm. Sau đây là một số lưu ý quan trọng về việc cần làm gì và không cần làm gì: Trung thực trong nghiên cứu Nghiên cứu khoa học phải phản ánh trung thực và đầy đủ các kết quả, phát hiện, dẫu rằng chúng có thể không giống với các dự định ban đầu. Việc che đậy những thiếu sót, sai lầm hay sửa đổi dữ liệu, kết quả phải tuyệt đối không bao giờ được cho phép. Trích dẫn, số liệu lấy từ các nghiên cứu khác cần phải chỉ rõ nguồn gốc để thể hiện chúng là tài liệu tham khảo, không phải kết quả của nghiên cứu này và cũng là cách tôn trọng những nghiên cứu trước. Ứng xử có đạo đức trong nghiên cứu Có những điều nếu người nghiên cứu làm hoàn toàn không phạm luật nhưng không có tính đạo đức nghề nghiệp, vì vậy nên tránh nếu có thể. Phạm phải điều PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 13 cấm này có thể vô tội trước pháp luật, nhưng sẽ bị lên án, coi thường bởi đồng nghiệp, bạn bè và bị day dứt lương tâm. Điều này sẽ làm ảnh hưởng tới uy tín của người nghiên cứu, thái độ nghi ngờ và thiếu hợp tác của mọi người, dẫn đến việc gặp phải nhiều khó khăn, ảnh hưởng tới chất lượng của các nghiên cứu sau này. Chọn đề tài nghiên cứu hợp lý Nên tiến hành các nghiên cứu có tính thực tiễn cao, có thể áp dụng vào thực tế để tạo ra lợi ích cho bản thân và xã hội. Không nên tiến hành những nghiên cứu vô bổ, tốn kém nhưng lợi ích thấp, mục đích để đánh bóng tên tuổi chứ không có ý nghĩa khoa học và kinh tế,… Thông thường sức nghiên cứu đến mức nào thì nên tiến hành nghiên cứu ở mức đấy mà thôi, theo kiểu “tuổi nhỏ làm việc nhỏ”, đừng tiến hành những dự án quá tham vọng vượt quá khả năng, thời gian và nguồn tài chính cho phép. Một số ví dụ điển hình trong việc chon hướng nghiên cứu sai như: chọn đề tài mà kết quả chỉ có thể áp dụng sau 20-50 năm nữa do hạn chế về kinh tế, xã hội và kỹ thuật. Có nghiên cứu lại đề xuất các ý tưởng mới với các yêu cầu thực hiện tốn kém hơn nhiều lần so với giải pháp đã có hiện tại. Nhiều nghiên cứu sinh lại thực hiện đề tài quá tham vọng, dẫn đến việc không hoàn thành đúng hạn và phải gia hạn, tốn kém thời gian và tiền bạc. Thời gian nghiên cứu Hiện vẫn còn chưa rõ ràng về việc tiêu tốn thời gian thế nào là hợp lý trong nghiên cứu khoa học. Nhiều người dành quá nhiều thời gian cho nghiên cứu do vậy phải giảm thời gian nghỉ ngơi. Ngược lại, có nhiều người dành rất ít thời gian cho nghiên cứu. Vì vậy các nghiên cứu cần phải được tiến hành liên tục và không có nhiều gián đoạn dài để tránh tốn thời gian cho việc tái khởi động và xem xét lại các phần đã làm. Dẫu rằng chưa có nghiên cứu chính thức nào trong nghiên cứu, nhưng có thể coi như giống thời gian làm việc của người lao động và đã được PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 14 kiểm chứng qua nhiều thời đại. Thời gian nghiên cứu thì khoảng 8-10 tiếng 1 ngày và 5 ngày 1 tuần là hợp lý. Ngoài ra, người nghiên cứu còn cần thời gian cho ngủ 8 tiếng, các sinh hoạt cá nhân và giải trí 8 tiếng. Tránh hao phí thời gian vô ích Quãng đời nghiên cứu rất ngắn nên tránh hao phí thời gian nghiên cứu (8 tiếng 1 ngày) vào những việc vô ích. Nhiều người tốn quá nhiều thời gian trên phòng nghiên cứu cho các việc vô bổ như chat, xem phim, ngủ, nghe nhạc, tán chuyện, … dẫu rằng những việc đó có thể làm vào 16 tiếng còn lại trong ngày. Một số người khác lại hay bị gián đoạn nghiên cứu do phải ra ngoài để làm thêm, hoạt động xã hội, du lịch,… Những thời gian vô ích đấy cần phải tránh trong thời gian 8 tiếng nghiên cứu. Cần nhớ rằng bạn là người nghiên cứu nên mục đích đầu tiên và quan trọng nhất là nghiên cứu, các hoạt động khác chỉ là phụ mà thôi. Ngoài ra, người nghiên cứu đã có 16 tiếng 1 ngày và 2 ngày cuối tuần để giải quyết các hoạt động yêu cầu của bản thân và xã hội. Công bố kết quả nghiên cứu Các kết quả nghiên cứu cần được công bố nhiều nhất và sớm nhất có thể. Đây chính là cách thông báo cho ra công chúng những gì đề tài nghiên cứu đã thực hiện để nhận được các phê bình, nhận xét phục vụ cho việc hoàn thiện nghiên cứu hơn nữa. Việc công bố rộng rãi là cách chứng minh sự trung thực, không cóp nhặttừ nghiên cứu khác hoặc cũng là cách đóng góp trở lại cho khoa học, giúp những người đi sau có tài liệu tham khảo và trả ơn những người đi trước mà đề tài đã tham khảo đến. Đôi khi cũng có một số nghiên cứu không công bố hoặc luôn cố gắng giữ bí mật kết quả do nhiều lý do. Tuy nhiên khi nghiên cứu qua đi thì kết quả của nghiên cứu đấy đã không được áp dụng do không ai biết đến và gây lãng phí về mặt khoa học. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 15 Giảng viên hướng dẫn Như đã nói ở trên thì các giảng viên mỗi người một tính cách do vậy mối quan hệ với giảng viên không phải lúc nào cũng tốt đẹp cả. Một điều nên tránh là gây ra xung đột với giảng viên hướng dẫn vì dẫu có kết quả thế nào thì nghiên cứu sinh sẽ vẫn là người chịu thiệt thòi nhất. Một khi bạn đã chấp nhận giảng viên là người hướng dẫn thì bạn bắt buộc chịu sự hướng dẫn của họ, dù đúng hay sai. Thông thường khoảng thời gian nghiên cứu không dài, trung bình khoảng 3 năm, nên sự chịu đựng là chấp nhận được. Điều quan trọng là bạn có thể nhận ra được những điều chưa đúng để khi trở thành người nghiên cứu độc lập bạn tránh được. Bảo vệ kết quả nghiên cứu Khi nghiên cứu chưa hoàn thành và chưa được công bố, người nghiên cứu nên có những biện pháp cần thiết để bảo vệ những thông tin nhạy cảm hoặc những kết quả có thể bị sử dụng bởi người khác. Điều này là cần thiết để tránh những điều đáng tiếc sau này có thể dẫn đến tranh chấp không cần thiết. Ngoài ra, việc lưu giữ số liệu cần được làm theo định kỳ và cất giữ ở ít nhất 2 nơi để tránh việc mất dữ liệu trong máy tính hoặc các bản in ra. Việc xuất bản, ấn hành hay đăng báo cũng là cách tốt để đỡ mất công trong việc bảo vệ dữ liệu hoặc các kết quả nghiên cứu. Dịch tài liệu nước ngoài Nhiều người nghiên cứu chỉ đơn thuần dịch tài liệu nước ngoài, sửa đổi chút ít và coi như đấy là nghiên cứu của chính họ. Vậy câu hỏi đặt ra là đấy có phải các nghiên cứu khoa học không hay chỉ là những sự cóp nhặt, ăn cắp của người khác? Những hành vi đó không phải là các nghiên cứu khoa học vì những người đó không hề có nghiên cứu, không có mục tiêu rõ ràng và cũng không giải quyết được khó khăn của thực tế. Những bài dịch đấy chỉ có tác dụng phổ biếnkiến thức và hướng vào những độc giả kém hiểu biết hơn. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 16 CHƯƠNG 2: PHÂN TÍCH QUÁ TRÌNH PHÁT TRIỂN CỦA NGHÀNH CÔNG NGHIỆP GAME & VIỆC ỨNG DỤNG CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC TRONG ĐÓ I. SƠ LƯỢC QUÁ TRÌNH PHÁT TRIỂN CỦA NGÀNH CÔNG NGHIỆP GAME 1.1. Khái niệm video game Video game (gọi tắt là game) là một dạng trò chơi điện tử liên quan đến tính tuơng tác với một giao diện người sử dụng để tạo ra một phản hồi hình ảnh trên một thiết bị hiển thị (video). Từ video trong video game là cách gọi truyển thống cho một thiết bị hiển thị raster. Tuy nhiên, với sự phổ biến của thuật ngữ "video game", giờ đây nó ngụ ý tất cả các dạng thiết bị hiển thị. Hệ thống thiết bị điện tử sử dụng để chơi video game được gọi là các hệ máy; ví dụ như máy tính cá nhân hay các hệ máy console. Những hệ máy này có kích thước từ chiếc máy tính đồ sộ cho đến những thiết bị nhỏ gọn cầm tay. Một số hệ máy chuyên để chơi game như máy arcade, tiếng anh arcade machine (hệ máy sử dụng tiền xu để chơi), trước đây khá phổ biến nhưng nay dần không còn được sử dụng nữa. Các thiết bị đầu vào sử dụng để thao tác trong game được gọi là thiết bị điều khiển game (hay tay cầm- game controller), và thay đổi tùy theo hệ máy. Ví dụ, một tay cầm chuyên dụng có khi chỉ có một nút và một cần điều khiển, trong khi những loại khác lại có hàng tá nút bấm và có hơn một cần điều khiển. Các game cho máy tính cá nhân thế hệ đầu chỉ cần bàn phím để chơi, hoặc thông thường hơn là yêu cầu người sử dụng mua một tay cầm riêng với ít nhất một nút bấm[2]. Rất PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 17 nhiều máy tính hiện nay cho phép, thậm chí yêu cầu, người chơi phải sử dụng cả bàn phím và chuột đồng thời. 1.2. Lịch sử phát triển của ngành công nghiệp game Nguồn gốc của video game nằm trong quá trình phát triển với ống phóng tia âm cực -dựa trên hệ thống phòng thủ tên lửa vào cuối những năm 1940. Các chương trình này sau đó được chuyển thể thành trò chơi đơn giản khác trong những năm 1950. Vào cuối những năm 1950 và qua các năm 1960, trò chơi máy tính đã được phát triển nhiều hơn (phần lớn là trên các máy tính lớn), với sự tinh tế và phức tạp ngày càng tăng lên (rất nhiều các video game thời kỳ đầu đã biến mất và hầu như không có một bản ghi lại nào). Trải qua các thời kỳ, video game tách ra trên nhiều hệ máy khác nhau: hệ arcade (hệ máy thùng), máy tính lớn, hệ console (hệ máy có tay cầm điều khiển), máy tính cá nhân và sau cùng là hệ máy cầm tay. Video game đầu tiên được thương mại hóa là Computer Space năm 1971, mà về sau đặt nền móng cho một ngành công nghiệp giải trí mới trong cuối những năm 1970 tại Hoa Kỳ, Nhật Bản, và châu Âu. Sự suy sụp đầu tiên xảy ra vào năm 1977 khi các công ty bị bắt buộc phải bán các hệ thống đã lỗi thời của họ tràn ngập thị trường. Sáu năm sau đó, một cuộc sụp đổ lớn hơn xảy ra. Cơn khủng hoảng này (gây ra bởi việc đổ bộ ồ ạt các video game chất lượng tệ hại vào trong thị trường) là kết quả sự sụp đổ hoàn toàn của ngành công nghiệp game trên hệ máy có tay cầm (game console) ở Mỹ, cuối cùng chuyển sự thống trị của thị trường game từ Bắc Mỹ sang Nhật Bản. Trong khi cơn khủng hoảng này tiêu diệt thị trường hệ máy console, thì game trên hệ máy tính cá nhân gần như không bị ảnh hưởng. Các thế hệ tiếp theo của hệ console vẫn tiếp tục bị thống trị bởi các tập đoàn Nhật Bản. Dù đã có vài nỗ lực bởi các tập đoàn ở Bắc Mỹ và Châu Âu nhằm giành lại chỗ đứng của mình , với thế hệ thứ tư các hệ máy console, nhưng sự liên doanh này thất bại hoàn toàn. Cho tới khi thế hệ máy chơi game thứ sáu ra đời PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 18 với Xbox là thành công thương mại thực sự được phát triển bởi tập đoàn Microsoft nhưng vẫn còn tỏ ra yếu thế về doanh số với các tập đoàn Nhật Bản như Sony, Nintendo hay Sega. Thị trường game cho máy cầm tay cũng đi theo một con đường giống như hệ console với vài thất bại của các tập đoàn Mỹ, tất cả đều không thành công trừ một số thành công hạn chế trong các hệ máy cầm tay thời kỳ đầu. Hiện tại thì chỉ có duy nhất các tập đoàn Nhật Bản có những thành công lớn trên hệ máy cầm tay, mặc dù game cho hệ máy cầm tay vài năm gần đây đã chuyển dần sang các thiết bị như điện thoại di động hay PDA do sự phát triển của công nghệ. II. PHÂN TÍCH CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC ĐƯỢC ÁP DỤNG TRONG QUÁ TRÌNH PHÁT TRIỂN CỦA NGÀNH CÔNG NGHIỆP GAME 2.1. Nguyên lý phân nhỏ Trong lĩnh vực game người ta phân chia game theo nhiều cách khác nhau, nhưng thông thường game được phân chia theo 2 hướng: - Game được phân chia theo thể loại: nhập vai, chiển thuật, giải đố, âm nhạc, hành động, phiêu lưu, kinh dị, mô phỏng, thể thao, đua xe, đối kháng,… - Game được phân chia theo hệ máy: o Game PC với ý nghĩa rằng người chơi sử dụng một máy tính cá nhân kết nối với một màn hình có độ phân giải cao. o Game console sẽ được chơi trên một hệ máy chuyên dụng kết nối với một tivi thông thường hoặc một màn hình tích hợp các chân cắm chuyên dụng. o Game handheld (thiết bị cầm tay dùng để chơi game) đã chứa tất cả các linh kiện cần thiết(màn hình hiển thị,phần cứng, phần mềm lõi) để có thể mang theo và vừa với tay người sử dụng. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 19 o Game arcade thường được hiểu là một game chơi trên một hệ máy thậm chí còn chuyên dụng hơn với các thiết bị điện tử thiết kế chỉ để chơi một game duy nhất và người chơi sẽ chơi trong một buồng riêng biệt. o Và cũng có các thiết bị có màn hình và cũng có chức năng chơi các game nhưng không phải là thiết bị chơi game chuyên dụng (ví dụ như điện thoại di động,PDA...). 2.2. Nguyên tắc kết hợp Một video game, như hầu hết các thể loại phuơng tiện thông tin khác, sẽ được chia thành các thể loại dựa trên nhiều yếu tố như lối chơi, loại mục tiêu, phong cách hình ảnh (hoạt hình hay mô phỏng) và các loại khác... Bởi vì các thể loại còn tùy thuộc vào việc định nghĩa nội dung, các thể loại cũng dần thay đổi và phát triển khi các phong cách mới của video game ra đời. Khi các tiến bộ công nghệ và các sản phẩm có giá trị liên quan đến việc phát triển video game ra đời đã khích lệ các game càng giống thực và phức tạp hơn nên có khả năng các thể loại mới xuất hiện càng nhiều (ví dụ: nuôi thú ảo), thúc đẩy ranh giới trong cách chơi của các game hiện tại hoặc trong một số trường hợp thêm các cách chơi mới . Một số thể loại xuất hiện là sự kết hợp của các thể loại khác, như các game nhập vai trực tuyến nhiều người chơi(MMORPG) . Cũng thường thấy các thể loại cấp cao hơn mà tổng hợp các đặc tính dựa trên các thể loại khác như hành động kết hợp với âm nhạc, hoặc kết hợp với yếu tố kinh dị trong game. 2.3. Nguyên tắc vạn năng Có một số game thường làm ra với các mục đích ngoài giải trí đơn thuần. chẳng hạn như các thể loại game luyện tập, game giáo dục, hay game tuyên truyền. Có những game thường được thiết kế để chơi bởi một chuyên gia như một phần của một công việc cụ thể hoặc để tăng cường kỹ năng. Chúng cũng có thể được tạo ra để truyền đạt nhận thức chính trị xã hội trên một phuơng diện cụ thể. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 20 Một trong những game có thuơng hiệu lâu đời nhất có lẽ là Microsoft Flight Simulator (game mô phỏng lái máy bay) lần đầu phát hành vào năm 1982 với tên này. Quân đội Mỹ sử dụng game mô phỏng thục tế ảo này để làm bài tập huấn luyện, cùng với đó là sự phát triển một số lớn các phần hỗ trợ bay khác như lái máy bay cảnh sát, máy bay chiến đấu, máy bay y tế. Một ví dụ khác nữa là game thế giới ảo (Second Life) đang được sử dụng bởi một số các đơn vị của chính phủ Mỹ (vd:NOAA, NASA, JPL), các trường đại học (vd:Đại học Ohio, MIT) cho giáo dục và các chương trình học tập từ xa và cả trong kinh doanh (như IBM, Cisco Systems) cho các cuộc họp và huấn luyện. III. ÁP DỤNG CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC KỸ THUẬT TRONG VẬN HÀNH GAME Sau đây là một số áp dụng của các nguyên lý sáng tạo khoa học kỹ thuật trong vận hành game online. 3.1. Nguyên tắc thực hiện sơ bộ Trong quy trình làm game trước khi release bất kì một game nào ra thị trường thường các game sẽ được chạy thử nghiệm qua các giai đoạn anpha, beta, close beta. Trong giai đoạn này sẽ có một số lượng hạn chế số lượng người chơi tham gia vào game chơi thử. Nếu có bất kì vấn đề gì về game sẽ được gamer phản hồi với nhà phát hành game để khắc phục. Mục đích của quá trình này nhằm đảm bảo game chạy ổn định trước khi vận hành chính thức. 3.2. Nguyên tắc dự phòng Trong quá trình vận hành các sản phẩm game trực tuyến thường lượng dữ liệu thông tin của người chơi game là rất lớn, do vậy những người vận hành game phải thường xuyển thực hiện việc sao lưu lại các thông tin đó một cách định kì nhằm đảm bảo dữ liệu của người dùng không bị mất khi có sự cố xảy ra. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 21 3.3. Nguyên tắc linh động Các lỗi phần mềm nếu không được phát hiện bởi những người kiểm tra phần mềm sẽ có thể tồn tại trong các bản phát hành chính thức của game. Điều này thường hay xảy ra vì phần lớn các trục trặc này chỉ xuất hiện dưới những điều kiện bất thường trong game, được coi là quá nhỏ để sửa lại, hoặc bởi vì game phải phát triển nhanh để kịp thời hạn phát hành. Các trục trặc có thể chỉ là những lỗi nhỏ về hình ảnh cho tới các lỗi nghiêm trọng như xóa hoàn toàn phần lưu game hoặc gây ra sự cố trong khi chạy game. Phần lớn các trường hợp nhà phát hành sẽ tung ra các bản cập nhật(hay gọi là patch- bản vá lỗi) để sửa các trục trặc. Đôi khi, trục trặc lại có lợi cho người chơi, chúng thường được gọi là các exploits-khám phá mới. 3.4. Nguyên tắc biến hại thành lợi Gian lận trong game có thể liên quan đến mã gian lận và các điểm ẩn giấu được thực hiên trong quá trình làm game, các mã chỉnh sửa được làm bởi bên thứ ba, hoặc người chơi khám phá ra một lỗi phần mềm nào đó. Việc chỉnh sửa được tạo điều kiện bởi gian lận trong phần cứng hoặc bởi một người được đào tạo về phần mềm. Gian lận thường làm game dễ hơn bằng việc cung cấp một số lượng không hạn chế các tài nguyên trong game, ví dụ như vũ khí, máu, đạn dược hay các loại khác; hoặc có thể các khả năng đặc biệt như đi xuyên tường. Các loại gian lận khác có thể cho phép truy cập tới những cấp độ không thể chơi được theo cách thông thường hoặc cung cấp các tính năng bất thường hay gây cười, như thay đổi màu sắc hoặc hiển thị hình ảnh trong game. Qua phân tích một ví dụ điển hình về sự phát triển của ngành công nghiệp game chúng ta có thể thấy các nguyên tắc về phương pháp sáng tạo khoa học được dùng một cách rộng rãi và phổ biến đặc biệt là trong công nghệ thông tin. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 22 CHƯƠNG 3: ỨNG DỤNG CƠ SỞ LÝ THUYẾT NGHIÊN CỨU KHOA HỌC VÀO CÔNG VIỆC NGHIÊN CỨU THỰC TIỄN CỦA BẢN THÂN I. GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU Tên đề tài: PHƯƠNG PHÁP TRẢ LỜI CÁC TRUY VẤN TIẾNG VIỆT CHO HỆ THỐNG TÌM KIẾM THƯ VIỆN PHIM 1.1. Mục tiêu đề tài Đề tài nhằm mục tiêu nghiên cứu phương pháp trả lời các truy vấn tiếng Việt cho hệ thống tìm kiếm thư viện phim. Phương pháp trả lời các truy vấn tiếng Việt được chúng tôi thiết lập trên cơ sở xây dựng các qui tắc cú pháp được định nghĩa theo DCG (Definite Clause Grammar) để phân tích cấu trúc cú pháp của các câu hỏi tiếng Việt, từ đó xác định những thông tin mà các câu hỏi này cần truy vấn để tạo các câu trả lời dựa trên cấu trúc cú pháp của những câu hỏi có liên quan. 1.2. Phạm vi nghiên cứu Để thực hiện mục tiêu nghiên cứu của đề tài, chúng tôi giới hạn phạm vi nghiên cứu trong những nội dung sau: - Các dạng câu truy vấn tiếng Việt: có cấu trúc câu đơn, hỏi trực tiếp, thuộc 3 dạng sau: o Dạng câu hỏi đúng/sai o Dạng câu hỏi thông tin o Dạng câu hỏi yêu cầu liệt kê thông tin đối tượng - Lĩnh vực ứng dụng: các thông tin về phim chẳng hạn như: tên phim, đạo diễn, diễn viên … PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 23 1.3. Nội dung nghiên cứu Nội dung nghiên cứu đề tài tập trung chủ yếu vào việc làm thế nào để phân tích, xử lý một câu truy vấn bằng tiếng Việt dưới dạng ngôn ngữ tự nhiên, cụ thể bao gồm các nội dung sau: - Cách lấy thông tin: o Nghiên cứu việc rút trích thông tin phim trên các website. o Chuyển đổi thông tin đã rút trích được thành dạng Ontology. - Cách biểu diễn thông tin phim trên máy tính: o Sử dụng Ontology để lưu trữ các thông tin về phim. o Các thao tác với Ontology: tạo mới một ontology, câp nhật, truy vấn. - Cách phân tích, xử lý câu truy vấn bằng ngôn ngữ tự nhiên (tiếng Việt): o Nghiên cứu ngữ pháp DCG để phân tích câu truy vấn. o Nghiên cứu cách xử lý câu truy vấn đã được phân tích bằng DCG, sau đó phát sinh câu truy vấn SPARQL từ cây ngữ pháp đã được DCG phân tích để truy vấn Ontology. - Cách phát sinh câu trả lời dựa vào kết quả truy vấn trên Ontology, và câu truy vấn của người sử dụng. 1.4. Những đóng góp mới Từ những nghiên cứu trên nhóm đã đưa ra một giải pháp mới cho mô hình tìm kiếm đó là tìm kiếm dựa trên ngữ nghĩa của câu, đều cần làm ở đây là làm sao cho máy tính có khả năng hiểu được ý nghĩa của câu truy vấn từ đó thực hiện tìm kiếm các thông tin phù hợp nhất với câu truy vấn. - Vê mặt thực tiễn: cung cấp search engine gần gũi, thân thiện với người sử dụng hơn. Người sử dụng nhập vào câu truy vấn và nhận được đúng cái mình muốn, không như trước kia phải tốn thời gian cho việc sàng lọc thông tin tìm kiếm được. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 24 - Về mặt nghiên cứu khoa học: đưa ra mô hình xử lý cho các câu truy vấn tiếng Việt dưới dạng ngôn ngữ tự nhiên. Mô hình đã giải quyết được bài toán là làm thế nào máy tính có thể hiểu một câu truy vấn dưới dạng ngôn ngữ tự nhiên. 1.5. Mô hình kiến trúc hệ thống đã xây dựng được Hình 3.1 Mô hình kiến trúc hệ thống Hinh 3.1 là mô hình xử lý câu truy vấn tiếng việt cho thư viện phim mà nhóm đã xây dựng được trong quá trình nghiên cứu, mô hình trên cho phép người dùng (user) nhập vào bất kỳ một câu truy vấn nào bằng tiếng việt dưới dạng ngôn ngữ tự nhiên để tìm kiếm thông tin phim cần thiết. Ví dụ: Câu hỏi: “ai là diễn viên của phim chòm sao tình yêu?” PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 25 Trả lời:“(Có tất cả 4 kết quả) tào mẫn lợi, mã tuấn vỹ, dương di, tạ thiên hoa: là diễn viên của phim chòm sao tình yêu”. Sau đây chúng ta sẽ đi sâu vào từng thành phần cụ thể để thấy rõ việc áp dụng các nguyên lý sáng tạo khoa học trong đó. II. ÁP DỤNG CÁC NGUYÊN LÝ NGHIÊN CỨU KHOA HỌC TRONG QUÁ TRÌNH NGHIÊN CỨU 2.1. Nguyên lý phân nhỏ Áp dụng nguyên lý phân nhỏ, nhóm đã phân chia hệ thống truy vấn thành từng module nhỏ, mỗi module đảm nhiệm một vai trò Trong mô hình 3.1 chúng ta thấy rằng hệ thống được chia nhỏ thành 5 lớp: - Giao diện người dùng: Nơi trực tiếp tương tác với người sử dụng, tiếp nhận yêu cầu cần xử lý - Bộ phân tích câu truy vấn: Các câu truy vấn bằng tiếng Việt dưới dạng ngôn ngữ tự nhiên sau khi được người sử dụng nhập vào sẽ đi qua bộ phân tích câu truy vấn, bộ phận này có nhiệm vụ phân tích câu cho ra cây cú pháp tương ứng. - Bộ chuyển đổi cây cú pháp: Từ cây cú pháp có được sau quá trình phân tích ở bộ phân tích câu truy vấn, một thuật toán chuyển đổi sẽ được áp dụng để chuyển cây cú pháp về dạng câu truy vấn ontology – trên ngôn ngữ SPARQL. - Ontology phim: nơi lữu trữu dữ liệu các thông tin về phim có thể xem đây là cơ sở dữ liệu của hệ thống. - Bộ phát sinh câu trả lời: là nơi phát sinh câu trả lời dựa vào câu truy vấn tiếng Việt và các thông tin có được từ việc thực hiện truy vấn trên ontology. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 26 2.2. Nguyên lý thực hiện sơ bộ Áp dụng nguyên lý thực hiện sơ bộ trong xây dựng mô hình phân tích câu truy vấn. Hình là sơ đồ thiết kế của bộ phân tích câu truy vấn: Hình 3.2 Sơ đồ quá trình xử lý câu truy vấn tiếng Việt dưới dạng ngôn ngữ tự nhiên Một câu truy vấn tiếng việt trước khi được chuyển thành cây cấu trúc ngữ pháp DCG phải trải qua bước tiền xử lý câu truy vấn. Các bước thực hiện trong quá trình tiền xử lý: - Loại bỏ các khoảng trắng dư thừa. - Chuyển chữ hoa về dạng chữ thường. - Thay thế các kí tự đặc biệt như dấu phẩy, dấu hai chấm, dấu chấm phẩy… thành các chuỗi đại diện. - Biến đổi chuỗi thành dạng danh sách các từ đơn. Kết quả của quá trình này sẽ cho chúng ta một danh sách các từ đơn của câu truy vấn. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 27 Phân tích cú pháp bằng DCG là dựa vào các qui tắc cú pháp đã được định nghĩa bằng DCG để phân tích và xác định cấu trúc cây cú pháp của câu hỏi. 2.3. Nguyên lý linh động Áp dụng nguyên lý linh động trong phận tích, chuyển đổi cây ngữ pháp sang ngôn ngữ truy vấn SPARQL, một thuật toán là thành phần trung giản để chuyển đổi bất kì cây ngữ pháp nào có được từ bộ phân tích câu truy vấn. Thuật toán chuyển đổi cây cú pháp sẽ nhận chuỗi input là cây cú pháp để xác định được đâu là thành phần cần truy vấn, đâu là thành phần dữ liệu, cuối cùng sẽ chuyển các thành phần đó về dạng câu truy vấn SPARQL. Sơ đồ thiết kế bộ chuyển đổi cây cú pháp: Hình 3.3 Sơ đồ khối quá trình chuyển đổi cây cú pháp sang SPARQL Ví dụ: Input và Output của thuật toán chuyển đổi. Giả sử chúng ta có câu truy vấn sau: “ dương di là diễn viên của phim chòm sao tình yêu ? ” Input và Output của thuật toán chuyển đổi cây ngữ pháp Input Cây cấu trúc ngữ pháp Output Câu truy vấn SPARQL formal2(formal2( interrogative(nil), unrelated_defined_objects(unrelated_ defined_object(film(plural(nil), SELECT ?Đạo_diễn WHERE { < PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 28 film_term(nil), name(input(input_term(phim), input(input_term(chòm), input(input_term(sao), input(input_term(tình), input(input_term(yêu)))))))))), related_interrogative_objects(r_rela ted_interrogative_object(relation(re lation_film_director(verb_have(có), director_term(đạo, diễn),verb_be(là))), unrelated_interrogative_objects(unre lated_interrogative_object(w_directo r(who(ai)))))), interrogative(nil))) ontologies.com/Ontol ogy1282878573.owl#B> :có_đạo_diễn_là ?Đạo_diễn. } 2.4. Nguyên lý hoạt động theo chu kỳ Để đảm bảo cho Ontology phim được cập nhật và mở rộng liên tục, bộ rút trích dữ liệu trên web thực hiện việc thu thập dữ liệu về phim từ các web site trên internet, từ đó cập nhật vào ontology. Hoạt động như một chương trình web crawler (trong phạm vi đề tài này chúng ta chỉ giới hạn là dữ liệu phim). Bộ rút trích sẽ đến duyệt các trang của một web site phim để rút trích các thông tin về phim, sau đó tự động chuyển các thông tin rút trích được vào Ontology phim. Mô hình thiết kế: PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 29 Hình 3.4 Sơ đồ khối quá trình rút trích dữ liệu Ví dụ: Các thông tin cần rút trích: Dữ liệu sẽ được rút trích từ trang Bộ thư viện html parser hỗ trợ việc phân tích các trang web. Bộ thư viện jdom hỗ trợ đọc ghi xml file Cụ thể, các thông tin phim được rút trích bao gồm những thông tin sau: - Url địa chỉ liên kết đến phim đó trên internet. - Tên tiếng Việt của phim. - Tên tiếng Anh của phim. - Đạo diễn. - Diễn viên. - Nhà sản xuất. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 30 - Thể loại. - Quốc gia. - Độ dài. - Ngày phát hành. - Đánh giá. - Giới thiệu, nội dung phim. 2.5. Nguyên lý phản hồi Quá trình xử lý cuối cùng là phát sinh câu trả lời dựa vào câu truy vấn tiếng Việt và các thông tin có được từ việc thực hiện truy vấn trên ontology. Chẳng hạn, đối với một câu truy vấn “Ai là đạo diễn phim chòm sao tình yêu ?” thì chúng ta có thể chỉ cần trả lời đơn giản là “Từ Ngộ An”. Tuy nhiên, để tăng tính tự nhiên và thân thiện hơn với người dùng, các kết quả có được từ truy vấn ontology sẽ thông qua bộ phát sinh câu trả lời và cho ra câu trả lời tự nhiên nhất. Ví dụ như với câu truy vấn “Ai là đạo diễn phim chòm sao tình yêu” thay vì chỉ đơn thuần trả về kết quả là “Từ Ngộ An” thì thông qua bộ phát sinh câu trả lời người sử dụng sẽ nhận được kết quả là “Phim chòm sao tình yêu có đạo diễn là Từ Ngộ An”. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 31 TÀI LIỆU THAM KHẢO Các tài liệu tiếng Anh: [1] Dang Tuan Nguyen, Ha Quy-Tinh Luong “Document searching system based on natural language query processing for Vietnam Open Courseware library”, International Journal of Computer Science Issues (IJCSI), pp. 7-13, Vol. 6, No. 2, November 2009. ISSN (online): 1694-0784, ISSN (print): 1694-0814. [2] Fernando C. N. Pereira và Stuart M. Shieber, “Prolog and Natural-Language Analysis (Digital Edition)”, ISBN 0-9719777-0-4 (Microtome’s website: www.mtome.com). [3] Fernando C. N. Pereira and David H. D. Warren (Department of Artificial Intelligence, University of Edinburgh), “Definite Clause Grammars for Language Analysis – A Survey of the Formalism and a Comparison with Augmented Transition Networks”, presented at Artif. Intell., 1980, pp.231-278. [4] Patrick Blackburn, Johan Bos, Kristina Striegnitz , “Learn Prolog now”, 2011. Các tài liệu tiếng Việt: [5] Slide _ Phương pháp nghiên cứu khoa học trong tin học _ GS.TSKH. Hoàng Kiếm [6] Phương pháp luận sáng tạo khoa học – kỹ thuật giải quyết vấn đề và ra quyết định (giáo trình tóm tắt) _ Phan Dũng [7] Phương pháp nghiên cứu khoa học _ TS. Đinh Tuấn Hải [8] Lương Quý Tịnh Hà, “Xây dựng công cụ tìm kiếm tài liệu học tập bằng các truy vấn ngôn ngữ tự nhiên trên kho học liệu mở Tiếng Việt”, Luận văn Thạc sỹ ngành Công nghệ thông tin, Trường Đại Học Công nghệ thông tin, Đại học quốc gia TP. Hồ Chí Minh, 2009. PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 32 [9] Nguyễn Vũ Huy, “Một số phương pháp và kỹ thuật nâng cao hiệu quả xử lý các dạng câu hỏi tiếng Việt đơn giản cho công cụ tìm kiếm thư viện học liệu mở”, Khóa luận tốt nghiệp đại học, hệ Cử nhân Tài năng, ngành Khoa học máy tính, Trường Đại học Công nghệ Thông tin, Đại học Quốc gia TP. Hồ Chí Minh, 2010. [10] Nguyễn Văn Lễ, “Tìm kiếm thông tin theo ngữ nghĩa: ứng dụng trong lĩnh vực du lịch”, Luận văn Thạc sỹ ngành Truyền dữ liệu và mạng máy tính, Học Viện Công nghệ Bưu chính Viễn thông, 2011. [11] Nguyễn Đình Liên, “Phương pháp xử lý một số dạng câu hỏi tiếng Việt cho công cụ tìm kiếm thư viện điện tử”, Luận văn Thạc sỹ ngành Công nghệ thông tin, Đại học Lạc Hồng, 2011. [12] Vũ Thị Phương, “Công cụ tìm kiếm thông tin lịch trình các chuyến du lịch bằng truy vấn tiếng Việt”, Khóa luận tốt nghiệp Đại học ngành Khoa học máy tính, Trường Đại học Công nghệ Thông tin, Đại học Quốc gia TP. Hồ Chí Minh. [13] Lý Thiên Trang, “Mô hình công cụ tìm kiếm bằng truy vấn tiếng Việt ứng dụng cho thư viện trường đại học”, Luận văn Thạc sỹ ngành Công nghệ thông tin, Trường Đại học Công nghệ Thông tin, Đại học Quốc gia TP. Hồ Chí Minh, 2009. [14] Tô Hoài Việt, "Xây dựng hệ thống học linh hoạt với tương tác người dùng cho bài toán so khớp ontology", Luận văn Thạc sỹ, ngành Khoa học máy tính, Đại học Khoa Học Tự Nhiên, Đại học Quốc gia TP. Hồ Chí Minh, 2009. Các tài liệu trên internet: [15] HTML Parser : [16] Protégé : [17] SWI-Prolog: PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 33 [18] [19] [20] PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Nguyễn Khắc Mẫn _ Ngô Ngọc Thơ 34

Các file đính kèm theo tài liệu này:

  • pdf_ch1101102__5015.pdf