Xây dựng kho dữ liệu luật kinh tế để phục vụ việc học tập của sinh viên

Đề tài đã xây dựng được kho dữ liệu và ứng dụng để phục vụ việc khai thác thông tin luật kinh tếcho người dùng, tuy nhiên do số lượng các văn bản là rất lớn với phạm vi điều chỉnh rộng, bao gồm nhiều lĩnh vực khác nhau về kinh tế, vì thế cần có những phân tích mang tính chuyên sâu hơn cho người dùng, ví dụphân nhóm các văn bản, tài liệu có liên quan, . Do đó, đề tài cần ứng dụng các kỹ thuật xử lý ngôn ngữ và khai phá dữ liệu để phát triển ứng dụng tìm kiếm văn bản luật thông minh hơn, đem lại thuận tiện cho người dùng. Trên cơ sở kho dữ liệu thu thập được, đề tài có thể ứng dụng các kỹ thuật của web ngữ nghĩa (semantic web) để xây dựng cơ sở dữ liệu tri thức về luật kinh tế nhằm hỗ trợ tư vấn người dùng một cách tự động, giúp người dùng có thể tìm kiếm các điều khoản trong một văn bản luật một cách chính xác hơn.

pdf13 trang | Chia sẻ: lylyngoc | Lượt xem: 2456 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Xây dựng kho dữ liệu luật kinh tế để phục vụ việc học tập của sinh viên, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
- 1 - BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG HUỲNH THỊ THANH SỰ XÂY DỰNG KHO DỮ LIỆU LUẬT KINH TẾ ĐỂ PHỤC VỤ VIỆC HỌC TẬP CỦA SINH VIÊN Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2011 - 2 - Cơng trình được hồn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS. Võ Trung Hùng Phản biện 1: TS. Huỳnh Hữu Hưng Phản biện 2: TS. Trương Cơng Tuấn Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật họp tại Đại học Đà Nẵng vào ngày 16 tháng 10 năm 2011 Cĩ thể tìm hiểu luận văn tại: - Trung tâm Thơng tin-Học liệu, Đại học Đà Nẵng - Trung tâm Học liệu, Đại học Đà Nẵng - 1 - MỞ ĐẦU 1. Lý do chọn đề tài Với tốc độ phát triển cơng nghệ thơng tin hiện nay, việc quản lý giáo dục trở nên dễ dàng, nhanh chĩng và tiện lợi hơn nhờ sự giúp sức các ứng dụng cơng nghệ thơng tin làm phương tiện học tập, tạo nên mơi trường học tập với thơng tin đa dạng trong việc tra cứu tài liệu, tạo nên tính tự học, tự nghiên cứu cho người học. Trường trực thuộc UBND tỉnh Quảng Nam và chịu sự quản lý nhà nước về giáo dục của Bộ Giáo dục và Đào tạo. Tổng số sinh viên của trường đang đào tạo là 8.587 sinh viên. Trong đĩ sinh viên ngành kế tốn và quản trị kinh doanh là 3.250 sinh viên. Trong chương trình đào tạo dành cho chuyên ngành kế tốn và quản trị kinh doanh, sinh viên được trang bị các kiến thức cơ bản về luật doanh nghiệp năm 2005, luật hợp tác xã năm 2003, luật phá sản năm 2004, luật thương mại năm 2005. Đây là những kiến thức hết sức cần thiết cho những người hoạt động trong lĩnh vực kế tốn và quản trị kinh doanh bởi vì nĩ sẽ cung cấp cho họ những hiểu biết nhất định về quy chế thành lập và hoạt động của các loại hình doanh nghiệp, hợp tác xã đang tồn tại và phát triển trong nền kinh tế thị trường của Việt Nam hiện nay. Với một lượng thơng tin cần phải tiếp cận nhiều như vậy địi hỏi nhà trường phải cĩ một hệ thống tài liệu liên quan đến mơn học một cách phong phú, đa dạng và cập nhật. Nhà trường chỉ mới dừng lại ở việc trang bị các văn bản pháp luật hiện hành cĩ liên quan mà chưa quan tâm đến việc xây dựng một hệ thống các loại sách tham khảo cần thiết để sinh viên nghiên cứu. Bên cạnh đĩ việc tra cứu hệ thống pháp luật thơng qua mạng Internet cịn gặp nhiều khĩ khăn do dữ liệu khơng tập trung, chưa nhất quán. Với những lý do ở trên, tơi là người đang cơng tác tại trường Cao đẳng Kinh tế - Kỹ thuật Quảng Nam và được sự đồng ý của PGS.TS. Võ - 2 - Trung Hùng, tơi chọn đề tài “Xây dựng kho dữ liệu Luật kinh tế để phục vụ việc học tập của sinh viên” và mục đích đầu tiên là sử dụng tại Trường Cao đẳng Kinh tế Kỹ thuật Quảng Nam. 2. Mục tiêu của đề tài Đề tài này nhằm mục đích xây dựng kho dữ liệu phục vụ việc tra cứu tài liệu về Luật kinh tế nhanh chĩng, chính xác cho sinh viên, giáo viên trong nhà trường thơng qua mạng Internet. Nâng cao hiệu quả ứng dụng cơng nghệ thơng tin cho sinh viên và giáo viên trong nhà trường. Để đáp ứng mục tiêu đã nêu, đề tài cần giải quyết những vấn đề chính sau: tìm hiểu hiện trạng hệ thống tra cứu Luật và các vấn đề liên quan đến hệ thống tra cứu; tìm hiểu, thu thập dữ liệu về Luật kinh tế để từ đĩ thiết kế kho dữ liệu về Luật kinh tế; nghiên cứu và lựa chọn cơng cụ để xây dựng hệ thống cho phép người sử dụng cập nhật, tra cứu trực tuyến hiệu quả nhất. 3. Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu của đề tài bao gồm các tài liệu điện tử liên quan đến Luật kinh tế và các ngành học liên quan đến Luật kinh tế của trường; kho dữ liệu và khai phá dữ liệu; các phần mềm mã nguồn mở, các hệ cơ sở dữ liệu liên quan đến đề tài. Bên cạnh đĩ Xây dựng ứng dụng với ngơn ngữ lập trình C# và hệ Cơ sở dữ liệu SQL Server 2005. 4. Nhiệm vụ nghiên cứu - Tìm hiểu các ngành học về Luật kinh tế của nhà trường. - Tìm hiểu các nội dung, văn bản về Luật kinh tế; và các nội dung, văn bản luật liên quan. - Phân tích và thiết kế kho dữ liệu về luật kinh tế. - Tìm hiểu ngơn ngữ lập trình, cơng cụ để xây dựng kho dữ liệu để xây dựng Cổng thơng tin về luật kinh tế phục vụ tìm kiếm, khai thác thơng tin về luật kinh tế. - 3 - - Thu thập dữ liệu về luật kinh tế để nạp vào kho dữ liệu. - Đánh giá kết quả ứng dụng hệ thống trong Nhà trường. 5. Phương pháp nghiên cứu - Phương pháp nghiên cứu lý luận: Các nội dung văn bản luật kinh tế, các nội dung văn bản luật liên quan. Phân tích các nội dung văn bản để xây dựng kho dữ liệu. - Phương pháp nghiên cứu thực tiễn: Khảo sát nhu cầu thực tế của sinh viên, giáo viên tra cứu, tìm kiếm tài liệu; Tìm hiểu các kho dữ liệu hiện cĩ. - Phương pháp nghiên cứu tài liệu: Tìm hiểu ngơn ngữ lập trình, hệ quản trị Cơ sở dữ liệu; Xây dựng ứng dụng. 6. Bố cục của luận văn Luận văn bao gồm các phần như sau: Mở đầu Chương 1: Nêu tổng quan về kho dữ liệu dữ liệu, khai phá dữ liệu, khái niệm về luật kinh tế, nhu cầu khai thác luật kinh tế, hiện trạng hệ thống tra cứu hiện cĩ. Chương 2: Trình bày yêu cầu đối với hệ thống, kiến trúc tổng thể và mơ hình hoạt động của hệ thống, thiết kế kho dữ liệu và chức năng của hệ thống. Chương 3: Việc lựa chọn cơng cụ để phát triển hệ thống, xác định các giải pháp phát triển hệ thống và đồng bộ dữ liệu, xây dựng các module xử lý. Kết luận của đề tài về các mặt làm được, khả năng ứng dụng, những ưu và nhược điểm và hướng phát triển trong tương lai. Kết luận của đề tài về các mặt làm được, khả năng ứng dụng, những ưu và nhược điểm và hướng phát triển trong tương lai. - 4 - CHƯƠNG 1 NGHIÊN CỨU TỔNG QUAN 1.1. KHO DỮ LIỆU 1.1.1. Kho dữ liệu và đặc trưng của kho dữ liệu 1.1.1.1. Định nghĩa kho dữ liệu Định nghĩa do W.H. Inman đề xướng: Kho dữ liệu (DWH) được hiểu là một tập hợp các dữ liệu tương đối ổn định (khơng hay thay đổi), cập nhật theo thời gian, được tích hợp theo hướng chủ đề nhằm hỗ trợ quá trình tạo quyết định về mặt quản lý. 1.1.1.2. Đặc trưng kho dữ liệu Đặc trưng của kho dữ liệu: tính tích hợp, tính gắn với thời gian , tính lịch sử, tính chỉ đọc, tính khơng biến động và tính dữ liệu tổng hợp và chi tiết. 1.1.2. Kiến trúc kho dữ liệu Dữ liệu tác nghiệp (nguồn 1) Dữ liệu tác nghiệp (nguồn 2) Dữ liệu tác nghiệp (nguồn 3) Bộ quản lí kho dữ liệu Các cơng cụ truy vấn báo cáo, phát triển ứng dụng và EIS Các cơng cụ xử lý phân tích trực truyến Các cơng cụ khai phá dữ liệu Các cơng cụ truy cập dữ liệu của người dùng đầu cuối Dữ liệu lưu trữ và sao lưu dự phịng Bộ quản lí kho dữ liệu Bộ quản lí truy vấn Dữ liệu chi tiết Dữ liệu tổng hợp ở mức thấp Dữ liệu tổng hợp ở mức cao Bộ quản lí nạp dữ liệu Siêu dữ liệu 1.1.3. Các dịng thơng tin của kho dữ liệu Việc xây dựng và khai thác kho dữ liệu tập trung vào quản lý năm luồng thơng tin chính cĩ tên là: luồng vào (Inflow), luồng lên (Upflow), - 5 - luồng xuống (Downflow), luồng ra (Outflow) và luồng siêu dữ liệu (Metaflow). 1.1.4. Kho dữ liệu cục bộ Kho dữ liệu cục bộ (Data Mart - DM) là CSDL cĩ những đặc điểm giống với kho dữ liệu nhưng với quy mơ nhỏ hơn và lưu trữ dữ liệu về một lĩnh vực, một chuyên ngành. 1.1.5. Mơ hình logic của kho dữ liệu 1.1.5.1. Lược đồ hình sao Trong mơ hình dữ liệu này, phạm vi dữ liệu được tổ chức trong các bảng chiều, mỗi chiều ứng với một đặc trưng của dữ liệu (khách hàng, sản phẩm , bán hàng, thời gian…), các bảng sự kiện biểu diễn các sự kiện xảy ra và các thơng tin chi tiết về các sự kiện đĩ. 1.1.5.2. Lược đồ hình bơng tuyết Đây là mơ hình tương tự mơ hình sao tuy nhiên nĩ mở rộng hơn mơ hình sao, trong mơ hình này một chiều của dữ liệu cĩ thể gồm nhiều bảng, và trong đĩ cĩ 1 bảng sự kiện, bảng sự kiện này chính là một chiều trong mơ hình lớn hơn. 1.1.5.3. Mơ hình dữ liệu nhiều chiều Đây là mơ hình chức dữ liệu xoay quanh các chủ đề nhằm trả lời một cách nhanh nhất các câu hỏi trong nghiệp vụ của người quản lý. Cĩ thể nhìn dữ liệu được tổ chức như là một khối, trong đĩ mỗi chiều là một chủ đề trong nghiệp vụ . 1.1.6. Ứng dụng của kho dữ liệu Ngày nay, kho dữ liệu được triển khai trong các doanh nghiệp với nhiều mục đích khác nhau như tạo các báo cáo tổng hợp, tích hợp dữ liệu, - 6 - quản trị doanh nghiệp thơng minh (Business Intelligence), quản lý quan hệ khách hàng, khai phá dữ liệu. 1.1.7. Xu hướng phát triển của kho dữ liệu Trong tương lai xu hướng phát triển của kho dữ liệu bao gồm : quản lý dữ liệu phi cấu trúc, tìm kiếm dữ liêu, kiến trúc hướng dịch vụ và kho dữ liệu thời gian thực. 1.2. KHAI PHÁ DỮ LIỆU 1.2.1. Khái niệm Khai phá dữ liệu (Data mining) ra đời vào những năm cuối của thập kỷ 80. Nĩ bao hàm một loạt các kỹ thuật nhằm phát hiện ra các thơng tin cĩ giá trị tiềm ẩn trong các tập dữ liệu lớn (các kho dữ liệu). Về bản chất, khai phá dữ liệu liên quan đến việc phân tích các dữ liệu và sử dụng các kỹ thuật để tìm ra các mẫu hình cĩ tính chính quy (regularities) trong tập dữ liệu. 1.2.2. Mục tiêu của khai phá dữ liệu Dữ liệu của chúng ta sau khi xử lý trực tuyến phục vụ cho một mục đích nào đĩ được lưu lại trong kho dữ liệu và theo ngày tháng khối lượng dữ liệu được lưu trữ ngày càng lớn. Trong khối lượng dữ liệu to lớn này cịn rất nhiều thơng tin cĩ ích mang tính tổng quát, thơng tin cĩ tính qui luật vẫn đang cịn tiềm ẩn mà chúng ta chưa biết. Các cơng cụ xử lý phân tích trực tuyến (On-Line Analytical Processing - OLAP) là cần thiết để phân tích dữ liệu, nhưng chưa đủ để rút thơng tin từ một khối lượng dữ liệu khổng lồ như vậy. Từ khối lượng dữ liệu rất lớn thì cần phải cĩ những cơng cụ tự động rút các thơng tin và kiến thức cĩ ích. Một hướng tiếp cận mới cĩ khả năng giúp các cơng ty khai phá các thơng tin cĩ nhiều ý nghĩa từ các tập dữ liệu lớn (databases, data warehouses, data repositories ) đĩ là khai phá dữ liệu (Data Mining). - 7 - 1.2.3. Các bước thực hiện khai phá dữ liệu Hình 1.5. Sơ đồ mơ tả quá trình khai phá dữ liệu 1.3. LUẬT KINH TẾ 1.3.1. Khái niệm Luật Kinh tế Luật kinh tế (hay luật kinh doanh) là một ngành luật trong hệ thống pháp luật Việt Nam, gồm tổng thể các qui phạm pháp luật do Nhà nước ban hành để điều chỉnh các quan hệ kinh tế phát sinh trong quá tŕnh quản lư kinh tế và sản xuất kinh doanh giữa các cơ quan quản lư Nhà nước về kinh tế với các tổ chức kinh tế hoặc giữa các tổ chức kinh tế với nhau hay nĩi khác đi luật kinh tế (hay luật kinh doanh) gồm những qui phạm pháp luật điều chỉnh các quan hệ pháp luật trong lĩnh vực kinh doanh. 1.3.2. Chủ thể của Luật Kinh tế Chủ thể là thuật ngữ để chỉ các cá nhân, tổ chức, theo qui định của pháp luật, tham gia vào các quan hệ pháp luật để thực hiện các nội dung của qui phạm pháp luật tương ứng. Chủ thể của luật kinh doanh là những cá nhân, tổ chức tham gia trong quá trình kinh doanh. - 8 - 1.3.3. Vai trị của Luật Kinh tế trong nền kinh tế thị trường Trong nền kinh tế kế hoạch hĩa tập trung hay nền kinh tế thị trường, luật kinh doanh đều cĩ vai trị quan trọng. Tuy nhiên, tầm quan trọng của luật kinh doanh càng thể hiện rõ nét trong nền kinh tế thị trường qua các vai trị sau : 1.3.3.1. Cụ thể hĩa đường lối, chủ trương của Đảng, Nhà nước thành các qui định áp dụng cho các chủ thể kinh doanh. 1.3.3.2. Tạo hành lang pháp lý an tồn cho các chủ thể kinh doanh. 1.3.3.3. Xác định địa vị pháp lư của các chủ thể kinh doanh. 1.3.3.4. Điều chỉnh các hành vi kinh doanh, giải quyết các tranh chấp trong kinh doanh. 1.4. NHU CẦU CỦA VIỆC KHAI THÁC LUẬT KINH TẾ Qua tìm hiểu thực tế tại các trường Cao đẳng và Đại học trên địa bàn tỉnh Quảng Nam và một số nguồn thơng tin khác thì đối tượng tìm hiểu, nghiên cứu về Luật kinh tế là sinh viên các trường đại học, cao đẳng, các doanh nghiệp, cán bộ tư pháp xã, phường, … 1.5. HIỆN TRẠNG CÁC CƠ SỞ DỮ LIỆU LUẬT TẠI VIỆT NAM Để cĩ cơ sở xây dựng kho dữ liệu, tơi tiến hành khảo sát hiện trạng hệ thống phục vụ tra cứu hiện tại theo 2 nguồn thơng tin, đĩ là nguồn thơng tin trực tiếp từ thư viện nhà trường và qua mạng Google. Kết quả cụ thể như sau: Tiến hành khảo sát thực tế tại thư viện nhà trường kết quả cho thấy: số lượng đầu sách và tài liệu tham khảo liên quan đến hệ thống pháp luật kinh tế của nhà trường cịn nhiều hạn chế và chưa được cập nhật thường xuyên. - 9 - Tìm kiếm thơng tin luật kinh tế trên Internet: các hệ thống hỗ trợ Tra cứu văn bản luật cung cấp các văn bản pháp quy và yêu cầu sinh viên phải nắm rõ các thơng tin về văn bản: số hiệu văn bản, tên văn bản, loại văn bản, ngày ban hành,…điều này cũng gây khĩ khăn đối với sinh viên. KẾT CHƯƠNG 1: Trong chương này chúng tơi trình bày các khái niệm về kho dữ liệu, đặc trưng của kho dữ liệu, kiến trúc kho dữ liệu, các dịng thơng tin của kho dữ liệu, kho dữ liệu chủ đề và khai phá dữ liệu cũng như nhu cầu tra cứu và hiện trạng hệ thống phục vụ tra cứu luật kinh tế, một số hệ thống tra cứu hiện cĩ. Những nội dung trong chương này là cơ sở để thực hiện các chương tiếp theo. CHƯƠNG 2: PHÂN TÍCH THIẾT KẾ HỆ THỐNG 2.1. MƠ TẢ HỆ THỐNG 2.1.1. Yêu cầu đối với hệ thống Từ thực tiễn việc quản lý, lưu trữ dữ liệu đã được nêu ra ở chương 1, việc xây dựng kho dữ liệu Luật kinh tế phục vụ tra cứu thơng tin luật kinh tế phải đảm các yêu cầu sau: - Mềm dẻo trong việc cập nhật dữ liệu: hệ thống phải cho phép cập nhật dữ liệu được thu thập từ nhiều nguồn khác nhau: nhập trực tiếp, lấy từ web, từ file đã cĩ, sách... và cập nhật theo từng thể loại luật. - Kho dữ liệu cĩ thể lưu trữ dữ liệu nhiều định dạng khác nhau. - Cho phép hiển thị thơng tin trên mơi trường Web. - Cho phép tìm kiếm theo từng thể loại hoặc kết hợp nhiều tiêu chí khác nhau. - 10 - 2.1.2. Kiến trúc tổng thể Kiến trúc tổng thể của hệ thống bao gồm những thành phần sau: KHO DỮ LIỆU LUẬT KINH TẾ Tiền xử lý Sưu tập dữ liệu Chuẩn hĩa dữ liệu Sách Ứng dụng khai thác dữ liệu DOC PDF HTML Nhập trực tiếp … Hình 2.1. Kiến trúc tổng thể hệ thống 2.1.3. Mơ hình hoạt động Hình 2.2. Mơ hình hoạt động của hệ thống - 11 - 2.2. THIẾT KẾ CHỨC NĂNG HỆ THỐNG 2.2.1. Các yêu cầu chức năng - Hệ thống phải cho phép thu thập, xử lý dữ liệu và nạp vào kho dữ liệu các tài liệu văn bản luật trong lĩnh vực kinh tế. - Cho phép quản trị các thơng tin thuộc tính của văn bản luật như trích yếu, ngày ban hành, tình trạng hiệu lực, văn bản liên quan, … - Quản trị các thơng tin liên quan như danh sách các cơ quan ban hành (Quốc hội, Chính phủ, Bộ, …), lĩnh vực của văn bản (đầu tư, thuế, xuất nhập khẩu, …), loại văn bản (Luật, Nghị định, Thơng tư, …). - Chức năng quan trọng nhất của hệ thống là cho phép tìm kiếm, khai thác thơng tin về luật kinh tế qua mơi trường internet. Ngồi ra hệ thống cung cấp chức năng tư vấn, giải đáp thắc mắc về luật, giúp cho người dùng cĩ thể gửi các câu hỏi đến hệ thống và cung cấp thơng tin trả lời từ cơ quan/cá nhân cĩ khả năng trả lời. 2.2.2. Phân tích thiết kế hệ thống: 2.2.2.1. Danh sách các actor: Danh sách actor: Bảng 2.1. Danh sách actor STT Tên actor Diễn giải 1 Chuyên viên quản lý kho dữ liệu cĩ chức năng cập nhật thơng tin vào hệ thống, quản lý dữ liệu. 2 Quản trị hệ thống Quản lý các danh mục hệ thống, vận hành, bảo trì CSDL 3 Người sử dụng Tìm kiếm, khai thác thơng tin về các văn bản luật - 12 - Danh sách use case: Bảng 2.2. Danh sách usercase STT Tên use case Diễn giải 1 Quản lý người dùng Cho phép thêm, xĩa, sửa người dùng của hệ thống 2 Quản lý tài liệu Quản lý các tài liệu về Luật kinh tế như giáo trình, … 3 Quản lý văn bản luật Quản lý các văn bản quy phạm pháp luật về kinh tế 4 Quản lý danh mục thể loại văn bản Quản lý thể loại như Luật, Nghị định, thơng tư, … 5 Quản lý lĩnh vực Quản lý lĩnh vực kinh tế như thuế, hải quan, đầu tư, … 6 Quản lý danh mục cơ quan ban hành Quản lý danh mục các cơ quan ban hành như Quốc hội, chính phủ, các Bộ, … 7 Tìm kiếm, khai thác thơng tin Cho phép tìm kiếm văn bản, tài liệu luật kinh tế theo các tiêu chí khác nhau, xem thơng tin chi tiết. 2.2.2.2. Sơ đồ use case: Sơ đồ Use case của hệ thống như sau: - 13 - Hình 2.3. Sơ đồ usecase của hệ thống 2.2.2.3. Đặc tả use case: User case: quản lý văn bản Các tác nhân: quản trị. Pre Condition: người dùng đã đăng nhập thành cơng. Post Condition: Nếu use case thành cơng, thơng tin về văn bản luật sẽ được cập nhật vào cơ sở dữ liệu. Mơ tả: Use case này cho phép người sử dụng (đã là đăng nhập thành cơng) quản lý văn bản: thêm, sửa, xố văn bản, đính kèm file, …. Use case: tìm kiếm khai thác thơng tin Các tác nhân: người dùng. Pre Condition: Khơng cĩ. Post Condition: kết quả tìm kiếm thỏa mãn yêu cầu của người dùng. Mơ tả: Use case này cho phép dùng tìm kiếm các văn bản luật kinh tế theo các tiêu chí khác nhau như nội dung văn bản, khoảng thời gian ban hành, cơ quan ban hành, hình thức, … - 14 - Use case: quản lý người dùng Các tác nhân: quản trị. Pre Condition: quản trị đã đăng nhập thành cơng. Post Condition:. Mơ tả: Use case này cho phép quản trị viên thêm, sửa, xố, tìm kiếm thơng tin về thành viên sử dụng hệ thống. Quản lý trang tin của các thành viên (thêm, sửa, xố trang tin của người sử dụng). Use case: trao đổi, hỏi đáp Các tác nhân: người dùng. Pre Condition: khơng cĩ. Post Condition: xem và gửi câu hỏi. Mơ tả: Use case này cho phép người dùng xem câu hỏi và câu trả lời được đăng trên trang web và gửi câu hỏi. 2.2.2.4. Biểu đồ tuần tự: Ta xây dựng các biểu đồ tuần tự sau: quản lý văn bản, quản lý tài liệu, tìm kiếm và tra cứu văn bản. 2.2.2.5. Biểu đồ hoạt động Ta xây dựng các biểu đồ hoạt động sau : tạo văn bản/tài liệu mới, quản lý các nhĩm danh mục hệ thống, quản lý người dùng. 2.2.2.6. Biểu đồ lớp Biểu đồ lớp của hệ thống - 15 - Hình 2.10. Biểu đồ lớp của hệ thống 2.2.2.7. Thiết kế cơ sở dữ liệu Bảng dữ liệu văn bản pháp luật: Bảng dữ liệu tài liệu: Bảng dữ liệu cơ quan ban hành: Bảng dữ liệu thể loại văn bản: Bảng dữ liệu lĩnh vực: Bảng dữ liệu người dùng: Bảng dữ liệu phân quyền: Bảng trao đổi, hỏi đáp: Mơ hình quan hệ: - 16 - VB_HoiDap HoiDapID HoiDapParentID NguoiGui D iaC hi D ienThoai Email Ngay Gui NoiDungHoi NguoiTraLoi NoiDungTraLoi Ngay TraLoi SoLuotXem IsA pprov ed VB_VanBan V anBanID SoKy Hieu C oQ uanBanHanhID TheLoaiID LinhV ucID TrichYeu NguoiKy Ngay BanHanh Ngay C oHieuLuc Ngay HetH ieuLuc C onHieuLuc F ileD inhKem NguoiDang SoLuotXem VB_CoQuan C oQ uanID TenC oQ uan KhoiID C apID DiaC hi D ienThoai Email VB_LinhVuc LinhV ucID TenLinhV uc IsA ctiv e VB_TheLoai TheLoaiID TenTheLoai Ky Hieu GhiC hu VB_NguoiDung C anBoID Username PhongBanID HoTen C hucV u GhiC hu VB_TaiLieu TaiLieuID TenTaiLieu TacGia NhaXuatBan NamXuatBan HinhA nh MoTa SoLuotXem NguoiDang Hình 2.11. Sơ đồ quan hệ giữa các bảng CSDL 2.3. XÂY DỰNG KHO DỮ LIỆU VỚI MS SQL SERVER 2005 2.3.1. Tổng quan về các thành phần của SQL Server 2005 Hệ quản trị cơ sở dữ liệu Microsoft SQL Server (MSSQL) là một trong những hệ quản trị cơ sở dữ liệu thơng dụng hiện nay. Đây là hệ quản trị cơ sở dữ liệu thường được sử dụng với các hệ thống trung bình, với ưu điểm cĩ các cơng cụ quản lý mạnh mẽ giúp cho việc quản lý và bảo trì hệ thống dễ dàng , hỗ trợ nhiều phương pháp lưu trữ, phân vùng và đánh chỉ mục phục vụ cho việc tối ưu hĩa hiệu năng. Với phiên bản MSSQL 2005 Microsoft đã cĩ những cải tiến đáng kể nâng cao hiệu năng, tính sẵn sàng của hệ thống, khả năng mở rộng và bảo mật. Phiên bản mới này cịn cung cấp nhiều cơng cụ cho người phát triển ứng dụng được tích hợp với bộ Visual Studio do Microsoft cung cấp. Dưới đây là mơ hình về các dịch vụ của SQL server 2005. - 17 - Hình 20.12. Kiến trúc SQL Server 2005 MSSQL 2005 cĩ 4 dịch vụ lớn : Database Engine,Intergration Service, Reporting service, Analysis Services. 2.3.1.1. SQL Server intergration service: SSIS là một thành phần của SQL Server, nĩ được phát triển từ cơng cụ Data Transformation Services của phiên bản SQL Server 7.0, một cơng cụ để thực thi việc chuyển đổi dữ liệu. SSIS là nền tảng cho việc tích hợp dữ liệu , các chức năng của nĩ nhanh và mềm dẻo cho việc phát triển tiến trình ETL cho xây dựng kho dữ liệu , ngồi ra SSIS cịn cung cấp các cơng cụ tự động bảo trì và tự động cập nhật dữ liệu cho cơ sở dữ liệu nhiều chiều và cubes. 2.3.1.2. SQL Server analysis service (SSAS) SSAS là một trong những dịch vụ chính của SQL Server 2005 dùng để xây dựng các chiều và cubes cho DWH, trong phiên bản mới này cịn hỗ trợ một số thuật tốn khai phá dữ liệu điều này cung cấp cho người quản lý cĩ cái nhìn sâu sắc về dữ liệu của họ hơn. SSAS là một phần của nền tảng quản lý doanh nghiệp thơng minh (BI), nĩ khơng chỉ là một - 18 - thành phần của SQL Server, nĩ cịn được sử dụng trên .NET Framework và mơi trường phát triển Visual Studio. 2.3.1.3. SQL Server Reporting Service (SSRS) SSRS là một dịch vụ của SQL Server , nĩ là hệ thống quản lý các báo cáo. Hỗ trợ việc tạo báo cáo, quản lý các báo cáo, và quản lý truy cập thơng qua nền tảng web. 2.3.2. Xây dựng kho dữ liệu trên SQL Server 2005 Mơ hình biểu diễn phương pháp sử dụng các cơng cụ của MSSQL 2005 để xây dựng kho dữ liệu và hệ thống báo cáo cho người dùng: Hình 2.13. Mơ hình xây dựng kho dữ liệu trên SQL Server 2005 KẾT CHƯƠNG 2 Đây là một trong những chương quan trọng của đề tài. Trong chương này trình bày các nội dung: mơ tả hệ thống bao gồm: xác định yêu cầu đối với hệ thống, kiến trúc tổng thể và mơ hình hoạt động của hệ thống; từ hiện trạng hệ thống phục vụ tra cứu và đặc trưng kho dữ liệu ta thiết kế các chức năng và cuối cùng là thiết kế kho dữ liệu. - 19 - CHƯƠNG 3: PHÁT TRIỂN HỆ THỐNG Trong chương này sẽ thực hiện việc chọn Cơ sở dữ liệu, ngơn ngữ phát triển ứng dụng, đề xuất những giải pháp để phát triển ứng dụng và cài đặt ứng dụng. 3.1. CƠNG CỤ PHÁT TRIỂN HỆ THỐNG 3.1.1. Cơng cụ xây dựng kho dữ liệu Ngồi khả năng lưu trữ dữ liệu kích thước lớn, với những ưu điểm như giao diện thân thiện, tốc độ xử lý nhanh, cĩ phiên bản miễn phí là những yếu tố quan trọng để tơi quyết định chọn hệ quản trị CSDL SQL Server 2005 để lưu trữ CSDL. 3.1.2. Ngơn ngữ phát triển ứng dụng Visual Studio.Net là 1 sản phẩm cơng nghệ .NET của Microsoft với nhiều ngơn ngữ lập trình: C++.Net, Visual Basic.Net, ASP.Net, C#, J#, giúp chúng ta cĩ thể dễ dàng tạo ra những giao diện dễ dàng, nhanh chĩng với những cơng cụ hỗ trợ đi kèm. Trong đề tài này tơi chọn cơng nghệ .NET với ngơn ngữ C# để phát triển ứng dụng. 3.2. CÁC BƯỚC TRIỂN KHAI 3.2.1. Nguồn dữ liệu Để nạp dữ liệu vào kho phục vụ cho việc khai thác, sử dụng, tiến hành thu thập dữ liệu về các văn bản, tài liệu luật kinh tế từ các nguồn sau: - Hệ thống file dữ liệu về luật kinh tế sưu tầm được: hệ thống tiến hành phân tích, xử lý hệ thống file sưu tầm được và nạp các thơng tin vào kho dữ liệu. - 20 - - Các văn bản quy phạm pháp luật về kinh tế trên internet. Hệ thống sẽ tự động thu thập thơng tin từ các nguồn internet trên, qua bước kiểm tra xử lý để tránh trùng lặp dữ liệu, sau đĩ nạp vào kho dữ liệu. Mơ hình cụ thể như sau: Hình 3.1. Sơ đồ trích lọc dữ liệu vào hệ thống 3.2.1.1. Trích lọc dữ liệu từ hệ thống file Các bước xử lý và trích lọc nội dung tài liệu từ file word như sau: - Khai báo đối tượng Microsoft.Office.Interop.Word.Document dùng để đọc văn bản Word. - Sử dụng phương thức ActiveWindow.Selection.WholeStory() để đọc nội dung của văn bản. - Khai thác nội dung văn bản qua thuộc tính Content.Text. 3.2.1.2. Thu thập dữ liệu luật kinh tế trên Internet: . Các địa chỉ được lựa chọn để trích rút dữ liệu như sau: - www.chinhphu.vn (trang web của Chính phủ). - www.mof.gov.vn (trang web của Bộ Tài chính) - 21 - - www.mpi.gov.vn (trang web của Bộ Kế hoạch và Đầu tư) - www.thuvienphapluat.vn. - www.luatvietnam.vn - www.vietlaw.vn 3.2.2. Xây dựng kho dữ liệu Kho dữ liệu luật kinh tế được thiết kế theo lược đồ hình sao, bao gồm các bảng chiều (dimension table) và bảng sự kiện (fact table), được xây dựng từ nguồn dữ liệu trong CSDL quan hệ được xây dựng ở trên. Hình 3.5. Lược đồ kho dữ liệu luật kinh tế 3.2.3. Xây dựng Cổng thơng tin tra cứu về luật kinh tế Hệ thống tra cứu luật kinh tế được xây dựng dựa trên nền tảng DotnetNuke. Đây là hệ thống cổng thơng tin (portal) mã nguồn mở được sử dụng phổ biến nhất hiện nay và chạy trên mơi trường .NET của Microsoft, do đĩ cĩ thể tương thích và kết nối dễ dàng đến kho dữ liệu Luật kinh tế được xây dựng trên SQL Server 2005. - 22 - 3.3. THỬ NGHIỆM HỆ THỐNG 3.3.1. Yêu cầu hệ thống Hệ thống kho dữ liệu và website tra cứu thơng tin về luật kinh tế được cài trên máy chủ cĩ cấu hình tối thiểu: CPU Intel Core 2 Duo, 3 GHz, RAM 1G, Dung lượng ổ đĩa trống 500MB. 3.3.2. Cài đặt hệ thống: 3.3.2.1. Cài đặt CSDL quan hệ Quá trình cài đặt CSDL như sau: - File CSDL: VanBanQPPL.mdf (file data) và VanBanQPPL_log.ldf (file log). - Sử dụng cơng cụ Microsoft SQL Server management studio 2005 để kết nối đến Database Engine và tiến hành attach 02 file CSDL trên vào. 3.3.2.2. Cài đặt lược đồ kho dữ liệu - File chứa lược đồ: LuatKinhTe.abf. - Sử dụng cơng cụ Microsoft SQL Server management studio 2005 kết nối đến Analysis Services và tiến hành restore file trên để khơi phục kho dữ liệu. 3.3.2.3. Cài đặt Cổng thơng tin Luật kinh tế Cổng thơng tin Luật kinh tế là một ứng dụng web trên nền .NET framework, do đĩ được cài đặt trên web server là IIS (Internet Information Services). Sau khi khai báo website mới trong IIS, tiến hành sửa file config để khai báo cáo tham số kết nối đến kho dữ liệu. - 23 - 3.3.3. Kết quả triển khai Sử dụng trình duyệt web (IE, Firefox) gõ địa chỉ cài đặt của chương trình sẽ xuất hiện trang chủ như sau: Hình 3.9. Giao diện Cổng thơng tin Luật kinh tế KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Với thành tựu và tốc độ phát triển của Internet như ngày nay thì việc ứng dụng nĩ vào lĩnh vực giáo dục là tất yếu. Việc đề xuất xây dựng kho dữ liệu Luật kinh tế nhằm phục vụ tra cứu, tìm hiểu cho sinh viên thực sự rất cĩ ý nghĩa. - 24 - Hướng phát triển của đề tài: Đề tài đã xây dựng được kho dữ liệu và ứng dụng để phục vụ việc khai thác thơng tin luật kinh tế cho người dùng, tuy nhiên do số lượng các văn bản là rất lớn với phạm vi điều chỉnh rộng, bao gồm nhiều lĩnh vực khác nhau về kinh tế, vì thế cần cĩ những phân tích mang tính chuyên sâu hơn cho người dùng, ví dụ phân nhĩm các văn bản, tài liệu cĩ liên quan, …. Do đĩ, đề tài cần ứng dụng các kỹ thuật xử lý ngơn ngữ và khai phá dữ liệu để phát triển ứng dụng tìm kiếm văn bản luật thơng minh hơn, đem lại thuận tiện cho người dùng. Trên cơ sở kho dữ liệu thu thập được, đề tài cĩ thể ứng dụng các kỹ thuật của web ngữ nghĩa (semantic web) để xây dựng cơ sở dữ liệu tri thức về luật kinh tế nhằm hỗ trợ tư vấn người dùng một cách tự động, giúp người dùng cĩ thể tìm kiếm các điều khoản trong một văn bản luật một cách chính xác hơn. Do điều kiện thời gian hạn hẹp và kinh nghiệm của bản thân cịn nhiều hạn chế nên chắc chắn khơng tránh khỏi những thiếu sĩt. Tơi thành thật mong nhận được các ý kiến đĩng gĩp của các Thầy trong Hội đồng, các bạn và đồng nghiệp để ứng dụng ngày càng hồn thiện và phục tốt nhất nhu cầu tra cứu thơng tin.

Các file đính kèm theo tài liệu này:

  • pdftomtat_63_6147.pdf
Luận văn liên quan