Đề tài đã xây dựng được kho dữ liệu và ứng dụng để phục vụ việc khai 
thác thông tin luật kinh tếcho người dùng, tuy nhiên do số lượng các văn 
bản là rất lớn với phạm vi điều chỉnh rộng, bao gồm nhiều lĩnh vực khác 
nhau về kinh tế, vì thế cần có những phân tích mang tính chuyên sâu hơn 
cho người dùng, ví dụphân nhóm các văn bản, tài liệu có liên quan, . 
Do đó, đề tài cần ứng dụng các kỹ thuật xử lý ngôn ngữ và khai phá dữ
liệu để phát triển ứng dụng tìm kiếm văn bản luật thông minh hơn, đem lại 
thuận tiện cho người dùng. 
Trên cơ sở kho dữ liệu thu thập được, đề tài có thể ứng dụng các kỹ
thuật của web ngữ nghĩa (semantic web) để xây dựng cơ sở dữ liệu tri 
thức về luật kinh tế nhằm hỗ trợ tư vấn người dùng một cách tự động, giúp 
người dùng có thể tìm kiếm các điều khoản trong một văn bản luật một 
cách chính xác hơn.
                
              
                                            
                                
            
 
            
                 13 trang
13 trang | 
Chia sẻ: lylyngoc | Lượt xem: 2623 | Lượt tải: 2 
              
            Bạn đang xem nội dung tài liệu Xây dựng kho dữ liệu luật kinh tế để phục vụ việc học tập của sinh viên, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
- 1 - 
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
ĐẠI HỌC ĐÀ NẴNG 
HUỲNH THỊ THANH SỰ 
XÂY DỰNG KHO DỮ LIỆU LUẬT KINH TẾ 
ĐỂ PHỤC VỤ VIỆC HỌC TẬP CỦA SINH VIÊN 
Chuyên ngành: KHOA HỌC MÁY TÍNH 
Mã số: 60.48.01 
TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT 
Đà Nẵng - Năm 2011 
- 2 - 
Cơng trình được hồn thành tại 
ĐẠI HỌC ĐÀ NẴNG 
 Người hướng dẫn khoa học: PGS.TS. Võ Trung Hùng 
 Phản biện 1: TS. Huỳnh Hữu Hưng 
 Phản biện 2: TS. Trương Cơng Tuấn 
Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp 
thạc sĩ kỹ thuật họp tại Đại học Đà Nẵng vào ngày 16 tháng 10 
năm 2011 
 Cĩ thể tìm hiểu luận văn tại: 
 - Trung tâm Thơng tin-Học liệu, Đại học Đà Nẵng 
 - Trung tâm Học liệu, Đại học Đà Nẵng 
- 1 - 
MỞ ĐẦU 
1. Lý do chọn đề tài 
Với tốc độ phát triển cơng nghệ thơng tin hiện nay, việc quản lý 
giáo dục trở nên dễ dàng, nhanh chĩng và tiện lợi hơn nhờ sự giúp sức các 
ứng dụng cơng nghệ thơng tin làm phương tiện học tập, tạo nên mơi 
trường học tập với thơng tin đa dạng trong việc tra cứu tài liệu, tạo nên 
tính tự học, tự nghiên cứu cho người học. 
Trường trực thuộc UBND tỉnh Quảng Nam và chịu sự quản lý nhà 
nước về giáo dục của Bộ Giáo dục và Đào tạo. Tổng số sinh viên của 
trường đang đào tạo là 8.587 sinh viên. Trong đĩ sinh viên ngành kế tốn 
và quản trị kinh doanh là 3.250 sinh viên. Trong chương trình đào tạo 
dành cho chuyên ngành kế tốn và quản trị kinh doanh, sinh viên được 
trang bị các kiến thức cơ bản về luật doanh nghiệp năm 2005, luật hợp tác 
xã năm 2003, luật phá sản năm 2004, luật thương mại năm 2005. Đây là 
những kiến thức hết sức cần thiết cho những người hoạt động trong lĩnh 
vực kế tốn và quản trị kinh doanh bởi vì nĩ sẽ cung cấp cho họ những 
hiểu biết nhất định về quy chế thành lập và hoạt động của các loại hình 
doanh nghiệp, hợp tác xã đang tồn tại và phát triển trong nền kinh tế thị 
trường của Việt Nam hiện nay. 
Với một lượng thơng tin cần phải tiếp cận nhiều như vậy địi hỏi 
nhà trường phải cĩ một hệ thống tài liệu liên quan đến mơn học một cách 
phong phú, đa dạng và cập nhật. Nhà trường chỉ mới dừng lại ở việc trang 
bị các văn bản pháp luật hiện hành cĩ liên quan mà chưa quan tâm đến 
việc xây dựng một hệ thống các loại sách tham khảo cần thiết để sinh viên 
nghiên cứu. Bên cạnh đĩ việc tra cứu hệ thống pháp luật thơng qua mạng 
Internet cịn gặp nhiều khĩ khăn do dữ liệu khơng tập trung, chưa nhất 
quán. 
Với những lý do ở trên, tơi là người đang cơng tác tại trường Cao 
đẳng Kinh tế - Kỹ thuật Quảng Nam và được sự đồng ý của PGS.TS. Võ 
- 2 - 
Trung Hùng, tơi chọn đề tài “Xây dựng kho dữ liệu Luật kinh tế để phục 
vụ việc học tập của sinh viên” và mục đích đầu tiên là sử dụng tại Trường 
Cao đẳng Kinh tế Kỹ thuật Quảng Nam. 
2. Mục tiêu của đề tài 
Đề tài này nhằm mục đích xây dựng kho dữ liệu phục vụ việc tra 
cứu tài liệu về Luật kinh tế nhanh chĩng, chính xác cho sinh viên, giáo 
viên trong nhà trường thơng qua mạng Internet. Nâng cao hiệu quả ứng 
dụng cơng nghệ thơng tin cho sinh viên và giáo viên trong nhà trường. Để 
đáp ứng mục tiêu đã nêu, đề tài cần giải quyết những vấn đề chính sau: 
tìm hiểu hiện trạng hệ thống tra cứu Luật và các vấn đề liên quan đến hệ 
thống tra cứu; tìm hiểu, thu thập dữ liệu về Luật kinh tế để từ đĩ thiết kế 
kho dữ liệu về Luật kinh tế; nghiên cứu và lựa chọn cơng cụ để xây dựng 
hệ thống cho phép người sử dụng cập nhật, tra cứu trực tuyến hiệu quả 
nhất. 
3. Đối tượng và phạm vi nghiên cứu 
 Đối tượng nghiên cứu của đề tài bao gồm các tài liệu điện tử liên 
quan đến Luật kinh tế và các ngành học liên quan đến Luật kinh tế của 
trường; kho dữ liệu và khai phá dữ liệu; các phần mềm mã nguồn mở, các 
hệ cơ sở dữ liệu liên quan đến đề tài. 
Bên cạnh đĩ Xây dựng ứng dụng với ngơn ngữ lập trình C# và hệ 
Cơ sở dữ liệu SQL Server 2005. 
4. Nhiệm vụ nghiên cứu 
- Tìm hiểu các ngành học về Luật kinh tế của nhà trường. 
- Tìm hiểu các nội dung, văn bản về Luật kinh tế; và các nội dung, 
văn bản luật liên quan. 
- Phân tích và thiết kế kho dữ liệu về luật kinh tế. 
- Tìm hiểu ngơn ngữ lập trình, cơng cụ để xây dựng kho dữ liệu để 
xây dựng Cổng thơng tin về luật kinh tế phục vụ tìm kiếm, khai thác thơng 
tin về luật kinh tế. 
- 3 - 
- Thu thập dữ liệu về luật kinh tế để nạp vào kho dữ liệu. 
- Đánh giá kết quả ứng dụng hệ thống trong Nhà trường. 
5. Phương pháp nghiên cứu 
- Phương pháp nghiên cứu lý luận: Các nội dung văn bản luật 
kinh tế, các nội dung văn bản luật liên quan. Phân tích các nội dung văn 
bản để xây dựng kho dữ liệu. 
- Phương pháp nghiên cứu thực tiễn: Khảo sát nhu cầu thực tế 
của sinh viên, giáo viên tra cứu, tìm kiếm tài liệu; Tìm hiểu các kho dữ 
liệu hiện cĩ. 
- Phương pháp nghiên cứu tài liệu: Tìm hiểu ngơn ngữ lập trình, 
hệ quản trị Cơ sở dữ liệu; Xây dựng ứng dụng. 
6. Bố cục của luận văn 
Luận văn bao gồm các phần như sau: 
Mở đầu 
Chương 1: Nêu tổng quan về kho dữ liệu dữ liệu, khai phá dữ liệu, 
khái niệm về luật kinh tế, nhu cầu khai thác luật kinh tế, hiện trạng hệ 
thống tra cứu hiện cĩ. 
Chương 2: Trình bày yêu cầu đối với hệ thống, kiến trúc tổng thể 
và mơ hình hoạt động của hệ thống, thiết kế kho dữ liệu và chức năng của 
hệ thống. 
Chương 3: Việc lựa chọn cơng cụ để phát triển hệ thống, xác định 
các giải pháp phát triển hệ thống và đồng bộ dữ liệu, xây dựng các module 
xử lý. Kết luận của đề tài về các mặt làm được, khả năng ứng dụng, những 
ưu và nhược điểm và hướng phát triển trong tương lai. 
Kết luận của đề tài về các mặt làm được, khả năng ứng dụng, những 
ưu và nhược điểm và hướng phát triển trong tương lai. 
- 4 - 
CHƯƠNG 1 
NGHIÊN CỨU TỔNG QUAN 
1.1. KHO DỮ LIỆU 
1.1.1. Kho dữ liệu và đặc trưng của kho dữ liệu 
1.1.1.1. Định nghĩa kho dữ liệu 
Định nghĩa do W.H. Inman đề xướng: Kho dữ liệu (DWH) được 
hiểu là một tập hợp các dữ liệu tương đối ổn định (khơng hay thay đổi), 
cập nhật theo thời gian, được tích hợp theo hướng chủ đề nhằm hỗ trợ quá 
trình tạo quyết định về mặt quản lý. 
1.1.1.2. Đặc trưng kho dữ liệu 
Đặc trưng của kho dữ liệu: tính tích hợp, tính gắn với thời gian , tính 
lịch sử, tính chỉ đọc, tính khơng biến động và tính dữ liệu tổng hợp và chi 
tiết. 
1.1.2. Kiến trúc kho dữ liệu 
Dữ liệu tác nghiệp 
(nguồn 1) 
Dữ liệu tác nghiệp 
(nguồn 2) 
Dữ liệu tác nghiệp 
(nguồn 3) 
Bộ quản lí kho dữ 
liệu 
Các cơng cụ 
truy vấn báo 
cáo, phát 
triển ứng 
dụng và EIS 
Các cơng cụ 
xử lý phân 
tích trực 
truyến 
Các cơng cụ 
khai phá dữ 
liệu 
Các cơng cụ truy cập 
dữ liệu của người 
dùng đầu cuối 
Dữ liệu lưu trữ và sao 
lưu dự phịng 
Bộ quản lí kho dữ 
liệu 
Bộ 
quản 
lí truy 
vấn 
Dữ liệu chi tiết 
Dữ liệu tổng hợp 
ở mức thấp 
Dữ liệu tổng 
hợp ở mức cao 
Bộ 
quản lí 
nạp dữ 
liệu Siêu dữ liệu 
1.1.3. Các dịng thơng tin của kho dữ liệu 
Việc xây dựng và khai thác kho dữ liệu tập trung vào quản lý năm 
luồng thơng tin chính cĩ tên là: luồng vào (Inflow), luồng lên (Upflow), 
- 5 - 
luồng xuống (Downflow), luồng ra (Outflow) và luồng siêu dữ liệu 
(Metaflow). 
1.1.4. Kho dữ liệu cục bộ 
Kho dữ liệu cục bộ (Data Mart - DM) là CSDL cĩ những đặc điểm 
giống với kho dữ liệu nhưng với quy mơ nhỏ hơn và lưu trữ dữ liệu về 
một lĩnh vực, một chuyên ngành. 
1.1.5. Mơ hình logic của kho dữ liệu 
1.1.5.1. Lược đồ hình sao 
Trong mơ hình dữ liệu này, phạm vi dữ liệu được tổ chức trong 
các bảng chiều, mỗi chiều ứng với một đặc trưng của dữ liệu (khách hàng, 
sản phẩm , bán hàng, thời gian…), các bảng sự kiện biểu diễn các sự kiện 
xảy ra và các thơng tin chi tiết về các sự kiện đĩ. 
1.1.5.2. Lược đồ hình bơng tuyết 
Đây là mơ hình tương tự mơ hình sao tuy nhiên nĩ mở rộng hơn 
mơ hình sao, trong mơ hình này một chiều của dữ liệu cĩ thể gồm nhiều 
bảng, và trong đĩ cĩ 1 bảng sự kiện, bảng sự kiện này chính là một chiều 
trong mơ hình lớn hơn. 
1.1.5.3. Mơ hình dữ liệu nhiều chiều 
Đây là mơ hình chức dữ liệu xoay quanh các chủ đề nhằm trả lời 
một cách nhanh nhất các câu hỏi trong nghiệp vụ của người quản lý. Cĩ 
thể nhìn dữ liệu được tổ chức như là một khối, trong đĩ mỗi chiều là một 
chủ đề trong nghiệp vụ . 
1.1.6. Ứng dụng của kho dữ liệu 
Ngày nay, kho dữ liệu được triển khai trong các doanh nghiệp với 
nhiều mục đích khác nhau như tạo các báo cáo tổng hợp, tích hợp dữ liệu, 
- 6 - 
quản trị doanh nghiệp thơng minh (Business Intelligence), quản lý quan hệ 
khách hàng, khai phá dữ liệu. 
1.1.7. Xu hướng phát triển của kho dữ liệu 
Trong tương lai xu hướng phát triển của kho dữ liệu bao gồm : 
quản lý dữ liệu phi cấu trúc, tìm kiếm dữ liêu, kiến trúc hướng dịch vụ và 
kho dữ liệu thời gian thực. 
1.2. KHAI PHÁ DỮ LIỆU 
1.2.1. Khái niệm 
Khai phá dữ liệu (Data mining) ra đời vào những năm cuối của 
thập kỷ 80. Nĩ bao hàm một loạt các kỹ thuật nhằm phát hiện ra các thơng 
tin cĩ giá trị tiềm ẩn trong các tập dữ liệu lớn (các kho dữ liệu). Về bản 
chất, khai phá dữ liệu liên quan đến việc phân tích các dữ liệu và sử dụng 
các kỹ thuật để tìm ra các mẫu hình cĩ tính chính quy (regularities) trong 
tập dữ liệu. 
1.2.2. Mục tiêu của khai phá dữ liệu 
Dữ liệu của chúng ta sau khi xử lý trực tuyến phục vụ cho một mục 
đích nào đĩ được lưu lại trong kho dữ liệu và theo ngày tháng khối lượng 
dữ liệu được lưu trữ ngày càng lớn. Trong khối lượng dữ liệu to lớn này 
cịn rất nhiều thơng tin cĩ ích mang tính tổng quát, thơng tin cĩ tính qui 
luật vẫn đang cịn tiềm ẩn mà chúng ta chưa biết. Các cơng cụ xử lý phân 
tích trực tuyến (On-Line Analytical Processing - OLAP) là cần thiết để 
phân tích dữ liệu, nhưng chưa đủ để rút thơng tin từ một khối lượng dữ 
liệu khổng lồ như vậy. Từ khối lượng dữ liệu rất lớn thì cần phải cĩ những 
cơng cụ tự động rút các thơng tin và kiến thức cĩ ích. Một hướng tiếp cận 
mới cĩ khả năng giúp các cơng ty khai phá các thơng tin cĩ nhiều ý nghĩa 
từ các tập dữ liệu lớn (databases, data warehouses, data repositories ) đĩ 
là khai phá dữ liệu (Data Mining). 
- 7 - 
1.2.3. Các bước thực hiện khai phá dữ liệu 
Hình 1.5. Sơ đồ mơ tả quá trình khai phá dữ liệu 
1.3. LUẬT KINH TẾ 
1.3.1. Khái niệm Luật Kinh tế 
Luật kinh tế (hay luật kinh doanh) là một ngành luật trong hệ 
thống pháp luật Việt Nam, gồm tổng thể các qui phạm pháp luật do Nhà 
nước ban hành để điều chỉnh các quan hệ kinh tế phát sinh trong quá tŕnh 
quản lư kinh tế và sản xuất kinh doanh giữa các cơ quan quản lư Nhà 
nước về kinh tế với các tổ chức kinh tế hoặc giữa các tổ chức kinh tế với 
nhau hay nĩi khác đi luật kinh tế (hay luật kinh doanh) gồm những qui 
phạm pháp luật điều chỉnh các quan hệ pháp luật trong lĩnh vực kinh 
doanh. 
1.3.2. Chủ thể của Luật Kinh tế 
Chủ thể là thuật ngữ để chỉ các cá nhân, tổ chức, theo qui định của 
pháp luật, tham gia vào các quan hệ pháp luật để thực hiện các nội dung 
của qui phạm pháp luật tương ứng. 
Chủ thể của luật kinh doanh là những cá nhân, tổ chức tham gia trong 
quá trình kinh doanh. 
- 8 - 
1.3.3. Vai trị của Luật Kinh tế trong nền kinh tế thị trường 
Trong nền kinh tế kế hoạch hĩa tập trung hay nền kinh tế thị trường, 
luật kinh doanh đều cĩ vai trị quan trọng. Tuy nhiên, tầm quan trọng của 
luật kinh doanh càng thể hiện rõ nét trong nền kinh tế thị trường qua các 
vai trị sau : 
1.3.3.1. Cụ thể hĩa đường lối, chủ trương của Đảng, Nhà nước thành các 
qui định áp dụng cho các chủ thể kinh doanh. 
1.3.3.2. Tạo hành lang pháp lý an tồn cho các chủ thể kinh doanh. 
1.3.3.3. Xác định địa vị pháp lư của các chủ thể kinh doanh. 
1.3.3.4. Điều chỉnh các hành vi kinh doanh, giải quyết các tranh chấp 
trong kinh doanh. 
1.4. NHU CẦU CỦA VIỆC KHAI THÁC LUẬT KINH TẾ 
Qua tìm hiểu thực tế tại các trường Cao đẳng và Đại học trên địa 
bàn tỉnh Quảng Nam và một số nguồn thơng tin khác thì đối tượng tìm 
hiểu, nghiên cứu về Luật kinh tế là sinh viên các trường đại học, cao đẳng, 
các doanh nghiệp, cán bộ tư pháp xã, phường, … 
1.5. HIỆN TRẠNG CÁC CƠ SỞ DỮ LIỆU LUẬT TẠI VIỆT NAM 
Để cĩ cơ sở xây dựng kho dữ liệu, tơi tiến hành khảo sát hiện trạng 
hệ thống phục vụ tra cứu hiện tại theo 2 nguồn thơng tin, đĩ là nguồn 
thơng tin trực tiếp từ thư viện nhà trường và qua mạng Google. Kết quả cụ 
thể như sau: 
Tiến hành khảo sát thực tế tại thư viện nhà trường kết quả cho thấy: 
số lượng đầu sách và tài liệu tham khảo liên quan đến hệ thống pháp luật 
kinh tế của nhà trường cịn nhiều hạn chế và chưa được cập nhật thường 
xuyên. 
- 9 - 
Tìm kiếm thơng tin luật kinh tế trên Internet: các hệ thống hỗ trợ Tra 
cứu văn bản luật cung cấp các văn bản pháp quy và yêu cầu sinh viên phải 
nắm rõ các thơng tin về văn bản: số hiệu văn bản, tên văn bản, loại văn 
bản, ngày ban hành,…điều này cũng gây khĩ khăn đối với sinh viên. 
KẾT CHƯƠNG 1: 
Trong chương này chúng tơi trình bày các khái niệm về kho dữ 
liệu, đặc trưng của kho dữ liệu, kiến trúc kho dữ liệu, các dịng thơng tin 
của kho dữ liệu, kho dữ liệu chủ đề và khai phá dữ liệu cũng như nhu cầu 
tra cứu và hiện trạng hệ thống phục vụ tra cứu luật kinh tế, một số hệ 
thống tra cứu hiện cĩ. Những nội dung trong chương này là cơ sở để thực 
hiện các chương tiếp theo. 
CHƯƠNG 2: PHÂN TÍCH THIẾT KẾ HỆ THỐNG 
2.1. MƠ TẢ HỆ THỐNG 
2.1.1. Yêu cầu đối với hệ thống 
Từ thực tiễn việc quản lý, lưu trữ dữ liệu đã được nêu ra ở chương 1, 
việc xây dựng kho dữ liệu Luật kinh tế phục vụ tra cứu thơng tin luật kinh 
tế phải đảm các yêu cầu sau: 
- Mềm dẻo trong việc cập nhật dữ liệu: hệ thống phải cho phép cập 
nhật dữ liệu được thu thập từ nhiều nguồn khác nhau: nhập trực tiếp, lấy 
từ web, từ file đã cĩ, sách... và cập nhật theo từng thể loại luật. 
- Kho dữ liệu cĩ thể lưu trữ dữ liệu nhiều định dạng khác nhau. 
- Cho phép hiển thị thơng tin trên mơi trường Web. 
- Cho phép tìm kiếm theo từng thể loại hoặc kết hợp nhiều tiêu chí 
khác nhau. 
- 10 - 
2.1.2. Kiến trúc tổng thể 
Kiến trúc tổng thể của hệ thống bao gồm những thành phần sau: 
KHO 
DỮ 
LIỆU 
LUẬT 
KINH 
TẾ 
Tiền xử lý Sưu tập dữ liệu 
Chuẩn hĩa 
dữ liệu 
Sách 
Ứng 
dụng 
khai 
thác dữ 
liệu 
 DOC 
PDF 
HTML 
Nhập trực 
tiếp 
… 
Hình 2.1. Kiến trúc tổng thể hệ thống 
2.1.3. Mơ hình hoạt động 
Hình 2.2. Mơ hình hoạt động của hệ thống 
- 11 - 
2.2. THIẾT KẾ CHỨC NĂNG HỆ THỐNG 
2.2.1. Các yêu cầu chức năng 
- Hệ thống phải cho phép thu thập, xử lý dữ liệu và nạp vào kho dữ 
liệu các tài liệu văn bản luật trong lĩnh vực kinh tế. 
- Cho phép quản trị các thơng tin thuộc tính của văn bản luật như trích 
yếu, ngày ban hành, tình trạng hiệu lực, văn bản liên quan, … 
- Quản trị các thơng tin liên quan như danh sách các cơ quan ban 
hành (Quốc hội, Chính phủ, Bộ, …), lĩnh vực của văn bản (đầu tư, thuế, 
xuất nhập khẩu, …), loại văn bản (Luật, Nghị định, Thơng tư, …). 
- Chức năng quan trọng nhất của hệ thống là cho phép tìm kiếm, khai 
thác thơng tin về luật kinh tế qua mơi trường internet. 
Ngồi ra hệ thống cung cấp chức năng tư vấn, giải đáp thắc mắc về 
luật, giúp cho người dùng cĩ thể gửi các câu hỏi đến hệ thống và cung cấp 
thơng tin trả lời từ cơ quan/cá nhân cĩ khả năng trả lời. 
2.2.2. Phân tích thiết kế hệ thống: 
2.2.2.1. Danh sách các actor: 
Danh sách actor: 
Bảng 2.1. Danh sách actor 
STT Tên actor Diễn giải 
1 
Chuyên viên quản lý kho 
dữ liệu 
cĩ chức năng cập nhật thơng tin 
vào hệ thống, quản lý dữ liệu. 
2 
Quản trị hệ thống Quản lý các danh mục hệ thống, 
vận hành, bảo trì CSDL 
3 
Người sử dụng Tìm kiếm, khai thác thơng tin về 
các văn bản luật 
- 12 - 
Danh sách use case: 
Bảng 2.2. Danh sách usercase 
STT Tên use case Diễn giải 
1 Quản lý người dùng Cho phép thêm, xĩa, sửa người 
dùng của hệ thống 
2 Quản lý tài liệu Quản lý các tài liệu về Luật kinh 
tế như giáo trình, … 
3 Quản lý văn bản luật Quản lý các văn bản quy phạm 
pháp luật về kinh tế 
4 
Quản lý danh mục 
thể loại văn bản 
Quản lý thể loại như Luật, Nghị 
định, thơng tư, … 
5 Quản lý lĩnh vực Quản lý lĩnh vực kinh tế như 
thuế, hải quan, đầu tư, … 
6 
Quản lý danh mục cơ 
quan ban hành 
Quản lý danh mục các cơ quan 
ban hành như Quốc hội, chính 
phủ, các Bộ, … 
7 
Tìm kiếm, khai thác 
thơng tin 
Cho phép tìm kiếm văn bản, tài 
liệu luật kinh tế theo các tiêu chí 
khác nhau, xem thơng tin chi 
tiết. 
2.2.2.2. Sơ đồ use case: 
Sơ đồ Use case của hệ thống như sau: 
- 13 - 
Hình 2.3. Sơ đồ usecase của hệ thống 
2.2.2.3. Đặc tả use case: 
User case: quản lý văn bản 
Các tác nhân: quản trị. 
Pre Condition: người dùng đã đăng nhập thành cơng. 
Post Condition: Nếu use case thành cơng, thơng tin về văn bản luật sẽ 
được cập nhật vào cơ sở dữ liệu. 
Mơ tả: Use case này cho phép người sử dụng (đã là đăng nhập thành 
cơng) quản lý văn bản: thêm, sửa, xố văn bản, đính kèm file, …. 
Use case: tìm kiếm khai thác thơng tin 
Các tác nhân: người dùng. 
Pre Condition: Khơng cĩ. 
Post Condition: kết quả tìm kiếm thỏa mãn yêu cầu của người dùng. 
Mơ tả: Use case này cho phép dùng tìm kiếm các văn bản luật kinh tế 
theo các tiêu chí khác nhau như nội dung văn bản, khoảng thời gian ban 
hành, cơ quan ban hành, hình thức, … 
- 14 - 
Use case: quản lý người dùng 
Các tác nhân: quản trị. 
Pre Condition: quản trị đã đăng nhập thành cơng. 
Post Condition:. 
Mơ tả: Use case này cho phép quản trị viên thêm, sửa, xố, tìm kiếm 
thơng tin về thành viên sử dụng hệ thống. Quản lý trang tin của các thành 
viên (thêm, sửa, xố trang tin của người sử dụng). 
Use case: trao đổi, hỏi đáp 
Các tác nhân: người dùng. 
Pre Condition: khơng cĩ. 
Post Condition: xem và gửi câu hỏi. 
Mơ tả: Use case này cho phép người dùng xem câu hỏi và câu trả lời 
được đăng trên trang web và gửi câu hỏi. 
2.2.2.4. Biểu đồ tuần tự: 
Ta xây dựng các biểu đồ tuần tự sau: quản lý văn bản, quản lý tài 
liệu, tìm kiếm và tra cứu văn bản. 
2.2.2.5. Biểu đồ hoạt động 
Ta xây dựng các biểu đồ hoạt động sau : tạo văn bản/tài liệu mới, 
quản lý các nhĩm danh mục hệ thống, quản lý người dùng. 
2.2.2.6. Biểu đồ lớp 
 Biểu đồ lớp của hệ thống 
- 15 - 
Hình 2.10. Biểu đồ lớp của hệ thống 
2.2.2.7. Thiết kế cơ sở dữ liệu 
Bảng dữ liệu văn bản pháp luật: 
Bảng dữ liệu tài liệu: 
Bảng dữ liệu cơ quan ban hành: 
Bảng dữ liệu thể loại văn bản: 
Bảng dữ liệu lĩnh vực: 
Bảng dữ liệu người dùng: 
Bảng dữ liệu phân quyền: 
Bảng trao đổi, hỏi đáp: 
Mơ hình quan hệ: 
- 16 - 
VB_HoiDap
HoiDapID
HoiDapParentID
NguoiGui
D iaC hi
D ienThoai
Email
Ngay Gui
NoiDungHoi
NguoiTraLoi
NoiDungTraLoi
Ngay TraLoi
SoLuotXem
IsA pprov ed
VB_VanBan
V anBanID
SoKy Hieu
C oQ uanBanHanhID
TheLoaiID
LinhV ucID
TrichYeu
NguoiKy
Ngay BanHanh
Ngay C oHieuLuc
Ngay HetH ieuLuc
C onHieuLuc
F ileD inhKem
NguoiDang
SoLuotXem
VB_CoQuan
C oQ uanID
TenC oQ uan
KhoiID
C apID
DiaC hi
D ienThoai
Email
VB_LinhVuc
LinhV ucID
TenLinhV uc
IsA ctiv e
VB_TheLoai
TheLoaiID
TenTheLoai
Ky Hieu
GhiC hu
VB_NguoiDung
C anBoID
Username
PhongBanID
HoTen
C hucV u
GhiC hu
VB_TaiLieu
TaiLieuID
TenTaiLieu
TacGia
NhaXuatBan
NamXuatBan
HinhA nh
MoTa
SoLuotXem
NguoiDang
Hình 2.11. Sơ đồ quan hệ giữa các bảng CSDL 
2.3. XÂY DỰNG KHO DỮ LIỆU VỚI MS SQL SERVER 2005 
2.3.1. Tổng quan về các thành phần của SQL Server 2005 
Hệ quản trị cơ sở dữ liệu Microsoft SQL Server (MSSQL) là một 
trong những hệ quản trị cơ sở dữ liệu thơng dụng hiện nay. Đây là hệ 
quản trị cơ sở dữ liệu thường được sử dụng với các hệ thống trung bình, 
với ưu điểm cĩ các cơng cụ quản lý mạnh mẽ giúp cho việc quản lý và 
bảo trì hệ thống dễ dàng , hỗ trợ nhiều phương pháp lưu trữ, phân vùng và 
đánh chỉ mục phục vụ cho việc tối ưu hĩa hiệu năng. Với phiên bản 
MSSQL 2005 Microsoft đã cĩ những cải tiến đáng kể nâng cao hiệu 
năng, tính sẵn sàng của hệ thống, khả năng mở rộng và bảo mật. Phiên bản 
mới này cịn cung cấp nhiều cơng cụ cho người phát triển ứng dụng được 
tích hợp với bộ Visual Studio do Microsoft cung cấp. Dưới đây là mơ hình 
về các dịch vụ của SQL server 2005. 
- 17 - 
Hình 20.12. Kiến trúc SQL Server 2005 
MSSQL 2005 cĩ 4 dịch vụ lớn : Database Engine,Intergration 
Service, Reporting service, Analysis Services. 
2.3.1.1. SQL Server intergration service: 
SSIS là một thành phần của SQL Server, nĩ được phát triển từ cơng 
cụ Data Transformation Services của phiên bản SQL Server 7.0, một cơng 
cụ để thực thi việc chuyển đổi dữ liệu. SSIS là nền tảng cho việc tích hợp 
dữ liệu , các chức năng của nĩ nhanh và mềm dẻo cho việc phát triển tiến 
trình ETL cho xây dựng kho dữ liệu , ngồi ra SSIS cịn cung cấp các 
cơng cụ tự động bảo trì và tự động cập nhật dữ liệu cho cơ sở dữ liệu 
nhiều chiều và cubes. 
2.3.1.2. SQL Server analysis service (SSAS) 
SSAS là một trong những dịch vụ chính của SQL Server 2005 dùng 
để xây dựng các chiều và cubes cho DWH, trong phiên bản mới này cịn 
hỗ trợ một số thuật tốn khai phá dữ liệu điều này cung cấp cho người 
quản lý cĩ cái nhìn sâu sắc về dữ liệu của họ hơn. SSAS là một phần của 
nền tảng quản lý doanh nghiệp thơng minh (BI), nĩ khơng chỉ là một 
- 18 - 
thành phần của SQL Server, nĩ cịn được sử dụng trên .NET Framework 
và mơi trường phát triển Visual Studio. 
2.3.1.3. SQL Server Reporting Service (SSRS) 
SSRS là một dịch vụ của SQL Server , nĩ là hệ thống quản lý các báo 
cáo. Hỗ trợ việc tạo báo cáo, quản lý các báo cáo, và quản lý truy cập 
thơng qua nền tảng web. 
2.3.2. Xây dựng kho dữ liệu trên SQL Server 2005 
Mơ hình biểu diễn phương pháp sử dụng các cơng cụ của MSSQL 
2005 để xây dựng kho dữ liệu và hệ thống báo cáo cho người dùng: 
Hình 2.13. Mơ hình xây dựng kho dữ liệu trên SQL Server 2005 
KẾT CHƯƠNG 2 
Đây là một trong những chương quan trọng của đề tài. Trong 
chương này trình bày các nội dung: mơ tả hệ thống bao gồm: xác định 
yêu cầu đối với hệ thống, kiến trúc tổng thể và mơ hình hoạt động của hệ 
thống; từ hiện trạng hệ thống phục vụ tra cứu và đặc trưng kho dữ liệu ta 
thiết kế các chức năng và cuối cùng là thiết kế kho dữ liệu. 
- 19 - 
CHƯƠNG 3: PHÁT TRIỂN HỆ THỐNG 
Trong chương này sẽ thực hiện việc chọn Cơ sở dữ liệu, ngơn ngữ 
phát triển ứng dụng, đề xuất những giải pháp để phát triển ứng dụng và cài 
đặt ứng dụng. 
3.1. CƠNG CỤ PHÁT TRIỂN HỆ THỐNG 
3.1.1. Cơng cụ xây dựng kho dữ liệu 
Ngồi khả năng lưu trữ dữ liệu kích thước lớn, với những ưu điểm 
như giao diện thân thiện, tốc độ xử lý nhanh, cĩ phiên bản miễn phí là 
những yếu tố quan trọng để tơi quyết định chọn hệ quản trị CSDL SQL 
Server 2005 để lưu trữ CSDL. 
3.1.2. Ngơn ngữ phát triển ứng dụng 
 Visual Studio.Net là 1 sản phẩm cơng nghệ .NET của Microsoft với 
nhiều ngơn ngữ lập trình: C++.Net, Visual Basic.Net, ASP.Net, C#, J#, 
giúp chúng ta cĩ thể dễ dàng tạo ra những giao diện dễ dàng, nhanh chĩng 
với những cơng cụ hỗ trợ đi kèm. Trong đề tài này tơi chọn cơng nghệ 
.NET với ngơn ngữ C# để phát triển ứng dụng. 
3.2. CÁC BƯỚC TRIỂN KHAI 
3.2.1. Nguồn dữ liệu 
Để nạp dữ liệu vào kho phục vụ cho việc khai thác, sử dụng, tiến hành 
thu thập dữ liệu về các văn bản, tài liệu luật kinh tế từ các nguồn sau: 
- Hệ thống file dữ liệu về luật kinh tế sưu tầm được: hệ thống tiến 
hành phân tích, xử lý hệ thống file sưu tầm được và nạp các thơng tin vào 
kho dữ liệu. 
- 20 - 
- Các văn bản quy phạm pháp luật về kinh tế trên internet. Hệ thống 
sẽ tự động thu thập thơng tin từ các nguồn internet trên, qua bước kiểm tra 
xử lý để tránh trùng lặp dữ liệu, sau đĩ nạp vào kho dữ liệu. 
Mơ hình cụ thể như sau: 
 Hình 3.1. Sơ đồ trích lọc dữ liệu vào hệ thống 
3.2.1.1. Trích lọc dữ liệu từ hệ thống file 
Các bước xử lý và trích lọc nội dung tài liệu từ file word như sau: 
- Khai báo đối tượng Microsoft.Office.Interop.Word.Document dùng 
để đọc văn bản Word. 
- Sử dụng phương thức ActiveWindow.Selection.WholeStory() để 
đọc nội dung của văn bản. 
- Khai thác nội dung văn bản qua thuộc tính Content.Text. 
3.2.1.2. Thu thập dữ liệu luật kinh tế trên Internet: 
. Các địa chỉ được lựa chọn để trích rút dữ liệu như sau: 
- www.chinhphu.vn (trang web của Chính phủ). 
- www.mof.gov.vn (trang web của Bộ Tài chính) 
- 21 - 
- www.mpi.gov.vn (trang web của Bộ Kế hoạch và Đầu tư) 
- www.thuvienphapluat.vn. 
- www.luatvietnam.vn 
- www.vietlaw.vn 
3.2.2. Xây dựng kho dữ liệu 
 Kho dữ liệu luật kinh tế được thiết kế theo lược đồ hình sao, bao gồm 
các bảng chiều (dimension table) và bảng sự kiện (fact table), được xây 
dựng từ nguồn dữ liệu trong CSDL quan hệ được xây dựng ở trên. 
Hình 3.5. Lược đồ kho dữ liệu luật kinh tế 
3.2.3. Xây dựng Cổng thơng tin tra cứu về luật kinh tế 
Hệ thống tra cứu luật kinh tế được xây dựng dựa trên nền tảng 
DotnetNuke. Đây là hệ thống cổng thơng tin (portal) mã nguồn mở được 
sử dụng phổ biến nhất hiện nay và chạy trên mơi trường .NET của 
Microsoft, do đĩ cĩ thể tương thích và kết nối dễ dàng đến kho dữ liệu 
Luật kinh tế được xây dựng trên SQL Server 2005. 
- 22 - 
3.3. THỬ NGHIỆM HỆ THỐNG 
3.3.1. Yêu cầu hệ thống 
Hệ thống kho dữ liệu và website tra cứu thơng tin về luật kinh tế được 
cài trên máy chủ cĩ cấu hình tối thiểu: CPU Intel Core 2 Duo, 3 GHz, 
RAM 1G, Dung lượng ổ đĩa trống 500MB. 
3.3.2. Cài đặt hệ thống: 
3.3.2.1. Cài đặt CSDL quan hệ 
Quá trình cài đặt CSDL như sau: 
- File CSDL: VanBanQPPL.mdf (file data) và VanBanQPPL_log.ldf 
(file log). 
- Sử dụng cơng cụ Microsoft SQL Server management studio 2005 để 
kết nối đến Database Engine và tiến hành attach 02 file CSDL trên vào. 
3.3.2.2. Cài đặt lược đồ kho dữ liệu 
- File chứa lược đồ: LuatKinhTe.abf. 
- Sử dụng cơng cụ Microsoft SQL Server management studio 2005 
kết nối đến Analysis Services và tiến hành restore file trên để khơi phục 
kho dữ liệu. 
3.3.2.3. Cài đặt Cổng thơng tin Luật kinh tế 
Cổng thơng tin Luật kinh tế là một ứng dụng web trên nền .NET 
framework, do đĩ được cài đặt trên web server là IIS (Internet Information 
Services). Sau khi khai báo website mới trong IIS, tiến hành sửa file 
config để khai báo cáo tham số kết nối đến kho dữ liệu. 
- 23 - 
3.3.3. Kết quả triển khai 
Sử dụng trình duyệt web (IE, Firefox) gõ địa chỉ cài đặt của chương 
trình sẽ xuất hiện trang chủ như sau: 
Hình 3.9. Giao diện Cổng thơng tin Luật kinh tế 
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 
 Với thành tựu và tốc độ phát triển của Internet như ngày nay thì việc 
ứng dụng nĩ vào lĩnh vực giáo dục là tất yếu. Việc đề xuất xây dựng kho 
dữ liệu Luật kinh tế nhằm phục vụ tra cứu, tìm hiểu cho sinh viên thực sự 
rất cĩ ý nghĩa. 
- 24 - 
Hướng phát triển của đề tài: 
Đề tài đã xây dựng được kho dữ liệu và ứng dụng để phục vụ việc khai 
thác thơng tin luật kinh tế cho người dùng, tuy nhiên do số lượng các văn 
bản là rất lớn với phạm vi điều chỉnh rộng, bao gồm nhiều lĩnh vực khác 
nhau về kinh tế, vì thế cần cĩ những phân tích mang tính chuyên sâu hơn 
cho người dùng, ví dụ phân nhĩm các văn bản, tài liệu cĩ liên quan, …. 
Do đĩ, đề tài cần ứng dụng các kỹ thuật xử lý ngơn ngữ và khai phá dữ 
liệu để phát triển ứng dụng tìm kiếm văn bản luật thơng minh hơn, đem lại 
thuận tiện cho người dùng. 
Trên cơ sở kho dữ liệu thu thập được, đề tài cĩ thể ứng dụng các kỹ 
thuật của web ngữ nghĩa (semantic web) để xây dựng cơ sở dữ liệu tri 
thức về luật kinh tế nhằm hỗ trợ tư vấn người dùng một cách tự động, giúp 
người dùng cĩ thể tìm kiếm các điều khoản trong một văn bản luật một 
cách chính xác hơn. 
Do điều kiện thời gian hạn hẹp và kinh nghiệm của bản thân cịn 
nhiều hạn chế nên chắc chắn khơng tránh khỏi những thiếu sĩt. Tơi thành 
thật mong nhận được các ý kiến đĩng gĩp của các Thầy trong Hội đồng, 
các bạn và đồng nghiệp để ứng dụng ngày càng hồn thiện và phục tốt 
nhất nhu cầu tra cứu thơng tin. 
            Các file đính kèm theo tài liệu này:
 tomtat_63_6147.pdf tomtat_63_6147.pdf