Đề tài đã xây dựng được kho dữ liệu và ứng dụng để phục vụ việc khai
thác thông tin luật kinh tếcho người dùng, tuy nhiên do số lượng các văn
bản là rất lớn với phạm vi điều chỉnh rộng, bao gồm nhiều lĩnh vực khác
nhau về kinh tế, vì thế cần có những phân tích mang tính chuyên sâu hơn
cho người dùng, ví dụphân nhóm các văn bản, tài liệu có liên quan, .
Do đó, đề tài cần ứng dụng các kỹ thuật xử lý ngôn ngữ và khai phá dữ
liệu để phát triển ứng dụng tìm kiếm văn bản luật thông minh hơn, đem lại
thuận tiện cho người dùng.
Trên cơ sở kho dữ liệu thu thập được, đề tài có thể ứng dụng các kỹ
thuật của web ngữ nghĩa (semantic web) để xây dựng cơ sở dữ liệu tri
thức về luật kinh tế nhằm hỗ trợ tư vấn người dùng một cách tự động, giúp
người dùng có thể tìm kiếm các điều khoản trong một văn bản luật một
cách chính xác hơn.
13 trang |
Chia sẻ: lylyngoc | Lượt xem: 2466 | Lượt tải: 2
Bạn đang xem nội dung tài liệu Xây dựng kho dữ liệu luật kinh tế để phục vụ việc học tập của sinh viên, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
- 1 -
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
HUỲNH THỊ THANH SỰ
XÂY DỰNG KHO DỮ LIỆU LUẬT KINH TẾ
ĐỂ PHỤC VỤ VIỆC HỌC TẬP CỦA SINH VIÊN
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01
TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng - Năm 2011
- 2 -
Cơng trình được hồn thành tại
ĐẠI HỌC ĐÀ NẴNG
Người hướng dẫn khoa học: PGS.TS. Võ Trung Hùng
Phản biện 1: TS. Huỳnh Hữu Hưng
Phản biện 2: TS. Trương Cơng Tuấn
Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp
thạc sĩ kỹ thuật họp tại Đại học Đà Nẵng vào ngày 16 tháng 10
năm 2011
Cĩ thể tìm hiểu luận văn tại:
- Trung tâm Thơng tin-Học liệu, Đại học Đà Nẵng
- Trung tâm Học liệu, Đại học Đà Nẵng
- 1 -
MỞ ĐẦU
1. Lý do chọn đề tài
Với tốc độ phát triển cơng nghệ thơng tin hiện nay, việc quản lý
giáo dục trở nên dễ dàng, nhanh chĩng và tiện lợi hơn nhờ sự giúp sức các
ứng dụng cơng nghệ thơng tin làm phương tiện học tập, tạo nên mơi
trường học tập với thơng tin đa dạng trong việc tra cứu tài liệu, tạo nên
tính tự học, tự nghiên cứu cho người học.
Trường trực thuộc UBND tỉnh Quảng Nam và chịu sự quản lý nhà
nước về giáo dục của Bộ Giáo dục và Đào tạo. Tổng số sinh viên của
trường đang đào tạo là 8.587 sinh viên. Trong đĩ sinh viên ngành kế tốn
và quản trị kinh doanh là 3.250 sinh viên. Trong chương trình đào tạo
dành cho chuyên ngành kế tốn và quản trị kinh doanh, sinh viên được
trang bị các kiến thức cơ bản về luật doanh nghiệp năm 2005, luật hợp tác
xã năm 2003, luật phá sản năm 2004, luật thương mại năm 2005. Đây là
những kiến thức hết sức cần thiết cho những người hoạt động trong lĩnh
vực kế tốn và quản trị kinh doanh bởi vì nĩ sẽ cung cấp cho họ những
hiểu biết nhất định về quy chế thành lập và hoạt động của các loại hình
doanh nghiệp, hợp tác xã đang tồn tại và phát triển trong nền kinh tế thị
trường của Việt Nam hiện nay.
Với một lượng thơng tin cần phải tiếp cận nhiều như vậy địi hỏi
nhà trường phải cĩ một hệ thống tài liệu liên quan đến mơn học một cách
phong phú, đa dạng và cập nhật. Nhà trường chỉ mới dừng lại ở việc trang
bị các văn bản pháp luật hiện hành cĩ liên quan mà chưa quan tâm đến
việc xây dựng một hệ thống các loại sách tham khảo cần thiết để sinh viên
nghiên cứu. Bên cạnh đĩ việc tra cứu hệ thống pháp luật thơng qua mạng
Internet cịn gặp nhiều khĩ khăn do dữ liệu khơng tập trung, chưa nhất
quán.
Với những lý do ở trên, tơi là người đang cơng tác tại trường Cao
đẳng Kinh tế - Kỹ thuật Quảng Nam và được sự đồng ý của PGS.TS. Võ
- 2 -
Trung Hùng, tơi chọn đề tài “Xây dựng kho dữ liệu Luật kinh tế để phục
vụ việc học tập của sinh viên” và mục đích đầu tiên là sử dụng tại Trường
Cao đẳng Kinh tế Kỹ thuật Quảng Nam.
2. Mục tiêu của đề tài
Đề tài này nhằm mục đích xây dựng kho dữ liệu phục vụ việc tra
cứu tài liệu về Luật kinh tế nhanh chĩng, chính xác cho sinh viên, giáo
viên trong nhà trường thơng qua mạng Internet. Nâng cao hiệu quả ứng
dụng cơng nghệ thơng tin cho sinh viên và giáo viên trong nhà trường. Để
đáp ứng mục tiêu đã nêu, đề tài cần giải quyết những vấn đề chính sau:
tìm hiểu hiện trạng hệ thống tra cứu Luật và các vấn đề liên quan đến hệ
thống tra cứu; tìm hiểu, thu thập dữ liệu về Luật kinh tế để từ đĩ thiết kế
kho dữ liệu về Luật kinh tế; nghiên cứu và lựa chọn cơng cụ để xây dựng
hệ thống cho phép người sử dụng cập nhật, tra cứu trực tuyến hiệu quả
nhất.
3. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài bao gồm các tài liệu điện tử liên
quan đến Luật kinh tế và các ngành học liên quan đến Luật kinh tế của
trường; kho dữ liệu và khai phá dữ liệu; các phần mềm mã nguồn mở, các
hệ cơ sở dữ liệu liên quan đến đề tài.
Bên cạnh đĩ Xây dựng ứng dụng với ngơn ngữ lập trình C# và hệ
Cơ sở dữ liệu SQL Server 2005.
4. Nhiệm vụ nghiên cứu
- Tìm hiểu các ngành học về Luật kinh tế của nhà trường.
- Tìm hiểu các nội dung, văn bản về Luật kinh tế; và các nội dung,
văn bản luật liên quan.
- Phân tích và thiết kế kho dữ liệu về luật kinh tế.
- Tìm hiểu ngơn ngữ lập trình, cơng cụ để xây dựng kho dữ liệu để
xây dựng Cổng thơng tin về luật kinh tế phục vụ tìm kiếm, khai thác thơng
tin về luật kinh tế.
- 3 -
- Thu thập dữ liệu về luật kinh tế để nạp vào kho dữ liệu.
- Đánh giá kết quả ứng dụng hệ thống trong Nhà trường.
5. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý luận: Các nội dung văn bản luật
kinh tế, các nội dung văn bản luật liên quan. Phân tích các nội dung văn
bản để xây dựng kho dữ liệu.
- Phương pháp nghiên cứu thực tiễn: Khảo sát nhu cầu thực tế
của sinh viên, giáo viên tra cứu, tìm kiếm tài liệu; Tìm hiểu các kho dữ
liệu hiện cĩ.
- Phương pháp nghiên cứu tài liệu: Tìm hiểu ngơn ngữ lập trình,
hệ quản trị Cơ sở dữ liệu; Xây dựng ứng dụng.
6. Bố cục của luận văn
Luận văn bao gồm các phần như sau:
Mở đầu
Chương 1: Nêu tổng quan về kho dữ liệu dữ liệu, khai phá dữ liệu,
khái niệm về luật kinh tế, nhu cầu khai thác luật kinh tế, hiện trạng hệ
thống tra cứu hiện cĩ.
Chương 2: Trình bày yêu cầu đối với hệ thống, kiến trúc tổng thể
và mơ hình hoạt động của hệ thống, thiết kế kho dữ liệu và chức năng của
hệ thống.
Chương 3: Việc lựa chọn cơng cụ để phát triển hệ thống, xác định
các giải pháp phát triển hệ thống và đồng bộ dữ liệu, xây dựng các module
xử lý. Kết luận của đề tài về các mặt làm được, khả năng ứng dụng, những
ưu và nhược điểm và hướng phát triển trong tương lai.
Kết luận của đề tài về các mặt làm được, khả năng ứng dụng, những
ưu và nhược điểm và hướng phát triển trong tương lai.
- 4 -
CHƯƠNG 1
NGHIÊN CỨU TỔNG QUAN
1.1. KHO DỮ LIỆU
1.1.1. Kho dữ liệu và đặc trưng của kho dữ liệu
1.1.1.1. Định nghĩa kho dữ liệu
Định nghĩa do W.H. Inman đề xướng: Kho dữ liệu (DWH) được
hiểu là một tập hợp các dữ liệu tương đối ổn định (khơng hay thay đổi),
cập nhật theo thời gian, được tích hợp theo hướng chủ đề nhằm hỗ trợ quá
trình tạo quyết định về mặt quản lý.
1.1.1.2. Đặc trưng kho dữ liệu
Đặc trưng của kho dữ liệu: tính tích hợp, tính gắn với thời gian , tính
lịch sử, tính chỉ đọc, tính khơng biến động và tính dữ liệu tổng hợp và chi
tiết.
1.1.2. Kiến trúc kho dữ liệu
Dữ liệu tác nghiệp
(nguồn 1)
Dữ liệu tác nghiệp
(nguồn 2)
Dữ liệu tác nghiệp
(nguồn 3)
Bộ quản lí kho dữ
liệu
Các cơng cụ
truy vấn báo
cáo, phát
triển ứng
dụng và EIS
Các cơng cụ
xử lý phân
tích trực
truyến
Các cơng cụ
khai phá dữ
liệu
Các cơng cụ truy cập
dữ liệu của người
dùng đầu cuối
Dữ liệu lưu trữ và sao
lưu dự phịng
Bộ quản lí kho dữ
liệu
Bộ
quản
lí truy
vấn
Dữ liệu chi tiết
Dữ liệu tổng hợp
ở mức thấp
Dữ liệu tổng
hợp ở mức cao
Bộ
quản lí
nạp dữ
liệu Siêu dữ liệu
1.1.3. Các dịng thơng tin của kho dữ liệu
Việc xây dựng và khai thác kho dữ liệu tập trung vào quản lý năm
luồng thơng tin chính cĩ tên là: luồng vào (Inflow), luồng lên (Upflow),
- 5 -
luồng xuống (Downflow), luồng ra (Outflow) và luồng siêu dữ liệu
(Metaflow).
1.1.4. Kho dữ liệu cục bộ
Kho dữ liệu cục bộ (Data Mart - DM) là CSDL cĩ những đặc điểm
giống với kho dữ liệu nhưng với quy mơ nhỏ hơn và lưu trữ dữ liệu về
một lĩnh vực, một chuyên ngành.
1.1.5. Mơ hình logic của kho dữ liệu
1.1.5.1. Lược đồ hình sao
Trong mơ hình dữ liệu này, phạm vi dữ liệu được tổ chức trong
các bảng chiều, mỗi chiều ứng với một đặc trưng của dữ liệu (khách hàng,
sản phẩm , bán hàng, thời gian…), các bảng sự kiện biểu diễn các sự kiện
xảy ra và các thơng tin chi tiết về các sự kiện đĩ.
1.1.5.2. Lược đồ hình bơng tuyết
Đây là mơ hình tương tự mơ hình sao tuy nhiên nĩ mở rộng hơn
mơ hình sao, trong mơ hình này một chiều của dữ liệu cĩ thể gồm nhiều
bảng, và trong đĩ cĩ 1 bảng sự kiện, bảng sự kiện này chính là một chiều
trong mơ hình lớn hơn.
1.1.5.3. Mơ hình dữ liệu nhiều chiều
Đây là mơ hình chức dữ liệu xoay quanh các chủ đề nhằm trả lời
một cách nhanh nhất các câu hỏi trong nghiệp vụ của người quản lý. Cĩ
thể nhìn dữ liệu được tổ chức như là một khối, trong đĩ mỗi chiều là một
chủ đề trong nghiệp vụ .
1.1.6. Ứng dụng của kho dữ liệu
Ngày nay, kho dữ liệu được triển khai trong các doanh nghiệp với
nhiều mục đích khác nhau như tạo các báo cáo tổng hợp, tích hợp dữ liệu,
- 6 -
quản trị doanh nghiệp thơng minh (Business Intelligence), quản lý quan hệ
khách hàng, khai phá dữ liệu.
1.1.7. Xu hướng phát triển của kho dữ liệu
Trong tương lai xu hướng phát triển của kho dữ liệu bao gồm :
quản lý dữ liệu phi cấu trúc, tìm kiếm dữ liêu, kiến trúc hướng dịch vụ và
kho dữ liệu thời gian thực.
1.2. KHAI PHÁ DỮ LIỆU
1.2.1. Khái niệm
Khai phá dữ liệu (Data mining) ra đời vào những năm cuối của
thập kỷ 80. Nĩ bao hàm một loạt các kỹ thuật nhằm phát hiện ra các thơng
tin cĩ giá trị tiềm ẩn trong các tập dữ liệu lớn (các kho dữ liệu). Về bản
chất, khai phá dữ liệu liên quan đến việc phân tích các dữ liệu và sử dụng
các kỹ thuật để tìm ra các mẫu hình cĩ tính chính quy (regularities) trong
tập dữ liệu.
1.2.2. Mục tiêu của khai phá dữ liệu
Dữ liệu của chúng ta sau khi xử lý trực tuyến phục vụ cho một mục
đích nào đĩ được lưu lại trong kho dữ liệu và theo ngày tháng khối lượng
dữ liệu được lưu trữ ngày càng lớn. Trong khối lượng dữ liệu to lớn này
cịn rất nhiều thơng tin cĩ ích mang tính tổng quát, thơng tin cĩ tính qui
luật vẫn đang cịn tiềm ẩn mà chúng ta chưa biết. Các cơng cụ xử lý phân
tích trực tuyến (On-Line Analytical Processing - OLAP) là cần thiết để
phân tích dữ liệu, nhưng chưa đủ để rút thơng tin từ một khối lượng dữ
liệu khổng lồ như vậy. Từ khối lượng dữ liệu rất lớn thì cần phải cĩ những
cơng cụ tự động rút các thơng tin và kiến thức cĩ ích. Một hướng tiếp cận
mới cĩ khả năng giúp các cơng ty khai phá các thơng tin cĩ nhiều ý nghĩa
từ các tập dữ liệu lớn (databases, data warehouses, data repositories ) đĩ
là khai phá dữ liệu (Data Mining).
- 7 -
1.2.3. Các bước thực hiện khai phá dữ liệu
Hình 1.5. Sơ đồ mơ tả quá trình khai phá dữ liệu
1.3. LUẬT KINH TẾ
1.3.1. Khái niệm Luật Kinh tế
Luật kinh tế (hay luật kinh doanh) là một ngành luật trong hệ
thống pháp luật Việt Nam, gồm tổng thể các qui phạm pháp luật do Nhà
nước ban hành để điều chỉnh các quan hệ kinh tế phát sinh trong quá tŕnh
quản lư kinh tế và sản xuất kinh doanh giữa các cơ quan quản lư Nhà
nước về kinh tế với các tổ chức kinh tế hoặc giữa các tổ chức kinh tế với
nhau hay nĩi khác đi luật kinh tế (hay luật kinh doanh) gồm những qui
phạm pháp luật điều chỉnh các quan hệ pháp luật trong lĩnh vực kinh
doanh.
1.3.2. Chủ thể của Luật Kinh tế
Chủ thể là thuật ngữ để chỉ các cá nhân, tổ chức, theo qui định của
pháp luật, tham gia vào các quan hệ pháp luật để thực hiện các nội dung
của qui phạm pháp luật tương ứng.
Chủ thể của luật kinh doanh là những cá nhân, tổ chức tham gia trong
quá trình kinh doanh.
- 8 -
1.3.3. Vai trị của Luật Kinh tế trong nền kinh tế thị trường
Trong nền kinh tế kế hoạch hĩa tập trung hay nền kinh tế thị trường,
luật kinh doanh đều cĩ vai trị quan trọng. Tuy nhiên, tầm quan trọng của
luật kinh doanh càng thể hiện rõ nét trong nền kinh tế thị trường qua các
vai trị sau :
1.3.3.1. Cụ thể hĩa đường lối, chủ trương của Đảng, Nhà nước thành các
qui định áp dụng cho các chủ thể kinh doanh.
1.3.3.2. Tạo hành lang pháp lý an tồn cho các chủ thể kinh doanh.
1.3.3.3. Xác định địa vị pháp lư của các chủ thể kinh doanh.
1.3.3.4. Điều chỉnh các hành vi kinh doanh, giải quyết các tranh chấp
trong kinh doanh.
1.4. NHU CẦU CỦA VIỆC KHAI THÁC LUẬT KINH TẾ
Qua tìm hiểu thực tế tại các trường Cao đẳng và Đại học trên địa
bàn tỉnh Quảng Nam và một số nguồn thơng tin khác thì đối tượng tìm
hiểu, nghiên cứu về Luật kinh tế là sinh viên các trường đại học, cao đẳng,
các doanh nghiệp, cán bộ tư pháp xã, phường, …
1.5. HIỆN TRẠNG CÁC CƠ SỞ DỮ LIỆU LUẬT TẠI VIỆT NAM
Để cĩ cơ sở xây dựng kho dữ liệu, tơi tiến hành khảo sát hiện trạng
hệ thống phục vụ tra cứu hiện tại theo 2 nguồn thơng tin, đĩ là nguồn
thơng tin trực tiếp từ thư viện nhà trường và qua mạng Google. Kết quả cụ
thể như sau:
Tiến hành khảo sát thực tế tại thư viện nhà trường kết quả cho thấy:
số lượng đầu sách và tài liệu tham khảo liên quan đến hệ thống pháp luật
kinh tế của nhà trường cịn nhiều hạn chế và chưa được cập nhật thường
xuyên.
- 9 -
Tìm kiếm thơng tin luật kinh tế trên Internet: các hệ thống hỗ trợ Tra
cứu văn bản luật cung cấp các văn bản pháp quy và yêu cầu sinh viên phải
nắm rõ các thơng tin về văn bản: số hiệu văn bản, tên văn bản, loại văn
bản, ngày ban hành,…điều này cũng gây khĩ khăn đối với sinh viên.
KẾT CHƯƠNG 1:
Trong chương này chúng tơi trình bày các khái niệm về kho dữ
liệu, đặc trưng của kho dữ liệu, kiến trúc kho dữ liệu, các dịng thơng tin
của kho dữ liệu, kho dữ liệu chủ đề và khai phá dữ liệu cũng như nhu cầu
tra cứu và hiện trạng hệ thống phục vụ tra cứu luật kinh tế, một số hệ
thống tra cứu hiện cĩ. Những nội dung trong chương này là cơ sở để thực
hiện các chương tiếp theo.
CHƯƠNG 2: PHÂN TÍCH THIẾT KẾ HỆ THỐNG
2.1. MƠ TẢ HỆ THỐNG
2.1.1. Yêu cầu đối với hệ thống
Từ thực tiễn việc quản lý, lưu trữ dữ liệu đã được nêu ra ở chương 1,
việc xây dựng kho dữ liệu Luật kinh tế phục vụ tra cứu thơng tin luật kinh
tế phải đảm các yêu cầu sau:
- Mềm dẻo trong việc cập nhật dữ liệu: hệ thống phải cho phép cập
nhật dữ liệu được thu thập từ nhiều nguồn khác nhau: nhập trực tiếp, lấy
từ web, từ file đã cĩ, sách... và cập nhật theo từng thể loại luật.
- Kho dữ liệu cĩ thể lưu trữ dữ liệu nhiều định dạng khác nhau.
- Cho phép hiển thị thơng tin trên mơi trường Web.
- Cho phép tìm kiếm theo từng thể loại hoặc kết hợp nhiều tiêu chí
khác nhau.
- 10 -
2.1.2. Kiến trúc tổng thể
Kiến trúc tổng thể của hệ thống bao gồm những thành phần sau:
KHO
DỮ
LIỆU
LUẬT
KINH
TẾ
Tiền xử lý Sưu tập dữ liệu
Chuẩn hĩa
dữ liệu
Sách
Ứng
dụng
khai
thác dữ
liệu
DOC
PDF
HTML
Nhập trực
tiếp
…
Hình 2.1. Kiến trúc tổng thể hệ thống
2.1.3. Mơ hình hoạt động
Hình 2.2. Mơ hình hoạt động của hệ thống
- 11 -
2.2. THIẾT KẾ CHỨC NĂNG HỆ THỐNG
2.2.1. Các yêu cầu chức năng
- Hệ thống phải cho phép thu thập, xử lý dữ liệu và nạp vào kho dữ
liệu các tài liệu văn bản luật trong lĩnh vực kinh tế.
- Cho phép quản trị các thơng tin thuộc tính của văn bản luật như trích
yếu, ngày ban hành, tình trạng hiệu lực, văn bản liên quan, …
- Quản trị các thơng tin liên quan như danh sách các cơ quan ban
hành (Quốc hội, Chính phủ, Bộ, …), lĩnh vực của văn bản (đầu tư, thuế,
xuất nhập khẩu, …), loại văn bản (Luật, Nghị định, Thơng tư, …).
- Chức năng quan trọng nhất của hệ thống là cho phép tìm kiếm, khai
thác thơng tin về luật kinh tế qua mơi trường internet.
Ngồi ra hệ thống cung cấp chức năng tư vấn, giải đáp thắc mắc về
luật, giúp cho người dùng cĩ thể gửi các câu hỏi đến hệ thống và cung cấp
thơng tin trả lời từ cơ quan/cá nhân cĩ khả năng trả lời.
2.2.2. Phân tích thiết kế hệ thống:
2.2.2.1. Danh sách các actor:
Danh sách actor:
Bảng 2.1. Danh sách actor
STT Tên actor Diễn giải
1
Chuyên viên quản lý kho
dữ liệu
cĩ chức năng cập nhật thơng tin
vào hệ thống, quản lý dữ liệu.
2
Quản trị hệ thống Quản lý các danh mục hệ thống,
vận hành, bảo trì CSDL
3
Người sử dụng Tìm kiếm, khai thác thơng tin về
các văn bản luật
- 12 -
Danh sách use case:
Bảng 2.2. Danh sách usercase
STT Tên use case Diễn giải
1 Quản lý người dùng Cho phép thêm, xĩa, sửa người
dùng của hệ thống
2 Quản lý tài liệu Quản lý các tài liệu về Luật kinh
tế như giáo trình, …
3 Quản lý văn bản luật Quản lý các văn bản quy phạm
pháp luật về kinh tế
4
Quản lý danh mục
thể loại văn bản
Quản lý thể loại như Luật, Nghị
định, thơng tư, …
5 Quản lý lĩnh vực Quản lý lĩnh vực kinh tế như
thuế, hải quan, đầu tư, …
6
Quản lý danh mục cơ
quan ban hành
Quản lý danh mục các cơ quan
ban hành như Quốc hội, chính
phủ, các Bộ, …
7
Tìm kiếm, khai thác
thơng tin
Cho phép tìm kiếm văn bản, tài
liệu luật kinh tế theo các tiêu chí
khác nhau, xem thơng tin chi
tiết.
2.2.2.2. Sơ đồ use case:
Sơ đồ Use case của hệ thống như sau:
- 13 -
Hình 2.3. Sơ đồ usecase của hệ thống
2.2.2.3. Đặc tả use case:
User case: quản lý văn bản
Các tác nhân: quản trị.
Pre Condition: người dùng đã đăng nhập thành cơng.
Post Condition: Nếu use case thành cơng, thơng tin về văn bản luật sẽ
được cập nhật vào cơ sở dữ liệu.
Mơ tả: Use case này cho phép người sử dụng (đã là đăng nhập thành
cơng) quản lý văn bản: thêm, sửa, xố văn bản, đính kèm file, ….
Use case: tìm kiếm khai thác thơng tin
Các tác nhân: người dùng.
Pre Condition: Khơng cĩ.
Post Condition: kết quả tìm kiếm thỏa mãn yêu cầu của người dùng.
Mơ tả: Use case này cho phép dùng tìm kiếm các văn bản luật kinh tế
theo các tiêu chí khác nhau như nội dung văn bản, khoảng thời gian ban
hành, cơ quan ban hành, hình thức, …
- 14 -
Use case: quản lý người dùng
Các tác nhân: quản trị.
Pre Condition: quản trị đã đăng nhập thành cơng.
Post Condition:.
Mơ tả: Use case này cho phép quản trị viên thêm, sửa, xố, tìm kiếm
thơng tin về thành viên sử dụng hệ thống. Quản lý trang tin của các thành
viên (thêm, sửa, xố trang tin của người sử dụng).
Use case: trao đổi, hỏi đáp
Các tác nhân: người dùng.
Pre Condition: khơng cĩ.
Post Condition: xem và gửi câu hỏi.
Mơ tả: Use case này cho phép người dùng xem câu hỏi và câu trả lời
được đăng trên trang web và gửi câu hỏi.
2.2.2.4. Biểu đồ tuần tự:
Ta xây dựng các biểu đồ tuần tự sau: quản lý văn bản, quản lý tài
liệu, tìm kiếm và tra cứu văn bản.
2.2.2.5. Biểu đồ hoạt động
Ta xây dựng các biểu đồ hoạt động sau : tạo văn bản/tài liệu mới,
quản lý các nhĩm danh mục hệ thống, quản lý người dùng.
2.2.2.6. Biểu đồ lớp
Biểu đồ lớp của hệ thống
- 15 -
Hình 2.10. Biểu đồ lớp của hệ thống
2.2.2.7. Thiết kế cơ sở dữ liệu
Bảng dữ liệu văn bản pháp luật:
Bảng dữ liệu tài liệu:
Bảng dữ liệu cơ quan ban hành:
Bảng dữ liệu thể loại văn bản:
Bảng dữ liệu lĩnh vực:
Bảng dữ liệu người dùng:
Bảng dữ liệu phân quyền:
Bảng trao đổi, hỏi đáp:
Mơ hình quan hệ:
- 16 -
VB_HoiDap
HoiDapID
HoiDapParentID
NguoiGui
D iaC hi
D ienThoai
Email
Ngay Gui
NoiDungHoi
NguoiTraLoi
NoiDungTraLoi
Ngay TraLoi
SoLuotXem
IsA pprov ed
VB_VanBan
V anBanID
SoKy Hieu
C oQ uanBanHanhID
TheLoaiID
LinhV ucID
TrichYeu
NguoiKy
Ngay BanHanh
Ngay C oHieuLuc
Ngay HetH ieuLuc
C onHieuLuc
F ileD inhKem
NguoiDang
SoLuotXem
VB_CoQuan
C oQ uanID
TenC oQ uan
KhoiID
C apID
DiaC hi
D ienThoai
Email
VB_LinhVuc
LinhV ucID
TenLinhV uc
IsA ctiv e
VB_TheLoai
TheLoaiID
TenTheLoai
Ky Hieu
GhiC hu
VB_NguoiDung
C anBoID
Username
PhongBanID
HoTen
C hucV u
GhiC hu
VB_TaiLieu
TaiLieuID
TenTaiLieu
TacGia
NhaXuatBan
NamXuatBan
HinhA nh
MoTa
SoLuotXem
NguoiDang
Hình 2.11. Sơ đồ quan hệ giữa các bảng CSDL
2.3. XÂY DỰNG KHO DỮ LIỆU VỚI MS SQL SERVER 2005
2.3.1. Tổng quan về các thành phần của SQL Server 2005
Hệ quản trị cơ sở dữ liệu Microsoft SQL Server (MSSQL) là một
trong những hệ quản trị cơ sở dữ liệu thơng dụng hiện nay. Đây là hệ
quản trị cơ sở dữ liệu thường được sử dụng với các hệ thống trung bình,
với ưu điểm cĩ các cơng cụ quản lý mạnh mẽ giúp cho việc quản lý và
bảo trì hệ thống dễ dàng , hỗ trợ nhiều phương pháp lưu trữ, phân vùng và
đánh chỉ mục phục vụ cho việc tối ưu hĩa hiệu năng. Với phiên bản
MSSQL 2005 Microsoft đã cĩ những cải tiến đáng kể nâng cao hiệu
năng, tính sẵn sàng của hệ thống, khả năng mở rộng và bảo mật. Phiên bản
mới này cịn cung cấp nhiều cơng cụ cho người phát triển ứng dụng được
tích hợp với bộ Visual Studio do Microsoft cung cấp. Dưới đây là mơ hình
về các dịch vụ của SQL server 2005.
- 17 -
Hình 20.12. Kiến trúc SQL Server 2005
MSSQL 2005 cĩ 4 dịch vụ lớn : Database Engine,Intergration
Service, Reporting service, Analysis Services.
2.3.1.1. SQL Server intergration service:
SSIS là một thành phần của SQL Server, nĩ được phát triển từ cơng
cụ Data Transformation Services của phiên bản SQL Server 7.0, một cơng
cụ để thực thi việc chuyển đổi dữ liệu. SSIS là nền tảng cho việc tích hợp
dữ liệu , các chức năng của nĩ nhanh và mềm dẻo cho việc phát triển tiến
trình ETL cho xây dựng kho dữ liệu , ngồi ra SSIS cịn cung cấp các
cơng cụ tự động bảo trì và tự động cập nhật dữ liệu cho cơ sở dữ liệu
nhiều chiều và cubes.
2.3.1.2. SQL Server analysis service (SSAS)
SSAS là một trong những dịch vụ chính của SQL Server 2005 dùng
để xây dựng các chiều và cubes cho DWH, trong phiên bản mới này cịn
hỗ trợ một số thuật tốn khai phá dữ liệu điều này cung cấp cho người
quản lý cĩ cái nhìn sâu sắc về dữ liệu của họ hơn. SSAS là một phần của
nền tảng quản lý doanh nghiệp thơng minh (BI), nĩ khơng chỉ là một
- 18 -
thành phần của SQL Server, nĩ cịn được sử dụng trên .NET Framework
và mơi trường phát triển Visual Studio.
2.3.1.3. SQL Server Reporting Service (SSRS)
SSRS là một dịch vụ của SQL Server , nĩ là hệ thống quản lý các báo
cáo. Hỗ trợ việc tạo báo cáo, quản lý các báo cáo, và quản lý truy cập
thơng qua nền tảng web.
2.3.2. Xây dựng kho dữ liệu trên SQL Server 2005
Mơ hình biểu diễn phương pháp sử dụng các cơng cụ của MSSQL
2005 để xây dựng kho dữ liệu và hệ thống báo cáo cho người dùng:
Hình 2.13. Mơ hình xây dựng kho dữ liệu trên SQL Server 2005
KẾT CHƯƠNG 2
Đây là một trong những chương quan trọng của đề tài. Trong
chương này trình bày các nội dung: mơ tả hệ thống bao gồm: xác định
yêu cầu đối với hệ thống, kiến trúc tổng thể và mơ hình hoạt động của hệ
thống; từ hiện trạng hệ thống phục vụ tra cứu và đặc trưng kho dữ liệu ta
thiết kế các chức năng và cuối cùng là thiết kế kho dữ liệu.
- 19 -
CHƯƠNG 3: PHÁT TRIỂN HỆ THỐNG
Trong chương này sẽ thực hiện việc chọn Cơ sở dữ liệu, ngơn ngữ
phát triển ứng dụng, đề xuất những giải pháp để phát triển ứng dụng và cài
đặt ứng dụng.
3.1. CƠNG CỤ PHÁT TRIỂN HỆ THỐNG
3.1.1. Cơng cụ xây dựng kho dữ liệu
Ngồi khả năng lưu trữ dữ liệu kích thước lớn, với những ưu điểm
như giao diện thân thiện, tốc độ xử lý nhanh, cĩ phiên bản miễn phí là
những yếu tố quan trọng để tơi quyết định chọn hệ quản trị CSDL SQL
Server 2005 để lưu trữ CSDL.
3.1.2. Ngơn ngữ phát triển ứng dụng
Visual Studio.Net là 1 sản phẩm cơng nghệ .NET của Microsoft với
nhiều ngơn ngữ lập trình: C++.Net, Visual Basic.Net, ASP.Net, C#, J#,
giúp chúng ta cĩ thể dễ dàng tạo ra những giao diện dễ dàng, nhanh chĩng
với những cơng cụ hỗ trợ đi kèm. Trong đề tài này tơi chọn cơng nghệ
.NET với ngơn ngữ C# để phát triển ứng dụng.
3.2. CÁC BƯỚC TRIỂN KHAI
3.2.1. Nguồn dữ liệu
Để nạp dữ liệu vào kho phục vụ cho việc khai thác, sử dụng, tiến hành
thu thập dữ liệu về các văn bản, tài liệu luật kinh tế từ các nguồn sau:
- Hệ thống file dữ liệu về luật kinh tế sưu tầm được: hệ thống tiến
hành phân tích, xử lý hệ thống file sưu tầm được và nạp các thơng tin vào
kho dữ liệu.
- 20 -
- Các văn bản quy phạm pháp luật về kinh tế trên internet. Hệ thống
sẽ tự động thu thập thơng tin từ các nguồn internet trên, qua bước kiểm tra
xử lý để tránh trùng lặp dữ liệu, sau đĩ nạp vào kho dữ liệu.
Mơ hình cụ thể như sau:
Hình 3.1. Sơ đồ trích lọc dữ liệu vào hệ thống
3.2.1.1. Trích lọc dữ liệu từ hệ thống file
Các bước xử lý và trích lọc nội dung tài liệu từ file word như sau:
- Khai báo đối tượng Microsoft.Office.Interop.Word.Document dùng
để đọc văn bản Word.
- Sử dụng phương thức ActiveWindow.Selection.WholeStory() để
đọc nội dung của văn bản.
- Khai thác nội dung văn bản qua thuộc tính Content.Text.
3.2.1.2. Thu thập dữ liệu luật kinh tế trên Internet:
. Các địa chỉ được lựa chọn để trích rút dữ liệu như sau:
- www.chinhphu.vn (trang web của Chính phủ).
- www.mof.gov.vn (trang web của Bộ Tài chính)
- 21 -
- www.mpi.gov.vn (trang web của Bộ Kế hoạch và Đầu tư)
- www.thuvienphapluat.vn.
- www.luatvietnam.vn
- www.vietlaw.vn
3.2.2. Xây dựng kho dữ liệu
Kho dữ liệu luật kinh tế được thiết kế theo lược đồ hình sao, bao gồm
các bảng chiều (dimension table) và bảng sự kiện (fact table), được xây
dựng từ nguồn dữ liệu trong CSDL quan hệ được xây dựng ở trên.
Hình 3.5. Lược đồ kho dữ liệu luật kinh tế
3.2.3. Xây dựng Cổng thơng tin tra cứu về luật kinh tế
Hệ thống tra cứu luật kinh tế được xây dựng dựa trên nền tảng
DotnetNuke. Đây là hệ thống cổng thơng tin (portal) mã nguồn mở được
sử dụng phổ biến nhất hiện nay và chạy trên mơi trường .NET của
Microsoft, do đĩ cĩ thể tương thích và kết nối dễ dàng đến kho dữ liệu
Luật kinh tế được xây dựng trên SQL Server 2005.
- 22 -
3.3. THỬ NGHIỆM HỆ THỐNG
3.3.1. Yêu cầu hệ thống
Hệ thống kho dữ liệu và website tra cứu thơng tin về luật kinh tế được
cài trên máy chủ cĩ cấu hình tối thiểu: CPU Intel Core 2 Duo, 3 GHz,
RAM 1G, Dung lượng ổ đĩa trống 500MB.
3.3.2. Cài đặt hệ thống:
3.3.2.1. Cài đặt CSDL quan hệ
Quá trình cài đặt CSDL như sau:
- File CSDL: VanBanQPPL.mdf (file data) và VanBanQPPL_log.ldf
(file log).
- Sử dụng cơng cụ Microsoft SQL Server management studio 2005 để
kết nối đến Database Engine và tiến hành attach 02 file CSDL trên vào.
3.3.2.2. Cài đặt lược đồ kho dữ liệu
- File chứa lược đồ: LuatKinhTe.abf.
- Sử dụng cơng cụ Microsoft SQL Server management studio 2005
kết nối đến Analysis Services và tiến hành restore file trên để khơi phục
kho dữ liệu.
3.3.2.3. Cài đặt Cổng thơng tin Luật kinh tế
Cổng thơng tin Luật kinh tế là một ứng dụng web trên nền .NET
framework, do đĩ được cài đặt trên web server là IIS (Internet Information
Services). Sau khi khai báo website mới trong IIS, tiến hành sửa file
config để khai báo cáo tham số kết nối đến kho dữ liệu.
- 23 -
3.3.3. Kết quả triển khai
Sử dụng trình duyệt web (IE, Firefox) gõ địa chỉ cài đặt của chương
trình sẽ xuất hiện trang chủ như sau:
Hình 3.9. Giao diện Cổng thơng tin Luật kinh tế
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Với thành tựu và tốc độ phát triển của Internet như ngày nay thì việc
ứng dụng nĩ vào lĩnh vực giáo dục là tất yếu. Việc đề xuất xây dựng kho
dữ liệu Luật kinh tế nhằm phục vụ tra cứu, tìm hiểu cho sinh viên thực sự
rất cĩ ý nghĩa.
- 24 -
Hướng phát triển của đề tài:
Đề tài đã xây dựng được kho dữ liệu và ứng dụng để phục vụ việc khai
thác thơng tin luật kinh tế cho người dùng, tuy nhiên do số lượng các văn
bản là rất lớn với phạm vi điều chỉnh rộng, bao gồm nhiều lĩnh vực khác
nhau về kinh tế, vì thế cần cĩ những phân tích mang tính chuyên sâu hơn
cho người dùng, ví dụ phân nhĩm các văn bản, tài liệu cĩ liên quan, ….
Do đĩ, đề tài cần ứng dụng các kỹ thuật xử lý ngơn ngữ và khai phá dữ
liệu để phát triển ứng dụng tìm kiếm văn bản luật thơng minh hơn, đem lại
thuận tiện cho người dùng.
Trên cơ sở kho dữ liệu thu thập được, đề tài cĩ thể ứng dụng các kỹ
thuật của web ngữ nghĩa (semantic web) để xây dựng cơ sở dữ liệu tri
thức về luật kinh tế nhằm hỗ trợ tư vấn người dùng một cách tự động, giúp
người dùng cĩ thể tìm kiếm các điều khoản trong một văn bản luật một
cách chính xác hơn.
Do điều kiện thời gian hạn hẹp và kinh nghiệm của bản thân cịn
nhiều hạn chế nên chắc chắn khơng tránh khỏi những thiếu sĩt. Tơi thành
thật mong nhận được các ý kiến đĩng gĩp của các Thầy trong Hội đồng,
các bạn và đồng nghiệp để ứng dụng ngày càng hồn thiện và phục tốt
nhất nhu cầu tra cứu thơng tin.
Các file đính kèm theo tài liệu này:
- tomtat_63_6147.pdf