Mục tiêu chính của đề tài nhằm nghiên cứu đề xuất các giải
pháp để triển khai dự án số hóa khối tài liệu lưu trữ hành chính
đang bảo quản tại Trung tâm Lưu trữ Quốc gia III bằng hệ
thống ITISCANNER. Kết quả nghiên cứu của luận văn có thể
khái quát như sau:
- Nghiên cứu, tổng hợp cơ sở lý luận, kinh nghiệm, phân
tích mục đích và mô hình áp dụng kỹ thuật số hóa tài
liệu lưu trữ, ưu điểm-nhược điểm và tổng quan về kỹ
thuật số hóa tài liệu lưu trữ. Đây vừa là nền tảng lý luận
vừa là luận chứng về khả năng áp dụng công nghệ số
hóa để triển khai dự án số hóa tài liệu lưu trữ đang bảo
quản tại Trung tâm Lưu trữ Quốc gia III.
- Để đảm bảo việc triển khai dự án số hóa tài liệu lưu trữ
có tính khả thi và hiệu quả cao, tiến hành khảo sát thực
tế khối tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu
trữ Quốc gia III và đưa ra những dữ liệu về các vấn đề
như: số lượng, thời gian, đặc điểm, tình trạng vật lý và
mức độ hư hỏng của tài liệu lưu trữ Trên cơ sở đó,
đánh giá khả năng áp dụng công nghệ số hóa đối với
khối tài liệu lưu trữ này.
- Đề xuất các giải pháp về quy trình số hóa, công nghệ sử
dụng, dự toán kinh phí để thực hiện dự án số hóa tài
liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III
23 trang |
Chia sẻ: builinh123 | Lượt xem: 6096 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu [Tóm tắt] Luận văn Dự án số hóa tài liệu lưu trữ trung tâm lưu trữ Quốc gia III, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1
ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN
NGUYỄN THANH HIẾU
DỰ ÁN SỐ HÓA TÀI LIỆU LƯU TRỮ
TRUNG TÂM LƯU TRỮ QUỐC GIA III
Ngành: Công nghệ thông tin
Chuyên ngành: Quản lý hệ thống thông tin
Mã số: Chuyên ngành đào tạo thí điểm
TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội – 2015
2
PHẦN MỞ ĐẦU
1. Đặt vấn đề
Trung tâm Lưu trữ Quốc gia III được thành lập theo quyết
định số 118/TCCB-TC ngày 10 tháng 6 năm 1995 của Bộ
trưởng - Trưởng ban Tổ chức Cán bộ Chính Phủ (nay là bộ Nội
vụ). Một trong những nhiệm vụ quan trọng của trung tâm là sưu
tầm, bổ sung; bảo quản an toàn và tổ chức sử dụng tài liệu, tư
liệu lưu trữ của các cơ quan, tổ chức Trung ương; các nhân vật
lịch sử, cá nhân, gia đình, dòng họ tiêu biểu của nước Việt Nam
dân chủ cộng hòa và Cộng hòa xã hội chủ nghĩa Việt Nam có
trụ sở đóng trên lãnh thổ từ tỉnh Quảng Bình trở ra phía Bắc; cơ
quan, tổ chức cấp kỳ, cấp liên khu, cấp khu của nước Việt Nam
dân chủ cộng hoà từ năm 1945 đến năm 1976; hồ sơ địa giới
hành chính, bản đồ địa giới và mốc địa giới hành chính các cấp
theo quy định của pháp luật. Tài liệu Lưu trữ quốc gia đã phục
vụ có hiệu quả các nhu cầu nghiên cứu, góp phần thiết thực vào
việc khôi phục nhiều công trình quan trọng sau chiến tranh,
cũng như cho sự nghiệp xây dựng, bảo vệ và phát triển kinh tế
văn hoá xã hội của đất nước
Hiện nay, sự phát triển nhanh chóng của công nghệ thông
tin đã hỗ trợ đắc lực cho nhu cầu truyền tin và khai thác thông
tin dữ liệu của nhân loại. Trong đó, hệ thống Internet được mọi
người quan tâm sử dụng nhiều nhất nhờ tính thông dụng trong
việc giao tiếp, tìm kiếm và đọc thông tin bằng tính năng ưu việt
của các phần mềm ứng dụng về quản lý, số hóa tài liệu.
Do yêu cầu của quá trình hội nhập đang diễn ra mạnh mẽ,
việc công khai minh bạch các văn bản, chính sách của nhà nước
đến mọi đối tượng trở thành vấn đề bắt buộc. Đặc biệt việc nâng
cao chất lượng thông tin phục vụ nhu cầu nghiên cứu quyết
định đầu tư, sản xuất cho các nhà đầu tư trong và ngoài nước
3
trên lĩnh vực quản lý nhà nước, kinh tế, văn hóa, xã hội, lịch sử
truyền thống cũng như nhu cầu tra cứu tài liệu khoa học phải
được chú trọng. Một trong những nguồn thông tin được mọi
người quan tâm nhiều nhất là thông tin từ tài liệu lưu trữ.
Mặt khác theo thời gian, lượng tài liệu lưu trữ tăng lên,
dưới góc độ quản lý nhà nước, việc bảo quản và sử dụng có
hiệu quả giá trị tài liệu lưu trữ có ý nghĩa cực kỳ quan trọng đối
với kinh tế, xã hội, lịch sử của mỗi quốc gia và địa phương. Vì
vậy, song song với chương trình cung cấp thông tin không thụ
động thông qua hệ thống Internet (Trang Web điện tử) và hệ
thống thông tin viễn thông thì việc ứng dụng các công nghệ, kĩ
thuật hiện đại vào bảo quản lâu dài các tài liệu có giá trị để dần
thay thế cho phương pháp bảo quản truyền thống đã trở thành
một nhiệm vụ cấp bách của công tác lưu trữ.
Số hóa tài liệu lưu trữ là biện pháp tối ưu, giúp giải quyết
việc lưu trữ, truy xuất, chia sẻ hay tìm kiếm thông tin hết sức dễ
dàng. Cắt giảm chi phí tối đa cho việc quản lý và không gian
lưu trữ. Ngoài ra số hóa tài liệu giúp chúng ta có thể chỉnh sửa
và tái sử dụng tài liệu, linh hoạt trong việc chuyển đổi sang các
dạng tài liệu số khác nhau.
Quá trình số hóa tài liệu đã được bắt đầu từ khá lâu trên thế
giới. Và đến nay, hầu hết những thư viện lớn và các cơ quan lưu
trữ trên thế giới đều đã thực hiện song song hai loại hình truyền
thống và số hóa. Với hệ thống lưu trữ số hóa điện tử, tài liệu lưu
trữ đã phát huy tối đa hiệu quả trong việc phục vụ cho lợi ích
phát triển kinh tế, văn hóa và giáo dục truyền thống lịch sử cho
thế hệ trẻ.
Nhận thức được vấn đề trên, tác giả đã lựa chọn đề tài “Dự
án số hóa tài liệu lưu trữ Trung tâm Lưu trữ Quốc gia III”
làm đề tài nghiên cứu cho luận văn tốt nghiệp của mình.
4
2. Mục tiêu và nhiệm vụ nghiên cứu
Mục tiêu chính của đề tài là nghiên cứu đề xuất giải pháp để
xây dựng dự án số hóa khối tài liệu lưu trữ hành chính đang bảo
quản tại Trung tâm Lưu trữ Quốc gia III.
Để có thể thực hiện mục tiêu, nhiệm vụ nghiên cứu của đề
tài bao gồm:
- Tiến hành khảo sát thực tế tình hình tài liệu lưu trữ
đang bảo quản tại Trung tâm Lưu trữ Quốc gia III.
- Nghiên cứu, tổng hợp cơ sở lý luận, kinh nghiệm về số
hóa tài liệu lưu trữ với mục đích bảo quản và tổ chức
khai thác sử dụng tài liệu lưu trữ của các nước có nền
lưu trữ tiến bộ như: Mỹ, Nga, Úc... Trên cơ sở đó khái
quát một cách hệ thống, lựa chọn hợp lý và vận dụng
sáng tạo vào hoàn cảnh thực tế của Trung tâm Lưu trữ
Quốc gia III và làm nền tảng trong suốt quá trình
nghiên cứu luận văn.
- Trên cơ sở đó đề xuất các giải pháp nhằm xây dựng dự
án số hóa khối tài liệu lưu trữ hành chính đang bảo
quản tại Trung tâm Lưu trữ Quốc gia III đảm bảo theo
mục tiêu đã đề ra
3. Đối tượng và phạm vi nghiên cứu
a. Đối tượng nghiên cứu của đề tài
- Các phông tài liệu lưu trữ đang bảo quản tại Trung
tâm Lưu trữ Quốc gia III.
- Các tài liệu trong và ngoài nước liên quan đến việc
thực hiện dự án số hóa trong ngành lưu trữ như: tài
liệu về tiêu chuẩn, báo cáo thực hiện dự án, cẩm
nang thực hiện và quản lý dự án số hóa
5
- Các phương pháp, công nghệ, quy trình số hóa tài
liệu.
b. Phạm vi nghiên cứu của đề tài
- Đối với tài liệu lưu trữ: Đề tài tập trung nghiên cứu
việc số hóa khối tài liệu lưu trữ hành chính trên vật
mang tin bằng giấy đang bảo quản tại Trung tâm
Lưu trữ Quốc gia III do đây là tài liệu lưu trữ chiếm
số lượng nhiều nhất trong các loại hình đang bảo
quản tại Trung tâm. Các loại hình tài liệu lưu trữ
trên vật mang tin khác như: phim, ảnh, ghi âm,
băng, tài liệu xây dựng cơ bản, tài liệu khoa học kỹ
thuật sẽ không thuộc phạm vi nghiên cứu của đề
tài này.
- Đối với phương pháp số hóa: chủ yếu tập trung
nghiên cứu và sử dụng phương pháp số hóa bằng hệ
thống quản lý và tự động số hóa tài liệu
(ITISCANNER) để triển khai số hóa, còn các hệ
thống, thiết bị số hóa khác sẽ không được đề cập
chi tiết tại đề tài này.
4. Lịch sử nghiên cứu
Công nghệ kỹ thuật số hóa đã hình thành vào cuối thế kỷ
XX và phát triển rất nhanh vào đầu thế kỷ XXI. Công nghệ kỹ
thuật số nói chung, kỹ thuật số hóa nói riêng đã mở ra kỷ
nguyên mới về sự tiến bộ của nhân loại, là thời đại kỹ thuật số.
Những ưu điểm nổi bật của nó đã làm cho kỹ thuật mới này
nhanh chóng phổ biến trên toàn thế giới, nhiều nước đã và đang
nghiên cứu và tiến hành dự án số hóa tài liệu với quy mô khác
nhau. Trong số đó phải kể đến một số nước tiêu biểu với quy
mô lớn như: Mỹ, Nga, Đức, Trung Quốc, Úc Lĩnh vực tiêu
6
biểu đi đầu trong việc áp dụng công nghệ này là thư viện, bảo
tàng và lưu trữ với mục tiêu bảo quản, bảo hiểm tài liệu nguyên
bản, sách, phim, ảnh, ghi âm đang trong tình trạng bị xuống
cấp, có yêu cầu sử dụng cao và tăng cường, tạo điều kiện cho
việc khai thác sử dụng, chia sẻ nguồn thông tin một cách nhanh
chóng, hiệu quả.
Tại nước ta, nhiều dự án số hóa đã được tiến hành tiêu biểu
trong ngành lưu trữ, thư viện và phim điện ảnh. Về lĩnh vực lưu
trữ, một số dự án cấp quốc gia đã được tiến hành như: dự án số
hóa tài liệu châu bản và mộc bản Triều Nguyễn năm 1993-2003,
Đề án bảo hiểm tài liệu lưu trữ Quốc gia, các Trung tâm lưu trữ
Quốc gia khác đều có dự án số hóa tài liệu lưu trữ nhằm mục
đích bảo hiểm, tăng cường việc tổ chức khai thác sử dụng, tại
một số lưu trữ tỉnh, huyện cũng đã bắt đầu thực hiện dự án số
hóa tài liệu lưu trữ. Nhiều văn bản quy phạm pháp luật và
hướng dẫn nghiệp vụ đã được ban hành như: Luật lưu trữ, Nghị
định số 01/2013/NĐ-CP ngày 03/01/2013 của Chính phủ quy
định chi tiết thi hành một số điều của Luật lưu trữ
Ngoài ra còn có nhiều bài viết trên tạp chí chuyên ngành
cũng đề cập đến vấn đề số hóa nhưng phần lớn chỉ mang tính
chất giới thiệu, chưa đi sâu về vấn đề triển khai cụ thể.
Trong lĩnh vực thư viện, hiện nay các cơ quan quản lý, cơ
quan sự nghiệp đang có xu hướng triển khai xây dựng thư
viện điện tử, trong đó việc số hóa nguồn tài liệu, sách, ấn
phẩm là một trong những nội dung quan trọng để chuyển đổi
từ hình thức thư viện truyền thống sang thư viện điện tử. Do đó,
việc nghiên cứu để xây dựng mô hình và tổ chức triển khai các
dự án số hóa các nguồn tài nguyên thông tin này ngày càng
được quan tâm và diễn ra một cách rộng rãi.
7
Đối với Trung tâm lưu trữ Quốc gia III, việc ứng dụng công
nghệ số hóa vào công tác lưu trữ đang là vấn đề rất được quan
tâm. Sau khi tìm hiểu và khảo sát lịch sử nghiên cứu vấn đề số
hóa tài liệu lưu trữ ở nước ngoài nói chung và ở Việt Nam, tôi
thấy rằng từ trước đến này chưa có công trình nghiên cứu nào
nghiên cứu về đề tài “Dự án số hóa tài liệu lưu trữ Trung tâm
Lưu trữ Quốc gia III”. Vì vậy, đây là một đề tài nghiên cứu
hoàn toàn mới và chưa có công trình nào đề cập đến.
5. Phương pháp nghiên cứu
- Phương pháp phân tích và tổng hợp
- Phương pháp khảo sát
- Phương pháp so sánh
- Phương pháp phỏng vấn
Ngoài ra, các phương pháp thống kê, phương pháp logic
cũng được kết hợp sử dụng trong quá trình nghiên cứu. Chúng
đã giúp tôi nhìn nhận các vấn đề trong quá trình triển khai số
hóa tài liệu lưu trữ một cách toàn diện, đầy đủ và khách quan về
mọi khía cạnh của vấn đề.
6. Nguồn tài liệu tham khảo
Việc ứng dụng công nghệ số hóa vào công tác lưu trữ là vấn
đề rất được quan tâm của ngành lưu trữ Việt Nam. Còn các
nước có nền lưu trữ phát triển, họ đã đi trước và có rất nhiều bài
học kinh nghiệm trong quá trình triển khai các dự án số hóa tài
liệu lưu trữ. Cho nên trong quá trình nghiên cứu tôi đã sử dụng
các nguồn tài liệu chủ yếu viết bằng tiếng Anh, tiếng Việt về
các vấn đề như lý luận, quy phạm pháp luật, hướng dẫn thực
hiện nghiệp vụ, tiêu chuẩn kỹ thuật số hóa.
8
7. Kết quả của đề tài
- Kết quả nghiên cứu của đề tài sẽ là cơ sở để áp dụng
vào việc triển khai dự án số hóa tài liệu lưu trữ đang
bảo quản tại Trung tâm Lưu trữ Quốc gia III trong thời
gian tới.
- Kết quả nghiên cứu của đề tài sẽ là nguồn tài liệu tham
khảo hữu ích cho việc triển khai các dự án số hóa
không chỉ tài liệu lưu trữ mà còn các loại tài liệu khác
sẽ được triển khai trong tương lai trên phạm vi cả nước.
- Kết quả nghiên cứu của đề tài sẽ là nguồn tài liệu tham
khảo bổ ích cho sinh viên muốn tìm hiểu, đi sâu trong
lĩnh vực số hóa tài liệu lưu trữ hiện đang là vấn đề rất
mới đối với sinh viên. Đặc biệt được biết thêm nguồn
thông tin về tình trạng tài liệu lưu trữ và các giải pháp,
cách thức triển khai số hóa tài liệu lưu trữ trong bối
cảnh của Trung tâm Lưu trữ Quốc gia III.
8. Kết cấu của đề tài
Ngoài phần mở đầu, kết luận, danh mục tài liệu tham khảo,
phụ lục, phần nội dung của đề tài được trình bày trong 3
chương:
Chương 1: Hiện trạng tài liệu lưu trữ đang bảo quản tại
Trung tâm Lưu trữ Quốc gia III
Chương 2: Nghiệp vụ số hóa tài liệu lưu trữ
Chương 3: Dự án số hóa tài liệu lưu trữ Trung Tâm
Lưu trữ Quốc gia III
Đề tài mang tính kỹ thuật, thực tiễn cao. Do trình độ nghiên
cứu, kinh nghiệm thực tế còn hạn chế cho nên nội dung được
trình bày trong luận văn sẽ không tránh khỏi khiếm khuyết, sai
9
sót. Do vậy, tác giả rất hy vọng sẽ nhận được những góp ý của
các thầy cô giáo và bạn đọc, để tiếp tục nghiên cứu cho hoàn
thiện hơn.
Trong quá trình thực hiện đề tài, tác giả đã gặp rất nhiều
khó khăn trong việc nghiên cứu, đi khảo sát thực tế nhưng cũng
đã nhận được sự quan tâm, giúp đỡ rất nhiệt tình của các cán bộ
của Trung tâm Lưu trữ Quốc gia III, các thầy cô giáo trong
Viện Công nghệ thông tin,Trường Đại học Quốc gia Hà Nội,
đặc biệt là của thầy giáo hướng dẫn TS. Lê Quang Minh. Nhân
đây, tác giả xin bày tỏ lòng biết ơn chân thành, sâu sắc nhất về
sự quan tâm, giúp đỡ quý báu đó.
10
CHƯƠNG 1: HIỆN TRẠNG TÀI LIỆU LƯU TRỮ
ĐANG BẢO QUẢN TẠI TRUNG TÂM LƯU TRỮ QUỐC
GIA III
1.1. Trung tâm Lưu trữ Quốc gia III
1.2. Cơ cấu tổ chức và chức năng nhiệm vụ
1.3. Tình hình tài liệu lưu trữ tại Trung tâm Lưu trữ
Quốc gia III
1.3.1. Nội dung và thành phần tài liệu lưu trữ tại Trung
tâm
Toàn bộ tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu
trữ Quốc gia III được hình thành trong quá trình hoạt động của
cơ quan thuộc bộ máy Nhà nước Trung ương, các bộ, ngành,
các đoàn thể xã hội và các liên khu, khu được thành lập từ
những ngày đầu tiên của nước Việt Nam Dân chủ Cộng hòa cho
tới nay. Đồng thời, những tài liệu này là những chứng cứ lịch sử
phản ánh chân thực, khách quan và toàn diện cả một quá trình
thành lập, xây dựng và bảo vệ đất nước Việt Nam độc lập hơn
60 năm qua.
Ngay sau khi thành lập, Trung tâm Lưu trữ Quốc gia III đã
tiếp nhận từ Trung tâm Lưu trữ Quốc gia I khoảng 3,6 km/giá
tài liệu thuộc thẩm quyền quản lý của mình. Từ đó đến nay,
Trung tâm Lưu trữ Quốc gia III đã thu thập thêm được nhiều tài
liệu đưa tổng số lên hơn 12 km/giá gồm 5 khối tài liệu chính
sau:
- Tài liệu hành chính.
- Tài liệu khoa học kỹ thuật.
- Tài liệu phim ảnh ghi âm.
11
- Tài liệu xuất xứ cá nhân.
- Tài liệu sưu tầm.
1.3.2. Hình thức tài liệu lưu trữ tại Trung tâm
1.3.3. Tình trạng vật lý của tài liệu lưu trữ tại Trung tâm
- Trong khối tài liệu hành chính và cá nhân, gia đình,
dòng họ có một số tài liệu tình trạng vật lý kém: bị ố
vàng, mờ và nhiễm độ axít.
- Tài liệu do Trung tâm Lưu trữ Quốc gia III đang bảo
quản đứng trước nguy cơ bị hủy hoại nghiêm trọng do
nhiều yếu tố khách quan và chủ quan.
1.3.4. Giá trị của tài liệu lưu trữ tại Trung tâm
Là một trong bốn Trung tâm Lưu trữ Quốc gia đang bảo
quản khối tài liệu quan trọng nhất của phông Lưu trữ Quốc gia
Việt Nam, thông tin chứa đựng trong tài liệu lưu trữ đang được
bảo quản tại Trung tâm III bao quát hầu hết các ngành, các mặt,
các lĩnh vực của đời sống xã hội và có giá trị nhiều mặt.
1.4. Nhận xét chung
Tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc
gia III là một nguồn sử liệu quý giá phản ánh quá trình lịch sử
của đất nước. Có thể nói rằng những tài liệu đang bảo quản
phần lớn chỉ có duy nhất tại Trung tâm Lưu trữ Quốc gia III,
chúng có ý nghĩa hết sức quan trọng đối với việc nghiên cứu
lịch sử, nghiên cứu các lĩnh vực chính trị, kinh tế, xã hội, an
ninh, quốc phòng, giáo dục, và là tài sản vô giá của đất nước.
Qua một số thông tin đã nêu trên phần nào giúp chúng ta
hình dung được đến thực trạng, mức độ hư hỏng của tài liệu lưu
trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III. Tài liệu
12
lưu trữ với tư cách là một loại hình thuộc di sản quốc gia đang
trong tình trạng hư hỏng, xuống cấp và có nguy cơ tự mất đi
vĩnh viễn do tác động tự thân tài liệu, điều kiện bảo quản và sử
dụng không đảm bảo.
Chúng ta cần phải tăng cường nghiên cứu những tiến bộ
khoa học của nhân loại để áp dụng phù hợp với hoàn cảnh thực
tế của trung tâm. Với vai trò, giá trị, ý nghĩa và tình trạng thực
tế của tài liệu lưu trữ đã nêu trên thì việc áp dụng phương pháp
số hóa là một trong những phương pháp có thể giải quyết một
số trong những vấn đề quan trọng thực tế đang đặt ra trong hoàn
cảnh của Trung tâm Lưu trữ Quốc gia III với những ưu điểm và
hạn chế sẽ được đề cập tại Chương II. Chúng ta cũng cần phải
lưu ý rằng, đây chỉ là một trong những phương pháp có thể giải
quyết được một số trong những vấn đề quan trọng chứ không
phải tất cả. Vấn đề đặt ra là muốn triển khai phương pháp số
hóa tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc
gia III sẽ phải có cách thức tổ chức, tiến hành công việc, quy
trình có liên quan như thế nào nhằm giải quyết những vấn đề
thực tiễn đang đặt ra một cách hiệu quả.
Toàn bộ những vấn đề này sẽ được đề cập tại chương III,
đồng thời cũng là nội dung cốt lõi của luận văn này.
TIỂU KẾT CHƯƠNG 1
Chương này tập trung trình bày kết quả khảo sát thực tế
thực trạng tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ
Quốc gia III để làm cơ sở trong việc nghiên cứu, xây dựng các
biện pháp để triển khai số hóa tài liệu lưu trữ
13
CHƯƠNG 2: NGHIỆP VỤ SỐ HÓA TÀI LIỆU LƯU
TRỮ
1.1. Một số khái niệm, thuật ngữ cơ bản về số hóa tài
liệu lưu trữ
- Số hóa (Digitising): Số hoá là hình thức chuyển đổi dữ
liệu truyền thống bên ngoài (Analog) thành dạng dữ
liệu số (Digital) mà máy tính có thể hiểu được
- Số hóa tài liệu lưu trữ: Số hoá tài liệu lưu trữ là hình
thức chuyển đổi thông tin tài liệu lưu trữ ở dạng truyền
thống bên ngoài (Analog) thành những thông tin dưới
dạng số (Digital) bằng phương tiện điện tử chuyển đổi
tín hiệu (máy quét/chụp hình) mà máy tính có thể hiểu
được.
1.2. Mục tiêu áp dụng kỹ thuật số hóa đối với tài liệu lưu
trữ
Đối với tài liệu lưu trữ, mục tiêu trong việc áp dụng kỹ
thuật số hóa chủ yếu tập trung vào 3 mục tiêu chính như sau:
- Mục tiêu 1: Đồng nhất các loại hình tài liệu lưu trữ từ
dạng tương tự sang dạng số
- Mục tiêu 2: Kéo dài tuổi thọ của tài liệu lưu trữ bản gốc
- Mục tiêu 3: Quản lý và khai thác tập trung nguồn tài
liệu số hóa
1.3. Những ưu điểm và hạn chế của kỹ thuật số hóa tài
liệu lưu trữ
1.3.1. Ưu điểm
- Giúp nâng cao trong việc bảo quản an toàn tài liệu lưu
trữ bản gốc đang trong tình trạng hư hỏng về tình trạng
14
vật lý và nội dung thông tin bằng cách sử dụng tài liệu
số hóa thay thế việc sử dụng trực tiếp, thường xuyên tài
liệu gốc và áp dụng các biện pháp củng cố, nâng cao
chất lượng đối với tài liệu gốc để kéo dài tuổi thọ.
- Nâng cao việc quản lý và tổ chức sử dụng nguồn tài
liệu lưu trữ của cơ quan lưu trữ phục vụ việc chia sẻ, tra
tìm, truy cập nguồn thông tin của các đối tượng độc giả
một cách nhanh chóng, chính xác, thuận tiện vượt qua
giới hạn về không gian và thời gian.
- Nâng cao chất lượng hiển thị của nguồn thông tin từ tài
liệu lưu trữ bản gốc (có tình trạng vật lý, nội dung kém
như: mờ, vết bẩn, thủng) tốt hơn bằng chương trình
phần mềm hiệu chỉnh/đồ họa chuyên dụng như: tăng độ
nét, độ sáng tối, xóa vết bẩn trên bề mặt tài liệu gốc
- Góp phần hiện đại hóa công tác lưu trữ của cơ quan lưu
trữ.
- Kỹ thuật số hóa có thể được sử dụng để hỗ trợ lẫn nhau
với các phương pháp khác để tăng cường khả năng bảo
quản và tổ chức khai thác sử dụng tài liệu lưu trữ một
cách hiệu quả hơn.
1.3.2. Hạn chế
- Để áp dụng thành công phương pháp này, đòi hỏi phải
nghiên cứu, tính toán rất kỹ và khách quan, trên cơ sở
đó lập kế hoạch phát triển cho phù hợp trong từng giai
đoạn.
- Phải đầu tư kinh phí tương đối nhiều trong quá trình
triển khai cũng như quản lý, sử dụng.
15
- Tài liệu số hoá có thời hạn tuổi thọ không cao vì nó phụ
thuộc vào vật mang tin, phần cứng, phần mềm tương
ứng. Do công nghệ thông tin thay đổi rất nhanh, cho
nên tài liệu số hóa cũng không ngừng phải nâng cấp
theo. Điều này dẫn đến phải sử dụng kinh phí tương đối
nhiều. Mặt khác, để tiếp cận được dạng tài liệu này,
chúng ta phải có thiết bị điện tử, phương tiện kết nối
thích hợp.
- Đòi hỏi cán bộ có trình độ chuyên môn giỏi đáp ứng
các yêu cầu công việc khác nhau trong từng khâu của
chuỗi số hoá tài liệu.
1.4. Tổng quan về kỹ thuật số hóa tài liệu
1.4.1. Một số thiết bị chuyển đổi: máy scan, máy chụp ảnh
số
1.4.2. Thuộc tính của tài liệu
Thuộc tính của tài liệu hiện nay được chia thành 4 loại như
sau: Bản văn/ dòng (Text/line art), Tông màu chuyển tiếp
(continuous tone), Nửa tông hoặc kiểu nửa tông (Halftone or
halftone -like), Hỗn hợp (Mixed).
1.4.3. Kỹ thuật quét tài liệu
Để quét các loại tài liệu có thuộc tính khác nhau và phù hợp
với yêu cầu đầu ra thì có ba kỹ thuật quét tài liệu được sử dụng,
đó là kỹ thuật quét đen trắng (Bitonal), kỹ thuật quét dải xám
(Grayscale) và kỹ thuật quét màu (Color).
1.4.4. Những yếu tố tác động đến chất lượng ảnh số
Chất lượng của ảnh số phụ thuộc vào 6 yếu tố cơ bản đó là:
- Tình trạng của tài liệu (Condition of records)
16
- Độ phân giải, độ ngưỡng và độ sâu màu (Resolution,
Threshold and Bit depth)
- Hiệu chỉnh ảnh (Image Enhancement)
- Quá trình nén và định dạng file (Compression and File
Format)
- Thiết bị sử dụng và hiệu suất của thiết bị đó (System
Performance)
- Quyết định của người vận hành (Operator Judgement)
1.5. Tổng quan về nhận dạng ký tự quang học (OCR)
Nhận dạng ký tự quang học (Optical Character Recognition
– OCR) là kỹ thuật chuyển các hình ảnh của chữ viết tay hoặc
chữ đánh máy (thường được quét bằng máy scanner, chụp ảnh)
thành các văn bản tài liệu. Giả sử ta có một văn bản tài liệu bản
cứng, sau khi quét bằng máy scanner thành file ảnh, phần mềm
OCR sẽ nhận dạng file ảnh đã quét đó thành file văn bản lưu trữ
trên máy tính có thể chỉnh sửa được trên máy tính.
Lịch sử của OCR đã có từ hơn nửa thế kỷ, nó xuất hiện đầu
tiên để giải quyết bài toán đọc mã số trong bưu điện, tiếp đó
phát triển để tự động đọc các địa chỉ và đọc các thông tin trong
các mẫu đơn, văn bản. Ngày nay với sự phát triển mạnh mẽ,
OCR trở nên phổ biến và thường được ứng dụng như một phần
mềm cài đặt trên máy tính hoặc tích hợp kèm với phần cứng
như tích hợp trong máy scan.
Đối với dự án số hóa tài liệu lưu trữ của Trung tâm Lưu trữ
Quốc gia III, việc nhận dạng ký tự quang học để chuyển đổi ảnh
quét bằng máy scan sang các định dạng lưu trữ khác để thuận
17
tiện trong việc tra cứu và lưu trữ như pdf, doc, cũng rất quan
trọng trong quy trình thực hiện số hóa tài liệu lưu trữ.
1.6. Xây dựng siêu dữ liệu cho tài liệu được số hóa
Vấn đề số hóa văn bản với phương pháp quét ảnh đã được
thực hiện phổ biến từ lâu. Tuy nhiên, việc số hóa chỉ dừng lại ở
việc chuyển các văn bản giấy thành file ảnh quét mà không có
thêm các thông tin nào khác. Các file ảnh quét này, sau đó,
thường được lưu trữ trên file hệ thống mà không có bất cứ hình
thức quản lý nào khác. Như vậy, việc khai thác và lưu trữ sẽ rất
kém hiệu quả.
Các phần mềm quét ảnh (đi kèm với thiết bị, hoặc thuộc
hãng thứ ba) có khả năng quét ảnh rất tốt. Tuy nhiên, các phần
mềm này thường cũng chỉ cho ra các file ảnh quét (với nhiều
định dạng khác nhau) mà chưa hỗ trợ việc tạo lập metadata
trong quá trình quét.
Để đảm bảo khả năng quản lý, khai thác và lưu trữ các file
ảnh quét được quét từ các văn bản giấy, thì các phần mềm số
hóa phải có khả năng tạo lập metadata cho tài liệu được quét
vào (tự động hoặc thông qua nhập liệu). Các thông tin metadata
này phải được tạo lập ra cùng với file ảnh quét và được lưu trữ
cùng với file ảnh quét.
1.6.1. Tạo lập metadata
1.6.2. Lựa chọn chuẩn dữ liệu đặc tả
Hiện nay, việc xây dựng quy chuẩn Việt Nam về dữ liệu
đặc tả cũng được dựa trên chuẩn Dublin Core (Công văn 839
ngày 29/9/2011 – Bộ thông tin và truyền thông).
Bộ thành tố dữ liệu đặc tả Dublin Core lúc đầu được thiết
kế chủ yếu cho mục đích mô tả. Các thành tố dữ liệu đặc tả
Dublin Core có những ưu điểm sau:
18
- Tạo lập và sử dụng dễ dàng.
- Ngữ nghĩa dễ hiểu, sử dụng đơn giản.
- Phạm vi phổ biến.
- Tính mở rộng.
- Giúp nâng cao độ chính xác của định chỉ số.
- Có khả năng liên tác (Interoperability), sử dụng lẫn
nhau.
- Mở rộng thuận lợi
1.6.3. Đề xuất metadata cho tài liệu được số hóa
Việc rút trích và tạo metadata cho các tài liệu điện tử giúp
cho việc sắp xếp tài liệu một cách khoa học và hỗ trợ người
dùng có thể tìm kiếm chúng một cách dễ dàng.
Đề xuất các yếu tố metadata của chuẩn Dublin core trong
việc tạo lập, sử dụng, lưu trữ dữ liệu đặc tả đối với văn bản số
TIỂU KẾT CHƯƠNG 2
Nội dung chương này, tôi tập trung trình bày kết quả
nghiên cứu, tập hợp, hệ thống lại các nguồn thông tin, kinh
nghiệm của một số nước liên quan đến các vấn đề cơ bản như:
khái niệm, giải thích một số thuật ngữ chuyên môn; đưa ra mục
tiêu chủ yếu trong việc áp dụng kỹ thuật số hóa; những ưu
điểm, hạn chế của nó; trình bày khái quát, tổng quan về kỹ thuật
số hóa, kỹ thuật nhận dạng ký tự quang học và tạo lập siêu dữ
liệu cho tài liệu số hóa. Đây là nền tảng về lý thuyết cơ bản của
luận văn số hóa tài liệu lưu trữ, đồng thời là cơ sở đề xuất dự án
triển khai số hóa tài liệu lưu trữ đang bảo quản tại Trung tâm
Lưu trữ Quốc gia III được đề cập tại chương III.
19
CHƯƠNG 3: DỰ ÁN SỐ HÓA TÀI LIỆU LƯU TRỮ
TRUNG TÂM LƯU TRỮ QUỐC GIA III
2.1. Cơ sở lý luận và bối cảnh hình thành dự án
2.2. Mục tiêu của dự án
2.2.1. Mục tiêu chung
Chuyển phương thức hoạt động của lưu trữ truyền thống
sang lưu trữ điện tử cụ thể là thực hiện số hóa tài liệu lưu trữ
đang được lưu trữ tại Trung tâm Lưu trữ Quốc gia III, trong đó
ưu tiên số hóa các tài liệu lưu trữ hành chính vì đây là khối tài
liệu lưu trữ chiếm khối lượng lớn nhất trong tổng số các khối tài
liệu đang được lưu trữ tại Trung tâm. Với mục tiêu bảo hiểm,
kéo dài tuổi thọ tài liệu lưu trữ gốc và tổ chức sử dụng chúng
bằng bản sao số hóa từ tài liệu lưu trữ.
2.2.2. Mục tiêu cụ thể
- Tài liệu lưu trữ được số hóa đảm bảo chất lượng, hiệu quả
sử dụng; đảm bảo có các bản sao lưu dự phòng tài liệu lưu
trữ gốc và hỗ trợ việc thực hiện duy tu, bảo dưỡng, kiểm
soát tài liệu.
- Tăng cường khả năng khai thác, truy cập đến nguồn tài liệu
lưu trữ của các đối tượng độc giả khác nhau một cách hiệu
quả, rộng rãi nhằm phát huy giá trị thông tin vốn có của tài
liệu lưu trữ vào sự phát triển kinh tế -xã hội.
- Giảm thiểu sự xuống cấp về mặt vật lý và hóa học của tài
liệu gốc do phải lưu thông thường xuyên trong quá trình
khai thác, sử dụng.
2.3. Nội dung triển khai và giải pháp thực hiện
2.3.1. Giải pháp về quy trình số hóa
20
Quy trình này nhằm tạo ra 3 phiên bản ảnh số:
- Tạo ra bản master của tài liệu lưu trữ đã được số hóa
đạt chất lượng cao
- Tạo ra bản phát sinh
- Tạo bản để ghi phim bảo hiểm
Quy trình số hóa bao gồm các bước chính sau:
- Chuẩn bị tài liệu để số hóa
- Quét tài liệu bằng máy quét
- Tạo ra các phiên bản ảnh số
- Nhận dạng ký tự quang học
- Tạo siêu dữ liệu, lập chỉ mục
- Lưu trữ
- Tổ chức khai thác sử dụng
2.3.2. Giải pháp hệ thống công nghệ thực hiện số hóa
Hệ thống ITISCANNER là kết quả của sự kết hợp giữa các
công nghệ số hóa hàng đầu như:
- Công nghệ nhận dạng tiếng việt.
- Công nghệ xử lý tiếng việt.
- Công nghệ tự động tách bộ lập chỉ mục.
- Hệ thống quản trị tài liệu.
2.4. Dự toán kinh phí cho dự án
21
TIỂU KẾT CHƯƠNG 3
Chương 3 tập trung trình bày kết quả nghiên cứu, khảo sát
để triển khai dự án số hóa tài liệu lưu trữ đang bảo quản tại
Trung tậm Lưu trữ Quốc gia III. Đưa ra các giải pháp nhằm
thực hiện theo mục tiêu của đề tài, đưa ra được quy trình kỹ
thuật số hóa, các giải pháp kỹ thuật, dự toán kinh phí cho dự án.
Tuy nhiên, còn có nhiều vấn đề cần được tiếp tục nghiên cứu,
giải quyết như: quy định của pháp luật về vấn đề số hóa, nguồn
kinh phí cụ thể, quy trình công việc cho toàn bộ dự án số hóa từ
vấn đề quản lý đến kiểm soát chất lượng... Do phần lớn công
việc số hóa liên quan đến vấn đề kỹ thuật nhiều hơn, cho nên
phần nội dung kỹ thuật không thể trình bày, nêu một cách chi
tiết tại luận văn bởi vì tính phức tạp, đa dạng của các tình huống
khác nhau của chúng. Cuối cùng, tôi mong rằng những giải
pháp đã nêu sẽ đóng góp trong việc định hướng cho cơ quan
quản lý nhà nước có thẩm quyền nói chung, Trung tâm Lưu trữ
Quốc gia III nói riêng có cách nhìn một cách toàn diện, khách
quan để tổ chức triển khai số hóa tài liệu lưu trữ đạt hiệu quả
cao, mang lại lợi ích thiết thực cho toàn xã hội.
22
KẾT LUẬN
Sự tiến bộ của nhân loại về khoa học – công nghệ, trong đó
là sự xuất hiện và phát triển mạnh mẽ của công nghệ số hóa tài
liệu đã mang lại cơ hội mới trong lĩnh vực lưu trữ, thư viện và
bảo tàng để tăng cường khả năng bảo quản tài liệu gốc và tiếp
cận nguồn thông tin một cách thuận lợi, nhanh chóng, vượt qua
giới hạn về thời gian và không gian chưa từng có trong lịch sử
của loại người. Trung tâm Lưu trữ Quốc gia III cũng đang
chuẩn bị triển khai việc áp dụng công nghệ số hóa vào tài liệu
lưu trữ đang bảo quản tại Trung tâm nhằm đạt được các mục
tiêu chung đó.
Mục tiêu chính của đề tài nhằm nghiên cứu đề xuất các giải
pháp để triển khai dự án số hóa khối tài liệu lưu trữ hành chính
đang bảo quản tại Trung tâm Lưu trữ Quốc gia III bằng hệ
thống ITISCANNER. Kết quả nghiên cứu của luận văn có thể
khái quát như sau:
- Nghiên cứu, tổng hợp cơ sở lý luận, kinh nghiệm, phân
tích mục đích và mô hình áp dụng kỹ thuật số hóa tài
liệu lưu trữ, ưu điểm-nhược điểm và tổng quan về kỹ
thuật số hóa tài liệu lưu trữ. Đây vừa là nền tảng lý luận
vừa là luận chứng về khả năng áp dụng công nghệ số
hóa để triển khai dự án số hóa tài liệu lưu trữ đang bảo
quản tại Trung tâm Lưu trữ Quốc gia III.
- Để đảm bảo việc triển khai dự án số hóa tài liệu lưu trữ
có tính khả thi và hiệu quả cao, tiến hành khảo sát thực
tế khối tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu
trữ Quốc gia III và đưa ra những dữ liệu về các vấn đề
như: số lượng, thời gian, đặc điểm, tình trạng vật lý và
mức độ hư hỏng của tài liệu lưu trữ Trên cơ sở đó,
23
đánh giá khả năng áp dụng công nghệ số hóa đối với
khối tài liệu lưu trữ này.
- Đề xuất các giải pháp về quy trình số hóa, công nghệ sử
dụng, dự toán kinh phí để thực hiện dự án số hóa tài
liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc
gia III
Từ những kết quả trên, về cơ bản đã giải quyết những mục
tiêu và nhiệm vụ của đề tài đã đề ra, đồng thời định hướng
những vấn đề cần được tiếp tục nghiên cứu và giải quyết với
các đề tài khác trong thời gian tới.
Hy vọng với những những kết quả nghiên cứu đã đạt được
sẽ đóng góp thiết thực cho việc triển khai số hóa tài liệu lưu trữ
đang bảo quản tại Trung tâm Lưu trữ Quốc gia III dự kiến sẽ
tiến hành trong tương lai đạt được kết quả tốt. Đồng thời, góp
phần trong việc bảo vệ, kéo dài tuổi thọ tài liệu lưu trữ gốc và
phát huy giá trị của tài liệu lưu trữ trong công cuộc xây dựng và
bảo vệ đất nước.
Tôi hiểu rằng những vấn đề đã đề cập trong luận văn còn
một số vấn đề chưa được trình bày, phân tích, giải quyết thấu
đáo hoặc phải tiếp tục nghiên cứu cặn kẽ hơn. Tôi mong rằng sẽ
nhận được sự chỉ bảo, góp ý của các nhà khoa học, các bạn
đồng nghiệp để luận văn của tôi được hoàn thiện hơn.
Các file đính kèm theo tài liệu này:
- du_an_so_hoa_tai_lieu_luu_tru_trung_tam_luu_tru_quoc_gia_iii_1148.pdf