[Tóm tắt] Luận văn Dự án số hóa tài liệu lưu trữ trung tâm lưu trữ Quốc gia III

Mục tiêu chính của đề tài nhằm nghiên cứu đề xuất các giải pháp để triển khai dự án số hóa khối tài liệu lưu trữ hành chính đang bảo quản tại Trung tâm Lưu trữ Quốc gia III bằng hệ thống ITISCANNER. Kết quả nghiên cứu của luận văn có thể khái quát như sau: - Nghiên cứu, tổng hợp cơ sở lý luận, kinh nghiệm, phân tích mục đích và mô hình áp dụng kỹ thuật số hóa tài liệu lưu trữ, ưu điểm-nhược điểm và tổng quan về kỹ thuật số hóa tài liệu lưu trữ. Đây vừa là nền tảng lý luận vừa là luận chứng về khả năng áp dụng công nghệ số hóa để triển khai dự án số hóa tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III. - Để đảm bảo việc triển khai dự án số hóa tài liệu lưu trữ có tính khả thi và hiệu quả cao, tiến hành khảo sát thực tế khối tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III và đưa ra những dữ liệu về các vấn đề như: số lượng, thời gian, đặc điểm, tình trạng vật lý và mức độ hư hỏng của tài liệu lưu trữ Trên cơ sở đó, đánh giá khả năng áp dụng công nghệ số hóa đối với khối tài liệu lưu trữ này. - Đề xuất các giải pháp về quy trình số hóa, công nghệ sử dụng, dự toán kinh phí để thực hiện dự án số hóa tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III

pdf23 trang | Chia sẻ: builinh123 | Lượt xem: 6022 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu [Tóm tắt] Luận văn Dự án số hóa tài liệu lưu trữ trung tâm lưu trữ Quốc gia III, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1 ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN NGUYỄN THANH HIẾU DỰ ÁN SỐ HÓA TÀI LIỆU LƯU TRỮ TRUNG TÂM LƯU TRỮ QUỐC GIA III Ngành: Công nghệ thông tin Chuyên ngành: Quản lý hệ thống thông tin Mã số: Chuyên ngành đào tạo thí điểm TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2015 2 PHẦN MỞ ĐẦU 1. Đặt vấn đề Trung tâm Lưu trữ Quốc gia III được thành lập theo quyết định số 118/TCCB-TC ngày 10 tháng 6 năm 1995 của Bộ trưởng - Trưởng ban Tổ chức Cán bộ Chính Phủ (nay là bộ Nội vụ). Một trong những nhiệm vụ quan trọng của trung tâm là sưu tầm, bổ sung; bảo quản an toàn và tổ chức sử dụng tài liệu, tư liệu lưu trữ của các cơ quan, tổ chức Trung ương; các nhân vật lịch sử, cá nhân, gia đình, dòng họ tiêu biểu của nước Việt Nam dân chủ cộng hòa và Cộng hòa xã hội chủ nghĩa Việt Nam có trụ sở đóng trên lãnh thổ từ tỉnh Quảng Bình trở ra phía Bắc; cơ quan, tổ chức cấp kỳ, cấp liên khu, cấp khu của nước Việt Nam dân chủ cộng hoà từ năm 1945 đến năm 1976; hồ sơ địa giới hành chính, bản đồ địa giới và mốc địa giới hành chính các cấp theo quy định của pháp luật. Tài liệu Lưu trữ quốc gia đã phục vụ có hiệu quả các nhu cầu nghiên cứu, góp phần thiết thực vào việc khôi phục nhiều công trình quan trọng sau chiến tranh, cũng như cho sự nghiệp xây dựng, bảo vệ và phát triển kinh tế văn hoá xã hội của đất nước Hiện nay, sự phát triển nhanh chóng của công nghệ thông tin đã hỗ trợ đắc lực cho nhu cầu truyền tin và khai thác thông tin dữ liệu của nhân loại. Trong đó, hệ thống Internet được mọi người quan tâm sử dụng nhiều nhất nhờ tính thông dụng trong việc giao tiếp, tìm kiếm và đọc thông tin bằng tính năng ưu việt của các phần mềm ứng dụng về quản lý, số hóa tài liệu. Do yêu cầu của quá trình hội nhập đang diễn ra mạnh mẽ, việc công khai minh bạch các văn bản, chính sách của nhà nước đến mọi đối tượng trở thành vấn đề bắt buộc. Đặc biệt việc nâng cao chất lượng thông tin phục vụ nhu cầu nghiên cứu quyết định đầu tư, sản xuất cho các nhà đầu tư trong và ngoài nước 3 trên lĩnh vực quản lý nhà nước, kinh tế, văn hóa, xã hội, lịch sử truyền thống cũng như nhu cầu tra cứu tài liệu khoa học phải được chú trọng. Một trong những nguồn thông tin được mọi người quan tâm nhiều nhất là thông tin từ tài liệu lưu trữ. Mặt khác theo thời gian, lượng tài liệu lưu trữ tăng lên, dưới góc độ quản lý nhà nước, việc bảo quản và sử dụng có hiệu quả giá trị tài liệu lưu trữ có ý nghĩa cực kỳ quan trọng đối với kinh tế, xã hội, lịch sử của mỗi quốc gia và địa phương. Vì vậy, song song với chương trình cung cấp thông tin không thụ động thông qua hệ thống Internet (Trang Web điện tử) và hệ thống thông tin viễn thông thì việc ứng dụng các công nghệ, kĩ thuật hiện đại vào bảo quản lâu dài các tài liệu có giá trị để dần thay thế cho phương pháp bảo quản truyền thống đã trở thành một nhiệm vụ cấp bách của công tác lưu trữ. Số hóa tài liệu lưu trữ là biện pháp tối ưu, giúp giải quyết việc lưu trữ, truy xuất, chia sẻ hay tìm kiếm thông tin hết sức dễ dàng. Cắt giảm chi phí tối đa cho việc quản lý và không gian lưu trữ. Ngoài ra số hóa tài liệu giúp chúng ta có thể chỉnh sửa và tái sử dụng tài liệu, linh hoạt trong việc chuyển đổi sang các dạng tài liệu số khác nhau. Quá trình số hóa tài liệu đã được bắt đầu từ khá lâu trên thế giới. Và đến nay, hầu hết những thư viện lớn và các cơ quan lưu trữ trên thế giới đều đã thực hiện song song hai loại hình truyền thống và số hóa. Với hệ thống lưu trữ số hóa điện tử, tài liệu lưu trữ đã phát huy tối đa hiệu quả trong việc phục vụ cho lợi ích phát triển kinh tế, văn hóa và giáo dục truyền thống lịch sử cho thế hệ trẻ. Nhận thức được vấn đề trên, tác giả đã lựa chọn đề tài “Dự án số hóa tài liệu lưu trữ Trung tâm Lưu trữ Quốc gia III” làm đề tài nghiên cứu cho luận văn tốt nghiệp của mình. 4 2. Mục tiêu và nhiệm vụ nghiên cứu Mục tiêu chính của đề tài là nghiên cứu đề xuất giải pháp để xây dựng dự án số hóa khối tài liệu lưu trữ hành chính đang bảo quản tại Trung tâm Lưu trữ Quốc gia III. Để có thể thực hiện mục tiêu, nhiệm vụ nghiên cứu của đề tài bao gồm: - Tiến hành khảo sát thực tế tình hình tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III. - Nghiên cứu, tổng hợp cơ sở lý luận, kinh nghiệm về số hóa tài liệu lưu trữ với mục đích bảo quản và tổ chức khai thác sử dụng tài liệu lưu trữ của các nước có nền lưu trữ tiến bộ như: Mỹ, Nga, Úc... Trên cơ sở đó khái quát một cách hệ thống, lựa chọn hợp lý và vận dụng sáng tạo vào hoàn cảnh thực tế của Trung tâm Lưu trữ Quốc gia III và làm nền tảng trong suốt quá trình nghiên cứu luận văn. - Trên cơ sở đó đề xuất các giải pháp nhằm xây dựng dự án số hóa khối tài liệu lưu trữ hành chính đang bảo quản tại Trung tâm Lưu trữ Quốc gia III đảm bảo theo mục tiêu đã đề ra 3. Đối tượng và phạm vi nghiên cứu a. Đối tượng nghiên cứu của đề tài - Các phông tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III. - Các tài liệu trong và ngoài nước liên quan đến việc thực hiện dự án số hóa trong ngành lưu trữ như: tài liệu về tiêu chuẩn, báo cáo thực hiện dự án, cẩm nang thực hiện và quản lý dự án số hóa 5 - Các phương pháp, công nghệ, quy trình số hóa tài liệu. b. Phạm vi nghiên cứu của đề tài - Đối với tài liệu lưu trữ: Đề tài tập trung nghiên cứu việc số hóa khối tài liệu lưu trữ hành chính trên vật mang tin bằng giấy đang bảo quản tại Trung tâm Lưu trữ Quốc gia III do đây là tài liệu lưu trữ chiếm số lượng nhiều nhất trong các loại hình đang bảo quản tại Trung tâm. Các loại hình tài liệu lưu trữ trên vật mang tin khác như: phim, ảnh, ghi âm, băng, tài liệu xây dựng cơ bản, tài liệu khoa học kỹ thuật sẽ không thuộc phạm vi nghiên cứu của đề tài này. - Đối với phương pháp số hóa: chủ yếu tập trung nghiên cứu và sử dụng phương pháp số hóa bằng hệ thống quản lý và tự động số hóa tài liệu (ITISCANNER) để triển khai số hóa, còn các hệ thống, thiết bị số hóa khác sẽ không được đề cập chi tiết tại đề tài này. 4. Lịch sử nghiên cứu Công nghệ kỹ thuật số hóa đã hình thành vào cuối thế kỷ XX và phát triển rất nhanh vào đầu thế kỷ XXI. Công nghệ kỹ thuật số nói chung, kỹ thuật số hóa nói riêng đã mở ra kỷ nguyên mới về sự tiến bộ của nhân loại, là thời đại kỹ thuật số. Những ưu điểm nổi bật của nó đã làm cho kỹ thuật mới này nhanh chóng phổ biến trên toàn thế giới, nhiều nước đã và đang nghiên cứu và tiến hành dự án số hóa tài liệu với quy mô khác nhau. Trong số đó phải kể đến một số nước tiêu biểu với quy mô lớn như: Mỹ, Nga, Đức, Trung Quốc, Úc Lĩnh vực tiêu 6 biểu đi đầu trong việc áp dụng công nghệ này là thư viện, bảo tàng và lưu trữ với mục tiêu bảo quản, bảo hiểm tài liệu nguyên bản, sách, phim, ảnh, ghi âm đang trong tình trạng bị xuống cấp, có yêu cầu sử dụng cao và tăng cường, tạo điều kiện cho việc khai thác sử dụng, chia sẻ nguồn thông tin một cách nhanh chóng, hiệu quả. Tại nước ta, nhiều dự án số hóa đã được tiến hành tiêu biểu trong ngành lưu trữ, thư viện và phim điện ảnh. Về lĩnh vực lưu trữ, một số dự án cấp quốc gia đã được tiến hành như: dự án số hóa tài liệu châu bản và mộc bản Triều Nguyễn năm 1993-2003, Đề án bảo hiểm tài liệu lưu trữ Quốc gia, các Trung tâm lưu trữ Quốc gia khác đều có dự án số hóa tài liệu lưu trữ nhằm mục đích bảo hiểm, tăng cường việc tổ chức khai thác sử dụng, tại một số lưu trữ tỉnh, huyện cũng đã bắt đầu thực hiện dự án số hóa tài liệu lưu trữ. Nhiều văn bản quy phạm pháp luật và hướng dẫn nghiệp vụ đã được ban hành như: Luật lưu trữ, Nghị định số 01/2013/NĐ-CP ngày 03/01/2013 của Chính phủ quy định chi tiết thi hành một số điều của Luật lưu trữ Ngoài ra còn có nhiều bài viết trên tạp chí chuyên ngành cũng đề cập đến vấn đề số hóa nhưng phần lớn chỉ mang tính chất giới thiệu, chưa đi sâu về vấn đề triển khai cụ thể. Trong lĩnh vực thư viện, hiện nay các cơ quan quản lý, cơ quan sự nghiệp đang có xu hướng triển khai xây dựng thư viện điện tử, trong đó việc số hóa nguồn tài liệu, sách, ấn phẩm là một trong những nội dung quan trọng để chuyển đổi từ hình thức thư viện truyền thống sang thư viện điện tử. Do đó, việc nghiên cứu để xây dựng mô hình và tổ chức triển khai các dự án số hóa các nguồn tài nguyên thông tin này ngày càng được quan tâm và diễn ra một cách rộng rãi. 7 Đối với Trung tâm lưu trữ Quốc gia III, việc ứng dụng công nghệ số hóa vào công tác lưu trữ đang là vấn đề rất được quan tâm. Sau khi tìm hiểu và khảo sát lịch sử nghiên cứu vấn đề số hóa tài liệu lưu trữ ở nước ngoài nói chung và ở Việt Nam, tôi thấy rằng từ trước đến này chưa có công trình nghiên cứu nào nghiên cứu về đề tài “Dự án số hóa tài liệu lưu trữ Trung tâm Lưu trữ Quốc gia III”. Vì vậy, đây là một đề tài nghiên cứu hoàn toàn mới và chưa có công trình nào đề cập đến. 5. Phương pháp nghiên cứu - Phương pháp phân tích và tổng hợp - Phương pháp khảo sát - Phương pháp so sánh - Phương pháp phỏng vấn Ngoài ra, các phương pháp thống kê, phương pháp logic cũng được kết hợp sử dụng trong quá trình nghiên cứu. Chúng đã giúp tôi nhìn nhận các vấn đề trong quá trình triển khai số hóa tài liệu lưu trữ một cách toàn diện, đầy đủ và khách quan về mọi khía cạnh của vấn đề. 6. Nguồn tài liệu tham khảo Việc ứng dụng công nghệ số hóa vào công tác lưu trữ là vấn đề rất được quan tâm của ngành lưu trữ Việt Nam. Còn các nước có nền lưu trữ phát triển, họ đã đi trước và có rất nhiều bài học kinh nghiệm trong quá trình triển khai các dự án số hóa tài liệu lưu trữ. Cho nên trong quá trình nghiên cứu tôi đã sử dụng các nguồn tài liệu chủ yếu viết bằng tiếng Anh, tiếng Việt về các vấn đề như lý luận, quy phạm pháp luật, hướng dẫn thực hiện nghiệp vụ, tiêu chuẩn kỹ thuật số hóa. 8 7. Kết quả của đề tài - Kết quả nghiên cứu của đề tài sẽ là cơ sở để áp dụng vào việc triển khai dự án số hóa tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III trong thời gian tới. - Kết quả nghiên cứu của đề tài sẽ là nguồn tài liệu tham khảo hữu ích cho việc triển khai các dự án số hóa không chỉ tài liệu lưu trữ mà còn các loại tài liệu khác sẽ được triển khai trong tương lai trên phạm vi cả nước. - Kết quả nghiên cứu của đề tài sẽ là nguồn tài liệu tham khảo bổ ích cho sinh viên muốn tìm hiểu, đi sâu trong lĩnh vực số hóa tài liệu lưu trữ hiện đang là vấn đề rất mới đối với sinh viên. Đặc biệt được biết thêm nguồn thông tin về tình trạng tài liệu lưu trữ và các giải pháp, cách thức triển khai số hóa tài liệu lưu trữ trong bối cảnh của Trung tâm Lưu trữ Quốc gia III. 8. Kết cấu của đề tài Ngoài phần mở đầu, kết luận, danh mục tài liệu tham khảo, phụ lục, phần nội dung của đề tài được trình bày trong 3 chương: Chương 1: Hiện trạng tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III Chương 2: Nghiệp vụ số hóa tài liệu lưu trữ Chương 3: Dự án số hóa tài liệu lưu trữ Trung Tâm Lưu trữ Quốc gia III Đề tài mang tính kỹ thuật, thực tiễn cao. Do trình độ nghiên cứu, kinh nghiệm thực tế còn hạn chế cho nên nội dung được trình bày trong luận văn sẽ không tránh khỏi khiếm khuyết, sai 9 sót. Do vậy, tác giả rất hy vọng sẽ nhận được những góp ý của các thầy cô giáo và bạn đọc, để tiếp tục nghiên cứu cho hoàn thiện hơn. Trong quá trình thực hiện đề tài, tác giả đã gặp rất nhiều khó khăn trong việc nghiên cứu, đi khảo sát thực tế nhưng cũng đã nhận được sự quan tâm, giúp đỡ rất nhiệt tình của các cán bộ của Trung tâm Lưu trữ Quốc gia III, các thầy cô giáo trong Viện Công nghệ thông tin,Trường Đại học Quốc gia Hà Nội, đặc biệt là của thầy giáo hướng dẫn TS. Lê Quang Minh. Nhân đây, tác giả xin bày tỏ lòng biết ơn chân thành, sâu sắc nhất về sự quan tâm, giúp đỡ quý báu đó. 10 CHƯƠNG 1: HIỆN TRẠNG TÀI LIỆU LƯU TRỮ ĐANG BẢO QUẢN TẠI TRUNG TÂM LƯU TRỮ QUỐC GIA III 1.1. Trung tâm Lưu trữ Quốc gia III 1.2. Cơ cấu tổ chức và chức năng nhiệm vụ 1.3. Tình hình tài liệu lưu trữ tại Trung tâm Lưu trữ Quốc gia III 1.3.1. Nội dung và thành phần tài liệu lưu trữ tại Trung tâm Toàn bộ tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III được hình thành trong quá trình hoạt động của cơ quan thuộc bộ máy Nhà nước Trung ương, các bộ, ngành, các đoàn thể xã hội và các liên khu, khu được thành lập từ những ngày đầu tiên của nước Việt Nam Dân chủ Cộng hòa cho tới nay. Đồng thời, những tài liệu này là những chứng cứ lịch sử phản ánh chân thực, khách quan và toàn diện cả một quá trình thành lập, xây dựng và bảo vệ đất nước Việt Nam độc lập hơn 60 năm qua. Ngay sau khi thành lập, Trung tâm Lưu trữ Quốc gia III đã tiếp nhận từ Trung tâm Lưu trữ Quốc gia I khoảng 3,6 km/giá tài liệu thuộc thẩm quyền quản lý của mình. Từ đó đến nay, Trung tâm Lưu trữ Quốc gia III đã thu thập thêm được nhiều tài liệu đưa tổng số lên hơn 12 km/giá gồm 5 khối tài liệu chính sau: - Tài liệu hành chính. - Tài liệu khoa học kỹ thuật. - Tài liệu phim ảnh ghi âm. 11 - Tài liệu xuất xứ cá nhân. - Tài liệu sưu tầm. 1.3.2. Hình thức tài liệu lưu trữ tại Trung tâm 1.3.3. Tình trạng vật lý của tài liệu lưu trữ tại Trung tâm - Trong khối tài liệu hành chính và cá nhân, gia đình, dòng họ có một số tài liệu tình trạng vật lý kém: bị ố vàng, mờ và nhiễm độ axít. - Tài liệu do Trung tâm Lưu trữ Quốc gia III đang bảo quản đứng trước nguy cơ bị hủy hoại nghiêm trọng do nhiều yếu tố khách quan và chủ quan. 1.3.4. Giá trị của tài liệu lưu trữ tại Trung tâm Là một trong bốn Trung tâm Lưu trữ Quốc gia đang bảo quản khối tài liệu quan trọng nhất của phông Lưu trữ Quốc gia Việt Nam, thông tin chứa đựng trong tài liệu lưu trữ đang được bảo quản tại Trung tâm III bao quát hầu hết các ngành, các mặt, các lĩnh vực của đời sống xã hội và có giá trị nhiều mặt. 1.4. Nhận xét chung Tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III là một nguồn sử liệu quý giá phản ánh quá trình lịch sử của đất nước. Có thể nói rằng những tài liệu đang bảo quản phần lớn chỉ có duy nhất tại Trung tâm Lưu trữ Quốc gia III, chúng có ý nghĩa hết sức quan trọng đối với việc nghiên cứu lịch sử, nghiên cứu các lĩnh vực chính trị, kinh tế, xã hội, an ninh, quốc phòng, giáo dục, và là tài sản vô giá của đất nước. Qua một số thông tin đã nêu trên phần nào giúp chúng ta hình dung được đến thực trạng, mức độ hư hỏng của tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III. Tài liệu 12 lưu trữ với tư cách là một loại hình thuộc di sản quốc gia đang trong tình trạng hư hỏng, xuống cấp và có nguy cơ tự mất đi vĩnh viễn do tác động tự thân tài liệu, điều kiện bảo quản và sử dụng không đảm bảo. Chúng ta cần phải tăng cường nghiên cứu những tiến bộ khoa học của nhân loại để áp dụng phù hợp với hoàn cảnh thực tế của trung tâm. Với vai trò, giá trị, ý nghĩa và tình trạng thực tế của tài liệu lưu trữ đã nêu trên thì việc áp dụng phương pháp số hóa là một trong những phương pháp có thể giải quyết một số trong những vấn đề quan trọng thực tế đang đặt ra trong hoàn cảnh của Trung tâm Lưu trữ Quốc gia III với những ưu điểm và hạn chế sẽ được đề cập tại Chương II. Chúng ta cũng cần phải lưu ý rằng, đây chỉ là một trong những phương pháp có thể giải quyết được một số trong những vấn đề quan trọng chứ không phải tất cả. Vấn đề đặt ra là muốn triển khai phương pháp số hóa tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III sẽ phải có cách thức tổ chức, tiến hành công việc, quy trình có liên quan như thế nào nhằm giải quyết những vấn đề thực tiễn đang đặt ra một cách hiệu quả. Toàn bộ những vấn đề này sẽ được đề cập tại chương III, đồng thời cũng là nội dung cốt lõi của luận văn này. TIỂU KẾT CHƯƠNG 1 Chương này tập trung trình bày kết quả khảo sát thực tế thực trạng tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III để làm cơ sở trong việc nghiên cứu, xây dựng các biện pháp để triển khai số hóa tài liệu lưu trữ 13 CHƯƠNG 2: NGHIỆP VỤ SỐ HÓA TÀI LIỆU LƯU TRỮ 1.1. Một số khái niệm, thuật ngữ cơ bản về số hóa tài liệu lưu trữ - Số hóa (Digitising): Số hoá là hình thức chuyển đổi dữ liệu truyền thống bên ngoài (Analog) thành dạng dữ liệu số (Digital) mà máy tính có thể hiểu được - Số hóa tài liệu lưu trữ: Số hoá tài liệu lưu trữ là hình thức chuyển đổi thông tin tài liệu lưu trữ ở dạng truyền thống bên ngoài (Analog) thành những thông tin dưới dạng số (Digital) bằng phương tiện điện tử chuyển đổi tín hiệu (máy quét/chụp hình) mà máy tính có thể hiểu được. 1.2. Mục tiêu áp dụng kỹ thuật số hóa đối với tài liệu lưu trữ Đối với tài liệu lưu trữ, mục tiêu trong việc áp dụng kỹ thuật số hóa chủ yếu tập trung vào 3 mục tiêu chính như sau: - Mục tiêu 1: Đồng nhất các loại hình tài liệu lưu trữ từ dạng tương tự sang dạng số - Mục tiêu 2: Kéo dài tuổi thọ của tài liệu lưu trữ bản gốc - Mục tiêu 3: Quản lý và khai thác tập trung nguồn tài liệu số hóa 1.3. Những ưu điểm và hạn chế của kỹ thuật số hóa tài liệu lưu trữ 1.3.1. Ưu điểm - Giúp nâng cao trong việc bảo quản an toàn tài liệu lưu trữ bản gốc đang trong tình trạng hư hỏng về tình trạng 14 vật lý và nội dung thông tin bằng cách sử dụng tài liệu số hóa thay thế việc sử dụng trực tiếp, thường xuyên tài liệu gốc và áp dụng các biện pháp củng cố, nâng cao chất lượng đối với tài liệu gốc để kéo dài tuổi thọ. - Nâng cao việc quản lý và tổ chức sử dụng nguồn tài liệu lưu trữ của cơ quan lưu trữ phục vụ việc chia sẻ, tra tìm, truy cập nguồn thông tin của các đối tượng độc giả một cách nhanh chóng, chính xác, thuận tiện vượt qua giới hạn về không gian và thời gian. - Nâng cao chất lượng hiển thị của nguồn thông tin từ tài liệu lưu trữ bản gốc (có tình trạng vật lý, nội dung kém như: mờ, vết bẩn, thủng) tốt hơn bằng chương trình phần mềm hiệu chỉnh/đồ họa chuyên dụng như: tăng độ nét, độ sáng tối, xóa vết bẩn trên bề mặt tài liệu gốc - Góp phần hiện đại hóa công tác lưu trữ của cơ quan lưu trữ. - Kỹ thuật số hóa có thể được sử dụng để hỗ trợ lẫn nhau với các phương pháp khác để tăng cường khả năng bảo quản và tổ chức khai thác sử dụng tài liệu lưu trữ một cách hiệu quả hơn. 1.3.2. Hạn chế - Để áp dụng thành công phương pháp này, đòi hỏi phải nghiên cứu, tính toán rất kỹ và khách quan, trên cơ sở đó lập kế hoạch phát triển cho phù hợp trong từng giai đoạn. - Phải đầu tư kinh phí tương đối nhiều trong quá trình triển khai cũng như quản lý, sử dụng. 15 - Tài liệu số hoá có thời hạn tuổi thọ không cao vì nó phụ thuộc vào vật mang tin, phần cứng, phần mềm tương ứng. Do công nghệ thông tin thay đổi rất nhanh, cho nên tài liệu số hóa cũng không ngừng phải nâng cấp theo. Điều này dẫn đến phải sử dụng kinh phí tương đối nhiều. Mặt khác, để tiếp cận được dạng tài liệu này, chúng ta phải có thiết bị điện tử, phương tiện kết nối thích hợp. - Đòi hỏi cán bộ có trình độ chuyên môn giỏi đáp ứng các yêu cầu công việc khác nhau trong từng khâu của chuỗi số hoá tài liệu. 1.4. Tổng quan về kỹ thuật số hóa tài liệu 1.4.1. Một số thiết bị chuyển đổi: máy scan, máy chụp ảnh số 1.4.2. Thuộc tính của tài liệu Thuộc tính của tài liệu hiện nay được chia thành 4 loại như sau: Bản văn/ dòng (Text/line art), Tông màu chuyển tiếp (continuous tone), Nửa tông hoặc kiểu nửa tông (Halftone or halftone -like), Hỗn hợp (Mixed). 1.4.3. Kỹ thuật quét tài liệu Để quét các loại tài liệu có thuộc tính khác nhau và phù hợp với yêu cầu đầu ra thì có ba kỹ thuật quét tài liệu được sử dụng, đó là kỹ thuật quét đen trắng (Bitonal), kỹ thuật quét dải xám (Grayscale) và kỹ thuật quét màu (Color). 1.4.4. Những yếu tố tác động đến chất lượng ảnh số Chất lượng của ảnh số phụ thuộc vào 6 yếu tố cơ bản đó là: - Tình trạng của tài liệu (Condition of records) 16 - Độ phân giải, độ ngưỡng và độ sâu màu (Resolution, Threshold and Bit depth) - Hiệu chỉnh ảnh (Image Enhancement) - Quá trình nén và định dạng file (Compression and File Format) - Thiết bị sử dụng và hiệu suất của thiết bị đó (System Performance) - Quyết định của người vận hành (Operator Judgement) 1.5. Tổng quan về nhận dạng ký tự quang học (OCR) Nhận dạng ký tự quang học (Optical Character Recognition – OCR) là kỹ thuật chuyển các hình ảnh của chữ viết tay hoặc chữ đánh máy (thường được quét bằng máy scanner, chụp ảnh) thành các văn bản tài liệu. Giả sử ta có một văn bản tài liệu bản cứng, sau khi quét bằng máy scanner thành file ảnh, phần mềm OCR sẽ nhận dạng file ảnh đã quét đó thành file văn bản lưu trữ trên máy tính có thể chỉnh sửa được trên máy tính. Lịch sử của OCR đã có từ hơn nửa thế kỷ, nó xuất hiện đầu tiên để giải quyết bài toán đọc mã số trong bưu điện, tiếp đó phát triển để tự động đọc các địa chỉ và đọc các thông tin trong các mẫu đơn, văn bản. Ngày nay với sự phát triển mạnh mẽ, OCR trở nên phổ biến và thường được ứng dụng như một phần mềm cài đặt trên máy tính hoặc tích hợp kèm với phần cứng như tích hợp trong máy scan. Đối với dự án số hóa tài liệu lưu trữ của Trung tâm Lưu trữ Quốc gia III, việc nhận dạng ký tự quang học để chuyển đổi ảnh quét bằng máy scan sang các định dạng lưu trữ khác để thuận 17 tiện trong việc tra cứu và lưu trữ như pdf, doc, cũng rất quan trọng trong quy trình thực hiện số hóa tài liệu lưu trữ. 1.6. Xây dựng siêu dữ liệu cho tài liệu được số hóa Vấn đề số hóa văn bản với phương pháp quét ảnh đã được thực hiện phổ biến từ lâu. Tuy nhiên, việc số hóa chỉ dừng lại ở việc chuyển các văn bản giấy thành file ảnh quét mà không có thêm các thông tin nào khác. Các file ảnh quét này, sau đó, thường được lưu trữ trên file hệ thống mà không có bất cứ hình thức quản lý nào khác. Như vậy, việc khai thác và lưu trữ sẽ rất kém hiệu quả. Các phần mềm quét ảnh (đi kèm với thiết bị, hoặc thuộc hãng thứ ba) có khả năng quét ảnh rất tốt. Tuy nhiên, các phần mềm này thường cũng chỉ cho ra các file ảnh quét (với nhiều định dạng khác nhau) mà chưa hỗ trợ việc tạo lập metadata trong quá trình quét. Để đảm bảo khả năng quản lý, khai thác và lưu trữ các file ảnh quét được quét từ các văn bản giấy, thì các phần mềm số hóa phải có khả năng tạo lập metadata cho tài liệu được quét vào (tự động hoặc thông qua nhập liệu). Các thông tin metadata này phải được tạo lập ra cùng với file ảnh quét và được lưu trữ cùng với file ảnh quét. 1.6.1. Tạo lập metadata 1.6.2. Lựa chọn chuẩn dữ liệu đặc tả Hiện nay, việc xây dựng quy chuẩn Việt Nam về dữ liệu đặc tả cũng được dựa trên chuẩn Dublin Core (Công văn 839 ngày 29/9/2011 – Bộ thông tin và truyền thông). Bộ thành tố dữ liệu đặc tả Dublin Core lúc đầu được thiết kế chủ yếu cho mục đích mô tả. Các thành tố dữ liệu đặc tả Dublin Core có những ưu điểm sau: 18 - Tạo lập và sử dụng dễ dàng. - Ngữ nghĩa dễ hiểu, sử dụng đơn giản. - Phạm vi phổ biến. - Tính mở rộng. - Giúp nâng cao độ chính xác của định chỉ số. - Có khả năng liên tác (Interoperability), sử dụng lẫn nhau. - Mở rộng thuận lợi 1.6.3. Đề xuất metadata cho tài liệu được số hóa Việc rút trích và tạo metadata cho các tài liệu điện tử giúp cho việc sắp xếp tài liệu một cách khoa học và hỗ trợ người dùng có thể tìm kiếm chúng một cách dễ dàng. Đề xuất các yếu tố metadata của chuẩn Dublin core trong việc tạo lập, sử dụng, lưu trữ dữ liệu đặc tả đối với văn bản số TIỂU KẾT CHƯƠNG 2 Nội dung chương này, tôi tập trung trình bày kết quả nghiên cứu, tập hợp, hệ thống lại các nguồn thông tin, kinh nghiệm của một số nước liên quan đến các vấn đề cơ bản như: khái niệm, giải thích một số thuật ngữ chuyên môn; đưa ra mục tiêu chủ yếu trong việc áp dụng kỹ thuật số hóa; những ưu điểm, hạn chế của nó; trình bày khái quát, tổng quan về kỹ thuật số hóa, kỹ thuật nhận dạng ký tự quang học và tạo lập siêu dữ liệu cho tài liệu số hóa. Đây là nền tảng về lý thuyết cơ bản của luận văn số hóa tài liệu lưu trữ, đồng thời là cơ sở đề xuất dự án triển khai số hóa tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III được đề cập tại chương III. 19 CHƯƠNG 3: DỰ ÁN SỐ HÓA TÀI LIỆU LƯU TRỮ TRUNG TÂM LƯU TRỮ QUỐC GIA III 2.1. Cơ sở lý luận và bối cảnh hình thành dự án 2.2. Mục tiêu của dự án 2.2.1. Mục tiêu chung Chuyển phương thức hoạt động của lưu trữ truyền thống sang lưu trữ điện tử cụ thể là thực hiện số hóa tài liệu lưu trữ đang được lưu trữ tại Trung tâm Lưu trữ Quốc gia III, trong đó ưu tiên số hóa các tài liệu lưu trữ hành chính vì đây là khối tài liệu lưu trữ chiếm khối lượng lớn nhất trong tổng số các khối tài liệu đang được lưu trữ tại Trung tâm. Với mục tiêu bảo hiểm, kéo dài tuổi thọ tài liệu lưu trữ gốc và tổ chức sử dụng chúng bằng bản sao số hóa từ tài liệu lưu trữ. 2.2.2. Mục tiêu cụ thể - Tài liệu lưu trữ được số hóa đảm bảo chất lượng, hiệu quả sử dụng; đảm bảo có các bản sao lưu dự phòng tài liệu lưu trữ gốc và hỗ trợ việc thực hiện duy tu, bảo dưỡng, kiểm soát tài liệu. - Tăng cường khả năng khai thác, truy cập đến nguồn tài liệu lưu trữ của các đối tượng độc giả khác nhau một cách hiệu quả, rộng rãi nhằm phát huy giá trị thông tin vốn có của tài liệu lưu trữ vào sự phát triển kinh tế -xã hội. - Giảm thiểu sự xuống cấp về mặt vật lý và hóa học của tài liệu gốc do phải lưu thông thường xuyên trong quá trình khai thác, sử dụng. 2.3. Nội dung triển khai và giải pháp thực hiện 2.3.1. Giải pháp về quy trình số hóa 20 Quy trình này nhằm tạo ra 3 phiên bản ảnh số: - Tạo ra bản master của tài liệu lưu trữ đã được số hóa đạt chất lượng cao - Tạo ra bản phát sinh - Tạo bản để ghi phim bảo hiểm Quy trình số hóa bao gồm các bước chính sau: - Chuẩn bị tài liệu để số hóa - Quét tài liệu bằng máy quét - Tạo ra các phiên bản ảnh số - Nhận dạng ký tự quang học - Tạo siêu dữ liệu, lập chỉ mục - Lưu trữ - Tổ chức khai thác sử dụng 2.3.2. Giải pháp hệ thống công nghệ thực hiện số hóa Hệ thống ITISCANNER là kết quả của sự kết hợp giữa các công nghệ số hóa hàng đầu như: - Công nghệ nhận dạng tiếng việt. - Công nghệ xử lý tiếng việt. - Công nghệ tự động tách bộ lập chỉ mục. - Hệ thống quản trị tài liệu. 2.4. Dự toán kinh phí cho dự án 21 TIỂU KẾT CHƯƠNG 3 Chương 3 tập trung trình bày kết quả nghiên cứu, khảo sát để triển khai dự án số hóa tài liệu lưu trữ đang bảo quản tại Trung tậm Lưu trữ Quốc gia III. Đưa ra các giải pháp nhằm thực hiện theo mục tiêu của đề tài, đưa ra được quy trình kỹ thuật số hóa, các giải pháp kỹ thuật, dự toán kinh phí cho dự án. Tuy nhiên, còn có nhiều vấn đề cần được tiếp tục nghiên cứu, giải quyết như: quy định của pháp luật về vấn đề số hóa, nguồn kinh phí cụ thể, quy trình công việc cho toàn bộ dự án số hóa từ vấn đề quản lý đến kiểm soát chất lượng... Do phần lớn công việc số hóa liên quan đến vấn đề kỹ thuật nhiều hơn, cho nên phần nội dung kỹ thuật không thể trình bày, nêu một cách chi tiết tại luận văn bởi vì tính phức tạp, đa dạng của các tình huống khác nhau của chúng. Cuối cùng, tôi mong rằng những giải pháp đã nêu sẽ đóng góp trong việc định hướng cho cơ quan quản lý nhà nước có thẩm quyền nói chung, Trung tâm Lưu trữ Quốc gia III nói riêng có cách nhìn một cách toàn diện, khách quan để tổ chức triển khai số hóa tài liệu lưu trữ đạt hiệu quả cao, mang lại lợi ích thiết thực cho toàn xã hội. 22 KẾT LUẬN Sự tiến bộ của nhân loại về khoa học – công nghệ, trong đó là sự xuất hiện và phát triển mạnh mẽ của công nghệ số hóa tài liệu đã mang lại cơ hội mới trong lĩnh vực lưu trữ, thư viện và bảo tàng để tăng cường khả năng bảo quản tài liệu gốc và tiếp cận nguồn thông tin một cách thuận lợi, nhanh chóng, vượt qua giới hạn về thời gian và không gian chưa từng có trong lịch sử của loại người. Trung tâm Lưu trữ Quốc gia III cũng đang chuẩn bị triển khai việc áp dụng công nghệ số hóa vào tài liệu lưu trữ đang bảo quản tại Trung tâm nhằm đạt được các mục tiêu chung đó. Mục tiêu chính của đề tài nhằm nghiên cứu đề xuất các giải pháp để triển khai dự án số hóa khối tài liệu lưu trữ hành chính đang bảo quản tại Trung tâm Lưu trữ Quốc gia III bằng hệ thống ITISCANNER. Kết quả nghiên cứu của luận văn có thể khái quát như sau: - Nghiên cứu, tổng hợp cơ sở lý luận, kinh nghiệm, phân tích mục đích và mô hình áp dụng kỹ thuật số hóa tài liệu lưu trữ, ưu điểm-nhược điểm và tổng quan về kỹ thuật số hóa tài liệu lưu trữ. Đây vừa là nền tảng lý luận vừa là luận chứng về khả năng áp dụng công nghệ số hóa để triển khai dự án số hóa tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III. - Để đảm bảo việc triển khai dự án số hóa tài liệu lưu trữ có tính khả thi và hiệu quả cao, tiến hành khảo sát thực tế khối tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III và đưa ra những dữ liệu về các vấn đề như: số lượng, thời gian, đặc điểm, tình trạng vật lý và mức độ hư hỏng của tài liệu lưu trữ Trên cơ sở đó, 23 đánh giá khả năng áp dụng công nghệ số hóa đối với khối tài liệu lưu trữ này. - Đề xuất các giải pháp về quy trình số hóa, công nghệ sử dụng, dự toán kinh phí để thực hiện dự án số hóa tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III Từ những kết quả trên, về cơ bản đã giải quyết những mục tiêu và nhiệm vụ của đề tài đã đề ra, đồng thời định hướng những vấn đề cần được tiếp tục nghiên cứu và giải quyết với các đề tài khác trong thời gian tới. Hy vọng với những những kết quả nghiên cứu đã đạt được sẽ đóng góp thiết thực cho việc triển khai số hóa tài liệu lưu trữ đang bảo quản tại Trung tâm Lưu trữ Quốc gia III dự kiến sẽ tiến hành trong tương lai đạt được kết quả tốt. Đồng thời, góp phần trong việc bảo vệ, kéo dài tuổi thọ tài liệu lưu trữ gốc và phát huy giá trị của tài liệu lưu trữ trong công cuộc xây dựng và bảo vệ đất nước. Tôi hiểu rằng những vấn đề đã đề cập trong luận văn còn một số vấn đề chưa được trình bày, phân tích, giải quyết thấu đáo hoặc phải tiếp tục nghiên cứu cặn kẽ hơn. Tôi mong rằng sẽ nhận được sự chỉ bảo, góp ý của các nhà khoa học, các bạn đồng nghiệp để luận văn của tôi được hoàn thiện hơn.

Các file đính kèm theo tài liệu này:

  • pdfdu_an_so_hoa_tai_lieu_luu_tru_trung_tam_luu_tru_quoc_gia_iii_1148.pdf
Luận văn liên quan