Giải pháp quản lý lưu trữ cho các hệ thống cơ sở dữ liệu dùng chung

DỰ ÁN QUY HOẠCH CƠ SỞ DỮ LIỆU VÀ HẠ TẦNG CÔNG NGHỆ THÔNG TIN TỈNH KHÁNH HÒA Đơn vị thực hiện : Công ty Phần mềm và Truyền thông VASC Tổng công ty Bưu chính Viễn thông Việt nam Địa chỉ : 99 Triệu Việt Vương – Hà Nội MỤC LỤC TUChương 1UTTUĐỊNH NGHĨA CƠ SỞ DỮ LIỆU DÙNG CHUNGUT3 TUChương 2UTTULỰA CHỌN MÔ HÌNH HỆ THỐNGUT4 TU2.1UTTUMÔ HÌNH TẬP TRUNGUT4 TU2.2UTTUMÔ HÌNH PHÂN TÁNUT5 TU2.3UTTUMÔ HÌNH KẾT HỢPUT6 TU2.3.1UTTUMô hình tập trungUT6 TU2.3.2UTTUMô hình phân tánUT7 TUChương 3UTTUGIẢI PHÁP QUẢN LÝ LƯU TRỮUT11 TU3.1UTTUSƠ ĐỒ TỔNG THỂ HỆ THỐNGUT11 TU3.1.1UTTUKết nối mạng diện rộngUT11 TU3.1.2UTTUKết nối trong mạng LAN:UT12 TU3.1.3UTTUHệ thống firewallUT13 TU3.1.4UTTUHệ thống lưu trữUT14 TU3.1.5UTTUHệ thống serverUT15 TU3.2UTTUHỆ THỐNG MẠNGUT17 TU3.2.1UTTUSwitchUT17 TU3.2.2UTTURouterUT17 TU3.2.3UTTUFirewallUT19 TU3.3UTTUHỆ THỐNG MÁY CHỦUT21 TU3.3.1UTTUDNS/Proxy ServerUT21 TU3.3.2UTTUDatabase ServerUT22 TU3.3.3UTTUApplication ServerUT23 TU3.3.4UTTUMáy chủ backupUT24 TU3.3.5UTTUPhần mềm hệ thốngUT25 TU3.4UTTUHỆ THỐNG LƯU TRỮUT32 TU3.4.1UTTUCông nghệ lưu trữUT32 TU3.4.2UTTULựa chọn giải pháp lưu trữUT35 TU3.4.3UTTUHệ thống lưu trữUT35 TU3.5UTTUHỆ THỐNG UPSUT37 TUChương 4UTTUGIẢI PHÁP SAO LƯU VÀ PHỤC HỒI DỮ LIỆUUT45 TU4.1UTTUCÁC GIẢI PHÁP SAO LƯUUT45 TU4.1.1UTTUSao lưu đầy đủUT45 TU4.1.2UTTUSao lưu gia tăngUT45 TU4.1.3UTTUSao lưu khác biệtUT46 TU4.2UTTUCHIẾN LƯỢC SAO LƯUUT46 TU4.3UTTUSAO LƯU DỮ LIỆUUT47 TU4.3.1UTTUTheo ngàyUT47 TU4.4UTTUPHỤC HỒI DỮ LIỆU KHI GẶP SỰ CỐUT49 TU4.4.1UTTUTrường hợp sự cố dữ liệu ứng dụngUT49 TU4.4.2UTTUTrường hợp sự cố CSDLUT49 TU4.4.3UTTUTrường hợp sự cố hệ điều hànhUT50 TUChương 5UTTUAN TOÀN BẢO MẬTUT52 TU5.1UTTUHỆ THỐNG DỰ PHÒNGUT52 TU5.2UTTUBẢO MẬT MỨC HÀNH CHÍNHUT52 TU5.3UTTUBẢO MẬT MỨC HỆ ĐIỀU HÀNHUT52 TU5.4UTTUBẢO MẬT MỨC CƠ SỞ DỮ LIỆUUT57 TU5.4.1UTTUCác mức bảo mậtUT57 TU5.4.2UTTUCác đối tượng bảo mậtUT59

doc61 trang | Chia sẻ: lvcdongnoi | Ngày: 02/07/2013 | Lượt xem: 1969 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Giải pháp quản lý lưu trữ cho các hệ thống cơ sở dữ liệu dùng chung, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ng được nhu cầu dữ liệu khổng lồ, tích hợp khối lượng dữ liệu dưới dạng văn bản, âm thanh, hình ảnh ngày càng tăng phục vụ cho công tác lưu trữ và xử lý của Tỉnh nhằm bảo đảm hiệu quả đầu tư. Máy chủ database này cần được cung cấp kèm với UPS nhằm tránh sự cố gián đoạn khi hỏng nguồn. Tốc độ xử lý dữ liệu phải cao, không bị tình trạng nghẽn cổ chai, không bị gián đoạn. Hệ thống ổ đĩa được thiết kế để không bị mất dữ liệu khi xẩy ra sự cố. Hệ thống ổ đĩa dễ dàng được mở rộng để đáp ứng nhu cầu gia tăng dữ liệu lưu trữ. Vì hệ thống database của Trung tâm Tích hợp dữ liệu lưu trữ lượng lớn dữ liệu nên cần một hệ thống lưu trữ thực hiện tác vụ này, chi tiết về hệ thống lưu trữ sẽ được chúng tôi trình bày ở phần sau. Application Server Hệ thống máy chủ ứng dụng là thành phần khá quan trọng trong hệ thống máy chủ dịch vụ, máy chủ này sẽ được cài đặt các phần mềm phát triển ứng dụng cần thiết cho công tác nghiệp vụ của Trung tâm Tích hợp dữ liệu. Với yêu cầu hoạt động đó, máy chủ ứng dụng cần đáp ứng được các yêu cầu sau : Máy chủ ứng dụng phải có cấu hình mạnh, đáp ứng được nhu cầu truy cập đồng thời của nhiều người dùng Dễ dàng nâng cấp, có độ mở rộng cao Cung cấp khả năng truy cập và đáp ứng lại các yêu cầu truy cập trong khoảng thời gian ngắn nhất Khả năng phân quyền người dùng. Hệ thống cần có độ tin cậy, tính linh hoạt cao và dễ sử dụng Hệ thống cần có khả năng caching dữ liệu với khối lượng lớn Như vậy, hệ thống máy chủ ứng dụng cần là máy chủ rất mạnh, đặc biệt cần có bộ nhớ lớn để có thể chạy nhiều chương trình ứng dụng cùng lúc. Máy chủ backup Máy chủ backup được sử dụng để phục vụ mục đích sao lưu dữ liệu. Bên cạnh việc lưu trữ dữ liệu trên các tủ đĩa cứng hoặc NAS server, việc lưu trữ dữ liệu trên băng từ cũng là một giải pháp được ưa chuộng với nhiều ưu điểm như: Băng từ là thiết bị lưu trữ ngoại tuyến hoạt động theo chế độ truy nhập tuần tự (Sequence Access mode) cho dung lượng lưu trữ rất lớn, lớn hơn rất nhiều lần so với các thiết bị lưu trữ dùng đĩa quang và đĩa cứng. Băng từ cũng có tuổi thọ trung bình rất cao (MTBP - Mean Time Between Failure) cao hơn nhiều khi so sánh với thiết bị quang, ổ đĩa cứng. Các thiết bị băng từ rẻ hơn rất nhiều lần so với đĩa cứng, đĩa quang.... Các ổ băng từ đã trở nên dễ sử dụng và phù hợp với việc lưu dữ liệu. Các phần mềm điều khiển các ổ băng từ và quản lý lưu trữ trên băng từ cho khả năng làm việc và sao lưu các loại cơ sở dữ liệu và các hệ điều hành phổ biến. Với các ưu điểm trên của băng từ, chúng tôi đề xuất sử dụng một thiết bị ghi đọc băng từ tại Trung tâm Tích hợp dữ liệu dùng lưu trữ các dữ liệu cần bảo quản lâu dài. Máy chủ backup gắn trực tiếp với hệ thống ghi băng từ, và thực hiện công tác sao lưu trên thiết bị này. Phần mềm hệ thống Hệ điều hành Theo các số liệu thống kê mới nhất, Windows vẫn là hệ điều hành đứng đầu trong việc sử dụng cho các máy tính để bàn. Đối với các yêu cầu sử dụng cho máy chủ, nhiều loại hệ điều hành khác nhau được sử dụng, tùy thuộc lựa chọn của khách hàng cũng như các phần cứng đi kèm trong toàn bộ hệ thống. Các hệ điều hành dùng cho máy chủ phổ biến gồm có: Hệ điều hành Windows của Microsoft Windows 2000 Server - là hệ điều hành dùng cho máy chủ của Microsoft hỗ trợ IIS, DNS. Với khả năng hoạt động ổn định và tin cậy, kèm với khả năng hỗ trợ 4 processor và 4 GB bộ nhớ, Windows 2000 Server phù hợp cho các ứng dụng web cũng như các ứng dụng đòi hỏi hiệu năng cao. Windows 2000 Advanced Server - là hệ điều hành máy chủ của Microsoft. Bên cạnh các tính năng tương tự như Windows 2000 Server, hoạt động ổn định với khả năng hỗ trợ 8 processor và 8 GB bộ nhớ. Bên cạnh đó, hệ điều hành này có khả năng hỗ trợ cluster với hai node. Windows 2000 Datacenter Server - hỗ trợ 32 processor với 32 GB bộ nhớ, có khả năng hoạt động với 4-node cluster. Windows Server 2003 – là phiên bản mới của hệ điều hành Windows mới được Microsoft đưa ra. Windows Server 2003 có một số tính năng bổ sung so với các phiên bản Windows trước đó. Linux - là hệ điều hành mã nguồn mở. Trong thời gian gần đây, Linux đang dần chiếm được sự quan tâm của người dùng do nhận được hỗ trợ của nhiều hãng khác nhau. Với đặc điểm của hệ mã nguồn mở, Linux ngày càng hoàn thiện là được lựa chọn cho nhiều ứng dụng khác nhau. Phần nhân của Linux được phát triển với sự kết hợp của nhiều chuyên gia, sau đó được tiếp tục phát triển thành các sản phẩm thương mại của nhiều hãng độc lập. Unix - có nhiều loại khác nhau phụ thuộc platform sử dụng, các hệ thống máy chủ Unix của HP sử dụng HP-UX, máy chủ của IBM sử dụng AIX và máy chủ của Sun sử dụng Solaris... Với nhu cầu sử dụng của Trung tâm Tích hợp dữ liệu, chúng tôi khuyến nghị sử dụng hệ điều hành Windows 2000 Server cho máy chủ và Windows XP cho máy trạm. Việc sử dụng một hệ điều hành thống nhất cho toàn bộ môi trường đơn giản hóa và giảm chi phí quản trị và phát triển ứng dụng. Cơ sở dữ liệu Phần dưới đây trình bày bảng so sánh một số cơ sở dữ liệu thông dụng. Các tiêu chí đặc trưng nhất của mỗi hệ thống được đem ra so sánh và đánh giá. TT Các tiêu chí SQL Server Oracle DB2 Informix 01 Tính phổ dụng ở thị trường Việt Nam Cao Cao Trung bình Thấp 02 Hệ thống đào tạo & Bảo hành - bảo trì - dịch vụ đi kèm Trung bình Cao Thấp Thấp 03 Quy mô dữ liệu (đạt hiệu quả cao) Vài trăm ngàn bản ghi Hàng triệu bản ghi Hàng triệu bản ghi Hàng triệu bản ghi 04 Có công cụ phân tích & thiết kế ứng dụng Không Có Không Không 05 Kết nối với Cơ sở dữ liệu Qua ODBC hay ADO Trực tiếp qua SQL Net Trực tiếp Trực tiếp 06 Platform (cơ sở hạ tầng) Intel - Windows NT/2000 Multi platform: NT/2000, UNIX, PC SERVER RS/6000, SUN, HP…. vv Multiplatform: PC Server, Linux AS400, Windows OS2 Multi platform 07 An toàn và bảo mật dữ liệu Trung bình (dựa trên Windows NT/2000) Cao Cao Trung bình 08 Khả năng giải quyết các bài toán dữ liệu phân tán Trung bình Cao Cao Trung bình 09 Giá thành Thấp Cao Có nhiều lựa chọn Có nhiều lựa chọn 10 Khả năng nâng cấp Trung bình Cao Cao Trung bình Dựa trên bản so sánh này, chúng tôi có một số nhận xét sau: Microsoft SQL Server - là hệ quản trị cơ sở dữ liệu rất phổ biến, đặc biệt ở Việt Nam do khả năng tích hợp và chạy trên hệ điều hành Windows. Ưu điểm - được sản xuất và phát triển bởi Microsoft, Microsoft SQL Server đặc biệt tích hợp rất tốt với hệ điều hành và các ứng dụng chạy trên Windows. Bên cạnh đó, giá thành thấp và khả năng hỗ trợ tốt cũng là một lợi điểm của Microsoft SQL Server khi so sánh với các hệ quản trị cơ sở dữ liệu khác. Microsoft SQL Server đặc biệt phù hợp với các khách hàng là các doanh nghiệp và tổ chức nghiên cứu yêu cầu dữ liệu không quá lớn và ngân sách vừa phải. Microsoft SQL Server là lựa chọn lý tưởng cho các trường đại học, viện nghiên cứu khi triển khai các cơ sở dữ liệu. Với nền tảng được xây dựng trên Windows, Microsoft SQL Server có giao diện rất thân thiện và dễ sử dụng, đơn giản hóa đáng kể yêu cầu đối với người dùng và người thiết kế, quản trị hệ thống. Đây là điểm rất mạnh của Microsoft SQL Server để triển khai trên thị trường Việt Nam. Nhược điểm - nhược điểm lớn nhất của Microsoft SQL Server là khả năng xử lý hạn chế (so với các hệ quản trị cơ sở dữ liệu quy mô lớn khác). Để hệ thống hoạt động tối ưu thì quy mô dữ liệu chỉ nên duy trì trong khoảng vài chục nghìn đến vài trăm nghìn bản ghi. Với các cơ sở dữ liệu lớn (vài trăm nghìn bản ghi trở lên) thì Microsoft SQL Server hoạt động với hiệu quả giảm sút. Tuy nhiên, với các ứng dụng không đòi hỏi số lượng quá lớn bản ghi thì Microsoft SQL Server là sự lựa chọn lý tưởng do hiệu năng tốt. Oracle - là hệ quản trị cơ sở dữ liệu rất phổ biến trên thế giới. Oracle luôn chiếm vị trí hàng đầu trong thị trường hệ quản trị cơ sở dữ liệu dùng cho doanh nghiệp lớn. Ưu điểm - Oracle có thể hỗ trợ nhiều hệ điều hành khác nhau (Windows, nhiều loại Unix...). Bên cạnh khả năng xử lý cơ sở dữ liệu với quy mô lớn (hàng triệu bản ghi), Oracle còn có các công cụ hỗ trợ phân tích và xây dựng cơ sở dữ liệu rất mạnh, hỗ trợ lập trình viên và chuyên gia thiết kế trong quá trình xây dựng hệ thống. Khả năng mở rộng và bảo mật cao cũng là một điểm mạnh của Oracle khi so sánh với các hệ quản trị cơ sở dữ liệu khác. Nhược điểm - nhược điểm lớn nhất của Oracle là chi phí rất lớn. Giá của Oracle thường cao hơn so với Micrsosoft SQL Server hay các hệ quản trị cơ sở dữ liệu khác khá nhiều. DB2 - là một hệ quản trị cơ sở dữ liệu được xây dựng, phát triển và hỗ trợ bởi IBM. DB2 chiếm một phần thị trường dù ở Việt Nam, DB2 chưa có thị phần đáng kể khi so sánh với Microsoft SQL Server và Oracle. Ưu điểm - cũng là một hệ cơ sở dữ liệu hỗ trợ đa hệ điều hành. Trước kia, DB2 chỉ hỗ trợ hệ điều hành của IBM nhưng với sự mở rộng và phát triển gần đây, DB2 đã hỗ trợ thêm nhiều hệ điều hành khác nhau bao gồm cả Windows, Linux và một số loại Unix, cho phép khách hàng có nhiều tùy chọn khi sử dụng DB2. Cũng như Oracle, DB2 hỗ trợ các cơ sở dữ liệu rất lớn với hàng triệu bản ghi và khả năng an toàn dữ liệu cũng rất cao. Ưu điểm vượt trội của DB2 so với Oracle là chính sách giá. Giá sở hữu một bản DB2 thấp hơn nhiều so với một bản Oracle với các tính năng gần tương đương. Nhược điểm - nhược điểm của DB2 so với Oracle là không có các công cụ hỗ trợ phân tích thiết kế và xây dựng ứng dụng. Bên cạnh đó, DB2 mới được phát triển để hỗ trợ các hệ điều hành khác bên cạnh hệ điều hành truyền thống của IBM nên khả năng hoạt động ổn định với hiệu năng cao vẫn còn là một ẩn số. Ngoài ra, giá của một bản DB2 cao hơn một bản Microsoft SQL Server. Cũng như vậy, môi trường sử dụng của DB2 chưa thực sự quen thuộc với người dùng, đặc biệt là người dùng Việt Nam khi Windows luôn là lựa chọn hàng đầu. Informix - Informix cũng là một hệ quản trị cơ sở dữ liệu khá phổ biến trên thế giới mặc dù chưa được dùng nhiều ở Việt Nam. Ưu điểm - dựa trên các tiêu chí so sánh, Informix cũng có các ưu điểm tương tự như DB2 với khả năng hỗ trợ các cơ sở dữ liệu rất lớn với nhiều triệu bản ghi cũng như khả năng hỗ trợ đa hệ điều hành. Bên cạnh đó, khả năng bảo mật cơ sở dữ liệu của Informix khá cao. Chính sách giá cả hợp lý là một ưu điểm của Informix khi so sánh với hệ quản trị cơ sở dữ liệu Oracle. Nhược điểm - nhược điểm lớn nhất của Informix là tính phổ dụng ở thị trường Việt Nam chưa cao nên việc hỗ trợ kỹ thuật chưa thực sự được mạnh. Ngoài nhược điểm đó thì cũng tương tự như DB2, Informix cũng không có các công cụ hỗ trợ phân tích thiết kế và xây dựng ứng dụng như của Oracle và tương đối khó sử dụng đối với người dùng (nếu so sánh với Microsoft SQL Server) Với yêu cầu sử dụng và kinh phí đầu tư của hệ thống cơ sở dữ liệu dùng chung, đặc biệt là nhu cầu lưu trữ và quản lý các bản ghi sẽ không ngừng tăng cao trong tương lai, chúng tôi đề xuất sử dụng giải pháp Oracle làm phần mềm quản trị cơ sở dữ liệu. Web Services Hai chương trình Web Server phổ biến hiện nay là IIS (Internet Information Service) và Apache. Với khả năng tích hợp với hệ điều hành Windows của Microsoft, IIS là một giải pháp tốt cho các ứng dụng web trên nền Windows. Khác với IIS, Apache có khả năng chạy trên nhiều hệ điều hành khác nhau và là web server phổ biến trên thế giới. Với yêu cầu sử dụng của hệ thống cơ sở dữ liệu dùng chung, chúng tôi lựa chọn sử dụng IIS Web Server với các đặc điểm sau: Tích hợp chặt chẽ với hệ điều hành Windows 2000 Server của Microsoft. Việc sử dụng IIS với Windows 2000 Server bảo đảm hệ thống hoạt động ổn định, ít lỗi với hiệu năng cao nhất. Là một sản phẩm chạy trên nền Windows, IIS kế thừa được tính thân thiện và dễ sử dụng của các sản phẩm Windows, tạo điều kiện dễ dàng cho người quản trị trong việc quản lý và phát triển hệ thống. Các lỗ hổng (luôn tồn tại với tất cả các phần mềm) thường xuyên được cập nhật. Bên cạnh đó, việc sử dụng kèm với hệ điều hành có tính bảo mật cao như Windows 2000 Server giảm thiểu khả năng bị tấn công. Phần mềm kèm luôn với Windows 2000 Server. Khi mua Windows 2000 Server, người sử dụng không phải trả thêm bất kỳ một chi phí nào để có thể sử dụng IIS Web Server. HỆ THỐNG LƯU TRỮ Công nghệ lưu trữ Quá trình lưu trữ có thể được thực hiện theo nhiều cách: sử dụng các ổ đĩa gắn trực tiếp vào server cần lưu trữ, dùng các thiết bị lưu trữ ngoài hoặc xây dựng mạng dùng riêng cho việc lưu trữ dữ liệu. Phương pháp lưu trữ dùng các ổ đĩa gắn trực tiếp đã xuất hiện và được sử dụng từ rất lâu do tính dễ sử dụng của chúng. Cùng với sự phát triển của công nghệ, đặc biệt là yêu cầu của người dùng về dữ liệu lưu trữ (dung lượng, tốc độ, khả năng khôi phục dữ liệu, ảnh hưởng của lưu trữ đến hiệu năng của toàn hệ thống), nhiều phương pháp lưu trữ mới được phát triển. Mỗi phương pháp có những ưu nhược điểm riêng và được dùng cho những mục đích nhất định. DAS DAS (Direct Attached Storage) dùng để chỉ các thiết bị lưu trữ gắn trực tiếp vào hệ thống cần lưu trữ (server, workstation). Ví dụ đơn giản nhất của DAS là ổ đĩa cứng lắp trong hoặc các ổ lắp ngoài của máy tính. Tính đến thời điểm này, DAS vẫn là phương pháp lưu trữ phổ biến nhất cho các hệ thống máy tính. DAS được sử dụng phần lớn cho các người dùng đơn lẻ, hoặc những nơi mà yêu cầu về khả năng sẵn sàng của dữ liệu không quá cao. Khả năng mở rộng của các thiết bị DAS không cao so với các phương pháp khác. NAS NAS (Network Attached Storage) là phương pháp lưu trữ dữ liệu sử dụng các thiết bị lưu trữ đặc biệt gắn trực tiếp vào trong mạng như một thiết bị mạng bình thường (tương tự máy tính, switch hay router). Các thiết bị NAS cũng được gắn các địa chỉ IP cố định và được client truy nhập thông qua sự điều khiển của server. Trong một số trường hợp, NAS có thể được truy cập trực tiếp không cần có sự quản lý của server. NAS có các ưu điểm sau: Trong môi trường đa hệ điều hành với nhiều máy chủ khác nhau, việc lưu trữ dữ liệu, backup, quản lý hay áp dụng các chính sách security đều được thực hiện tập trung. Khả năng mở rộng: khi người dùng cần thêm dung lượng lưu trữ, các thiết bị lưu trữ NAS mới có thể được bổ sung và lắp đặt vào mạng. NAS tăng cường khả năng chống lại sự cố cho mạng. Trong môi trường DAS, khi một máy chủ chứa dữ liệu không hoạt động thì toàn bộ dữ liệu đó không thể sử dụng được. Trong môi trường NAS, dữ liệu vẫn hoàn toàn có thể được truy nhập bởi người dùng. Các biện pháp chống lỗi và dự phòng tiên tiến được áp dụng để bảo đảm NAS luôn sẵn sàng cung cấp dữ liệu cho người dùng. Tuy có những điểm nổi trội so với các thiết bị DAS nhưng NAS vẫn có những hạn chế nhất định. Với việc sử dụng chung hạ tầng mạng với các ứng dụng khác, việc lưu trữ dữ liệu có thể ảnh hưởng đến hiệu năng của toàn hệ thống (làm chậm tốc độ của LAN), điều này đặc biết đáng quan tâm khi cần lưu trữ thường xuyên một lượng lớn dữ liệu. SAN SAN (Storage Area Network) là một mạng riêng gồm các thiết bị lưu trữ được liên kết với nhau và liên kết với máy chủ (hoặc một nhóm các máy chủ) đóng vai trò như các điểm truy nhập trong SAN. Trong một số trường hợp, SAN cũng được kết nối với mạng LAN. SAN sử dụng các switch đặc biệt để kết nối các thiết bị với nhau. Hệ thống SAN thường được chia làm hai mức: mức vật lý và logic. Mức vật lý mô tả sự liên kết các thành phần của mạng (edge switch, core switch, Host Bus Adapter – HBA, cable, firmware) tạo ra một hệ thống lưu trữ đồng nhất và có thể sử dụng đồng thời cho nhiều ứng dụng và người dùng. Mức logic bao gồm các ứng dụng, các công cụ quản lý và dịch vụ được xây dựng trên nền tảng của các thiết bị lớp vật lý, cung cấp khả năng quản lý hệ thống SAN. Việc sử dụng một mạng riêng để kết nối các thiết bị lưu trữ với nhau có những ưu điểm nhất định so với các phương pháp khác. Cụ thể là: Có khả năng backup dữ liệu với dung lượng lớn và thường xuyên mà không làm ảnh hưởng đến lưu lượng thông tin trên mạng. Dữ liệu luôn ở mức độ sẵn sàng cao, không giống như DAS sử dụng các thiết bị lưu trữ trực tiếp gắn với server. Dữ liệu được lưu trữ thống nhất, tập trung và có khả năng quản lý cao. Có khả năng khôi phục dữ liệu nếu có xảy ra sự cố. Một số đặc điểm khác của hệ thống SAN: Hỗ trợ nhiều giao thức, chuẩn lưu trữ khác nhau iSCSI, FCIP, DWDM. Có khả năng mở rộng tốt trên cả phương diện số lượng thiết bị, dung lượng hệ thống cũng như khoảng cách vật lý. Mức độ security cao do thực hiện quản lý tập trung cũng như sử dụng các công cụ hỗ trợ quản lý SAN. Lựa chọn giải pháp lưu trữ Với các phân tích ưu nhược điểm của các công nghệ lưu trữ phổ dụng hiện nay, kết hợp với tính chất công việc, yêu cầu sử dụng và kinh phí đầu tư của hệ thống cơ sở dữ liệu dùng chung, chúng tôi đề xuất giải pháp sử dụng công nghệ NAS kết hợp với DAS dùng cho thiết bị lưu trữ. NAS bảo đảm tính sẵn sàng cũng như khả năng an toàn dữ liệu, không phụ thuộc các server. NAS phù hợp với các hệ thống lưu trữ với dung lượng lớn. Chúng tôi chọn giải pháp NAS dùng cho hệ thống lưu trữ tại Trung tâm Tích hợp dữ liệu của Tỉnh. Chi tiết về hệ thống NAS được đề xuất sẽ được chúng tôi trình bày trong phần “Hệ thống lưu trữ”. Với nhu cầu lưu trữ tại các đơn vị, chúng tôi sử dụng giải pháp lưu trữ DAS với thiết bị lưu trữ dung lượng lớn gắn trực tiếp với máy chủ database. Mỗi máy chủ database tại các trung tâm lưu trữ được gắn trực tiếp với thiết bị lưu trữ DAS. Chi tiết về thiết bị DAS được đề xuất được chúng tôi trình bày trong phần “Hệ thống lưu trữ”. Hệ thống lưu trữ Lưu trữ dùng NAS Để đáp ứng cho nhu cầu lưu trữ tại Trung tâm Tích hợp dữ liệu của Tỉnh, chúng tôi sử dụng thiết bị lưu trữ NAS server. Máy chủ NAS thực hiện lưu trữ các dữ liệu của các server trên mạng, góp phần loại trừ và giảm yêu cầu về các thiết bị lưu trữ gắn trực tiếp vào các server đó. Khả năng này giúp tăng cường tính sẵn sàng của dữ liệu – dữ liệu có thể được truy xuất bởi nhiều client khác nhau mà không bị ảnh hưởng bởi tình trạng của server. Ngay cả khi server có sự cố không hoạt động được, dữ liệu vẫn sẵn sàng cho các nhu cầu sử dụng của người dùng. NAS thực chất là một máy chủ với khả năng lưu trữ và khả năng mở rộng lớn theo yêu cầu. Ngoài ra, các thiết bị NAS có khả năng kết hợp với nhiều thiết bị và giải pháp lưu trữ khác khi có nhu cầu mở rộng. Tủ đĩa lưu trữ Với thiết bị lưu trữ tại các đơn vị, chúng tôi sử dụng tủ đĩa lưu trữ gắn trực tiếp với máy chủ cơ sở dữ liệu. Với khả năng lưu trữ dung lượng lớn, độ sẵn sàng và hiệu năng cao, tủ đĩa lưu trữ là giải pháp lý tưởng cho công tác lưu trữ tại các phòng Tin học của các đơn vị trong tỉnh. Hệ thống tủ đĩa lưu trữ cần đáp ứng được một số tiêu chuẩn sau: Gọn nhẹ, không chiếm nhiều không gian lưu trữ Hỗ trợ các chuẩn lưu trữ tiên tiến, cho phép trao đổi dữ liệu tốc độ cao Có khả năng mở rộng, bảo đảm người dùng có thể bảo toàn đầu tư khi nâng cấp trong tương lai. Ổ cứng, nguồn, quạt có khả năng thay thế nóng. Quạt, nguồn và I/O module đều có khả năng dự phòng. Hỗ trợ nhiều ổ cứng với dung lượng lớn. Lưu trữ dùng băng từ (Tape) Như trên đã trình bày, với việc lưu trữ tại Trung tâm Tích hợp dữ liệu của Tỉnh, bên cạnh việc dùng NAS server làm thiết bị lưu trữ chính, chúng tôi sử dụng tape storage để backup các dữ liệu với dung lượng lớn. Trong đề xuất kỹ thuật này, chúng tôi đề xuất sử dụng thiết bị autoloader để backup dữ liệu từ server ra hệ thống băng từ. Hệ thống autoloader có một đầu đọc ghi và chứa được một số tape nhất định. Autoloader có thể chứa đồng thời nhiều tape Khi đọc ghi dữ liệu, hệ thống chỉ có thể truy cập một tape tại một thời điểm Với số lượng tape lớn hơn khả năng lưu trữ của autoloader, một số tape có thể được lưu trữ ngoài và sẽ được đưa vào autoloader khi có nhu cầu sử dụng. Các dữ liệu lưu trên tape có nhược điểm là tốc độ truy cập chậm hơn so với trên ổ đĩa cứng nhưng bù lại, chúng ta có thể lưu trữ được dung lượng lớn dữ liệu trên tape với chi phí rẻ, cho phép thực hiện bảo quản lâu dài. Lưu trữ dùng CD Trong giải pháp này, chúng tôi vẫn đề xuất một giải pháp lưu trữ khác phổ biến ở Việt Nam là thực hiện lưu trữ trên các đĩa CD. Để thực hiện được điều này, Trung tâm Tích hợp dữ liệu và các phòng Tin học của các đơn vị được trang bị các đầu ghi CD dùng cho mục đích lưu trữ các dữ liệu đã được số hóa trên CD. HỆ THỐNG UPS Hiện nay, việc điều hành quản lý các hoạt động kinh doanh, kỹ thuật và nghiên cứu của các cơ quan, tổ chức và doanh nghiệp phụ thuộc rất nhiều vào thiết bị máy tính và các thiết bị liên lạc truyền thông. Về phần mình, để bảo đảm cho hoạt động liên tục và chính xác, các thiết bị tin học này lại phụ thuộc rất lớn vào nguồn cung cấp điện. Chúng luôn đòi hỏi phải có một nguồn điện liên tục, ổn định, chất lượng cao trong mọi tình huống. Trong khi đó, nguồn điện cung cấp của thành phố lại không ổn định với nhiều loại sự cố xảy ra như mất điện, điện áp không ổn định, nhiễu, hài làm cho chất lượng điện kém. Ngay cả khi đã có trang bị hệ thống máy phát điện dự phòng để chống mất điện lâu dài, nhưng khi có sự cố mất điện xảy ra thì toàn bộ hệ thống máy tính, mạng máy tính và các thiết bị điện tử truyền thông nhạy cảm vẫn phải ngừng hoạt động do các gián đoạn trong khi đổi nguồn cung cấp. Lúc đó có thể xảy ra việc mất dữ liệu, hệ thống bị rối loạn và đôi khi không thể phục hồi. Đó là chưa kể đến chất lượng của nguồn điện do máy phát điện đưa ra nhiều khi không đáp ứng được yêu cầu của các thiết bị có mạch điện tử nhạy cảm. Để khắc phục tình trạng trên, các trung tâm dữ liệu quan trọng cần phải có một nguồn điện liên tục, có tính độc lập tương đối cao với nguồn điện thành phố cũng như đối với hệ máy phát điện dự phòng. Đó chính là hệ thống UPS trực tuyến công suất lớn. Hệ thống UPS (Uninterruptible Power Supply) là một thành phần không thể thiếu được đối với các thiết bị điện tử, tin học, truyền thông. Về nguyên lý, khi có sự cố trên điện lưới, UPS sẽ dùng năng lượng của các ắc quy có sẵn để cung cấp một nguồn điện liên tục và ổn định cho hệ thống tải trong khoảng thời gian đủ để chờ có điện trở lại (nếu mất điện trong thời gian ngắn) hoặc chuyển sang nguồn dự phòng (nếu mất điện lâu dài). Hệ thống UPS cho trung tâm dữ liệu phải đáp ứng được các yêu cầu sau: Bảo đảm cung cấp nguồn liên tục và ổn định cho toàn bộ các máy chủ quan trọng trong Trung tâm Tích hợp dữ liệu của Tỉnh cũng như các phòng Tin học của các đơn vị. Hệ thống phải bảo đảm khả năng hoạt động liên tục cho các thiết bị của trung tâm. Ngoài ra, hệ thống phải có khả năng hoạt động dự phòng, bảo đảm đáp ứng được yêu cầu trong trường hợp có sự cố với một thiết bị nào đó trong hệ thống. Có khả năng quản lý tập trung, cho phép lập trình theo lịch biểu. Khả năng mở rộng và nâng cấp dễ dàng. Điều này đặc biệt cần thiết khi quy mô và mức độ hoạt động của trung tâm dữ liệu tăng lên theo thời gian. Các thiết bị UPS có thể dùng của các hãng nổi tiếng trong lĩnh vực này như APC hay Powerware (các hãng độc lập). Ngoài ra, các thiết bị UPS có thể được trang bị kèm với hệ thống lưu trữ và máy chủ (UPS đi kèm với thiết bị của hãng). Trong thiết kế này, các máy chủ và thiết bị quan trọng đều được trang bị các UPS đi kèm, bảo đảm khả năng bảo vệ hệ thống khi có sự cố về nguồn. CẤU HÌNH CÁC THIẾT BỊ HỆ THỐNG Danh mục Chi tiết kỹ thuật Thiết bị mạng  Router Cisco 3725 (Head quarter)  3700 Series, 2-Slot, Dual FE, Multiservice Access Router Cisco 3725 Ser IOS IP PLUS 4-Port Async/Sync Serial Network Module Power Cord Europe 3 x RS-232 Cable, DTE Male to Smart Serial, 10 Feet Router Cisco 2651XM (Internet)  High Performance Dual 10/100 Modular Rout with Cisco IOS IP Power Cord Europe Cisco 2600 Ser IOS IP PLUS 1-Port Serial WAN Interface Card V.35 Cable, DTE Male to Smart Serial, 10 Feet Configuration of software via CCO for 2600 64 to 128MB DRAM factory upgrade - 265xXM/XM VPN Bundles 16 to 32 MB Flash Factory Upgrade for the Cisco 2600XM Router Cisco 2650XM (Branch)  High Performance 10/100 Modular Router w/Cisco IOS IP Power Cord Europe Cisco 2600 Ser IOS IP PLUS 2-Port Async/Sync Serial WAN Interface Card V.35 Cable, DTE Male to Smart Serial, 10 Feet Configuration of software via CCO for 2600  Catalyst 3550-12T  10-10/100/1000BaseT ports and 2 GBIC ports Catalyst 2950-24T  24 10/100 ports w/ 2 10/100/1000BASE-T ports, Enhanced Image Firewall PIX525  PIX 525-R Bundle (Chassis, Restricted SW, 2 FE Ports) PIX 10/100 Fast Ethernet interface card, RJ45 Máy chủ  Máy chủ Cơ sở dữ liệu Processor: 2 x Intel Xeon 2.80GHz, system bus 400 MHz, 512KB L2 Cache Memory: 2048MB PC1600 ECC SDRAM Hard Disk: 4 x 36GB 10K U320 Pluggable Hard Drive NIC Card: Integrated Compaq NC3163 Fast Ethernet NIC PCI 10/100, NC7132 10/100/1000 NIC Card SCSI Adapter: Integrated Dual Channel Wide Ultra3 SCSI Adapter Smart Array 532 Controller Rack form Redundant Fans and Power Supplies Monitor, Keyboard and Mouse share with other devices in the same rack. Máy chủ ứng dụng Processor: 2 x Intel Xeon 2.80GHz, system bus 400 MHz, 512KB L2 Cache Memory: 1024MB PC2100 DDR SDRAM Hard Disk: 4 x 36GB Ultra3 SCSI 10K U320 Pluggable Hard Drive NIC Card: Integrated Integrated NC7781 PCI-X Gigabit NIC SCSI Adapter: Integrated Dual Channel Wide Ultra3 SCSI Adapter Smart Array 532 Controller Rack form. Redundant Fans and Power Supplies FDD1.44 MB, CDROM Drive Monitor, Keyboard and Mouse share with other devices in the same rack. Máy chủ DNS/Proxy  Processor: 2 x Intel Xeon 2.80GHz, system bus 400 MHz, 512KB L2 Cache Memory: 1024MB PC2100 DDR SDRAM Hard Disk: 4 x 36GB Ultra3 SCSI 10K U320 Pluggable Hard Drive NIC Card: Integrated Integrated NC7781 PCI-X Gigabit NIC SCSI Adapter: Integrated Dual Channel Wide Ultra3 SCSI Adapter Smart Array 532 Controller Rack form. Redundant Fans and Power Supplies FDD1.44 MB, CDROM Drive Monitor, Keyboard and Mouse share with other devices in the same rack Máy chủ backup Processor: 2 x Intel Xeon 2.80GHz, system bus 400 MHz, 512KB L2 Cache Memory: 1024MB PC2100 DDR SDRAM Hard Disk: 4 x 36GB Ultra3 SCSI 10K U320 Pluggable Hard Drive NIC Card: Integrated Integrated NC7781 PCI-X Gigabit NIC SCSI Adapter: Integrated Dual Channel Wide Ultra3 SCSI Adapter Smart Array 532 Controller Rack form. Redundant Fans and Power Supplies FDD1.44 MB, CDROM Drive Monitor, Keyboard and Mouse share with other devices in the same rack  Hệ thống lưu trữ  Storage Enclosure 4314T  4314 Tower JBOD StorageWorks Enclosure 8 x 146GB 10K U320 Pluggable Hard Drive UPS T2200 XR High Voltage INT Storage NAS B3000  NAS B3000 v2 Server w/Storage US DL380G3 - Dual processors, 2 GB DDR DIMM, 2 mirrored 36 GB HDD Redundant power supplies, redundant fans, FC2101 64-bit/66MHz FC Adapter MSA 1000 StorageWorks Enclosure with 4 146 GB HDD, 256 MB Controller Cache Two embedded Compaq NC7781 PCI-X Gigabit NICs and Integrated Smart Array 5i Plus Controller Slimline DVD-ROM Drive 1.44 MB FDD Windows 2000 Server OS Included 4 x 146GB 10K U320 Pluggable Hard Drive 2Gb FC Port Kit ALL 256MB Battery Cache Upgrade Kit Tape Autoloader  SSL1016 SDLT160/320 Tape Autoloader sdlt media - 20 pack all OV Data Protector Cell Manag Win. LTU CD Hệ thống rack cho máy chủ Rack 10642 (42U) Standard Pallet PDU 16A-High, All ALL Integrated 1U Kybd & TFT Monitor Kit INT 8 x CPU to Switch Box Cable (12ft) 4 x Blanking Panel 10 1U 10k KVM Switch Box 1x8 Port INT UPS R6000 High Voltage INT GIẢI PHÁP SAO LƯU VÀ PHỤC HỒI DỮ LIỆU Hệ thống được thiết kế bảo đảm khắc phục các sự cố về dữ liệu của ứng dụng cũng như hệ điều hành. Khi dữ liệu của ứng dụng bị hỏng hoặc hệ điều hành bị sụp đổ, hệ thống bảo đảm các dữ liệu sao lưu cho việc phục hồi trạng thái làm việc ổn định. Dưới đây là 3 phương pháp sao lưu của hệ thống được thực hiện theo các chu kỳ: Ngày, tuần và tháng. Các thao tác sao lưu và phục hồi đều có thể dễ dàng thực hiện tại chỗ (local) hoặc từ xa (remote) nếu sử dụng các công cụ hỗ trợ như Terminal Service. CÁC GIẢI PHÁP SAO LƯU Hệ thống CSDL dùng chung đảm bảo an toàn dữ liệu theo 3 phương thức cơ bản: Sao lưu đầy đủ, sao lưu gia tăng và sao lưu khác biệt. Sao lưu đầy đủ Dùng để sao lưu tất cả các thông tin được chọn, không quan tâm đến việc thông tin đó được lưu trữ vào thời điểm nào và các lần sao lưu trước đó. Phương pháp này cho phép sao lưu đầy đủ nhất, nhưng tốn kém về thời gian và phương tiện sao lưu. Sao lưu đầy đủ chỉ thực hiện được khi ngừng toàn bộ hoạt động của hệ thống Sao lưu gia tăng Dùng để sao lưu tất cả các thông tin được chọn mà có sự thay đổi hoặc cập nhật so với lần sao lưu gần nhất trước đó. Phương thức này cho phép tiết kiệm tối đa thời gian, đồng thời cho phép thực hiện sao lưu trực tuyến trong khi hệ thống vẫn đang hoạt động, tuy nhiên khá phức tạp và sẽ tốn nhiều dung lượng lưu trữ trong trường hợp dùng cơ chế Logs của hệ thống. Sao lưu khác biệt Dùng để sao lưu tất cả các thông tin được chọn mà có sự thay đổi hoặc cập nhật so với lần sao lưu khác biệt hoặc đầy đủ gần nhất trước đó. CHIẾN LƯỢC SAO LƯU Chiến lược sao lưu là lựa chọn phương thức sao lưu, tần suất sao lưu dữ liệu của hệ thống. Việc hoạch định chiến lược sao lưu tối ưu phải phụ thuộc vào qui mô, tầm cỡ của hệ thống, độ quan trọng của dữ liệu và tính chất nghiệp vụ của hệ thống. Các yếu tố ảnh hưởng trực tiếp đến chiến lược sao lưu: Quy mô, tầm cỡ của hệ thống: Hệ thống càng lớn, việc phục hồi dữ liệu càng khó khăn và hầu như không thể thực hiện được nếu không có sao lưu. Chi phí và thời gian dành cho việc sao lưu cũng sẽ tỷ lệ với độ lớn dữ liệu. Độ quan trọng của dữ liệu: Dữ liệu càng quan trọng thì việc sao lưu càng phải được thực hiện nghiêm túc, tuân thủ chặt chẽ các quy định và quy trình sao lưu dữ liệu. Tính trực tuyến của hệ thống: Thời gian làm việc của hệ thống, số giờ trong 1 ngày, số ngày trong 1 tuần. Tính trực tuyến của hệ thống ảnh hưởng trực tiếp đến việc quyết định thời gian và tần suất sao lưu dữ liệu. Tính trực tuyến của dữ liệu: Tính trực tuyến của dữ liệu ảnh hưởng đến việc quyết định tần suất và phương thức sao lưu dữ liệu. Đối với những dữ liệu có tính trực tuyến cao, luôn luôn thay đổi, tần suất sao lưu dữ liệu cũng phải cao và việc sao lưu dữ liệu cũng phải hoạt động trực tuyến (có khả năng sao lưu dữ liệu mà không làm ngừng hoạt động của hệ thống). Khả năng phục hồi dữ liệu: Là khả năng phục hồi lại dữ liệu khi không có sao lưu. Khả năng này phụ thuộc vào tính sẵn có của dữ liệu đầu vào, và phương thức cũng như thời gian nhận/nhập dữ liệu vào hệ thống. SAO LƯU DỮ LIỆU Theo ngày Chúng ta sử dụng backup on-line, cho phép thực hiện việc backup dữ liệu của hệ thống trong khi hệ thống vẫn đang hoạt động (người sử dụng vẫn có thể truy nhập bình thường trong quá trình backup). Dữ liệu sẽ được lưu trữ ở file backup. Thông tin được lưu trữ bao gồm tất cả các object (bảng dữ liệu, cấu trúc dữ liệu, triggers, packages,...) của CSDL. Phương án này backup phần dữ liệu thay đổi trong ngày của CSDL. Phương pháp backup này sử dụng công cụ Backup/Restore sẵn có của các hệ quản trị CSDL. Chu kỳ Đối với dữ liệu hệ thống CSDL dùng chung thì: Mỗi ngày định kỳ một lần vào cuối ngày. Lưu trữ file backup Chúng ta sử dụng 7 files khác nhau được gán tên có đánh số từ 1 đến 7, như vậy chúng ta sẽ có số liệu của 7 ngày làm việc gần nhất của hệ thống. Theo tuần Chúng ta cũng lựa chọn giải pháp backup on-line. Backup toàn bộ hệ thống CSDL dùng chung. Dùng phương án này chúng ta có được số liệu của toàn bộ cơ sở dữ liệu hàng tuần. Phương pháp backup này sử dụng công cụ Backup/Restore sẵn có của các hệ quản trị CSDL. Chu kỳ Mỗi tuần một lần vào cuối giờ làm việc của ngày thứ sáu, chúng ta thực hiện phương án backup này. Lưu trữ file backup Chúng ta cũng sử dụng 4 files khác nhau được gán tên có đánh số từ 1 đến 4 để backup các datafiles. Theo tháng Đây là phương án backup toàn bộ hệ điều hành, chương trình ứng dụng và các CSDL dùng chung. Đây là giải pháp backup off-line, đòi hỏi hệ thống không còn các giao dịch kết nối, các CSDL dùng chung phải được shutdown. Phương pháp backup này sử dụng công cụ System Tools/Backup của Windows Server. Chu kỳ Mỗi tháng một lần vào cuối giờ làm việc của ngày thứ sáu tuần cuối cùng của tháng, chúng ta thực hiện phương án backup này. Lưu trữ file backup Chúng ta cũng sử dụng 12 files khác nhau được gán tên có đánh số từ 01 đến 12 để backup toàn bộ thông số của hệ điều hành. PHỤC HỒI DỮ LIỆU KHI GẶP SỰ CỐ Trường hợp sự cố dữ liệu ứng dụng Đối với sự cố khi toàn bộ các file và cơ sở dữ liệu hệ thống của hệ quản trị CSDL vẫn an toàn, chỉ có số liệu của CSDL dùng chung vì lý do gì đó bị hỏng, chúng sử dụng dữ liệu được backup ở các file lưu trữ số liệu hàng tuần và hàng ngày để thực hiện khôi phục. Các bước khôi phục cụ thể như sau: Khôi phục lại cơ sở dữ liệu sử dụng các file backup dữ liệu tuần (dùng công cụ Backup/Restore của hệ quản trị CSDL). Sử dụng file backup dữ liệu ngày mới nhất để khôi phục phần dữ liệu mới nhất đến trước khi xảy ra sự cố. Trường hợp sự cố CSDL Trong trường hợp này có thể sẽ phải cài lại hệ quản trị CSDL. Trước khi cài lại hệ quản trị CSDL, cần lưu lại các file database của CSDL dùng chung để cố gắng sử dụng lại do các file này đang chứa dữ liệu mới nhất. Trong trường hợp không thể dùng được các file database chúng ta sẽ sử dụng các files lưu trữ số liệu hàng tuần và hàng ngày để khôi phục tuỳ thuộc dữ liệu nào được backup gần đây nhất. Các bước khôi phục dữ liệu như sau: Lưu lại các file cơ sở dữ liệu của ứng dụng và tiến hành cài đặt lại hệ quản trị CSDL (nếu cần thiết) Dùng lệnh attach database của hệ quản trị CSDL để dùng lại các file cơ sở dữ liệu đã lưu lại ở bước trên. Sử dụng các file backup số liệu tuần và ngày để khôi phục lại cơ sở dữ liệu trong trường hợp không dùng lại được các file cơ sở dữ liệu. Trường hợp sự cố hệ điều hành Trong trường hợp máy chủ bị sự cố do một lý do bất khả kháng (hỏng hóc thiết bị, động đất, hoả hoạn, v.v...) không có thể tiếp tục hoạt động ngay được, cần có một quy trình phục hồi hoạt động của điểm này trong thời gian ngắn nhất. Quy trình phục hồi hoạt động như sau: Dùng hệ thống máy chủ cluster Một Cluster là một tập hợp tổng thể các máy tính được kết nối về mặt vật lý với nhau, mỗi máy có bộ xử lý, bộ nhớ động, hệ thống I/O và địa chỉ mạng riêng. những máy tính này có thể chia sẻ một tập hợp các tài nguyên như đĩa, ứng dụng, dữ liệu, địa chỉ mạng logic, password bảo vệ và tất cả được quản lý bởi một tầng quản lý riêng. Tầng quản lý này được gọi là Cluster Manager, chuyên monitor and reacts các sự kiện hệ thống tập chung hoặc là về mặt phần cứng, hệ điều hành hoặc ứng dụng được phát ra và thực hiện các hoạt động để giữ các ứng dụng và dữ liệu sẵn sàng cho việc liên kết với người dùng. Đó là các server mạnh, có khả năng đáp ứng nhiều loại ứng dụng khác nhau liên kết với nhau thông qua đường Ethernet, cùng sử dụng chung một hệ thống lưu trữ thông tin (shared storage) và hoạt động nhờ vào một software cho phép cluster (Cluster-enable software). Một hệ thống máy nối cluster với nhau cho phép: Tăng tính sẵn sàng và độ tin cậy của hệ thống. Tăng hiệu năng của hệ thống. Dùng máy chủ dự phòng Nguyên tắc chung: Dùng hệ thống máy chủ dự phòng tiếp tục thực hiện các giao dịch. Sau khi máy chủ được phục hồi xong, các giao dịch này sẽ được tự động cập nhật vào CSDL chính bằng cơ chế đồng bộ hóa. Quá trình phục hồi máy chủ sẽ được thực hiện qua các bước Bước 1: Khắc phục sự cố Khắc phục sự cố phần cứng (nếu có) Dựng lại máy chủ hệ thống CSDL dùng chung Bước 2: Khôi phục lại toàn bộ hệ thống đến thời điểm bị hỏng hóc theo quy trình được nêu ở phần trên Bước 3: Kiểm tra hệ thống đã hoạt động trở lại Bước 4: Thực hiện đồng bộ hóa hai cơ sở dữ liệu qua cơ chế của hệ quản trị cơ sở dữ liệu. Như vậy, đối với trường hợp sự cố trên 1 máy chủ Cluster, hệ thống sẽ được vận hành trên máy chủ Custer còn lại, thực hiện khắc phục sự cố trên máy chủ bị hỏng. Trường hợp toàn bộ máy chủ Cluster gặp sự cố, chuyển hướng sử dụng của toàn bộ hệ thống lên máy chủ dự phòng, khắc phục sự cố trên máy chủ chính. Trường hợp toàn bộ máy chủ Cluster và máy chủ dự phòng gặp sự cố, sử dụng các file backup dữ liệu của tháng gần nhất với tháng xảy ra sự cố để phục hồi lại toàn bộ hệ thống. Sau đó sử dụng các files lưu trữ số liệu hàng tuần và hàng ngày để phục hồi lại cơ sở dữ liệu. AN TOÀN BẢO MẬT HỆ THỐNG DỰ PHÒNG Các hệ thống CSDL dùng chung được vận hành trên máy chủ Cluster đảm bảo luôn có sự vận hành 24/24 của hệ thống, không bị gián đoạn khi có sự cố trên một máy chủ. Ngoài ra hệ thống yêu cầu có thêm một máy chủ dự phòng được đặt tại một phòng chứa máy chủ khác với máy chủ chính đang được vận hành của hệ thống. Hai tiếng một lần hệ thống sẽ có cơ chế tự đồng bộ số liệu sang máy chủ dự phòng để đảm bảo an toàn số liệu trong trường hợp sự cố máy chủ chính. BẢO MẬT MỨC HÀNH CHÍNH Mức bảo mật này dựa trên các nguyên tắc hành chính của đơn vị. Kiểm soát chức năng, nhiệm vụ, quyền hạn, việc ra vào các phòng máy chủ của từng cá nhân. Tuân thủ các nguyên tắc bảo mật thông tin trên CSDL dùng chung. Từng cá nhân phải có trách nhiệm bảo vệ tài nguyên máy tính của mình cũng như đảm bảo bí mật tên người sử dụng, mật khẩu dùng để truy cập và quản trị hệ thống CSDL dùng chung. BẢO MẬT MỨC HỆ ĐIỀU HÀNH Chúng ta đều biết rằng bất cứ hệ điều hành nào cũng cho phép áp dụng các qui tắc bảo mật tới các tài nguyên của nó. Chúng ta có các quyền truy nhập tài nguyên sau: Quyền truy nhập máy chủ/bảo trì hệ thống Quyền chạy các chương trình ứng dụng Mỗi người sử dụng của hệ thống được cũng cấp một account ở mức hệ điều hành, account này sẽ được gán quyền cho phép chạy chương trình nào trên hệ thống. Có một account quản trị hệ thống (Administrator) sẽ có toàn quyền đối với hệ thống (mức hệ điều hành), account này có thể phân quyền chạy các chức năng này cho các account sử dụng khác. Các hệ thống CSDL dùng chung được định hướng xây dựng trên môi trường Windows Server. Như vậy phần này chỉ tập trung đến những vấn đề bảo mật của hệ điều hành Windows Server. Khi làm việc trong môi trường Windows Server, mỗi người sử dụng được cung cấp một khoản mục người sử dụng (user account) để truy nhập vùng cũng như truy nhập các tài nguyên của mạng. Khoản mục người sử dụng của Windows Server bao gồm: Tên, mật khẩu để nhập vùng, những nhóm mà người sử dụng là thành viên, quyền của người sử dụng đối với hệ thống. Nó cũng chứa các thông tin khác như: Tên đầy đủ, mô tả khoản mục, thông tin về môi trường làm việc máy trạm để từ đó có thể nhập vùng, thời gian được phép làm việc... Trong quá trình cài đặt Windows Server, các khoản mục Guest (Khách) và Administrator được tự động tạo ra. Khoản mục Guest dùng cho những người làm việc tạm thời có thể truy cập vào một số tài nguyên của máy tính mà họ đang làm việc. Khoản mục Administrator được dùng để quản lý chung các máy tính, người sử dụng cũng như các tài nguyên của vùng. Chúng ta có thể dùng khoản mục này để tạo ra các nhóm mới, thiết lập chế độ bảo mật, gán quyền cho các cá nhân. Windows Server cung cấp các chính sách quản lý môi trường làm việc của người sử dụng: Chính sách hệ thống (System policy) cung cấp cho người quản trị khả năng điều khiển và quản lý cao đối với các máy tính chạy Windows Server hay Windows 9x trên toàn vùng. Cho phép người quản trị tạo ra những chính sách cũng như thay đổi chúng cho từng người sử dụng trong hệ thống hay những máy tính trong toàn vùng. Khái lược người sử dụng (user profile) bao gồm mọi thiết đặt mà người sử dụng có thể tự định nghĩa, liên quan đến giao diện làm việc, các kết nối mạng và máy in... Cơ chế bảo mật của Windows Server buộc mỗi người sử dụng phải có khái lược riêng để truy nhập mạng. Khái lược này có thể được lưu trên máy chủ và chúng đi theo người sử dụng đến mọi máy chạy Windows trên mạng. Trên các máy tính chạy Windows Server, chính sách hệ thống kết hợp với khái lược người sử dụng tạo ra môi trường làm việc của người sử dụng vì mỗi công cụ này có tác dụng ở những phạm vi khác nhau của môi trường. Windows Server còn cung cấp chính sách quản trị theo nhóm người sử dụng dưới dạng các khoản mục nhóm. Nhóm là một khoản mục có thể chứa những khoản mục nhóm và khoản mục người sử dụng khác như các thành viên của mình. Chúng ta có thể dùng nhóm để: Giao cho người sử dụng quyền thực hiện các công việc hệ thống như dự trữ và phục hồi các tệp hoặc thay đổi thời gian hệ thống. Theo ngầm định thì khi mới được tạo ra, người sử dụng không có một chút quyền gì. Họ phải được gán vào một nhóm nào đó để lấy quyền. Cho phép truy nhập vào các tài nguyên như tệp, thư mục và máy in. Quyền của nhóm được gán tự động cho các thành viên của nhóm. Điều này cho phép người quản trị xử lý một số lượng lớn người sử dụng chi thông qua một khoản mục. Chúng ta có quyền của người sử dụng (user right) và cho phép (permision) là hai nguyên tắc để quy định các hoạt động của người sử dụng trong mạng. Trong khi quyền liên quan đến công việc hệ thống thì cho phép liên quan đến các tài nguyên như tệp tin, thư mục hay máy in. Khái niệm nhóm là một khái niệm quan trọng trong Windows Server. Microsoft Windows Server cung cấp ba kiểu nhóm, mỗi kiểu có các mục đích, khả năng và hạn chế khác nhau: Nhóm cục bộ (Local group). Đây là kiểu nhóm được cài đặt trong cơ sở dữ liệu khoản mục cục bộ của máy tính. Windows Server cung cấp nhiều nhóm cục bộ tạo sẵn để quản lý công việc hệ thống. Những nhóm này cho người sử dụng một số quyền về hệ thống như lưu trữ và phục hồi tệp, thay đổi thời gian hệ thống hay quản lý tài nguyên hệ thống. Người quản trị có thể tạo thêm các nhóm cục bộ mới để quản lý việc truy cập tại nguyên. Nhóm cục bộ cho phép thành viên của nó được quyền truy cập tài nguyên của máy tính có đăng ký nhóm cục bộ đó. Các nhóm cục bộ sẵn có trên mọi máy chạy Windows Server. Nhóm toàn cục (Global group). Loại nhóm này được sử dụng để tổ chức các khoản mục người sử dụng của vùng. Những nhóm này giúp cho người quản trị trong việc quản lý mọi người sử dụng của vùng. Nhóm toàn cục chỉ chứa các khoản mục người sử dụng từ những cơ sở dữ liệu khoản mục vùng cục bộ chứ không chứa các khoản mục của các vùng khác. Tuy nhiên, các nhóm này có thể được sử dụng trên toàn vùng hay những vùng khác nhau. Mặc dù chúng chỉ chứa người sử dụng từ những vùng cục bộ nhưng thông qua các quan hệ tin cậy có thể dùng chúng để truy nhập đến những vùng khác. Những nhóm toàn cục được gán quyền truy nhập đến các tài nguyên ở máy tính chứa nhóm hay đến những vùng tin cậy. Những nhóm toàn cục cũng có thể được gán quyền truy nhập tài nguyên bằng cách đưa chúng vào nhóm cục bộ có quyền trên. Chúng chỉ có trên các máy điều khiển vùng. Nhóm hệ thống (System group). Chỉ có Windows Server dùng loại nhóm này để truy nhập hệ thống. Nhóm này còn được gọi là nhóm đặc biệt, nó không chứa khoản mục người sử dụng hay khoản mục nhóm khác. Các nhóm này tự động tổ chức người sử dụng để phục vụ nhu cầu sử dụng của hệ thống. Người quản trị không thể gán người sử dụng vào các nhóm này. Mọi người sử dụng đều là thành viên của một nhóm hệ thống nào đó ngầm định hay theo hoạt động của họ trong mạng. Các nhóm đặc biệt có trên mọi máy Windows Server. Có một số nhóm đặc biệt sau: Nhóm mạng (Network), Nhóm tương tác (Interactive), Nhóm toàn thể (Everyone), Nhóm người sở hữu do khởi tạo (Creator Owner). Windows Server còn đưa ra phương thức bảo mật các tài nguyên mạng thông qua các cho phép chia sẻ (share permissions). Nếu như muốn truy cập vào một chương trình nào đó hoặc vào một cơ sở dữ liệu được cài đặt trên một máy khác, tức là chúng ta phải sử dụng tài nguyên mạng, thì tài nguyên đó phải được chia sẻ. Để điều khiển người sử dụng truy nhập vào một thư mục được chia sẻ, Windows Server cung cấp một số cách cho phép chia sẻ: No Access (Không được truy nhập). Đặt ở chế độ này, người sử dụng có thể nhìn thấy thư mục trong mạng nhưng không truy cập vào được. Read (Đọc). Đặt ở chế độ này, có thể xem các tên tệp và thư mục con, xem các thuộc tính của chúng, chạy các chương trình và truy cập tới các thư mục con. Change (Thay đổi). Đặt ở chế độ này, có thể tạo các thư mục con, thêm tệp, thay đổi dữ liệu của tệp cũng như thuộc tính của chúng, xoá tệp và các thư mục con. Full Control (Toàn quyền). Đặt ở chế độ này, có thể làm mọi việc của chế độ Change, thay đổi các cho phép của tệp, lấy quyền sở hữu đối với các tệp, thư mục. Chúng ta có thể gán các cho phép chia sẻ một cách trực tiếp cho người sử dụng cũng như gán các cho phép đó và một nhóm người sử dụng đó là thành viên. Windows Server còn cung cấp một chế độ bảo mật đó là việc đặt các cho phép NTFS trên các thư mục và tệp. Các cho phép NTFS bảo mật các tài nguyên trên mạng cục bộ và khi người sử dụng nối tới các tài nguyên đó trên mạng. Các cho phép NTFS là các cho phép chỉ có trên một phân hoạch được định dạng qua hệ thống tệp của Windows Server (NTFS). Các cho phép chung cấp bảo mật ở mức độ cao hơn vì chúng có gán tới các thư mục và tới các tệp cụ thể. Các cho phép NTFS thư mục và tệp được áp dụng cả với người sử dụng làm việc tại má nơi có thư mục hoặc tệp lưu trữ và cả những người truy nhập thư mục hoặc tệp tin đó từ mạng thông qua việc kết nối tới một thư mục được chia sẻ. Các cho phép NTFS được gán cho các khoản mục người sử dụng và các khoản mục nhóm theo cùng một cách mà các cho phép chia sẻ đã gán. Một người sử dụng có thể được gán các cho phép NTFS một cách trực tiếp hoặc như thành viên của một hay nhiều nhóm. BẢO MẬT MỨC CƠ SỞ DỮ LIỆU Các mức bảo mật Các hệ quản trị CSDL dựa vào Windows Server để thực hiện nhiều chức năng trong đó có bảo mật. Các hệ quản trị CSDL thường hỗ trợ hai kiểu bảo mật - bảo mật tích hợp và bảo mật hỗn hợp, cụ thể như sau: Kiểu bảo mật tích hợp: Chạy hệ quản trị CSDL ở chế độ bảo mật tích hợp đem lại sự an toàn cao cho cơ sở dữ liệu. Trong kiểu bảo mật tích hợp, hệ quản trị CSDL sử dụng hệ thống xác thực của Windows Server gọi là Giao diện Cung cấp Sự hỗ trợ Bảo mật (SSPI - Security Support Provider Interface). Khi một máy khách muốn kết nối với hệ quản trị CSDL qua mạng, hệ quản trị CSDL yêu cầu Windows Server xác thực máy khách đó. Windows Server kiểm tra định danh của người dùng, thực hiện sự xác thực qua lại nếu cần thiết, và cho phép việc đăng nhập vào hệ thống CSDL được tiếp tục, đồng thời gửi thẻ truy nhập (access token) cho Hệ quản trị CSDL. Sự xác thực qua lại chỉ được hỗ trợ trên hệ quản trị CSDL sử dụng hệ xác thực Kerberos. Việc xác thực trong kiểu bảo mật tích hợp hoàn toàn dựa vào các thông tin tài khoản (account) trong Windows Security Account Manager (SAM) hoặc thông tin thành viên (member) trong Windows Server Active Directory. Để cấp quyền truy xuất hệ thống CSDL cho một người dùng thì người dùng đó phải có một tài khoản SAM hoặc Active Directory tương ứng. Các hệ quản trị CSDL cũng chấp nhận khái niệm nhóm thành viên của Windows, nên ta có thể dùng tài khoản nhóm như là tài khoản người dùng trong một hệ quản trị CSDL. Kiểu bảo mật hỗn hợp: Trong kiểu bảo mật này, máy khách phải chỉ rõ ID đăng nhập và mật khẩu. ID đăng nhập và mật khẩu này được chuyển đến hệ quản trị CSDL, được kiểm tra sự tồn tại của ID đăng nhập và sự chính xác của mật khẩu. Cơ chế bảo mật này hoạt động bên trong các hệ quản trị CSDL, không sử dụng các API bảo mật của Windows. Kiểu bảo mật hỗn hợp cũng chấp nhận cả các đăng nhập của kiểu bảo mật tích hợp. Đối với các ứng dụng yêu cầu bảo mật cao, không nên sử dụng kiểu bảo mật hỗn hợp. Các cơ chế này thậm chí không hỗ trợ nhiều chiến lược bảo mật đơn giản nhất như bắt buộc chiều dài tối thiểu của mật khẩu và không cho phép mật khẩu rỗng. Bảo mật của Windows Server mạnh hơn rất nhiều nên bất kỳ ai muốn có hệ thống CSDL chạy an toàn, ổn định nên dùng kiểu bảo mật tích hợp. Các đối tượng bảo mật Người dùng hệ thống cơ sở dữ liệu: Ngay khi yêu cầu đăng nhập vào cơ sở dữ liệu được thực hiện thành công sử dụng một trong hai phương pháp được mô tả ở trên, kết nối tới hệ quản trị CSDL phải chuyển sang ngữ cảnh của cơ sở dữ liệu. Lúc này, đăng nhập được ánh xạ vào một ngữ cảnh của người dùng trong cơ sở dữ liệu. Ngữ cảnh người dùng là đặc trưng đối với cơ sở dữ liệu, do đó mỗi đăng nhập được coi như một người dùng cơ sở dữ liệu khác nhau đối với cơ sở dữ liệu. Role cơ sở dữ liệu: Mỗi cơ sở dữ liệu có thể chứa nhiều role. Role tương tự như nhóm (group) trong Windows, nhưng chúng hoàn toàn là riêng rẽ đối với một cơ sở dữ liệu cụ thể, không giống như các role server cố định. Có ba kiểu role trong một cơ sở dữ liệu: role cố định, role người dùng và role ứng dụng. Role cơ sở dữ liệu cố định: Các role cơ sở dữ liệu cố định tương tự như các role server cố định – chúng cung cấp các nhóm quyền xây dựng sẵn cho người dùng hệ quản trị CSDL. Có 9 role cơ sở dữ liệu cố định. Không giống như các role server cố định, các thành viên của mỗi role này không thể thêm người dùng khác vào role. Role cơ sở dữ liệu người dùng: Bên cạnh các role cơ sở dữ liệu cố định đã được xây dựng sẵn trong mỗi cơ sở dữ liệu, chúng ta có thể tạo các role riêng trong cơ sở dữ liệu. Role ứng dụng: Các role ứng dụng giống như các role cơ sở dữ liệu do người dùng định nghĩa; tuy nhiên, role ứng dụng không có thành viên. Hơn nữa, role ứng dụng có mật khẩu. Quyền của hệ quản trị CSDL: Sau khi đã đăng nhập vào hệ thống CSDL, người dùng chỉ có một số khả năng hạn chế thao tác trên cơ sở dữ liệu. Để thực hiện được nhiều thao tác trên hệ thống CSDL, người dùng phải có quyền hoặc là thành viên của role server cố định sys-admin. Có 3 câu lệnh tác động đến quyền: grant để cấp quyền cho người dùng, deny để cấm quyền, và revoke để loại bỏ lệnh grant hoặc deny trước đó. Có 2 loại quyền trong một hệ quản trị CSDL: quyền với câu lệnh, cho phép chạy những câu lệnh cụ thể; quyền với đối tượng, cho phép thực hiện những thao tác cụ thể trên những đối tượng cụ thể. Quyền có tính luỹ tích, ngoại trừ với deny (từ chối). Một người dùng có thể có nhiều loại quyền - quyền của chính họ, quyền của các nhóm trong Windows mà họ là thành viên, quyền của các role trong hệ quản trị CSDL mà họ là thành viên. Tuy nhiên, deny (từ chối) luôn được xem xét trước bất kỳ allow (cho phép) nào. Ví dụ, nếu người dùng có các quyền Select, Insert, Update và Delete trên một bảng do là thành viên của một nhóm nhưng người đó bị cấm (hoặc bất kỳ nhóm nào mà người đó là thành viên bị cấm) Select trên bảng đó, người dùng sẽ bị cấm các truy nhập trên bảng đó.

Các file đính kèm theo tài liệu này:

  • docGiải pháp quản lý lưu trữ cho các hệ thống cơ sở dữ liệu dùng chung.doc