Luận văn Nghiên cứu và ứng dụng ITIL cho quản lý dịch vụ đám mây nội bộ trong doanh nghiệp

Trong suốt quá trình thực hiện nghiên cứu và áp dụng và trong thực tế khóa luận đã đạt được một số kết quả nhất định như xây dựng một cách bài bản và có chiến lược xuyên suốt một dịch vụ Đám mây nội bộ cơ bản; xây dựng thành công hệ thống OpenStack và đưa vào sử dụng trên thực tế, đảm bảo các tiêu chí về mặt kĩ thuật như dễ sử dụng, ổn định, có tính sẵn sàng cao; chuyển đổi thành công từ sử dụng hệ thống Cloud cũ sang hệ thống Cloud mới; cung cấp được dịch vụ cho hầu hết các dịch vụ mới không chỉ dừng lại trong nội bộ công ty Fpt Telecom mà bắt đầu cung cấp dịch vụ cho một số các đơn vị nội bộ khác trong tập đoàn Fpt; xây dựng được một bộ các qui trình liên quan đến các quá trình như quản lý tính sẵn sàng của hệ thống, quản lý năng lực của toàn bộ hệ thống và quản lý các yêu cầu từ người dùng và các đơn vị trong hệ thống; đồng thời bắt đầu áp dụng được các qui trình đó vào trong các hoạt động định kì trên thực tế.

pdf52 trang | Chia sẻ: builinh123 | Ngày: 02/08/2018 | Lượt xem: 273 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu và ứng dụng ITIL cho quản lý dịch vụ đám mây nội bộ trong doanh nghiệp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
c hành trong việc quản lý dịch vụ IT để có thể có một dịch vụ đáng tin cậy, cải tiến liên tục trên một nền tảng có sẵn thì với các dịch vụ Cloud thì lại hoàn toàn khác. Các dịch vụ Cloud đặc biệt là hạ tầng thì liên tục thay đổi dẫn tới các bài toán về mặt kiểm soát và tích hợp. Mặc dù, Cloud Computing cũng chính là một dịch vụ công nghệ thông tin tuy nhiên tại từng pha công việc của ITIL lại có những điểm khác biệt mà bản thân ITIL chưa thể đáp đứng trọn vẹn a. Service Strategy Chiến lược điển hình của bất kì một dịch vụ IT nào cũng là giải quyết các vấn đề trong ngắn hạn và dài hạn với những chặng đích rõ ràng, các phương án được phát triển với tính tập trung cao cả về kiến trúc lẫn hạ tầng. Tuy nhiên, trong các dịch vụ Cloud thì những bản kế hoạch dài 3-5 năm này này lại trở lên lạc lõng vì không thể đáp ứng được tính thay đổi liên tục và luôn đổi mới của dịch vụ. b. Service Design Các dịch vụ IT truyền thống được thiết kế với kiến trúc tập trung, chú trọng và ứng dụng trong khi đó các hệ thống Cloud lại đòi hỏi tính phân tán. Bên cạnh đó, các chỉ tiêu đo lường KPI, SLA truyền thống có thể không còn phù hợp khi áp dụng cho các đơn vị cung cấp dịch vụ vì một đặc trưng của Cloud là khả năng tự phục hồi hơn là dư thừa để đảm bảo tính sẵn sàng. Chưa kể đến việc áp dụng các SLA/KPI truyền thống sẽ tạo ra rất nhiều các ngoại lệ trong một hệ thống cung cấp dịch vụ tự phục vụ như Cloud. c. Service Transition Việc chuyển đổi dịch vụ sang các dịch vụ mới gặp phải các vấn đề liên quan đến thay đổi kiến trúc dịch vụ từ tập trung, sang phân tán cũng như các yêu cầu về thời gian gián đoạn tối thiểu. d. Service Operation Theo mô hình truyền thống, khi sử dụng dịch vụ, các cam kết về dịch vụ (SLAs) phải được giám sát và theo dõi để đảm bảo các cam kết dịch vụ được thực hiện theo đúng như cam kết đã có. Quá trình này bao gồm quản lý sự cố, quản lý sự kiến, quản lý yêu cầu. Khi chuyển đổi lên hệ thống Cloud, các sự kiện, cam kết được kiểm tra và báo cáo trong môi trường và kiến trúc mới như thế nào. Chưa kể việc vận hành hệ thống 25 trong môi trường mới đòi hỏi sự tương tác trực tiếp giữa người với hệ thống cũng như giữa đơn vị cung cấp và khách hàng cuối phải giảm thiểu tối đa. Điểm chung duy nhất giữa các dịch vụ Cloud và hệ thống quản lý dịch vụ ITIL chính là quá trình cải tiến liên tục, luôn luôn tích luỹ bài học kinh nghiệm và kiến thức trong suốt quá trình thiết kế, vận hành hoạt động của dịch vụ, tạo ra các thông tin phản hồi để cải tiến hoặc thay đổi dịch vụ. 2.2. Triển khai OpenStack 2.2.1. Giới thiệu về OpenStack OpenStack là một giải pháp mã nguồn mở tổng thể cho phép xây dựng một nền tảng điện toán đám mây (Cloud computing platform), có thể cung cấp dịch vụ trong nội tại một tổ chức hoặc cung cấp dịch vụ ra bên ngoài. Mục tiêu của dự án là cung cấp một giải pháp có thể đáp ứng cho đa dạng các loại hình hệ thống khác nhau nhưng phải đảm bảo các tiêu chí: dễ dàng thực thi, dễ dàng mở rộng và nhiều tính năng. Giải pháp OpenStack được phân phối theo giấy pháp mã nguồn mở Apache tạo sự linh hoạt trong việc tái đóng gói và cung cấp sản phẩm dịch vụ một cách thương mại hoá mà không bị gò bó trong các qui định khắt khe về giấy phép phần mềm nguồn mở truyền thống. Dự án được bắt đầu vào năm 2010, khi Rackspace và NASA kết hợp với nhau công bố về dự án với mục tiêu cung cấp nền tảng điện toán đám mây sử dụng các phần cứng giá rẻ và phổ biến. Việc phát triển dự án OpenStack được điều hành bởi một quĩ chung là OpenStack Foundation. Hiện nay quĩ OpenStack bên cạnh việc quản lý và đầu tư phát triển các dự án con của OpenStack thì tổ chức này còn có nhiệm vụ là quảng bá hình ảnh, phát triển cộng đồng, phát triển thị trường và các hệ sinh thái sảnh phẩm và kinh tế xung quanh dự án OpenStack. Dự án OpenStack bao gồm rất nhiều dự án con, mỗi dự án con chịu trách nhiệm thực hiện một tính năng riêng của biệt của dự án. Các dự án chính bao gồm: - Nova: quản lý các tài nguyên ảo hóa và tính toán (RAM, CPU). - Neutron: quản lý thiết bị và các tài nguyên về mạng. - Cinder: cung cấp dịch vụ quản lý lưu trữ theo khối (Block storage) - Swift: dịch vụ quản lý lưu trữ theo đối tượng (Object storage). - Horizon: giao diện tương tác với người dùng cuối. - Ceilometer: Thực hiện đo đạc hiệu năng của toàn bộ hệ thống. Khi triển khai xây dựng, chỉ cần tùy biến các thành phần này và ghép với nhau là trở thành một giải pháp Hạ tầng như một dịch vụ (IaaS) hoàn chỉnh một cách nhanh chóng và dễ dàng, không gặp nhiều khó khăn. 26 Bên cạnh đó, với tốc độ phát triển hiện nay, OpenStack cũng đang có một hệ sinh thái các dịch vụ Cloud mới được xây dựng dựa trên các dịch vụ hạ tầng cơ mà bản đang có như PaaS (OpenShift), Manhout (Hadoop-as-Service), Trove (DbaaS), LbaaS hay FwaaS. Các dự án này ngày càng phong phú và đa dạng, tạo tiền đề cho người dùng cuối có thể ứng dụng các dịch vụ đám mây một cách linh hoạt và đa dạng. 2.2.2. Kiến trúc và các thành phần cơ bản của OpenStack OpenStack là một nền tảng quản lý Cloud (Cloud Management Platform), được thiết kế theo dạng Module, trong đó các thành phần con tương tác trực tiếp với nhau, rất dễ dàng mở rộng và tích hợp thêm các dịch vụ khác vào trong hệ thống. Tuy nhiên, hệ thống OpenStack sẽ bao gồm các thành phần cơ bản chính như sau: - Nova: thành phần quan trọng nhất của OpenStack, chịu trách nhiệm tạo, phân phối và quản lý vòng đời máy ảo và các tài nguyên tính toán như năng lực xử lý CPU, bộ nhớ RAM. - Cinder: cung cấp dịch vụ lưu trữ theo khối (Block storage), cho phép tạo, phân phối dung lượng lưu trữ bất kì cho các máy ảo sử dụng như một hoặc nhiều ổ cứng lưu trữ vật lý với dung lượng tuỳ ý. Người dùng cảm thấy có thể sử dụng một lượng lưu trữ “không có giới hạn”. - Swift: cung cấp dịch vụ lưu trữ theo đối tượng (Object storage). Cho phép tải lên, tải xuống và lưu trữ các file (object) trên hệ thống storage riêng biệt. Hệ thống swift phục vụ việc truyền tải, tải lên, tải xuống file dựa trên giao thức phổ biến HTTP. Người dùng cuối sử dịch vụ Swift sẽ giống như đang sử dụng một dịch vụ chia sẻ file phổ biến trên mạng Internet. - Neutron: thành phần quan trọng tương đươngdịch vụ Nova, chịu trách nhiệm quản lý, tạo và điều phối các tài nguyên mạng và cung cấp các dịch vụ về mạng cho các máy ảo sử dụng như địa chỉ IP, quản lý VLAN, QoS, - Horizon: thành phần cung cấp giao diện đồ họa (web) cho người dùng cuối tương tác với hệ thống OpenStack để tạo, quản lý và truy cập máy ảo cũng như các tài nguyên tính toán khác. - Keystone: thành phần cung cấp dịch vụ về định danh và xác thực cho toàn bộ các dịch vụ khác trong hệ thống OpenStack. - Glance: thành phần cung cấp dịch vụ các file ảnh hệ điều hành, phục vụ cho quá trình bật các máy ảo. - Ceilometer: cung cấp dịch vụ lưu trữ và giám sát các thông tin đo lường về hoạt động của các thành phần khác trong hệ thống OpenStack. - Heat: thành phần cung cấp dịch vụ điều phối hoạt động của các máy ảo theo các kịch bản được định nghĩa trước. 27 Hình 5. Kiến trúc Logic của OpenStack 2.2.3. Tại sao lại là OpenStack mà không phải là các giải pháp thương mại khác OpenStack được lựa chọn nghiên cứu sử dụng bởi có rất nhiều tính năng nổi trội hơn các bản thương mại khác đang có trên thị trường. - Là một giải pháp được sử dụng phần lớn bởi 75% các nhà cung cấp dịch vụ đám mây (công cộng lẫn nội bộ). Từ khi ra đời năm 2010 đến nay đã rất nhiều công ty và tổ chức lớn trên thế giới chuyển đổi sang sử dụng nền tảng OpenStack từ các dịch vụ cung cấp nội bộ đến các dịch vụ cung cấp ra bên ngoài. Như Intel, CERN, HP Public Cloud, HP Coverged Cloud, Ebay, Paypal, Rackspace, Yahoo, Wikimedia, Sony, 28 - Là một nền tảng công nghệ mã nguồn mở đang được phát triển rất tích cực.. Dự án được phát triển liên tục và ra phiên bản mới trong chu kì 6 tháng. Phiên bản mới nhất được release vào tháng 10/2014 có tên gọi là Juno. - Dễ dàng thay đổi và tùy biến cho các nhu cầu cụ thể. Nền tảng công nghệ chính mà dự án sử dụng là các nền tảng mã nguồn mở phổ biến bao gồm: Linux, Python, MySQL và RabbitMQ. Các thành phần này đều rất dễ học và dễ phát triển tùy biến theo các nhu cầu khác nhau. Chính vì vậy, trong quá trình xây dựng và triển khai thì việc áp dụng và tùy biến công nghệ sẵn có là điều dễ dàng. - Có một cộng đồng người dùng và các nhà phát triển lớn nhất trên thế giới nếu so sánh với các giải pháp IaaS khác cả mã nguồn đóng và mã nguồn mở. Tính đến tháng 6/2013, dự án OpenStack đã có gần 10,000 thành viên trên gần 100 nước tham gia đóng góp, được hỗ trợ bởi 200 công ty trên toàn thế giới. Đặc biệt, dự án được rất nhiều các công ty lớn quan tâm và hỗ trợ như Redhat, Intel, Canonical Ubuntu, SUSE, Intel, NASA. - Có khả năng tương thích tốt với đa dạng các nền tảng phần cứng và thiết bị mạng của các hãng khác nhau. Hiện nay OpenStack đang hỗ trợ hai nền tảng ảo hóa phổ biến hiện nay là Redhat KVM và VMWare. Bên cạnh đó là khả năng làm việc theo các giao thức chuẩn tắc được hỗ trợ phổ biến trên hầu hết các dòng thiết bị mạng phổ thông cũng như cao cấp. 2.2..4. Các dịch vụ cơ bản của OpenStack cung cấp cho người dùng Như đã nói ở trên, OpenStack là một nền tảng quản lý đám mây, những dịch vụ chính mà OpenStack cung cấp tới người dùng cuối bao gồm - Tạo và quản lý các máy ảo theo các mẫu cấu hình cho trước. Người dùng có thể lựa chọn cấu hình phần cứng máy ảo (CPU, RAM, dung lượng lưu trữ) theo các cấu hình mà đơn vị cung cấp xây dựng sẵn. Ví dụ như các mẫu cấu hình 1VCPU, 1GB RAM (m1.tiny) hay 1VCPU, 2GB RAM (m1.small), - Tạo và quản lý các mạng riêng ảo (VPC) và các tài nguyên mạng khác như địa chỉ IP nội bộ và địa chỉ IP Internet. Người dùng cuối có thể xây dựng lại một mô hình mạng giống như mô hình mạng vật lý đang hoạt động với nhiều lớp mạng khác nhau, với các dải mạng có địa chỉ ra Internet, - OpenStack cung cấp hai giao diện tương tác chính cho người dùng là giao diện thông qua dashboard (giao diện web) và giao diện tương tác thông qua HTTP API. 29 Hình 6. Giao diện tương tác đồ họa của OpenStack - Ngoài ra, do tính module hóa của OpenStack rất cao mà người dùng cuối có thể sử dụng thêm rất nhiều các dịch vụ khác nhau như DbaaS, FwaaS, LbaaS, mà đơn vị cung cấp tích hợp các thành phần khác của Open Stack vào dịch vụ đang chạy. 30 Chương 3. Áp dụng vào bài toán Triển khai Private Cloud tại công ty Fpt Telecom Rất may mắn là trong quá trình thực hiện khóa luận này, tôi có cơ hội được áp dụng các kiến thức trên vào giải quyết một bài toán thực tế tại nơi làm việc đó là xây dựng các qui trình quản lý một hệ thống private cloud dựa trên ITIL cho công ty Fpt Telecom. Dự án đang được thực hiện từ đầu năm 2014 đến nay và dự kiến sẽ kéo dài đến hết năm 2015, trong đó mục tiêu lớn nhất là chuyển đổi toàn bộ hạ tầng Công nghệ thông tin của công ty từ mô hình tính toán vật lý truyền thống sang mô hình cung cấp dịch vụ IaaS. 3.1. Mô tả bài toán 3.1.1. Giới thiệu về dự án Triển khai Private Cloud tại Fpt Telecom Công ty cổ phần Viễn thông Fpt (Fpt Telecom) là một trong 3 công ty cung cấp dịch vụ Internet (ISP) lớn nhất Việt Nam. Hệ thống nội bộ cung cấp dịch vụ và quản lý bên trong Fpt Telecom rất phức tạp và trải dài từ Hà Nội vào Thành phố Hồ Chí Minh. Số lượng các máy chủ đang hoạt động cho các hệ thống này lên tới hàng nghìn máy và tiếp tục gia tăng liên tục theo suốt sự phát triển dịch vụ của công ty. Sự tăng trưởng liên tục gây ra một áp lực vô cùng lớn đến hạ tầng công nghệ của công ty đặc biệt là trong việc quản lý tài nguyên tính toán khi mà nhu cầu tính toán tăng nhanh hơn việc đầu tư bổ sung tài nguyên. Bên cạnh đó là các khó khăn trong việc quản lý một số lượng máy tính vật lý và thiết bị lưu trữ lớn đến hàng nghìn máy trong điều kiện chi phí đầu tư và vận hành luôn được chủ trương tiết kiệm một cách tối đa. Từ năm 2010, để tiết kiệm chi phí đầu tư mua phần cứng và tăng năng suất phát triển của toàn hệ thống, trung tâm Nghiên cứu phát triển (RAD), Công ty Fpt Telecom đã quyết định xây dựng và triển khai một hệ thống Private cloud dựa trên nền tảng công nghệ OpenNebula nhằm giải quyết những bài toán đặt ra trong việc quản lý tài nguyên tính toán. Trong vòng 3 năm hoạt động (2010-2013) hệ thống đã đáp ứng được phần nào đó nhu cầu về cấp phát tài nguyên tính toán trong nội bộ của trung tâm và các đơn vị kĩ thuật khác. Một vài con số về qui mô hệ thống Cloud chạy Private cloud (còn gọi là Cloud “cũ”): - Bao gồm 12 máy chủ vật lý, 3 máy chủ Firewall và 1 Gateway. - Hiện tại đang có 126 máy chủ ảo (VMs) trong đó có 71 máy chủ đang hoạt động cho các dịch vụ chính của công ty. - Hỗ trợ 2 nền tảng ảo hóa chính là KVM và VMWare. 31 - Số lượng dịch vụ đang hoạt động trên nền tảng này chiếm hơn 50% tổng số dịch vụ của toàn bộ trung tâm RAD. Tuy nhiên, hệ thống này gặp phải rất nhiều hạn chế được chia thành 2 nhóm chính là hạn chế về mặt kĩ thuật và hạn chế về mặt quản lý. a. Các hạn chế về mặt kĩ thuật - Hệ thống do không được đo đạc và giám sát kịp chặt chẽ nên không được mở rộng kịp thời. Hệ thống đã bắt đầu có dấu hiệu quá tải. - Hệ thống chưa được tích hợp sâu vào hạ tầng mạng sẵn có của Fpt Telecom nhằm tận dụng các tính năng có sẵn hạ tầng mạng của một công ty viễn thông. Nguyên nhân là do hạn chế của bản thân giải pháp OpenNebula đang sử dụng - Việc vận hành hệ thống chưa được tự động hóa, các quá trình vận hành hàng ngày vẫn phải thực hiện thủ công. - Hệ thống chưa khai thác được các công nghệ về mặt ảo hóa mà các giải pháp ảo hóa KVM hay VMWare đem lại. b. Các hạn chế về qui trình quản lý Hệ thống Cloud “cũ” không có các qui trình tiêu chuẩn về mặt giám sát và vận hành hệ thống dẫn tới rất nhiều khó khăn trong việc quản lý và vận hành hệ thống. - Thiếu các qui trình liên quan đến hướng dẫn vận hành, quản lý, giám sát hệ thống và xử lý sự cố. Việc vận hành hệ thống được thực hiện dựa trên kinh nghiệm của người giám sát. Chính vì vậy mỗi khi có nhân sự vào ra khỏi hệ thống là việc cung cấp dịch vụ trở nên rất khó khăn. - Thiếu các qui trình liên quan đến đảm bảo an toàn, an ninh thông tin hệ thống. Một số các sự cố liên quan đến bảo mật đã xảy ra trong quá trình vận hành hệ thống. - Thiếu các qui trình liên quan đến quản lý thay đổi. Việc thay đổi không được phê duyệt và ghi nhận, dẫn tới rất khó theo dõi và kiểm soát các thay đổi trong suốt quá trình vận hành của hệ thống tạo nên rất nhiều điểm “đen” trên hệ thống rất khó quản lý đặc biệt là khi có sự cố xảy ra. Rất nhiều trường hợp sự cố xảy ra do việc thay đổi cấu hình hệ thống mà không được báo trước - Không có các dự báo hoặc lập kế hoạch chuẩn bị mở rộng tài nguyên. Chính vì điều này dẫn tới việc đầu tư và mở rộng hệ thống không đồng nhất, sau một thời gian vận hành hệ thống trở nên chắp vá. - Các công cụ quản lý tài nguyên còn nghèo nàn. - Không có mô hình quản lý dịch vụ. Các nhóm vận hành cũng không có tư duy về cung cấp dịch vụ. Chính vì vậy dẫn tới dịch vụ được cung cấp rất tùy tiện, không có cam kết về chất lượng dịch vụ hay xử lý yêu cầu, sự cố. 32 Chính vì vậy đầu năm 2014, công ty Fpt Telecom đã quyết định triển khai dự án xây dựng hệ thống Private cloud mới dựa trên nền tảng công nghệ OpenStack đồng thời áp dụng ITIL vào quản lý hệ thống Private cloud nhằm giải quyết các bài toán vừa được nêu ra. Chuyển đổi từ mô hình phục vụ đơn thuần sang mô hình cung cấp theo dịch vụ có cam kết chất lượng. 3.1.2. Giải quyết bài toán Sau khi nghiên cứu kĩ các giải pháp kĩ thuật đang có trong tay và các phương pháp luận cần thiết từ ITIL nhóm dự án đã quyết định thực hiện các bước sau đây. - Bước 1: Trước khi bắt đầu vào dự án triển khai nền tảng Cloud “mới” nhóm thực hiện dự án đã quyết định viết lại yêu cầu của bài toán một cách cụ thể dựa trên thêm các yêu cầu của các đơn vị kinh doanh và sử dụng hệ thống bên cạnh việc xem xét lại các vấn đề đang tồn tại. - Bước 2: Lập chiến lược cho dịch vụ, xây dựng lộ trình tổng thể cho toàn bộ dự án. Xác định các qui trình tổng thể và các bước áp dụng chi tiết. - Bước 3: Thiết kế dịch vụ chi tiết. Xây dựng kiến trúc kĩ thuật tổng thể cho toàn bộ hệ thống. - Bước 4: Tiến hành xây dựng và thử nghiệm các giải pháp kĩ thuật đang có sẵn (bao gồm cả thương mại và mã nguồn mở). - Bước 5: Tiến hành chuyển đổi hệ thống từ hệ thống cũ sang hệ thống mới áp dụng các best practices trong việc chuyển đổi dịch vụ. - Bước 6: Đưa hệ thống vào vận hành nội bộ. Hoàn thiện các bộ qui trình liên quan đến vận hành kĩ thuật dựa trên best practices trong Vận hành dịch vụ. - Bước 7: Cải tiến và mở rộng liên tục hệ thống để đáp ứng các nhu cầu mới của dịch vụ. Do tính phức tạp của việc xây dựng và chuyển đổi sang hệ thống Cloud mới và độ lớn của bộ công cụ ITIL nên một số các qui trình cần thiết được tiến hành xây dựng trước để đảm bảo cho độ tiến độ công việc. Các qui trình được xây dựng trước bao gồm: thiết kế chiến lược dịch vụ, thiết kế dịch vụ, quản lý tính sẵn sàng, quản lý năng lực hệ thống (thiết kế dịch vụ) và quản lý đáp ứng yêu cầu của khách hàng (vận hành dịch vụ). 3.1.2.1. Xây dựng đề bài cụ thể về dịch vụ Cloud mới Đội dự án đã làm việc với rất nhiều bên trong đó có ghi nhận lại mong muốn và phản hồi từ những đơn vị đang sử dụng dịch vụ là nội bộ của trung tâm RAD và các đơn vị kĩ thuật thành viên, các đơn vị kinh doanh trực tiếp về tầm nhìn phát triển dịch vụ và làm việc với Ban Giám đốc của công ty để biết được những kì vọng của Ban Giám đốc về dự án cũng như qui mô về mặt đầu tư tài chính cho dự án. Ngoài ra, nhóm 33 dự án cũng đã liên lạc với các chuyên gia và các công ty về dịch vụ xây dựng Cloud để học hỏi thêm kinh nghiệm và các thông tin khác. Sau khi thực hiện xong, nhóm đã xây dựng được một đề bài cụ thể để thực hiện dự án như sau: - Chuyển đổi hạ tầng IaaS sẵn có sang nền tảng công nghệ mới, phù hợp, linh hoạt và có độ tin cậy cao. - Hoàn thiện các qui trình về vận hành, lập kế hoạch phát triển tài nguyên, xử lý sự cố, kiểm soát thay đổi cho các hệ thống mới. - Xây dựng được đội ngũ kĩ sư làm chủ được công nghệ để có thể vận hành và phát triển hệ thống Cloud, cung cấp các dịch vụ mới cho không chỉ cho nội bộ công ty Fpt Telecom mà cả tập đoàn Fpt cũng như ra khách hàng công cộng. - Xây dựng được nền tảng về kĩ thuật, qui trình và quản lý để có thể cung cấp dịch vụ một cách chuyên nghiệp tin cậy và có khả năng mở rộng theo yêu cầu. - Chuyển đổi những dịch vụ quan trọng và phù hợp lên Cloud. 3.1.2.2. Lập chiến lược cho dịch vụ. Xây dựng lộ trình phát triển Sau khi xác định được đề bài cụ thể cho dự án mới, nhóm dự án bắt tay vào lập chiến lược và tầm nhìn cho dịch vụ cũng như xây dựng lộ trình phát triển dự án. Trong phần chiến lược và tầm nhìn cho dịch vụ, theo ITIL, thì cần phải thực hiện theo 8 bước bao gồm - Bước 1: Định nghĩa thị trường và khách hàng. Tại đây, nhóm dự án đã xác định được khách hàng đầu tiên cần phục vụ trước mắt các đơn vị kĩ thuật và dự án nội bộ. Sau đó là các đơn vị kĩ thuật của tập đoàn Fpt có nhu cầu sử dụng Cloud và cuối cùng là nhóm khách hàng doanh nghiệp bên ngoài đang sử dụng các dịch vụ hosting có sẵn của Fpt Telecom. - Bước 2: Hiểu rõ khách hàng. Đặc tính của các khách hàng mà dịch vụ sẽ phải cung cấp đều có những yêu cầu rất cao về hiệu năng hoạt động, sự ổn định của hệ thống và các cam kết hỗ trợ xử lý yêu cầu kịp thời. - Bước 3: Định giá kết quả. Theo Gartner thì tốc độ thị trường phát triển IaaS đang còn rất tiềm năng và có tốc độ tăng rất cao trong thời gian tới. - Bước 4: Phân loại dịch vụ. Do đặc tính khách hàng nên nhóm dự án sẽ chỉ tập trung vào hai loại hình dịch vụ chính là dịch vụ bình thường với chất lượng vừa phải và dịch vụ đảm bảo với chất lượng cam kết. - Bước 5: Hiểu rõ cơ hội của Fpt Telecom trên thị trường IaaS - Bước 6: Định nghĩa các dịch vụ dựa trên kết quả dự kiến - Bước 7: Định nghĩa mô hình dịch vụ. Dự kiến dịch vụ được cung cấp theo mô hình tự phục vụ theo nhu cầu (on demand self-service) của người dùng. 34 - Bước 8: Định nghĩa các gói của dịch vụ. Dịch vụ sẽ cung cấp các gói dịch vụ cơ bản sau như gói dịch vụ về tính toán và dịch vụ về lưu trữ. Đây là những dịch vụ cần thiết và đang có nhu cầu rất lớn cả trong và ngoài nước. Trước mắt ở qui mô công ty, nhóm dự án đã định nghĩa được hai gói dịch vụ chính sau a. Single VM - Các máy ảo đơn lẻ được tạo và quản lý theo trung tâm và đơn vị khác nhau. - Mỗi trung tâm/đơn vị được tạo thành một dự án trên hệ thống. Các tài nguyên như máy ảo, block storage và Public IP được cấp theo quota của từng trung tâm và đơn vị. - Mỗi một tenant được cấp phát một VPN server riêng. Các trung tâm và nhóm đơn vị gửi lại thông tin về các tài khoản VPN vào hệ thống. - Mỗi máy ảo được khởi tạo ra phải đi kèm với một key-pair của một cá nhân xác định. - Việc tạo và quản lý máy ảo được đảm trách bởi đội vận hành Cloud chung. b. Projects - Các dự án nếu đủ qui mô về số lượng máy ảo (trên 5 VMs) và có khả năng tự quản lý tài nguyên (máy ảo, storage, public IP) thì có thể đề xuất tạo dự án riêng để quản lý tập trung và tách biệt so với các hệ thống còn lại. - Các tài nguyên máy ảo, block storage và public IP được cấp theo quota cho từng dự án. - Mỗi dự án được cấp từ 1-2 account truy cập vào hệ thống VPN chính và sử dụng OpenStack dashboard. Sau đó, nhóm dự án đã phác thảo được lộ trình cho dự án trong khoảng 3 năm dự kiến như sau a. Nâng cấp hạ tầng Cloud sẵn có Thời gian dự kiến: 1/2014 Mục tiêu thực hiện - Nâng cấp thành công hạ tầng cloud sẵn có từ OpenNebula sang OpenStack, dựa trên hạ tầng phần cứng và thiết bị mạng sẵn có. - Cung cấp được các dịch vụ cơ bản về Tính toán, Lưu trữ và Mạng - Hệ thống mới cần được đáp ứng 50% nhu cầu nội bộ của trung tâm RAD - Xây dựng được đội ngũ kĩ thuật từ 5-7 người, có kĩ năng cơ bản về xây dựng và vận hành hệ thống Cloud. - Xây dựng được các kế hoạch và kịch bản đầu tư phát triển và mở rộng hệ thống trong tương lai theo yêu cầu. - Đào tạo và cho người dùng làm quen với cách sử dụng dịch vụ. 35 b. Cung cấp dịch vụ trong nội bộ Fpt và Fpt Telecom Thời gian dự kiến: Giữa năm 2014 Mục tiêu thực hiện - Xây dựng chiến lược cung cấp dịch vụ Hạ tầng như một dịch vụ (IaaS). - Mở rộng được hệ thống Fpt Cloud đáp ứng được 70% nhu cầu của Fpt Telecom, hướng tới cung cấp dịch vụ cho toàn bộ Fpt. - Xây dựng, và áp dụng được qui trình liên quan đến quản lý dịch vụ và vận hành hệ thống, bao gồm chăm sóc khách hàng và hỗ trợ kĩ thuật. - Xây dựng được các kế hoạch phát triển và mở rộng hệ thống khi cần thiết. Kế hoạch bao gồm lựa chọn phần cứng, tự động hóa quá trình mở rộng, có các thống phát triển và kiểm thử riêng rẽ. - Xây dựng được đội ngũ kĩ thuật khoảng 10 người, có am hiểu sâu về nền tảng OpenStack. c. Trở thành nhà cung cấp cấp dịch vụ Cloud Thời gian dự kiến: bắt đầu từ giữa năm 2015. Mục tiêu thực hiện: - Trở thành nhà cung cấp dịch vụ Cloud công cộng với một số các dịch vụ cơ bản liên quan đến tính toán (Compute Engine), lưu trữ (Storage) đáp ứng được các nhu cầu khác nhau từ cá nhân cho đến tổ chức. - Hoàn thiện các thành phần hỗ trợ như quản lý khách hàng, hệ thống Billing. - Xây dựng được đội ngũ vận hành và phát triển khoảng 15 người, làm chủ được công nghệ và sẵn sàng phát triển được các dịch vụ cao cấp dựa trên nền tảng hạ tẫng có sẵn. - Hoàn chỉnh và chuyên nghiệp hóa quá trình quản lý dịch vụ, chăm sóc khách hàng và hỗ trợ kĩ thuật. - Tích hợp được hệ thống quản lý dịch vụ với các hệ thống khác trong tổ chức như Billing, quan hệ khách hàng, ... Đồng thời, nhóm dự án cũng xây dựng được tổ chức con người thực hiện dự án sẽ hoạt động như sau 36 Hình 7. Tổ chức đội dự án Trong đó đội dự án bao gồm các kĩ sư về qui trình, hệ thống và phát triển phần mềm, quản lý và giám đốc dự án. Các đơn vị liên quan bao gồm các đơn vị kĩ thuật nội bộ của Fpt Telecom và Ban giám đốc, những người chịu trách nhiệm đầu tư cho dự án. 3.1.2.3. Thiết kế dịch vụ chi tiết. Xây dựng kiến trúc kĩ thuật tổng thể cho toàn bộ hệ thống. Sau khi thu nhận được các thông tin đầu vào, nhóm dự án đã bắt tay và thực hiện thiết kế dịch vụ ở mức chi tiết đồng thời tiến hành xây dựng các qui trình quản lý đầu tiên liên quan đến quản lý năng lực (capacity management) và (availablity management). a. Thiết kế dịch vụ Dịch vụ trước mắt được cung cấp sẽ chú trọng vào - Cung cấp dịch vụ tạo, cấp phát và quản lý máy ảo theo qui trình được định nghĩa sẵn. - Cung cấp dịch vụ tạo, cấp phát và quản lý các tài nguyên mạng như VLAN, địa chỉ IP và kết nối Internet - Cung cấp dịch vụ hỗ trợ và xử lý yêu cầu cho người dùng cuối. b. Xây dựng kiến trúc tổng thể cho toàn bộ hệ thống Hệ thống cloud mới được tách thành ba phần riêng biệt bao gồm: - Hạ tầng Công nghệ (OpenStack IaaS): các dịch vụ công nghệ chính sẽ được sử dụng ngay tại thời điểm ban đầu bao gồm Nova (Compute Engine), Cinder 37 (Block Storage), Swift (Object Storage), KeyStone (Authentication & Authorization) và Ceilometer (Metrics). - Cung cấp dịch vụ (Service Delivery): bao gồm Thiết kê và lên yêu cầu chức năng cho các dịch vụ Cloud mới (Service Design), SLA (cam kết đảm bảo dịch vụ), Hệ thống Billing, Giao diện quản lý (Management Console), Giao diện quản lý qua API (Management API) và quản lý khách hàng (CRM). - Quản lý và vận hành dịch vụ (Service Management): Bao gồm tự động hóa quá trình vận hành và khai thác dịch vụ, Giám sát, Lập kế hoạch mở rộng và các qui trình vận hành khác có liên quan. Hình 8. Kiến trúc tổng quan về hệ thống Cloud mới c. Xây dựng kiến trúc kĩ thuật tổng thể cho hệ thống Cloud mới Trong kiến trúc kĩ thuật tổng quan này, chúng ta có thể thấy các nền tảng và công nghệ khác nhau mà hệ thống sử dụng - Network: Hệ thống Fpt Cloud sẽ sử dụng hai hạ tầng mạng riêng biệt là Management Network nhằm phục vụ cho các kết nối quản lý và giám sát máy chủ và Physical Network là hệ thống mạng vật lý chạy nội bộ cho toàn bộ hệ thống Cloud. Việc quản lý hạ tầng mạng vật lý và điều phối tài nguyên mạng sẽ được thành phần Neutron của OpenStack quản lý. Hệ thống mạng vật lý sẽ được tính toán để vừa đủ đảm bảo tối đa hiệu năng hoạt động, tính độc lập cũng như độ mềm dẻo để đáp ứng các nhu cầu đa dạng trong nội bộ của công ty. Một trong những mục tiêu trong việc thiết kế là hướng tới là xây dựng một hệ thống SDN (Software Defined Networking) cho hệ thống mạng của Fpt Cloud. - Dịch vụ Storage: hướng tới xây dựng được hệ thống SDS (Software Defined Storage) trong đó tối ưu được cả về tài nguyên phần cứng cao cấp (SAN) cũng như các tài nguyên phần cứng phổ biến (SATA disk) để có thể cung cấp một cách đa dạng các độ tin cậy, tốc độ, dung lượng cho các nhu cầu lưu trữ khác 38 nhau. Hai dịch vụ sẽ được cung cấp chính là Object Storage (dựa trên nền Swift) và Block Storage (dựa trên nền Cinder). - Dịch vụ Tính toán: Hai nền tảng ảo hóa phổ biến được hỗ trợ sử dụng là KVM và VMWare trong đó KVM được lựa chọn do tính tương thích, hiệu năng hoạt động với OpenStack còn VMWare được lựa chọn vì tính phổ biến và độ ổn định của nền tảng. - Các thành tố khác cần quan tâm bao gồm là các giao diện quản lý (Horizon), điều phối tài nguyên (Heat) và công cụ đo cho nền tảng Cloud (Ceilometer). Hình 9. Kiến trúc kĩ thuật tổng quan về hệ thống d. Xây dựng qui trình về quản lý tính sẵn sàng (availablity management) Mục tiêu lớn nhất của các qui trình quản lý tính sẵn sàng là để đảm bảo tính sẵn sàng ở các cấp độ khác nhau cho dịch vụ phù hợp với các cam kết đã có với chi phí và thời gian hợp lý. Dựa trên ITIL nhóm dự án đã định nghĩa các công việc cần phải thực hiện để quản lý tính sẵn sàng bao gồm - Xây dựng và liên tục duy trì một bản kế hoạch sẵn sàng, trong đó mô tả các yêu cầu về tính sẵn sàng của dịch vụ ở mức độ cung cấp cho người dùng cuối, cũng như từ góc nhìn của đội xây dựng dự án. Trong bản kế hoạch này đã mô tả sẵn sàng các các yêu cầu về thời gian gián đoạn dịch vụ, thời gian phục hồi cũng như các hành động cụ thể khi xảy ra gián đoạn nhằm đảm bảo tính sẵn sàng của toàn bộ dịch vụ cũng như hiệu năng hoạt động của toàn bộ hệ thống. - Xây dựng được bộ các tiêu chí về thông tin cần được giám sát và theo dõi trên hệ thống. Định nghĩa các thông tin vượt ngưỡng được cảnh báo, các cơ chế phục hồi tự động và các cơ chế phục hồi bằng tay. - Xây dựng được qui trình xử lý thông tin khi có sự cố về gián đoạn dịch vụ xảy ra. Các phương án chuyển tiếp thông tin cho các đơn vị xử lý phù hợp đã được định nghĩa. 39 - Thực hiện các qui trình báo cáo định kì về tính sẵn sàng của hệ thống theo từng ngày, từng tuần, từng tháng, từng quí. Trong đó định nghĩa sẵn sàng các thông tin cần tổng hợp và báo cáo, các đơn vị và người nhận báo cáo. - Xây dựng các kế hoạch kiểm thử tính sẵn sàng theo định kì 3 tháng một lần trong đó tại mỗi lần kiểm thử sẽ kiểm thử một thành phần xác định trên hệ thống như network, tính toán, hệ thống quản lý hay cơ sở dữ liệu, Ghi nhận các các phương án khắc phục phòng ngừa. - Xây dựng qui trình đánh giá và biểu mẫu đánh giá định kì hàng quí về rủi ro sự cố, các phương án kĩ thuật thực hiện đối với từng thành phần mới đưa vào hệ thống. Các thành phần mới để có thể được đưa vào hệ thống cần đáp ứng được đầy đủ các yếu tố đã được định nghĩa sẵn trong bản kế hoạch sẵn sàng. Hình 10. Các qui trình về quản lý tính sẵn sàng. 40 e. Xây dựng về qui trình quản lý năng lực hệ thống (capacity management) Quản lý năng lực hệ thống là một trong những yếu tố mà bản thân Cloud cũ không có và gặp phải các vấn đề rất nghiêm trọng liên quan đến đầu tư và qui hoạch tài nguyên. Chính vì vậy đây là một trong những thành phần mà nhóm dự án quan tâm và thực hiện ngay từ đầu do dự kiến tốc độ phát triển của hệ thống đám mây nội bộ là rất nhanh và tài nguyên phải luôn được sẵn sàng để đáp ứng cho nhu cầu của người dùng. Các qui trình đã được xây dựng bao gồm - Qui trình về quản lý, tổng hợp và dự báo phát triển tài nguyên. Nguồn thông tin được lấy ra từ các nguồn sau: thông tin về việc phát triển các hệ thống ứng dụng trong nội bộ, thông tin về tốc độ tăng trường số lượng máy ảo, tốc độ tăng trưởng của storage, về băng thông và IP trên toàn hệ thống cũng như tốc độ hỏng và thay thế phần cứng trong một đơn vị thời gian. Các thông tin về biến động dự kiến khác. Đầu ra dự kiến là các báo cáo hàng tháng được gửi đến quản lý dự án. - Qui trình xây dựng và thiết kế cấu hình phần cứng cho các thành phần của hệ thống OpenStack. Đối với từng thành phần của OpenStack đều có những yêu cầu về phần cứng đặc thù khác nhau. Tuy nhiên, do dự án phát triển đang rất nhanh nên những thông số đó chỉ dừng lại ở mức tham khảo, đòi hỏi nhóm dự án phải thực hiện kiểm thử rất kĩ lưỡng trên thực tế rất kĩ lưỡng để có thể đưa ra một bộ tham số cấu hình phần cứng cụ thể. Điều này cần một qui trình cực kì kĩ lưỡng từ kiểm thử thông số, tính toán kĩ thuật trước khi đưa một thành phần phần cứng mới vào hệ thống. - Qui trình lập kế hoạch về đầu tư mua sắm phần cứng mới dựa trên các báo cáo về dự đoán phát triển tài nguyên, tính toán cấu hình tham số. Báo cáo về đầu tư mua sắm được thực hiện định kì 3 tháng một lần nhằm bổ sung kịp thời tài nguyên phần cứng cho nhu cầu phát triển của dự án. 41 Hình 11. Các qui trình về quản lý năng lực hệ thống. 3.1.2.4. Xây dựng và kiểm thử các giải pháp kĩ thuật có sẵn Mặc dù OpenStack là một giải pháp mã nguồn mở tuy nhiên, trên thế giới hiện nay có rất nhiều các bản đóng gói thương mại của OpenStack từ các hãng thứ ba. Các bản phân phối này được các hãng xây dựng nhằm giải quyết một hoặc nhiều vấn đề mà bản thân dự án OpenStack không giải quyết được hoặc chưa giải quyết trọn vẹn như khả năng tính dễ cài đặt và sử dụng, tính sẵn sàng cao, giải pháp backup và phục hồi. Tuy nhiên một nhược điểm rất lớn của các bản đóng gói này là tính đóng rất lớn, các thành phần bên trong bị khóa cứng rất khó mở rộng khi cần hoặc bổ sung thêm các thành phần bên ngoài. Hầu hết các bản thương mại sử dụng phiên bản OpenStack chậm hơn phiên bản hiện tại từ 6-12 tháng. Ngoài ra là các bản đóng gói bị khóa cứng với các phần cứng từ các hãng khác. Chính vì vậy rất khó về sau khi cần đầu tư mua sắm phần cứng lớn hoặc cần nhiều tùy biến trong cấu hình phần cứng. Khi thực hiện, nhóm dự án đã tiến hành thử nghiệm các giải pháp sau: IBM SmartCloud, HP Helion, Ubuntu OpenStack, Redhat OpenStack và Cisco OpenStack. Sau khi thử nghiệm và đánh giá, nhóm dự án đã quyết định sử dụng bản đóng gói từ Redhat OpenStack (RDO) vì thỏa mãn các tiêu chí như tính dễ dùng, khả năng mở rộng, độ ổn định, khả năng cập nhật và dễ dàng tích hợp với các thành phần khác. Ngoài ra, có hai thành phần khác phải được đánh giá cực kì kĩ lưỡng đó là giải pháp về lưu trữ và giải pháp về các thiết bị mạng phục vụ cho hệ thống OpenStack. Sau khi đánh giá, nhóm dự án cũng đã quyết định sử giúp giải pháp Redhat Ceph cho hệ thống lưu trữ thay vì sử dụng mô hình SAN storage truyền thống vì hai yếu tố giá cả và khả năng dễ mở rộng. Còn về các thiết bị mạng thì nhóm đã quyết định sử dụng toàn bộ các switch dòng thấp của hãng Cisco kết hợp với việc gộp nhiều card 1Gbps trên máy 42 chủ để tạo ra băng thông mạng lớn trên máy chủ. Các máy chủ có thể đáp ứng dung lượng vào ra từ khoảng 6-8Gbps trên từng server. Đây là một giải pháp linh hoạt, rẻ tiền và phù hợp với mô hình triển khai OpenStack trên thế giới. 3.1.2.5. Chuyển đổi hệ thống từ Cloud cũ sang hệ thống mới. Sau khi lựa chọn xong được toàn bộ giải pháp kĩ thuật chính từ phần mềm cho đến phần cứng và dựng được một hệ thống có khả năng đáp ứng được khoảng 300 máy chủ ảo, với hệ thống lưu trữ có tổng dung lượng 6TB và và đường nối Internet ổn định, nhóm dự án tiến hành chuyển đổi các máy chủ ảo từ hệ thống Cloud cũ sang hệ thống mới. Do hệ thống cloud cũ hoạt động trong thời gian dài, không có qui hoạch nên các hệ thống với các chức năng khác nhau như đang chạy dịch vụ thật hoặc đang dùng để phát triển phần mềm được đặt chung một chỗ và không có nhiều thông tin ghi nhận. Chính vì vậy quá trình chuyển đổi được thực hiện thành 4 bước sau - Bước 1: Tiến hành ghi nhận lại toàn bộ thông tin về việc sử dụng như người quản lý, chức năng của máy chủ, thời gian cho phép gián đoạn của từng máy chủ một. Đánh giá độ ưu tiên theo hai mức Cao, Trung bình và Thấp. - Bước 2 Chuyển đổi một phần nhỏ các máy ảo có độ ưu tiên Thấp trong hệ thống Cloud cũ sang hệ thống mới. Số lượng dự kiến: 20 máy ảo Mục đích: chuyển đổi nhằm xác nhận về mặt kĩ thuật các phương án chuyển đổi đồng thời thử nghiệm tải hệ thống Cloud OpenStack mới. - Bước 3: Chuyển đổi các máy ảo có độ ưu tiên Trung bình sang hệ thống OpenStack sau khi hệ thống được nâng cấp phần cứng. Số lượng dự kiến: 20-40 máy ảo - Bước 4: Chuyển đổi nốt các máy ảo còn lại trong hệ thống Cloud cũ sang hệ thống Cloud mới. Tách các máy ảo theo từng nhóm dự án tương ứng. Hoàn tất việc chuyển đổi. Quá trình chuyển đổi được thực hiện từ tháng 9/2014 và kết thúc vào trung tuần tháng 12/2014. 3.1.2.6. Đưa hệ thống vào vận hành nội bộ. Hoàn thiện các bộ qui trình vận hành Sau khi kết thúc việc chuyển đổi thì hệ thống mới cũng đã chứng minh được một phần độ ổn định hoạt động của mình. Đội dự án tiếp tục bắt tay vào hoàn thiện các thành phần hỗ trợ liên quan đến hệ thống chính như các hệ thống giám sát và cảnh báo sự cố, các hệ thống quản lý thông tin xung quanh. Tại bước này, các vấn đề kĩ thuật không còn là vấn đề chính nữa mà các vấn đề cần tập trung giải quyết tại bước này chính lại là các vấn đề liên quan đến hướng dẫn sử dụng dịch vụ và hoàn thiện các qui 43 trình vận hành như quản lý sự kiện, quản lý sự cố, quản lý vấn đề, quản lý cấu hình hay quản lý thay đổi, Một trong những mảng công việc rất lớn cần giải quyết trong giai đoạn này đó chính là hướng dẫn sử dụng cho người dùng mới tập làm quen với mô hình cung cấp dịch vụ Hạ tầng như một dịch vụ thay vì cách làm việc truyền thống. Công việc này không chỉ đơn giản là hướng dẫn sử dụng, làm quen với giao diện và cách thức tương tác mới mà quan trọng hơn là tập cho người dùng cuối những tư duy và suy nghĩ thiết kế, phát triển hệ thống theo mô hình điện toán đám mây: đó là đề cao sự phân tán, đề cao khả năng chịu đựng lỗi, hoạt động liên tục, dễ dàng thay đổi thay vì những tư duy vốn đã ăn sâu vào nếp nghĩ từ trước tới nay đó là mô hình kiến trúc tập trung và chú trọng đến dư thừa để đảm bảo hiệu năng hoạt động. Bên cạnh đó, một vấn đề cũng cần phải khắc phục đó là thói quen yêu cầu tài nguyên vượt quá nhu cầu thực sự vốn tồn tại rất lâu trong tổ chức. Do khả năng tự phục vụ sử dụng theo nhu cầu, rất nhiều người dùng luôn tạo ra các yêu cầu tài nguyên lớn không hợp lý. Người dùng cần được huấn luyện để có thói quen sử dụng hợp lý và vừa đủ các nguồn tài nguyên trên cloud. Chính vì vậy, trong giai đoạn này, qui trình duy nhất được xây dựng và áp dụng ngay trong thực tế đó là qui trình đáp ứng yêu cầu của người dùng (Request fulfilment) như yêu cầu kiểm tra máy ảo, tạo mới hay copy máy ảo, reset mật khẩu, 3.1.2.7. Cải tiến và mở rộng liên tục hệ thống để đáp ứng các nhu cầu mới của dịch vụ. Đây là bước tương ứng với quá trình cải tiến và hoàn thiện liên tục trong ITIL. Trong đó các bài học, vấn đề và kinh nghiệm liên tục được đúc rút từ trong quá trình vận hành được ghi nhận lại để liên tục cải tiến. Không chỉ vậy, tại bước này nhóm dự án sẽ liên tục lắng nghe các phản hồi của khách hàng về dịch vụ cũng như các mong muốn kì vọng của các bên thứ ba như đơn vị kinh doanh, ban giám đốc công ty để liên tục cải tiến, mở rộng thêm các gói dịch vụ cung cấp cũng như các triển khai các hệ thống hỗ trợ khác để có thể tiếp tục trưởng thành trong việc cung cấp dịch vụ. 44 3.1.3. Kết quả đạt được Trong gần một năm hoạt động, từ tháng 1/2014 tới nay dự án đang dừng lại ở bước 6 trong kế hoạch 7 bước của mình. Dưới đây là một số kết quả dự án đã đạt được. a. Xây dựng thành công hạ tầng kĩ thuật của dịch vụ trên nền tảng OpenStack Hình 12. Kiến trúc hoạt động của Cloud sau khi triển khai Hệ thống sau khi được xây dựng xong đã đạt năng lực phục vụ được khoảng 300-500 máy ảo, với năng lực phần cứng vào khoảng 1TB RAM và 300TB lưu trữ. Kiến trúc đảm bảo tính sẵn sàng cao trên toàn hệ thống. Các thành phần của hệ thống từ thiết bị mạng đến các máy chủ vật lý quản lý hệ thống đều được dựng lên theo cặp đảm bảo tính sẵn sàng cao, hệ thống sẽ không gặp trục trặc hay gián đoạn dịch vụ ngay cả khi có sự cố phần cứng xảy ra với một hoặc nhiều node khác nhau trong toàn bộ hệ thống. b. Hoạt động vận hành hiện tại Sau khi triển khai và tiến hành chuyển đổi hệ thống mới đang phục vụ cho khoảng 180 máy ảo (bao gồm cả mũ và mới). Có giao diện web thân thiện, cho phép người dùng có thể tự truy cập tạo và cấp phát máy theo nhu cầu của mình. Hiện tại quá trình chuyển đổi vẫn đang được tiến hành với các hệ thống dịch vụ đòi hỏi thời gian gián đoạn thấp. Bên cạnh việc phục vụ dịch vụ hạ tầng như một dịch vụ cho 4 đơn vị kĩ thuật chính trong nội bộ Fpt Telecom, hiện tại hệ thống đang dần tiếp nhận các khách hàng từ trong nội bộ tập đoàn Fpt đang có nhu cầu sử dụng tài nguyên tính toán trên cloud. Một số dự án tiêu biểu của tập đoàn Fpt đã chuyển đổi thành công lên đám mây này. 45 Hình 13. Giao diện quản trị thông tin của Hệ thống Cloud nội bộ c. Xây dựng được quá trình làm chiến lược dịch vụ Qui trình làm chiến lược dịch vụ đã được xây dựng và chuẩn hóa toàn diện, tạo tiền đề cho phép nhóm dự án tiếp xúc trao đổi và tiếp nhận thông tin trực tiếp không chỉ chính khách hàng đang sử dụng dịch vụ mà còn từ các đơn vị kinh doanh để từ đó có thể đề ra các chiến lược phát triển dịch vụ phù hợp với chiến lục chung của toàn công ty và tập đoàn. Hàng tháng đều đặn nhóm dự án có một buổi báo cáo và trao đổi tình hình với lãnh đạo kĩ thuật của công ty và lãnh đạo trung tâm. d. Xây dựng được bộ qui trình quản lý năng lực (capacity management) Quản lý năng lực là một thành phần cơ bản và cực kì quan trọng trong các dịch vụ Cloud vì nó cho phép đơn vị cung cấp dự đoán và chuẩn bị sẵn tài nguyên một cách phù hợp cho các bước phát triển trong tương lai của dịch vụ, giảm thiểu các rủi ro liên quan đến hỏng hóc phần cứng hoặc tài nguyên bị quá tải do các tài nguyên được mua về không kịp. Nhóm dự án đã hoàn thành xong và áp dụng được 3 qui trình quản lý năng lực vào trong thực tế công việc việc. - Qui trình kiểm thử và tính toán phần cứng cho các thành phần của OpenStack. Nhóm dự án đã xây dựng xong cho các thành cơ bản của OpenStack như cấu hình cho một máy chủ trong hệ thống Nova, cấu hình phần cứng cho một máy 46 chủ trong hệ thống Ceph và cấu hình phần cứng cho máy chủ phục vụ cho dịch vụ Neutron của OpenStack. Hiện tại nhóm đang hoàn thiện các thành phần còn lại của hệ thống OpenStack như máy chủ Controller, các thiết bị mạng, - Qui trình quản lý, tổng hợp và dự báo tài nguyên. Hiện tại qui trình này đang được áp dụng định kì hàng tháng do qui mô của hệ thống còn đang ở mức khá nhỏ. Hàng tuần đều có một báo cáo từ đội vận hành thông báo đầy đủ về tình hình phần cứng đang có, các hỏng hóc thay thế, các dự đoán về tăng trưởng trong tháng sắp tới. - Qui trình lập kế hoạch đầu tư và muaa sắm phần cứng mới. Qui trình này đã được áp dụng cho đợt mua sắm phần cứng bổ sung mới nhất vào tháng 11/2014 năm nay. Hiện tại các qui trình đang được chạy thử nghiệm một cách trơn tru, một số các trục trặc trong thực hiện chủ yếu là quá trình trao đổi thông tin đã được cập nhật và sửa đổi hơn cho phù hợp với thực tế. e. Hoàn thiện bộ qui trình về quản lý tính sẵn sàng của hệ thống Trong qui trình về quản lý tính sẵn sàng của hệ thống, tất cả các qui trình đều đã được áp dụng vào trong thực tế và cho hiệu quả tốt. - Nhóm qui trình vận hành hàng ngày. Hệ thống giám sát và qui trình tương tác giám sát khi xuất hiện cảnh báo đã được đưa vào thực hiện. Bộ tiêu chí giám sát đã được xây dựng và tiếp tục bổ sung và được đưa vào giám sát trên thực tế thông qua hệ thống giám sát cảnh báo của Munin và OpsWork. Các qui trình liên quan đến phục hồi và tự phục hồi được kiểm tra định kì. - Nhóm qui trình đánh giá tích cực: các qui trình như đánh giá rủi ro, đánh giá giải pháp sẵn sàng cho các thành phần mới được đưa vào hệ thống đã được áp dụng trên thực tế. Các thành phần chủ chốt như các node controller của hệ thống OpenStack đã được đánh giá rủi ro và xây dựng giải pháp sẵn sàng cao ngay trước khi hệ thống hoạt động chính thức. 47 Hình 14. Hệ thống giám sát được đưa vào hoạt động để quản lý tính sẵn sàng của hệ thống - Nhóm qui trình báo cáo. Kế hoạch sẵn sàng đã được xây dựng xong và bổ sung cho các trường hợp một hoặc nhiều node xảy ra ra sự cố. Định kì sẽ có các báo cáo tổng hợp về tính sẵn sàng của hệ thống từ hệ thống giám sát tự động hay các đơn vị vận hành gửi đến cho các trưởng nhóm kĩ thuật vận hành và phát triển cũng như quản lý dự án. Qui trình kiểm thử tính sẵn sàng đã được xây dựng xong, tuy nhiên chưa được đưa vào thực hiện trên thực tế vì nhiều lý do khách quan. f. Hoàn thiện qui trình về đáp ứng yêu cầu của người dùng. Hiện tại với tốc độ hàng ngày có từ 5-10 yêu cầu từ phía người dùng liên quan đến các thay đổi trên hệ thống như kiểm tra dịch vụ, thay đổi mật khẩu, tạo mới hoặc xóa sửa máy ảo, nhóm dự án đã xây dựng xong một qui trình liên quan đến đáp ứng nhu cầu của khách hàng và một hệ thống quản lý ticket phục vụ cho việc theo dõi và trả lời các yêu cầu một cách dễ dàng hơn. Hiện tại qui trình đáp ứng nhu cầu của khách hàng đang bao phủ ở hai phần chính đó là yêu cầu cấp phát và tạo mới tài nguyên như máy ảo, dự án. Các yêu cầu cấp phát này cần được sự phê duyệt của các cấp quản lý thích hợp trước khi yêu cầu được thực hiện. Nhóm yêu cầu thứ hai là các yêu cầu nhỏ của người dùng dịch vụ đang sẵn có. Tất cả các yêu cầu của hai nhóm dịch vụ này đều được ghi nhận và trả lời trên hệ thống ticket system. 48 3.1.4. Các công việc cần được hoàn thiện trong tương lai So với kế hoạch được đề ra thì hiện tại dự án đang gần cán đích đầu tiên và dừng lại ở bước thứ 6 trong kế hoạch phát triển. Tại bước này, mục tiêu lớn nhất của nhóm dự án là định hình được hoạt động dịch vụ đám mây nội bộ trong một tổ chức liên tục phát triển và mở rộng như Fpt Telecom. Bên cạnh hoàn thiện các công việc kĩ thuật còn dang dở, nhóm dự án sẽ tiếp tục phân tích bộ qui trình ITIL để có thể tiếp tục bổ sung các bộ qui trình còn thiếu đặc biệt là các bộ qui trình liên quan đến cam kết chất lượng dịch vụ (SLA), dịch vụ như quản lý sự kiện, quản lý yêu cầu, quản lý thay đổi, quản lý các sự cố, quản lý hỗ trợ hay một mảng lớn công việc là quản lý an toàn, an ninh thông tin đặc biệt là trong hoàn cảnh vấn đề bảo mật đang nóng hơn bao giờ hết. Bên cạnh việc hoàn thiện các bộ qui trình, nhóm dự án sẽ tiếp tục phát triển các giải pháp kĩ thuật bổ sung cho hệ thống OpenStack để đảm bảo hệ thống được đầy đủ các tính năng, dễ dàng sử dụng và thân thiện với người dùng cuối. 49 KẾT LUẬN Dưới sự hướng dẫn của TS. Đỗ Đức Đông tôi đã hoàn thiện được phương pháp luận để áp dụng các hướng dẫn của bộ công cụ ITIL vào trong quản lý một dịch vụ Công nghệ thông tin cụ thể như dịch vụ Đám mây nội bộ trong một doanh nghiệp và tổ chức tại Việt Nam nhằm giải quyết một số các vấn đề không tương thích giữa ITIL và các dịch vụ điện toán đám mây luôn luôn thay đổi. Cũng rất may mắn là tôi được công ty cổ phần viễn thông Fpt Telecom tạo điều kiện tham gia dự án triển khai hệ thống OpenStack phục vụ cho dịch vụ Đám mây nội bộ của doan nghiệp để có thể áp dụng được những nghiên cứu của mình vào thực tế, nhằm cải thiện được chất lượng dịch vụ của một trong những dịch vụ mới mẻ và nhiều tiềm năng như IaaS. Trong suốt quá trình thực hiện nghiên cứu và áp dụng và trong thực tế khóa luận đã đạt được một số kết quả nhất định như xây dựng một cách bài bản và có chiến lược xuyên suốt một dịch vụ Đám mây nội bộ cơ bản; xây dựng thành công hệ thống OpenStack và đưa vào sử dụng trên thực tế, đảm bảo các tiêu chí về mặt kĩ thuật như dễ sử dụng, ổn định, có tính sẵn sàng cao; chuyển đổi thành công từ sử dụng hệ thống Cloud cũ sang hệ thống Cloud mới; cung cấp được dịch vụ cho hầu hết các dịch vụ mới không chỉ dừng lại trong nội bộ công ty Fpt Telecom mà bắt đầu cung cấp dịch vụ cho một số các đơn vị nội bộ khác trong tập đoàn Fpt; xây dựng được một bộ các qui trình liên quan đến các quá trình như quản lý tính sẵn sàng của hệ thống, quản lý năng lực của toàn bộ hệ thống và quản lý các yêu cầu từ người dùng và các đơn vị trong hệ thống; đồng thời bắt đầu áp dụng được các qui trình đó vào trong các hoạt động định kì trên thực tế. Tuy nhiên, bản thân các bài toán riêng lẻ như triển khai đám mây nội bộ sử dụng công nghệ OpenStack, ứng dụng Điện toán đám mây vào trong hoạt động của doanh nghiệp hay áp dụng các hướng dẫn của bộ công cụ ITIL vào trong phát triển và vận hành dịch vụ đều là những bài toán lớn và phức tạp. Bài toán triển khai đám mây nội bộ phải giải quyết các vấn đề liên quan đến những công nghệ còn rất mới và phức tạp như OpenStack, bài toán ứng dụng đám mây nội bộ vào trong doanh nghiệp đòi hỏi phải thay đổi tư duy thiết kế và sử dụng dịch vụ từ mô hình truyền thống sang mô hình mới. Bài toán triển khai ITIL lại rất phức tạp vì bản thân ITIL là một bộ công cụ rất lớn và chi tiết nên để có thể áp dụng trọng vẹn vào trong thực tế một doanh nghiệp đòi hỏi rất nhiều thời gian. Chưa kể đến các yếu tố về kinh nghiệm triển khai ITIL, thay đổi tư duy của cả người dùng lẫn người vận hành về mô hình hoạt động mới, dịch vụ mới. Trên thực thế, rất nhiều doanh nghiệp khi muốn áp dụng ITIL đã phải bỏ rất nhiều tiền để thuê chuyên gia và tư vấn nhưng kết quả đạt được cũng không được như mong 50 đợi. Chính vì những yếu tố đó mà khóa luận này cũng mới chỉ cố gắng giải quyết được một phần của những vấn đề trên trong một bài toán cụ thể. Đồng thời cũng khóa luận cũng tạo ra một nền tảng về phương pháp luận vững chắc giúp cho tôi có thể ứng dụng trọn vẹn bộ công cụ ITIL vào trong công việc quản lý các dịch vụ đám mây trong tương lai./. 51 TÀI LIỆU THAM KHẢO 1. Microsoft Solution Accelerators, 2013. Service Management for Private Cloud. 2. OpenStack Foundation, 2014. Openstack Operations guide. 3. OpenStack Foundation, 2014. Openstack Design guide. 4. Best Management Practices, 2011. Introduction to ITIL lifecycle. The Stationery Office. ISBN 9780113313099. 5. National Institute of Standards and Technology, 2011. NIST Definition of Cloud Computing, SP800-145. 6. Bộ thông tin truyền thông, 2012. Dự thảo Nghị định về dịch vụ Công nghệ thông tin. 7. Best Management Practices, 2007. ITIL V3 Glossary of Terms and Acronyms v3.1.24. 8. IT Service Management Forum (2002). van Bon, J., ed. IT Service Management: An Introduction. Van Haren Publishing. ISBN 90-806713-4-7 9. IBM.com, 2014. IBM Tivoli Unified Process. 10. Microsoft.com, 2014. Microsoft Operations Framework. 11. Axelos.com, 2014. Best practice in the cloud: an introduction. 12. Axelos.com, 2014. Using ITIL to seize the opportinuties of the cloud – and rise to its challenges. 13. Lê Thành Trung, VNG, 2014. ITIL in Practice. 14. Microsoft Solution Accelerators, 2014. MOF and Private Cloud. 15. Best Management Practices, 2012. ITIL Foundation Handbook. The Stationery Office. ISBN 9780113313495

Các file đính kèm theo tài liệu này:

  • pdfnghien_cuu_va_ung_dung_itil_cho_quan_ly_dich_vu_dam_may_noi_bo_trong_doanh_nghiep_2143.pdf
Luận văn liên quan