Trong suốt quá trình thực hiện nghiên cứu và áp dụng và trong thực tế khóa luận
đã đạt được một số kết quả nhất định như xây dựng một cách bài bản và có chiến lược
xuyên suốt một dịch vụ Đám mây nội bộ cơ bản; xây dựng thành công hệ thống
OpenStack và đưa vào sử dụng trên thực tế, đảm bảo các tiêu chí về mặt kĩ thuật như
dễ sử dụng, ổn định, có tính sẵn sàng cao; chuyển đổi thành công từ sử dụng hệ thống
Cloud cũ sang hệ thống Cloud mới; cung cấp được dịch vụ cho hầu hết các dịch vụ mới
không chỉ dừng lại trong nội bộ công ty Fpt Telecom mà bắt đầu cung cấp dịch vụ cho
một số các đơn vị nội bộ khác trong tập đoàn Fpt; xây dựng được một bộ các qui trình
liên quan đến các quá trình như quản lý tính sẵn sàng của hệ thống, quản lý năng lực
của toàn bộ hệ thống và quản lý các yêu cầu từ người dùng và các đơn vị trong hệ
thống; đồng thời bắt đầu áp dụng được các qui trình đó vào trong các hoạt động định
kì trên thực tế.
52 trang |
Chia sẻ: builinh123 | Lượt xem: 1411 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu và ứng dụng ITIL cho quản lý dịch vụ đám mây nội bộ trong doanh nghiệp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
c hành trong việc quản lý dịch vụ IT để có thể có một dịch vụ đáng tin
cậy, cải tiến liên tục trên một nền tảng có sẵn thì với các dịch vụ Cloud thì lại hoàn
toàn khác. Các dịch vụ Cloud đặc biệt là hạ tầng thì liên tục thay đổi dẫn tới các bài
toán về mặt kiểm soát và tích hợp. Mặc dù, Cloud Computing cũng chính là một dịch
vụ công nghệ thông tin tuy nhiên tại từng pha công việc của ITIL lại có những điểm
khác biệt mà bản thân ITIL chưa thể đáp đứng trọn vẹn
a. Service Strategy
Chiến lược điển hình của bất kì một dịch vụ IT nào cũng là giải quyết các vấn
đề trong ngắn hạn và dài hạn với những chặng đích rõ ràng, các phương án được phát
triển với tính tập trung cao cả về kiến trúc lẫn hạ tầng. Tuy nhiên, trong các dịch vụ
Cloud thì những bản kế hoạch dài 3-5 năm này này lại trở lên lạc lõng vì không thể đáp
ứng được tính thay đổi liên tục và luôn đổi mới của dịch vụ.
b. Service Design
Các dịch vụ IT truyền thống được thiết kế với kiến trúc tập trung, chú trọng và
ứng dụng trong khi đó các hệ thống Cloud lại đòi hỏi tính phân tán.
Bên cạnh đó, các chỉ tiêu đo lường KPI, SLA truyền thống có thể không còn phù hợp
khi áp dụng cho các đơn vị cung cấp dịch vụ vì một đặc trưng của Cloud là khả năng
tự phục hồi hơn là dư thừa để đảm bảo tính sẵn sàng. Chưa kể đến việc áp dụng các
SLA/KPI truyền thống sẽ tạo ra rất nhiều các ngoại lệ trong một hệ thống cung cấp
dịch vụ tự phục vụ như Cloud.
c. Service Transition
Việc chuyển đổi dịch vụ sang các dịch vụ mới gặp phải các vấn đề liên quan
đến thay đổi kiến trúc dịch vụ từ tập trung, sang phân tán cũng như các yêu cầu về thời
gian gián đoạn tối thiểu.
d. Service Operation
Theo mô hình truyền thống, khi sử dụng dịch vụ, các cam kết về dịch vụ (SLAs)
phải được giám sát và theo dõi để đảm bảo các cam kết dịch vụ được thực hiện theo
đúng như cam kết đã có. Quá trình này bao gồm quản lý sự cố, quản lý sự kiến, quản
lý yêu cầu.
Khi chuyển đổi lên hệ thống Cloud, các sự kiện, cam kết được kiểm tra và báo
cáo trong môi trường và kiến trúc mới như thế nào. Chưa kể việc vận hành hệ thống
25
trong môi trường mới đòi hỏi sự tương tác trực tiếp giữa người với hệ thống cũng như
giữa đơn vị cung cấp và khách hàng cuối phải giảm thiểu tối đa.
Điểm chung duy nhất giữa các dịch vụ Cloud và hệ thống quản lý dịch vụ ITIL
chính là quá trình cải tiến liên tục, luôn luôn tích luỹ bài học kinh nghiệm và kiến thức
trong suốt quá trình thiết kế, vận hành hoạt động của dịch vụ, tạo ra các thông tin phản
hồi để cải tiến hoặc thay đổi dịch vụ.
2.2. Triển khai OpenStack
2.2.1. Giới thiệu về OpenStack
OpenStack là một giải pháp mã nguồn mở tổng thể cho phép xây dựng một nền
tảng điện toán đám mây (Cloud computing platform), có thể cung cấp dịch vụ trong
nội tại một tổ chức hoặc cung cấp dịch vụ ra bên ngoài. Mục tiêu của dự án là cung cấp
một giải pháp có thể đáp ứng cho đa dạng các loại hình hệ thống khác nhau nhưng phải
đảm bảo các tiêu chí: dễ dàng thực thi, dễ dàng mở rộng và nhiều tính năng. Giải pháp
OpenStack được phân phối theo giấy pháp mã nguồn mở Apache tạo sự linh hoạt trong
việc tái đóng gói và cung cấp sản phẩm dịch vụ một cách thương mại hoá mà không
bị gò bó trong các qui định khắt khe về giấy phép phần mềm nguồn mở truyền thống.
Dự án được bắt đầu vào năm 2010, khi Rackspace và NASA kết hợp với nhau
công bố về dự án với mục tiêu cung cấp nền tảng điện toán đám mây sử dụng các phần
cứng giá rẻ và phổ biến.
Việc phát triển dự án OpenStack được điều hành bởi một quĩ chung là
OpenStack Foundation. Hiện nay quĩ OpenStack bên cạnh việc quản lý và đầu tư phát
triển các dự án con của OpenStack thì tổ chức này còn có nhiệm vụ là quảng bá hình
ảnh, phát triển cộng đồng, phát triển thị trường và các hệ sinh thái sảnh phẩm và kinh
tế xung quanh dự án OpenStack.
Dự án OpenStack bao gồm rất nhiều dự án con, mỗi dự án con chịu trách nhiệm
thực hiện một tính năng riêng của biệt của dự án. Các dự án chính bao gồm:
- Nova: quản lý các tài nguyên ảo hóa và tính toán (RAM, CPU).
- Neutron: quản lý thiết bị và các tài nguyên về mạng.
- Cinder: cung cấp dịch vụ quản lý lưu trữ theo khối (Block storage)
- Swift: dịch vụ quản lý lưu trữ theo đối tượng (Object storage).
- Horizon: giao diện tương tác với người dùng cuối.
- Ceilometer: Thực hiện đo đạc hiệu năng của toàn bộ hệ thống.
Khi triển khai xây dựng, chỉ cần tùy biến các thành phần này và ghép với nhau
là trở thành một giải pháp Hạ tầng như một dịch vụ (IaaS) hoàn chỉnh một cách nhanh
chóng và dễ dàng, không gặp nhiều khó khăn.
26
Bên cạnh đó, với tốc độ phát triển hiện nay, OpenStack cũng đang có một hệ
sinh thái các dịch vụ Cloud mới được xây dựng dựa trên các dịch vụ hạ tầng cơ mà bản
đang có như PaaS (OpenShift), Manhout (Hadoop-as-Service), Trove (DbaaS), LbaaS
hay FwaaS. Các dự án này ngày càng phong phú và đa dạng, tạo tiền đề cho người
dùng cuối có thể ứng dụng các dịch vụ đám mây một cách linh hoạt và đa dạng.
2.2.2. Kiến trúc và các thành phần cơ bản của OpenStack
OpenStack là một nền tảng quản lý Cloud (Cloud Management Platform), được
thiết kế theo dạng Module, trong đó các thành phần con tương tác trực tiếp với nhau,
rất dễ dàng mở rộng và tích hợp thêm các dịch vụ khác vào trong hệ thống. Tuy nhiên,
hệ thống OpenStack sẽ bao gồm các thành phần cơ bản chính như sau:
- Nova: thành phần quan trọng nhất của OpenStack, chịu trách nhiệm tạo, phân
phối và quản lý vòng đời máy ảo và các tài nguyên tính toán như năng lực xử lý
CPU, bộ nhớ RAM.
- Cinder: cung cấp dịch vụ lưu trữ theo khối (Block storage), cho phép tạo, phân
phối dung lượng lưu trữ bất kì cho các máy ảo sử dụng như một hoặc nhiều ổ
cứng lưu trữ vật lý với dung lượng tuỳ ý. Người dùng cảm thấy có thể sử dụng
một lượng lưu trữ “không có giới hạn”.
- Swift: cung cấp dịch vụ lưu trữ theo đối tượng (Object storage). Cho phép tải
lên, tải xuống và lưu trữ các file (object) trên hệ thống storage riêng biệt. Hệ
thống swift phục vụ việc truyền tải, tải lên, tải xuống file dựa trên giao thức phổ
biến HTTP. Người dùng cuối sử dịch vụ Swift sẽ giống như đang sử dụng một
dịch vụ chia sẻ file phổ biến trên mạng Internet.
- Neutron: thành phần quan trọng tương đươngdịch vụ Nova, chịu trách nhiệm
quản lý, tạo và điều phối các tài nguyên mạng và cung cấp các dịch vụ về mạng
cho các máy ảo sử dụng như địa chỉ IP, quản lý VLAN, QoS,
- Horizon: thành phần cung cấp giao diện đồ họa (web) cho người dùng cuối
tương tác với hệ thống OpenStack để tạo, quản lý và truy cập máy ảo cũng như
các tài nguyên tính toán khác.
- Keystone: thành phần cung cấp dịch vụ về định danh và xác thực cho toàn bộ
các dịch vụ khác trong hệ thống OpenStack.
- Glance: thành phần cung cấp dịch vụ các file ảnh hệ điều hành, phục vụ cho
quá trình bật các máy ảo.
- Ceilometer: cung cấp dịch vụ lưu trữ và giám sát các thông tin đo lường về
hoạt động của các thành phần khác trong hệ thống OpenStack.
- Heat: thành phần cung cấp dịch vụ điều phối hoạt động của các máy ảo theo
các kịch bản được định nghĩa trước.
27
Hình 5. Kiến trúc Logic của OpenStack
2.2.3. Tại sao lại là OpenStack mà không phải là các giải pháp thương mại
khác
OpenStack được lựa chọn nghiên cứu sử dụng bởi có rất nhiều tính năng nổi trội
hơn các bản thương mại khác đang có trên thị trường.
- Là một giải pháp được sử dụng phần lớn bởi 75% các nhà cung cấp dịch vụ
đám mây (công cộng lẫn nội bộ). Từ khi ra đời năm 2010 đến nay đã rất nhiều
công ty và tổ chức lớn trên thế giới chuyển đổi sang sử dụng nền tảng OpenStack
từ các dịch vụ cung cấp nội bộ đến các dịch vụ cung cấp ra bên ngoài. Như Intel,
CERN, HP Public Cloud, HP Coverged Cloud, Ebay, Paypal, Rackspace,
Yahoo, Wikimedia, Sony,
28
- Là một nền tảng công nghệ mã nguồn mở đang được phát triển rất tích cực..
Dự án được phát triển liên tục và ra phiên bản mới trong chu kì 6 tháng. Phiên
bản mới nhất được release vào tháng 10/2014 có tên gọi là Juno.
- Dễ dàng thay đổi và tùy biến cho các nhu cầu cụ thể. Nền tảng công nghệ chính
mà dự án sử dụng là các nền tảng mã nguồn mở phổ biến bao gồm: Linux,
Python, MySQL và RabbitMQ. Các thành phần này đều rất dễ học và dễ phát
triển tùy biến theo các nhu cầu khác nhau. Chính vì vậy, trong quá trình xây
dựng và triển khai thì việc áp dụng và tùy biến công nghệ sẵn có là điều dễ dàng.
- Có một cộng đồng người dùng và các nhà phát triển lớn nhất trên thế giới nếu
so sánh với các giải pháp IaaS khác cả mã nguồn đóng và mã nguồn mở. Tính
đến tháng 6/2013, dự án OpenStack đã có gần 10,000 thành viên trên gần 100
nước tham gia đóng góp, được hỗ trợ bởi 200 công ty trên toàn thế giới. Đặc
biệt, dự án được rất nhiều các công ty lớn quan tâm và hỗ trợ như Redhat, Intel,
Canonical Ubuntu, SUSE, Intel, NASA.
- Có khả năng tương thích tốt với đa dạng các nền tảng phần cứng và thiết bị
mạng của các hãng khác nhau. Hiện nay OpenStack đang hỗ trợ hai nền tảng ảo
hóa phổ biến hiện nay là Redhat KVM và VMWare. Bên cạnh đó là khả năng
làm việc theo các giao thức chuẩn tắc được hỗ trợ phổ biến trên hầu hết các dòng
thiết bị mạng phổ thông cũng như cao cấp.
2.2..4. Các dịch vụ cơ bản của OpenStack cung cấp cho người dùng
Như đã nói ở trên, OpenStack là một nền tảng quản lý đám mây, những dịch vụ
chính mà OpenStack cung cấp tới người dùng cuối bao gồm
- Tạo và quản lý các máy ảo theo các mẫu cấu hình cho trước. Người dùng có
thể lựa chọn cấu hình phần cứng máy ảo (CPU, RAM, dung lượng lưu trữ) theo
các cấu hình mà đơn vị cung cấp xây dựng sẵn. Ví dụ như các mẫu cấu hình
1VCPU, 1GB RAM (m1.tiny) hay 1VCPU, 2GB RAM (m1.small),
- Tạo và quản lý các mạng riêng ảo (VPC) và các tài nguyên mạng khác như địa
chỉ IP nội bộ và địa chỉ IP Internet. Người dùng cuối có thể xây dựng lại một
mô hình mạng giống như mô hình mạng vật lý đang hoạt động với nhiều lớp
mạng khác nhau, với các dải mạng có địa chỉ ra Internet,
- OpenStack cung cấp hai giao diện tương tác chính cho người dùng là giao diện
thông qua dashboard (giao diện web) và giao diện tương tác thông qua HTTP
API.
29
Hình 6. Giao diện tương tác đồ họa của OpenStack
- Ngoài ra, do tính module hóa của OpenStack rất cao mà người dùng cuối có
thể sử dụng thêm rất nhiều các dịch vụ khác nhau như DbaaS, FwaaS, LbaaS,
mà đơn vị cung cấp tích hợp các thành phần khác của Open Stack vào dịch vụ
đang chạy.
30
Chương 3. Áp dụng vào bài toán Triển khai Private Cloud
tại công ty Fpt Telecom
Rất may mắn là trong quá trình thực hiện khóa luận này, tôi có cơ hội được áp
dụng các kiến thức trên vào giải quyết một bài toán thực tế tại nơi làm việc đó là xây
dựng các qui trình quản lý một hệ thống private cloud dựa trên ITIL cho công ty Fpt
Telecom. Dự án đang được thực hiện từ đầu năm 2014 đến nay và dự kiến sẽ kéo dài
đến hết năm 2015, trong đó mục tiêu lớn nhất là chuyển đổi toàn bộ hạ tầng Công nghệ
thông tin của công ty từ mô hình tính toán vật lý truyền thống sang mô hình cung cấp
dịch vụ IaaS.
3.1. Mô tả bài toán
3.1.1. Giới thiệu về dự án Triển khai Private Cloud tại Fpt Telecom
Công ty cổ phần Viễn thông Fpt (Fpt Telecom) là một trong 3 công ty cung cấp
dịch vụ Internet (ISP) lớn nhất Việt Nam. Hệ thống nội bộ cung cấp dịch vụ và quản
lý bên trong Fpt Telecom rất phức tạp và trải dài từ Hà Nội vào Thành phố Hồ Chí
Minh. Số lượng các máy chủ đang hoạt động cho các hệ thống này lên tới hàng nghìn
máy và tiếp tục gia tăng liên tục theo suốt sự phát triển dịch vụ của công ty. Sự tăng
trưởng liên tục gây ra một áp lực vô cùng lớn đến hạ tầng công nghệ của công ty đặc
biệt là trong việc quản lý tài nguyên tính toán khi mà nhu cầu tính toán tăng nhanh hơn
việc đầu tư bổ sung tài nguyên. Bên cạnh đó là các khó khăn trong việc quản lý một số
lượng máy tính vật lý và thiết bị lưu trữ lớn đến hàng nghìn máy trong điều kiện chi
phí đầu tư và vận hành luôn được chủ trương tiết kiệm một cách tối đa.
Từ năm 2010, để tiết kiệm chi phí đầu tư mua phần cứng và tăng năng suất phát
triển của toàn hệ thống, trung tâm Nghiên cứu phát triển (RAD), Công ty Fpt Telecom
đã quyết định xây dựng và triển khai một hệ thống Private cloud dựa trên nền tảng công
nghệ OpenNebula nhằm giải quyết những bài toán đặt ra trong việc quản lý tài nguyên
tính toán. Trong vòng 3 năm hoạt động (2010-2013) hệ thống đã đáp ứng được phần
nào đó nhu cầu về cấp phát tài nguyên tính toán trong nội bộ của trung tâm và các đơn
vị kĩ thuật khác.
Một vài con số về qui mô hệ thống Cloud chạy Private cloud (còn gọi là Cloud
“cũ”):
- Bao gồm 12 máy chủ vật lý, 3 máy chủ Firewall và 1 Gateway.
- Hiện tại đang có 126 máy chủ ảo (VMs) trong đó có 71 máy chủ đang hoạt
động cho các dịch vụ chính của công ty.
- Hỗ trợ 2 nền tảng ảo hóa chính là KVM và VMWare.
31
- Số lượng dịch vụ đang hoạt động trên nền tảng này chiếm hơn 50% tổng số
dịch vụ của toàn bộ trung tâm RAD.
Tuy nhiên, hệ thống này gặp phải rất nhiều hạn chế được chia thành 2 nhóm
chính là hạn chế về mặt kĩ thuật và hạn chế về mặt quản lý.
a. Các hạn chế về mặt kĩ thuật
- Hệ thống do không được đo đạc và giám sát kịp chặt chẽ nên không được mở
rộng kịp thời. Hệ thống đã bắt đầu có dấu hiệu quá tải.
- Hệ thống chưa được tích hợp sâu vào hạ tầng mạng sẵn có của Fpt Telecom
nhằm tận dụng các tính năng có sẵn hạ tầng mạng của một công ty viễn thông.
Nguyên nhân là do hạn chế của bản thân giải pháp OpenNebula đang sử dụng
- Việc vận hành hệ thống chưa được tự động hóa, các quá trình vận hành hàng
ngày vẫn phải thực hiện thủ công.
- Hệ thống chưa khai thác được các công nghệ về mặt ảo hóa mà các giải pháp
ảo hóa KVM hay VMWare đem lại.
b. Các hạn chế về qui trình quản lý
Hệ thống Cloud “cũ” không có các qui trình tiêu chuẩn về mặt giám sát và vận
hành hệ thống dẫn tới rất nhiều khó khăn trong việc quản lý và vận hành hệ thống.
- Thiếu các qui trình liên quan đến hướng dẫn vận hành, quản lý, giám sát hệ
thống và xử lý sự cố. Việc vận hành hệ thống được thực hiện dựa trên kinh
nghiệm của người giám sát. Chính vì vậy mỗi khi có nhân sự vào ra khỏi hệ
thống là việc cung cấp dịch vụ trở nên rất khó khăn.
- Thiếu các qui trình liên quan đến đảm bảo an toàn, an ninh thông tin hệ thống.
Một số các sự cố liên quan đến bảo mật đã xảy ra trong quá trình vận hành hệ
thống.
- Thiếu các qui trình liên quan đến quản lý thay đổi. Việc thay đổi không được
phê duyệt và ghi nhận, dẫn tới rất khó theo dõi và kiểm soát các thay đổi trong
suốt quá trình vận hành của hệ thống tạo nên rất nhiều điểm “đen” trên hệ thống
rất khó quản lý đặc biệt là khi có sự cố xảy ra. Rất nhiều trường hợp sự cố xảy
ra do việc thay đổi cấu hình hệ thống mà không được báo trước
- Không có các dự báo hoặc lập kế hoạch chuẩn bị mở rộng tài nguyên. Chính
vì điều này dẫn tới việc đầu tư và mở rộng hệ thống không đồng nhất, sau một
thời gian vận hành hệ thống trở nên chắp vá.
- Các công cụ quản lý tài nguyên còn nghèo nàn.
- Không có mô hình quản lý dịch vụ. Các nhóm vận hành cũng không có tư duy
về cung cấp dịch vụ. Chính vì vậy dẫn tới dịch vụ được cung cấp rất tùy tiện,
không có cam kết về chất lượng dịch vụ hay xử lý yêu cầu, sự cố.
32
Chính vì vậy đầu năm 2014, công ty Fpt Telecom đã quyết định triển khai dự
án xây dựng hệ thống Private cloud mới dựa trên nền tảng công nghệ OpenStack đồng
thời áp dụng ITIL vào quản lý hệ thống Private cloud nhằm giải quyết các bài toán vừa
được nêu ra. Chuyển đổi từ mô hình phục vụ đơn thuần sang mô hình cung cấp theo
dịch vụ có cam kết chất lượng.
3.1.2. Giải quyết bài toán
Sau khi nghiên cứu kĩ các giải pháp kĩ thuật đang có trong tay và các phương
pháp luận cần thiết từ ITIL nhóm dự án đã quyết định thực hiện các bước sau đây.
- Bước 1: Trước khi bắt đầu vào dự án triển khai nền tảng Cloud “mới” nhóm
thực hiện dự án đã quyết định viết lại yêu cầu của bài toán một cách cụ thể dựa
trên thêm các yêu cầu của các đơn vị kinh doanh và sử dụng hệ thống bên cạnh
việc xem xét lại các vấn đề đang tồn tại.
- Bước 2: Lập chiến lược cho dịch vụ, xây dựng lộ trình tổng thể cho toàn bộ
dự án. Xác định các qui trình tổng thể và các bước áp dụng chi tiết.
- Bước 3: Thiết kế dịch vụ chi tiết. Xây dựng kiến trúc kĩ thuật tổng thể cho toàn
bộ hệ thống.
- Bước 4: Tiến hành xây dựng và thử nghiệm các giải pháp kĩ thuật đang có sẵn
(bao gồm cả thương mại và mã nguồn mở).
- Bước 5: Tiến hành chuyển đổi hệ thống từ hệ thống cũ sang hệ thống mới áp
dụng các best practices trong việc chuyển đổi dịch vụ.
- Bước 6: Đưa hệ thống vào vận hành nội bộ. Hoàn thiện các bộ qui trình liên
quan đến vận hành kĩ thuật dựa trên best practices trong Vận hành dịch vụ.
- Bước 7: Cải tiến và mở rộng liên tục hệ thống để đáp ứng các nhu cầu mới của
dịch vụ.
Do tính phức tạp của việc xây dựng và chuyển đổi sang hệ thống Cloud mới và
độ lớn của bộ công cụ ITIL nên một số các qui trình cần thiết được tiến hành xây dựng
trước để đảm bảo cho độ tiến độ công việc. Các qui trình được xây dựng trước bao
gồm: thiết kế chiến lược dịch vụ, thiết kế dịch vụ, quản lý tính sẵn sàng, quản lý năng
lực hệ thống (thiết kế dịch vụ) và quản lý đáp ứng yêu cầu của khách hàng (vận hành
dịch vụ).
3.1.2.1. Xây dựng đề bài cụ thể về dịch vụ Cloud mới
Đội dự án đã làm việc với rất nhiều bên trong đó có ghi nhận lại mong muốn và
phản hồi từ những đơn vị đang sử dụng dịch vụ là nội bộ của trung tâm RAD và các
đơn vị kĩ thuật thành viên, các đơn vị kinh doanh trực tiếp về tầm nhìn phát triển dịch
vụ và làm việc với Ban Giám đốc của công ty để biết được những kì vọng của Ban
Giám đốc về dự án cũng như qui mô về mặt đầu tư tài chính cho dự án. Ngoài ra, nhóm
33
dự án cũng đã liên lạc với các chuyên gia và các công ty về dịch vụ xây dựng Cloud để
học hỏi thêm kinh nghiệm và các thông tin khác. Sau khi thực hiện xong, nhóm đã xây
dựng được một đề bài cụ thể để thực hiện dự án như sau:
- Chuyển đổi hạ tầng IaaS sẵn có sang nền tảng công nghệ mới, phù hợp, linh
hoạt và có độ tin cậy cao.
- Hoàn thiện các qui trình về vận hành, lập kế hoạch phát triển tài nguyên, xử lý
sự cố, kiểm soát thay đổi cho các hệ thống mới.
- Xây dựng được đội ngũ kĩ sư làm chủ được công nghệ để có thể vận hành và
phát triển hệ thống Cloud, cung cấp các dịch vụ mới cho không chỉ cho nội bộ
công ty Fpt Telecom mà cả tập đoàn Fpt cũng như ra khách hàng công cộng.
- Xây dựng được nền tảng về kĩ thuật, qui trình và quản lý để có thể cung cấp
dịch vụ một cách chuyên nghiệp tin cậy và có khả năng mở rộng theo yêu cầu.
- Chuyển đổi những dịch vụ quan trọng và phù hợp lên Cloud.
3.1.2.2. Lập chiến lược cho dịch vụ. Xây dựng lộ trình phát triển
Sau khi xác định được đề bài cụ thể cho dự án mới, nhóm dự án bắt tay vào lập
chiến lược và tầm nhìn cho dịch vụ cũng như xây dựng lộ trình phát triển dự án. Trong
phần chiến lược và tầm nhìn cho dịch vụ, theo ITIL, thì cần phải thực hiện theo 8 bước
bao gồm
- Bước 1: Định nghĩa thị trường và khách hàng. Tại đây, nhóm dự án đã xác
định được khách hàng đầu tiên cần phục vụ trước mắt các đơn vị kĩ thuật và dự
án nội bộ. Sau đó là các đơn vị kĩ thuật của tập đoàn Fpt có nhu cầu sử dụng
Cloud và cuối cùng là nhóm khách hàng doanh nghiệp bên ngoài đang sử dụng
các dịch vụ hosting có sẵn của Fpt Telecom.
- Bước 2: Hiểu rõ khách hàng. Đặc tính của các khách hàng mà dịch vụ sẽ phải
cung cấp đều có những yêu cầu rất cao về hiệu năng hoạt động, sự ổn định của
hệ thống và các cam kết hỗ trợ xử lý yêu cầu kịp thời.
- Bước 3: Định giá kết quả. Theo Gartner thì tốc độ thị trường phát triển IaaS
đang còn rất tiềm năng và có tốc độ tăng rất cao trong thời gian tới.
- Bước 4: Phân loại dịch vụ. Do đặc tính khách hàng nên nhóm dự án sẽ chỉ tập
trung vào hai loại hình dịch vụ chính là dịch vụ bình thường với chất lượng vừa
phải và dịch vụ đảm bảo với chất lượng cam kết.
- Bước 5: Hiểu rõ cơ hội của Fpt Telecom trên thị trường IaaS
- Bước 6: Định nghĩa các dịch vụ dựa trên kết quả dự kiến
- Bước 7: Định nghĩa mô hình dịch vụ. Dự kiến dịch vụ được cung cấp theo mô
hình tự phục vụ theo nhu cầu (on demand self-service) của người dùng.
34
- Bước 8: Định nghĩa các gói của dịch vụ. Dịch vụ sẽ cung cấp các gói dịch vụ
cơ bản sau như gói dịch vụ về tính toán và dịch vụ về lưu trữ. Đây là những dịch
vụ cần thiết và đang có nhu cầu rất lớn cả trong và ngoài nước.
Trước mắt ở qui mô công ty, nhóm dự án đã định nghĩa được hai gói dịch vụ chính sau
a. Single VM
- Các máy ảo đơn lẻ được tạo và quản lý theo trung tâm và đơn vị khác nhau.
- Mỗi trung tâm/đơn vị được tạo thành một dự án trên hệ thống. Các tài nguyên
như máy ảo, block storage và Public IP được cấp theo quota của từng trung tâm
và đơn vị.
- Mỗi một tenant được cấp phát một VPN server riêng. Các trung tâm và nhóm
đơn vị gửi lại thông tin về các tài khoản VPN vào hệ thống.
- Mỗi máy ảo được khởi tạo ra phải đi kèm với một key-pair của một cá nhân
xác định.
- Việc tạo và quản lý máy ảo được đảm trách bởi đội vận hành Cloud chung.
b. Projects
- Các dự án nếu đủ qui mô về số lượng máy ảo (trên 5 VMs) và có khả năng tự
quản lý tài nguyên (máy ảo, storage, public IP) thì có thể đề xuất tạo dự án riêng
để quản lý tập trung và tách biệt so với các hệ thống còn lại.
- Các tài nguyên máy ảo, block storage và public IP được cấp theo quota cho
từng dự án.
- Mỗi dự án được cấp từ 1-2 account truy cập vào hệ thống VPN chính và sử
dụng OpenStack dashboard.
Sau đó, nhóm dự án đã phác thảo được lộ trình cho dự án trong khoảng 3 năm
dự kiến như sau
a. Nâng cấp hạ tầng Cloud sẵn có
Thời gian dự kiến: 1/2014
Mục tiêu thực hiện
- Nâng cấp thành công hạ tầng cloud sẵn có từ OpenNebula sang OpenStack,
dựa trên hạ tầng phần cứng và thiết bị mạng sẵn có.
- Cung cấp được các dịch vụ cơ bản về Tính toán, Lưu trữ và Mạng
- Hệ thống mới cần được đáp ứng 50% nhu cầu nội bộ của trung tâm RAD
- Xây dựng được đội ngũ kĩ thuật từ 5-7 người, có kĩ năng cơ bản về xây dựng
và vận hành hệ thống Cloud.
- Xây dựng được các kế hoạch và kịch bản đầu tư phát triển và mở rộng hệ thống
trong tương lai theo yêu cầu.
- Đào tạo và cho người dùng làm quen với cách sử dụng dịch vụ.
35
b. Cung cấp dịch vụ trong nội bộ Fpt và Fpt Telecom
Thời gian dự kiến: Giữa năm 2014
Mục tiêu thực hiện
- Xây dựng chiến lược cung cấp dịch vụ Hạ tầng như một dịch vụ (IaaS).
- Mở rộng được hệ thống Fpt Cloud đáp ứng được 70% nhu cầu của Fpt
Telecom, hướng tới cung cấp dịch vụ cho toàn bộ Fpt.
- Xây dựng, và áp dụng được qui trình liên quan đến quản lý dịch vụ và vận
hành hệ thống, bao gồm chăm sóc khách hàng và hỗ trợ kĩ thuật.
- Xây dựng được các kế hoạch phát triển và mở rộng hệ thống khi cần thiết. Kế
hoạch bao gồm lựa chọn phần cứng, tự động hóa quá trình mở rộng, có các thống
phát triển và kiểm thử riêng rẽ.
- Xây dựng được đội ngũ kĩ thuật khoảng 10 người, có am hiểu sâu về nền tảng
OpenStack.
c. Trở thành nhà cung cấp cấp dịch vụ Cloud
Thời gian dự kiến: bắt đầu từ giữa năm 2015.
Mục tiêu thực hiện:
- Trở thành nhà cung cấp dịch vụ Cloud công cộng với một số các dịch vụ cơ
bản liên quan đến tính toán (Compute Engine), lưu trữ (Storage) đáp ứng được
các nhu cầu khác nhau từ cá nhân cho đến tổ chức.
- Hoàn thiện các thành phần hỗ trợ như quản lý khách hàng, hệ thống Billing.
- Xây dựng được đội ngũ vận hành và phát triển khoảng 15 người, làm chủ được
công nghệ và sẵn sàng phát triển được các dịch vụ cao cấp dựa trên nền tảng hạ
tẫng có sẵn.
- Hoàn chỉnh và chuyên nghiệp hóa quá trình quản lý dịch vụ, chăm sóc khách
hàng và hỗ trợ kĩ thuật.
- Tích hợp được hệ thống quản lý dịch vụ với các hệ thống khác trong tổ chức
như Billing, quan hệ khách hàng, ...
Đồng thời, nhóm dự án cũng xây dựng được tổ chức con người thực hiện dự án
sẽ hoạt động như sau
36
Hình 7. Tổ chức đội dự án
Trong đó đội dự án bao gồm các kĩ sư về qui trình, hệ thống và phát triển phần
mềm, quản lý và giám đốc dự án.
Các đơn vị liên quan bao gồm các đơn vị kĩ thuật nội bộ của Fpt Telecom và
Ban giám đốc, những người chịu trách nhiệm đầu tư cho dự án.
3.1.2.3. Thiết kế dịch vụ chi tiết. Xây dựng kiến trúc kĩ thuật tổng thể cho toàn bộ
hệ thống.
Sau khi thu nhận được các thông tin đầu vào, nhóm dự án đã bắt tay và thực
hiện thiết kế dịch vụ ở mức chi tiết đồng thời tiến hành xây dựng các qui trình quản lý
đầu tiên liên quan đến quản lý năng lực (capacity management) và (availablity
management).
a. Thiết kế dịch vụ
Dịch vụ trước mắt được cung cấp sẽ chú trọng vào
- Cung cấp dịch vụ tạo, cấp phát và quản lý máy ảo theo qui trình được định
nghĩa sẵn.
- Cung cấp dịch vụ tạo, cấp phát và quản lý các tài nguyên mạng như VLAN,
địa chỉ IP và kết nối Internet
- Cung cấp dịch vụ hỗ trợ và xử lý yêu cầu cho người dùng cuối.
b. Xây dựng kiến trúc tổng thể cho toàn bộ hệ thống
Hệ thống cloud mới được tách thành ba phần riêng biệt bao gồm:
- Hạ tầng Công nghệ (OpenStack IaaS): các dịch vụ công nghệ chính sẽ được
sử dụng ngay tại thời điểm ban đầu bao gồm Nova (Compute Engine), Cinder
37
(Block Storage), Swift (Object Storage), KeyStone (Authentication &
Authorization) và Ceilometer (Metrics).
- Cung cấp dịch vụ (Service Delivery): bao gồm Thiết kê và lên yêu cầu chức
năng cho các dịch vụ Cloud mới (Service Design), SLA (cam kết đảm bảo dịch
vụ), Hệ thống Billing, Giao diện quản lý (Management Console), Giao diện
quản lý qua API (Management API) và quản lý khách hàng (CRM).
- Quản lý và vận hành dịch vụ (Service Management): Bao gồm tự động hóa
quá trình vận hành và khai thác dịch vụ, Giám sát, Lập kế hoạch mở rộng và các
qui trình vận hành khác có liên quan.
Hình 8. Kiến trúc tổng quan về hệ thống Cloud mới
c. Xây dựng kiến trúc kĩ thuật tổng thể cho hệ thống Cloud mới
Trong kiến trúc kĩ thuật tổng quan này, chúng ta có thể thấy các nền tảng và
công nghệ khác nhau mà hệ thống sử dụng
- Network: Hệ thống Fpt Cloud sẽ sử dụng hai hạ tầng mạng riêng biệt là
Management Network nhằm phục vụ cho các kết nối quản lý và giám sát máy
chủ và Physical Network là hệ thống mạng vật lý chạy nội bộ cho toàn bộ hệ
thống Cloud. Việc quản lý hạ tầng mạng vật lý và điều phối tài nguyên mạng sẽ
được thành phần Neutron của OpenStack quản lý. Hệ thống mạng vật lý sẽ được
tính toán để vừa đủ đảm bảo tối đa hiệu năng hoạt động, tính độc lập cũng như
độ mềm dẻo để đáp ứng các nhu cầu đa dạng trong nội bộ của công ty. Một
trong những mục tiêu trong việc thiết kế là hướng tới là xây dựng một hệ thống
SDN (Software Defined Networking) cho hệ thống mạng của Fpt Cloud.
- Dịch vụ Storage: hướng tới xây dựng được hệ thống SDS (Software Defined
Storage) trong đó tối ưu được cả về tài nguyên phần cứng cao cấp (SAN) cũng
như các tài nguyên phần cứng phổ biến (SATA disk) để có thể cung cấp một
cách đa dạng các độ tin cậy, tốc độ, dung lượng cho các nhu cầu lưu trữ khác
38
nhau. Hai dịch vụ sẽ được cung cấp chính là Object Storage (dựa trên nền Swift)
và Block Storage (dựa trên nền Cinder).
- Dịch vụ Tính toán: Hai nền tảng ảo hóa phổ biến được hỗ trợ sử dụng là KVM
và VMWare trong đó KVM được lựa chọn do tính tương thích, hiệu năng hoạt
động với OpenStack còn VMWare được lựa chọn vì tính phổ biến và độ ổn định
của nền tảng.
- Các thành tố khác cần quan tâm bao gồm là các giao diện quản lý (Horizon),
điều phối tài nguyên (Heat) và công cụ đo cho nền tảng Cloud (Ceilometer).
Hình 9. Kiến trúc kĩ thuật tổng quan về hệ thống
d. Xây dựng qui trình về quản lý tính sẵn sàng (availablity management)
Mục tiêu lớn nhất của các qui trình quản lý tính sẵn sàng là để đảm bảo tính sẵn
sàng ở các cấp độ khác nhau cho dịch vụ phù hợp với các cam kết đã có với chi phí và
thời gian hợp lý. Dựa trên ITIL nhóm dự án đã định nghĩa các công việc cần phải thực
hiện để quản lý tính sẵn sàng bao gồm
- Xây dựng và liên tục duy trì một bản kế hoạch sẵn sàng, trong đó mô tả các
yêu cầu về tính sẵn sàng của dịch vụ ở mức độ cung cấp cho người dùng cuối,
cũng như từ góc nhìn của đội xây dựng dự án. Trong bản kế hoạch này đã mô
tả sẵn sàng các các yêu cầu về thời gian gián đoạn dịch vụ, thời gian phục hồi
cũng như các hành động cụ thể khi xảy ra gián đoạn nhằm đảm bảo tính sẵn
sàng của toàn bộ dịch vụ cũng như hiệu năng hoạt động của toàn bộ hệ thống.
- Xây dựng được bộ các tiêu chí về thông tin cần được giám sát và theo dõi trên
hệ thống. Định nghĩa các thông tin vượt ngưỡng được cảnh báo, các cơ chế phục
hồi tự động và các cơ chế phục hồi bằng tay.
- Xây dựng được qui trình xử lý thông tin khi có sự cố về gián đoạn dịch vụ xảy
ra. Các phương án chuyển tiếp thông tin cho các đơn vị xử lý phù hợp đã được
định nghĩa.
39
- Thực hiện các qui trình báo cáo định kì về tính sẵn sàng của hệ thống theo từng
ngày, từng tuần, từng tháng, từng quí. Trong đó định nghĩa sẵn sàng các thông
tin cần tổng hợp và báo cáo, các đơn vị và người nhận báo cáo.
- Xây dựng các kế hoạch kiểm thử tính sẵn sàng theo định kì 3 tháng một lần
trong đó tại mỗi lần kiểm thử sẽ kiểm thử một thành phần xác định trên hệ thống
như network, tính toán, hệ thống quản lý hay cơ sở dữ liệu, Ghi nhận các các
phương án khắc phục phòng ngừa.
- Xây dựng qui trình đánh giá và biểu mẫu đánh giá định kì hàng quí về rủi ro
sự cố, các phương án kĩ thuật thực hiện đối với từng thành phần mới đưa vào hệ
thống. Các thành phần mới để có thể được đưa vào hệ thống cần đáp ứng được
đầy đủ các yếu tố đã được định nghĩa sẵn trong bản kế hoạch sẵn sàng.
Hình 10. Các qui trình về quản lý tính sẵn sàng.
40
e. Xây dựng về qui trình quản lý năng lực hệ thống (capacity management)
Quản lý năng lực hệ thống là một trong những yếu tố mà bản thân Cloud cũ
không có và gặp phải các vấn đề rất nghiêm trọng liên quan đến đầu tư và qui hoạch
tài nguyên. Chính vì vậy đây là một trong những thành phần mà nhóm dự án quan tâm
và thực hiện ngay từ đầu do dự kiến tốc độ phát triển của hệ thống đám mây nội bộ là
rất nhanh và tài nguyên phải luôn được sẵn sàng để đáp ứng cho nhu cầu của người
dùng.
Các qui trình đã được xây dựng bao gồm
- Qui trình về quản lý, tổng hợp và dự báo phát triển tài nguyên. Nguồn thông
tin được lấy ra từ các nguồn sau: thông tin về việc phát triển các hệ thống ứng
dụng trong nội bộ, thông tin về tốc độ tăng trường số lượng máy ảo, tốc độ tăng
trưởng của storage, về băng thông và IP trên toàn hệ thống cũng như tốc độ hỏng
và thay thế phần cứng trong một đơn vị thời gian. Các thông tin về biến động
dự kiến khác. Đầu ra dự kiến là các báo cáo hàng tháng được gửi đến quản lý
dự án.
- Qui trình xây dựng và thiết kế cấu hình phần cứng cho các thành phần của hệ
thống OpenStack. Đối với từng thành phần của OpenStack đều có những yêu
cầu về phần cứng đặc thù khác nhau. Tuy nhiên, do dự án phát triển đang rất
nhanh nên những thông số đó chỉ dừng lại ở mức tham khảo, đòi hỏi nhóm dự
án phải thực hiện kiểm thử rất kĩ lưỡng trên thực tế rất kĩ lưỡng để có thể đưa ra
một bộ tham số cấu hình phần cứng cụ thể. Điều này cần một qui trình cực kì kĩ
lưỡng từ kiểm thử thông số, tính toán kĩ thuật trước khi đưa một thành phần
phần cứng mới vào hệ thống.
- Qui trình lập kế hoạch về đầu tư mua sắm phần cứng mới dựa trên các báo cáo
về dự đoán phát triển tài nguyên, tính toán cấu hình tham số. Báo cáo về đầu tư
mua sắm được thực hiện định kì 3 tháng một lần nhằm bổ sung kịp thời tài
nguyên phần cứng cho nhu cầu phát triển của dự án.
41
Hình 11. Các qui trình về quản lý năng lực hệ thống.
3.1.2.4. Xây dựng và kiểm thử các giải pháp kĩ thuật có sẵn
Mặc dù OpenStack là một giải pháp mã nguồn mở tuy nhiên, trên thế giới hiện
nay có rất nhiều các bản đóng gói thương mại của OpenStack từ các hãng thứ ba. Các
bản phân phối này được các hãng xây dựng nhằm giải quyết một hoặc nhiều vấn đề mà
bản thân dự án OpenStack không giải quyết được hoặc chưa giải quyết trọn vẹn như
khả năng tính dễ cài đặt và sử dụng, tính sẵn sàng cao, giải pháp backup và phục hồi.
Tuy nhiên một nhược điểm rất lớn của các bản đóng gói này là tính đóng rất lớn, các
thành phần bên trong bị khóa cứng rất khó mở rộng khi cần hoặc bổ sung thêm các
thành phần bên ngoài. Hầu hết các bản thương mại sử dụng phiên bản OpenStack chậm
hơn phiên bản hiện tại từ 6-12 tháng. Ngoài ra là các bản đóng gói bị khóa cứng với
các phần cứng từ các hãng khác. Chính vì vậy rất khó về sau khi cần đầu tư mua sắm
phần cứng lớn hoặc cần nhiều tùy biến trong cấu hình phần cứng.
Khi thực hiện, nhóm dự án đã tiến hành thử nghiệm các giải pháp sau: IBM
SmartCloud, HP Helion, Ubuntu OpenStack, Redhat OpenStack và Cisco OpenStack.
Sau khi thử nghiệm và đánh giá, nhóm dự án đã quyết định sử dụng bản đóng gói từ
Redhat OpenStack (RDO) vì thỏa mãn các tiêu chí như tính dễ dùng, khả năng mở
rộng, độ ổn định, khả năng cập nhật và dễ dàng tích hợp với các thành phần khác.
Ngoài ra, có hai thành phần khác phải được đánh giá cực kì kĩ lưỡng đó là giải pháp về
lưu trữ và giải pháp về các thiết bị mạng phục vụ cho hệ thống OpenStack. Sau khi
đánh giá, nhóm dự án cũng đã quyết định sử giúp giải pháp Redhat Ceph cho hệ thống
lưu trữ thay vì sử dụng mô hình SAN storage truyền thống vì hai yếu tố giá cả và khả
năng dễ mở rộng. Còn về các thiết bị mạng thì nhóm đã quyết định sử dụng toàn bộ
các switch dòng thấp của hãng Cisco kết hợp với việc gộp nhiều card 1Gbps trên máy
42
chủ để tạo ra băng thông mạng lớn trên máy chủ. Các máy chủ có thể đáp ứng dung
lượng vào ra từ khoảng 6-8Gbps trên từng server. Đây là một giải pháp linh hoạt, rẻ
tiền và phù hợp với mô hình triển khai OpenStack trên thế giới.
3.1.2.5. Chuyển đổi hệ thống từ Cloud cũ sang hệ thống mới.
Sau khi lựa chọn xong được toàn bộ giải pháp kĩ thuật chính từ phần mềm cho
đến phần cứng và dựng được một hệ thống có khả năng đáp ứng được khoảng 300 máy
chủ ảo, với hệ thống lưu trữ có tổng dung lượng 6TB và và đường nối Internet ổn định,
nhóm dự án tiến hành chuyển đổi các máy chủ ảo từ hệ thống Cloud cũ sang hệ thống
mới.
Do hệ thống cloud cũ hoạt động trong thời gian dài, không có qui hoạch nên các
hệ thống với các chức năng khác nhau như đang chạy dịch vụ thật hoặc đang dùng để
phát triển phần mềm được đặt chung một chỗ và không có nhiều thông tin ghi nhận.
Chính vì vậy quá trình chuyển đổi được thực hiện thành 4 bước sau
- Bước 1: Tiến hành ghi nhận lại toàn bộ thông tin về việc sử dụng như người
quản lý, chức năng của máy chủ, thời gian cho phép gián đoạn của từng máy
chủ một. Đánh giá độ ưu tiên theo hai mức Cao, Trung bình và Thấp.
- Bước 2 Chuyển đổi một phần nhỏ các máy ảo có độ ưu tiên Thấp trong hệ
thống Cloud cũ sang hệ thống mới.
Số lượng dự kiến: 20 máy ảo
Mục đích: chuyển đổi nhằm xác nhận về mặt kĩ thuật các phương án chuyển đổi
đồng thời thử nghiệm tải hệ thống Cloud OpenStack mới.
- Bước 3: Chuyển đổi các máy ảo có độ ưu tiên Trung bình sang hệ thống
OpenStack sau khi hệ thống được nâng cấp phần cứng.
Số lượng dự kiến: 20-40 máy ảo
- Bước 4: Chuyển đổi nốt các máy ảo còn lại trong hệ thống Cloud cũ sang hệ
thống Cloud mới. Tách các máy ảo theo từng nhóm dự án tương ứng.
Hoàn tất việc chuyển đổi.
Quá trình chuyển đổi được thực hiện từ tháng 9/2014 và kết thúc vào trung tuần
tháng 12/2014.
3.1.2.6. Đưa hệ thống vào vận hành nội bộ. Hoàn thiện các bộ qui trình vận hành
Sau khi kết thúc việc chuyển đổi thì hệ thống mới cũng đã chứng minh được
một phần độ ổn định hoạt động của mình. Đội dự án tiếp tục bắt tay vào hoàn thiện các
thành phần hỗ trợ liên quan đến hệ thống chính như các hệ thống giám sát và cảnh báo
sự cố, các hệ thống quản lý thông tin xung quanh. Tại bước này, các vấn đề kĩ thuật
không còn là vấn đề chính nữa mà các vấn đề cần tập trung giải quyết tại bước này
chính lại là các vấn đề liên quan đến hướng dẫn sử dụng dịch vụ và hoàn thiện các qui
43
trình vận hành như quản lý sự kiện, quản lý sự cố, quản lý vấn đề, quản lý cấu hình hay
quản lý thay đổi,
Một trong những mảng công việc rất lớn cần giải quyết trong giai đoạn này đó
chính là hướng dẫn sử dụng cho người dùng mới tập làm quen với mô hình cung cấp
dịch vụ Hạ tầng như một dịch vụ thay vì cách làm việc truyền thống. Công việc này
không chỉ đơn giản là hướng dẫn sử dụng, làm quen với giao diện và cách thức tương
tác mới mà quan trọng hơn là tập cho người dùng cuối những tư duy và suy nghĩ thiết
kế, phát triển hệ thống theo mô hình điện toán đám mây: đó là đề cao sự phân tán, đề
cao khả năng chịu đựng lỗi, hoạt động liên tục, dễ dàng thay đổi thay vì những tư duy
vốn đã ăn sâu vào nếp nghĩ từ trước tới nay đó là mô hình kiến trúc tập trung và chú
trọng đến dư thừa để đảm bảo hiệu năng hoạt động. Bên cạnh đó, một vấn đề cũng cần
phải khắc phục đó là thói quen yêu cầu tài nguyên vượt quá nhu cầu thực sự vốn tồn
tại rất lâu trong tổ chức. Do khả năng tự phục vụ sử dụng theo nhu cầu, rất nhiều người
dùng luôn tạo ra các yêu cầu tài nguyên lớn không hợp lý. Người dùng cần được huấn
luyện để có thói quen sử dụng hợp lý và vừa đủ các nguồn tài nguyên trên cloud.
Chính vì vậy, trong giai đoạn này, qui trình duy nhất được xây dựng và áp dụng ngay
trong thực tế đó là qui trình đáp ứng yêu cầu của người dùng (Request fulfilment) như
yêu cầu kiểm tra máy ảo, tạo mới hay copy máy ảo, reset mật khẩu,
3.1.2.7. Cải tiến và mở rộng liên tục hệ thống để đáp ứng các nhu cầu mới của
dịch vụ.
Đây là bước tương ứng với quá trình cải tiến và hoàn thiện liên tục trong ITIL.
Trong đó các bài học, vấn đề và kinh nghiệm liên tục được đúc rút từ trong quá trình
vận hành được ghi nhận lại để liên tục cải tiến.
Không chỉ vậy, tại bước này nhóm dự án sẽ liên tục lắng nghe các phản hồi của
khách hàng về dịch vụ cũng như các mong muốn kì vọng của các bên thứ ba như đơn
vị kinh doanh, ban giám đốc công ty để liên tục cải tiến, mở rộng thêm các gói dịch vụ
cung cấp cũng như các triển khai các hệ thống hỗ trợ khác để có thể tiếp tục trưởng
thành trong việc cung cấp dịch vụ.
44
3.1.3. Kết quả đạt được
Trong gần một năm hoạt động, từ tháng 1/2014 tới nay dự án đang dừng lại ở
bước 6 trong kế hoạch 7 bước của mình. Dưới đây là một số kết quả dự án đã đạt được.
a. Xây dựng thành công hạ tầng kĩ thuật của dịch vụ trên nền tảng OpenStack
Hình 12. Kiến trúc hoạt động của Cloud sau khi triển khai
Hệ thống sau khi được xây dựng xong đã đạt năng lực phục vụ được khoảng
300-500 máy ảo, với năng lực phần cứng vào khoảng 1TB RAM và 300TB lưu trữ.
Kiến trúc đảm bảo tính sẵn sàng cao trên toàn hệ thống. Các thành phần của hệ thống
từ thiết bị mạng đến các máy chủ vật lý quản lý hệ thống đều được dựng lên theo cặp
đảm bảo tính sẵn sàng cao, hệ thống sẽ không gặp trục trặc hay gián đoạn dịch vụ ngay
cả khi có sự cố phần cứng xảy ra với một hoặc nhiều node khác nhau trong toàn bộ hệ
thống.
b. Hoạt động vận hành hiện tại
Sau khi triển khai và tiến hành chuyển đổi hệ thống mới đang phục vụ cho
khoảng 180 máy ảo (bao gồm cả mũ và mới). Có giao diện web thân thiện, cho phép
người dùng có thể tự truy cập tạo và cấp phát máy theo nhu cầu của mình.
Hiện tại quá trình chuyển đổi vẫn đang được tiến hành với các hệ thống dịch vụ đòi hỏi
thời gian gián đoạn thấp.
Bên cạnh việc phục vụ dịch vụ hạ tầng như một dịch vụ cho 4 đơn vị kĩ thuật
chính trong nội bộ Fpt Telecom, hiện tại hệ thống đang dần tiếp nhận các khách hàng
từ trong nội bộ tập đoàn Fpt đang có nhu cầu sử dụng tài nguyên tính toán trên cloud.
Một số dự án tiêu biểu của tập đoàn Fpt đã chuyển đổi thành công lên đám mây này.
45
Hình 13. Giao diện quản trị thông tin của Hệ thống Cloud nội bộ
c. Xây dựng được quá trình làm chiến lược dịch vụ
Qui trình làm chiến lược dịch vụ đã được xây dựng và chuẩn hóa toàn diện, tạo
tiền đề cho phép nhóm dự án tiếp xúc trao đổi và tiếp nhận thông tin trực tiếp không
chỉ chính khách hàng đang sử dụng dịch vụ mà còn từ các đơn vị kinh doanh để từ đó
có thể đề ra các chiến lược phát triển dịch vụ phù hợp với chiến lục chung của toàn
công ty và tập đoàn. Hàng tháng đều đặn nhóm dự án có một buổi báo cáo và trao đổi
tình hình với lãnh đạo kĩ thuật của công ty và lãnh đạo trung tâm.
d. Xây dựng được bộ qui trình quản lý năng lực (capacity management)
Quản lý năng lực là một thành phần cơ bản và cực kì quan trọng trong các dịch
vụ Cloud vì nó cho phép đơn vị cung cấp dự đoán và chuẩn bị sẵn tài nguyên một cách
phù hợp cho các bước phát triển trong tương lai của dịch vụ, giảm thiểu các rủi ro liên
quan đến hỏng hóc phần cứng hoặc tài nguyên bị quá tải do các tài nguyên được mua
về không kịp.
Nhóm dự án đã hoàn thành xong và áp dụng được 3 qui trình quản lý năng lực vào
trong thực tế công việc việc.
- Qui trình kiểm thử và tính toán phần cứng cho các thành phần của OpenStack.
Nhóm dự án đã xây dựng xong cho các thành cơ bản của OpenStack như cấu
hình cho một máy chủ trong hệ thống Nova, cấu hình phần cứng cho một máy
46
chủ trong hệ thống Ceph và cấu hình phần cứng cho máy chủ phục vụ cho dịch
vụ Neutron của OpenStack. Hiện tại nhóm đang hoàn thiện các thành phần còn
lại của hệ thống OpenStack như máy chủ Controller, các thiết bị mạng,
- Qui trình quản lý, tổng hợp và dự báo tài nguyên. Hiện tại qui trình này đang
được áp dụng định kì hàng tháng do qui mô của hệ thống còn đang ở mức khá
nhỏ. Hàng tuần đều có một báo cáo từ đội vận hành thông báo đầy đủ về tình
hình phần cứng đang có, các hỏng hóc thay thế, các dự đoán về tăng trưởng
trong tháng sắp tới.
- Qui trình lập kế hoạch đầu tư và muaa sắm phần cứng mới. Qui trình này đã
được áp dụng cho đợt mua sắm phần cứng bổ sung mới nhất vào tháng 11/2014
năm nay.
Hiện tại các qui trình đang được chạy thử nghiệm một cách trơn tru, một số các trục
trặc trong thực hiện chủ yếu là quá trình trao đổi thông tin đã được cập nhật và sửa đổi
hơn cho phù hợp với thực tế.
e. Hoàn thiện bộ qui trình về quản lý tính sẵn sàng của hệ thống
Trong qui trình về quản lý tính sẵn sàng của hệ thống, tất cả các qui trình đều
đã được áp dụng vào trong thực tế và cho hiệu quả tốt.
- Nhóm qui trình vận hành hàng ngày. Hệ thống giám sát và qui trình tương tác
giám sát khi xuất hiện cảnh báo đã được đưa vào thực hiện. Bộ tiêu chí giám sát
đã được xây dựng và tiếp tục bổ sung và được đưa vào giám sát trên thực tế
thông qua hệ thống giám sát cảnh báo của Munin và OpsWork. Các qui trình
liên quan đến phục hồi và tự phục hồi được kiểm tra định kì.
- Nhóm qui trình đánh giá tích cực: các qui trình như đánh giá rủi ro, đánh giá
giải pháp sẵn sàng cho các thành phần mới được đưa vào hệ thống đã được áp
dụng trên thực tế. Các thành phần chủ chốt như các node controller của hệ thống
OpenStack đã được đánh giá rủi ro và xây dựng giải pháp sẵn sàng cao ngay
trước khi hệ thống hoạt động chính thức.
47
Hình 14. Hệ thống giám sát được đưa vào hoạt động để quản lý tính sẵn sàng của hệ
thống
- Nhóm qui trình báo cáo. Kế hoạch sẵn sàng đã được xây dựng xong và bổ sung
cho các trường hợp một hoặc nhiều node xảy ra ra sự cố. Định kì sẽ có các báo
cáo tổng hợp về tính sẵn sàng của hệ thống từ hệ thống giám sát tự động hay
các đơn vị vận hành gửi đến cho các trưởng nhóm kĩ thuật vận hành và phát
triển cũng như quản lý dự án. Qui trình kiểm thử tính sẵn sàng đã được xây dựng
xong, tuy nhiên chưa được đưa vào thực hiện trên thực tế vì nhiều lý do khách
quan.
f. Hoàn thiện qui trình về đáp ứng yêu cầu của người dùng.
Hiện tại với tốc độ hàng ngày có từ 5-10 yêu cầu từ phía người dùng liên quan
đến các thay đổi trên hệ thống như kiểm tra dịch vụ, thay đổi mật khẩu, tạo mới hoặc
xóa sửa máy ảo, nhóm dự án đã xây dựng xong một qui trình liên quan đến đáp ứng
nhu cầu của khách hàng và một hệ thống quản lý ticket phục vụ cho việc theo dõi và
trả lời các yêu cầu một cách dễ dàng hơn. Hiện tại qui trình đáp ứng nhu cầu của khách
hàng đang bao phủ ở hai phần chính đó là yêu cầu cấp phát và tạo mới tài nguyên như
máy ảo, dự án. Các yêu cầu cấp phát này cần được sự phê duyệt của các cấp quản lý
thích hợp trước khi yêu cầu được thực hiện. Nhóm yêu cầu thứ hai là các yêu cầu nhỏ
của người dùng dịch vụ đang sẵn có. Tất cả các yêu cầu của hai nhóm dịch vụ này đều
được ghi nhận và trả lời trên hệ thống ticket system.
48
3.1.4. Các công việc cần được hoàn thiện trong tương lai
So với kế hoạch được đề ra thì hiện tại dự án đang gần cán đích đầu tiên và dừng
lại ở bước thứ 6 trong kế hoạch phát triển. Tại bước này, mục tiêu lớn nhất của nhóm
dự án là định hình được hoạt động dịch vụ đám mây nội bộ trong một tổ chức liên tục
phát triển và mở rộng như Fpt Telecom. Bên cạnh hoàn thiện các công việc kĩ thuật
còn dang dở, nhóm dự án sẽ tiếp tục phân tích bộ qui trình ITIL để có thể tiếp tục bổ
sung các bộ qui trình còn thiếu đặc biệt là các bộ qui trình liên quan đến cam kết chất
lượng dịch vụ (SLA), dịch vụ như quản lý sự kiện, quản lý yêu cầu, quản lý thay đổi,
quản lý các sự cố, quản lý hỗ trợ hay một mảng lớn công việc là quản lý an toàn, an
ninh thông tin đặc biệt là trong hoàn cảnh vấn đề bảo mật đang nóng hơn bao giờ hết.
Bên cạnh việc hoàn thiện các bộ qui trình, nhóm dự án sẽ tiếp tục phát triển các
giải pháp kĩ thuật bổ sung cho hệ thống OpenStack để đảm bảo hệ thống được đầy đủ
các tính năng, dễ dàng sử dụng và thân thiện với người dùng cuối.
49
KẾT LUẬN
Dưới sự hướng dẫn của TS. Đỗ Đức Đông tôi đã hoàn thiện được phương pháp
luận để áp dụng các hướng dẫn của bộ công cụ ITIL vào trong quản lý một dịch vụ
Công nghệ thông tin cụ thể như dịch vụ Đám mây nội bộ trong một doanh nghiệp và
tổ chức tại Việt Nam nhằm giải quyết một số các vấn đề không tương thích giữa ITIL
và các dịch vụ điện toán đám mây luôn luôn thay đổi. Cũng rất may mắn là tôi được
công ty cổ phần viễn thông Fpt Telecom tạo điều kiện tham gia dự án triển khai hệ
thống OpenStack phục vụ cho dịch vụ Đám mây nội bộ của doan nghiệp để có thể áp
dụng được những nghiên cứu của mình vào thực tế, nhằm cải thiện được chất lượng
dịch vụ của một trong những dịch vụ mới mẻ và nhiều tiềm năng như IaaS.
Trong suốt quá trình thực hiện nghiên cứu và áp dụng và trong thực tế khóa luận
đã đạt được một số kết quả nhất định như xây dựng một cách bài bản và có chiến lược
xuyên suốt một dịch vụ Đám mây nội bộ cơ bản; xây dựng thành công hệ thống
OpenStack và đưa vào sử dụng trên thực tế, đảm bảo các tiêu chí về mặt kĩ thuật như
dễ sử dụng, ổn định, có tính sẵn sàng cao; chuyển đổi thành công từ sử dụng hệ thống
Cloud cũ sang hệ thống Cloud mới; cung cấp được dịch vụ cho hầu hết các dịch vụ mới
không chỉ dừng lại trong nội bộ công ty Fpt Telecom mà bắt đầu cung cấp dịch vụ cho
một số các đơn vị nội bộ khác trong tập đoàn Fpt; xây dựng được một bộ các qui trình
liên quan đến các quá trình như quản lý tính sẵn sàng của hệ thống, quản lý năng lực
của toàn bộ hệ thống và quản lý các yêu cầu từ người dùng và các đơn vị trong hệ
thống; đồng thời bắt đầu áp dụng được các qui trình đó vào trong các hoạt động định
kì trên thực tế.
Tuy nhiên, bản thân các bài toán riêng lẻ như triển khai đám mây nội bộ sử dụng
công nghệ OpenStack, ứng dụng Điện toán đám mây vào trong hoạt động của doanh
nghiệp hay áp dụng các hướng dẫn của bộ công cụ ITIL vào trong phát triển và vận
hành dịch vụ đều là những bài toán lớn và phức tạp. Bài toán triển khai đám mây nội
bộ phải giải quyết các vấn đề liên quan đến những công nghệ còn rất mới và phức tạp
như OpenStack, bài toán ứng dụng đám mây nội bộ vào trong doanh nghiệp đòi hỏi
phải thay đổi tư duy thiết kế và sử dụng dịch vụ từ mô hình truyền thống sang mô hình
mới. Bài toán triển khai ITIL lại rất phức tạp vì bản thân ITIL là một bộ công cụ rất
lớn và chi tiết nên để có thể áp dụng trọng vẹn vào trong thực tế một doanh nghiệp đòi
hỏi rất nhiều thời gian. Chưa kể đến các yếu tố về kinh nghiệm triển khai ITIL, thay
đổi tư duy của cả người dùng lẫn người vận hành về mô hình hoạt động mới, dịch vụ
mới. Trên thực thế, rất nhiều doanh nghiệp khi muốn áp dụng ITIL đã phải bỏ rất nhiều
tiền để thuê chuyên gia và tư vấn nhưng kết quả đạt được cũng không được như mong
50
đợi. Chính vì những yếu tố đó mà khóa luận này cũng mới chỉ cố gắng giải quyết được
một phần của những vấn đề trên trong một bài toán cụ thể. Đồng thời cũng khóa luận
cũng tạo ra một nền tảng về phương pháp luận vững chắc giúp cho tôi có thể ứng dụng
trọn vẹn bộ công cụ ITIL vào trong công việc quản lý các dịch vụ đám mây trong tương
lai./.
51
TÀI LIỆU THAM KHẢO
1. Microsoft Solution Accelerators, 2013. Service Management for Private Cloud.
2. OpenStack Foundation, 2014. Openstack Operations guide.
3. OpenStack Foundation, 2014. Openstack Design guide.
4. Best Management Practices, 2011. Introduction to ITIL lifecycle. The Stationery
Office. ISBN 9780113313099.
5. National Institute of Standards and Technology, 2011. NIST Definition of Cloud
Computing, SP800-145.
6. Bộ thông tin truyền thông, 2012. Dự thảo Nghị định về dịch vụ Công nghệ thông tin.
7. Best Management Practices, 2007. ITIL V3 Glossary of Terms and Acronyms
v3.1.24.
8. IT Service Management Forum (2002). van Bon, J., ed. IT Service Management: An
Introduction. Van Haren Publishing. ISBN 90-806713-4-7
9. IBM.com, 2014. IBM Tivoli Unified Process.
10. Microsoft.com, 2014. Microsoft Operations Framework.
11. Axelos.com, 2014. Best practice in the cloud: an introduction.
12. Axelos.com, 2014. Using ITIL to seize the opportinuties of the cloud – and rise to
its challenges.
13. Lê Thành Trung, VNG, 2014. ITIL in Practice.
14. Microsoft Solution Accelerators, 2014. MOF and Private Cloud.
15. Best Management Practices, 2012. ITIL Foundation Handbook. The Stationery
Office. ISBN 9780113313495
Các file đính kèm theo tài liệu này:
- nghien_cuu_va_ung_dung_itil_cho_quan_ly_dich_vu_dam_may_noi_bo_trong_doanh_nghiep_2143.pdf