Kiến trúc mạng nơ ron nhân tạo bao gồm ba lớp I(6)-HL(4)-O(1); Lớp
đầu vào I(6) bao gồm sáu nơ ron là các tham số O1, O11, C3, C4, C6 và
C7; Nơ ron lớp đầu ra O(1) là hoạt tính sinh học pGI50; Lớp ẩn HL(4)
bao gồm bốn nơ ron. Mạng thần kinh đa lớp sử dụng thuật toán lan
truyền ngược để luyện mạng. Hàm truyền sigmoid trên mỗi nút của
mạng; Các thông số mạng thần kinh bao gồm tỷ lệ luyện 0,7 và tốc độ
học 0,7; sai số MSE = 0,000816 với 10,000 vòng lặp. Sau khi luyện
mạng thần kinh, giá trị R2 là 0,993 và R2pred là 0,971 trong khi đối với
mô hình QSARMLR (3.19), giá trị R2 là 0,938 và R2pred là 0,903.
                
              
                                            
                                
            
 
            
                 28 trang
28 trang | 
Chia sẻ: anhthuong12 | Lượt xem: 1186 | Lượt tải: 0 
              
            Bạn đang xem trước 20 trang tài liệu Luận án Thiết kế, sàng lọc một số dẫn xuất flavonoid và đánh giá hoạt tính gây độc lên dòng tế bào hela dựa vào các tính toán hóa lượng tử, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
ĐẠI HỌC HUẾ 
TRƯỜNG ĐẠI HỌC KHOA HỌC 
BÙI THỊ PHƯƠNG THÚY 
THIẾT KẾ, SÀNG LỌC MỘT SỐ DẪN XUẤT FLAVONOID VÀ 
ĐÁNH GIÁ HOẠT TÍNH GÂY ĐỘC LÊN DÒNG TẾ BÀO HELA 
DỰA VÀO CÁC TÍNH TOÁN HÓA LƯỢNG TỬ 
Chuyên ngành: Hóa lý thuyết và hóa lý 
Mã số: 62.44.01.19 
TÓM TẮT LUẬN ÁN TIẾN SĨ HÓA LÝ THUYẾT VÀ HÓA LÝ 
HUẾ, NĂM 2018 
Công trình được hoàn thành tại Khoa Hóa học, trường Đại học Khoa 
học, Đại học Huế. 
Người hướng dẫn khoa học: 1. PGS.TS. PHẠM VĂN TẤT 
 2. PGS.TS. TRẦN DƯƠNG 
Phản biện 1: 
Phản biện 2: 
Phản biện 3: 
Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Huế chấm luận án 
tiến sĩ họp tại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 
vào hồi giờ ngày tháng năm 
Có thể tìm hiểu luận án tại thư viện: ..................................
1 
MỞ ĐẦU 
Các phương pháp phòng và trị bệnh ung thư hiện nay như phẫu thuật, 
xạ trị, hóa trị. Tuy nhiên các phương pháp này vẫn có những tác dụng 
phụ nhất định đối với bệnh nhân. Nhu cầu về dược chất kháng ung thư 
có khả năng phòng và trị bệnh đang rất lớn nhưng khả năng đáp ứng 
còn hạn chế. Các nhà khoa học, dược học đã và đang quan tâm nghiên 
cứu, tìm kiếm các loại dược chất mới. Trong đó nhóm flavonoid nói 
chung flavone, isoflavone nói riêng là nhóm dược chất có nhiều trong 
thực vật với hoạt tính kháng oxi hóa, kháng ung thư, kháng viêm,  
hiệu quả. Các nghiên cứu thực nghiệm trên thế giới và Việt Nam đã 
cung cấp một cơ sở dữ liệu quý giá về nguồn dược chất trong tự nhiên, 
nhưng các nghiên cứu thực nghiệm thuần túy còn nhiều hạn chế để tạo 
ra hợp chất có hoạt tính kháng ung thư hiệu quả, nhanh chóng, kinh tế. 
Các nghiên cứu lý thuyết trên thế giới nói chung, trong nước nói riêng 
về nhóm flavone và isoflavone có hoạt tính kháng ung thư cổ tử cung 
còn khá khiêm tốn. Nghiên cứu mối quan hệ cấu trúc – hoạt tính nhằm 
thiết kế các dẫn xuất flavone, isoflavone mới có hoạt tính được cải 
thiện; các nghiên cứu lý thuyết là rất cần thiết để thúc đẩy và làm tiền 
đề cho các nghiên cứu thực nghiệm, nhằm tìm kiếm các dược chất 
kháng ung thư hiệu quả. 
Trong nghiên cứu này, chúng tôi sử dụng các thông tin mô tả cấu trúc 
điện tích nguyên tử, độ dịch chuyển hóa học, tính chất hóa lý, tham số 
2D và 3D của phân tử kết hợp các kỹ thuật phân tích hồi quy, mạng nơ 
ron, phân tích thành phần chính, giải thuật di truyền, bình phương cực 
tiểu riêng phần để xây dựng các mối quan hệ định lượng cấu trúc - hoạt 
tính (QSAR). Các flavonoid được xây dựng và tối ưu hóa bằng các 
phương pháp cơ học phân tử MM+. Các tham số mô tả phân tử 2D, 3D 
được sử dụng để xây dựng các mô hình đa biến như hồi quy tuyến tính 
đa biến (MLR), phân tích thành phần chính (PCR), bình phương cực 
tiểu riêng phần (PLS) và mạng nơ ron nhân tạo (ANN). Xây dựng các 
mô hình QSAR nhằm xác định những yếu tố tham số mô tả phân tử ảnh 
hưởng đến tác dụng kháng ung thư cổ tử cung từ đó xác định hướng 
thiết kế phân tử mang lại hoạt tính cao hơn. Trong nghiên này cũng đã 
tiến hành chiết tách và phân lập flavonoid từ gừng gió, đậu nành, tía tô, 
xa kê, actiso, một vài kỹ thuật phân tích hóa lý cũng được sử dụng để 
xác định cấu trúc phân tử các dẫn xuất flavonoid. Các phân tử flavonoid 
đã phân lập sẽ được dự báo hoạt tính, và sử dụng làm chất mẫu để thiết 
kế hợp chất mới có hoạt tính cao hơn. 
2 
Từ các cơ sở trên, chúng tôi nghiên cứu đề tài “Thiết kế, sàng lọc một 
số dẫn xuất flavonoid và đánh giá hoạt tính gây độc lên dòng tế bào 
Hela dựa vào các tính toán hóa lượng tử”. 
Mục tiêu của luận án: Tính toán các tham số cấu trúc phân tử; Xây 
dựng các mô hình QSAR; Phân lập và tinh chế một số flavonoid; Dự 
đoán tính sinh học của các hợp chất mới. 
Ý nghĩa khoa học của luận án: 
Việc mô phỏng kết hợp giữa phương pháp lý thuyết với phương pháp 
thực nghiệm trong nghiên cứu tìm kiếm hợp chất có hoạt tính kháng 
ung thư có nguồn gốc thiên nhiên là một hướng nghiên cứu đáng chú ý 
đang được quan tâm và phát triển mạnh mẽ trong thời gian gần đây. 
Phương pháp tiếp cận hiện đại, khoa học, mang lại hiệu quả về thời 
gian, công sức, tiền bạc trong nghiên cứu thực nghiệm. Kết quả nghiên 
cứu đáng tin cậy và có nhiều ứng dụng quan trọng cho các nghiên cứu 
lý thuyết cũng như nghiên cứu thực nghiệm. 
Đóng góp mới: 
Công trình này, chúng tôi đã xác định được cấu trúc và thử hoạt tính 
pGI50 in vitro đối với 6 hợp chất flavonoid phân lập từ lá tía tô, lá xa kê, 
lá actiso, hạt đậu nành và củ gừng gió. Đã tính toán và sàng lọc được 
các tham số mô tả cấu trúc phân tử như tham số điện tích, tham số độ 
dịch chuyển hóa học, tham số 2D, 3D ảnh hưởng chính đến hoạt tính 
kháng ung thư của các dẫn xuất flavonoid. Đã xây dựng thành công các 
mô hình QSAR. Đã dự đoán hoạt tính kháng ung thư và tính chất hóa lý 
của các hợp chất mới được thiết kế từ các chất mẫu và hợp chất tự 
nhiên. Hoạt tính kháng ung thư của các hợp chất mới tốt hơn hoạt tính 
kháng ung thư của chất mẫu, hợp chất phân lập từ gừng gió, đậu nành, 
tía tô, xa kê, actiso. 
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU 
Phần tổng quan giới thiệu về bệnh ung thư cổ tử cung, các hợp chất 
flavonoid, mối liên hệ giữa cấu trúc và hoạt tính, tính toán các tham số 
cấu trúc, các mô hình QSAR, các dẫn xuất flavonoid, phân lập và tinh 
chế flavonoid, ứng dụng hóa học tính toán lượng tử trong nghiên cứa 
các dẫn xuất flavonoid. 
CHƯƠNG 2. NỘI DUNG & PHƯƠNG PHÁP NGHIÊN CỨU 
2.1. SƠ ĐỒ NGHIÊN CỨU 
2.2. CƠ SỞ DỮ LIỆU, NGUYÊN LIỆU VÀ PHƯƠNG PHÁP 
2.2.1. Xây dựng cơ sở dữ liệu thông tin phân tử 
3 
2.2.2. Nguyên liệu và phương pháp 
2.2.2.1. Phần mềm ứng dụng 
2.2.2.2. Hóa chất, thiết bị 
2.2.2.3. Nguyên liệu 
2.3. NGHIÊN CỨU LÝ THUYẾT 
2.3.1. Phương pháp tính toán thông tin cấu trúc 
2.3.1.1. Cơ học phân tử 
2.3.1.2. Hóa lượng tử 
2.3.1.3. Các tham số cấu trúc 
2.3.2. Xây dựng các mô hình QSAR 
2.4. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN 
2.4.1. Phân lập các hợp chất flavonoid 
2.4.2. Xác định cấu trúc hóa học các hợp chất flavonoid 
2.4.2.1. Phương pháp phổ cộng hưởng từ hạt nhân 
2.4.2.2. Đo nhiễu xạ tia X đơn tinh thể 
2.4.3. Kỹ thuật thử hoạt tính in vitro 
2.4.3.1. Nguyên tắc phương pháp Sulforhodamine B 
2.4.3.2. Nuôi cấy tế bào 
2.4.3.3. Nhuộm SRB 
2.4.3.4. Xử lý kết quả 
2.4.3.5. Xác định GI50 
2.5. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH CỦA FLAVONOID 
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN 
3.1. NGHIÊN CỨU LÝ THUYẾT 
3.1.1. Phương pháp tính toán thông tin cấu trúc 
3.1.1.1. Cơ học phân tử 
3.1.1.2. Hóa lượng tử 
3.1.2. Tham số cấu trúc 
3.1.2.1. Tham số điện tích 
3.1.2.2. Phổ 13C-NMR, 15O-NMR và độ dịch chuyển hóa học 
3.1.2.3. Tham số hóa lý 
3.1.2.4. Tham số hình học 2D, 3D 
3.2. XÂY DỰNG MÔ HÌNH QSAR 
3.2.1. Khảo sát các biến số mô hình 
3.2.2. Xây dựng các mô hình QESAR 
3.2.2.1. Mô hình tuyến tính QESARMLR 
Quan hệ định lượng cấu trúc điện tử - họa tính (QESAR) của 26 dẫn 
xuất flavone và isoflavone với hoạt tính kháng ung thư được xây dựng 
4 
bằng kỹ thuật phân tích hồi quy đa biến sử dụng các thuật toán chọn lựa 
biến. Năm tham số mô tả điện tích của các nguyên tử O1, O11, C3, C4, C6 
và C7 được chọn lựa sử dụng kỹ thuật thêm dần và loại bỏ dần từng 
tường hợp để xây dựng mô hình QESARNMR. Mô hình QESARMLR tốt 
nhất với 6 biến số có các giá trị hồi quy gồm R2train = 0,9382, R2adj = 
0,9186, SE = 0,0887, R2pred = 0,9030 và MARE,% = 1,7510%. Mô hình 
QESARlinear được đánh giá bằng kỹ thuật đánh giá chéo. Mô hình 
QESARMLR với k = 6 
pGI50 = 6,7116 – 42,3105O1 – 8,1592O11 + +3,0139C3 – 19,0370C4 + 
6,6117C6 + 4,6038C7 (3.2) 
Bảng 3.9 Các mô hình tuyến tính QESARMLR và giá trị thống kê 
k Nguyên tử trong các mô hình R2train SE R2test 
2 O1, C7 0,816 0,1390 0,765 
3 O1, C4, C6 0,860 0,1240 0,800 
4 O1, C2, C4, C5 0,901 0,1070 0,829 
5 O1, C2, C4, C5, C3' 0,924 0,0957 0,873 
6 O1, O11, C3, C4, C6, C7 0,938 0,0887 0,903 
7 O11, C4, C6, C8, C9, C2', C6' 0,906 0,0743 0,714 
8 O11, C3, C6, C7, C8, C9, C10, C3' 0,970 0,0653 0,696 
9 O1, O11, C3, C4, C6, C7, C8, C9, C10 0,978 0,0574 0,563 
10 O1, O11, C3, C6, C7, C8, C9, C2', C3', C6' 0,978 0,0595 0,358 
Hình 3.4 Giá trị đóng góp trung bình toàn cục GMPmxk 
3.2.2.2. Mô hình mạng thần kinh QESARANN 
Mô hình QESARANN có kiến trúc mạng I(6)-HL(2)-O(1) với R2fitness là 
0.95642 được xây dựng từ các tham số điện tích từ mô hình 
QESARANN. 
3.2.2.3. Kiểm tra khả năng dự đoán 
Hoạt tính kháng ưng thư của flavone và isoflavone dự đoán từ mô hình 
QESARNMR và QESARANN với giá trị MARE, % tương ứng là 1,7510% 
và 1,1670%, Bảng 3.12. 
5 
Bảng 3.12 pGI50 của nhóm kiểm tra dự đoán từ mô hình QESARMLR, 
QESA RANN 
Hợp chất pGI50,exp 
pGI50,tt ARE,% 
QESARMLR QESARANN QESARMLR QESARMLR 
1b 5,921 6,008 5,891 1,468 0,513 
2b 5,745 5,692 5,743 0,930 0,033 
3b 6,097 5,759 5,788 5,549 5,068 
4b 5,699 5,651 5,712 0,840 0,221 
5b 5,699 5,651 5,735 0,835 0,623 
6b 5,137 5,092 5,109 0,883 0,543 
 MARE,% 1,751 1,167 
3.2.3. Xây dựng các mô hình QSDAR 
3.2.3.1. Mô hình tuyến tính QSDARMLR 
Bảng 3.13 Các mô hình QSDAR và các giá trị thống kê 
k Nguyên tử trong các mô hình R2luyện R2adj SE R2thử 
2 O1, C4 0,327 0,268 0,287 0,036 
3 O1, C4, C11 0,484 0,413 0,257 0,204 
4 O1, C4, C5, C6 0,636 0,566 0,221 0,38 
5 O1, O11, C4, C6, C7 0,802 0,752 0,167 0,631 
6 O1, O11, C3, C4, C6, C7 0,861 0,817 0,143 0,673 
7 O1, O11, C2, C3, C6, C7, C2’ 0,906 0,869 0,121 0,800 
8 O1, O11, C2, C3, C4, C5, C6, C7 0,909 0,867 0,122 0,713 
9 O1, O11, C2, C3, C4, C5, C6, C7, C2’ 0,921 0,877 0,118 0,678 
10 O1, O11, C2, C3, C4, C5, C6, C7, C1’,C2’ 0,921 0,869 0,121 0,641 
Mô hình QSDARMLR được thành lập bằng cách thay đổi độ dịch chuyển 
hóa họci của oxy và cac bon. 
Chọn lựa độ dịch chuyển hóa họci bằng thuật toán thêm dần và loại bỏ 
dần từng trường hợp kết hợp với thuật toán di truyền (GA). 
Quá trình mô hình hóa được thực hiện bằng cách theo dõi các giá trị 
thống kê SE, R2adj, R2test và F-stat với mức độ tin cậy α là 0,05. Tất cả 
các mô hình QSDARMLR được đánh giá bằng kỹ thuật đánh giá chéo 
loại bỏ dần từng trường hợp. Các mô hình QSDARMLR tốt nhất với k = 
5, 6, 7 cho ở bảng Bảng 3.14. Giá trị R2fitness và SE của các mô hình 
QSDARMLR (với số biến số k từ 2 đến 9) cho ở Bảng 3.13. 
Mô hình QSDARMLR tốt nhất (với k bằng 7) với các biến số i của các 
nguyên tố O1, O11, C2, C3, C6, C7 và C2’ với các giá trị R2fitness là 0,9057 
và sai số SE là 0.1213 QSDARMLR. Các nguyên tử này cũng đóng góp 
quan trọng nhất đối với các hoạt tính kháng ung thư của các chất dẫn 
xuất flavone và isoflavone. 
6 
Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ 
dịch chuyển hóa học i trong các mô hình QSDARMLR 
Biến số xi 
QSDARMLR MPxk,% 
GMPmxi,% 
m = 5 m = 6 m = 7 m = 5 m = 6 m = 7 
R2luyện 0,802 0,861 0,906 - - - - 
R2adj 0,752 0,817 0,869 - - - - 
SE 0,167 0,143 0,121 - - - - 
R2thử 0,631 0,673 0,800 - - - - 
Hằng số 14,459 37,055 32,99 - - - - 
O1 0 0,014 0,016 0,133 7,649 9,949 5,91 
O11 0,004 0,008 0,006 18,599 11,386 9,501 13,162 
C2 - - -0,045 - - 16,448 5,483 
C3 - -0,058 -0,063 - 14,348 17,603 10,65 
C4 -0,068 -0,078 - 71,64 27,471 - 33,037 
C6 0,006 -0,059 -0,047 5,169 16,424 14,965 12,186 
C7 -0,005 -0,075 -0,059 4,46 22,722 20,312 15,832 
C2' - - -0,037 - - 11,222 3,741 
Ba mô hình QSDARMLR (với k từ 5 đến 7) là các nguyên tử O1, O11, C2, 
C3, C4, C6, C7 và C2’ trong Bảng 3.14 được chọn để tính toán tỷ lệ phần 
trăm đóng góp của các nguyên từ đối với hoạt tính kháng ung thư. 
Các giá trị phần trăm đóng góp MPmxk,%, và GMPmxk%, cũng như các 
giá trị thống kê trong mô hình QSDARMLR (với k từ 5 đến 7) cũng được 
chỉ ra trong Bảng 3.14. Các giá trị độ dịch chuyển hóa học của cac bon 
à oxy trong phân tử flavone và isoflavone sắp xếp theo giá trị 
GMPmxk,% as C4 > C7 > O11 > C6 > C3 > O1 > C2 > C2’. Các vị trị O1, C2, 
C3 và C4 là các vị trí quan trọng trong khung phân tử. Bởi vì đây là các 
oxy và cac bon của nhóm cacbonyl C4 = O11 và O1 với cặp electron tự 
do. Trong trườn hợp này electron  của liên kết C2 = C3 và C4 = O11 tạo 
thành hệ liên hợp. Nhóm cacbonyl C4 = O11 thực hiện các phản ứng oxy 
hóa khử. Nghiên cứu này phù hợp với các nghiên cứu thực nghiệm. 
Hơn nữa, các vị trí C6, C7 và C3 cũng cho thấy rằng các vị trí quan trọng 
đã khảo sát và nghiên cứu bằng các nhóm thế gắn vào các nguyên tử C3, 
C6 và C7 để thiết kế các dẫn xuất mới. Như vậy, để thiết các các dẫn 
xuất mới với hoạt tính pGI50 cao bằng cách gắn các nhóm thế mới vào 
các vị trí C3, C6 và C7 trong phân tử flavone và isoflavone. 
3.2.3.2. Mô hình mạng thần kinh QSDARANN 
Mô hình mạng thần kinh QSDARANN được xây dựng bằng mạng thần 
kinh trên phần mềm INForm đã được khảo sát kiến trúc mạng. Kiến 
trúc I(7)-HL(2)-O(1) bao gồm lớp nhập I(7) với yếu tố đầu vào đã được 
chọn là O1, O11, C2, C3, C6, C7 và C2’ là các biến số trong mô hình tuyến 
7 
tính QSDARMLR với k = 7 và một lớp xuất O(1) với yếu tố đầu ra 
(pGI50) như là biến mục tiêu, cấu trúc một lớp ẩn HL(2) với hai nút. 
Giải thuật lan truyền ngược, sai số 0,001 được sử dụng để luyện kiểu 
mạng thần kinh này. Các tham số để luyện mạng nơ ron là tốc độ học 
0,7; momen = 0,7; vòng lặp 10000 và sai số MSE = 0,0305764. Hàm 
truyền sigmoid được sử dụng cho mỗi nơ ron của lớp nhập và lớp xuất. 
Sau khi luyện mô hình thần kinh QSDARANN, R2thử = 0,800; giá trị 
R2luyện đạt được 0,924 cao hơn giá trị R2luyện = 0,906 đối với mô hình 
tuyến tính QSDARMLR. 
3.2.3.3. Kiểm tra khả năng dự đoán 
Bảng 3.15 Hoạt tính pGI50,tt của các dẫn xuất kiểm tra và các giá trị 
ARE,% từ các mô hình QSDARMLR (với k = 7) và QSDARANN với kiến 
trúc I(7)-HL(2)-O(1) 
Hợp chất pGI50tn pGI50,tt ARE,% 
 QSADRMLR QSDARANN QSDARMLR QSDARANN 
a1 5,745 5,781 5,789 0,636 0,764 
a2 5,699 5,758 5,796 1,039 1,697 
a3 5,796 5,808 5,708 0,209 1,515 
a4 5,921 6,181 5,957 4,389 0,606 
a5 5,699 5,394 5,755 5,344 0,975 
a6 5,658 5,503 5,723 2,730 1,157 
MARE,% 2,391 1,119 
Sau khi sử dụng các mô hình QSDARMLR và QSDARANN để dự đoán 
hoạt tính kháng ung thư của các dẫn xuất kiểm tra, độ lệch khoảng dự 
đoán là có thể chấp nhận. Các mô hình QSDARMLR và QSDARANN thỏa 
mãn các đòi hỏi thực tế để dự đoán hoạt tính kháng ung thư pGI50 của 
các dẫn xuất mới. Một lần nữa chúng tôi khẳng định khả năng dự đoán 
của các mô hình quan hệ cấu trúc hoạt tính là đáng tin cậy. 
3.2.4. Xây dựng mô hình QSSRMLR 
3.2.4.1. Nguyên tắc xây dựng 
3.2.4.2. Tính toán các tham số hóa lý 
3.2.4.3. Xây dựng mô hình 
Mô hình tuyến tính QSSRMLR cũng được nghiên cứu, phát triển từ các 
kỹ thuật hồi quy tuyến tính. Mô hình quan hệ cấu trúc - cấu trúc 
(QSSR) là mối quan hệ giữa những hợp chất (y) và các hợp chất có cấu 
trúc tương tự (x). Các mô hình QSSRMLR được xây dựng bằng phương 
pháp hồi quy tuyến tính. Kỹ thuật hồi quy đa biến tuyến tính được sử 
dụng để xây dựng mối quan hệ tuyến tính giữa các hợp chất có cấu trúc 
tương tự. Những mối quan hệ tuyến tính này được xây dựng bằng cách 
8 
sử dụng các bộ mô tả điện tích nguyên tử của các chất dự đoán và các 
chất mục tiêu. Tất cả các bộ mô tả điện tích nguyên tử bao gồm các 
nguyên tử tính O1, C2, C3, C4, C5, C6, C7, C8, C9, C10, O11, C1', C2', C3', 
C4', C5', C6'. Các mô hình tuyến tính QSSRMLR với các giá trị thống kê 
rất tốt R2luyện = 0,999 và R2thử = 0,999: 
Fla-A1 = 0,00015+1,018 (Fla-A5)-0,513 (Fla-A21)+0,497 (Fla-A22) 
Fla-A2 = -0,00020+1,260 (Fla-A6) + 0,871 (Fla-A14)-1,134 (Fla-A24) 
Fla-A3 = 0,00002+0,935 (Fla-A7) + 0,582 (Fla-A16) -0,517 (Fla-A28) 
isoFla-A4=-0,000002+0,980(isoFla-A8)-0,233(isoFla-A18)+0,252(isoFla-
A19) 
Fla-A5 = -0,00015+0,982 (Fla-A1) +0,499 (Fla-A21) -0,483 (Fla-A22) 
Fla-A6 =0,00019+0,682 (Fla-A2)-0,587 (Fla-A14)+0,907 (Fla-A24) 
Fla-A7 = -0,00003+1,037 (Fla-A3)+-0,041 (Fla-A16)+0,004 (Fla-A27) 
isoFla-A8=0,0000051+1,006(isoFla-A4)+0,253(isoFla-A18)-
0,259(isoFla-A19) 
Fla-A9 = 0,000004+0,047 (Fla-A5) +1,025 (Fla-A11) -0,072 (Fla-A23) 
Fla-A10 = 0,00012+0,977 (Fla-A9) -1,055 (Fla-A21) +1,079 (Fla-A22) 
3.2.4.4. Kiểm tra khả năng dự đoán 
 Mô hình hồi quy tuyến tính nhận được 
từ các dẫn xuất flavone và isoflavone 
này có thể ứng dụng để dự đoán tính 
chất hóa lý cũng như hoạt tính kháng 
ung thư của các flavone và isoflavone có 
cấu trúc tương tự. Phân tích ANOVA 
một yếu tố cũng chỉ ra rằng kết quả dự 
đoán tính chất hóa lý và hoạt tính kháng 
ung thư của các dẫn xuất flavone và 
isoflavone từ mô hình 
 Hình 3.6. Quan hệ giữa 
tính chất hóa lý dự đoán 
và dữ liệu thực nghiệm 
QSSRMLR thì không khác các giá trị tính chất hóa lý tham khảo, giá trị 
hoạt tính kháng ung thư xác định từ thực nghiệm với (Ftt = 0,0010 < 
F0,05 = 3,9423). 
3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1) 
3.2.5.1. Dữ liệu 
3.2.5.2. Xây dựng mô hình QSARMLR (3.16) 
9 
Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, 
R2pred và MSE 
k Tham số mô tả phân tử 2D, 3D trong các mô hình MSE R² R²pred 
2 xvc3, Dipole 0,063 0,657 0,630 
3 xvp3, xvpc4, Dipole 0,034 0,820 0,798 
4 xvp6, xvpc4, Dipole, LogP 0,027 0,866 0,843 
5 xp8, Dipole, Volume, knotpv, LogP 0,023 0,891 0,867 
6 xp8, xvp8, Dipole, knotpv, SHBa, LogP 0,019 0,914 0,890 
7 xp8, xvp8, Dipole, Hmaxpos, knotpv, SHBa, LogP 0,015 0,933 0,910 
8 xp6, SaaCH, k2, nvx, knotp, knotpv, SHBa, LogP 0,015 0,936 0,909 
9 xp8, ABSQ, SsOH, Hmaxpos, phia, knotp, knotpv, SHBa, LogP 0,012 0,955 0,932 
10 xp8, ABSQ, SsOH, Hmaxpos, nvx, phia, knotp, knotpv, SHBa, LogP 0,012 0,955 0,928 
 Bảng 3.19. Các giá trị thống kê và giá trị phần trăm đóng góp MPmxk,% 
và GMPmxk,% đối với các tham số mô tả phân tử 2D3, D trong các mô 
hình QSARMLR (với k là 8, 9, 10). 
QSARMLR MPmxi,% 
GMPmxi, % 
m = 8 M = 9 m = 10 m = 8 m = 9 m = 10 
R2 0,936 0,955 0,955 
R2 pred 0,909 0,932 0,928 
SE 0,124 0,107 0,110 
Hệ số -13,133 3,044 2,946 
k2 -4,926 - - 23,638 7,879 
xp6 -2,899 - - 6,399 2,133 
xp8 - 4,473 4,282 14,301 12.181 8,827 
nvx 3,487 - 0,036 45,229 1,138 15,456 
knotp -8,350 -2,673 -2,794 9,072 7,879 7,325 8,092 
knotpv 34,40 15,54 15,917 9,681 11,878 10,813 10,790 
SHBa -0,225 0,019 0,016 4,398 1,004 0,770 2,057 
Hmaxpos - -1,203 -1,201 3,439 3,060 2,166 
SaaCH -0,166 - - 1,490 0,497 
ABSQ - -5,982 -5,939 33,101 29,255 20,785 
SsOH - 0,359 0,358 2,924 2,609 1,844 
phia - 3,067 2,999 21,167 18,413 13,193 
logP 0,050 0,839 0,793 0,093 4,308 3,624 2,675 
Sự biến thiên các giá trị R2, R2pred và SE trong các mô hình QSARMLR 
với các tham số mô tả 2D và 3D, tương ứng chỉ ra trong Bảng 3.18. 
Để xây dựng các mô hình QSARMLR, các tham số mô tả 2D và 3D được 
chọn lựa bằng kĩ thuật hồi quy từng bước. Các tham số mô tả 2D, 3D 
được chọn dựa trên cơ sở các giá trị thống kê R2, SE và F-stat. 
Các mô hình được đánh giá chéo bằng kĩ thuật loại bỏ dần từng trường 
hợp (LOO) để xác định giá trị R2pred. 9 mô hình phù hợp nhất được chỉ 
10 
ra trong Bảng 3.18. Các giá trị phần trăm đóng góp trung bình 
MPmxk,%, GMPmxk, % và các giá trị thống kê khác đối với các mô hình 
(với k là 8, 9 và 10), được đưa ra trong Bảng 3.19. Sự xắp xếp mức độ 
ảnh hưởng quan trọng của các tham số 2D, 3D trong các mô hình 
QSARMLR theo thứ tự là GMPmxk,%: SaaCH < SsOH < SHBa < xp6 < 
Hmaxpos < logP < k2 < knotp < xp8 < knotpv < phia < nvx < ABSQ. 
Các tham số mô tả ABSQ, nvx, phia, knotpv, xp8, knotp, k2 và LogP 
được xem là các tham số mô tả quan trọng nhất trong mỗi phân tử. Mô 
hình QSARMLR (3.16) như sau: 
pGI50 = 3,044 + 4,473×xp8 -5,982×ABSQ + 0,359×SsOH -
1,203×Hmaxpos + 3,067×phia -2,673×knotp + 15,540×knotpv + 
0,019×SHBa + 0,839×LogP (3.16) 
Với n = 34; R2 = 0,955; R2Adj= 0,932; R2Pred = 0,745; SE = 0,107; F = 
42,182. 
3.2.5.3. Xây dựng mô hình QSARANN(1) 
Mô hình QSARANN(1) được xây dựng bằng kỹ thuật neuro-fuzzy với 
thuật toán di truyền sử dụng phần mềm INForm. Mô hình mạng thần 
kinh nhân tạo có kiến trúc mạng I(9)-HL(5)-O(1) được xây dựng. Kiến 
trúc mạng này bao gồm lớp input I(9) với 9 nơ ron tương ứng với 9 biến 
độc lập xp8, ABSQ, SsOH, Hmaxpos, phia, knotp, knotpv, SHBa và 
LogP; lớp ẩn HL(5) với 5 nơ ron và lớp output O(1) với 1 nơ ron là hoạt 
tính sinh học pGI50. Thuật toán lan truyền ngược được ứng dụng để 
luyện mạng thần kinh. Hàm truyền cho mỗi nơ ron là đường tiếp tuyến 
Hypecbol; mỗi tham số luyện mạng khác nhau được sử dụng cho quá 
trình luyện mạng với tốc độ huấn luyện (moment) là 0.7 và tốc độc học 
là 0.01; sai số tổng cộng là 0,0003017, sai số dự đoán là 0,00001 với 
300000 vòng lặp. Sau khi luyện mạng mô hình mạng thần kinh thu 
được có kiến trúc I(9)-HL(5)-O(1), với giá trị thống kê R2train là 0,8963 
và R2pred là 0,8883. 
3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và 
QSARANN(1) 
Sau khi sử dụng các mô hình QSARMLR (3.16) và QSARANN(1) để dự 
đoán hoạt tính sinh học pGI50 của sáu hợp chất trong nhóm kiểm tra chỉ 
ra khả năng dự đoán chính xác của các mô hình QSAR với các sai số 
nằm trong khoảng tin cậy của phép đo thực nghiệm. Tuy nhiên, các mô 
hình QSARMLR (3.16) và QSARANN(1) đều có khả năng dự báo tốt đối 
với hoạt tính sinh học của các hợp chất mới. 
11 
Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình 
QSARMLR (3.16) và QSARANN(1) 
Hợp chất pGI50,exp 
pGI50,pred 
ARE,% 
M1 M2 M1 M2 
Fla-1 5,699 5,3879 5,7371 5,4589 0,6685 
Fla-11 5,699 5,9188 6,0478 3,8568 6,1204 
Fla-24 5,6198 5,9316 5,7662 5,5482 2,6051 
Fla-25 5,6383 5,8627 5,6843 3,9799 0,8158 
Fla-26 5,699 5,8841 5,7058 3,2479 0,1193 
Fla-30 5,0862 4,8677 4,9365 4,2959 2,9433 
MARE,% 4,3979 2,2121 
3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR; QSARPCA-ANN 
3.2.6.1. Dữ liệu 
3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR 
Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, 
R2pred và MSE 
k Tham số mô tả phân tử 2D, 3D trong các mô hình R2 R2pred SE 
2 a1, a2 0,756 0,731 0,430 
3 a1, a2, a3 0,774 0,732 0,417 
4 a1, a2, a3, a4 0,805 0,772 0,390 
5 a1, a2, a3, a4, a5 0,832 0,756 0,365 
6 a1, a4, a5, a6, a7, a8 0,854 0,812 0,342 
7 a1, a2, a3, a4, a5, a9, a10 0,836 0,721 0,365 
8 a1, a2, a3, a4, a5, a8, a9, a10 0,837 0,693 0,367 
9 a1, a2, a3, a4, a5, a8, a9, a10, a11 0,838 0,682 0,369 
10 a1, a2, a3, a4, a5, a6, a8, a9, a10, a11 0,841 0,650 0,368 
Đối với các mô hình QSARMLR, mức độ quan trọng của mô tả phân tử 
2D và 3D được sắp xếp theo các giá trị GMPmxk,%: MaxQp > ABSQ > 
ka2 > MaxNeg > LogP > ka3 > SdssC > SdO > Ovality > ABSQon. Mô 
hình QSARMLR (3.17) với k = 6: 
pGI50 = 8,509 + 2,8540MaxQp + 0,0247SdO + 0,2192LogP - 
3,6969Ovality + 0,2969SdssC + 0,3635ka3 (3.17) 
Sáu biến số MaxQp, SdO, ka3, LogP, Ovality and SdssC được chọn để 
xây dựng mô hình QSARPCR (3.18). 
pGI50 = 5,48356 + 0,38027×PC1 - 0,11868×PC2 + 0,34789×PC3 + 
0,06995×PC4 + 0,21850×PC5 + 0,35057×PC6 (3.18) 
12 
Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxk,%, 
GMPmxk,% của các tham số mô tả phân tử 2D, 3D trong các mô hình 
QSARMLR (với k = 5, 6, 7) 
Biến số QSARMLR MPmxi,% GMPmxi, 
% 
m m = 5 m = 6 m = 7 m = 5 m = 6 m = 7 
R2 0,832 0,854 0,836 
R2adj 0,820 0,841 0,820 
SE 0,365 0,342 0,365 
R2pred 0,756 0,812 0,721 
Hệ số 3,883 8,509 4,790 
ABSQ -0,222 - -0,257 27,945 18,636 19,005 21,862 
ABSQon - - 0,0143 - - 0,433 0,144 
MaxQp 3,416 2,8540 3,588 24,043 25,862 25,908 25,271 
MaxNeg - - 6,122 - 24,203 23,890 16,031 
SdO 0,0125 0,0247 0,0126 6,192 3,792 3,665 4,550 
ka2 0,133 - 0,143 27,484 17,617 17,426 20,842 
LogP 0,156 0,2192 0,163 15,651 9,829 9,672 11,717 
Ovality - -3,6969 - 5,292 4,393 2,315 4,000 
SdssC - 0,2969 - 4,382 5,613 7,236 5,744 
ka3 - 0,3635 - 5,351 9,324 3,473 6,049 
3.2.6.3. Xây dựng mô hình QSARPCA-ANN 
Mô hình QSARPCA-ANN được xây dựng bằng kỹ thuật neurofuzzy với 
thuật toán di truyền bằng chương trình INForm. Kiến trúc mạng nơ-ron 
nhân tạo I(6) -HL(9) - O(1) đã được xây dựng. Mô hình QSARPCA-ANN 
bao gồm lớp đầu vào I(6) với 6 nơ ron là các biến độc lập PC1, PC2, 
PC3, PC4, PC5 và PC6 tương ứng với các tham số MaxQp, SdO, ka3, 
LogP, Ovality và SdssC; lớp ẩn HL(9) với 9 nơ ron thần kinh và lớp 
đầu ra O (1) với 1 nơ ron là hoạt tính sinh học pGI50. Thuật toán lan 
truyền ngược được sử dụng để luyện mạng nơ ron. Hàm truyền trên mỗi 
nơ ron được sử dụng là hàm truyền sigmoid; các thông số khác được sử 
dụng để huấn luyện mạng thần kinh này bao gồm tỷ lệ luyện là 0,7 và 
tốc độ học 0,7; sai số MSE = 0,003447 với số vòng lặp là 5000. Sau khi 
luyện mạng nơ ron I(6) - HL(9)- O(1), giá trị R2 là 0,897298 và R2pred là 
0,88718. 
3.2.6.4. Khả năng dự đoán của các mô hình 
Các hoạt tính dự báo từ các mô hình QSAR được so sánh với các hoạt 
tính thực nghiệm và so sánh với nhau bằng cách sử dụng giá trị trung 
bình sai số tương đối MARE%. Các giá trị MARE,% cho thấy rằng khả 
13 
năng dự báo của mô hình QSARMLR (3.17) thấp hơn cả hai mô hình 
QSARPCR và QSARPCA-ANN, như trong Bảng 3.23. 
Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình 
QSARMLR (3.17) (M1), QSARPCR (M2) và QSARPCA-ANN (M3) 
Hợp chất pGI50,exp pGI50,pred ARE,% 
 M1 M2 M3 M1 M2 M3 
Flav-8 5,921 5,234 5,526 5,471 3,214 8,979 7,890 
Flav-22 5,745 5,485 5,699 5,556 3,755 0,001 2,513 
Flav-32 6,097 5,423 5,697 5,351 5,567 10,895 4,161 
Flav-74 5,699 5,815 5,895 5,736 1,964 3,362 0,585 
Flav-80 5,699 6,034 6,288 6,086 0,773 3,399 0,083 
 MARE,% 3,055 5,327 3,045 
Do giá trị MARE,% mô hình QSARPCR (3.18) là cao nhất. Sau khi sử 
dụng các mô hình QSARMLR (3.17), QSARPCR(3.18) và QSARPCA-ANN để 
dự đoán các hoạt tính sinh học pGI50 của sáu hợp chất trong nhóm thử 
nghiệm khả năng dự đoán chính xác của một mô hình QSAR được thể 
hiện bởi các sai số có thể chấp nhận được trong khoảng tin cậy của phép 
đo thực nghiệm. Do đó, các mô hình QSARMLR (3.17), QSARPCR (3.18) 
và QSARPCA-ANN có khả năng dự đoán tính sinh học của các chất mới. 
3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và 
QSARANN(2) 
3.2.7.1. Dữ liệu 
3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20) 
Bảng 3.24 Các mô hình QSARMLR với các giá trị R2 , SE và R2pred tương 
ứng 
k Điện tích nguyên tử trong các mô hình R2 SE R2pred 
2 O1, C7 0,816 0,139 0,765 
3 O1, C4, C6 0,86 0,124 0,8 
4 O1, C2, C4, C5 0,901 0,107 0,829 
5 O1, C2, C4, C5, C3’ 0,924 0,096 0,873 
6 O1, O11, C3, C4, C6, C7, 0,938 0,089 0,903 
7 O11, C4, C6, C8, C9, C2’, C6’ 0,959 0,074 0,879 
8 O11, C3, C6, C7, C8, C9, C10, C3’ 0,97 0,065 0,696 
9 O1, O11, C3, C4, C6, C7, C8, C9, C10 0,978 0,057 0,563 
10 O1, O11, C3, C6, C7, C8, C9, C2’, C3’, C6’ 0,978 0,059 0,358 
Mô hình QSARMLR (3.19) với k = 6 với giá trị R2 là 0,938 và giá trị 
R2pred cao nhất là 0,903. 
pGI50 = 6,7116 − 42,3105 O1 − 8,1592O11 + 3,0139 C3 −19,0370 C4 + 
6,6117 C6 + 4,6038C7 
14 
Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxk,%, 
GMPmxk,% của điện tích nguyên tử trong các mô hình QSARMLR 
Biến 
QSARMLR MPmxi 
GMPmxi m = 5 m = 6 m = 7 m = 5 m = 6 m = 7 
R2 0,924 0,938 0,959 
R2adj 0,905 0,919 0,943 
SE 0,096 0,089 0,074 
R2pred 0,873 0,903 0,879 
Hằng số −0,933 6,712 4,714 
O1 −101,208 −42,311 − 57,602 24,629 − 27,410 
O11 − −8,159 −32,8026 − 18,632 21,462 13,365 
C2 −15,426 − − 13,418 − − 4,473 
C3 − 3,014 − − 4,216 − 1,405 
C4 −6,874 −19,037 −60,070 15,121 42,447 38,387 31,985 
C5 
− − 
− − 
C6 − 6,612 20,877 − 6,572 5,779 4,117 
C7 − 4,604 − − 3,505 − 1,168 
C8 − − 16,902 − − 5,696 1,899 
C9 − − 95,421 − − 22,597 7,532 
C2' − − −24,472 − − 2,497 0,832 
C3' −16,117 − − 11,801 − − 3,934 
C6' − − −25,422 − − 3,582 1,194 
Đối với 3 mô hình QSARMLR với k = 5 – 7 biến số, vị trí các nguyên tử 
quan trọng sắp xếp theo các giá trị GMPmxk,%: C4 > O1 > O11 > C9 > C2 
> C6 > C3. Các nguyên tử C4, O1, O11 là các các vị trí quan trọng nhất 
trong các phân tử, Bảng 3.25. 
3.2.7.3. Xây dựng mô hình QSARANN(2) 
Kiến trúc mạng nơ ron nhân tạo bao gồm ba lớp I(6)-HL(4)-O(1); Lớp 
đầu vào I(6) bao gồm sáu nơ ron là các tham số O1, O11, C3, C4, C6 và 
C7; Nơ ron lớp đầu ra O(1) là hoạt tính sinh học pGI50; Lớp ẩn HL(4) 
bao gồm bốn nơ ron. Mạng thần kinh đa lớp sử dụng thuật toán lan 
truyền ngược để luyện mạng. Hàm truyền sigmoid trên mỗi nút của 
mạng; Các thông số mạng thần kinh bao gồm tỷ lệ luyện 0,7 và tốc độ 
học 0,7; sai số MSE = 0,000816 với 10,000 vòng lặp. Sau khi luyện 
mạng thần kinh, giá trị R2 là 0,993 và R2pred là 0,971 trong khi đối với 
mô hình QSARMLR (3.19), giá trị R2 là 0,938 và R2pred là 0,903. 
3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới 
Khả năng dự báo của mô hình QSARMLR (3.19), thấp hơn các mô hình 
QSARPLS và QSARANN (2) tương ứng như trong Bảng 3.26. Mô hình 
15 
QSARANN (2) có sai số với giá trị MARE % là 1,161 nhỏ hơn MARE,% 
của cả hai mô hình QSARMLR (3.19) và QSARPLS. Vì vậy, khả năng dự 
báo của mô hình QSARANN (2) tốt hơn so với mô hình QSARMLR (3.19) 
và QSARPLS. 
Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình 
QSARMLR (3.19) (M1), QSARPLS (M2) và QSARANN(2) (M3) 
Hợp chất pGI50,exp 
pGI50,pred ARE,% 
M1 M2 M3 M1 M2 M3 
Fla 2 5,921 6,008 5,801 5,851 1,472 2,020 1,180 
Fla 9 5,745 5,692 5,608 5,741 0,925 2,376 0,070 
Fla 12 6,097 5,759 5,842 5,814 5,548 4,188 4,646 
Fla 15 5,699 5,651 5,652 5,712 0,840 0,828 0,236 
Fla 16 5,699 5,651 5,655 5,719 0,835 0,775 0,347 
Isofla 32 5,137 5,092 5,083 5,112 0,877 1,046 0,490 
MARE,% 1,749 1,872 1,161 
Sau khi sử dụng các mô hình QSARMLR (3.19), QSARPLS, QSARANN(2) 
để dự đoán các hoạt tính sinh học pGI50 của 6 hợp chất trong nhóm thử 
nghiệm, sai số của dự đoán nằm trong khoảng sai số cho phép của các 
phép đo thực nghiệm. Do đó, các mô hình QSARMLR (3.19), QSARPLS 
và QSARANN(2) thích hợp để dự đoán các hoạt tính sinh học của các chất 
mới. 
3.3. SÀNG LỌC, PHÂN LẬP FLAVONOID TỰ NHIÊN 
3.3.1. Phân lập cynaroside từ actiso 
Cynaroside phân lập từ lá actiso, cấu trúc cynaroside xác định bằng 
phương pháp phổ NMR, Hình 3.8. 
Hình 3.8 Cấu trúc phân tử cynaroside, C12H20O11 
3.3.2. Phân lập quercetin từ xa kê 
Quercetin phân lập từ lá xa kê, cấu trúc quercetin xác định bằng phương 
pháp phổ NMR, Hình 3.9. 
16 
Hình 3.9 Cấu trúc phân tử quercetin, C15H10O7 
3.3.3. Phân lập luteolin từ tía tô 
Luteolin phân lập từ lá tía tô, cấu trúc luteolin xác định bằng phương 
pháp phổ NMR, Hình 3.10. 
Hình 3.10 Cấu trúc luteolin, C15H10O6 
3.3.4. Phân lập daidzin từ đậu nành 
3.3.4.1. Xác định cấu trúc daidzin bằng phương pháp NMR 
Daidzin phân lập từ hạt đậu nành, cấu trúc daidzin xác định bằng 
phương pháp phổ NMR, Hình 3.11. 
Hình 3.11 Cấu trúc phân tử của daidzin, C21H20O9 
3.3.4.2. Xác định cấu trúc phân tử daidzin bằng phương pháp đo 
nhiễu xạ tia X 
Daidzin phân lập từ hạt đậu nành, cấu trúc daidzin xác định bằng 
phương pháp đo nhiễu xạ tia X đơn tinh thể, Hình 3.12. 
17 
Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 
50% 
3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió 
3.3.5.1. Xác định cấu trúc kaempferol-3-O-methylether bằng 
phương pháp NMR 
Kaempferol-3-O-methylether phân lập từ củ gừng gió, cấu trúc 
kaempferol-3-O-methylether xác định bằng phương pháp phổ NMR, 
Hình 3.13. 
Hình 3.13 Cấu trúc phân tử của kaempferol-3-O-methylether, C16H12O6 
3.3.5.2. Xác định cấu trúc kaempferol-3-O-methylether bằng 
phương pháp đo nhiễu xạ tia X 
Kaempferol-3-O-methylether phân lập từ củ gừng gió, cấu trúc 
kaempferol-3-O-methylether xác định bằng phương pháp đo nhiễu xạ 
tia X đơn tinh thể, Hình 3.14. 
18 
Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 
50% 
3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L-
rhamnopyranoside) từ gừng gió 
Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12) 
Kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) phân lập 
từ củ gừng gió, cấu trúc kaempferol-3-O-(2,4-O-diacetyl-alpha-L-
rhamnopyranoside) xác định bằng phương pháp phổ NMR, Hình 3.13. 
3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid 
chiết xuất 
Các hợp chất chiết xuất với GML1 là daidzin, POL1 là luteolin, CSL1 
là cynaroside, AIL1 là quercetin, ZZL1 là kaempferol-3-O-methylether 
và ZZL2 là kaempferol-3-O-(2,4-O-diacetyl-alpha-l-rhamnopyranoside) 
19 
phân lập từ actiso, xa kê, đậu nành, tía tô và gừng gió được thử 
nghiệm in vitro hoạt tính kháng ung thư Hela trên tế bào Hela, kết 
quả cho ở Bảng 3.28. 
Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát 
từ thực nghiệm in vitro 
Flavonoid 
GI50 (µg/ml) 
GI50 (µM) pGI50 
Lần 1 Lần 2 Lần 3 TB ± ĐLC TB TB 
CSL1 4,41 4,79 4,96 4,72 ± 0,280 
10,533 4,977 
AIL1 4,36 4,38 3,81 4,18 ± 0,327 
13,839 4,859 
POL1 4,75 5,38 4,95 5,03 ± 0,321 
17,584 4,755 
GML1 8,09 7,87 7,70 7,88 ± 0,195 
18,937 4,723 
ZZL1 15,05 15,24 15,82 15,37 ± 0,401 
51,223 4,291 
ZZL2 39,65 38,03 38,90 38,86 ± 0,814 
75,292 4,123 
3.4. THIẾT KẾ VÀ DỰ BÁO HOẠT TÍNH TỪ CÁC FLAVONOID 
TỰ NHIÊN 
3.4.1. Mô hình QESAR 
Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự 
đoán từ mô hình QESARMLR và QESARANN 
Hợp chất 
Nhóm thế pGI50,tt 
vị trí C6 vị trí C3' QESARMLR QESARANN 
fla-1a [103] -H -H 5,954 5,709 
fla-1c -OCH2CONHCH3 -OH 5,928 5,795 
fla-2c -OCH2CONHCH3 -H 5,954 5,814 
fla-3c -OCH2(CH3)C=NOH -OH 5,974 5,816 
fla-4c -OH -OCH2CONHCH3 6,128 5,873 
fla-5c -OH -OCH2CH3C=NOH 6,172 5,886 
isofla-6b [103] -H -H 5,092 5,011 
isofla-7c -OCH2CONHCH3 -OH 5,328 5,308 
isofla-8c 
-OCH2CONHCH3 -H 5,367 5,341 
isofla-9c 
-OCH2(CH3)C=NOH -OH 5,369 5,350 
isofla-10c 
-OH -OCH2CONHCH3 5,502 5,452 
isofla-11c 
-OH -OCH2CH3C=NOH 5,543 5,486 
ZZL1 (*) -H -H 4,291(*) 4,291(*) 
Flav-11(n) -OCH2CONHCH3 -OH 4,345 4,387 
Flav-12(n) 
-OCH2CONHCH3 -OH 4,789 4,715 
Flav-13(n) 
-OCH2(CH3)C=NOH -OH 4,963 4,960 
Flav-14(n) 
-OH -OCH2CONHCH3 5,528 5,512 
Flav-15(n) 
-OH -OCH2CH3C=NOH 5,530 5,513 
20 
ZZL2 (*) -H -H 4,123 (*) 4,123(*) 
Flav-16(n) -OCH2CONHCH3 -OH 4,139 4,159 
Flav-17(n) 
-OCH2CONHCH3 -OH 4,398 4,414 
Flav-18(n) 
-OCH2(CH3)C=NOH -OH 4,615 4,870 
Flav-19(n) 
-OH -OCH2CONHCH3 4,980 5,103 
Flav-20(n) 
-OH -OCH2CH3C=NOH 5,100 5,231 
20 dẫn xuất mới được thiết kế từ vị trí C3’, C6 còn trống của flavone 1a, 
flavone 6b, và ZZL1, ZZL2 from Zingiber zerumbet L,. Các hoạt tính 
kháng ung thư dự đoán pGI50 của các dẫn xuất mới cao hơn hợp chất 
mẫu. Các mô hình QESARMLR và QESARANN đã phát triển là tin cậy và 
có thể ứng dụng để dự đoán hoạt tính kháng ung thư pGI50. 
3.4.2. Mô Hình QSDAR 
18 dẫn xuất mới được thiết kế từ vị trí C3, C6 và C7 còn trống của 
flavone 22 và isoflavone 26. Các hoạt tính kháng ung thư dự đoán pGI50 
của các dẫn xuất mới cao hơn flavone 22 và isoflavone 26, tương ứng. 
Các mô hình QSDARMLR và QSDARANN đã phát triển là tin cậy và có 
thể ứng dụng để dự đoán hoạt tính kháng ung thư pGI50. 
Bảng 3.30 Hoạt tính pGI50 của flavone và isoflavone mới được thiết kế 
và dự đoán từ mô hình QSDARMLR (M1) và QSDARANN (M2) 
Cấu trúc phân tử Nhóm thế 
pGI50,pred 
M1 M2 
flavone 22 [103] 5,3570 5,2808 
1b, R1 = Me 5,4157 5,8444 
2b, R1 = C6H5 5,3669 5,7736 
3b, R1 = p-F- C6H4 5,3855 5,8263 
4b, R1 = Me 6,0412 6,0728 
5b, R1 = C6H5 6,0063 6,0622 
6b, R1 = p-F- C6H4 5,9579 6,0535 
7b, R1 = Me 7,5843 5,9761 
8b, R1 = C6H5 7,5843 5,9749 
9b, R1 = p-F- C6H4 7,6042 5,9863 
isoflavone 26 [103] 5,0698 5,08715 
10b, R1 = Me 5,1145 5,1742 
11b, R1 = C6H5 5,0957 5,1716 
12b, R1 = p-F- C6H4 5,0973 5,1724 
13b, R1 = Me 5,8170 5,4754 
14b, R1 = C6H5 5,7985 5,4744 
15b, R1 = p-F- C6H4 5,8204 5,4704 
16b, R1 = Me 7,2093 5,2362 
17b, R1 = C6H5 7,1880 5,2312 
18b, R1 = p-F- C6H4 7,1716 5,2219 
21 
3.4.3. Mô hình QSSR 
Phân tích ANOVA một yếu tố chỉ ra rằng kết quả dự đoán tính chất hóa 
lý của các dẫn xuất flavone và isoflavone từ mô hình QSSRMLR không 
khác các giá trị tính chất hóa lý tham khảo (Ftt = 0,004 < F0,05 = 4,149). 
Tínhn chất hóa lý và hoạt tính kháng ung thư dự đoán từ mô hình 
QSSRMLR của các flavone và isoflavone mục tiêu trình bày trong Hình 
3.19. 
 Các mô hình QSSRMLR của các 
hợp chất flavonoid phân lập được 
sử dụng để dự đoán nhiệt độ nóng 
chảy của các hợp chất phân lập 
Bảng 3.33. Nhiệt độ nóng chảy 
thực nghiệm được so sánh với giá 
trị dự đoán với giá trị sai số trung 
bình MARE, % là 0,243 % cho 
thấy khả năng dự báo rất tốt của 
các mô hình QSSRMLR. 
 Hình 3.19. Tương quan giữa 
giá trị tính chất vật lý dự đoán 
và giá trị thực nghiệm 
Bảng 3.33 Nhiệt độ nóng chảy thực nghiệm và dự đoán từ mô hình 
QSSRMLR của các dẫn xuất flavonoid chiết xuất. 
Hợp chất 
Tm (oC) ARE, % 
Thực nghiệm QSSRMLR QSSRMLR 
CSL1 256,500 257,646 0,447 
POL1 327,500 327,607 
0,033 
ZZL1 249,500 248,456 
0,418 
ZZL2 112,500 112,688 
0,167 
AIL1 315,000 315,236 
0,075 
GML1 247,000 247,789 
0,319 
MARE, % 0,243 
Với GML1 là daidzin, POL1 là luteolin, CSL1 là cynaroside, AIL1 là 
quercetin, ZZL1 là kaempferol-3-O-methylether và ZZL2 là 
kaempferol-3-O-(2,4-O-diacetyl-alpha-l-rhamnopyranoside). 
22 
3.4.4. Mô hình QSARMLR (3.16) và QSARANN(1) 
ZZL1 flav-1(n) flav-2(n) flav-3(n) flav-4(n) flav-5(n)
0
1
2
3
4
5
6
7
p
G
I 5
0
Hop chat flavonoid 
ZZL2 flav-6(n) flav-7(n) flav-8(n) flav-9(n) flav-10(n)
0
1
2
3
4
5
6
7
p
G
I 5
0
Hop chat flavonoid 
a) b) 
Fig. 3.20 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất 
mẫu a) ZZL1, b) ZZL2 
Kết quả dự đoán giá trị pGI50 của các hợp chất mới được chuyển đổi về 
giá trị GI50 (µM) và so sánh với giá trị thực nghiệm của ZZL1, ZZL2 
xem Hình 3.20. Hoạt tính GI50 (µM) của 10 hợp chất mới bằng cách 
gắn nhóm thế vào các vị trí C6, C2’ và C3’ của ZZL1 và ZZL2 cao hơn 
hợp chất mẫu tương ứng. Từ đây, các hợp chất mới thiết kế hứa hẹn 
trong tổng hợp các dược phẩm mới từ hợp chất tự nhiên. 
3.4.5. Mô hình QSARMLR (3.17), QSARPCR và QSARPCA-ANN 
POL1 flav-1(n) flav-2(n) flav-3(n) flav-4(n) flav-5(n)
0
1
2
3
4
5
6
7
p
G
I 5
0
Hop chat flavonoid
GML1 flav-6(n) flav-7(n) flav-8(n) flav-9(n) flav-10(n)
0
1
2
3
4
5
6
7
p
G
I 5
0
Hop chat flavonoid 
a) b) 
Hình 3.21 So sánh giữa các giá trị pGI50 của năm flavonoid mới với 
chất mẫu a) POL1; b) GML1 
Kết quả dự đoán hoạt tính sinh học pGI50 đối với các chất mới được so 
sánh với hoạt tính thử nghiệm của POL1 và GML1, như được mô tả 
trong Hình 3.21. Hoạt tính kháng ung thư của năm hợp chất mới được 
thiết kế bằng cách gắn nhóm thế vào các vị trí C6, C2' và C3 của luteolin 
23 
mạnh hơn hoạt tính của POL1 và GML1. Các hợp chất mới được thiết 
kế nhằm tạo ra các sản phẩm dược phẩm mới từ các sản phẩm tự nhiên 
có hoạt tính sinh học được cải thiện. 
3.4.6. Mô hình QSARMLR (3.19 ), QSARPLS (3.20) và QSARANN(2) 
Các hợp chất được thiết kế mới cũng dự đoán với các hoạt tính sinh học 
pGI50 sử dụng mô hình QSARANN (e). Sau đó, các hoạt tính dự báo 
pGI50 đã được chuyển về dạng ban đầu GI50 (μM), như Bảng 3.39. 
Các kết quả dự đoán pGI50 đối với các chất mới so sánh với hoạt tính 
thử nghiệm của hợp chất AIL1 và CSL1 mẫu, trong (Hình 3.21). Do đó, 
các hợp chất mới với nhóm thế ở vị trí C6 và C3' trong phân tử quercetin 
cho thấy hoạt tính mạnh hơn GI50 (μM) so với mẫu. Ở đây, các hợp chất 
được thiết kế mới sẽ hứa hẹn đưa ra một kế hoạch thiết kế cho các sản 
phẩm dược phẩm mới từ các sản phẩm tự nhiên. 
AIL1 Fla-1(n) Fla-2(n) Fla-3(n) Fla-4(n) Fla-5(n)
0
1
2
3
4
5
6
7
p
G
I 5
0
Hop chat flavonoid 
CSL1 flav-6(n) flav-7(n) flav-8(n) flav-9(n) flav-10(n)
0
1
2
3
4
5
6
7
p
G
I 5
0
Hop chat flavonoid 
a) b) 
Hình 3.22 So sánh giữa các giá trị pGI50 của năm flavonoid mới với 
chất mẫu a) AIL1; b) CSL1 
NHỮNG KẾT LUẬN CHÍNH CỦA LUẬN ÁN 
Luận án đã đạt được các mục tiêu đề ra: 
1) tính toán và sàng lọc được các tham số cấu trúc phân tử ảnh 
hưởng đến hoạt tính kháng ung thư bao gồm: các tham số điện tích (O1, 
O11, C3, C4, C6 và C7), các tham số độ dịch chuyển hóa học (O1, O11, C2, 
C3, C6, C7 và C2’); các tham số 2D và 3D (xp8, ABSQ, SsOH, 
Hmaxpos, phia, knotp, knotpv, SHBa, LogP; MaxQp, SdO, ka3, LogP, 
Ovality và SdssC) 
2) Đã xây dựng được các mô hình QSAR có khả năng dự báo 
rất tốt hoạt tính kháng ung thư gồm: mô hình QESARMLR, QESARANN, 
24 
QSDARMLR, QSDARANN, QSSRMLR, QSARMLR (3.16), QSARMLR 
(3.17), QSARPCA-ANN, QSARMLR (3.19), QSARPLS (3.20), QSARANN(1), 
QSARANN(2). 
3) Đã phân lập và sàng lọc được các dẫn xuất flavonoid có 
nguồn gốc tự nhiên có hoạt tính kháng ung thư gồm 6 hợp chất daidzin, 
luteolin, cynaroside, quercetin, kaempferol-3-O-methylether và 
kaempferol-3-O-(2,4-O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ 
actiso, xa kê, đậu nành, tía tô và gừng gió.. 
4) Đã thử nghiệm in vitro hoạt tính kháng ung thư của các dẫn 
xuất flavonoid phân lập. 
5) Đã đánh giá hoạt tính kháng ung thư, tính chất hóa lý, của 
các dẫn xuất flavonoid của các dẫn flavonoid phân lập. 
6) Đã nghiên cứu, thiết kế các dược chất mới bằng cách gắn các 
nhóm thế quan trọng vào các vị trí phân tử ảnh hưởng lớn đến hoạt tính 
ung thư gồm các vị trí C3, C6 và C7 và C3’ và các nhóm thế -
OCH2CONHC6H4F; -OCH2CONHC6H4OCH3; -OCH2(CH3)C=NOH; -
OCH2CONHCH3; -OCH2CH3C=NOH; CH3CO- ; -CH3 ; -OCH3; -NO2; -
OH. 
7) Đã sàng lọc được các hợp chất mới có hoạt tính kháng ung 
thư cao hơn hợp chất ban đầu. 
NHỮNG ĐỊNH HƯỚNG NGHIÊN CỨU TIẾP THEO 
Những kết quả đạt được trong luận án đã mở ra những định hướng 
nghiên cứu triển vọng có thể tiếp cận trong thời gian tới: 1) Mở rộng 
các kỹ thuật xây dựng mô hình QSAR. 2) Tiến hành tổng hợp các dẫn 
xuất flavonoid mới. 
DANH MỤC CÁC CÔNG TRÌNH LIÊN QUAN ĐẾN LUẬN ÁN 
1. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung 
Van Trung, Hoang Thi Kim Dung, Pham Van Tat (2015), 
"Prediction of anticancer activities of luteolin flavonoid daidzin in 
leaf of plants Perilla ocymoides L. flavonoid Glucine max L. using 
2D, 3D descriptors", Viet Nam Journal of Chemistry, 6e4(53), pp, 
232-239. 
2. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Vo Thanh Cong, 
Phung Van Trung, Hoang Thi Kim Dung, Tran Duong, Pham Van 
Tat (2016), "Anticancer agents of kaempferol-3-O-methylether 
flavonoid kaempferol-3-O-(2,4-O-diacetyl-alpha-L-
rhamnopyranoside) in leaf of plants Zingiber zerumbet Sm. using 
25 
2D, 3D descriptors", Viet Nam Journal of Chemistry, 54(6), pp, 
710-718. 
3. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung 
Van Trung, Nguyen Minh Quang, Hoang Thi Kim Dung, Pham 
Van Tat, (2016), "Prediction of anticancer activities of cynaroside 
flavonoid quercetin in leaf of plants Cynara scolymus L. flavonoid 
Artocarpus incisa L. using structure–activity relationship", Cogent 
Chemistry Taylor & Francis 2(1), pp, 1-12. 
4. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, 
Trần Dương, Phạm Văn Tất (2017), "Nghiên cứu hoạt tính kháng 
ung thư của kaempferol-1, daidzin từ Zingiber zerumbet Sm. và 
Glucine max L. sử dụng các tham số mô tả phân tử 2D và 3D", Tạp 
Chí Khoa học và Công nghệ Trường Đại học Khoa Học Huế: 
Khoa học Tự nhiên, pp. 1-10. (Đã có giấy nhận đăng) 
5. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, 
Trần Dương, Phạm Văn Tất (2017), " Dự báo hoạt tính kháng ung 
thư cổ tử cung của các hợp chất flavonoid phân lập từ Cynara 
scolymus L. Và Artocarpus incisa L. Sử dụng mô hình QSAR 2D 
và 3D ", Tạp chí khoa học đại học Huế, 126 (S 1D), pp. 1-9. 
6. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van 
Trung, Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), "In 
silico Modelling of 2D, 3D Molecular Descriptors for Prediction 
Of Anticancer Activities Of Luteolin And Daidzin From Plants 
Perilla ocymoides L and Glucine max L", Organic & Medicinal 
Chemistry International Journal (OMCIJ), pp. 1-13. ISSN: 2474-
7610. 
7. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van 
Trung, Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), 
"Prediction Of Anticancer Activities Of Kaempferol-3-O-
Methylether And Kaempferol-3-O-(2,4-O-Diacetyl-Alpha-L-
Rhamnopyranoside) Isolating From Plant Rhizome Zingiber 
Zerumbet Sm using QSDAR Models from 13C-NMR and 15O-NMR 
Simulation Spectra Data", Organic & Medicinal Chemistry 
International Journal (OMCIJ), pp. 1-15. ISSN: 2474-7610. 
8. Thuy, B.T.P., Chau, H.V., Dai, T.T., Nhung, N.T.A., Trung, P.V., 
Dung, H.T.K., Duong, T., Tat, P.V. (2018), "Appreciation of 
cytotoxic activity on hela cell of flavonoid derivatives using 
multiple linear regression and artificial neural network", The 4th 
26 
International Integated (Web & offline) Conference & Concert on 
Convergence (IICCC2018) (ISSN 2384-4418), 4, pp. 323-332. 
            Các file đính kèm theo tài liệu này:
 24_tomtat_vn_2155_2071951.pdf 24_tomtat_vn_2155_2071951.pdf