1. Đã nghiên cứu lý thuyết về phương pháp hồi quy đa biến tuyến tính sử dụng
mạng nơron nhân tạo, phương pháp phân tích thành phần chính nhằm giảm kích
thước tập số liệu, đưa ra được các thuật toán và lập trình tìm ra số cấu tử chính, mô
hình mạng nơron nhân tạo tối ưu để tính nồng độ các cấu tử trong hỗn hợp cần phân
tích. Đặc biệt đây là công trình đầu tiên tại Việt Nam đã ứng dụng phần mềm
MATLAB trong việc lập mô hình mạng nơron nhân tạo và mạng nơron nhân tạo giải
bài toán xác định đồng thời các chất không có tính cộng tính trong phương pháp trắc
quang. Đóng góp này đã đem lại công cụ phần mềm để giải quyết hồi qui đa biến
bằng MATLAB- một phần mềm chứng tỏ những ưu điểm về sử dụng đơn giản và
tính tiện dụng cao so với phần mềm khác,
2. Đã khảo sát các điều kiện hình thành các phức màu Ni- PAR, Co- PAR, Cu –
PAR, Pb- PAR và Cd- PAR với các cực đại hấp thụ tương ứng là 495 nm, 496 nm, 499
nm; 524 nm và 512nm ở pH 10, Nồng độ tối ưu PAR là 1,5.10
-4
M, Đường chuẩn đơn
biến Ni
2+
tuyến tính trong khoảng 0,03 – 1 ppm, Co
2+
: 0,04 – 1,2 ppm, Pb
2+
: 0,2 - 6
ppm; Cu
2+
: 0,04-1,4 ppm và Cd
2+
: 0,05-1,7ppm,
76 trang |
Chia sẻ: tienthan23 | Lượt xem: 2735 | Lượt tải: 3
Bạn đang xem trước 20 trang tài liệu Ứng dụng phần mềm Matlab trong nghiên cứu và giảng dạy hóa phân tích ở Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
S1 S2 Sn1], {TF1 TF2TFn1}, BTF, BTF, PF)
Trong đó:
PR = [min(x); max(x) ]
[S1 S2 Sn1] là số nơron lớp ẩn và lớp xuất, ứng với bài toán này ta
có: [nhidden 2]
{TF1 TF2 TFn1} là các hàm học của mỗi lớp mạng, chúng ta có thể
tham khảo thêm trong toolbox của Matlab.
Sim(net, x, d, ntimes): hàm mô phỏng đầu ra theo các giá trị đầu vào.
Train(net, x ,d, ntimes): hàm học của bài toán.
Epochs = 10000 : số bước học.
Các hàm này đều là hàm chuẩn, ta có thể dùng ngay và lấy dễ dàng từ
toolbox của Matlab. Để có mô hình ANN tối ưu, có thể khảo sát các yếu tố sau: Số
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
47
lớp ẩn, Số nút trong lớp ẩn, Giá trị sai số tương đối bình phương trung bình (MSE),
Số bước học.
Tuy nhiên, do sự khác nhau không nhiều về các điều kiện đó, và kết quả tính
toán đã cho sai số rất nhỏ so với yêu cầu, nên chúng tôi chỉ tiến hành khảo sát số
lớp ẩn có trong mô hình.
Chương trình lập trình trong Matlab cho mạng MLP để tìm mô hình mạng tối ưu
% Yeu cau : co hai bo so lieu (xlearn,dlearn) va
(xtest,dtest).
% Hay tim duong dac tinh phu thuoc Ekt va Ehoc vao so noron
lop an trong mang noron truyền thẳng MLP mot lop an, tu do
xac dinh cau truc mang toi uu (Ekt=min).Tinh sai so cho mang
toi uu.
%------------------------------------------------------------
--
% LAY DU LIEU
load ANN.mat;
%Chuyen vi cac ma tran so lieu dau vao
[N,S]=size(Clearn); % o day ta co N= 5; S=151
[K,R]=size(Alearn); % o day ta co K=77; S= 151
% Xac dinh mang MLP bang phuong phap Fletcher-Reeves
conjugate gradient
Ehoc= rand(120,1);
Ekt= rand(120,1);
for nhidden = 1:2:120
% cho so noron lop an thay doi tu 1 den 120 de tim cau truc
mang toi uu
for nTimes = 1:1:10
% thuc hien tinh 10 lan cho moi lop an de tim gia tri co diem
xuat phat tot nhat
Elearn = 0;
Etest=0;
Ehoc_try = rand(1,10);
Ekt_try = rand(1,10);
net = newff(minmax(Alearn),[nhidden 100 100 5],{'logsig'
'purelin' ‘logsig’ ‘purelin’},'traincgf');
% Thiet lap cac thong so cho qua trinh hoc cua mang
net.trainParam.goal=0.001;
net.trainParam.epochs = 100000;
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
48
net = train(net,Alearn,Clearn);
ylearn = sim(net,Alearn);
% gia tri dau ra cua lop mang ung voi E_learn
ytest = sim(net,Atest) ;
% Gia tri dau ra cua lop mang ung voi E_test
e_hoc = Clearn-ylearn;
%sai so cua qua trinh hoc
e_test = Ctest-ytest;
%sai so cua qua trinh kiem tra
% Tinh toan sai so
Elearn = sum(sum(e_hoc.*e_hoc));
Etest = sum(sum(e_test.*e_test));
% Tinh sai so Elearn cho mang duoc cat vao mot matran co 5
hang
Ehoc_try(nTimes) = Elearn;
%luu giu gia tri nay lai
% Tinh sai so Etest cho mang duoc cat vao ma tran co 5 hang
Ekt_try(nTimes) = Etest;
%luu giu gia tri nay lai
end
if Elearn > net.trainParam.goal
% Neu sai so Elearn > goal thi tiep tuc
continue
% con nguoc lai thi dung qua trinh hoc lai
end
break
Ehoc(nhidden,1)= min(Ehoc_try);
Ekt(nhidden,1) = min(Ekt_try);
end
% khoi hien thi su phu thuoc cua sai so va so lop an
for i=1:1:800;
plot(i,Ehoc(i,1),'*b-',i,Ekt(i,1),'+r:');
title('Sai so hoc va kiem tra cua mang MLP theo so luong
Noron lop an');
xlabel('So Noron lop an');
ylabel('Sai so');
legend({'Sai so hoc Elearn','Sai so kiem tra Etest'});
grid on;
hold on;
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
49
end
% ket thuc chuong trinh
Sau khi thực hiện chạy chương trình ta thu được kết quả như sau:
Hình 13: Mô hình mạng nơron nhân tạo mạng truyền thẳng MLP với 4 lớp ẩn
Từ mô hình mạng nơron truyền thẳng ở trên, ta thấy thời gian luyện mạng rất
lớn (55 phút) đó là do kích thước của tập số liệu là rất lớn (80x151) và (80x5), số
nút đầu vào lên tới 151 nút, cần phải có nhiều thời gian để lan truyền sai số giữa các
giá trị của nút ẩn sao cho sai số thu được ở đầu ra là nhỏ nhất. Nếu giảm kích thước
của tập số liệu đầu vào từ 151 xuống giá trị nhỏ hơn 10 thì thời gian phân tích sẽ
giảm hơn rất nhiều. Vì vậy chúng tôi tiếp tục Vì vậy cần xử lý số liệu bằng cách
giảm kích thước tập số liệu trước khi nhập số liệu vào mạng nơron nhân tạo.
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
50
Hình 14: Đồ thị biểu diễn sự phụ thuộc của sai số MSE theo số bước học
Hình 15: Đồ thị biểu diễn sự phụ thuộc của sai số học và sai số kiểm tra vào số
nơron lớp ẩn.
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
51
Mô hình ANN tối ưu dựa trên nguyên tắc lựa chọn số nút trong lớp ẩn đầu
tiên sao cho giá trị sai số của mẫu học và mẫu kiểm tra là thấp nhất. Đồ thị trên hình
15 cho thấy, nếu số nơron lớp ẩn là 100 thì giá trị sai số học và sai số kiểm tra sẽ
nhỏ gần bằng nhau. Do đó, chúng tôi chọn số nơron lớp ẩn là 100 để tiến hành
luyện mạng và kiểm tra mạng theo chương trình dưới đây:
net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig' 'purelin' 'logsig'
'purelin'},'traincgf');
net.trainParam.goal=0.0001;
net.trainParam.epochs = 10000;
net = train(net,Alearn,Clearn);
ylearn = sim(net,Alearn);
ytest = sim(net,Atest);
saiso1 = 100*(ytest-Ctest)./Ctest;
3.2.2. Xây dựng thuật toán loại trừ giá trị đo bất thường (outlier)
Khi xây dựng ma trận nồng độ mẫu phân tích và mẫu kiểm tra xác định 5 cấu
tử trong cùng 1 dung dịch, do trật tự thí nghiệm được bố trí một cách ngẫu nhiên và
số thí nghiệm rất lớn nên kết quả thí nghiệm chắc chắn sẽ có sai số thô hay còn gọi
là giá trị bất thường. Nếu không loại bỏ các thí nghiệm này sẽ dẫn tới quá trình phân
tích dựa trân ma trận dung dịch chuẩn thu được thiếu chính xác.
Do đó chúng tôi đã tiến hành xây dựng thuật toán loại sai số thô trước khi
tiến hành thực hiện quá trình phân tích thành phần chính. Quá trình loại sai số dựa
trên việc đánh giá giá trị trung bình độ sai chuẩn tương đối của ma trận kiểm tra.
Đây là mô hình loại bỏ 1 số mẫu mà nghi ngờ mắc sai số tương đối lớn. Dựa
vào mô hình hồi quy này, 20 dung dịch kiểm tra được sử dụng để đánh giá độ chính
xác và phù hợp của mô hình thông qua giá trị độ sai chuẩn tương đối (relative
standard error)
Trong đó Cij là nồng độ chuẩn của cấu tử thứ i trong mẫu j. nồng độ của
cấu tử i trong mẫu j tính được từ mô hình.
Mẫu bị mắc sai số hệ thống là mẫu khi loại bỏ nó khỏi ma trận mẫu học thì
bộ số liệu học còn lại sẽ cho sai số tương nhỏ. Vì vậy, mẫu nào mà khi loaịo bỏ nỏ
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
52
làm cho giá trị RSE thấp thì mẫu đó càng kém chính xác, có ảnh hưởng nhiều tới
mô hình ANN và nên loại bỏ để được RSE nhỏ.
Các bước tiến hành phương pháp trên như sau:
- Nhập ma trận 80 mẫu chuẩn và 20 mẫu để kiểm tra.
- Loại bỏ mẫu số 1 trong ma trận mẫu chuẩn thì chỉ còn 79 mẫu học, khi đó ma trận
xlearn chỉ còn (79x151) và ma trận dlearn chỉ còn (79x5)
- Xây dựng mô hình ANN thông thường dựa trên 79 dung dịch chuẩn để tìm nồng
độ của các mẫu kiểm tra khi có ma trận độ hấp thụ quang của mẫu kiểm tra.
- Tính toán giá trị trung bình độ sai chuẩn tương đối của tất cả các mẫu kiểm tra dựa
trên công thức bằng excel. Mẫu nào làm giá trị RSE nhỏ hơn 1% tức là mẫu đó bị
mắc sai số hệ thống.
- Tiến hành loại bỏ tương tự mẫu số 2, mẫu số 3mẫu 80 với thuật toán trong
Matlab như sau:
load mau1.mat; % mau 1 la mau trong do ma tran mau kiem tra bi loai bo gia
% mau so 1, chi con lai 79 mau. Nhu vay, neu mau 1 khong mac sai so tho
% thi gia tri do sai chuan cua mau kiem tra se lon do mau 1 co anh huong
% mo hinh ANN
net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig' 'purelin' 'logsig'
'purelin'},'traincgf');
net.trainParam.goal=0.0000001;
net.trainParam.epochs = 300000;
net = train(net,Alearn,Clearn);
ylearn = sim(net,Alearn);
ytest = sim(net,Atest);
saiso1 = 100*(ytest-Ctest)./Ctest;
load mau2.mat;
net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig' 'purelin' 'logsig'
'purelin'},'traincgf');
net.trainParam.goal=0.0000001;
net.trainParam.epochs = 300000;
net = train(net,Alearn,Clearn);
ylearn = sim(net,Alearn);
ytest = sim(net,Atest);
saiso2 = 100*(ytest-Ctest)./Ctest;
load mau3.mat;
net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig' 'purelin' 'logsig'
'purelin'},'traincgf');
net.trainParam.goal=0.0000001;
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
53
net.trainParam.epochs = 300000;
net = train(net,Alearn,Clearn);
ylearn = sim(net,Alearn);
ytest = sim(net,Atest);
saiso3 = 100*(ytest-Ctest)./Ctest;
Sau khi thu được các giá trị sai số tương đối, nhập dữ liệu trên vào phần mềm excel
để tính toán giá trị độ sai chuẩn tương đối. Giá trị độ sai chuẩn tương đối thu được ở
bảng 7:
Bảng 7: Khảo sát sơ bộ độ sai chuẩn tương đối trung bình RSE của các mẫu kiểm
tra
STT mẫu RSE (%) STT mẫu RSE (%) STT mẫu RSE(%)
1 1,1027 28 2,1432 55 0,9345
2 6,5147 29 2,4562 56 7,2459
3 3,5476 30 3,4566 57 2,1234
4 1,2874 31 5,2355 58 3,0596
5 1,8863 32 4,2342 59 4,1949
6 1,3534 33 2,1432 60 3,1946
7 5,3936 34 4,6867 61 2,1948
8 2,5653 35 3,2512 62 6,1395
9 3,8875 36 5,5678 63 7,1252
10 2,3546 37 1,2738 64 2,2495
11 4,0415 38 2,3957 65 3,0184
12 5,9181 39 3,1480 66 2,3594
13 3,8006 40 4,3579 67 11,4567
14 11,1977 41 3,2658 68 8,4359
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
54
15 3,9807 42 2,1479 69 1,153294
16 5,1383 43 5,2568 70 3,8271
17 5,4388 44 6,2567 71 3,8271
18 4,8931 45 3,9376 72 4,5764
19 0,3647 46 0,2859 73 7,5594
20 4,7868 47 2,9859 74 4,4158
21 2,3464 48 9,2578 75 5,8491
22 7,1353 49 4,1035 76 5,6077
23 4,6877 50 3,1056 77 20,4685
24 1,3454 51 2,1349 78 3,0289
25 5,3254 52 2,5082 79 6,6760
26 8,2355 53 6,2068 80 3,93347
27 0,1243 54 7,9375
Dựa vào bảng 7 chúng tôi nhận thấy nếu bỏ mẫu 19, 27, 46 thì kết quả mẫu
học sẽ cho sai số thấp nhất, do đó chúng tôi loại bỏ 3 mẫu trên, và tiến hành tính
toán lại dựa trên mô hình ANN, khi đó ma trận mẫu học chỉ còn lại là 77x5.
3.3. Phương pháp mạng noron nhân tạo kết hợp với hồi quy thành phần
chính (PCR-ANN) xác định đồng thời 5 cấu tử trong dung dịch.
Mục tiêu của luận văn là nghiên cứu xây dựng thuật toán PCR-ANN và áp
dụng phần mềm MATLAB để giải quyết bài toán phân tích đồng thời nhiều cấu tử
trong cùng hỗn hợp trên cơ sở giảm kích thước của tập số liệu nên chúng tôi chỉ tiến
hành nghiên cứu phương pháp xác định với các dung dịch mẫu tự tạo đã biết sẵn
nồng độ của 5 ion kim loại và không có ion lạ ngoài các ion cần phân tích. Ảnh
hưởng của các chất cản trở được xem như ảnh hưởng nền mẫu.
Đối với phương pháp hồi quy đa biến phi tuyến tính, các thuật toán có phức
tạp hơn, bộ số liệu sử dụng vẫn như trên, tuy nhiên các ma trận số liệu đó có kích
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
55
thước rất lớn, thời gian luyện mạng kéo dài. Để giảm kích thước của tập số liệu,
chúng tôi tiến hành sử dụng phương pháp phân tích cấu tử chính. Ma trận độ hấp
thụ quang được chuyển sang 1 hệ tọa độ khác, tại đó, chỉ có 1 số cấu tử ảnh hưởng
trực tiếp đến nồng độ của các ion kim loại khảo sát (cấu tử chính). Do đó, thiết lập
được 1 ma trận đầu vào của mạng noron nhân tạo có kích thước nhở hơn, làm đơn
giản hóa mô hình tính toán và kết quả thu được có độ chính xác cao hơn.
3.3.1. Khảo sát xây dựng mô hình PCA tối ưu.
- Tiến hành nhập ma trận nồng độ và ma trận độ hấp thụ quang của 80 mẫu
chuẩn vào chương trình PCA đã dựng sẵn để xây dựng mô hình hồi quy đa biến trên
cơ sở phân tích cấu tử chính nhằm giảm kích thước tập số liệu.
- Sau khi dùng phương pháp ANN đánh giá sơ bộ, loại trừ các mẫu mắc sai
số thô, ảnh hưởng tới kết quả quá trình phân tích. Bộ số liệu học gồm ma trận nồng
độ của các dung dịch chuẩn chỉ còn kích thước 77x5 và ma trận độ hấp thụ quang
có kích thước 77x151.
- Nhập ma trận độ hấp thụ quang của mẫu học và mẫu kiểm tra Ao (mxn)
trong đó m hàng là số mẫu chuẩn bị ( m= 77+20= 97, n cột là số bước sóng
(n=151).
- Chuẩn hóa tập số liệu đầu vào: stdr = std(Ao) ;
- Chuyển tập số liệu sang 1 tọa độ mới: sr = Ao./repmat(stdr,100,1);
- Tính toán các giá trị tải trọng (loading) và trị số (score), phương sai (var)
[PCALoadings, PCAScores, PCAVar] = princomp(sr);
- Tính tổng giá trị phương sai tích lũy trên các cấu tử:
cumsum(PCAVar./sum(PCAVar) * 100);
Sau khi tính toán vecto cột chứa giá trị phần trăm phương sai tích lũy gồm 151
hàng (tương ứng với 151 bước sóng) thu được như bảng 8 sau:
Bảng 8: Giá trị phương sai tích lũy ứng với 151 cấu tử
Cấu tử Giá trị phương sai tích lũy
1 61,0620135980013
2 94,6386206361863
3 99,4701457087665
4 99,9047763641201
5 99,9675941164431
6 99,9846263560543
7 99,9961983769519
8 99,9968829228295
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
56
9 99,9974242980017
10 99,9976864025098
11 99,9978870269475
12 99,9980840753909
13 99,9982529434438
14 99,9984155586119
15 99,9985570592987
.. .
Bảng 8 thực tế có 151 cấu tử, tương ứng với 151 bước sóng. Sau khi dùng
PCA từ ma trận độ hấp thụ quang 97x151 về nguyên tắc sẽ thu được 151 cấu tử
(PC) nhưng kết quả cho thấy cấu tử 1 (PC1) đã chiếm 61,06% lượng thông tin của
tập dữ liệu, nếu thêm cấu tử thứ hai (PC2) thì phương sai tích lũy đã đạt 94,64%.
Khi thêm một cấu tử nữa (PC3) thì 3 cấu tử đầu này đã chiếm 99,47% lượng thông
tin tập dữ liệu. Từ cấu tử thứ 4 trở đi lượng thông tin thu được tăng không đáng kể.
Từ kết quả trên cho thấy, 3 cấu tử ban đầu có ảnh hưởng chính tới các thông
tin chứa trong tập số liệu. Bảng 16 là độ sai chuẩn tương đối RSE(%) tùy thuộc vào
số cấu tử chính đã chọn.
Bảng 9 : Sự phụ thuộc của RSE vào số cấu tử chính khi phân tích mẫu kiểm tra
Số cấu tử (PC) 1 2 3 4 5
RSE(%) 26,86 3,14 4,00 4,20 5,07
Kết quả ở bảng 8 cho thấy nếu mô hình ANN chỉ chọn 1 cấu tử làm số nút lớp
nhập thì sai số rất lớn là do cấu tử 1 chỉ chiếm khoảng 64% lượng thông tin của tập
dữ liệu ban đầu. Với lượng thông tin đó, rất khó để thiết lập mô hình ANN phù hợp
để xác định đồng thời cả 5 cấu tử.
Tuy nhiên, nếu tăng số cấu tử lên 3, 4 hoặc 5 thì sai số RSE tăng là do lượng
thông tin chứa trong các cấu tử thứ 3, thứ 4 và thứ 5 không ảnh hưởng nhiều tới tập
dữ liệu ban đầu trong khi kích thước tập số liệu lại tăng, vì vậy chúng tôi đã lựa
chọn chỉ 2 cấu tử chính cho các bước nghiên cứu tiếp theo. Như vậy, tập dữ liệu ban
đầu từ kích thước 97x151 cấu tử (ma trận độ hấp thụ quang) được chuyển về kích
thước nhỏ hơn, chỉ còn 97x2 ( ma trận trị số (score) của 97 dung dịch chuẩn và
kiểm tra và 2 PC).
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
57
3.3.2. Xây dựng mô hình PCR- ANN
* Xây dựng mô hình tìm số cấu tử chính (PCA) :
- Nhập toàn bộ giá trị ma trận độ hấp thụ quang của dung dịch chuẩn và dung
dịch kiểm tra thành ma trận Ao (97x151) (97 là số mẫu của dung dịch chuẩn và
dung dịch kiểm tra, 151 là số bước sóng khảo sát) để phân tích cấu tử chính (PCA).
- Chuẩn hóa tập số liệu đầu vào:
stdr = std(Ao) ;
- Chuyển tập số liệu sang 1 tọa độ mới:
sr = Ao./repmat(stdr,100,1);
- Tính toán các giá trị tải trọng (loading) và trị số (score), phương sai tích lũy
(var)
[PCALoadings, PCAScores, PCAVar] = princomp(sr);
- Do số cấu tử chính tối ưu là 2, tách 2 cột đầu tiên trong ma trận trị số
PCAScores làm dữ liệu đầu vào trong mô hình ANN, thu được ma trận mới A’o(
2x97) (97 là số mẫu dung dịch chuẩn và dung dịch kiểm tra, 2 là số cấu tử chính tối
ưu)
* Xây dựng mô hình ANN dựa vào tập số liệu PCA vừa phân tích được.
+ Nhập ma trận đầu vào mẫu học Clearn(5x77) của 77 dung dịch chuẩn chứa
5 ion kim loại cần phân tích (5 hàng, 77 cột).
+ Nhập ma trận đầu ra mẫu học Alearn(2x77) (2 là số cấu tử chính thu được
khi phân tích PCA). Ma trận này lấy từ 77 cột đầu tiên của ma trận A’o.
+ Nhập ma trận nồng độ mẫu kiểm tra Ctest(5x20) của 20 dung dịch chuẩn
chứa 5 cấu tử (5 hàng, 20 cột).
+ Nhập ma trận đầu ra mẫu kiểm tra Atest(2x20). Ma trận này lấy từ 20 cột
cuối cùng của ma trận A’o.
+ Tính toán số liệu theo mô hình ANN tối ưu đã khảo sát
net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig'
'purelin' 'logsig' 'purelin'},'traincgf');
net.trainParam.goal=0.0000001;
net.trainParam.epochs = 300000;
net = train(net,Alearn,Clearn);
ylearn = sim(net,Alearn);
ytest = sim(net,Atest);
saiso = 100*(ytest-Ctest)./Ctest;
- Lưu lại M-file vừa thực hiện được mang tên:PCR- ANN.m
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
58
- Sau khi tính toán, kết quả thu được từ mô hình sẽ là giá trị
+ ylearn : nồng độ của các mẫu học sau quá trình luyện mạng (learning).
+ ytest : nồng độ các mẫu kiểm tra sau quá trình học của mạng (trainning)
+ sai số tương đối của các mẫu kiểm tra sau quá trình học mạng
Thời gian luyện mạng được biểu diễn ở hình 16. Nồng độ và sai số tương đối
của các mẫu kiểm tra sau quá trình học mạng được biểu diễn ở bảng 10
Hình 16 : Mô hình luyện mạng nơron nhân tạo sau khi đã phân tích thành phần
chính.
Như vậy, nếu giảm kích thước tập số liệu thì thời gian tính toán của mô hình
đã được giảm từ 55 phút xuống còn 5phút46 giây.
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
59
Bảng 10: Bảng so sánh nồng độ của các ion kim loại thu được từ mô hìnhANN và mô hình PCR-ANN
Mẫu Nồng độ dung dịch kiểm tra (mg/l)
Nồng độ dung dịch thu được từ mô
hình ANN (mg/l)
Nồng độ dung dịch thu được từ mô
hình PCR-ANN (mg/l)
Cu Ni Co Pb Cd Cu Ni Co Pb Cd Cu Ni Co Pb Cd
1 0,4 0 0,4 3 0,4 0,342 0,010 0,422 2,972 0,382 0,386 0,001 0,415 3,006 0,389
2 0,4 0,6 0 1 0,4 0,415 0,614 0,032 1,002 0,362 0,408 0,604 0,002 1,010 0,393
3 0,6 0,2 0,2 0 0,4 0,489 0,189 0,330
-
0,024
0,377 0,606 0,190 0,200 0,001 0,395
4 0,4 0,2 0,4 3 0 0,381 0,211 0,360 3,028
-
0,003
0,400 0,216 0,401 3,000 0,007
5 0 0,4 0 0 1,2 0,009 0,370
-
0,010
0,011 1,190 0,007 0,400 0,009 0,007 1,189
6 0 0,2 1 0 0 0,036 0,201 0,964 0,001 0,009 0,002 0,190 0,995 0,005 0,006
7 0,2 0 1 0 0 0,203
-
0,008
1,037 0,001
-
0,039
0,190 0,008 0,999 0,004 0,002
8 0 0 0 0 1,6 0,004 0,014
-
0,035
0,024 1,613 0,003 0,000 0,004 0,001 1,593
9 1,2 0,1 0,1 0,5 0,1 1,189 0,130 0,088 0,492 0,109 1,202 0,103 0,108 0,502 0,098
10 1 0,2 0,1 0,5 0,1 0,972 0,184 0,000 0,518 0,058 1,001 0,192 0,100 0,503 0,108
11 0,6 0,6 0 0 0 0,588 0,586 0,084
-
0,042
-
0,020
0,589 0,609 0,007 0,004 0,003
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
60
12 0,3 0,2 0,2 1,5 0,4 0,289 0,246 0,220 1,517 0,404 0,301 0,232 0,205 1,504 0,397
13 0,2 0,2 0,3 1,5 0,4 0,279 0,194 0,258 1,535 0,424 0,187 0,184 0,312 1,495 0,389
14 0,4 0,4 0 0 1 0,372 0,416 0,039
-
0,004
1,021 0,402 0,403 0,008 0,003 1,004
15 0,6 0,4 0 2 0 0,586 0,409 0,037 2,009
-
0,026
0,620 0,403 0,006 2,028 0,001
16 0 0,8 0 0 0,8 0,011 0,778 0,008 0,004 0,847 0,003 0,807 0,000 0,001 0,794
17 0,2 0,2 0,2 1 0,2 0,262 0,187 0,157 0,983 0,213 0,189 0,192 0,194 0,991 0,188
18 0,3 0,1 0,2 1 0,4 0,205 0,120 0,267 0,976 0,411 0,283 0,147 0,212 0,990 0,392
19 0,2 0,3 0,1 1 0,4 0,184 0,315 0,100 0,958 0,416 0,200 0,319 0,094 1,002 0,394
20 0,2 0,2 0,3 0,5 0,4 0,178 0,162 0,359 0,499 0,398 0,167 0,171 0,306 0,519 0,416
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
61
Bảng 11: Nồng độ của các ion kim loại thu được từ mô hình PCR-ANN và sai số tương đối thu được.
Mẫu Nồng độ dung dịch kiểm tra (mg/l)
Nồng độ dung dịch thu được từ mô
hình (mg/l)
Sai số tương đối (%)
Cu Ni Co Pb Cd Cu Ni Co Pb Cd Cu Ni Co Pb Cd
1 0,4 0 0,4 3 0,4 0,386 0,001 0,415 3,006 0,389 3,48 0 3,790 0,228 2,567
2 0,4 0,6 0 1 0,4 0,408 0,604 0,002 1,010 0,393 2,14 0,809 0 1,034 1,736
3 0,6 0,2 0,2 0 0,4 0,606 0,190 0,200 0,001 0,395 1,06 4,547 0,442 0 1,606
4 0,4 0,2 0,4 3 0 0,400 0,216 0,401 3,000 0,007 0,11 8,089 0,345 0,009 0
5 0 0,4 0 0 1,2 0,007 0,400 0,009 0,007 1,189 0 0,177 0 0 0,874
6 0 0,2 1 0 0 0,002 0,190 0,995 0,005 0,006 0 4,907 0,484 0 0
7 0,2 0 1 0 0 0,190 0,008 0,999 0,004 0,002 4,590 0 0,010 0 0
8 0 0 0 0 1,6 0,003 0,000 0,004 0,001 1,593 0 0 0 0 0,387
9 1,2 0,1 0,1 0,5 0,1 1,202 0,103 0,108 0,502 0,098 0,233 3,347 8,263 0,593 1,910
10 1 0,2 0,1 0,5 0,1 1,001 0,192 0,100 0,503 0,108 0,163 3,989 0,058 0,753 8,232
11 0,6 0,6 0 0 0 0,589 0,609 0,007 0,004 0,003 1,748 1,631 0 0 0
Vò Quúnh Thu Cao häc K18
Khoa Hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
62
12 0,3 0,2 0,2 1,5 0,4 0,301 0,232 0,205 1,504 0,397 0,445 16,19 2,850 0,305 0,640
13 0,2 0,2 0,3 1,5 0,4 0,187 0,184 0,312 1,495 0,389 6,061 7,594 4,036 0,313 2,699
14 0,4 0,4 0 0 1 0,402 0,403 0,008 0,003 1,004 0,572 0,755 0 0 0,406
15 0,6 0,4 0 2 0 0,620 0,403 0,006 2,028 0,001 3,482 0,883 0 1,432 0
16 0 0,8 0 0 0,8 0,003 0,807 0,000 0,001 0,794 0 0,882 0 0 0,689
17 0,2 0,2 0,2 1 0,2 0,189 0,192 0,194 0,991 0,188 5,462 3,504 2,675 0,876 5,921
18 0,3 0,1 0,2 1 0,4 0,283 0,147 0,212 0,990 0,392 5,391 47,99 6,045 0,924 1,960
19 0,2 0,3 0,1 1 0,4 0,200 0,319 0,094 1,002 0,394 0,449 6,368 5,420 0,240 1,353
20 0,2 0,2 0,3 0,5 0,4 0,167 0,171 0,306 0,519 0,416 16,01 14,08 2,127 3,857 4,133
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
63
So sánh các giá trị nồng độ thu được từ bảng 10 cho thấy, phương pháp PCR-
ANN cho phép tính toán nồng độ các cấu tử gần với giá trị thực của các dung dịch
chuẩn hơn. Đồng thời bảng 11 cho thấy, nồng độ các cấu tử thu được từ mô hình PCR-
ANN cho thấy, sai số tương đối đều rất nhỏ, phù hợp để xác định đồng thời nhiều cấu
tử trong cùng 1 dung dịch và phương pháp PCR-ANN cho giá trị RSE(%) là rất thấp
(0%). Có một số mẫu mà nồng độ của 1 trong 5 cấu tử bằng 0, thì kết quả nồng độ đó
thu được từ mô hình cũng là rất nhỏ (khoảng 0,001ppm). Mẫu 18 có sai số rất lớn, điều
này chỉ có thể giải thích là do bản thân mẫu đã mắc sai số hệ thống do pha chế.
Các phương pháp xác định đồng thời các cấu tử trong cùng dung dịch khác
thường gặp phải khó khăn: đối tượng phân tích phải nằm trong khoảng tuyến tính, các
mẫu phân tích không mắc sai số hệ thống, hoá chất tinh khiết Nhưng khi phân tích
đồng thời Cu2+, Co2+, Ni2+, Pb2+, Cd2+, chúng tôi đã tiến hành thí nghiệm với các mẫu
chuẩn nằm ngoài khoảng tuyến tính, các kết quả phân tích mắc phải sai số hệ thống khi
khảo sát sự phụ thuộc của độ hấp thụ quang vào nồng độ, đồng thời mẫu trắng có độ
hấp thụ quang khá cao (cao nhất là 0,217) nhưng những nhược điểm đó đã được mạng
nơron nhân tạo khắc phục. Do đó hàm lượng các kim loại thu được chính xác hơn. Sai
số tương đối nhỏ nhất là 0% và lớn nhất là 47%. Tuy nhiên, các giá trị sai số của mẫu
18 đều rất lớn, chứng tỏ là mẫu kiểm tra số 18 đã mắc sai số thô trong quá trình pha
mẫu.
Từ các kết quả trên cho thấy mạng nơron nhân tạo là một phương pháp tối ưu để
giải quyết các bài toán xác định đồng thời các cấu tử trong cùng hỗn hợp ngay cả khi
hỗn hợp các cấu tử có tín hiệu đo tuyến tính hay phi tuyến tính với nồng độ chất phân
tích. Tuy nhiên, nếu chỉ sử dụng phương pháp mạng nơron nhân tạo, thì do kích thước
tập số liệu khá lớn, khiến cho thời gian luyện mạng mất nhiều thời gian, có khi lên tới
60 phút. Vì vậy, chúng tôi sử dụng phương pháp phân tích thành phần chính để giảm
kích thước tập số liệu, rút ngắn thời gian phân tích mà không làm mất lượng thông tin
có trong tập dữ liệu ban đầu.
Vì thời gian có hạn nên chúng tôi chưa thử được mô hình mạng PCR-ANN để xác
định hàm lượng Cu2+, Co2+, Ni2+, Pb2+, Cd2+ trong mẫu thực tế và so sánh với các
phương pháp khác cũng như thử trên các đối tượng khác. Những nghiên cứu này sẽ
được tiến hành trong thời gian tới.
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
64
3.3.3. Đánh giá tính hiệu quả của phương pháp PCR-ANN
Phương pháp PCR-ANN là phương pháp hồi quy đa biến cho phép phân tích
đồng thời nhiều cấu tử, độ chính xác cao. Để đánh giá tính hiệu quả của mô hình,
chúng tôi tiếp tục xây dựng mô hình PCR-ANN để xác định đồng thời 3 ion kim loại
Ce2+, Cu2+ và Ca2+ dựa trên kết quả phân tích của đề tài “ xác định đồng thời các kim
loại Ce, Cu và Ca trong lớp phủ bảo vệ kim loại đen bằng phương pháp hấp thụ phân
tử sử dụng mạng ANN” – luận văn thạc sĩ khoa học (2006) của tác giả [11]
Kích thước tập số liệu gồm 2 ma trận:
+ Ma trận độ hấp thụ quang A (342x 76) 342 mẫu của hỗn hợp 3 ion kim loại
Ce2+, Cu2+ và Ca2+ tại 76 bước sóng (từ 580 nm đến 730 nm).
+ Ma trận nồng độ C (342 x 3) (342 mẫu và 3 ion kim loại)
Phân tích thành phần chính:
+ Chuẩn hóa tập số liệu đầu vào: stdr = std(Ao) ;
+ Chuyển tập số liệu sang 1 tọa độ mới: sr = Ao./repmat(stdr,342,1); 342 là
số mẫu tiến hành đo độ hấp thụ quang.
+ Tính toán các giá trị tải trọng (loading) và trị số (score), phương sai (var)
[PCALoadings, PCAScores, PCAVar] = princomp(sr);
+ Tính tổng giá trị phương sai tích lũy trên các cấu tử:
cumsum(PCAVar./sum(PCAVar) * 100);
+ Sau khi tính toán vecto cột chứa giá trị phần trăm phương sai tích lũy gồm 76
hàng (tương ứng với 76 bước sóng) thu được như bảng 12 sau:
Cấu tử Giá trị phương sai tích lũy
1 91,3339784792356
2 97,2451607447669
3 99,7079781808949
4 99,8949050200568
5 99,9775847568665
6 99,9921621701294
7 99,9959357800121
8 99,9974069935249
9 99,9979538219829
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
65
10 99,9984831482205
11 99,9989147297407
12 99,9992664238834
13 99,9995130898429
14 99,9996696141363
15 99,9997843681934
.. ..
Như vậy cấu tử đầu tiên chiếm khoảng 91,33% lượng thông tin chứa trong tập
số liệu ban đầu. Đến câu tử thứ 3, chiếm 99,71% lượng thông tin chứa trong tập số
liệu ban đầu, các cấu tử phía sau có phương sai tích lũy tăng không đáng kể. Vì vậy,
chúng tôi chọn 3 cấu tử chính cho các bước nghiên cứu tiếp theo.
Xây dựng mô hình ANN dựa vào tập số liệu PCA vừa phân tích được.
+ Nhập ma trận đầu vào mẫu học Clearn(3x300) của 300 dung dịch chuẩn chứa
3 ion kim loại cần phân tích (5 hàng, 300 cột).
+ Nhập ma trận đầu ra mẫu học Alearn(3x300) (3 là số cấu tử chính thu được
khi phân tích PCA). Ma trận này lấy từ 300 cột đầu tiên của ma trận A’o.
+ Nhập ma trận nồng độ mẫu kiểm tra Ctest(3x42) của 42 dung dịch chuẩn chứa
3 cấu tử (3 hàng, 42 cột).
+ Nhập ma trận đầu ra mẫu kiểm tra Atest(3x42). Ma trận này lấy từ 42 cột cuối
cùng của ma trận A’o.
+ Tính toán số liệu theo mô hình ANN tối ưu đã khảo sát
net = newff(minmax(Alearn),[100 100 100 100 3],{'logsig' 'logsig'
'purelin' 'logsig' 'purelin'},'traincgf'); % 3 là số cấu tử khảo sát
net.trainParam.goal=0.0000001;
net.trainParam.epochs = 300000;
net = train(net,Alearn,Clearn);
ylearn = sim(net,Alearn);
ytest = sim(net,Atest);
saiso = 100*(ytest-Ctest)./Ctest;
- Lưu lại M-file vừa thực hiện được mang tên:PCR- ANN2.m
- Sau khi tính toán, kết quả thu được từ mô hình sẽ là giá trị
+ ylearn : nồng độ của các mẫu học sau quá trình luyện mạng (learning).
+ ytest : nồng độ các mẫu kiểm tra sau quá trình học của mạng (trainning)
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
66
+ sai số tương đối của các mẫu kiểm tra sau quá trình học mạng
Nồng độ và sai số tương đối của các mẫu kiểm tra sau quá trình học mạng được
biểu diễn ở bảng 12 :
Bảng 12 : So sánh nồng độ các ion kim loại tính toán được từ mô hình PCR-ANN
và mô hình ANN của tác giả [11]
(1) : là hàm lượng kim loại tìm được từ mô hình PCR-ANN
(2) : là hàm lượng kim loại tìm được từ mô hình ANN của tác giả [11]
(0) : là hàm lượng kim loại thực có.
Mẫu Ca (1) Ca (2) Ca
(0)
Ce (1) Ce (2) Ce
(0)
Cu (1) Cu (2) Cu(0)
1 -0,057 -0,155 0 10,050 9,971 10 9,930 10,184 10
2 -0,017 -0,114 0 9,904 9,826 10 24,962 25,251 25
3 0,046 -0,034 0 14,912 15,327 15 9,925 10,141 10
4 -0,015 0,174 0 14,984 15,147 15 20,045 19,969 20
5 0,097 -0,083 0 20,046 19,875 20 5,030 10,057 10
6 -0,107 -0,042 0 20,008 19,777 20 9,876 25,178 25
7 0,000 0,122 0 20,034 24,769 25 25,105 15,020 15
8 -0,049 0,073 0 25,082 24,771 25 14,974 25,208 25
9 0,229 0,035 0 24,957 29,987 30 24,609 4,930 5
10 0,086 0,187 0 29,984 29,874 30 4,959 19,862 20
11 -0,145 0,099 0 30,034 39,934 40 19,982 4,959 5
12 0,012 0,218 0 39,969 39,956 40 5,011 19,912 20
13 -0,010 5,167 5 40,039 -0,091 0 19,972 4,999 5
14 4,987 5,021 5 -0,097 -0,076 0 4,968 25,094 25
15 10,073 10,071 10 -0,006 0,167 0 25,104 15,169 15
16 9,985 10,003 10 -0,072 -0,123 0 14,937 2,940 30
17 14,912 14,827 15 0,017 0,420 0 29,955 9,934 10
18 14,959 14,950 15 -0,023 -0,093 0 10,008 24,935 25
19 20,013 19,843 20 0,055 0,012 0 25,023 9,857 10
20 19,887 20,040 20 0,020 -0,143 0 10,051 29,940 30
21 24,980 24,913 25 -0,048 -0,041 0 29,977 9,948 10
22 24,939 25,141 25 0,012 -0,198 0 9,996 20,122 20
23 30,016 30,142 30 -0,202 -0,301 0 19,955 5,103 5
24 29,998 30,110 30 -0,040 -0,240 0 4,949 20,056 20
25 5,051 4,803 5 10,050 9,975 10 20,081 -0,041 0
26 4,915 4,880 5 29,987 29,879 30 0,023 -0,119 0
27 9,922 10,164 10 15,076 14,970 15 0,054 0,014 0
28 10,053 9,928 10 25,058 24,874 25 -0,048 -0,024 0
29 15,101 15,153 15 15,010 14,785 15 0,015 -0,048 0
30 14,930 15,139 15 29,973 29,824 30 -0,003 -0,066 0
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
67
31 19,957 20,064 20 14,996 15,000 15 0,150 0,007 0
32 19,913 19,956 20 30,026 29,886 30 -0,012 0,008 0
33 24,981 25,007 25 14,949 14,986 15 0,058 0,024 0
34 25,025 24,810 25 29,922 29,934 30 0,065 0,036 0
35 30,070 29,943 30 19,922 19,758 20 0,080 0,103 0
36 29,979 30,035 30 40,011 39,812 40 -0,024 0,007 0
37 5,040 4,806 5 10,112 10,211 10 9,928 10,184 10
38 4,981 4,945 5 10,042 9,978 10 19,985 19,983 20
39 5,043 4,992 5 15,089 15,028 15 9,937 10,137 10
40 4,960 5,045 5 14,997 15,094 15 25,123 25,230 25
41 4,936 4,811 5 20,056 20,045 20 9,910 10,053 10
42 5,004 4,878 5 20,006 19,975 20 25,032 25,155 25
43 5,027 5,066 5 24,956 25,051 25 4,976 4,913 5
44 5,000 5,008 5 24,995 24,910 25 24,938 25,154 25
45 4,789 4,833 5 30,048 29,994 30 9,977 9,950 10
46 5,083 5,039 5 30,148 29,886 30 20,020 19,852 20
47 4,990 4,885 5 39,925 40,084 40 10,131 10,155 10
48 4,982 4,935 5 40,085 40,114 40 24,995 25,146 25
49 9,958 9,893 10 10,003 10,225 10 10,058 10,145 10
50 9,985 10,007 10 9,950 9,985 10 25,033 25,222 25
51 10,070 10,032 10 15,035 15,021 15 10,070 10,094 10
52 9,958 10,176 10 14,873 15,112 15 25,100 25,199 25
53 9,996 9,927 10 14,967 20,066 20 5,007 4,995 5
54 10,041 10,057 10 20,007 20,149 20 24,944 25,118 25
55 10,105 9,794 10 24,853 25,065 25 10,333 9,923 10
56 10,001 10,013 10 25,025 24,904 25 24,931 25,094 25
57 9,953 9,958 10 30,128 29,894 30 4,911 4,975 5
58 9,999 9,989 10 29,937 29,830 30 20,010 19,912 20
59 10,001 9,933 10 39,966 39,853 40 5,064 5,101 5
60 9,949 9,963 10 40,071 39,985 40 24,986 25,125 25
61 14,889 14,890 15 9,997 10,278 10 10,049 10,084 10
62 15,020 14,865 15 10,002 10,047 10 30,024 29,907 30
63 14,954 14,939 15 15,016 14,843 15 9,866 10,053 10
64 14,938 15,015 15 14,933 14,673 15 20,022 19,943 20
65 15,010 14,910 15 20,049 20,027 20 9,931 10,029 10
66 15,003 15,077 15 20,060 19,860 20 15,006 15,070 15
67 14,833 14,787 15 24,952 25,137 25 10,186 9,949 10
68 14,953 14,935 15 25,025 25,043 25 19,873 19,953 20
69 14,914 15,120 15 30,030 29,826 30 14,998 15,192 15
70 15,065 15,106 15 30,027 29,891 30 25,022 24,721 25
71 14,993 14,906 15 39,870 39,721 40 19,965 19,930 20
72 15,010 14,786 15 40,003 39,770 40 30,035 30,007 30
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
68
73 19,994 19,944 20 9,979 10,166 10 10,041 10,002 10
74 20,015 20,015 20 9,966 9,936 10 19,951 20,039 20
75 20,032 20,108 20 15,056 14,707 15 5,026 4,977 5
76 19,998 19,954 20 14,946 15,185 15 24,953 25,180 25
77 19,890 19,834 20 20,019 20,115 20 9,907 9,966 10
78 20,113 19,922 20 20,104 20,157 20 25,054 25,132 25
79 20,193 19,647 20 25,053 25,024 25 10,046 9,892 10
80 20,001 19,759 20 24,888 24,933 25 24,975 25,126 25
81 19,923 20,049 20 30,014 29,858 30 5,002 4,990 5
82 19,958 20,055 20 29,879 29,879 30 20,110 19,973 20
83 20,077 19,865 20 39,774 40,066 40 9,976 9,992 10
84 19,957 19,781 20 39,960 40,113 40 25,002 25,104 25
85 25,036 24,867 25 9,946 10,005 10 10,161 10,090 10
86 25,004 24,734 25 10,028 9,900 10 24,907 25,203 25
87 24,970 25,116 25 14,974 14,657 15 5,016 5,051 5
88 25,010 25,103 25 15,016 14,830 15 20,002 20,063 20
89 24,779 24,875 25 20,080 20,027 20 9,830 10,075 10
90 25,053 25,084 25 20,003 19,903 20 20,149 20,055 20
91 25,057 24,952 25 24,967 24,824 25 15,103 15,131 15
92 25,006 25,151 25 24,986 24,787 25 30,102 30,093 30
93 24,960 24,833 25 30,096 29,922 30 14,959 15,223 15
94 25,011 24,759 25 29,981 30,024 30 25,007 24,948 25
95 25,057 25,128 25 40,026 39,957 40 4,968 5,044 5
96 25,048 24,740 25 40,065 40,166 40 25,054 25,111 25
97 30,051 29,904 30 9,999 10,020 10 9,957 10,081 10
98 29,983 29,927 30 9,949 9,937 10 29,971 29,950 30
99 29,976 29,980 30 14,996 15,031 15 15,008 14,966 15
100 29,902 29,805 30 15,050 15,414 15 24,937 25,066 25
101 30,073 30,080 30 20,156 19,749 20 5,019 5,164 5
102 30,034 29,782 30 19,966 19,988 20 24,930 25,057 25
103 29,969 30,063 30 24,953 24,889 25 10,056 10,133 10
104 29,992 30,166 30 24,965 24,901 25 20,043 20,098 20
105 29,991 29,766 30 29,919 29,909 30 14,896 15,275 15
106 30,045 29,628 30 30,024 30,056 30 24,943 24,907 25
107 30,014 30,028 30 40,075 39,909 40 10,002 10,022 10
108 30,150 29,763 30 39,991 40,078 40 25,044 24,976 25
Các kết quả tính toán ở bảng 12 cho thấy, hàm lượng tính được mô hình PCR-ANN
hoàn toàn phù hợp với kết quả phân tích của tác giả, đồng thời, rất nhiều mẫu tính toán
(mẫu 1, 4, 6....) được cho kết quả tốt hơn kết quả ban đầu của tác giả.
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
69
KẾT LUẬN
Matlab là chương trình phần mềm hỗ trợ đắc lực cho tính toán với ma trận và
hiển thị. Với những ưu điểm đó, Matlab ngày càng trở nên thông dụng và là một công
cụ trợ giúp hữu hiệu nhằm giải quyết các vấn đề rất đa dạng trong công việc trong
nghiên cứu và ứng dụng. Trong hóa học phân tích, việc sử dụng Malab để lập trình tính
toán đối với phương pháp hồi quy đa biến tuyến tính và phi tuyến tính cho phép xác
định nhanh đồng thời các cấu tử trong cùng hỗn hợp mà không cần tách và làm giàu,
đem lại hiệu quả rất cao.
Với mục tiêu ban đầu đặt ra cho luận văn là nghiên cứu xác định đồng thời một
số kim loại bằng phương pháp trắc quang sử dụng thuật toán mạng nơron nhân tạo kết
hợp với hồi qui thành phần chính (PCR-ANN), sau một thời gian nghiên cứu chúng tôi
thu được một số kết quả sau:
1. Đã nghiên cứu lý thuyết về phương pháp hồi quy đa biến tuyến tính sử dụng
mạng nơron nhân tạo, phương pháp phân tích thành phần chính nhằm giảm kích
thước tập số liệu, đưa ra được các thuật toán và lập trình tìm ra số cấu tử chính, mô
hình mạng nơron nhân tạo tối ưu để tính nồng độ các cấu tử trong hỗn hợp cần phân
tích. Đặc biệt đây là công trình đầu tiên tại Việt Nam đã ứng dụng phần mềm
MATLAB trong việc lập mô hình mạng nơron nhân tạo và mạng nơron nhân tạo giải
bài toán xác định đồng thời các chất không có tính cộng tính trong phương pháp trắc
quang. Đóng góp này đã đem lại công cụ phần mềm để giải quyết hồi qui đa biến
bằng MATLAB- một phần mềm chứng tỏ những ưu điểm về sử dụng đơn giản và
tính tiện dụng cao so với phần mềm khác,
2. Đã khảo sát các điều kiện hình thành các phức màu Ni- PAR, Co- PAR, Cu –
PAR, Pb- PAR và Cd- PAR với các cực đại hấp thụ tương ứng là 495 nm, 496 nm, 499
nm; 524 nm và 512nm ở pH 10, Nồng độ tối ưu PAR là 1,5.10-4M, Đường chuẩn đơn
biến Ni2+ tuyến tính trong khoảng 0,03 – 1 ppm, Co2+: 0,04 – 1,2 ppm, Pb2+: 0,2 - 6
ppm; Cu2+ : 0,04-1,4 ppm và Cd2+: 0,05-1,7ppm,
3. Đã ứng dụng mô hình mạng nơron nhân tạo kết hợp với hồi quy thành phần
chính và tìm ra mô hình hồi quy tối ưu nhờ giảm kích thước tập số liệu từ 151 bước
sóng xuống chỉ còn 2 cấu tử chính mà không làm mất đi lượng thông tin có trong tập
dữ liệu. Mạng lan truyền thẳng (MLP) với 2 nơron lớp nhập, 4 lớp ẩn, mỗi lớp ẩn có
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
70
100 nơron, 5 nơron lớp xuất tương ứng với nồng độ của 5 ion Cd2+, Co2+, Cu2+, Ni2+,
Pb2+ , kết quả thu được có sai số rất thấp (dưới 5%), giảm thời gian luyện mạng ANN
từ 55 phút xuống còn 5 phút 46 giây. Các phương pháp xác định đồng thời các cấu tử
trong cùng dung dịch khác thường gặp phải khó khăn: đối tượng phân tích phải nằm
trong khoảng tuyến tính, các mẫu phân tích không mắc sai số hệ thống, hoá chất tinh
khiếtNhưng khi phân tích đồng thời các ion Cd2+, Co2+, Cu2+, Ni2+, Pb2+ chúng tôi
đã tiến hành thí nghiệm với các mẫu chuẩn nằm ngoài khoảng tuyến tính, các kết quả
phân tích mắc phải sai số hệ thống khi khảo sát sự phụ thuộc của độ hấp thụ quang
vào nồng độ, đồng thời mẫu trắng có độ hấp thụ quang khá cao (0,071) nhưng những
nhược điểm đó đã được mạng nơron nhân tạo khắc phục. Do đó hàm lượng các kim
loại thu được là rất chính xác, Sai số tương đối nhỏ nhất là 0% và lớn nhất là 14%,
những mẫu có sai số lớn có thể do quá trình pha chế.
Từ các kết quả trên cho thấy mạng nơron nhân tạo là một phương pháp tối ưu để
giải quyết các bài toán xác định đồng thời các cấu tử trong cùng hỗn hợp ngay cả khi
hỗn hợp các cấu tử có tín hiệu đo tuyến tính hay phi tuyến tính với nồng độ chất phân
tích. Phần mềm Matlab là phần mềm đơn giản và có rất nhiều tiện ích, giải quyết được
nhiều bài toán phức tạp trong hóa phân tích. Đây là chương trình hỗ trợ tính toán rất
mạnh và sinh viên có thể dễ dàng hiểu được. Chúng tôi hi vọng rằng phần mềm Matlab
sẽ được đưa vào giảng dạy trong nhà trường và được nghiên cứu sâu hơn trong hoá học
nói chung cũng như hoá học phân tích nói riêng.
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
71
TÀI LIỆU THAM KHẢO
Tiếng Việt
1. Trần Thúc Bình (2002), Trần Tứ Hiếu, Phạm Luận (1996). Xác định Trắc quang
Đồng, Kẽm, Mangan, Niken trong cùng hỗn hợp bằng Pyridin-Azo-Naphtol
(PAN), Tạp chí phân tích Hóa, Lý và Sinh học, T,1, số 3+4, tr 24 – 25.
2. Nguyễn Xuân Chiến (2006), Nghiên cứu xác định đồng thời uran và thori bằng
một số phương pháp phân tích hoá lý hiện đại, Luận án tiến sĩ hoá học, Trường
ĐHKHTN, ĐHQGHN.
3. Bùi Công Cường, Nguyễn Doãn Phước (2001), Hệ mờ, mạng nơron và ứng dụng,
Nhà xuất bản Khoa học và kĩ thuật.
4. Nguyễn Hoàng Hải, Nguyễn Việt Anh (2005). Lập trình Matlab và ứng dụng. Nhà
xuất bản khoa học và kĩ thuật, Hà Nội.
5. Trương Thị Hiên, “Xác định Coban, Niken trong nước bằng phương pháp phổ F-
AAS sau khi làm giàu trên than hoạt tính mang thuốc thử PAR”, 2008, Khoá luận
tốt nghiệp, Khoa Hóa học, Trường ĐHKHTN – ĐHQGHN,
6. Trần Tứ Hiếu, Từ Vọng Nghi, Nguyễn Xuân Trung, Nguyên Văn Ri (2003), “Các
phương pháp phân tích công cụ”, NXB Đại học quốc gia Hà Nội
7. Trần Tứ Hiếu (2003), “Phân tích trắc quang phổ hấp thụ UV – VIS”, Nhà Xuất bản
Đại học quốc gia Hà Nội,
8. Trần Tứ Hiếu, Trần Thúc Bình, Đặng Vân Khánh (2001), “Định lượng đồng thời
các Vitamin B (B1, B2, B3, B5, B6) bằng phương pháp phân tích phổ toàn phần”,
tạp chí Phân tích Hóa, Lý và Sinh học, T,6, số 3, tr1 – 4.
9. Phan Văn Khoa, Lưu Trường Văn, Lê Kiều. Mạng nơron nhân tạo (ANN) và giới
thiệu một số nghiên cứu, ứng dụng trong dự án đầu tư.
10. Phạm Luận (1989), Sổ tay pha chế dung dịch, lưu hành nội bộ - trường Đại học
Khoa học tự nhiên – ĐHQGHN.
11. Nguyễn Thi Phương “xác định đồng thời các kim loại Ce, Cu và Ca trong lớp phủ
bảo vệ kim loại đen bằng phương pháp hấp thụ phân tử sử dụng mạng ANN”.
Luận văn thạc sĩ (2006) trường ĐHKHTN
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
72
12. Nguyễn Đình Luyện (2002), nghiên cứu sự tạo phức đa-ligan trong hệ Ho(III)-4-
(2-pyridylazo)-rezoxinol (PAR)-CCl3COOH bằng phương pháp trắc quang, tạp
chí khoa học, Đại học Huế, số 12,
13. Hoàng Nhâm (2000)” Hoá học vô cơ ” , NXB Giáo dục, tập 3
14. Phùng Thị Nga (2010) Xác định đồng thời Ni, Co, Pd trong bản mạch điện tử bằng
phương pháp trắc quang với thuốc thử PAN sử dụng thuật toán hồi quy đa biến”,
luận văn thạc sĩ, trường ĐHKHTN.
15. Tạ Thị Thảo (2005), “Bài giảng chemometrics”, Lưu hành nội bộ - Trường Đại học
Khoa Học Tự Nhiên – Đại học Quốc Gia Hà Nội,
16. Nguyễn Minh Thu (1994), Luận văn tốt nghiệp. Khoa Hoá, bộ môn hoá phân tích,
Hà Nội.
17. Mai Xuân Trường, Trần Tứ Hiếu, Đặng Ứng Vận, Mai Thị Hậu (2005). Xác định
đồng thời các nguyên tố Ba, Ca, Sr, Pb cũng như các nguyên tố đất hiếm bằng
lập trình sử dụng sai số tương đối trong phép đo quang. Tuyển tập báo cáo khoa
học tại hội nghị khoa học phân tích hóa, lí và sinh học Việt Nam lần thứ hai, tr
45 – 51.
18. Mai Xuân Trường, Trần Tứ Hiếu, Đặng Ứng Vận (2005), Xác định đồng thời các
nguyên tố Zn(II), Co(II), Cd(II), Pb(II) và Hg(II) bằng phương pháp trắc quang
theo phương pháp lọc Kalman, Tuyển tập báo cáo khoa học tại hội nghị khoa
học phân tích hóa, lí và sinh học Việt Nam lần thứ hai, tr,29-33
19. Mai Xuân Trường, Trần Tứ Hiếu, Đặng Ứng Vận, Mai Thị Hậu (2005), Xác định
đồng thời các nguyên tố Ba, Ca, Sr, Pb cũng như các nguyên tố đất hiếm bằng
lập trình sử dụng sai số tương đối trong phép đo quang, tuyển tập báo cáo khoa
học tại hội nghị khoa học phân tích hóa, lí và sinh học Việt Nam lần thứ hai, tr
45-51.
20. Đào Hữu Vinh, Lâm Ngọc Thụ (người dịch), chuẩn độ phức chất, NXB Khoa
học kĩ thuật Hà Nội.
21. Đinh Thành Việt, Trần Hoàng Khứ “Kết hợp hệ chuyên gia và nơron nhân tạo
chuẩn đoán sự cố tiềm ẩn” - tài liệu mạng internet.
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
73
22. Nguyễn Đức Kỳ (2006), Nghiên cứu xác định đồng thời một số kim loại nặng
bằng phương pháp chuẩn đa biến sử dụng mạng nơron nhân tạo, luận văn thạc
sĩ khoa học, trường ĐHKHTN
23. Nhận dạng giọng nói http:// w w w ,vica,vnn,vn/uni/vica5/abstracts/v95
Tiếng Anh
24. A, Abbaspour, L, Baramakeh, “Novel zirconium optical sensor based on
immobilization of Alizarin Red S on a triacetylcellulose membrane by using
principle component analysis artificial neural network”, Sensors and Actuators
B 114 (2006) , pp, 950 – 956
25. A, Abbaspour, L, Baramakeh, Application of principe component analysis-
artificial neural network for simultaneuos determination of zirconium and
hafnium in real samples, Spectrochimica Acta Part A, vol 64 (2006), pp 477-
482,
26. Ali A, Ensafi, T, Khayamian, R, Tabaraki, Simultaneuos kinetic determination of
thiocyanate and sulfide using eigenvalue ranking and correlation ranking in
principal component – wavelet neural network. Talanta, vol 71 (2007), pp 2021
-2028,
27. Afsaneh Safavi, Omran Moradlou, Saeed Maesum. Simultaneuos kinetic
determination of sulfite and sulfide using artificial neural networks. Talanta 62
(2004), pp, 51-56.
28. Bruno L, Batista, Jairo L, Rodrigues, Juliana A, Nunes, Luciano Tormen, Adilson
J, Curtius, Fernando Barbosa Jr, (2008), Simutalneuos determination of Cd, Cu,
Mn, Ni, Pb and Zn in nail samples by inductively coupled plasma mass
spectrometry (ICP-MS) after tetramethylammonium hydroxide solubilization at
room temperature: Comparison with ETAAS. Talanta, vol, 76, pp,575 – 579.
29. Dr Martin Goosey and Dr Rod Kellner, “A Scoping Study End-of-Life Printed
Circuit Boards”, ScienceDirect
30. B. Sandell, Hiroshi Onishi. Photometric determination of traces of metals. John
wiley and sons, 2002
31. G, Chakrapani, D,S,R, Murty, P,L, Mohanta, R,Rangaswamy, Sorption of PAR-
metal complexs on activated carbon as a rapid preconcentration method for the
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
74
determination of Cu, Co, Cd, Cr, Ni, Pb and V in ground water. Journal of
Geochemical Exploration 63 (1998) 145 -152,
32. He CY, Sun YM, Wu GH, Chen R (2001), Application of artifical neural network
to simultaneous spectrophotometric determination of Cu, Co and Ni, Guang Pu
Xue Yu Guang Pu Fen Xi, 21(5), pp,719-722,
33. Howard Demuth Mark Beale (1998), “Neural Network Toolbox For Use with
MATLAB”
34. Hua-Kuan Lin, Shou-Rong Zhu, Zhi-Fen Zhou, Xun-Cheng Su, Zong-Xin Gu and
Yun-Ti Chen (1998), Calorimetric determination of the enthalpies of coordination
of competitive ternary mixed-ligand complex compounds, Copper(II)-12-(2′-
hydroxy-5′-bromo-benzyl)-1,4,7,10-tetraazacyclo-tridecane-11,13-dione-α-
aminoacids and 5-substituted 1,10-phenanthrolines systems, Polyhedron, Volume
17, Issues 13-14, Pages 2363-2371,
35. Ivo M, Raimundo Jr, R, Narayanaswamy, “Simultaneuos determination of Zn(II),
Cd(II) and Hg(II) in water”, Sensors and Actuators B 90 (2003) , pp, 189 – 197,
36. Masoumeh Hasani, Mahsa Moloudi, “Application of principal component-artificial
neural network models for simultaneous determination of phenolic compounds by a
kinetic spectrophotometric method” , Journal of Hazardous Materials 157 (2008) 161 -
169.
37. K, Zarei, M, Atabati and L, Kazemi, (2005), “Simultaneous determination of
Fe(II) and Fe(III) in pharmaceutical folmulations with chromogenic mixed
reagent by using pricipal component artificial neural network and mutivariate
calibration”, II Farmaco, Vol, 60, Issuel, pp.37-42,
38. K,D,Khalaf, A, Morales-Rubio, M, Dela Guardia, J,M, Garcia, F, Jimenez, and
J,J,Arias, Simultaneuos kinetic determination of Carbamate Pesticides after
Derivatization with p-Aminophenol by using Partical Least Squares, Micro
chemical journal (1996) vol 53, pp, 461-471,
39. M Nasiddurin Khan, Aila Sarwar (2001), Analytical Sciences, Vol,17, 1195-
119745. Mojtaba Shamisipur, Bahram Hemmateenejad, Morteraz Akhond,
“Multicomponent acid-base titration by principal component-artificial neural
network calibration”. Analytical Chimica Acta 461 (2002).pp 147-153.
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
75
40. Van den Berg , C,M,G and Z,Q,Huang, (1986), Determination of copper,
cadminium and lead in sea water by cathodic stripping voltammetry of complexes
with 8 – hydroxyquinoline, J,Electroanal, Chem, 215, 111- 121
41. Oi-Wah Lau and Sing- Yiu Ho (1993), “Simultaneous determination of traces of
iron, cobalt, nicken, copper, mercury, and lead in water by energy – dispersive
x- ray fluorescence spectrometry after preconcentraton as their piperazino-1,4-
bis(dithiocarbamate) complexes”. Analytica Chimica Acta, Volume 280, Issue
2, 16 August 1993, pp 269-277
42. Rao, K,S,, T, Balaji, T, Prasada Rao, Y, Babu, G,R,K, Naidu (2002),
“Determination of Iron, Cobalt, Nikel, Manganese, Zinc, Copper, Cadmium and
Lead in Human Hair by Inductively Coupled Plasma-atomic Emission
Spectrometry”, Spectrochim, Acta B: Atomic Spec,57, pp,1333-1338.
43. Rigin V (1993), “Simultaneous atomic fluorescence spectrometric determination
of traces of iron, cobalt and nickel after conversion to their carbonyls and gas-
phase atomization by microwave – induced plasma”. Anal, Chim, Acta.
Vol,283, pp 895-901.
44. She Z and Wang Z (1993). “Simultaneuos determination of cadmium, nickel, zinc,
cobal, iron and manganese by kalman filter polarography”. Fensi Huaxue, vol
21, pp 1313-1316.
45. SHIGEYA SATO, TOSHIE SATO and SUMIO UCHIKAOA (1987), “Synthesis
of 2 – (3,5 – dicloro – 2- pyridylazo) – 5 – dimetylaminophenol and its
application to the spẻctophotometric determination of cobant”, Talanta, Vol 34,
No 3, pp 369 – 371.
46. Xie N, Huang C and Fu HD (1990), “Simultaneuos determination of trace
copper, iron, nickel, zinc, cobal and lead in human hair by ion
chromatography”. Sepu, vol 8, pp, 114-116.
47. Yongnian Ni, Guowen Zhang, Serge Kokot (2004) “Simultaneous
spectrophotometric determination of maltol, ethyl maltol, vanilin and ethyl
vanilin in foods by multivariate calibration and artificial neural networks”.
Food Chemistry, vol 89 (2005), pp 465-473,
Vò Quúnh Thu Cao häc K18
Khoa hãa häc-Trêng §HKHTN LuËn v¨n Th¹c sÜ
76
48. Ying Dou, Tingting Zou, Tong Liu, Nan Qu, Yulin Ren, “Calibration in non-
linear NIR spectroscopy using principal component artificial neural networks”,
Spectrochimica Acta Part A, vol 68 (2007), pp 1201-1206.
49. Zi-Tao Jang, Jimmy C,Yu, Ho-Yan Liu (2005), “Simultaneuos determination of
cobal, copper and zinc by energy dispersive X-ray fluorescence spectrometry
after preconcentration o PAR-loader ion-exchange resin”. Analytical science,
vol 21, pp 851-854.
50. E,B, Sandell, “Photometric determination of trace of element”, Wiley Interscience.
51. Varinder Kaur, Jatinder Singh Aulakh and Ashok Kumar Malik (2007), “A new
approach for simultaneous determination of Co(II), Ni(II), Cu(II) and Pd(II)
using 2-thiophenaldehyde-3-thiosemicarbazone as reagent by solid phase
microextraction–high performance liquid chromatography”, Analytica Chimica
ActaVolume 603, Issue 1, 5 November 2007, Pages 44-50,
52. Ying Dou, Tingting Zou, Tong Liu, Nan Qu, Yulin Ren. “ Calibration in non-
linear NIR spectroscopy using principal component artificial neural networks”,
Spectrochimica Acta Part A 68(2007) 1201 -1206
53. Jahanbakhsh Ghasemi, Nahid Shahabadi, Hamid R. Seraji, “Spectrophotometric
simultaneous determination of cobalt, copper and nickel using nitroso-R-salt in alloys
by partial least squares”, Analytica Chimica Acta, Volume 510, Issue 1, 10 May 2004,
Pages 121-126.
Các file đính kèm theo tài liệu này:
- ung_dung_phan_mem_matlab_trong_nghien_cuu_va_giang_day_hoa_phan_tich_o_viet_nam_5269.pdf