Trang nhan đề
Mục lục
Danh mục
Mở đầu
Chương 1: Tổng quan
Chương 2: Tư vấn thông tin dựa trên lọc cộng tác
Chương 3: Các phương pháp PROMETHEE hỗ trợ quyết định đa tiêu chí
Chương 4: Xây dựng CP bằng phương pháp PROMETHEEMATCH
Chương 5 Thử nghiệm và phân tích kết quả
Chương 6 Kết luận và hướng phát triển
Tài liệu tham khảo
MỤC LỤC
DANH MỤC HÌNH 4
DANH MỤC BẢNG . 5
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT 6
MỞ ĐẦU . 7
CHƯƠNG 1. TỔNG QUAN 9
1.1 Đặt vấn đề 9
1.2 Mục tiêu của đề tài 12
1.3 Nội dung nghiên cứu . 12
1.4 Những đóng góp của luận văn 13
CHƯƠNG 2. TƯ VẤN THÔNG TIN DỰA TRÊN LỌC CỘNG TÁC . 14
2.1 Tư vấn thông tin dựa trên lọc cộng tác . 14
2.1.1 Cách tiếp cận dựa trên người dùng (User-based approaches) 15
2.1.2 Cách tiếp cận dựa trên tài nguyên (Item-based approaches) 17
2.1.3 Cách tiếp cận dựa trên mô hình (Model-based approaches) . 18
2.1.4 Các độ đo tương tự (Similarity Measures) 19
2.2 Tạo lập cộng đồng . 20
2.2.1 Mô hình phân nhóm (clustering model) 20
2.2.1.1 Phương pháp phân nhóm hàng xóm gần nhất (nearest neighbor
clustering) . 21
2.2.1.2 Phương pháp phân nhóm khoảng cách tâm (k-mean clustering) 22
2.2.2 Tạo lập cộng đồng dựa trên mô hình cộng đồng đa tiêu chí 22
2.3 Định vị người dùng mới vào cộng đồng 24
2.3.1 Khai thác thông tin thăm dò . 24
2.3.2 Cung cấp profile mẫu . 24
2
2.3.3 Phương pháp suy diễn cộng đồng . 25
2.3.4 Định vị dựa trên CP . 25
2.3.4.1 Phương pháp 1 - POP (Porpularly Rated) . 27
2.3.4.2 Phương pháp 2 – HR20 (High Ratings 20) 28
2.3.4.3 Phương pháp 3 – avgMatch . 29
2.4 Quan điểm xây dựng CP như giải bài toán ra quyết định đa tiêu chí . 32
CHƯƠNG 3. CÁC PHƯƠNG PHÁP PROMETHEE HỖ TRỢ QUYẾT
ĐỊNH ĐA TIÊU CHÍ 35
3.1 Bài toán ra quyết định đa tiêu chí . 35
3.1.1 Giới thiệu . 35
3.1.2 Một số phương pháp hỗ trợ ra quyết định đa tiêu chí . 41
3.1.2.1 Phương pháp thứ tự . 42
3.1.2.2 Phương pháp Lexicographic 43
3.1.2.3 Phương pháp Borda 43
3.1.2.4 Phương pháp Condorcet 44
3.1.3 Phương pháp trọng số (Weighted methods) 44
3.1.3.1 Phương pháp tổng trọng số (Weighted sum method) 44
3.1.3.2 Phương pháp tích trọng số (Weighted product method) . 45
3.2 Các Phương pháp PROMETHEE 46
3.2.1 Lịch sử . 46
3.2.2 Mô hình thích hơn PROMETHEE 46
3.2.2.1 Thông tin giữa các tiêu chí 47
3.2.2.2 Thông tin trong các tiêu chí . 47
3.2.3 Xếp hạng PROMETHEE I và PROMETHEE II 51
3.2.3.1 Các chỉ số thích hơn tích hợp (Aggregated Preference Indices) . 52
3.2.3.2 Các dòng hơn cấp (Outranking Flows) 53
3.2.3.3 PROMETHEE I – thứ tự bộ phận 54
3.2.3.4 PROMETHEE II – thứ tự toàn phần 55
3.2.3.5 Profile của các lựa chọn 56
CHƯƠNG 4. XÂY DỰNG CP BẰNG PHƯƠNG PHÁP
PROMETHEEMATCH . 58
3
4.1 Cách tiếp cận chính của PrometheeMatch . 58
4.2 Những cải tiến của PrometheeMatch . 59
4.2.1 Cải tiến 1 – Sử dụng PROMETHEE II để xếp hạng các tài nguyên trong
cộng đồng 61
4.2.2 Cải tiến 2 – Sử dụng ngưỡng trùng lắp . 64
4.2.3 Cải tiến 3 – Giảm sự phụ thuộc vào thứ tự duyệt cộng đồng . 67
4.3 Thuật toán và sơ đồ khối . 71
4.4 Nhận xét . 74
CHƯƠNG 5. THỬ NGHIỆM và PHÂN TÍCH KẾT QUẢ . 76
5.1 Dữ liệu thực nghiệm 76
5.2 Các tiêu chí đánh giá . 77
5.2.1 Tiêu chí popRank (Popularity Rank) – TC1 77
5.2.2 Tiêu chí avgRating (average Rating) – TC2 78
5.2.3 Tiêu chí uniqueness – TC3 . . 79
5.3 Cách thức tiến hành thực nghiệm . 80
5.4 Phân tích kết quả . 81
5.4.1 Phương pháp 1, 2, và 3 . 81
5.4.2 Phương pháp 4 – PrometheeMatch 82
5.4.2.1 Sự ảnh hưởng trọng số lên các tiêu chí: 83
5.4.2.2 So sánh với 3 phương pháp hiện có . 88
5.5 Tổng kết . 92
CHƯƠNG 6. KẾT LUẬN và HƯỚNG PHÁT TRIỂN 93
6.1 Kết luận 93
6.2 Đề xuất hướng phát triển 93
TÀI LIỆU THAM KHẢO 95
17 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 2782 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Nghiên cứu xây dựng đặc trưng cộng đồng trong các hệ thống tư vấn thông tin, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
76
CHƯƠNG 5. THỬ NGHIỆM và PHÂN TÍCH KẾT QUẢ
Trong chương này luận văn trình bày quá trình thử nghiệm các phương pháp
xây dựng CP. Mục tiêu của thử nghiệm nhằm so sánh phương pháp cải tiến
PrometheeMatch với các phương pháp đã có, nêu rõ ý nghĩa của những cải tiến dựa
trên kết quả đạt được. Để có thể thực hiện việc so sánh luận văn sẽ trình bày cách
tính các tiêu chí mà dựa trên đó các phương pháp được so sánh với nhau. Luận văn
cũng trình bày ưu điểm và khuyết điểm của từng phương pháp, cũng như ý nghĩa
của từng tham số thông qua kết quả đạt được.
5.1 Dữ liệu thực nghiệm
Để có được kết quả khách quan, đáng tin cậy, luận văn thử nghiệm các
phương pháp trên tập dữ liệu MovieLens [19], một hệ thống tư vấn về những tài
nguyên phim, được thu thập từ dự án nghiên cứu GroupLens thuộc trường đại học
Minnesota. Dữ liệu này được dùng làm dữ liệu chuẩn trong những công trình
nghiên cứu về CF.
Tập dữ liệu này bao gồm 100.000 mẩu tin đánh giá (có số điểm từ 1 đến 5) từ
943 người dùng trên 1682 phim. Mỗi người dùng đánh giá ít nhất 20 phim. Sau đây
là mô tả tóm tắt về cơ sở dữ liệu.
Bảng Data chứa 100.000 đánh giá của 943 người dùng trên 1682 phim. Mỗi
người dùng đánh giá ít nhất 20 phim, userId và item Id được đánh số liên
tiếp nhau bắt đầu từ 1. Bảng này gồm các cột sau:
userId | itemId | rating | timestamp.
Bảng Item thông tin về phim, bao gồm các cột sau:
movie id | movie title | release date | video release date | IMDb URL |
unknown | Action | Adventure | Animation | Children's | Comedy | Crime |
Documentary | Drama | Fantasy | Film-Noir | Horror | Musical | Mystery |
Romance | Sci-Fi | Thriller | War | Western.
77
19 cột cuối cùng là thể loại phim, với giá trị bằng 1 thể hiện phim thuộc thể
loại đó, bằng 0 nghĩa là không thuộc. Một phim có thể cùng lúc thuộc nhiều
thể loại.
Bảng User thông tin nhân khẩu học của người dùng, bao gồm các cột sau:
user id | age | gender | occupation | zip code
Bảng Group thông tin về nhóm (cộng đồng) người dùng thuộc về, mỗi
nhóm thuộc về một phân hoạch (divisionId), bảng này bao gồm các cột sau:
group Id | group Name | divisionId
Bảng UserGroup thông tin mô tả người dùng thuộc về nhóm nào, một
người dùng có thể thuộc về nhiều nhóm, một nhóm có nhiều người dùng.
Bảng này bao gồm các cột sau:
user Id | group Id
5.2 Các tiêu chí đánh giá
Phần này luận văn trình bày một số tiêu chí được dùng để so sánh các phương
pháp trong một số trường hợp cụ thể, ở nhiều khía cạnh khác nhau [21].
5.2.1 Tiêu chí popRank (Popularity Rank) – TC1
popRank là khái niệm chỉ số thứ tự của tài nguyên trong cộng động hoặc hệ
thống dựa trên số lượng người dùng tham gia đánh giá tài nguyên. Tài nguyên có
thứ hạng cao nhất sẽ có số lượng người dùng tham gia đánh giá nhiều nhất. Ví dụ
Star Wars (1977) là phim được được nhiều người dùng đánh giá nhất trong
MovieLens (583 người) có popRank = 1. Chỉ số này đặc trưng cho tính phổ biến
của tài nguyên trong hệ thống, popRank càng thấp thì tính phổ biến càng cao.
Giả sử áp dụng phương pháp tìm CP f1 trên k cộng đồng, mỗi cộng đồng lấy n
tài nguyên làm đặc trưng. Khi đó tập CP của hệ thống có kn tài nguyên và popRank
của phương pháp f1 được tính như sau:
78
ܴܽ݊݇( ଵ݂) = ܴܽ݊݇(݉ଵ) + ܴܽ݊݇(݉ଶ) + … + ܴܽ݊݇(݉)݊݇
Trong đó:
k: là số lượng cộng đồng,
n: số lượng tài nguyên trong mỗi CP
Ij, j [1, nk] là tập tài nguyên thuộc CP của hệ thống.
Ví dụ:
Áp dụng phương pháp tìm CP f1 trên 3 cộng đồng, mỗi cộng đồng chọn ra 2 tài
nguyên làm CP như (hình 5.1):
Nhóm 1
item Id popRank Nhóm 2
10 3 item Id popRank Nhóm 3
3 6 7 1 item Id popRank
5 4 6 2
8 5
Hình 5.1: CP với điểm popRank
Khi đó popRank của f1 được tính như sau:
popRank(f1) = [popRank(10) + popRank(3) + popRank(7) + popRank(5) +
popRank(6) + popRank(8)] / 6
= (3 + 6 + 1 + 4 + 2 + 5)/6 = 3.5
5.2.2 Tiêu chí avgRating (average Rating) – TC2
Điểm avgRating của một tài nguyên được tính bằng cách lấy trung bình điểm
đánh giá của tất cả nguời dùng trong cộng đồng hoặc hệ thống tham gia đánh giá tài
nguyên đó. Ví dụ, nếu tài nguyên m1 được 3 người dùng đánh giá với các điểm số
4, 3 và 5, thì avgRating của m1 là (4 + 3 + 5)/3 = 4. Chỉ số này đặc trưng cho chất
lượng của tài nguyên trong hệ thống. avgRating càng cao thì chất lượng của tài
nguyên càng cao.
79
Công thức tính avgRating của phương pháp f1 tương tự như công thức tính
popRank của f1 như sau:
ܽݒܴ݃ܽݐ݅݊݃( ଵ݂) = ܽݒܴ݃ܽݐ݅݊݃(݉ଵ) + ܽݒܴ݃ܽݐ݅݊݃(݉ଶ) + … + ܽݒܴ݃ܽݐ݅݊݃(݉)݊݇
Ví dụ: Ta có CP của 3 nhóm theo phương pháp f1 như sau:
Nhóm 1
item Id avgRating Nhóm 2
10 5 item Id avgRating Nhóm 3
3 4.5 7 4 item Id avgRating
5 4 6 4.5
8 4
Hình 5.2: CP với điểm avgRating
Khi đó avgRating của f1 được tính như sau:
avgRating (f1) = [avgRating (10) + avgRating (3) + avgRating (7) + avgRating
(5) + avgRating (6) + avgRating (8)] / 6
= (5 + 4.5 + 4 + 4 + 4.5 + 4)/6 = 4.33
5.2.3 Tiêu chí uniqueness – TC3
Chỉ số uniqueness đặc trưng tính duy nhất của các tài nguyên trong CP. CP có
điểm uniqueness càng cao thì tính duy nhất càng cao. Cách tính điểm uniqueness
của một phương pháp như sau:
Giả sử có k cộng đồng, mỗi cộng đồng chọn ra n tài nguyên - theo phương
pháp f1 - làm CP. Như vậy, tập CP của hệ thống có kn tài nguyên. gọi U là tập tài
nguyên chọn ra từ kn tài nguyên CP sao cho { m1 U, m2 U m1 m2 }.
Khi ấy uniqueness(f1) = | U |. Điểm uniqueness [n, kn].
Ví dụ:
Ta có tập CP trên 5 nhóm theo phương pháp f1 như bảng sau:
80
Tài nguyên
Nhóm C1 C2 C3 C4 C5
m1 x x
m2 x x x x x
m3 x x x x x
m4 x x
m5 x x x x
m6 x x x
m7 x
m8 x
m9 x
m10 x
Hình 5.3 CP và điểm uniqueness
Ta thấy điểm uniqueness của tập CP hệ thống thuộc [5, 25] và:
uniqueness(f1) = 10
5.3 Cách thức tiến hành thực nghiệm
Để tiến hành thực nghiệm, luận văn sử dụng 3 phân hoạch khác nhau (tương
ứng với 3 cách chia cộng đồng khác nhau) trên tập người dùng nhằm kiểm tra tính
nhất quán của các phương pháp trong những tình trạng dữ liệu khác nhau. Phân
hoạch I có 10 nhóm được tạo ngẫu nhiên từ tập người sử dụng. Phân hoạch II gồm
10 nhóm được lấy ra từ một thuật toán gom nhóm dựa trên ma trận đánh giá (xem
phần 2.2.1) và phân hoạch III gồm 8 nhóm được lấy ra từ một thuật toán gom nhóm
dựa trên ma trận vector trọng số của người dùng trong hệ thống. Hai phân hoạch sau
cùng đã được sử dụng cho các thực nghiệm của những công trình được công bố
trong [21].
Trong phương pháp PrometheeMatch. Các giá trị w1, w2, w3 là trọng số tương
ứng với tiêu chí tính phổ biến, chất lượng và tính duy nhất của CP. w1, w2, w3
[0,1] và w1 + w2 = 1. Bước nhảy của các trọng số này là 0.1, bước nhảy càng nhỏ
81
thì mức độ khác nhau trong các kết quả càng mịn. Tuy nhiên với giá trị 0.1 cũng đủ
cho ta thấy được sự khác nhau giữa các kết quả.
Để tiện cho việc so sánh giữa các phương pháp, số lượng tài nguyên được
chọn làm CP là 5. Nếu chọn số tài nguyên khác 5 thì kết quả so sánh giữa các
phương pháp cũng không thay đổi, tuy nhiên hệ thống sẽ xử lý nhiều hơn nên chạy
chậm hơn.
Điểm popRank [1, 1682] vì có tổng cộng 1682 phim trong tập dữ liệu thử
nghiệm. Điểm avgRating [1, 5] vì người dùng đánh giá phim dựa theo thang điểm
{1, 2, 3, 4, 5}. Trong phân hoạch I và II, điểm uniqueness thuộc [5, 50] (vì có 10
nhóm môi nhóm có 5 tài nguyên đặc trưng). Và phân hoạch III điểm uniqueness
thuộc [5, 40] (vì có 8 nhóm, mỗi nhóm có 5 tài nguyên đặc trưng).
Đối với TC1 và TC2, luận văn sẽ so sánh các phương pháp ở hai mức cục bộ
(trên từng cộng đồng) và toàn cục (trên toàn hệ thống). Bởi vì kết quả cục bộ (trong
từng cộng đồng) có thể khác với kết quả trên toàn hệ thống, Ví dụ, xét theo TC2,
giả sử có một tài nguyên i có điểm đánh giá trung bình rất cao trong cộng đồng c,
nên c chọn i làm CP, nhưng trên toàn hệ thống điểm trung bình của i rất thấp, điều
này dẫn đến chất lượng CP trên từng cộng đồng không tỷ lệ thuận với chất lượng
CP trên toàn hệ thống. Nghĩa là có khả năng tập CP tìm được tốt nhất trên từng
cộng đồng (theo TC1 và TC2) nhưng có khả năng rất tệ (cũng theo 2 tiêu chí này)
trên toàn hệ thống.
5.4 Phân tích kết quả
5.4.1 Phương pháp 1, 2, và 3
Trong phần này luận văn trình bày kết quả thử nghiệm của 3 phương pháp đã
có (1, 2 và 3) để thấy rõ ý nghĩa của từng phương pháp theo các tiêu chí đánh giá,
dựa trên dữ liệu thực tế.
82
Bảng 5.2 trình bày kết quả thử nghiệm của 3 phương pháp trên 3 phân hoạch
cộng đồng, việc thử nghiệm trên 3 cộng đồng khác nhau nhằm khẳng định kết quả
của các phương pháp không phụ thuộc vào tình trạng cụ thể của dữ liệu.
Phương
pháp
Phân hoạch I Phân hoạch II Phân hoạch III
TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3
PP1 4.66 3.89 14 8.90 3.90 13 5.48 3.87 11
PP2 56.18 4.32 24 71.33 4.33 21 88.51 4.33 19
PP3 263.14 3.565 50 180.98 3.743 50 107.55 3.934 40
Bảng 5.1 Kết quả thực nghiệm phương pháp 1, 2 và 3 trên toàn cục
Phương
Pháp
Phân hoạch I Phân hoạch II Phân hoạch III
TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3
PP1 2.82 3.88 14 2.68 3.97 13 2.75 3.89 11
PP2 49.36 4.4847 13 72.93 4.433 21 87.600 4.433 19
PP3 278.5 3.6 50 171.6 3.9 50 102.7 4.0 40
Bảng 5.2 Kết quả thực nghiệm phương pháp 1, 2 và 3 trên cục bộ
Kết quả trên toàn cục (Bảng 5.2) và cục bộ (Bảng 5.3) cho thấy, trên cả 3 phân
hoạch, phương pháp 1 tốt nhất trên TC1, phương pháp 2 tốt nhất trên TC2 và
phương pháp 3 tốt nhất trên TC3. Kết quả này là hợp lý, bởi vì phương pháp 1
hướng đến tính phổ biến tài nguyên (TC1), do đó phương pháp này đạt được điểm
nhỏ nhất trên TC1 (tính phổ biến cao nhất). Phương pháp 2 tập trung vào tiêu chí
chất lượng nên đạt điểm cao nhất trên TC2 (chất lượng cao nhất. Và phương pháp 3
tập trung vào tính duy nhất nên luôn đạt được điểm TC3 tối đa. Tuy nhiên, đặc điểm
chung của 3 phương pháp này là chỉ tập trung vào một tiêu chí và không quan tâm
hoặc quan tâm chưa đúng mức 2 tiêu chí còn lại cho nên điểm của 2 tiêu chí còn lại
rất thấp.
5.4.2 Phương pháp 4 – PrometheeMatch
Trong phần này luận văn trình bày và phân tích kết quả thử nghiệm của
phương pháp 4. Đầu tiên sẽ thử nghiệm phương pháp 4 trên từng tiêu chí, sau đó sẽ
83
trình bày kết quả dựa trên sự thỏa hiệp các tiêu chí và cuối cùng sẽ so sánh các
phương pháp nhau.
5.4.2.1 Sự ảnh hưởng trọng số lên các tiêu chí:
Để thấy rõ mức độ ảnh hưởng của các trọng số lên các tiêu chí, luận văn lần
lượt sẽ xét từng trọng số một bằng cách cho các trọng số biến đổi trong miền giá trị
của nó trong khi cố định các trọng số còn lại. Vì w1 + w2 = 1 nên khi w1 biến đổi thì
w2 cũng biến đổi (nhưng theo hướng ngược lại). Do đó ta chỉ cần xét sự biến thiên
của một trọng số là đủ.
Đầu tiên luận văn cố định w3 và cho w1, w2 biến thiên (hình 5.4, 5.5)
0.0
200.0
400.0
600.0
800.0
1000.0
1200.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC1 với w3 = 0, w1 biến thiên
w1 PH1 PH2 PH3
0.0
1.0
2.0
3.0
4.0
5.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC2 với w3 = 0, w2 biến thiên.
w2 PH1 PH2 PH3
84
Hình 5.4: kết quả TC1, TC2 của 3 phân hoạch trên toàn cục khi w3 cố định, w1, w2
biến thiên
0.0
200.0
400.0
600.0
800.0
1000.0
1200.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC1 với w3 = 0.5, w1 biến thiên.
w1 PH1 PH2 PH3
0.0
1.0
2.0
3.0
4.0
5.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC2 với w3 = 0.5, w2 biến thiên
w2 PH1 PH2 PH3
0.0
200.0
400.0
600.0
800.0
1000.0
1200.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC1 với w3 = 1, w1 biến thiên.
w1 PH1 PH2 PH3
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC2 với w3 = 1, w2 biến thiên
w2 PH1 PH2 PH3
85
0.0
100.0
200.0
300.0
400.0
500.0
600.0
700.0
800.0
900.0
1000.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC1 với w3 = 0, w1 biến thiên
w1 PH1 PH2 PH3
0.0
1.0
2.0
3.0
4.0
5.0
6.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC2 với w3 = 0, w2 biến thiên
w2 PH1 PH2 PH3
0.0
100.0
200.0
300.0
400.0
500.0
600.0
700.0
800.0
900.0
1000.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC1 với w3 = 0.5, w1 biến thiên.
w1 PH1 PH2 PH3
0.0
1.0
2.0
3.0
4.0
5.0
6.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC2 với w3 = 0.5, w2 biến thiên
w2 PH1 PH2 PH3
86
Hình 5.5: kết quả TC1, TC2 của 3 phân hoạch trên cục bộ khi w3 cố định, w1, w2
biến thiên
Ở đây luận văn chỉ thể hiện kết quả TC1, TC2 trên 3 phân hoạch khi w1, w2
biến thiên từ 0 đến 1 với bước nhảy 0.1 tại các giá trị cố định của w3 bằng 0, 0.5 và
1. Thực tế tại các giá trị khác của w3, cũng cho kết quả tương tự.
Kết quả cho thấy, trên cục bộ thì tính phổ biến và chất lượng của CP tỷ lệ
thuận với trọng số của TC1 và TC2, nghĩa là khi w1 tăng thì TC1 giảm (hay tính
phổ biến tăng), khi w2 tăng thì TC2 tăng theo (chất lượng tăng), điều này phù hợp
với lý thuyết.
Xét tính phổ biến CP trên toàn cục (tính phổ biến tỷ lệ nghịch với TC1):
Trên toàn cục thì tính phổ biến gần như tỷ lệ thuận với trọng số của TC1, điều
này cũng dễ giải thích vì một tài nguyên có số lượng đánh giá nhiều trong một cộng
đồng cũng thường là những tài nguyên được đánh giá nhiều trong toàn hệ thống, do
đó khi chọn một tài nguyên có tính phổ biến cao làm CP cũng thường dẫn đến tập
CP hệ thống có độ phổ biến cao, kết quả thực nghiệm cũng cho thấy điều này.
Xét chất lượng CP trên toàn cục (chất lượng tỷ lệ thuận với TC2):
0.0
100.0
200.0
300.0
400.0
500.0
600.0
700.0
800.0
900.0
1000.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC1 với w3 = 1, w1 biến thiên
w1 PH1 PH2 PH3
0.0
1.0
2.0
3.0
4.0
5.0
6.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
TC2 với w3 = 1, w2 biến thiên
w2 PH1 PH2 PH3
87
Trên toàn cục chất lượng CP không tỷ lệ thuận với trọng số của TC2, cụ thể
TC2 đạt giá trị cao nhất tại các các giá trị trung bình của w2 và thấp dần khi w2 tiền
về 2 biên, điều này đúng trên cả 3 phân hoạch. Và được lý giải như sau: khi w2 thấp,
nghĩa là w1 cao và đặc trưng trong mỗi cộng đồng sẽ ưu tiên cho tài nguyên có độ
phổ biến cao, nói cách khác chất lượng của tài nguyên không được quan tâm nên
tập CP hệ thống có chất lượng không cao. Khi w2 cao, lúc này đặc trưng của mỗi
cộng đồng sẽ ưu tiên cho những tài nguyên có chất lượng cao (được cộng đồng
đánh giá cao). Nhưng thông thường mỗi cộng đồng thường ưu ái cho một loại tài
nguyên nào đó, do đó họ sẽ đánh giá những tài nguyên loại này rất cao, nhưng có
khả năng những tài nguyên này không được các cộng đồng khác ưa thích nên bị cho
điểm thấp, dẫn đến chất lượng của tài nguyên trên toàn cục thấp. Trong trường hợp
w2 có giá trị trung bình, nghĩa những tài nguyên này có chất lượng trung bình và độ
phổ biến trung bình sẽ được xem xét làm đặc trưng trên mỗi cộng đồng, và những
tài nguyên này cũng có nhiều khả năng đạt được chất lượng đó trên toàn hệ thống,
do vậy, cuối cùng, chất lượng của tập CP trên hệ thống có xu hướng cao ở những
giá trị w2 trung bình.
Ta xét ảnh hưởng của trọng số w3 lên TC3 trên toàn cục. (Xem hình 5.6)
0.0
10.0
20.0
30.0
40.0
50.0
60.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
w1 = 0, w2 = 1 và w3 biến thiên
w3 PH1 PH2 PH3
0.0
10.0
20.0
30.0
40.0
50.0
60.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
w1 = 0.5, w2 = 0.5
w3 PH1 PH2 PH3
88
Hình 5.6: Đồ thị TC3 trên 3 phân hoạch với w1, w2 cố định và w3 biến thiên.
Ở đây, luận văn chỉ trình bày kết quả TC3 khi trọng số w3 biến thiên tại 3 cặp
giá trị cố định của w1, w2 là (0, 1), (0.5, 0.5) và (1, 0). Tính duy nhất của CP tỷ lệ
thuận với trọng số w3, về mặt lý thuyết cũng như thực nghiệm đều đúng. Ta thấy
rằng khác với w1 và w2 – hai trọng số này nhằm xét độ quan trọng của tính phổ biến
và chất lượng CP trong từng cộng đồng - w3 ảnh hưởng đến mối quan hệ giữa các
CP với nhau thông qua tính duy nhất của tập CP hệ thống, Do đó ta không cần phải
xét tính duy nhất trên cục bộ, vì CP của mỗi cộng đồng không thể có sự trùng lắp.
5.4.2.2 So sánh với 3 phương pháp hiện có
Vì ngữ cảnh của các phương pháp xây dựng CP hướng đến từng cộng đồng,
do đó ta sẽ so sánh các phương pháp ở mức cục bộ, nghĩa là 2 TC1 và TC2 được
tính trên từng cộng đồng chứ không phải trên toàn hệ thống, mặc dù một số kết quả
trên toàn cục vẫn được đưa ra để tham khảo.
Phương pháp 4 – PrometheeMatch - thỏa hiệp 3 tiêu chí tính phổ biến, chất
lượng và tính duy nhất tài nguyên theo cách linh động, hiệu quả, cho ra kết quả
thỏa hiệp tốt nhất 3 tiêu chí. Để thấy rõ điều này, luận văn tiến hành so sánh phương
pháp 4 với 3 phương pháp 1, 2, và 3.
0.0
10.0
20.0
30.0
40.0
50.0
60.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
w1 = 1, w2 = 0 và w3 biến thiên
w3 PH1 PH2 PH3
89
So sánh với phương pháp 1 - POP
Với (w1 = 1, w2 = 0, w3 = 0) khi đó PrometheeMatch chính là POP. Vì khi w2
= 0 thì PrometheeMatch sẽ xếp hạng tài nguyên theo TC1 (tiêu chí tính phổ biến) và
w3 = 0 nghĩa là việc chọn CP không quan tâm đến sự trùng lắp của các tài nguyên.
Đây chính là phương pháp POP.
Phương
pháp 4
Phân hoạch I Phân hoạch II Phân hoạch III Tương
đương TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3
w1 = 1,
w2 = 0,
w3 = 0
4.66 3.89 14 8.90 3.90 13 5.48 3.87 11 POP
Bảng 5.3: So sánh PrometheeMatch với POP
So sánh với phương pháp 2 – HR20
Phương pháp HR20 hướng đến tiêu chí TC2, do đó, phương pháp này luôn có
điểm TC2 cao hơn so với các phương pháp khác, nhưng PP4 nhờ thỏa hiệp TC1 và
TC2 nên với những bộ trọng số phù hợp (như bảng 5.8) cho kết quả có TC2 tốt gần
bằng PP2 nhưng TC1 tốt hơn hẳn PP2.
Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3
w1 = 0.5, w2 = 0.5,
w3 = 0 4.78 4.18 13 66.52 4.4 20 39.73 4.36 16
w1 = 0.6, w2 = 0.4,
w3 = 0 3.56 4.07 13 26.12 4.32 17 12.22 4.29 15
HR20 49.36 4.48 13 72.93 4.43 21 87.6 4.43 19
Bảng 5.4: So sánh PrometheeMatch với HR20
So sánh với phương pháp 3 - avgMatch:
Phương
pháp
Phân hoạch I Phân hoạch II Phân hoạch III Ghi chú
TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3
PP3
263 3.6 50 181 3.7 50 108 3.9 40 Toàn cục
279 3.6 50 172 3.9 50 103 4.0 40 Cục bộ
Bảng 5.5: Kết quả phương pháp 3 trên 3 phân hoạch
90
Đầu tiên luận văn xét trường hợp w3 = 1, khi đó phương pháp 4 cho độ duy
nhất tối đa giống phương pháp 3. Tuy nhiên với khả năng thỏa hiệp 2 tiêu chí TC1
và TC2 cùng với việc chọn 2 trọng số w1 và w2 phù hợp, phương pháp 4 cho ra kết
quả tốt và linh hoạt hơn phương pháp 3 trên 2 TC này. Xem bảng 5.11, 5.12.
Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III
w1 w2 w3 TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3
0.3 0.7 1 276.22 4.06 50 540.00 3.84 50 478.70 3.94 40
0.4 0.6 1 46.28 4.02 50 328.50 3.96 50 354.45 3.98 40
0.5 0.5 1 31.96 3.97 50 137.08 3.96 50 261.15 3.94 40
0.6 0.4 1 30.14 3.93 50 132.92 3.93 50 122.70 3.98 40
0.7 0.3 1 32.18 3.93 50 88.72 3.91 50 48.48 3.97 40
0.8 0.2 1 27.96 3.87 50 38.54 3.90 50 47.58 3.96 40
0.9 0.1 1 27.68 3.84 50 34.70 3.85 50 37.50 3.92 40
1 0 1 27.62 3.82 50 40.56 3.77 50 31.23 3.88 40
Bảng 5.6: Kết quả phương pháp 4 trên 3 phân hoạch với w3=1 trên toàn cục
Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III
w1 w2 w3 TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3
0 1 1 941.46 5.00 50 867.26 5.00 50 938.08 5.00 40
0.1 0.9 1 868.58 5.00 50 788.22 5.00 50 870.00 5.00 40
0.2 0.8 1 656.24 4.90 50 718.00 4.96 50 763.53 4.95 40
0.3 0.7 1 288.84 4.57 50 510.12 4.81 50 400.50 4.73 40
0.4 0.6 1 39.40 4.20 50 299.40 4.64 50 273.40 4.60 40
0.5 0.5 1 18.16 4.06 50 119.62 4.40 50 190.28 4.47 40
0.6 0.4 1 16.96 3.99 50 115.94 4.36 50 93.00 4.32 40
0.7 0.3 1 17.04 3.98 50 61.54 4.21 50 22.90 4.18 40
0.8 0.2 1 15.56 3.90 50 20.94 4.09 50 20.88 4.15 40
0.9 0.1 1 14.42 3.84 50 14.44 3.99 50 13.05 4.02 40
1 0 1 14.60 3.81 50 13.54 3.80 50 11.28 3.87 40
Bảng 5.7: Kết quả phương pháp 4 trên 3 phân hoạch với w3=1 trên cục bộ
Bảng 5.12 cho thấy khi trọng số w2 tăng thì TC2 tăng theo. Nếu w2 quá cao
(như w2 ≥ 0.7) khi đó CP tìm được có TC2 rất cao nhưng TC1 rất thấp, và ngược lại
91
w2 thấp (w2 ≤ 0.4) nghĩa là w1 cao, khi đó CP tìm được có TC1 cao. Với 2 bộ
trọng số hợp lý của w1, w2 là (0.4, 0.6) và (0.5, 0.5) CP tìm được cho kết quả tương
đối cao so với phương pháp 3 trên 2 tiêu chí TC1 và TC2.
Điểm cải tiến của phương pháp 4 là cho phép điều khiển được TC3 (tính duy
nhất), điều mà phương pháp 3 không thể làm được, Bảng 5.13 luận văn liệt kê một
số kết quả tương ứng với các giá trị xác định của trọng số w3.
Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III
w1 w2 w3 TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3
0 1 0 889.94 3.69 38 821.94 3.55 45 985.60 3.59 38
0 1 0.5 889.94 3.69 38 821.94 3.55 45 985.60 3.59 38
0 1 1 873.54 3.7 50 814.14 3.51 50 978.65 3.50 40
0.5 0.5 0 6.42 4.13 13 74.26 4.09 20 53.10 4.12 16
0.5 0.5 0.5 14.88 4.08 31 101.80 4.03 31 135.58 4.06 26
0.5 0.5 1 31.96 3.97 50 137.08 3.96 50 261.15 3.94 40
1 0 0 4.66 3.89 14 8.90 3.90 13 5.48 3.87 11
1 0 0.5 12.54 3.9 31 26.08 3.81 33 18.08 3.90 26
1 0 1 27.62 3.82 50 40.56 3.77 50 31.23 3.88 40
Bảng 5.8: Một số kết quả phương pháp 4 trên 3 phân hoạch trên toàn cục
Nhận xét:
Kết quả thực nghiệm đã giúp minh họa được ý nghĩa của những cải tiến, với
sự thỏa hiệp TC1 và TC2 bằng PROMETHEE II, phương pháp 4 cho ra kết quả phù
hợp với trọng số của 2 tiêu chí này, với những bộ trọng số phù hợp của (w1, w2)
phương pháp 4 cho ra kết quả tốt hơn phương pháp 3 trên 2 tiêu chí này, đồng thời
vẫn đảm bảo TC3 ở mức tối đa. Bên cạnh đó với việc sử dụng trọng số w3, phương
pháp 4 cho phép điều khiển TC3 theo mong muốn.
Quan trọng hơn hết phương pháp 4 không nhằm mục đích cho kết quả tối ưu
trên một tiêu chí cụ thể, mặc dầu với những trọng số đặc biệt phương pháp 4 cũng
cho ra kết quả tối ưu trên 1 tiêu chí (dẫn đến việc kết quả trùng với phương pháp 1
hoặc tương đương với phương pháp 2), mà phương pháp 4 hướng đến việc thỏa
92
hiệp các tiêu chí dựa trên trọng số tương đối của các tiêu chí, và kết quả thực
nghiệm đã cho thấy được điều đó.
5.5 Tổng kết
Để kết thúc chương này, luận văn tóm lược lại ý nghĩa của các phương pháp
trong những trường hợp cụ thể như sau:
Phương pháp 1 (POP) nên sử dụng trong các hệ thống mong muốn độ phổ
biến của CP cao nhất mà không quan tâm đến chất lượng và tính duy nhất của CP
Phương pháp 2 (HR20) nên sử dụng trong các hệ thống mong muốn chất
lượng CP cao nhất, quan tâm ít hơn đến độ phổ biến của CP và không quan tâm đến
tính duy nhất của CP.
Phương pháp 3 (avgMatch) nên sử dụng trong các hệ thống mong muốn đạt
được tính duy nhất của CP cao nhất, quan tâm ít hơn đến chất lượng và độ phổ biến
của CP.
Phương pháp 4 (PrometheeMatch) có thể sử dụng cho các hệ thống mong
muốn cho ra kết quả thỏa hiệp tốt 2 tiêu chí tính phổ biến và chất lượng tài nguyên
theo trọng số tương đối của 2 tiêu chí này, đồng thời cho phép điều khiển tính duy
nhất theo ý muốn.