Nghiên cứu xây dựng đặc trưng cộng đồng trong các hệ thống tư vấn thông tin

Trang nhan đề Mục lục Danh mục Mở đầu Chương 1: Tổng quan Chương 2: Tư vấn thông tin dựa trên lọc cộng tác Chương 3: Các phương pháp PROMETHEE hỗ trợ quyết định đa tiêu chí Chương 4: Xây dựng CP bằng phương pháp PROMETHEEMATCH Chương 5 Thử nghiệm và phân tích kết quả Chương 6 Kết luận và hướng phát triển Tài liệu tham khảo MỤC LỤC DANH MỤC HÌNH 4 DANH MỤC BẢNG . 5 DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT 6 MỞ ĐẦU . 7 CHƯƠNG 1. TỔNG QUAN 9 1.1 Đặt vấn đề 9 1.2 Mục tiêu của đề tài 12 1.3 Nội dung nghiên cứu . 12 1.4 Những đóng góp của luận văn 13 CHƯƠNG 2. TƯ VẤN THÔNG TIN DỰA TRÊN LỌC CỘNG TÁC . 14 2.1 Tư vấn thông tin dựa trên lọc cộng tác . 14 2.1.1 Cách tiếp cận dựa trên người dùng (User-based approaches) 15 2.1.2 Cách tiếp cận dựa trên tài nguyên (Item-based approaches) 17 2.1.3 Cách tiếp cận dựa trên mô hình (Model-based approaches) . 18 2.1.4 Các độ đo tương tự (Similarity Measures) 19 2.2 Tạo lập cộng đồng . 20 2.2.1 Mô hình phân nhóm (clustering model) 20 2.2.1.1 Phương pháp phân nhóm hàng xóm gần nhất (nearest neighbor clustering) . 21 2.2.1.2 Phương pháp phân nhóm khoảng cách tâm (k-mean clustering) 22 2.2.2 Tạo lập cộng đồng dựa trên mô hình cộng đồng đa tiêu chí 22 2.3 Định vị người dùng mới vào cộng đồng 24 2.3.1 Khai thác thông tin thăm dò . 24 2.3.2 Cung cấp profile mẫu . 24 2 2.3.3 Phương pháp suy diễn cộng đồng . 25 2.3.4 Định vị dựa trên CP . 25 2.3.4.1 Phương pháp 1 - POP (Porpularly Rated) . 27 2.3.4.2 Phương pháp 2 – HR20 (High Ratings 20) 28 2.3.4.3 Phương pháp 3 – avgMatch . 29 2.4 Quan điểm xây dựng CP như giải bài toán ra quyết định đa tiêu chí . 32 CHƯƠNG 3. CÁC PHƯƠNG PHÁP PROMETHEE HỖ TRỢ QUYẾT ĐỊNH ĐA TIÊU CHÍ 35 3.1 Bài toán ra quyết định đa tiêu chí . 35 3.1.1 Giới thiệu . 35 3.1.2 Một số phương pháp hỗ trợ ra quyết định đa tiêu chí . 41 3.1.2.1 Phương pháp thứ tự . 42 3.1.2.2 Phương pháp Lexicographic 43 3.1.2.3 Phương pháp Borda 43 3.1.2.4 Phương pháp Condorcet 44 3.1.3 Phương pháp trọng số (Weighted methods) 44 3.1.3.1 Phương pháp tổng trọng số (Weighted sum method) 44 3.1.3.2 Phương pháp tích trọng số (Weighted product method) . 45 3.2 Các Phương pháp PROMETHEE 46 3.2.1 Lịch sử . 46 3.2.2 Mô hình thích hơn PROMETHEE 46 3.2.2.1 Thông tin giữa các tiêu chí 47 3.2.2.2 Thông tin trong các tiêu chí . 47 3.2.3 Xếp hạng PROMETHEE I và PROMETHEE II 51 3.2.3.1 Các chỉ số thích hơn tích hợp (Aggregated Preference Indices) . 52 3.2.3.2 Các dòng hơn cấp (Outranking Flows) 53 3.2.3.3 PROMETHEE I – thứ tự bộ phận 54 3.2.3.4 PROMETHEE II – thứ tự toàn phần 55 3.2.3.5 Profile của các lựa chọn 56 CHƯƠNG 4. XÂY DỰNG CP BẰNG PHƯƠNG PHÁP PROMETHEEMATCH . 58 3 4.1 Cách tiếp cận chính của PrometheeMatch . 58 4.2 Những cải tiến của PrometheeMatch . 59 4.2.1 Cải tiến 1 – Sử dụng PROMETHEE II để xếp hạng các tài nguyên trong cộng đồng 61 4.2.2 Cải tiến 2 – Sử dụng ngưỡng trùng lắp . 64 4.2.3 Cải tiến 3 – Giảm sự phụ thuộc vào thứ tự duyệt cộng đồng . 67 4.3 Thuật toán và sơ đồ khối . 71 4.4 Nhận xét . 74 CHƯƠNG 5. THỬ NGHIỆM và PHÂN TÍCH KẾT QUẢ . 76 5.1 Dữ liệu thực nghiệm 76 5.2 Các tiêu chí đánh giá . 77 5.2.1 Tiêu chí popRank (Popularity Rank) – TC1 77 5.2.2 Tiêu chí avgRating (average Rating) – TC2 78 5.2.3 Tiêu chí uniqueness – TC3 . . 79 5.3 Cách thức tiến hành thực nghiệm . 80 5.4 Phân tích kết quả . 81 5.4.1 Phương pháp 1, 2, và 3 . 81 5.4.2 Phương pháp 4 – PrometheeMatch 82 5.4.2.1 Sự ảnh hưởng trọng số lên các tiêu chí: 83 5.4.2.2 So sánh với 3 phương pháp hiện có . 88 5.5 Tổng kết . 92 CHƯƠNG 6. KẾT LUẬN và HƯỚNG PHÁT TRIỂN 93 6.1 Kết luận 93 6.2 Đề xuất hướng phát triển 93 TÀI LIỆU THAM KHẢO 95

17 trang | Chia sẻ: lvcdongnoi | Lượt xem: 3087 | Lượt tải: 1

Bạn đang xem nội dung tài liệu Nghiên cứu xây dựng đặc trưng cộng đồng trong các hệ thống tư vấn thông tin, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

76 CHƯƠNG 5. THỬ NGHIỆM và PHÂN TÍCH KẾT QUẢ Trong chương này luận văn trình bày quá trình thử nghiệm các phương pháp xây dựng CP. Mục tiêu của thử nghiệm nhằm so sánh phương pháp cải tiến PrometheeMatch với các phương pháp đã có, nêu rõ ý nghĩa của những cải tiến dựa trên kết quả đạt được. Để có thể thực hiện việc so sánh luận văn sẽ trình bày cách tính các tiêu chí mà dựa trên đó các phương pháp được so sánh với nhau. Luận văn cũng trình bày ưu điểm và khuyết điểm của từng phương pháp, cũng như ý nghĩa của từng tham số thông qua kết quả đạt được. 5.1 Dữ liệu thực nghiệm Để có được kết quả khách quan, đáng tin cậy, luận văn thử nghiệm các phương pháp trên tập dữ liệu MovieLens [19], một hệ thống tư vấn về những tài nguyên phim, được thu thập từ dự án nghiên cứu GroupLens thuộc trường đại học Minnesota. Dữ liệu này được dùng làm dữ liệu chuẩn trong những công trình nghiên cứu về CF. Tập dữ liệu này bao gồm 100.000 mẩu tin đánh giá (có số điểm từ 1 đến 5) từ 943 người dùng trên 1682 phim. Mỗi người dùng đánh giá ít nhất 20 phim. Sau đây là mô tả tóm tắt về cơ sở dữ liệu.  Bảng Data chứa 100.000 đánh giá của 943 người dùng trên 1682 phim. Mỗi người dùng đánh giá ít nhất 20 phim, userId và item Id được đánh số liên tiếp nhau bắt đầu từ 1. Bảng này gồm các cột sau: userId | itemId | rating | timestamp.  Bảng Item thông tin về phim, bao gồm các cột sau: movie id | movie title | release date | video release date | IMDb URL | unknown | Action | Adventure | Animation | Children's | Comedy | Crime | Documentary | Drama | Fantasy | Film-Noir | Horror | Musical | Mystery | Romance | Sci-Fi | Thriller | War | Western. 77 19 cột cuối cùng là thể loại phim, với giá trị bằng 1 thể hiện phim thuộc thể loại đó, bằng 0 nghĩa là không thuộc. Một phim có thể cùng lúc thuộc nhiều thể loại.  Bảng User thông tin nhân khẩu học của người dùng, bao gồm các cột sau: user id | age | gender | occupation | zip code  Bảng Group thông tin về nhóm (cộng đồng) người dùng thuộc về, mỗi nhóm thuộc về một phân hoạch (divisionId), bảng này bao gồm các cột sau: group Id | group Name | divisionId  Bảng UserGroup thông tin mô tả người dùng thuộc về nhóm nào, một người dùng có thể thuộc về nhiều nhóm, một nhóm có nhiều người dùng. Bảng này bao gồm các cột sau: user Id | group Id 5.2 Các tiêu chí đánh giá Phần này luận văn trình bày một số tiêu chí được dùng để so sánh các phương pháp trong một số trường hợp cụ thể, ở nhiều khía cạnh khác nhau [21]. 5.2.1 Tiêu chí popRank (Popularity Rank) – TC1 popRank là khái niệm chỉ số thứ tự của tài nguyên trong cộng động hoặc hệ thống dựa trên số lượng người dùng tham gia đánh giá tài nguyên. Tài nguyên có thứ hạng cao nhất sẽ có số lượng người dùng tham gia đánh giá nhiều nhất. Ví dụ Star Wars (1977) là phim được được nhiều người dùng đánh giá nhất trong MovieLens (583 người) có popRank = 1. Chỉ số này đặc trưng cho tính phổ biến của tài nguyên trong hệ thống, popRank càng thấp thì tính phổ biến càng cao. Giả sử áp dụng phương pháp tìm CP f1 trên k cộng đồng, mỗi cộng đồng lấy n tài nguyên làm đặc trưng. Khi đó tập CP của hệ thống có kn tài nguyên và popRank của phương pháp f1 được tính như sau: 78 ݌݋݌ܴܽ݊݇( ଵ݂) = ݌݋݌ܴܽ݊݇(݉ଵ) + ݌݋݌ܴܽ݊݇(݉ଶ) + … + ݌݋݌ܴܽ݊݇(݉௡௞)݊݇ Trong đó: k: là số lượng cộng đồng, n: số lượng tài nguyên trong mỗi CP Ij, j  [1, nk] là tập tài nguyên thuộc CP của hệ thống. Ví dụ: Áp dụng phương pháp tìm CP f1 trên 3 cộng đồng, mỗi cộng đồng chọn ra 2 tài nguyên làm CP như (hình 5.1): Nhóm 1 item Id popRank Nhóm 2 10 3 item Id popRank Nhóm 3 3 6 7 1 item Id popRank 5 4 6 2 8 5 Hình 5.1: CP với điểm popRank Khi đó popRank của f1 được tính như sau: popRank(f1) = [popRank(10) + popRank(3) + popRank(7) + popRank(5) + popRank(6) + popRank(8)] / 6 = (3 + 6 + 1 + 4 + 2 + 5)/6 = 3.5 5.2.2 Tiêu chí avgRating (average Rating) – TC2 Điểm avgRating của một tài nguyên được tính bằng cách lấy trung bình điểm đánh giá của tất cả nguời dùng trong cộng đồng hoặc hệ thống tham gia đánh giá tài nguyên đó. Ví dụ, nếu tài nguyên m1 được 3 người dùng đánh giá với các điểm số 4, 3 và 5, thì avgRating của m1 là (4 + 3 + 5)/3 = 4. Chỉ số này đặc trưng cho chất lượng của tài nguyên trong hệ thống. avgRating càng cao thì chất lượng của tài nguyên càng cao. 79 Công thức tính avgRating của phương pháp f1 tương tự như công thức tính popRank của f1 như sau: ܽݒܴ݃ܽݐ݅݊݃( ଵ݂) = ܽݒܴ݃ܽݐ݅݊݃(݉ଵ) + ܽݒܴ݃ܽݐ݅݊݃(݉ଶ) + … + ܽݒܴ݃ܽݐ݅݊݃(݉௡௞)݊݇ Ví dụ: Ta có CP của 3 nhóm theo phương pháp f1 như sau: Nhóm 1 item Id avgRating Nhóm 2 10 5 item Id avgRating Nhóm 3 3 4.5 7 4 item Id avgRating 5 4 6 4.5 8 4 Hình 5.2: CP với điểm avgRating Khi đó avgRating của f1 được tính như sau: avgRating (f1) = [avgRating (10) + avgRating (3) + avgRating (7) + avgRating (5) + avgRating (6) + avgRating (8)] / 6 = (5 + 4.5 + 4 + 4 + 4.5 + 4)/6 = 4.33 5.2.3 Tiêu chí uniqueness – TC3 Chỉ số uniqueness đặc trưng tính duy nhất của các tài nguyên trong CP. CP có điểm uniqueness càng cao thì tính duy nhất càng cao. Cách tính điểm uniqueness của một phương pháp như sau: Giả sử có k cộng đồng, mỗi cộng đồng chọn ra n tài nguyên - theo phương pháp f1 - làm CP. Như vậy, tập CP của hệ thống có kn tài nguyên. gọi U là tập tài nguyên chọn ra từ kn tài nguyên CP sao cho { m1  U,  m2  U  m1  m2 }. Khi ấy uniqueness(f1) = | U |. Điểm uniqueness  [n, kn]. Ví dụ: Ta có tập CP trên 5 nhóm theo phương pháp f1 như bảng sau: 80 Tài nguyên Nhóm C1 C2 C3 C4 C5 m1 x x m2 x x x x x m3 x x x x x m4 x x m5 x x x x m6 x x x m7 x m8 x m9 x m10 x Hình 5.3 CP và điểm uniqueness Ta thấy điểm uniqueness của tập CP hệ thống thuộc [5, 25] và: uniqueness(f1) = 10 5.3 Cách thức tiến hành thực nghiệm Để tiến hành thực nghiệm, luận văn sử dụng 3 phân hoạch khác nhau (tương ứng với 3 cách chia cộng đồng khác nhau) trên tập người dùng nhằm kiểm tra tính nhất quán của các phương pháp trong những tình trạng dữ liệu khác nhau. Phân hoạch I có 10 nhóm được tạo ngẫu nhiên từ tập người sử dụng. Phân hoạch II gồm 10 nhóm được lấy ra từ một thuật toán gom nhóm dựa trên ma trận đánh giá (xem phần 2.2.1) và phân hoạch III gồm 8 nhóm được lấy ra từ một thuật toán gom nhóm dựa trên ma trận vector trọng số của người dùng trong hệ thống. Hai phân hoạch sau cùng đã được sử dụng cho các thực nghiệm của những công trình được công bố trong [21]. Trong phương pháp PrometheeMatch. Các giá trị w1, w2, w3 là trọng số tương ứng với tiêu chí tính phổ biến, chất lượng và tính duy nhất của CP. w1, w2, w3  [0,1] và w1 + w2 = 1. Bước nhảy của các trọng số này là 0.1, bước nhảy càng nhỏ 81 thì mức độ khác nhau trong các kết quả càng mịn. Tuy nhiên với giá trị 0.1 cũng đủ cho ta thấy được sự khác nhau giữa các kết quả. Để tiện cho việc so sánh giữa các phương pháp, số lượng tài nguyên được chọn làm CP là 5. Nếu chọn số tài nguyên khác 5 thì kết quả so sánh giữa các phương pháp cũng không thay đổi, tuy nhiên hệ thống sẽ xử lý nhiều hơn nên chạy chậm hơn. Điểm popRank  [1, 1682] vì có tổng cộng 1682 phim trong tập dữ liệu thử nghiệm. Điểm avgRating  [1, 5] vì người dùng đánh giá phim dựa theo thang điểm {1, 2, 3, 4, 5}. Trong phân hoạch I và II, điểm uniqueness thuộc [5, 50] (vì có 10 nhóm môi nhóm có 5 tài nguyên đặc trưng). Và phân hoạch III điểm uniqueness thuộc [5, 40] (vì có 8 nhóm, mỗi nhóm có 5 tài nguyên đặc trưng). Đối với TC1 và TC2, luận văn sẽ so sánh các phương pháp ở hai mức cục bộ (trên từng cộng đồng) và toàn cục (trên toàn hệ thống). Bởi vì kết quả cục bộ (trong từng cộng đồng) có thể khác với kết quả trên toàn hệ thống, Ví dụ, xét theo TC2, giả sử có một tài nguyên i có điểm đánh giá trung bình rất cao trong cộng đồng c, nên c chọn i làm CP, nhưng trên toàn hệ thống điểm trung bình của i rất thấp, điều này dẫn đến chất lượng CP trên từng cộng đồng không tỷ lệ thuận với chất lượng CP trên toàn hệ thống. Nghĩa là có khả năng tập CP tìm được tốt nhất trên từng cộng đồng (theo TC1 và TC2) nhưng có khả năng rất tệ (cũng theo 2 tiêu chí này) trên toàn hệ thống. 5.4 Phân tích kết quả 5.4.1 Phương pháp 1, 2, và 3 Trong phần này luận văn trình bày kết quả thử nghiệm của 3 phương pháp đã có (1, 2 và 3) để thấy rõ ý nghĩa của từng phương pháp theo các tiêu chí đánh giá, dựa trên dữ liệu thực tế. 82 Bảng 5.2 trình bày kết quả thử nghiệm của 3 phương pháp trên 3 phân hoạch cộng đồng, việc thử nghiệm trên 3 cộng đồng khác nhau nhằm khẳng định kết quả của các phương pháp không phụ thuộc vào tình trạng cụ thể của dữ liệu. Phương pháp Phân hoạch I Phân hoạch II Phân hoạch III TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 PP1 4.66 3.89 14 8.90 3.90 13 5.48 3.87 11 PP2 56.18 4.32 24 71.33 4.33 21 88.51 4.33 19 PP3 263.14 3.565 50 180.98 3.743 50 107.55 3.934 40 Bảng 5.1 Kết quả thực nghiệm phương pháp 1, 2 và 3 trên toàn cục Phương Pháp Phân hoạch I Phân hoạch II Phân hoạch III TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 PP1 2.82 3.88 14 2.68 3.97 13 2.75 3.89 11 PP2 49.36 4.4847 13 72.93 4.433 21 87.600 4.433 19 PP3 278.5 3.6 50 171.6 3.9 50 102.7 4.0 40 Bảng 5.2 Kết quả thực nghiệm phương pháp 1, 2 và 3 trên cục bộ Kết quả trên toàn cục (Bảng 5.2) và cục bộ (Bảng 5.3) cho thấy, trên cả 3 phân hoạch, phương pháp 1 tốt nhất trên TC1, phương pháp 2 tốt nhất trên TC2 và phương pháp 3 tốt nhất trên TC3. Kết quả này là hợp lý, bởi vì phương pháp 1 hướng đến tính phổ biến tài nguyên (TC1), do đó phương pháp này đạt được điểm nhỏ nhất trên TC1 (tính phổ biến cao nhất). Phương pháp 2 tập trung vào tiêu chí chất lượng nên đạt điểm cao nhất trên TC2 (chất lượng cao nhất. Và phương pháp 3 tập trung vào tính duy nhất nên luôn đạt được điểm TC3 tối đa. Tuy nhiên, đặc điểm chung của 3 phương pháp này là chỉ tập trung vào một tiêu chí và không quan tâm hoặc quan tâm chưa đúng mức 2 tiêu chí còn lại cho nên điểm của 2 tiêu chí còn lại rất thấp. 5.4.2 Phương pháp 4 – PrometheeMatch Trong phần này luận văn trình bày và phân tích kết quả thử nghiệm của phương pháp 4. Đầu tiên sẽ thử nghiệm phương pháp 4 trên từng tiêu chí, sau đó sẽ 83 trình bày kết quả dựa trên sự thỏa hiệp các tiêu chí và cuối cùng sẽ so sánh các phương pháp nhau. 5.4.2.1 Sự ảnh hưởng trọng số lên các tiêu chí: Để thấy rõ mức độ ảnh hưởng của các trọng số lên các tiêu chí, luận văn lần lượt sẽ xét từng trọng số một bằng cách cho các trọng số biến đổi trong miền giá trị của nó trong khi cố định các trọng số còn lại. Vì w1 + w2 = 1 nên khi w1 biến đổi thì w2 cũng biến đổi (nhưng theo hướng ngược lại). Do đó ta chỉ cần xét sự biến thiên của một trọng số là đủ. Đầu tiên luận văn cố định w3 và cho w1, w2 biến thiên (hình 5.4, 5.5) 0.0 200.0 400.0 600.0 800.0 1000.0 1200.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 0, w1 biến thiên w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 0, w2 biến thiên. w2 PH1 PH2 PH3 84 Hình 5.4: kết quả TC1, TC2 của 3 phân hoạch trên toàn cục khi w3 cố định, w1, w2 biến thiên 0.0 200.0 400.0 600.0 800.0 1000.0 1200.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 0.5, w1 biến thiên. w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 0.5, w2 biến thiên w2 PH1 PH2 PH3 0.0 200.0 400.0 600.0 800.0 1000.0 1200.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 1, w1 biến thiên. w1 PH1 PH2 PH3 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 1, w2 biến thiên w2 PH1 PH2 PH3 85 0.0 100.0 200.0 300.0 400.0 500.0 600.0 700.0 800.0 900.0 1000.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 0, w1 biến thiên w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 6.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 0, w2 biến thiên w2 PH1 PH2 PH3 0.0 100.0 200.0 300.0 400.0 500.0 600.0 700.0 800.0 900.0 1000.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 0.5, w1 biến thiên. w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 6.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 0.5, w2 biến thiên w2 PH1 PH2 PH3 86 Hình 5.5: kết quả TC1, TC2 của 3 phân hoạch trên cục bộ khi w3 cố định, w1, w2 biến thiên Ở đây luận văn chỉ thể hiện kết quả TC1, TC2 trên 3 phân hoạch khi w1, w2 biến thiên từ 0 đến 1 với bước nhảy 0.1 tại các giá trị cố định của w3 bằng 0, 0.5 và 1. Thực tế tại các giá trị khác của w3, cũng cho kết quả tương tự. Kết quả cho thấy, trên cục bộ thì tính phổ biến và chất lượng của CP tỷ lệ thuận với trọng số của TC1 và TC2, nghĩa là khi w1 tăng thì TC1 giảm (hay tính phổ biến tăng), khi w2 tăng thì TC2 tăng theo (chất lượng tăng), điều này phù hợp với lý thuyết. Xét tính phổ biến CP trên toàn cục (tính phổ biến tỷ lệ nghịch với TC1): Trên toàn cục thì tính phổ biến gần như tỷ lệ thuận với trọng số của TC1, điều này cũng dễ giải thích vì một tài nguyên có số lượng đánh giá nhiều trong một cộng đồng cũng thường là những tài nguyên được đánh giá nhiều trong toàn hệ thống, do đó khi chọn một tài nguyên có tính phổ biến cao làm CP cũng thường dẫn đến tập CP hệ thống có độ phổ biến cao, kết quả thực nghiệm cũng cho thấy điều này. Xét chất lượng CP trên toàn cục (chất lượng tỷ lệ thuận với TC2): 0.0 100.0 200.0 300.0 400.0 500.0 600.0 700.0 800.0 900.0 1000.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 1, w1 biến thiên w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 6.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 1, w2 biến thiên w2 PH1 PH2 PH3 87 Trên toàn cục chất lượng CP không tỷ lệ thuận với trọng số của TC2, cụ thể TC2 đạt giá trị cao nhất tại các các giá trị trung bình của w2 và thấp dần khi w2 tiền về 2 biên, điều này đúng trên cả 3 phân hoạch. Và được lý giải như sau: khi w2 thấp, nghĩa là w1 cao và đặc trưng trong mỗi cộng đồng sẽ ưu tiên cho tài nguyên có độ phổ biến cao, nói cách khác chất lượng của tài nguyên không được quan tâm nên tập CP hệ thống có chất lượng không cao. Khi w2 cao, lúc này đặc trưng của mỗi cộng đồng sẽ ưu tiên cho những tài nguyên có chất lượng cao (được cộng đồng đánh giá cao). Nhưng thông thường mỗi cộng đồng thường ưu ái cho một loại tài nguyên nào đó, do đó họ sẽ đánh giá những tài nguyên loại này rất cao, nhưng có khả năng những tài nguyên này không được các cộng đồng khác ưa thích nên bị cho điểm thấp, dẫn đến chất lượng của tài nguyên trên toàn cục thấp. Trong trường hợp w2 có giá trị trung bình, nghĩa những tài nguyên này có chất lượng trung bình và độ phổ biến trung bình sẽ được xem xét làm đặc trưng trên mỗi cộng đồng, và những tài nguyên này cũng có nhiều khả năng đạt được chất lượng đó trên toàn hệ thống, do vậy, cuối cùng, chất lượng của tập CP trên hệ thống có xu hướng cao ở những giá trị w2 trung bình. Ta xét ảnh hưởng của trọng số w3 lên TC3 trên toàn cục. (Xem hình 5.6) 0.0 10.0 20.0 30.0 40.0 50.0 60.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 w1 = 0, w2 = 1 và w3 biến thiên w3 PH1 PH2 PH3 0.0 10.0 20.0 30.0 40.0 50.0 60.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 w1 = 0.5, w2 = 0.5 w3 PH1 PH2 PH3 88 Hình 5.6: Đồ thị TC3 trên 3 phân hoạch với w1, w2 cố định và w3 biến thiên. Ở đây, luận văn chỉ trình bày kết quả TC3 khi trọng số w3 biến thiên tại 3 cặp giá trị cố định của w1, w2 là (0, 1), (0.5, 0.5) và (1, 0). Tính duy nhất của CP tỷ lệ thuận với trọng số w3, về mặt lý thuyết cũng như thực nghiệm đều đúng. Ta thấy rằng khác với w1 và w2 – hai trọng số này nhằm xét độ quan trọng của tính phổ biến và chất lượng CP trong từng cộng đồng - w3 ảnh hưởng đến mối quan hệ giữa các CP với nhau thông qua tính duy nhất của tập CP hệ thống, Do đó ta không cần phải xét tính duy nhất trên cục bộ, vì CP của mỗi cộng đồng không thể có sự trùng lắp. 5.4.2.2 So sánh với 3 phương pháp hiện có Vì ngữ cảnh của các phương pháp xây dựng CP hướng đến từng cộng đồng, do đó ta sẽ so sánh các phương pháp ở mức cục bộ, nghĩa là 2 TC1 và TC2 được tính trên từng cộng đồng chứ không phải trên toàn hệ thống, mặc dù một số kết quả trên toàn cục vẫn được đưa ra để tham khảo. Phương pháp 4 – PrometheeMatch - thỏa hiệp 3 tiêu chí tính phổ biến, chất lượng và tính duy nhất tài nguyên theo cách linh động, hiệu quả, cho ra kết quả thỏa hiệp tốt nhất 3 tiêu chí. Để thấy rõ điều này, luận văn tiến hành so sánh phương pháp 4 với 3 phương pháp 1, 2, và 3. 0.0 10.0 20.0 30.0 40.0 50.0 60.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 w1 = 1, w2 = 0 và w3 biến thiên w3 PH1 PH2 PH3 89 So sánh với phương pháp 1 - POP Với (w1 = 1, w2 = 0, w3 = 0) khi đó PrometheeMatch chính là POP. Vì khi w2 = 0 thì PrometheeMatch sẽ xếp hạng tài nguyên theo TC1 (tiêu chí tính phổ biến) và w3 = 0 nghĩa là việc chọn CP không quan tâm đến sự trùng lắp của các tài nguyên. Đây chính là phương pháp POP. Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III Tương đương TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 w1 = 1, w2 = 0, w3 = 0 4.66 3.89 14 8.90 3.90 13 5.48 3.87 11 POP Bảng 5.3: So sánh PrometheeMatch với POP So sánh với phương pháp 2 – HR20 Phương pháp HR20 hướng đến tiêu chí TC2, do đó, phương pháp này luôn có điểm TC2 cao hơn so với các phương pháp khác, nhưng PP4 nhờ thỏa hiệp TC1 và TC2 nên với những bộ trọng số phù hợp (như bảng 5.8) cho kết quả có TC2 tốt gần bằng PP2 nhưng TC1 tốt hơn hẳn PP2. Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 w1 = 0.5, w2 = 0.5, w3 = 0 4.78 4.18 13 66.52 4.4 20 39.73 4.36 16 w1 = 0.6, w2 = 0.4, w3 = 0 3.56 4.07 13 26.12 4.32 17 12.22 4.29 15 HR20 49.36 4.48 13 72.93 4.43 21 87.6 4.43 19 Bảng 5.4: So sánh PrometheeMatch với HR20 So sánh với phương pháp 3 - avgMatch: Phương pháp Phân hoạch I Phân hoạch II Phân hoạch III Ghi chú TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 PP3 263 3.6 50 181 3.7 50 108 3.9 40 Toàn cục 279 3.6 50 172 3.9 50 103 4.0 40 Cục bộ Bảng 5.5: Kết quả phương pháp 3 trên 3 phân hoạch 90 Đầu tiên luận văn xét trường hợp w3 = 1, khi đó phương pháp 4 cho độ duy nhất tối đa giống phương pháp 3. Tuy nhiên với khả năng thỏa hiệp 2 tiêu chí TC1 và TC2 cùng với việc chọn 2 trọng số w1 và w2 phù hợp, phương pháp 4 cho ra kết quả tốt và linh hoạt hơn phương pháp 3 trên 2 TC này. Xem bảng 5.11, 5.12. Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III w1 w2 w3 TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 0.3 0.7 1 276.22 4.06 50 540.00 3.84 50 478.70 3.94 40 0.4 0.6 1 46.28 4.02 50 328.50 3.96 50 354.45 3.98 40 0.5 0.5 1 31.96 3.97 50 137.08 3.96 50 261.15 3.94 40 0.6 0.4 1 30.14 3.93 50 132.92 3.93 50 122.70 3.98 40 0.7 0.3 1 32.18 3.93 50 88.72 3.91 50 48.48 3.97 40 0.8 0.2 1 27.96 3.87 50 38.54 3.90 50 47.58 3.96 40 0.9 0.1 1 27.68 3.84 50 34.70 3.85 50 37.50 3.92 40 1 0 1 27.62 3.82 50 40.56 3.77 50 31.23 3.88 40 Bảng 5.6: Kết quả phương pháp 4 trên 3 phân hoạch với w3=1 trên toàn cục Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III w1 w2 w3 TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 0 1 1 941.46 5.00 50 867.26 5.00 50 938.08 5.00 40 0.1 0.9 1 868.58 5.00 50 788.22 5.00 50 870.00 5.00 40 0.2 0.8 1 656.24 4.90 50 718.00 4.96 50 763.53 4.95 40 0.3 0.7 1 288.84 4.57 50 510.12 4.81 50 400.50 4.73 40 0.4 0.6 1 39.40 4.20 50 299.40 4.64 50 273.40 4.60 40 0.5 0.5 1 18.16 4.06 50 119.62 4.40 50 190.28 4.47 40 0.6 0.4 1 16.96 3.99 50 115.94 4.36 50 93.00 4.32 40 0.7 0.3 1 17.04 3.98 50 61.54 4.21 50 22.90 4.18 40 0.8 0.2 1 15.56 3.90 50 20.94 4.09 50 20.88 4.15 40 0.9 0.1 1 14.42 3.84 50 14.44 3.99 50 13.05 4.02 40 1 0 1 14.60 3.81 50 13.54 3.80 50 11.28 3.87 40 Bảng 5.7: Kết quả phương pháp 4 trên 3 phân hoạch với w3=1 trên cục bộ Bảng 5.12 cho thấy khi trọng số w2 tăng thì TC2 tăng theo. Nếu w2 quá cao (như w2 ≥ 0.7) khi đó CP tìm được có TC2 rất cao nhưng TC1 rất thấp, và ngược lại 91 w2 thấp (w2 ≤ 0.4) nghĩa là w1 cao, khi đó CP tìm được có TC1 cao. Với 2 bộ trọng số hợp lý của w1, w2 là (0.4, 0.6) và (0.5, 0.5) CP tìm được cho kết quả tương đối cao so với phương pháp 3 trên 2 tiêu chí TC1 và TC2. Điểm cải tiến của phương pháp 4 là cho phép điều khiển được TC3 (tính duy nhất), điều mà phương pháp 3 không thể làm được, Bảng 5.13 luận văn liệt kê một số kết quả tương ứng với các giá trị xác định của trọng số w3. Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III w1 w2 w3 TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 0 1 0 889.94 3.69 38 821.94 3.55 45 985.60 3.59 38 0 1 0.5 889.94 3.69 38 821.94 3.55 45 985.60 3.59 38 0 1 1 873.54 3.7 50 814.14 3.51 50 978.65 3.50 40 0.5 0.5 0 6.42 4.13 13 74.26 4.09 20 53.10 4.12 16 0.5 0.5 0.5 14.88 4.08 31 101.80 4.03 31 135.58 4.06 26 0.5 0.5 1 31.96 3.97 50 137.08 3.96 50 261.15 3.94 40 1 0 0 4.66 3.89 14 8.90 3.90 13 5.48 3.87 11 1 0 0.5 12.54 3.9 31 26.08 3.81 33 18.08 3.90 26 1 0 1 27.62 3.82 50 40.56 3.77 50 31.23 3.88 40 Bảng 5.8: Một số kết quả phương pháp 4 trên 3 phân hoạch trên toàn cục Nhận xét: Kết quả thực nghiệm đã giúp minh họa được ý nghĩa của những cải tiến, với sự thỏa hiệp TC1 và TC2 bằng PROMETHEE II, phương pháp 4 cho ra kết quả phù hợp với trọng số của 2 tiêu chí này, với những bộ trọng số phù hợp của (w1, w2) phương pháp 4 cho ra kết quả tốt hơn phương pháp 3 trên 2 tiêu chí này, đồng thời vẫn đảm bảo TC3 ở mức tối đa. Bên cạnh đó với việc sử dụng trọng số w3, phương pháp 4 cho phép điều khiển TC3 theo mong muốn. Quan trọng hơn hết phương pháp 4 không nhằm mục đích cho kết quả tối ưu trên một tiêu chí cụ thể, mặc dầu với những trọng số đặc biệt phương pháp 4 cũng cho ra kết quả tối ưu trên 1 tiêu chí (dẫn đến việc kết quả trùng với phương pháp 1 hoặc tương đương với phương pháp 2), mà phương pháp 4 hướng đến việc thỏa 92 hiệp các tiêu chí dựa trên trọng số tương đối của các tiêu chí, và kết quả thực nghiệm đã cho thấy được điều đó. 5.5 Tổng kết Để kết thúc chương này, luận văn tóm lược lại ý nghĩa của các phương pháp trong những trường hợp cụ thể như sau: Phương pháp 1 (POP) nên sử dụng trong các hệ thống mong muốn độ phổ biến của CP cao nhất mà không quan tâm đến chất lượng và tính duy nhất của CP Phương pháp 2 (HR20) nên sử dụng trong các hệ thống mong muốn chất lượng CP cao nhất, quan tâm ít hơn đến độ phổ biến của CP và không quan tâm đến tính duy nhất của CP. Phương pháp 3 (avgMatch) nên sử dụng trong các hệ thống mong muốn đạt được tính duy nhất của CP cao nhất, quan tâm ít hơn đến chất lượng và độ phổ biến của CP. Phương pháp 4 (PrometheeMatch) có thể sử dụng cho các hệ thống mong muốn cho ra kết quả thỏa hiệp tốt 2 tiêu chí tính phổ biến và chất lượng tài nguyên theo trọng số tương đối của 2 tiêu chí này, đồng thời cho phép điều khiển tính duy nhất theo ý muốn.

Các file đính kèm theo tài liệu này:

8.pdf
0.pdf
1.pdf
10.pdf
2.pdf
3.pdf
4.pdf
5.pdf
6.pdf
7.pdf
9.pdf