Trong luận văn này em đã trình bày được nội dung thuật toán di truyền, phương
pháp tối ưu hóa đàn kiến, mô hình quy hoạch nguyên, bài toán thuê xe có hạn
ngạch, đưa ra mô hình nguyên cho bài toán và áp dụng thuật toán di truyền và
phương pháp tối ưu hóa đàn kiến giải bài toán trên.
Kết quả thực nghiệm tính toán được biểu diễn bằng cách cố định số lần lặp,
cố định số lần đánh giá và cố định thời gian xử lý đồng thời sử dụng hệ thống
kiểm định để phát hiện sự khác biệt trọng yếu trong thuật toán nhẳm đảm bảo
chất lượng của giải pháp. Kết quả thu được chỉ ra rằng thuật toán phương pháp
tối ưu hóa đàn kiến cho kết quả và thời gian chạy tốt hơn trong nhiều trường hợp.
Vấn đề được trình bày trong nghiên cứu này là mới, vậy nên có thể có một số
vấn đề có thể được nghiên cứu trong tương lai, ví dụ như ứng dụng của metaheuristic và thủ tục tìm kiếm địa phương, hoặc là nghiên cứu các biến thể khác của
q-CaRS, ví dụ một phiên bản với 2 tham số mà tổng ràng buộc được tối đa và chi
phí là nhỏ nhất.
Đóng góp chính của luận văn bao gồm:
1 Tìm hiểu và trình bày lại nội dung bài toán thuê xe có hạn ngạch q-CaRS.
2 Trình bày lại thuật toán di truyền giải bài toán q-CaRS và đề xuất thêm
phương pháp tối ưu hóa đàn kiến để giải bài toán.
3 Lập trình và đưa ra kết quả thực nghiệm đánh giá của hai thuật toán.
Tuy nhiên do thời gian thực hiện luận văn không nhiều còn có những sai sót em
rất mong nhận được sự góp ý của quý thầy cô và bạn đọc.
71 trang |
Chia sẻ: yenxoi77 | Lượt xem: 535 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận văn Bài toán thuê xe du lịch có hạn ngạch, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
=(11100010010011011) u2
3. 0,11 0,40 0,70 v6=(00010100001001010) u3
4. 0,11 0,51 0,78 v8=(10000110000111010) u4
5. 0,08 0,59 0,42 v4=(10001100010110100) u5
6. 0,08 0,67 0,31 v4=(00001000001100100) u6
7. 0,10 0,76 0,42 v4=(10001100010110100) u7
8. 0,08 0,84 0,28 v2=(11100010010011011) u8
9. 0,06 0,90 0,64 v6=(00010100001001011) u9
10 0,10 1,00 0,95 v10=(00010100001001010) u10
Tương giao chéo. Với pc=0,25 ta chọn được cặp tương giao chéo là
u3= (00010100001001010)
u5= (10001100010110100) với điểm trao đổi k=5.
Sau khi tương giao ta được
u
′
3= (00010100010110100)
u
′
5= (10001100001001010)
Với xác suất đột biến là pm=0,01 ; các gene đánh số từ 1 đến 170 ta chọn được gene
thứ 81 (gene thứ 13 của cá thể thứ 5) và gene thứ 127 (gene thứ 8 của cá thể thứ 8)
Ta được P(1) là :
23
v
′
5 = (00011101100101001)
v
′
2 = (11100010010011011)
v
′
6 = (00010100010110100)
v
′
8 = (10000110000111010)
v
′
4 = (10001100001011010
v
′
3 = (00001000001100100)
v
′
4 = (10001100010110100)
v
′
2 = (11100011010011011)
v
′
6 = (00010100001001011)
v
′
10 = (00010100001001010)
Độ thích hợp toàn phần là F= 107,65 ; cá thể tốt nhất vẫn là v
′
2=(11100010010011011)
với eval=14,78 nhưng thế hệ này tốt hơn p(0) nhiều quá trình tiếp tục cho tới lúc
dừng ta được lời giải gần tối ưu.
2.1.2. Biễu diễn bằng véc tơ số thực
Sau khi GA cổ điển được Holland công bố nó chứng tỏ là một phương pháp tốt
để giải các bài toán tối ưu khó và nó được cải tiến phong phú để tăng hiệu quả ứng
dụng.
Đối với các bài toán có miền chấp nhận được lớn và đòi hỏi sai số bé thì độ dài
của mỗi mỗi nhiễm sắc thể theo phương pháp GA cổ điển rất lớn nên việc áp dụng
GA rất khó khăn. Vì vậy người ta cải tiến bằng biễu diễn nhiễm sắc thể bằng véc tơ
thực để giải bài toán (I,1). Trong biễu diễn này, người ta dùng các véc tơ thực trong
miền chấp nhận đươc (thuôc tập M) làm nhiễm sắc thể và thiết kế các nhóm toán
tử di truyền cho thích hợp với biễu diễn này mà vẫn giữ nguyên thủ tục GA đã đặc
tả ở trên. Dưới đây giới thiệu một số toán tử dễ dùng.
Các toán tử tương giao chéo
Người ta chó thể chọn một vài toán tử tương giao chóe trong số các toán tử sau.
Tương giao đơn giản
Toán tử này thực hiện trao đổi hai nhóm gene tương tự như giải thuật cổ điển.
Nếu tương giao hai véc tơ
x = (x1, x2, ..., xn),
x = (y1, y2, ..., yn)
với điểm chọn ở vị trí thứ k thì ta được
x
′
= (x1, ...xk, yk+1, ..., yn) ,
y
′
= (y1, ...yk, xk+1, ..., xn)
Tương giao số học đơn
24
Nếu tương giao hai véc tơ:
x = (x1, x2, ..., xn),
y = (y1, y2, ..., yn)
với điểm chọn ở vị trí thứ k thì ta được :
x
′
= (x1, ...x
′
k.., xn) ,
y
′
= (y1, ...y
′
k.., yn)
trong đó x
′
k = axk + (1− a)yk với a ∈ (0, 1) là số cho trước hoặc chọn ngẫu nhiên.
Tương giao số học toàn cục
Nếu tương giao hai véc tơ
x = (x1, x2, ..., xn),
y = (y1, y2, ..., yn) thì được
x
′
= ax+ (1− a)y ,
y
′
= ay+ (1− a)x
với a ∈ (0, 1) là số cho trước hoặc chọn ngẫu nhiên.
Các toán tử biến dị
Người ta có thể dùng nhiều kiểu toán tử biến dị, chẳng hạn, một trong hai toán
tử biến dị sau.
Biến dị đều
Giả sử gene xk diến dị thành x
′
k thì x
′
k là số ngẫu nhiên phân bố đều trên miền
chấp nhận được [ak, bk] của nó.
Biến dị không đều
Giả sử gene xk diến dị thành thì x
′
k = xk + δ(t, xk) trong đó δ(t, xk) là số ngẫu
nhiên phân bố không đều trên đoạn [ak − xk, bk − xk] và hội tụ theo xác suất về
không khi t tăng ra vô hạn, tham số tchỉ vòng lặp. Thông dụng nhất là chọn phân
bố chuẩn.
2.1.3. GA trong tối ưu tổ hợp
Thuật toán di truyền giải các bài toán tối ưu tổ hợp có cùng lược đồ với GA cổ
điển được mô tả trong hình I.1. Trong ứng dụng, ta thường gặp nhiều bài toán thực
tiễn mà hàm mục tiêu chưa có dạng tường minh. Khi đó ta cần xây dựng bài toán
tói ưu cho nó và áp dụng GA để tìm lời giải. Cách tiếp cận này mở ra các phương
pháp tính toán tiến hóa (Evolutionary computation viết tắt là EC)
Lược đồ tính toán tiến hóa
Trong tối ưu hóa, thuật ngữ tính toán tiến hóa có thể hiểu theo hai tiếp cận.
Theo nghĩa rộng, EC dùng để chỉ các phương pháp lặp tạo sinh hoặc phát triển
25
quần thể lời giải, trong đó chất lượng lời giải được cải thiện theo thời gian. Theo
nghĩa hẹp mà ta dùng trong mục này, EC dùng để chỉ các phương pháp giải các
bài toán nhờ ứng dụng GA. Khí áp dụng EC, ta cần đưa bài toán được xét về bài
toán tìm lời giải tối ưu để áp dụng GA để giải. Chương trình áp dụng EC để giải
bài toán gọi là chương trình tiến hóa.
Mối liên hệ giữa EC và GA đươc minh hoạ bởi sơ đồ trong hình I.2.
Hình 2.2: Sơ đồ quan hệ áp dụng tính toán tiến hóa
Các bước cơ bản để5 xây dựng chương trình tiến hóa
Đối với một bài toán cần giải P, để xây dựng một chương trình tiến hoá giải nó,
người ta thường tiến hành theo năm bước cơ bản sau:
• Bước 1. Chọn cấu trúc nhiễm sắc thể / kiểu gene biễu diễn lời giải tiềm năng
của bài toán sao cho nó chứa đủ các thông tin quan trọng và dễ làm việc. Tuy
nhiên không có sự hướng dẫn nào về cách chọn này. Thiết kế chương trình
mã hóa và giải mã
• Bước 2. Khởi tạo tập lời giải ban đầu. Việc khởi tạo là ngẫu nhiên hay có thể
áp dụng một vài thuật toán heuristic, nhưng phải đảm bảo sao cho các ràng
buộc của bài toán được đảm bảo.
• Bước 3. Chọn hàm đánh giá mức độ tốt của lời giải (để đánh giá các cá thể
trong quần thể lời giải theo độ thích nghi của chúng ).
• Bước 4. Thiết kế các toán tử di truyền. Các toán tử này được thiết kế nên dựa
trên kiểu gene/ nhiễm sắc thể , đặc điểm bài toán và các ràng buộc của nó.
26
• Bước 5: Xác định các tham số cho bài toán. Các tham số này có thể không
thay đổi trong quá trình tiến hoá hoặc có thể tự điều chỉnh tham số theo thời
gian.
Một số nhận xét
GA có phổ ứng dụng rộng, dễ sử dụng và hướng tới lời giải tối ưu toàn cục nên
được người dùng ưa thích. Tuy nhiên khi cáp dụng GA, cần lưu ý các điểm sau.
1. Trong tối ưu liên tục, GA thích hợp cho các bài toán nhiều cực trị và không
khả vi. Đối với các bài toán đã có phương pháp truyền thống thì thường GA
mất nhiều thời gian chạy hơn. Với các bài toán nhiều cực trị nhưng áp dụng
được phương pháp gradient thì có thể khởi tạo nhiều điểm xuất phát có phân
bố đều và áp dụng tìm kiếm gradient để chọn lời giải tốt nhất sẽ hiệu quả hơn
GA.
2. Trong tối ưu tổ hợp, việc chọn cấu trúc nhiễm sắc thể và kiểu gene rất quan
trọng đối với hiệu quả thuật toán. Kiểu gene chọn tốt sẽ thỏa mãn được nhiều
ràng buộc, hạn chế phạm vi tìm kiếm trong không gian trạng thái.
3. Việc tìm kiếm trong các thuật toán giải các bài toán tối ưu tổ hợp thường có
2 cơ chế chính: tìm kiếm tăng cường (intensification)/khai thác (exploitation)
quanh miền có lời giải tốt tìm được và khám phá (exploration)/ đa dạng (diver-
sification) nhằm tạo sinh các lời giải đa dạng để mở rộng tìm kiếm hướng tới
tối ưu toán cục. Trong GA, thủ tục chọn lọc là khâu chính hướng tới tìm kiếm
tăng cường còn các toán tử di truyền hướng tới sự khám phá. Khi áp dụng
GA cần cân bằng giữa hai cơ chế này. Việc chọn tham số cho các toán tử di
truyền cũng rất quan trọng đối với hiệu quả thuật toán
4. GA là thuật toán dễ sử dụng cho cả tối ưu liên tục và tối ưu tổ hơp. Tuy nhiên
khi dùng cho tối ưu liên tục, nó thích hợp cho các bài toán không khả vi và có
nhiều cực trị địa phương. Đối với các bài toán đã có các phương pháp truyền
thống tốt thì GA chạy lâu và chất lượng lời giải thường kém hơn. Các toán tử
di truyền có thể vận dụng mềm dẻo và đa dạng để tăng tính khám phá của
thuật toán.
5. Khi áp dụng GA, việc chọn biễu diễn gene và cấu trúc nghiếm sắc thể rất
quan trọng. Một cách chọn biễu diễn gene thích hợp sẽ cho phép đáp ứng
nhiều ràng buộc, thu hẹp không gian tìm kiếm và dễ xây dựng các toán tử di
truyền.
27
2.2. Phương pháp tối ưu hóa đàn kiến
Tối ưu hoá đàn kiến (Ant colony optimization, viết tắt là ACO) được đề xuất
bởi Dorigo vào năm 1991, mô phỏng cách tìm đường đi của các con kiến thực nhờ
kết hợp các thông tin heuristic và cách học tăng cường để giải các bài toán tối ưu
tổ hợp.
2.2.1. Cách tìm đường đi của kiến tự nhiên
Trên đường đi của mình đường đi từ tổ tới nguồn thức ăn và ngược lại, các con
kiến thực để lại một vết hóa chất được gọi là vết mùi (pheromone trail). Vết mùi
này là có khả năng tích lũy, bay hơi và là phương tiện giao tiếp báo cho các con
kiến khác thông tin về đường đi đó một cách gián tiếp. Ở mỗi lối rẽ, các con kiến
sẽ lựa chọn lối tiếp theo dựa trên nồng độ lượng mùi trên đó, nồng độ càng cao thì
càng nhiều khả năng được chọn. Những lối rẽ thuộc đường đi dài thì vết mùi bay
hơ nhiều nên nồng độ thấp, dần dần các con kiến sẽ chọn lối rẽ có nồng độ mùi
cao và do đó thuọc đương đi ngắn nhất. Nhờ cách giao tiếp mang tính gián tiếp
và cộng đồng này mà đàn kiến trong tự nhiên tìm được đường đi ngắn nhất trong
quá trình tìm thức ăn mang về tổ và ngược lại.
Hành vi của đàn kiến khi gặp chướng ngại vật trên đường đi được minh họa
trong hình 2.3, ở hình a cho thấy kiến chưa gặp vật cản, bất ngờ cómột chướng ngại
vật (hình b), kiến phân bố ngẫu nhiên theo nồng độmùi (hình c) và khi đường ngắn
có nồng độ mùi cao thì kiến luôn chọn đường này (hình d).
28
Hình 2.3: Phân bố của đàn kiến trên đường đi từ tổ tới nguồn thức ăn
2.2.2. Kiến nhân tạo
Thực nghiệm cây cầu đôi cho thấy đàn kiến tự nhiên có thể sử dụng luật di
chuyển theo xác suất, dựa trên thông tin địa phương để tìm được đường đi ngắn
nhất giữa hai địa điểm. Vết mùi của đàn kiến cho phép liên tưởng tới cách học
tăng cường (reinforcement learning) trong bài toán chọn tác động tối ưu, gợi mở
mô hình mô phỏng cho bài toán tìm đường đingắn nhất giữa hai nút (tương ứng là
tổ và nguồn thức ăn) trên đồ thị, trong đó các tác tử (agent) là đàn kiến nhân tạo.
Tuy nhiên, trong các bài toán ứng dụng các đồ thị thường phức tạp hơn.Từ mỗi
đỉnh có thể có nhiều cạnh, nên nếu mô phỏng thực sự hành vi của đàn kiến tự
nhiên nhiều con kiến sẽ đi luẩn quẩn và do đó hiệu quả thuật toán sẽ rất kém. Vì
vậy, người ta dùng kỹ thuật đa tác tử (multiagent) mô phỏngđàn kiến nhân tạo,
trong đó mỗi con kiến nhân tạo có khả năng nhiều hơn so với kiến tự nhiên. Kiến
nhân tạo (về sau trong luận án ta sẽ gọi đơn giản là kiến) có bộ nhớ riêng, có khả
năng ghi nhớ các đỉnh đã thăm trong hành trình và tính được độ dài đường đi nó
chọn. Ngoài ra, kiến có thể trao đổi thông tin với nhau, thực hiện tính toán cần
thiết, cập nhật mùi. . .
2.2.3. Phương pháp ACO tổng quát
Để trình bày phương pháp ACO tổng quát giải các bài toán tối ưu tổ hợp khó,
ta cần phát biểu lại bài toán tối ưu tổ hợp theo khung nhìn của heuristic cấu trúc.
29
Bài toán tối ưu tổ hợp tổng quát
Các cách tiếp cận trên được áp dụng rộng rãi và phong phú để giải các bài toán
tối ưu tổ hợp trong đó bài toán tối ưu tổng quát được phát biểu như sau.
Xét bài toán cực tiểu hóa trong đó S là tập hợp hữu hạn trạng thái, f là hàm
mục tiêu xác định trên S còn là các ràng buộc để xác định S qua các thành phần
của tập hữu hạn C và các liên kết của tập này. Các tập S, C, và có các đặc tính sau :
• 1) C = {c1, c2, ...,Cn}là tập hữu hạn gồm n thành phần. Ta ký hiệu X là tập
các xâu thành phần trong C có độ dài không quá h : X = {}.
• 2) Tồn tại tập con X∗ của X và ánh xạ từ X∗ lên S sao cho ϕ−1(s) không rỗng
với mọi s ∈ S, hơn nữa, tập X∗ này xây dựng được từ tập con C0 của C và Ω
theo đặc tính 3.
• 3) Từ C0 mở rộng được thành X∗theo thủ tục tuần tự :
– x0 = là mở rộng được với ∀u ∈ C0 .
– Nếu xk = là mở rộng được thì từ Ω xác định được tập con
J(xk) của C sao cho với mọi uk=1 ∈ J(xk)ta có xk+1 =
là mở rộng được và xk ∈ X∗ khi J(xk) là rỗng.
– Với mọi u0 ∈ C , thủ tục mở rộng nêu trên xây dựng được mọi phần tử
của X∗. Không giảm tổng quả ta giả thiết rằng có tương ứng giữa các
phần tử trong X∗ với mỗi đường đi được mở rộng từ mỗi u0 trong C0.
Thuật toán tổng quát
Với bài toán tổng quát trên, về lý thuyết ta cú thể áp dụng thủ tục mở rộng để
xây dựng X∗ và chọn lời giải tốt nhất bằng phương pháp vét cạn, nhưng trên thực
tế, do bùng nổ tổ hợp thì khi số phần tử n của C lớn ta không thực hiện được đối
với bài toán thuộc loại NP-khó.
Để giải bài toán người ta đưa nó về bài toán tìm đường đi tối ưu trên đồ thị cấu
trúc sao cho mỗi lời giải chấp nhận được s ứng với đường đi , trong
đó xi thuộc tập đỉnh (thành phần C) của đồ thị, x1 thuộc tập đỉnh C0 (tham khảo
phương pháp constructive heuristics).
Đồ thị cấu trúc thường là đồ thị đầy đủ có trọng số G = (V, E,H, τ) trong đó V
là tập đỉnh tương ứng với tập thành phần C ở trên, E là tập các cạnh, H là vectơ các
trọng số heuristic của cạnh/đỉnh tương ứng, còn τ là vectơ vết mùi tích lũy được
ban đầu với khởi tạo bằng τ0 .
Thông tin heuristic và vết mùi có thể để ở đỉnh hoặc các cạnh của đồ thị tùy
theo đặc điểm bài toán dùng để định hướng tìm kiếm heuristic ngẫu nhiên khi xây
30
dựng lời nhờ mở rộng tuần tự từ một đỉnh trong C0 theo đặc điểm thứ 3 của bài
toán tổng quát.
Dựa trên đồ thị cấu trúc này, ta xây dựng thủ tục bước bước tuần tự tìm lời giải
cho các kiến nhân tạo.
Thông thường ta có thể đã có các phương pháp heuristic để tim lời giải đủ tốt
cho bài toán. Các thuật toán ACO kết hợp thông tin heuristic này với phương pháp
học tăng cường nhờ mô phỏng hành vi của đàn kiến để tìm lời giải tốt hơn.
Với quy tắc cập nhật mùi, các tham số, số kiến và điều kiện dừng (thường là
số lần lặp Nc định trước) đã được chọn các thuật toán được mô tả hình thức trong
hình 2.4.
Hình 2.4: Lược đồ thuật toán ACO tổng quát
Xây dựng lời giải
Để tiện trình bày, ta giả sử bài toán có vết mùi và thông tin heuristic để ở các
cạnh. Sau khi khởi tạo các tham số và cường độ mùi ban đầu, các con kiến chọn
ngẫu nhiên một đỉnh xuất phát trong C0 để thực hiện thủ tục xây dựng lời giải.
Trong mỗi lần lặp t, kiến chọn ngẫu nhiên một đỉnh tiếp theo trong C kết hợp
thông tin heuristic với thông tin mùi để xây dựng lời giải ngẫu nhiên theo thủ tục
mở rộng tuần tự nêu ở trên với quy tắc chuyển trạng thái như mô tả ở dưới.
Quá trình mở rộng tiếp tục cho tới khi mỗi con kiến k đều tìm được lời giải chấp
nhận được xk ∈ X∗ và do đó s(k) = ϕ(x(k)) . Để tiện trình bày, về sau ta sẽ xem
x(k) và s(k)như nhau không phân biệt X∗ với S.
Ký hiệu ω∗(t) là trạng thái tốt nhất các con kiến tìm được cho tới lúc này và
ωi(t) là lời giải tốt nhất trong bước lặp. Ở bước lặp t, ω∗(t) sẽ được xem là lời giải
gần đúng của bài toán.
Quy tắc chuyển trạng thái
Giả sử con kiến k đã xây dựng được lời giải tiềm năng xk = , nó sẽ
31
chọn đỉnh y thuộc J(xkn) để có xkn+1 với xác suất :
P(y|τ, xkn) =
ταu,yhu,y
∑j∈J(xk) τ
α
u,jhu,j
y ∈ J(xk)0 ngược lại
(2.2.2)
Quy tắc cập nhật mùi
Quy tắc cập nhật mùi có tính phổ dụng cho các thuật toán và là yếu tố ảnh
hưởng lớn tới chất lượng thuật toán. Để đảm bảo vết mùi hội tụ, người ta sử dụng
hằng số bay hơi vết mùi 0 < ρ <= 1 hay hệ số chiết khấu trong học tăng cường,
khi một cạnh được cập nhật mùi thì vết mùi biến đổi theo công thức:
τij ← (1− ρ)τij + ∆ij
Điểm then chốt là cạnh nào được cập nhật và lượng them vào thế nào là tùy theo
quy tắc được chon. Có nhiều quy tắc cập nhật mùi đã được đề xuất, trong đó điển
hình là các quy tắc hệ kiến (Ant System: AS), hệ đàn kiến (ACS), hệ kiến Max-
Min(Max–Min Ant System: MMAS) và hệ kiến Max-min trơn (Smooth Max-Min
Ant System: SMMAS).
Hệ kiến AS
Hệ kiến AS áp dụng quy tắc cập nhật mùi địa phương, và là quy tắc đầu tiên được
áp dụng trong số các thuật toán ACO. Theo quy tắc này, ở bước lặp t, mỗi kiến k
áp dụng cập nhật mùi cho tất cả các cạnh (ui, ui+1) thuộc lời giải ωk(t) theo công
thức:
∆i,j =
ρ 1Lk nếu(i, j) ∈ (ω(t))0 khác (2.2.3)
trong đó Lk là giá trị hàm mục tiêu f (ωk(t)) (không giảm tổng quát,được giả thiết
là dương). Nhược điểm của quy tắc là vết mùi ở các cạnh không được cập nhật sẽ
nhanh chóng dần về không nên hạn chế không gian tìm kiếm và thuật toán kém
hiệu quả.
Quy tắc ACS
Quy tắc này do Dorigo đề xuất năm (1997). Trong thuật toán ACS, việc cập nhật
mùi bao gồm cả hai hình thức địa phương và toàn cục. Cập nhật mùi địa phương
áp dụng cho mọi cạnh có kiến k sử dụng khi nó tìm lời giải. có hai cách cập nhật
mùi toàn cục.
a) Cập nhật mùi toàn cục áp dụng cho các cạnh thuộc lời giải tốt nhất của bước
lặp ω(t)hay toàn cục ω∗(t) và gọi tương ứng là i-best hay G-best. Theo cách i-besst,
∆τi,j được xác định theo công thức:
∆τi,j = ρ f (ω(t)) (2.2.4)
32
b) Cập nhật mùi toàn cục áp dụng cho tất cả các cạnh và cũng các hai cách i-best
hay G-best, với G-best thì ∆τij xác định theo công thức:
∆i,j =
ρ 1f (ω∗(t)) nếu(i, j) ∈ (ω∗(t))0 khác (2.2.5)
Quy tắc MMAS
Để khắc phục nhược điểm nêu trên của AS và ACS, Stutzle Hoos (2000) đề xuất
MMAS gồm 2 bước.
Bước thứ nhất, cập mùi toàn cục cho tất cả các cạnh theo phương thức i-best hoặc
G-best.
Bước thứ hai, so sánh các τi,jvới hai đại lượng τmax và τmin với τmax > τmin > 0 để
giới hạn vết mùi trong đoạn [τmax, τmin], cụ thể như sau:
τi,j =
τmax nếuτi,j > τmax
τi,j nếuτi,j ∈ [τmin, τmax]
τmin nếuτi,j < τmin
(2.2.6)
Nói chung, MMAS dùng i-best tốt hơn G-best nhưng cũng có thể dung luân
phiên cho các bước lặp. Khi bắt đầu thuật toán, vết mùi thường được thiết đặt
bằng ước lượng cận trên của vết mùi τmax. Cách khởi tạo như vậy kết hợp với tham
số bay hơi nhỏ làm chậm sự khác biệt vết mùi của các cạnh, do đó giai đoạn đầu
của MMAS mang tính khám phá. Nhờ giới hạn vết mùi trong đoạn [τmin, τmax] ,
MMAS hạn chế được tình trạng vết mùi dần về không, khắc phục được nhược
điểm của AS và ACS.
Quy tắc SMMAS
Quy tắc SMMAS lần đầu tiên được Đỗ Đức Đông và cộng sự dùng cho bài toán
lập lịch sản xuất và được trình bày chặt chẽ cho bài toán TSP.
SMMAS được đề xuất dựa trên nhận xét hai nhược điểm của MMAS:
• Thứ nhất, nếu chọn τmax, τmin lệch nhau ít thì làm triệt tiêu hiệu quả học tăng
cường, còn nếu chọn lệch nhau nhiều thì vết mùi ở các cạnh ít được cập nhật
sẽ nhanh chóng về τmin làm hạn chế không gian tìm kiếm mặc dù có nhẹ hơn
AS và ACS.
• Thứ hai là đâị lượng ∆τi,j phụ thuộc giá trị hàm mục tiêu làm cho thuật toán
phải tính toán phức tạp, tuy nhiên trong học tăng cường thì không cần thiết.
Một trong các cải tiến là khi khởi tạo lại vết mùi, việc cập nhật mùi thường xuyên
bằng lời giải tốt nhất tìm được mới nhất thay vì cố định.
33
Với nhận xét trên, SMMAS không giảm vết mùi ở các cạnh không thuộc lời giải
tốt quá nhanh như quy tắc MMAS mà dùng quy tắc Max-Min trơn bằng cách cập
nhật τi,j toàn cục cho mọi cạnh với ∆τi,j xác định bởi:
τij ← (1− ρ)τij + ∆ij
trong đó:
∆i,j =
ρτmax nếu(i, j) ∈ (t)ρτmin khác (2.2.7)
Quy tắc này cũng khởi tạo τ0 = τmax. Đây là một phương pháp cập nhật mùi dễ cài
đặt và có độ phức tạp tính toán cũng thấp hơn so với các phương pháp trước nó.
Thực nghiệm và phân tích toán học cho thấy nó tốt hơn MMAS.
Tái khởi tạo vết mùi
Việc sử dụng thông tin vết mùi như cơ chế học tăng cường giúp ta tìm kiếm
quanh lời giải tốt, tuy nhiên có thể bỏ sót những miền tiềm năng chứa lời giải tốt
hơn. Để tăng tính khám phá, nếu sau một số bước lặp mà lời giải tốt nhất ω∗(t) tìm
được không đổi so với các bước trước đó thì nên khởi tạo lại vết mùi.
Tìm kiếm địa phương
Lược đồ ACO ở trên thực hiện tìm kiếm ngẫu nhiên để tìm lời giải gần đúng nên
không gian tìm kiếm rộng. Thông thường thì các kỹ thuật tìm kiếm địa phương hội
tụ đến cực trị địa phương nhanh hơn. Vì vậy người ta thường áp dụng kỹ thuật
tìm kiếm địa phương để tăng cường chất lượng lời giải cho lời giải tốt nhất hoặc
cho mọi lời giải trong mỗi bước lặp trước khi cập nhật mùi.
34
Chương 3
Thuật giải di truyền cho bài toán
q-CaRS
Như đã giới thiệu trong chương 1, thuật toán tiến hóa sử dụng những nguyên
tắc của sự tiến hóa để khai thác và tìm kiếm các giải pháp trong bài toán tối ưu.
Giải thuật di truyền cũng tương tự như vậy. Giải thuật di truyền cổ điển sử dụng
những nguyên tắc của sự tiến hóa dựa trên sự chuyển đổi của gen theo chiều dọc,
ví dụ sự kế thừa của con cái từ cha mẹ. Với sự phổ biến của lý thuyết tiến hóa
trong ngành khoa học máy tính, các cơ chế tiến hóa khác được tạo ra ví dụ như
chuyển đổi gen theo chiều ngang (HGT), và HGT cũng được coi là nền tảng cho sự
tiến hóa của nhiều ngành khoa học. HGT, còn được gọi là chuyển gen ngoài, tức là
ngoài việc kế thừa từ cha mẹ sang con thì gen có thể được kế thừa từ những sinh
vật khác [10]. Các cơ chế chính của HGT là chuyển đổi, phân chia và truyền dẫn.
Chuyển đổi là sự hấp thụ thông tin di truyền tự nhiên của sinh vật từ bên ngoài,
phân chia là quá trình chuyển giao thông tin di truyền thông qua sự tiếp xúc vật lý
từ tế bào cho sang tế bào nhận. Và truyền dẫn là quá trình chuyển đổi gen thông
qua một virus trung gian.
Các yếu tố di truyền di động như transposons và plasmid là phương tiện quan
trọng giữa HGT và vi khuẩn. Transposons hay các gen nhảy là các đoạn DNA có
khả năng dịch chuyển nơi cư trú của chính mình trong một bộ gen. Một plasmid
là một phân tử AND nhỏ có khả năng sao chép độc lập. Các bài toán dựa trên sự
dịch chuyển của transposon được lần đầu giới thiệu trong [35] . Tuy nhiên, những
nghiên cứu dựa trên hành động của plasmid ít được nghiên cứu rộng rãi. Một giải
thuật tiến hóa dựa trên sự biến đổi của plasmids được giới thiệu trong [36, 37] và
được áp dụng cho bài toán xếp ba lô dạng 0/1, thuật toán sử dụng sự tổng hợp
các đoạn DNA vào nhiễm sắc thể. Các đoạn DNA là những chuỗi nhị phân được
thu thập từ một kho lưu trữ được tạo ra từ lúc bắt đầu của quá trình tiến hóa và
được cập nhật theo thời gian thực. Một ý tưởng tương tự được giới thiệu trong
35
[13], đã sử dụng một virus để vận hành sự chuyển đổi gen giữa các nhiễm sắc thể
trong giải thuật di truyền. Cơ chế HGT cũng đóng một vài trò quan trọng trong
giải thuật tiến hóa vi khuẩn (BEA) trong [31]. Thuật toán BEA lấy những phần tốt
nhất của nhiễm sắc thể để sao chép sang những nhiễm sắc thể xấu. Một biến thể
memetic của BEA được giới thiệu trong [12] và được áp dụng trong TSP. Thao tác
của plasmid và transposon đều được sử dụng trong thuật chuyển đổi gen trong
[19, 22] để thúc đẩy sự phát triển của những giải pháp tiềm năng mới. Các thao tác
tái tổ hợp và chéo nhau không được sử dụng cho những thuật toán trên.
Những nghiên cứu của lý thuyết tiến hóa cũng được xem xét cho những sinh vật
nhân sơ(prokaryotes), gần đây có nhiều nghiên cứu đã cung cấp bằng chứng rằng
nó cũng xảy ra với cả những sinh vật nhân chuẩn(eukaryotes). Trong luận văn này,
thuật toán tiến hóa sử dụng thao tác plasmid của nhiễm sắc thể và đồng thời sử
dụng thao tác tái sản sinh .
3.1. Biểu diễn quần thể
Trong bài toán này ta sẽ biểu diễn nhiễm sắc thể dạng nguyên. Mỗi nhiễm sắc
thể là một mảng hai chiều với một hàng là tập tuần tự các thành phố đến thăm và
một hàng là tập các xe được sử dụng.
Hình 3.1: Nhiễm sắc thể
Thuật toán láng giềng gần nhất được sử dụng để xây dựng đường dẫn giữa 2
thành phố theo chi phí cạnh của chiếc xe gắn liền với con đường đó. Tour bắt đầu
tại thành phố 1. Xe c1 được chọn ngẫu nhiên để di chuyển từ thành phố 1 tới thành
phố ngẫu nhiên i (c1 được trả lại ở i). Nếu giá trị ràng buộc tối thiểu không được
thu thập, thành phố i sẽ là điểm khởi tạo trong phần tiếp theo của tour. Một xe mới
c2 và một thành phố chưa đến thăm j sẽ được chọn ngẫu nhiên. Một đường dẫn
sẽ được tạo ra giữa thành phố i và j bằng việc chỉ xem xét đến các thành phố chưa
đến thăm. Tiến trình sẽ tiếp diễn cho đến khi thu được giá trị ràng buộc nhỏ nhất.
Chu trình sẽ được đóng với một cạnh từ thành phố cuối cùng trong tour đi đến
thành phố 1. Bài toán biến thể được xem xét đến trong nghiên cứu này không cho
36
phép một xe có thể được thuê nhiều hơn 1 lần, vậy nên nếu không còn xe mới nào
được thêm thì chiếc xe cuối cùng sẽ được sử dụng dể di chuyển đến các thành phố
khác cho đến khi thu được giá trị rằng buộc tối thiểu .
3.2. Quá trình tái tạo
Quá trình tái tạo được thực hiện dựa vào toán tử di truyền và biến dị.
Toán tử tương giao chéo:
Khi khởi tạo quần thể, một tập các cá thể tốt nhất sẽ được chọn ra gọi là tập
elite. Trong mỗi lần tái tạo ta sẽ chọn ngẫu nhiên một cá thể trong quần thể và một
cá thể trong tập các cá thể tốt nhất để tương giáo chéo với điểm tương giao chéo là
ngẫu nhiên. Sau khi tái tạo tập các cá thể tốt nhất được cập nhật lại.
Toán tử biến dị:
Toán tử biến dị ở đây chính là một đoạn plasmid là đoạn gen được chọn ra từ tập
elite. Một đoạn gen trong cá thể được chọn lọc để tái tạo sẽ được thay thể tương
ứng với plasmid.
Hình 3.2: Plasmid
Ví dụ trong hình 3.2 một cá thể sol được chọn ra từ quần thể và cá thể sol’ được
chọn ra từ tập elite. Một đoạn plasmid được chọn ra từ sol’. Tương tự ta loại bỏ
1 đoạn gen ngẫu nhiên có kích thước bằng với plasmid từ sol cho kết quả là sol".
Thay thể đoạn gen bị loại bỏ bằng plasmid ta có kết quả là sol”’.
37
3.3. Thủ tục tìm kiếm địa phương
Để tăng cường chất lượng của lời giải "sol" ta có thủ tục tìm kiếm địa phương
multiOperatorsSearch với 6 thủ tục:
-removeSaving: sẽ loại bỏ các thành phố có giá trị hạn ngạch thấp nhất từ sol
cho đến khi tổng ràng buộc yêu cầu là nhỏ nhất.
Ví dụ như hình ta có một nhiễm sắc thể với 1 chiều là mảng các thành phố, mỗi
thành phố có một mức độ hài lòng. Tổng mức độ hài lòng yêu cầu là 288 nhưng
tổng mức độ hài lòng hiện tại đang là 330, vì thế ta sẽ loại bỏ một số thành phố.
Thành phố 7 đang có mức độ hài lòng thấp nhất nên sẽ là điểm loại bỏ đầu tiên.
Sau khi loại bỏ thành phố 7 mức độ hài lòng là 317 vẫn lớn hơn yêu cầu, ta tiếp tục
xét đến thành phố liền kề đứng trước thành phố 7 là thành phố 6. Tiếp tục loại bỏ
thành phố 6 mức độ hài lòng là 290 vẫn lớn hơn 288. Xét tiếp thành phố 5 nhưng
tồng mức độ hài lòng là 257 nhỏ hơn 288 vì vậy ta không thể loại bỏ thành phố 5.
Đây là kết cuối cùng sau thủ tục removeSaving.
Hình 3.3: removeSaving
-invertSol: Hàm đảo ngược invertSol của sol có kết quả là sol
′
. Những xe liên
quan tới các thành phố trong sol cũng có giá trị sol
′
tương đương. Thứ tự của các
38
lượt thăm được đảo ngược, do đó các điểm cho thuê và các điểm trả lại được trao
đổi, điều này làm ảnh hưởng đến chi phí của giải pháp. Thủ tục invertSol trả về giải
pháp tốt nhất giữa sol và sol
′
.
Hình 3.4: invertSol
-replaceSavingCity: Tất cả những thành phố chưa thăm được xem xét cho sự bổ
sung. Mỗi thành phố chưa thăm được kiểm tra để thay thế 1 thành phố trong sol.
Những xe đã được gán sẽ không thay đổi.
Trong hình 3.5 , thành phố 7 là thành phố chưa được thăm. Ta sẽ xét thay thế
thành phố 7 cho các thành phố 2, 3, 4, 5
Hình 3.5: replaceSavingCity
-insertSavingCity: Thủ tục insertSavingCity cũng tập trung vào các thành phố
chưa được thăm, các thành phố chưa được thăm sẽ được chèn vào các vị trí mà
không loại bỏ bất kì thành phố nào trong sol. Xe được thuê là xe tương ứng với
thành phố trước đó.
Trong hình 3.6, thành phố 2 là thành phố chưa được thăm. Ta sẽ bổ sung thành
phố 2
39
Hình 3.6: insertSavingCity
-replaceSavingCar: Thủ tục replaceSavingCar kiểm tra việc chèn xe chưa được
sử dụng . Tất cả những chiếc xe chưa sử dụng được xem xét và chèn vào tại tất cả
các điểm của sol.
Ví dụ minh họa thay thế chiếc xe 1 trong các hình: 3.7, 3.8, 3.9, 3.10
Hình 3.7: Thay thế xe 1 bắt đầu từ vị trí 2
40
Hình 3.8: Thay thế xe 1 bắt đầu từ vị trí 3
Hình 3.9: Thay thế xe 1 bắt đầu từ vị trí 4
41
Hình 3.10: Thay thế xe 1 bắt đầu từ vị trí 5
- 2-opt.:Tất cả 2-opt di chuyển đều được kiểm tra. Trình tự của xe gắn với tour
cũng sẽ được giữ nguyên.
Lời giải cụ thể được biểu diễn trong thuật toán MemPlas dưới đây
3.4. Thuật toán MemPlas
Mã giả của thuật toán MemPlas được biểu diễn trong (thuật toán 1) . Đầu vào
của thuật toán có 5 tham số: số lượng quần thể (sizePop), kích thước của plasmid
(sizePlas), tỉ lệ tái tổ hợp (#cross), kích thước của các lớp (#elite) và số lần lặp tối đa
(limitIter). Tâp giá trị elite sẽ chứa những #elite tốt nhất từ quần thể. Plasmid bao
gồm những đoạn gen thu được trong tập elite. Trong 9 lần lặp, nhiễm sắc thể sẽ
được tái tổ hợp. Trong lần lặp cuối cùng, một plasmid sẽ được sử dụng để thay đổi
nhiễm sắc thể đã chọn.
42
Hình 3.11: Thuật toán MemPlas
Thao tác khôi phục có thể cần thiết sau khi thực hiện tái tổ hợp hoặc plasmid.
Giải pháp có thể cần được sửa chữa do các tour du lịch không khả thi hoặc việc
phân chia xe không khả thi hoặc là việc thu thập hạn mức là không khả thi. Hình
2 minh hoạ một nhiễm sắc thể C mà cần phải sửa chữa. Thành phố 3 và 7 trong
C đã đến thăm 2 lần và xe 2 và 3 đã được thuê 2 lần. Thao tác sửa chữa được mô
tả trong [22]. Để xóa bỏ tính chất không khả thi của tour, một dấu sao (*) sẽ thay
thế một thành phố trong nhiễm sắc thể. Những thành phố được chọn ngẫu nhiên
trong những thành phố chưa thăm. Nếu không còn thành phố nào chưa thăm thì
gen tương ứng với dấu sao sẽ được xóa. Để bỏ tính chất không khả thi của việc
phân chia xe, dấu * sẽ thay thế cho việc lặp đi lặp lại việc thuê xe như trong nhiễm
sắc thế thứ hai trong hình 2. Sau đó ta sẽ quét từ trái sang phải và dấu * trong index
i sẽ được thay thế bởi thành phần index i-1. Cuối cùng, giá trị ràng buộc nhỏ nhất
được xác nhận. Đặt l là giá trị biểu diễn số lượng thành phố đã thăm. Nếu yều cầu
ràng buộc không được thỏa mãn thì các giá trị ràng buộc sẽ được sắp xếp theo thứ
tự không giảm và thành phố tương ứng được đánh số từ 1 đến l. Thủ tục bắt đầu
từ thành phố đầu tiên và nó sẽ duyệt để thay thế một thành phố đã thăm với một
thành phố chưa thăm mà có giá trị ràng buộc cao hơn cho đến khi yêu cầu được
thỏa mãn. Nếu thành phố thứ l đã được thay thế mà yêu cầu vẫn chưa được thỏa
mãn thì các thành phố sẽ được bổ sung ngẫu nhiên vào vị trí cuối cùng cho đến
khi yêu cầu ràng buộc đạt yêu cầu. Khi đó xe sẽ được gán với mỗi thành phố được
thêm cho đến thành phố cuối cùng.
43
Hình 3.12: Sửa chữa tour
3.5. Kết quả thực nghiệm
3.5.1. Bộ dữ liệu chuẩn
Trong phần này sẽ giới thiệu kết quả của việc tính toán thực nghiệm dựa trên 40
trường hợp q-CaRS. Dữ liệu được lấy từ
Các thông số trong mỗi file:
DIMENSION: Số lượng thành phố.
CARS_NUMBER: Số lượng xe để thuê.
NODE_COORD_SECTION: Tọa độ thành phố .
EDGE_WEIGHT_SECTION: Giá thuê xe tại mỗi thành phố.
RETURN_RATE_SECTION: Giá thuế trả lại xe tại mỗi thành phố.
Chí phí di chuyển từ thành phố i đến thành phố j với chiếc xe c được tính theo
công thức như sau:
dcij =
2Lc[i] + 3Lc[j]
3
+ d[i][j] (3.5.1)
Mức độ hài lòng tại mỗi thành phố được tạo ngẫu nhiên trong khoảng(0, 100);
3.5.2. Tiến hành chạy thực nghiệm
Chương trình được viết bằng ngôn ngữ Java chạy trên máy Desktop cấu hình
CPU intel core i5 2.5Ghz Ram 4GB, sử dụng hệ điều hànhWindow10. Vì GA là lớp
thuật toán meta-heuristic nên mỗi lần chạy sẽ cho các kết quả cụ thể là khác nhau,
nên tôi tiến hành chạy chương trình 10 lần trên mỗi bộ dữ liệu, thống kê kết quả
lấy giá trị kết quả tốt nhất và kết quả trung bình. Bên cạnh đó là thời gian tương
ứng chạy với các kết quả.
3.5.3. Kết quả thực nghiệm
Phần này thực hiện với hai bộ tham số khác nhau để đánh giá về mức độ ảnh
hưởng khi thay đổi các tham số đầu vào
44
Tiến hành thực nghiệm với các tham số
Tham số Giá trị
Số lượng quần thể( sizePop) 150
Số lượng vòng lặp 10
Tỉ lệ tái tổ hợp(#cross) 0.4
Tỉ lệ chọn các cá thể tối ưu ( #elite) 0.3
Kích thước của plasmid(sizePlas) [3, 0.4s] với s là kích thước cá thể chứa plasmid
45
Hình 3.13: Kết quả thực nghiệm 1 của GA
46
Tiến hành thực nghiệm với các tham số
Tham số Giá trị
Số lượng quần thể( sizePop) 150
Số lượng vòng lặp 10
Tỉ lệ tái tổ hợp(#cross) 0.5
Tỉ lệ chọn các cá thể tối ưu ( #elite) 0.5
Kích thước của plasmid(sizePlas) [3, 0.4s] với s là kích thước cá thể chứa plasmid
47
Hình 3.14: Kết quả thực nghiệm 2 của GA
Bảng trên thống kê kết quả sau 10 lần chạy thực nghiệm đối vởi cả 35 bộ dữ. Trong
đó mỗi hàng thể hiện cho một bộ dữ liệu. Kết quả trung bình là kết quả chạy trung
bình của 10 lần chạy, kết quả tốt nhất là kết quả tốt nhất trong 10 lần chạy. Tương
ứng là thời gian chạy với các kết quả.
Từ các kết quả thực nghiệm khi tỉ lệ tương giao và tỉ lệ chọn các nhiễm sắc thể ưu
tú cao thì kết quả không tốt với tỉ lệ thấp hơn. Việc lựa chọn ngẫu nhiên các nhiễm
48
sắc thể từ một tập lớn hơn sẽ bị ảnh hưởng đến chất lượng, bởi khi đó có thể chọn
vào các nhiễm sắc thể không tốt. Tuy nhiên nếu chọn tỉ lệ quá thấp có thể rơi vào
trạng thái cục bộ, bỏ qua kết quả tốt khác. Vì vậy tùy vào từng yêu cầu bài toán ta
có thể lựa chọn tỉ lệ một cách mềm dẻo để cho chất lượng lời giải tốt nhất.
49
Chương 4
Thuật toán ACO giải bài toán q-CaRS
4.1. Đồ thị cấu trúc
Giải bài toán tối ưu tổ hợp bằng thuật toán ACO việc quan trọng nhất là xây
dựng cấu trúc đồ thị.
Ta có:
A = a1, a2, ..., an là tập các thành phố.
C = c1, c2, ..., cm là tâp các xe để di chuyển.
Đồ thị cấu trúc của bài toán G = {V, E} được xây dựng như sau:
Đồ thị bao gồm l tầng như hình 4.1 . Mỗi đỉnh bao gồm thành phố xuất phát và
chiếc xe để di chuyển đến thành phố tiếp theo : vci = (i, c) : i ∈ A, c ∈ C. Các cạnh
của đồ thị ei j = (vci , v
c′
j ) : vi, vj ∈ A, i < j, c, c′ ∈ C nối các đỉnh đồ thị. Thông tin
heuristic được đặt trên các cạnh của đồ thị kí hiệu là τ(vci , v
c′
j ). Quy tắc cập nhật
vết mùi được áp dụng theo thuật toán SMMAS[2].
50
Hình 4.1: Đồ thị cấu trúc
Thuật toán được xây dựng như dưới đây:
Bước 1. Khởi tạo ma trận vết mùi, và tập K gồm k kiến.
Bước 2. Thực hiện lặp trong khi chưa thoả mãn điều kiện dừng
Với mỗi kiến ta tiến hành các bước sau:
2.1. Khởi tạo đỉnh xuất phát vci bằng cách chọn thành phố cơ sở và chiếc xe di
chuyển c thuộc C. Cập nhật lại A = A− i .
2.2 Thực hiện lặp với t >= 2. Chọn đỉnh tiếp theo vc
′
j = (j, c
′) với xác suất
Pvci vc
′
j
=
[τ
vci v
c′
j
]α[η
vci v
c′
j
]β
∑l∈A,c′∈C[τvci vc
′
l
]α[η
vci v
c′
l
]β
.Cập nhật lại A = A − i . Nếu đỉnh trước đó được
chọn có xe c 6= c′ ta cập nhật lại C = C− c
2.3. Thực hiện tìm kiếm cục bộ trên lời giải tốt nhất do các kiến tìm được để cải
thiện chất lượng lời giải.
2.4. Cập nhật lại lời giải tốt nhất.
2.4. Cập nhật vết mùi theo quy tắc SMMAS dựa trên lời giải tốt nhất.
Bước 3. Lưu lại lời giải tốt nhất.
Sơ đồ thuật toán của việc xây dựng một lời giải pi bởi một con kiến được phác
thảo dưới đây:
51
Hình 4.2: Xây dựng lời giải của kiến
4.2. Vết mùi và thông tin heuristic
Vết mùi τ(vci , v
c′
j ) trên cạnh τ(v
c
i , v
c′
j ) được khởi tạo bằng τmax và được cập nhật
lại theo mỗi vòng theo công thức.
Thông tin heuristic đươc tính theo công thức:
ηvci v
c′
j
=
1
dcij + γ
c
ij
(4.2.1)
trong đó dcij là chi phí di chuyển từ thành phố i đến thành phố j và γ
c
ij là chi phí trả
lại chiếc xe nếu tại j xe c không được thuê .
4.3. Quy tắc cập nhật mùi
Sau khi tất cả các kiến đã xây dựng lời giải, lời giải của kiến tốt nhất được áp
dụng thủ tục tìm kiếm cục bộ để tăng chất lượng lời giải. Lời giải tốt nhất này được
sử dụng để cập nhật vết mùi trên các cạnh theo quy tắc cập nhật mùi SMMAS:
τ(vci , v
c′
j ) = (1− ρ)τ(vci , vc
′
j ) + ∆vci ,vc
′
j
(4.3.2)
52
trong đó:
∆vci ,vc
′
j
=
ρτmax nếu(vci , vc
′
j ) ∈ bestsolution
ρτmin nếu (vci , v
c′
j ) /∈ bestsolution
(4.3.3)
Trong đó τmax và τmin là các tham số được cho trước, ρ ∈ (0, 1) là tham số bay hơi
cho trước quy định 2 thuộc tính, ρ nhỏ thể hiện việc tìm kiếm quanh thông tin học
tăng cường, ρ lớn thể hiện tính khám phá.
4.4. Thủ tục tìm kiếm cục bộ
Để tăng cường chất lượng lời giải, ta sử dụng thêm thủ tục tìm kiếmđịa phương.
Thục tục tìm kiếm cục bộ trong phần này được áp dụng hàmmultiOperatorsSearch
như trong thuật toán GA ở phần trên.
4.5. Kết quả thực nghiệm
Thực nghiệm được tiến hành để so sánh với thuật toán GA nên sử dụng bộ dữ
liệu chuẩn như trong GA với cấu hình máy tương tự.
Vì ACO là lớp thuật toán meta-heuristic nên mỗi lần chạy sẽ cho các kết quả cụ thể
là khác nhau, nên tôi tiến hành chạy chương trình 10 lần trên mỗi bộ dữ liệu, thống
kê kết quả thu được, so sánh thông qua 2 tiêu trí là kết quả tốt nhất, kết quả xấu
nhất và kết quả trung bình của 10 lần chạy đó. Để so sánh với thuật toán GA ta sẽ
chạy thực nghiệm của ACO với cùng số lời giải. Như giới thiệu ở trên, GA sử dụng
số lượng quần thể là 150 và số vòng lặp là 10, do đó trong ACO ta sử dụng 10 kiến
và đẩy số lượng vòng lặp là 150.
4.6. Kết quả thực nghiệm và đánh giá
Tương tự với thuật toán GA ta cũng thực nghiệm với hai bộ tham số khác nhau
để đánh giá mức độ ảnh hưởng của các tham số
53
Tiến hành thực nghiệm với các tham số
Tham số Giá trị
Tham số bay hơi( ρ) 0.03
α 2
β 6
Số kiến ban đầu 10
Số vòng lắp 150
τmax 0.1
τmin 0.008
Kết quả chạy:
54
Hình 4.3: Kết quả thực nghiệm 1 của ACO
55
Tiến hành thực nghiệm với các tham số
Tham số Giá trị
Tham số bay hơi( ρ) 0.03
α 2
β 6
Số kiến ban đầu 10
Số vòng lắp 150
τmax 0.1
τmin 0.008
Kết quả chạy:
56
Hình 4.4: Kết quả thực nghiệm 2 của ACO
Bảng trên thống kê kết quả sau 10 lần chạy thực nghiệm đối vởi cả 35 bộ dữ.
Trong đó mỗi hàng thể hiện cho một bộ dữ liệu. Kết quả trung bình là kết quả chạy
trung bình của 10 lần chạy, kết quả tốt nhất là kết quả tốt nhất của 10 lần chạy.
Tương ứng là thời gian chạy với các kết quả.
Kết quả cho thấy khi tham số bay hơi nhỏ thì thực nghiệm tốt hơn. Điều này cho
thấy việc học tăng cường trong bài toán này là quan trọng hơn.
57
So sánh với kết quả thực nghiệm của thuật toán GA
Trong phần này ta sẽ so sánh kết quả của hai thuật toán GA và ACO với bộ
tham số cho kết quả tốt nhất.
Hình 4.5: So sánh kết quả thực nghiệm của ACO và GA
Từ bảng so sánh ta thấy thuật toán ACO cho kết quả tốt hơn GA rất nhiều cả
về chất lượng và thời gian chạy trong nhiều trường hợp. Chỉ có 4 trường hợp được
58
in đậm trên tổng số 35 trường hợp tức là khoảng 11.5% kết quả cho thấy GA tốt
hơn. Như vậy tùy từng yêu cầu của bài toán về thời gian và chất lượng, nếu yêu
cầu thời gian chạy thấp ta có thể hoàn toàn sử dụng ACO để tìm kiếm lời giải.Tuy
nhiên mức độ ảnh hưởng của các tham số là khá lớn, vì vậy cần linh hoạt trong
bước lựa chọn tham số.
59
Phụ lục
Phụ lục này sẽ trình bày cách chạy chương trình và một số modules cơ bản của
thuật toán MemPlas dưới dạng ngôn ngữ Java 8.
Cách chạy chương trình:
Bước 1: mở chương trình với IDE ’ItelliJ IDEA’ như hình 4.6
Hình 4.6: Mở chương trình
Bước 2: Bấm nút ’Run’ để chạy chương trình như hình 4.7
60
Hình 4.7: Chạy chương trình
Kết quả được ghi vào file ’myfile.txt’.
Một số modules cơ bản:
Class City
public class City implements Comparable{
private String name;
private double x = 0;
private double y = 0;
private double satisfaction = 0;
public double getX() {
return x;
}
public double getY() {
return y;
}
public String getName() {
return this.name;
}
61
public double getSatisfaction() {
return this.satisfaction;
}
public double getDistance(City city) {
return Math.sqrt(Math.pow(city.getX() - x, 2) + Math.pow(city.getY() - y, 2));
}
public City(String name, double x, double y, double satisfaction) {
this.name = name;
this.x = x;
this.y = y;
this.satisfaction = satisfaction;
}
public int compareTo(City city) {
double compareSatisfaction = ((City) city).getSatisfaction();
return (int) (compareSatisfaction - this.satisfaction);
}
}
Class Car:
import java.util.HashMap;
public class Car {
private String name;
public HashMap prices = new HashMap();
public HashMap returnTaxes = new HashMap();
public String getName() {
return name;
}
62
public Car(String name) {
this.name = name;
}
public void setCityReturnTax(City city, double value) {
returnTaxes.put(city, value);
}
public double getCityReturnTax(City city) {
return returnTaxes.get(city);
}
public void setCityPrice(City city, double value) {
prices.put(city, value);
}
public double getCityPrice(City city) {
return prices.get(city);
}
public double getCarTax(City city) {
return getCityReturnTax(city);
}
public double getCarPrice(City fromCity, City toCity) {
double distance = fromCity.getDistance(toCity);
double price = (2 * getCityPrice(fromCity) + 3 * getCityPrice(toCity)) / 3 + distance;
return price;
}
}
Class CityCar
public class CityCar {
private City city;
private Car car;
63
public CityCar(City city, Car car) {
this.city = city;
this.car = car;
}
public City getCity() {
return city;
}
public Car getCar() {
return car;
}
}
64
KẾT LUẬN
Trong luận văn này emđã trình bày được nội dung thuật toán di truyền, phương
pháp tối ưu hóa đàn kiến, mô hình quy hoạch nguyên, bài toán thuê xe có hạn
ngạch, đưa ra mô hình nguyên cho bài toán và áp dụng thuật toán di truyền và
phương pháp tối ưu hóa đàn kiến giải bài toán trên.
Kết quả thực nghiệm tính toán được biểu diễn bằng cách cố định số lần lặp,
cố định số lần đánh giá và cố định thời gian xử lý đồng thời sử dụng hệ thống
kiểm định để phát hiện sự khác biệt trọng yếu trong thuật toán nhẳm đảm bảo
chất lượng của giải pháp. Kết quả thu được chỉ ra rằng thuật toán phương pháp
tối ưu hóa đàn kiến cho kết quả và thời gian chạy tốt hơn trong nhiều trường hợp.
Vấn đề được trình bày trong nghiên cứu này là mới, vậy nên có thể có một số
vấn đề có thể được nghiên cứu trong tương lai, ví dụ như ứng dụng của meta-
heuristic và thủ tục tìm kiếm địa phương, hoặc là nghiên cứu các biến thể khác của
q-CaRS, ví dụ một phiên bản với 2 tham số mà tổng ràng buộc được tối đa và chi
phí là nhỏ nhất.
Đóng góp chính của luận văn bao gồm:
1 Tìm hiểu và trình bày lại nội dung bài toán thuê xe có hạn ngạch q-CaRS.
2 Trình bày lại thuật toán di truyền giải bài toán q-CaRS và đề xuất thêm
phương pháp tối ưu hóa đàn kiến để giải bài toán.
3 Lập trình và đưa ra kết quả thực nghiệm đánh giá của hai thuật toán.
Tuy nhiên do thời gian thực hiện luận văn không nhiều còn có những sai sót em
rất mong nhận được sự góp ý của quý thầy cô và bạn đọc.
65
Tài liệu tham khảo
[1] Hoàng Xuân Huấn, Giáo trình tối ưu tổ hợp.
[2] D.D.Do, Q.H.Dinh, H.X.Hoang (2008), On the pheromone update rules of ant-
colony optimization approaches for the job shop scheduling problem. In The 11th
Paci-c Rim International Conference on Multi-Agents:Intelligent Agents and
Multi-Agent Systems, volume 5357 of Lecture Notes in ComputerScience, 153-
160, Springer, Heidelberg.
[3] W.P. Adams, R.J. Forrester, F.W. Glover, Comparisons and enhancement strategies
for linearizing mixed 0–1 quadratic programs, Discrete Optim, 1 (2)(2004) 99–120.
[4] J.O. Andersson, Lateral gene transfer in eukaryotes, Cell. Mol. Life Sci. 62 (11)
(2005) 11821197.
[5] G. Ausiello, M. Demange, L. Laura, V. Paschos, Algorithms for the on-line quota
traveling salesman problem,Inf. Process. Lett. 92 (2) (2005) 89–94
[6] B. Awerbuch, Y. Azar, A. Blum, S. Vempala, New approximation guarantees for
minimum-weight k-trees and prize-collecting salesmen, SIAM J. Comput.28 (1)
(1998) 254–262.
[7] T.-M. Chan, K.-F. Man, K.-S. Tang, S.A. Kwong, A jumping gene algorithm for
multiobjective resource management in wideband cdma systems, Comput.J. 48 (6)
(2005) 749–768.
[8] K. Cheverst, K. Mitchell, N. Davies, The role of adaptive hypermedia in a context-
aware tourist guide, Commun. ACM 45 (5) (2002) 47–51.
[9] G.A. Croes, A method for solving traveling-salesman problems, Oper. Res. 6 (1958)
791–812.
[10] J.D.V. Elsas, S. Turner, M.J. Bailey, Horizontal gene transfer in the phytosphere,
New Phytol. 157 (3) (2003) 525–537.
66
[11] A. Fink , T. ReinersModeling and solving the short-term car rental logistics problem,
Transp. Res. Part E 42 (4) (2006) 272–292 .
[12] P. Fo¨ldesi, J. Botzheim, Modeling of loss aversion in solving fuzzy road transport
traveling salesman problem using eugenic bacterial memetic algo- rithm, Memetic
Comput. 2 (2010) 259–271.
[13] T. Fukuda , N. Kubota , K. Shimojima ,Virusevolutionary genetic algorithm and its
application to travelling salesmam problem, in: X. Yao (Ed.), Evolu-tionary Com-
putation, Theory and Applications, World Scientific, 1999, pp. 235–255.
[14] A. Garcia, P. Vansteenwegen, O. Arbelaitz, W. Souffriau, M.T. Linaza, Integrat-
ing public transportation in personalised electronic tourist guides, Comput.Oper.
Res. 40 (3) (2013) 758–774.
[15] D. Gavalas, C. Konstantopoulos, K. Mastakas, G. Pantziou, A survey on algo-
rithmic approaches for solving tourist trip design problems, J. Heuristics 20(3) (2014)
291–328.
[16] D.K. George, C.H. Xia, Fleet-sizing and service availability for a vehicle rental sys-
tem via closed queueing networks, Eur. J. Oper. Res. 211 (1) (2011)198–207.
[17] F. Glover, E. Woolsey, Converting the 0–1 polynomial programming problem to a
0–1 linear program, Oper. Res. 22 (1) (1974) 180–182.
[18] GLPK, A. Makhorin, Gnu linear programming kit.
[19] E.F.G. Goldbarg, M.C. Goldbarg, Transgenetic algorithm: A new endosymbiotic
approach for evolutionary algorithms, in: A. Abraham, A.-E. Hassanien, P. Siarry,
A. Engelbrecht (Eds.), Foundations of Computational Intelligence Volume 3,
Studies in Computational Intelligence, volume 203, Springer Berlin Heidel-
berg, 2009, pp. 425–460.
[20] M.C. Goldbarg, P.H. Asconavieta, E.F.G. Goldbarg, Memetic algorithm for the
traveling car renter problem: an experimental investigation, Memetic Comput. 4 (2)
(2012) 89–108.
[21] M.C. Goldbarg, E.F. Goldbarg, M. da S. Menezes, H.P. Luna, A transgenetic
algorithm applied to the traveling car renter problem, Expert Syst. Appl. 40 (16)
(2016) 6298–6310
[22] M.C. Goldbarg, E.F. Goldbarg, P.H. Asconavieta, M. da S. Menezes, H.P. Luna,
Quota traveling car renter problem: Model and evolutionary algorithm, Expert Syst.
Appl. 40 (16) (2013) 6298–6310
67
[23] B. Golden, L. Levy, R. Vohra, The orienteering problem, Nav. Res. Logist. 34 (3)
(1987) 307–318.
[24] K. Hagen , R. Kramer , M. Hermkes , B. Schumann , P. Mueller , Semantic
matching and heuristic search for a dynamic tour guide, in: Information and Com-
munication Technologies in Tourism, Springer, 2005, pp. 149–159 .
[25] Hansen, C. Meyer, Improved compact linearizations for the unconstrained quadratic
0–1 minimization problem, Discr. Appl. Math. 157 (6) (2009) 1267–1290.
[26] R. Kramer , M. Modsching , K. ten Hagen , A city guide agent creating and adapt-
ing individual sightseeing tours based on field trial results, Int. J. Comput.Intel.
Res. 2 (2) (2006) 191–206 .
[27] P. Hansen, C. Meyer, Improved compact linearizations for the unconstrained
quadratic 0–1 minimization problem, Soft Comput. 11 (2007) 923941.
[28] P. Kumar, D. Gospodaric, P. Bauer, Improved genetic algorithm inspired by biolog-
ical evolution, Soft Comput. 11 (2007) 923941.
[29] M.S. Menezes, M.C. Goldbarg, E.F.G. Goldbarg, A memetic algorithm for the
prize-collecting traveling car renter problem, Evolutionary Computation(CEC),
2014 IEEE Congress on, 2014, pp. 3258–3265.
[30] C.E. Miller, A.W. Tucker, R.A. Zemlin, Integer programming formulation of trav-
eling salesman problems, J. ACM 7 (4) (1960) 326–329.
[31] N.E. Nawa, T. Furuhashi, Fuzzy systems parameters discovery by bacterial evolu-
tionary algoritm, IEEE Trans. Fuzzy Syst. 7 (5) (1999) 608–616.
[32] A.M. Nedelcu, I.H. Miles, A.M. Fagir, K. Karol, Adaptative eukaryote-to-
eukaryote lateral gene transfer: stress-related genes of algal origin in the closest uni-
cellular relatives of animals, J. Evol. Biol. 21 (6) (2008) 18521860.
[33] G. Reinelt, Tsplib– a traveling salesman problem library, ORSA J. Comput. 3 (4)
(1991) 376.
[34] M. Schilde, K. Doerner, R. Hartl, G. Kiechle, Metaheuristics for the bi-objective
orienteering problem, Swarm Intel. 3 (3) (2009) 179–201.
[35] A. Simões , E. Costa , Transposition: a biologically inspired mechanism to use with
genetic algorithms, in: Proceedings of the Fourth International Conference on Neural
Networks and Genetic Algorithms (ICANNGA’99), 1999, pp. 178–186.
68
[36] W. Souffriau, P. Vansteenwegen, G.V. Berghe, D.V. Oudheusden, A path relink-
ing approach for the team orienteering problem, Comput. Oper. Res. 37(11) (2010)
1853–1859.
[37] W. Souffriau, P. Vansteenwegen, J. Vertommen, G.V. Berghe, D.V. Oudheus-
den, A personalised tourist trip design algorithm for mobile tourist guides, Appl.
Artif. Intel. 22 (10) (2008) 964–985.
[38] W. Souffriau, P. Vansteenwegen, G.V. Berghe, D.V. Oudheusden, A path relink-
ing approach for the team orienteering problem, Comput. Oper. Res. 37(11) (2010)
1853–1859 .
[39] W. Souffriau, P. Vansteenwegen, J. Vertommen, G.V. Berghe, D.V. Oudheus-
den, A personalised tourist trip design algorithm for mobile tourist guides, Appl.
Artif. Intel. 22 (10) (2008) 964–985.
[40] T. Tsiligirides, Heuristic methods applied to orienteering, J. Oper. Res. Soc. 35 (9)
(1984) 797–809 .
[41] P. Vansteenwegen, D.V. Oudheusden, The mobile tourist guide: An or opportu-
nity, OR Insights 20 (3) (2007) 21–27.
[42] P. Vansteenwegen, W. Souffriau, G.V. Berghe, D.V. Oudheusden, Iterated local
search for the team orienteering problem with time windows, Comput.Oper. Res. 36
(12) (2009) 3281–3290.
[43] P. Vansteenwegen, W. Souffriau, G.V. Berghe, D.V. Oudheusden, The city trip
planner: An expert system for tourists, Expert Syst. Appl. 38 (6) (2011)6540–6546
[44] P. Vansteenwegen, W. Souffriau, D.V. Oudheusden, The orienteering problem: A
survey, Eur. J. Oper. Res. 209 (1) (2011) 1–10.
[45] Y. Yang, W. Jin, X. Hao, Car rental logistics problem: A review of literature, in: Ser-
vice Operations and Logistics, and Informatics, 2008. IEEE/SOLI 2008.IEEE Inter-
national Conference on, 2, 2008, pp. 2815–2819.
[46] S.-H. Yeung, H.-K. Ng, K.-F. Man, Multi-criteria design methodology of a dielec-
tric resonator antenna with jumping genes evolutionary algorithm, Int.J. Electron.
Commun. (AEU¨) 62 (2008) 266–276.
[47] W. Yu, Z. Bao, X. Bao, Optimal deterministic algorithms for some variants of online
quota traveling salesman problem, Eur. J. Oper. Res. 238 (3) (2014)735–740.
69
[48] J.R. Zaneveld, D.R. Nemergut, R. Knight„Are all horizontal gene transfers created
equal? prospects for mechanism-based studies of HGT patterns, Microbiology 154
(2008) 1–15.
70
Các file đính kèm theo tài liệu này:
- luan_van_bai_toan_thue_xe_du_lich_co_han_ngach.pdf