Luận văn Điều khiển tắc nghẽn trên mạng ngang hàng có cấu trúc

Ta tiếp tục xét đến một hình thức cải tiến của phương pháp đã đưa ra. Trên một nút ta duy trì thêm một giá trị xác định tắc nghẽn thứ hai nhỏ hơn giá trị xác định mức độ tắc nghẽn “mềm” đã có. Khi một nút có lượng truy vấn đến vượt qua giá trị tắc nghẽn thứ hai, nút đó sẽ thực hiện việc gửi yêu cầu tha y đổi bảng định tuyến đến các nút ở “xa”, khi nút đạt đến mức tắc nghẽn “mềm” nó sẽ gửi yêu cầu thay đổi bảng định tuyến đến tất cả các nút. Việc xác định một nút xa hay gần được dựa trên ID của các nút đó. Dưới đây là một số kết quả thu được khi áp dụng phương pháp này

56 trang | Chia sẻ: lylyngoc | Lượt xem: 2870 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Luận văn Điều khiển tắc nghẽn trên mạng ngang hàng có cấu trúc, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

nằm sau nó trong vòng Chord. Nếu một nút đột ngột không liên lạc được với successor thì nó sẽ sử dụng các nút liền sau trong danh sách. Tiếp nữa các khóa (các item liên quan tới khóa) sẽ được sao chép trên các nút có trong danh sách đó. Do đó một khóa (item liên quan đến khóa) sẽ chỉ bị mất khi có log2(N)+1 các nút trong danh sách phải đồng thời rời khỏi mạng. 16 Chương 2. Vấn đề điều khiển tắc nghẽn trong mạng ngang hàng có cấu trúc 2.1. Tắc nghẽn và tầm quan trọng của việc điều khiển tắc nghẽn trong mạng ngang hàng có cấu trúc Mạng ngang hàng có cấu trúc được xây dựng với mục đích đáp ứng được nhu cầu mở rộng về số lượng node, khóa cũng như khả năng đáp ứng của toàn mạng. Đối với một hệ thống chia sẻ file đơn giản khi mỗi node chỉ phải đáp ứng số lượng nhỏ query và chỉ phải index một số giới hạn các tập tin, hệ thống có thể hoạt động tốt với thiết kế ban đầu. Tuy nhiên trong thời gian gần đây, mạng ngang hàng có cấu trúc được phát triển để có thể phục vụ cho các ứng dụng có độ phức tạp cao, ví dụ như hệ thống truy vấn thông tin (P2P Information Retrieval – P2P-IR) [8] hay hệ thống quản trị cơ sở dữ liệu (P2P Database Management Systems - P2P-DBMS) [2]. Các ứng dụng ở lớp trên này tạo lượng truy vấn lớn hơn rất nhiều, ví dụ: với một hệ thống chia sẻ file đơn giản các nút chỉ phải đánh index và tạo một số lượng khóa nhỏ lấy từ tên của các file, với một hệ thống truy vấn sử dụng kĩ thuật tìm kiếm full-text số lượng khóa phải index và đưa vào mạng là vài nghìn với một văn bản. Trong DHT, cụ thể ở đây là mạng Chord một nút đảm nhận hai chức năng chính là trả lời truy vấn và chuyển tiếp truy vấn đến nút khác, do đó khi một nút có vấn đề cũng có thể gây ảnh hưởng tới nhiều nút khác trong mạng. Thông thường các nút trong mạng có cấu hình phần cứng và băng thông mạng rất đa dạng, do đó khả năng đáp ứng truy vấn của từng nút cũng hoàn toàn khác nhau. Ngoài ra với mạng ngang hàng thường xảy ra tình trạng một số lượng tài nguyên được truy vấn với tần suất cao, chỉ trong một khoảng thời gian nhất định. Những đặc điểm trên khiến cho mạng ngang hàng có cấu trúc dễ xảy ra tình trạng tắc nghẽn và có thể gây ảnh hưởng rộng trên toàn mạng. Tắc nghẽn trong DHT thường bắt đầu khi một nút nhận được số truy vấn vượt quá khả năng xử lý của nó, nếu không có cơ chế thích hợp các truy vấn sau đến hoặc đi qua nút đó sẽ tạo ra tắc nghẽn trên mạng, có thể gây sụp đổ toàn mạng. Việc điều khiển tắc nghẽn giúp một hệ thống DHT có khả năng xử lý lượng lớn truy vấn nhằm đáp ứng cho các ứng dụng phức tạp ở lớp trên. Việc xử lý tắc nghẽn trên DHT nằm ở tầng trên và độc lập với các cơ chế điều khiển tắc nghẽn ở các tầng bên dưới, như TCP. 17 2.2. Phân tích quá trình sụp đổ do tắc nghẽn trong mạng ngang hàng có cấu trúc [8] Trong mục này chúng ta sẽ phân tích quá trình sụp đổ của một mạng DHT khi có tắc nghẽn xảy ra và không có cơ chế điều khiển tắc nghẽn nào được sử dụng. Nhằm đơn giản hóa, ta xét mạng DHT trong trường hợp đặc biệt khi các nút có cùng khả năng đáp ứng truy vấn. Giả sử các nút tham gia vào mạng thực hiện các truy vấn với tốc độ chỉ phụ thuộc vào khả năng của từng nút (ví dụ như tốc độ của bộ vi xử lý hay đường truyền của nút đó). Các truy vấn đến từ các nút khác nhau sẽ phải “cạnh tranh” tài nguyên trên nút đích. Nếu như lượng truy vấn đến vượt quá khả năng xử lý của một nút thì nút đó sẽ phải loại bỏ một số truy vấn. 2.2.1. Khái quát Mục đích của việc phân tích này là nghiên cứu về thông lượng đạt được – A trong mạng DHT khi mỗi nút tạo ra lượng truy vấn với tốc độ x. Mỗi truy vấn có xác suất được thực hiện thành công là p. p=1 nếu như nút không bị quá tải, ngược lại 0<p<1. Một nút được xác định tắc nghẽn hay không dựa vào lượng truy vấn tới và tài nguyên trên máy (có thể là tốc độ vi xử lý hoặc băng thông). Do đó ta phải tính toán tổng tải O mà tài nguyên thấp nhất (bottleneck) trên nút phải xử lý và so sánh với khả năng của nút đã được cho trước: c, qua đó ta có thể tính p và thông lượng đạt được A là một hàm của x. p là đại lượng không thứ nguyên, còn x,O và A có đơn vị là số truy vấn/giây. 2.2.2. Định nghĩa Thông lượng đến: Mỗi nút khởi tạo các truy vấn, được chuyển qua các nút trong mạng. Để tính tổng tải đến O trước hết ta định nghĩa thông lượng đến od h là thông lượng đến với đích là d trước khi qua h nút. Như đã giả thiết ở trên, các nut có cùng khả năng đáp ứng truy vấn, và các nút cùng khởi tạo một số lượng truy vấn. Do đó, thông lượng đến độc lập với nguồn sinh truy vấn. Để đơn giản ta xét một mạng Chord nhỏ, tuy nhiên kết quả sẽ vẫn đúng cho bất kì mạng DHT log n nào. 18 Hình 10: (a) tải đến các nút tạo bởi P0, (b) Tải tới và rời khỏi nút Hình 10a thể hiện thông lượng đến các nút khác được sinh bởi nút P0. Mỗi nút có log2n = l (ở đây n=8 và l=3) mục trong bảng định tuyến, mỗi mục trỏ đến một nút với khoảng cách 2i với i=0…(l-1). Mỗi nút thực hiện việc định tuyến bằng cách gửi truy vấn đến nút gần khóa được tìm kiếm nhất. P0 tạo các truy vấn đến 7 nút còn lại trong mạng. Một trong số truy vấn được chuyển qua nút khác.Ví dụ o7 1 là thông lượng đến tại P0 với đích đến là P7 trước khi đi qua nút đầu tiên (P0 – P4). Thông lượng đạt được: Mỗi nút có khả năng đáp ứng c để xử lý thông lượng đến. c phụ thuộc vào tốc độ vi xử lý và đường truyền của nút. Nếu như tổng thông lượng đến không vượt quá khả năng xử lý của nút, tất cả truy vấn đều được xử lý. Ngược lại sẽ có một số truy vấn bị hủy. Ta định nghĩa thông lượng đạt được như sau: ad h là thông lượng đạt được với đích là d sau khi qua h nút. Ví dụ: a7 1 ≤ o7 1 là thông lượng với đích là nút 7 sau khi qua nút đầu tiên, ứng với thông lượng tới nút 4. Xác suất xử lý: thông lượng đã xử lý được định nghĩa bởi công thức: p= min (1, c/O) (1) ở đó c là khả năng xử lý của nút và O là tổng tải đến. Khi một nút không quá tải O≤c tất cả thông lượng tới đều được xử lý, khi đó p=1, ngược lại p <1. Giả sử nếu thông lượng đến lớn gấp 2 lần khả năng xử lý của nút thì khi đó xác suất xử lý là 0.5. 19 Nếu truy vấn đến nút đích đi qua một số các nút, tại các nút tiếp theo thông lượng đến được tính theo công thức: (2) 2.2.3. Các mô hình Mỗi nút phải xử lý các truy vấn đến và đi hình 10b: truy vấn đến bao gồm tổng thông lượng tới Ofinal, được xử lý bởi ứng dụng phía trên và thông lượng truyền qua Orel là các truy vấn được chuyển đến các nút khác. Ta xet hai trường hợp tắc nghẽn: Trường hợp 1: Đường truyền lên (uplink) là bottleneck: Trên thực tế rất nhiều máy tính cá nhân có đường truyền bất đối xứng với tốc độ download lớn hơn tốc độ upload. Vì thế băng thông của uplink quyết định đến khả năng xử lý của nút. Tuy nhiên chúng ta cũng phải chú ý tới đại lượng α được sinh ra bới các gói tin ack phục vụ cho việc tải thông tin xuống trên đường downlink. Do đó tổng tải đến nút là: Trường hợp 2: Khả năng xử lý của nút là bottleneck: Nếu một nút có đủ băng thông cho cả đường uplink và downlink thì khi đó bottleneck của nút là tốc độ của vi xử lý. Ta có: 2.2.4. Tổng tải đến O Chúng ta tính toán OM1 và OM2 cho mô hình mạng DHT trên, để có thể tính được khả năng xử lý p với c cho trước sử dụng công thức 1. Chúng ta xét trường hợp các nút đồng thời tạo ra các truy vấn ngẫu nhiên với tốc độ x. x ở đấy chứa cả các truy vấn mà nút khởi tạo có thể tự trả lời, tức không cần đi qua nút nào.Trước hết ta xét trường hợp ứng với mạng gồm 8 nút, sau đó sẽ xét tới trường hợp tổng quan. Với mạng gồm 8 nút: Trong trường hợp này số truy vấn không phải qua bất kỳ nút nào là x/8, và 7/8 . x truy vấn cần đi qua các nút trong mạng để đến được đích. Khi đó tải đến nút đầu tiên sẽ là: 20 ∀ d, 0 < d ≤ 7, od 1 = 1/8 · x (3) Ta sẽ tính tổng thông lượng O đến mỗi nút sinh bởi P0. Sử dụng công thức 2 và 3 ta có: Thông lượng tạo bởi ứng dụng đến tất cả các đích trong mạng DHT trước khi qua nút đầu tiên: Thông lượng đạt được tại tất cả các đích sau khi đi qua nút cuối cùng, được xử lý bởi ứng dụng và không chuyển tiếp nữa được tính bởi công thức: Thông lượng chuyển tiếp được chuyển qua các nút lân cận được tính bởi công thức: Thông lượng đến và đi có thể được tính như sau: Với trường hợp có n nút: với bất kỳ mạng DHT log n nào với n=2l trong đó mỗi nút có l=log2n liên kết đến các nút khác trong mạng. Tổng tải trên mỗi nút với đích đến là d ở nút đầu tiên là: ∀ d, 0 < d < n, od 1 = x/n = x/2 l Chúng ta có các tổng tải tương ứng là: 21 Thông lượng cuối hay còn gọi là thông lượng đạt được A thể hiện tổng tất cả các truy vấn được định tuyến thành công. Trong mạng DHT log n qua cách thức chọn lựa các mục định tuyến ta có thể tính toán số lượng các nút có thể đến sau khi đi qua một số nút nhất định bằng tam giác Pascal. Với l nút trong bảng định tuyến sau h lần đi qua các nút khác sẽ có thể tới: nút đích. Trên mỗi nút mà truy vấn đi qua, mỗi truy vấn sẽ được xử lý với xác suất là p. Do đó ta có: Ở đây ta chỉ xét các truy vấn được chuyển qua nút khác, các truy vấn được trả lời ngay trên host đó coi như không tốn tài nguyên, do đó h≥1. Thông lượng chuyển tiếp được tính bằng cách lấy tổng thông lượng đi ra trừ đi thông lượng mới được tạo Tổng thông lượng có thể được tính bằng tam giác Pascal. Tuy nhiên chúng ta xét tới tất cả các nút chứ không riêng ở nút đích. Do đó ta có: Sử dụng công thức 8 với l=3 ta sẽ có lại đúng công thức 4 đã xét ở phần trước. 22 2.2.5. Ví dụ với một triệu nút Ta lấy ví dụ trường hợp l=20, ứng với n=220 tức khoảng 1 triệu nút. Giả sử khả năng xử lý trên mỗi nút là c=120 truy vấn/giây. Ta xét hai trường hợp: M1 là trường hợp đường truyền lên của nút là bottleneck, M2 là trường hợp tốc độ vi xử lý của nút là bottleneck. Ta chọn α=5% cho trường hợp M1 ứng với thông lượng mà các gói tin ACK của TCP. Với các công thức 1, 5 và 8 ta có thể tính toán được xác suất xử lý p với 2l nút với c và x cho trước. Với p và công thức 6 ta có thể tính được Ofinal tức là thông lượng đạt được của mạng DHT. Hình dưới thể hiện thông lượng đạt được A. Thông lượng đạt được cao nhất đạt được khi x đạt giá trị tối ưu: x=11.4 trong trường hợp M1 và x=10,9 trong trường hợp M2. Khi tổng tải đến vượt quá giá trị x tối ưu, thông lượng đạt được sẽ giảm một cách nhanh chóng. Đó là hiện tượng sụp đổ do tắc nghẽn. Hình 11: Thông lượng đạt được so sánh với tốc độ truy vấn cho hệ thống DHT với một triệu nút trong hai trường hợp tắc nghẽn M1 và M2. Mạng DHT sụp đổ khi tải tới đạt đến giá trị xopt 2.2.6. Phân tích các trạng thái tiệm cận của A. Ta xét A trong trường hợp mạng DHT chạy với khả năng tối đa: p → 1 và trường hợp mạng DHT bị quá tải ở mức cao: p → 0 23 Sử dụng công thức )1/()1( 1 0 ppp h h j j    1)1( 1         lhl h pp h l 12 1         ll h h l để đơn giản các công thức từ 5 đến 8 ta có: Ta sẽ tính toán sự thay đổi của thông lượng đạt được A khi p→1 và khi p→0. Với trường hợp M1 ta có: 24 Ứng với p→1 tức là mạng được sử dụng hết khả năng tuy nhiên vẫn chưa quá tải có: Với O≥c mạng được sử dụng hết hoặc chưa sử dụng hết ứng với p ≤1 và O=c/p. Chúng ta có thể tính toán O khi p→1 Với trường hợp M2 tương tự ta có: Ứng với p→0 tức là đang xảy ra tình trạng tắc nghẽn ở mức độ cao. Sử dụng công thức 1/1 – p = 1+p+p 2 +. . ., với | p | < 1 ta có thể khai triển c/x=pO/x thành: a0p 0 + a1p 1 + a2p 2 + . . . và p thành: b0 + b1x -1 + b2x -2 + . . . Do đó ta có:    ... 2 12 21)1( )1(2 2 2      pappp p p x c l l ll l  25 ... 12 2 2 2 1     xbx c p l l Thay p vào công thức 9 và sử dụng công thức:   ...1... 210 1 210 0                            lpp l p l p l p k l p k l k l Do đó với trường hợp 1 và 2 khi p→0 ta có: 2.2.7. Kết luận Với hai trường hợp M1 khi đường uplink là bottleneck, và M2 khi tốc độ xử lý là bottleneck, mạng DHT có thể rơi vào trạng thái sụp đổ do tắc nghẽn nếu như các nút trong mạng tăng tốc độ truy vấn mà không tính toán đến khả năng chịu tải của mạng. Trong thực tế với mô hình mạng phức tạp, khả năng chịu tải của các nút là hoàn toàn khác nhau, thời gian truy vấn không theo quy luật, tình trạng mạng sụp đổ do tắc nghẽn sẽ xảy ra dễ dàng và nhanh chóng hơn. 26 Chương 3. Các nghiên cứu về điều khiển tắc nghẽn trên DHT Các nghiên cứu liên quan về vấn đề điều khiển tắc nghẽn của mạng DHT tập trung chủ yếu vào hai hướng giải quyết:  Điều khiển tốc độ truy vấn: giới hạn tốc độ gửi ở nút truy vấn hoặc tốc độ xử lý ở nút đích khi nút đích có hiện tượng quá tải. Gồm các phương pháp: Credit System Congestion Control (CSCC), Back-Pressure Congestion Control (BPCC), và phương pháp đánh dấu (Marking)  Thay đổi bảng định tuyến nhằm chuyển truy vấn đang đi qua nút quá tải sang nút không quá tải. Ý tưởng chung của các phương pháp này là việc không sử dụng thuật toán định tuyến tham lam (như trong Chord, nút được chuyển tiếp gói tin đến là nút trong bảng định tuyến có định danh gần với khóa nhất), mà dựa vào tình trạng từng nút để thay đổi đường đi của gói tin qua các nút ít tắc nghẽn hơn. Các phương pháp này đều có những ưu nhược điểm riêng sẽ được phân tích dưới đây. 3.1. Phương pháp CSCC[4] Ta có thể coi mô hình của mạng DHT (cụ thể là Chord) được phân tầng như hình dưới Hình 12: Phương pháp CSCC 27 Layer 1 đảm nhận việc truyền thông tin giữa 2 nút, layer 2 – overlay routing đảm nhận việc chuyển tiếp gói tin lên trên hoặc qua các nút khác tùy thuộc vào điểm đến của gói tin, layer 3 là tầng ứng dụng nằm trên mạng DHT. CSCC hoạt động phía trên của layer 2 – overlay routing và dưới layer 3. Tại nút đích mỗi khi nhận được gói tin đến CSCC sẽ trả lại gói tin ACK trực tiếp cho nút ban đầu gửi truy vấn bằng giao thức UDP. Tại nút nhận, CSCC duy trì trong bộ nhớ đệm của nó một hàng đợi cho các truy vấn đến. Khi hàng đợi đạt tới mức giới hạn của nút, các truy vấn đến sau sẽ bị loại bỏ mà không có thông báo gì cho nút gửi. Trên mỗi nút lưu một giá trị credit thể hiện số lượng truy vấn đã gửi đi mà chưa nhận được gói tin ACK trả về. Sử dụng thuật toán tương tự như thuật toán tính toán kích thước cửa sổ TCP cho giá trị credit, ta so sánh giá trị credit này với một giá trị threshold. Nếu credit nhỏ hơn threshold ta tiếp tục tăng nhanh giá trị credit, nếu credit đến ngưỡng threshold, ta sẽ tăng chậm hơn với mỗi gói ACK nhận được. Nếu như có gói tin bị mất (quá thời gian timeout mà chưa có gói ACK trả về) giá trị threshold sẽ được giảm xuống. Sau khi nhận biết một gói tin bị mất, nút gửi sẽ gửi lại gói tin đó. Có thể thấy phương thức hoạt động của CSCC gần tương tự như CC của TCP. Tuy nhiên nhược điểm của CSCC là sử dụng trên mạng DHT với quá trình kết nối tương đối phức tạp, chuyển tiếp giữa nhiều nút, không giống như TCP có kết nối 2 điểm trong thời gian dài và tương đối ổn định. Điều này gây khó khăn cho việc xác định các giá trị cần thiết như thời gian timeout. Thêm nữa, một gói tin có thể nhận được nhiều lần do đó mỗi nút cần phải tốn tài nguyên lưu giữ danh sách các gói nhận được ứng với mỗi nút gửi. CSCC thực hiện việc drop gói tin do đó thông lượng đạt được sẽ giảm. 3.2. Phương pháp BPCC[4] Tương tự như phương pháp CSCC mỗi nút đều lưu một hàng đợi cho các truy vấn đến. Tuy nhiên ở phương pháp này thay vì loại bỏ gói tin, nút đích gửi trạng thái hàng đợi của nó cho nút gửi. Khi đó nút gửi sẽ tự điều chỉnh lại tốc độ gửi để tránh tắc nghẽn xảy ra. BPCC sử dụng TCP ở layer 1. 28 Hình 13: Phương pháp BPCC Khi hàng đợi tại nút P đầy, thay vì loại bỏ gói tin, nút sẽ tạm ngưng việc đọc gói tin từ socket TCP của các kết nối đến. Khi đó thuật toán điều khiển lưu lượng sẵn có của TCP sẽ tự động làm chậm lại việc các nút gửi truy vấn đến nút P. Nguy cơ hình thành deadlock: Nguyên nhân của việc hình thành deadlock là khi một nút gửi đợi nút nhận xử lý các gói tin trong hàng đợi, trong khi nút nhận cũng đang phải đợi một nút khác. Deadlock xảy ra khi các nút đợi nhau tạo thành vòng kín, dễ thấy trong trường hợp mạng có dạng vòng như Chord. Có thể thấy khác biệt lớn nhất của BPCC là việc phương thức này không drop gói tin, do đó tăng thông lượng đạt được trên toàn hệ thống. Tuy nhiên phương pháp này có thể sinh ra deadlock và việc phát hiện, xử lý deadlock này là rất khó khăn, đặc biệt là trong môi trường mạng ngang hàng với sự tham gia của nhiều nút tự do, không thể kiểm soát. Ngoài ra việc chờ đợi trên các nút gây tăng thời gian đáp ứng của các truy vấn. 3.3. Phương pháp Marking[3] Hai phương pháp CSCC và BPCC ở trên có chung một nhược điểm là chỉ thực hiện việc chống tắc nghẽn tức là khi tắc nghẽn đã xảy ra trên mạng. Phương pháp Marking có gắng giải quyết vấn đề này. Để phân tích phương pháp này ta xét lần lượt từng thành phần tham gia vào việc điều khiển tắc nghẽn trong phương pháp này: Layer 3 BPCC Layer 2 Layer 1 - TCP Layer 3 BPCC Layer 2 Layer 1 - TCP Destination Queue state Source 29 Hàng đợi: Trên mỗi nút duy trì một hàng đợi chứa các truy vấn tới. Ta sử dụng các hàng đợi này để phản hồi tình trạng tắc nghẽn thông qua việc thêm một cờ h vào trong header. Mục đích là giữ cho các nút được chia sẻ tài nguyên đang bị bottleneck một cách công bằng mà không làm quá tải nút đang tắc nghẽn. Cờ h có kích thước 1 bit, mặc định được tắt trong gói tin truy vấn tại nguồn. Cờ h tắt thể hiện tình trạng mạng không tắc nghẽn, h bật thể hiện tình trạng tắc nghẽn. Mỗi nút đặt giá trị x thể hiện tốc độ truy vấn hiện tại của nó vào trong header của gói tin. Ngoài ra mỗi nút lưu số lượng trung bình xavg các gói tin, được tính toán thông qua giá trị x nhận được từ một số gói tin đến trước đó. Cờ h được bật với xác suất q được xác định thông qua việc xét xem gói tin đến có tốc độ nhanh hay chậm hơn giá trị trung bình xavg và giá trị trung bình kích thước của hàng đợi, cụ thể như sau: s: là số lượng gói tin trong hàng đợi δ: giá trị làm mềm, ví dụ bằng 0.9 s : số lượng trung bình các gói tin trong hàng đợi t: giá trị ngưỡng tối đa sẽ gửi phản hồi γ: giá trị đảm bảo độ công bằng s = (1 − δ) · s + δ · s q=min                   1, )(  avgx x stt s (10) Công thức 10 bao gồm 2 phần: phần thứ nhất dùng cho việc điều khiển tắc nghẽn, giá trị số gói tin trung bình s càng gần đến ngưỡng t sẽ làm tăng xác suất q dẫn tới việc khả năng cờ h được bật tăng. Nếu s ≥t, q=1 thì cờ h sẽ được bật với xác suất bằng 1. Giá trị ngưỡng t được đặt nhỏ hơn khả năng tối đa mà hàng đợi có thể lưu trữ, để đảm bảo khả năng phục vụ kể cả trong trường hợp có lượng lớn gói tin trong một thời điểm ngắn. Ngoài ra còn có thêm giá trị δ trong việc tính toán giá trị s để tránh việc bật cờ h trong trường hợp tốc độ truy vấn thay đổi đột biến trong thời gian ngắn. Phần thứ hai được dùng cho mục đích đảm bảo công bằng: khi tốc độ truy vấn x của một nút nguồn nhỏ hơn tốc độ trung bình xavg của truy vấn đến mà nút đích nhận được thì q giảm. Ngược lại 30 nếu x > xavg thì q tăng, thể hiện việc nút nguồn sẽ bị giới hạn tốc độ nếu như chiếm phần lớn tài nguyên của nút đích. Giá trị γ xác định xem mức độ quan trọng của việc chia sẻ công bằng. Nếu γ = 0 sẽ bỏ qua việc đảm bảo công bằng. γ càng lớn thì độ lệch giữa x và xavg sẽ ảnh hưởng càng nhiều đến xác suất p. Một khi cờ h được bật nó sẽ không bị tắt trên suốt quãng đường truyền tới đích cuối cùng. Nút đích sao chép giá trị của h vào gói tin overlay-acknowledgement được gửi trả lại cho nút nguồn kèm với trả lời cho truy vấn. Nút nguồn: Một nút sẽ nhận được gói tin trả lời truy vấn với overlay-ack có cờ h. Nếu h tắt, tức là không có tắc nghẽn, nút tăng tốc độ truy vấn của nó như sau: x c xx : c+ là một hằng số dương nhỏ thể hiện mức độ một nút kiểm tra lượng băng thông còn có thể sử dụng khi nhận được thông báo không tắc nghẽn. Với cờ h được bật nút giảm tốc độ truy vấn của nó như sau:  cxx : với 0 < c- < 1 là hằng số, thể hiện mức độ một nút giảm tốc độ truy vấn khi có tắc nghẽn xuất hiện. Qua hai công thức trên có thể thấy ta tăng tốc độ truy vấn theo cấp số cộng và giảm theo cấp số nhân của một nút tương tự như trong TCP. Giá trị c+ và c- được chọn dựa vào RTT và khả năng phục vụ của mạng. Lựa chọn giá trị RTT: Mỗi nút lưu một giá trị RTT ước lượng cho các truy vấn: với mỗi truy vấn RTT được tính dựa trên thời gian gửi và thời gian nhận được phản hồi. Giá trị RTT được sử dụng cho toàn mạng nghĩa là không phụ thuộc vào đích đến của truy vấn. Do thông thường mỗi truy vấn đến một nút khác nhau trong mạng do đó giá trị RTT có sự thay đổi rất lớn. Nếu như sau thời gian RTT mà nút không nhận được trả lời cho truy vấn, một nút giảm tốc độ gửi truy vấn và gửi lại truy vấn. Do không phải loại bỏ gói tin cũng như cơ chế gọn nhẹ trong việc gửi phản hồi tình trạng tắc nghẽn cho nút nguồn nên phương pháp Marking có kết quả về 31 thông lượng đạt được cũng như thời gian trả lời truy vấn tốt hơn nhiều so với hai phương pháp CSCC và BPCC đã trình bày ở phần trước. 3.4. Phương pháp định tuyến thích nghi[5] Các phương pháp trình bày ở trên đều có chung nhược điểm là nếu trong mạng có tồn tại các nút có khả năng đáp ứng thấp hơn hẳn các nút khác sẽ gây giảm thông lượng đạt được trên toàn mạng. Để giải quyết vấn đề này, phương pháp định tuyến thích nghi được đề xuất. Đây cũng là phương pháp gần nhất với giải pháp được nêu ra trong tài liệu này. Trong phương pháp này, thay vì chọn nút gần với khóa cần tìm nhất, ta chọn ra k nút gần với khóa và theo dõi hiệu năng của các nút đó. Khi gửi đi một truy vấn nút nguồn kiểm tra gói tin trả lời chứa cờ báo hiệu tắc nghẽn h trong header để xác định khả năng sử dụng của mỗi đường định tuyến qua k nút trên. Để đơn giản ta xét trường hợp k=2, nghĩa là một nút có hai đường định tuyến qua hai nút lân cận. Giả sử ta có mạng DHT như sau: Hình 14: Mạng DHT với 8 nút. Bảng dưới thể hiện các đường định tuyến mà P0 có thể sử dụng khi chuyển tiếp gói tin. 32 Ví dụ với dòng thứ 3, với đích là nút P3 lựa chọn đầu tiên của P0 là chuyển qua nút P2 sử dụng đường dẫn l0-2 và lựa chọn thứ hai là qua P1 sử dụng đường dẫn l0-1. Nếu như nút đích lưu khóa cần tìm thì sẽ không có lựa chọn thứ hai (N/A). Nếu hai nút có cùng khoảng cách đến khóa cần tìm ta chọn nút bên trái làm lựa chọn đầu tiên. Định tuyến thích nghi: Mỗi nút ghi nhận giá trị của cờ h trong gói trả về trên cả hai đường định tuyến. Với mỗi cặp đường định tuyến mỗi nút duy trì k (ở đây k=2) giá trị xác suất đã quan sát được (op) của giá trị cờ h trong gói trả về như bảng dưới: Các giá trị xác suất này là thông tin duy nhất mà mỗi nút cần phải duy trì cho việc định tuyến chống tắc nghẽn. Mỗi nút sẽ chỉ phải lưu thêm O(log(n)) thông tin thêm do đó mạng vẫn sẽ giữ được khả năng mở rộng cao. Thay đổi lưu lượng: Để đạt được mục đích tăng thông lượng đạt được trên toàn mạng ta thực hiện việc chuyển lưu lượng chuyển qua các nút. Mỗi nút có thể sử dụng k đường định tuyến để chuyển tiếp gói tin (ở đây k=2). Như ở bảng trên mỗi nút lưu xác suất op1 và op2, giữa vào các xác suất này một nút sẽ chuyển lượng f1 lưu lượng qua đường định tuyến thứ nhất và f2 lưu lượng qua đường thứ hai (f1+f2=1). Một nút cập nhật giá trị f1 và f2 bằng cách sử dụng công thức: δ = (op1 – op2 ) · φ f1 = f1 − δ, f2 = f2 + δ fmin ≤ fi, fj ≤ 1 – fmin trong đó δ là lưu lượng chuyển từ đường định tuyến thứ nhất sang đường định tuyến thứ hai. Giá trị φ là một hằng số xác định tốc độ chuyển lưu lượng từ đường định tuyến này sang đường khác. Nếu δ có giá trị âm lưu lượng sẽ được chuyển ngược lại. Các giá trị f được có cận dưới được xác định bởi giá trị fmin như công thức ở trên nhằm đảm bảo luôn luôn nhận được phản hồi về khả năng của mỗi đường định tuyến. 33 Với trường hợp k>2 đầu tiên chúng ta tính toán giá trị opmean là giá trị trung bình của tất cả các opi. Sau đó chúng ta sẽ tăng giảm fi dựa vào việc so sánh các giá trị opi và opmean. Một nút cập nhật các giá trị op mỗi khi có truy vấn mới. Khi một nút chuyển tiếp các truy vấn từ các nút khác, nó sẽ chia lưu lượng theo các hướng dựa vào các tính toán về khả năng của từng đường định tuyến. Do đó trên mỗi nút truy vấn sẽ được định tuyến theo đường tối ưu, qua đó sẽ tăng thông lượng đạt được trên toàn mạng. Nhược điểm của phương pháp này là khi muốn tăng số lượng các đường định tuyến, ta phải tăng kích thước bảng định tuyến. Sẽ là rất tốn kém tài nguyên nếu như mỗi nút phải duy trì bảng theo dõi trạng thái của nhiều nút khác. Đồng thời việc bỏ phương pháp định tuyến tham lam sẽ làm tăng số lượng gói tin truyền trên mạng. 34 Chương 4. Điều khiển tắc nghẽn sử dụng phương pháp thay đổi bảng định tuyến 4.1. Đề xuất phương pháp Như các phân tích ở chương trước về các cơ chế điều khiển tắc nghẽn đã có, ta thấy còn một số nhược điểm cần khắc phục. Khóa luận này nhằm đưa ra một phương pháp điều khiển tắc nghẽn sử dụng việc thay đổi bảng định tuyến với mục đích chính là: điều khiển tắc nghẽn, giảm thiểu tối đa sự gia tăng số lượng nút phải đi qua với mỗi truy vấn so với phương pháp định tuyến tham lam đã có, đồng thời không làm ảnh hưởng quá nhiều đến mô hình hoạt động của mạng Chord, tránh phát sinh lãng phí tài nguyên cho việc duy trì thêm nhiều thông tin và các gói tin phụ phục vụ cho việc thay đổi định tuyến này. Để thực hiện các yêu cầu trên ta sẽ tìm cách tác động đến bảng định tuyến trên từng nút để khi có nút tắc nghẽn trên bảng định tuyến, nút đó sẽ được thay thế bằng nút lân cận. Để tối thiểu số lượng nút phải đi qua với mỗi truy vấn ta sẽ ưu tiến thay thế nút tắc nghẹn bằng nút lân cận nằm ngoài khoảng giữa nút truy vấn và nút đang bị tắc nghẽn. Để đơn giản khi ta chuyển định tuyến đến nút lân cận nếu như nút đó cũng gặp tình trạng tắc nghẽn thì ta tiếp tục chuyển đến nút lân cận tiếp theo. Ta chỉ giữ trong mỗi mục của bảng định tuyến hai giá trị của nút đích đó là nút đích ban đầu và nút đích được chuyển định tuyến tới tại thời điểm hiện tại. 4.2. Nội dung chi tiết Ta đi vào nội dung chi tiết của phương pháp đã được khái quát ở trên. Để đảm bảo việc điều khiển tắc nghẽn ta xét lần lượt các bước gặp phải khi cần giải quyết bài toán tắc nghẽn trên một hệ thống. 4.2.1. Phát hiện tắc nghẽn. Trên mỗi nút ta tính toán tốc độ xử lý gói tin tối đa mà nút đó có thể xử lý được, ta có thể tính toán giá trị đó thông qua tốc độ xử lý và đường truyền của máy. Việc tính toán này không nằm trong nội dung của khóa luận này. Ta quy định trên mỗi nút sẽ tồn tại hai giá trị giới hạn gọi là hardLimitRate và softLimitRate, lần lượt ứng với tốc độ xử lý tối đa của máy trên một đơn vị thời gian: limitRate và x*limitRate (với x là hằng số 0<x<1). Khi tốc độ gói tin tới nút chạm tới mức softLimitRate ta coi như máy đó bước vào giai đoạn “tắc nghẽn mềm” và sẽ tiến 35 hành các phương thức chống tắc nghẽn với nút đó. Khi tốc độ gói tin tới mức hardLimitRate thì lúc đó máy bị tắc nghẽn hoàn toàn. Việc tính toán giá trị của hằng số x sẽ ảnh hưởng đến độ “nhạy” của việc phát hiện tắc nghẽn, nếu x quá nhỏ các nút sẽ dễ dàng bị coi là tắc nghẽn dù vẫn còn khả năng phục vụ, nếu x quá lớn sẽ khiến cho việc xử lý tắc nghẽn trên nút diễn ra quá muộn dẫn tới trường hợp nút bị tắc nghẽn hoàn toàn kéo theo số lượng gói tin bị loại bỏ sẽ tăng. 4.2.2. Xử lý trong trường hợp có tắc nghẽn Khi phát hiện “tắc nghẽn mềm” trên nút, nếu nút nhận được một truy vấn tới thì hệ thống sẽ tiến hành các động thái sau:  Nút nhận đang bị tắc nghẽn sẽ gửi gói tin đến nút vừa gửi truy vấn đến nó thông báo mình bị tắc nghẽn. Nút nhận lưu lại danh sách các nút nó đã gửi thông báo tắc nghẽn đến.  Nút gửi truy vấn (có thể là nút vừa chuyển tiếp truy vấn) đến nút tắc nghẽn tiến hành thay đổi bảng định tuyến của nó: chuyển nút tắc nghẽn thành các nút lân cận không bị tắc nghẽn.  Truy vấn đến nút đang bị “tắc nghẽn mềm” vẫn tiếp tục được xử lý như bình thường Để tiến hành thay đổi bảng định tuyến đồng thời giữ lại giá trị nút đích ban đầu ta thay đổi bảng định tuyến (bảng finger) bằng cách thêm một cột lưu giữ giá trị định tuyến ban đầu. Khi đó bảng finger có dạng ví dụ như sau: Finger Active Route Origin Route 1 (Pi + 1) Pa Pa 2 (Pi + 2) Pb Pb 3 (Pi + 4) Pc Pc … … … M (Pi + 2 m ) Px Px Giả sử khi nút Pb bị tắc nghẽn ta sẽ thay đổi bảng finger thành: 36 Finger Active Route Origin Route 1 (Pi + 1) Pa Pa 2 (Pi + 2) Pt Pb 3 (Pi + 4) Pc Pc … … … M (Pi + 2 m ) Px Px Với Pt là successor của Pa. Việc chọn lựa nút thay thế là nút “xa hơn” nút nguồn so với nút ban đầu nhằm mục đích giảm thiểu số lượng nút mà gói tin phải chuyển qua. Nếu có một truy vấn tới Pi mà theo bảng finger gốc truy vấn đó sẽ chuyển qua nút Pb, thì trong thời điểm này truy vấn đó sẽ được chuyển tới:  Pt nếu khóa của truy vấn không nằm trong khoảng của Pb và Pt  Pb nếu khóa của truy vấn nằm trong khoảng Pb và Pt Trong trường hợp gói tin đến khi nút đang bị tắc nghẽn hoàn toàn (tốc độ gói tin đến vượt quá hardLimitRate) thì gói tin đó sẽ bị loại bỏ. 4.2.3. Xử lý khi hết tắc nghẽn Các nút trong hệ thống thực hiện việc kiểm tra định kỳ số lượng truy vấn tới để so sánh với các giới hạn đã có. Khi một nút đang từ trạng thái tắc nghẽn chuyển về trạng thái không tắc nghẽn (có lượng truy vấn tới trong một đơn vị thời gian nhỏ hơn softLimitRate), hệ thống sẽ tiến hành các bước sau:  Nút vừa ra khỏi trạng thái tắc nghẽn sẽ gửi thông báo về tình trạng của mình cho một số nút trong danh sách các nút nó đã gửi thông báo tắc nghẽn mà nó đã lưu lại như mô tả ở bước trên.  Nút nhận được thông báo hết tắc nghẽn sẽ thay đổi các mục có liên quan về nút vừa gửi thông báo trong bảng định tuyến về trạng thái như ban đầu. 37 Ví dụ như trường hợp trên khi nhận được thông báo hết tắc nghẽn từ Pb, thì Pi sẽ chuyển Pt lại thành Pi trong bảng định tuyến của nó. Số lượng nút sẽ nhận được thông báo khi nút đích hết tắc nghẽn cũng cần được quan tâm ở đây. Ta chỉ chọn ra một số lượng nhất định trong số các nút trong danh sách nút đã nhận được thông báo tắc nghẽn. Số lượng nút nhận được thông báo hết tắc nghẽn sẽ gián tiếp ảnh hưởng đến mức độ khôi phục lại tải sau tắc nghẽn của một nút, nếu ta đặt giá trị này quá thấp sẽ làm cho nút chậm trở lại trạng thái phục vụ bình thường, nếu như quá cao sẽ dễ làm cho nút bị tắc nghẽn trở lại. 4.3. Ví dụ minh họa Ta xét một mạng Chord đơn giản với không gian khóa 8 bit để minh họa cho giải pháp vừa đưa ra: Hình 15: Truy vấn thông thường trên mạng Chord (m=8). Ta thực hiện việc truy vấn khóa 54 trên nút P8. Hình 13 mô tả quá trình truy vấn thông thường theo đúng như thuật toán ban đầu của Chord. Khi đó bảng finger trên nút P8 có dạng: 38 Hình 16: Bảng định tuyến ban đầu của nút P8 Giả sử ta phát hiện tắc nghẽn tại nút P42, khi đó nút này sẽ thông báo cho nút nguồn thực hiện truy vấn (nút P8) về tình trạng của mình. Với giải pháp đã nêu ta thực hiện việc thay đổi bảng finger trên nút P8 như sau: Hình 17: Bảng định tuyến của nút P8 khi xảy ra tình trạng tắc nghẽn trên nút P42. Trên nút P8 tất cả các mục định tuyến có nút đích là P42 sẽ được thay đổi thành successor của P42 là P48. Khi đó nếu tiếp tục phát sinh truy vấn từ nút P8 mà truy vấn đó theo như bảng finger ban đầu sẽ phải đi qua nút P42 sẽ được thay đổi để đi qua nút P48. Hình 18: Truy vấn được thay đổi đường đi khi áp dụng giải pháp chống tắc nghẽn 39 Như hình trên truy vấn thay vì đi qua nút P42 đang tắc nghẽn sẽ được điều chỉnh đi qua nút P48. Số lượng nút mà truy vấn phải đi qua vẫn là 3 bằng với số lượng cần thiết trong trường hợp ban đầu. Giả sử nút P48 cũng xảy ra tình trạng tắc nghẽn, trên bảng định tuyến nút P8 nút P48 sẽ được thay thế bằng nút P51. Vẫn trên nút P8 giả sử ta cần truy vấn khóa 49. Do 49 thuộc khoảng [42,51) nên truy vấn sẽ phải đi qua nút P42 và được thực hiện như bình thường. Trong quá trình hoạt động giả sử một số nút có bảng định tuyến đi qua nút P42 đều phải thay đổi để qua nút khác thì khi nút P42 hết tắc nghẽn các nút đã thay đổi bảng định tuyến sẽ được lần lượt phục hồi về trạng thái ban đầu. 4.4. Nhận xét về phương pháp Ta có thể rút ra một số nhận xét về phương pháp đã nêu ở trên:  Ưu điểm: Có thể thấy đây là một phương pháp đơn giản nhằm điều khiển tắc nghẽn trong mạng Chord. Việc thay đổi định tuyến sẽ giúp tránh khỏi nút tắc nghẽn qua đó tăng khả năng thực hiện truy vấn thành công. Việc thay đổi chỉ tác động một số nhỏ các nút (nút tắc nghẽn và nút nguồn) do đó số lượng gói tin và thông tin phụ cần để thực hiện quá trình thay đổi và phục hồi là không lớn. Hơn nữa việc chọn lựa nút thay thế nút tắc nghẽn như đã trình bày ở trên không làm tăng số lượng nút mà mỗi một truy vấn phải đi qua.  Nhược điểm: Do cơ chế thay đổi nút định tuyến rất đơn giản nên chỉ có thể giới hạn các nút thay thế có định danh nằm trong vùng định danh lân cận với nút tắc nghẽn, mà không xét đến yếu tố là khả năng đáp ứng của nút vào việc quyết định lựa chọn nút thay thế. Ngoài ra việc chuyển đổi có thể tiếp tục nếu như nút đích mới cũng bị tắc nghẽn nên có thể gây đến tình trạng số lượng gói tin thông báo tăng rất cao trong trường hợp toàn bộ các nút trên mạng đều rơi vào trạng thái tắc nghẽn khi không có một cơ chế giới hạn số lần chuyển đổi bảng định tuyến. Hơn thế nữa có thể dễ nhận thấy việc thay đổi đường định tuyến của gói tin không thể giải quyết triệt để tắc nghẽn nếu như các nút trong mạng tiếp tục đẩy tốc độ truy vấn lên quá cao so với khả năng đáp ứng của mạng. Dù còn tồn tại một số nhược điểm tuy nhiên phương pháp đã nêu có thể giải quyết được vấn đề tắc nghẽn ở mức độ nhẹ đặc biệt là các trường hợp tắc nghẽn cục bộ, qua đó tăng khả năng đáp ứng của toàn mạng. Mặt khác phương pháp 40 này hoàn toàn có thể kết hợp với các phương pháp điều khiển tắc nghẽn sử dụng phương pháp điều chỉnh lưu lượng đã có nhằm loại bỏ khả năng sụp đổ của mạng khi xảy ra tắc nghẽn ở mức độ cao. 41 5. Mô phỏng và kết quả 5.1. Mô phỏng Để kiểm chứng khả năng hoạt động chính xác cũng như những lợi ích đạt được, ta sử dụng một hệ thống mô phỏng mạng Chord và tiến hành cài đặt giải pháp đã đề xuất. 5.1.1. Chương trình mô phỏng Tổng quan cấu trúc mạng mô phỏng: Do mô hình mạng trên thực tế là rất phức tạp và khó có khả năng thể hiện hoàn thiện trên một chương trình mô phỏng do đó ta chỉ xét đến tính chất đặc trưng có ảnh hưởng lớn tới một hệ thống mạng ngang hàng đó là độ trễ giữa các nút trong mạng. Mô hình mạng mô phỏng bao gồm:  Nhiều miền (area) chứa một số nút nhất định, các miền độc lập với nhau  Mỗi miền có một nút biên, nút biên này nối với các nút khác theo mô hình hình sao.  Các miền được nối với nhau thông qua liên kết giữa hai nút biên của miền. Liên kết này được đặt ngẫu nhiên một giá trị độ trễ gọi là độ trễ liên miền.  Liên kết giữa các nút trong miền và nút biên cũng được lấy ngẫu nhiên một giá trị độ trễ gọi là độ trễ nội miền. Độ trễ nội miền sẽ nhỏ hơn nhiều so với độ trễ liên miền. Hình 19: Mô hình mạng mô phỏng 42 Với mô hình trên ta có thể tính toán được độ trễ giữa hai nút trong mạng bằng cách cộng giá trị độ trễ nội miền và liên miền của hai nút đó (nếu hai nút cùng miền thì độ trễ liên miền bằng 0). Có thể thấy với cách xác định độ trễ như vậy thì giá trị độ trễ ở đây là cố định, trong khi với mạng thực tế độ trễ là một giá trị biến đổi liên tục, ngoài ra mạng thực tế còn phức tạp hơn nhiều với cấu trúc đa tầng, tuy nhiên mô hình này cũng đã đủ đáp ứng mục đích mô phỏng độ trễ đa dạng giữa các nút có trong mạng. Cấu trúc chương trình: Chương trình bao gồm các lớp quan trọng sau:  Lớp Areas: gồm các đối tượng chứa thông tin về các miền có trong mạng mô phỏng, chứa các hàm truy xuất thông tin về miền, các hàm tính toán độ trễ liên miền.  Lớp Node: chứa thông tin về các nút có trong mạng. Một nút có các giá trị quan trọng như: tên, định danh, định danh miền chứa nó, độ trễ nội miền. Mỗi nút khi đưa vào mạng sẽ lưu thêm thông tin về các định danh của các nút successor, predecessor và bảng định tuyến. Bảng định tuyến (bảng finger) chứa thông tin về các finger của nút – là các đối tượng thuộc lớp FingerEntry. Lớp Node ngoài các phương thức để thiết lập và truy xuất các thông tin kể trên còn một số phương thức quan trọng sau: o fixFingerTable: thực hiện quá trình ổn định mạng bằng cách kiểm tra và chỉnh sửa lại tất cả các finger của nút. o findSuccessor: đảm nhận việc tìm kiếm nút successor của một khóa cho trước. Phương thức trả lại giá trị là định danh của chính nút đó Hình 20: Mô hình lớp Node 43 nếu nó là successor của khóa, hoặc sẽ chuyển tiếp truy vấn cho một nút gần nhất sau khóa trong bảng định tuyến bằng cách tiếp tục gọi đệ quy phương thức findSuccessor trên nút đó.  Lớp FingerEntry gồm các đối tượng là các mục trong bảng định tuyến của mỗi nút. Mỗi nút chứa fingerTable là tập hợp các đối tượng FingerEntry tạo nên bảng định tuyến của nút đó.  Lớp Network: Là lớp chứa toàn bộ thông tin về mạng mô phỏng. Sau khi khởi tạo các đối tượng miền và nút được thêm vào đối tượng network để xây dựng mô hình mạng. Đối tượng này tiếp tục thực hiện tất cả các quá trình phân bố tài nguyên vào các nút, sinh ra các truy vấn và thực hiện các truy vấn này. Các phương thức quan trọng là: o nodeBirth, nodeDeath o fixFingerTables o getNodeDistance  Lớp InputGenerator: Là lớp đảm nhận việc sinh các dữ liệu cần thiết cho mạng hoạt động gồm thông tin về mạng, nút, vị trí của nút.  Lớp ResourceGen: Là lớp đảm nhận việc sinh tài nguyên và các truy vấn theo phân phối Zipf.  Lớp DoSchedule: Đảm nhận nhiệm vụ lên lịch và thực thi lần các thao tác của chương trình mô phỏng. Quá trình thực thi: Quá trình thực thi chương trình sẽ được phân ra làm nhiều bước và thực hiện tuần tự: đầu tiên là việc sinh ra các dữ liệu về mạng, tiếp đến là dữ liệu về tài nguyên và các truy vấn. Sau khi hoàn tất việc sinh các dữ liệu cần thiết, chương trình sẽ tiếp tục thực hiện các truy vấn, sau quá trình truy vấn các thông tin về mạng và kết quả thu được sẽ được tổng hợp và xuất ra file hoặc màn hình. Quá trình sinh dữ liệu: Ban đầu một đối tượng Network được khởi tạo. Tiếp đó các thông tin về các đối tượng miền và nút được tạo ra từ các hằng số như số lượng miền, số lượng nút… Thời gian, thứ tự thực hiện truy vấn cũng như khả năng chịu tải của nút sẽ được sinh ngẫu nhiên bằng quá trình Poisson. Các thông số này được lưu lại thành file. Sau đó các đối tượng Areas và Node được sinh ra từ các file thông số đó. Sau khi tất cả các nút được sinh bằng cách gọi phương thức nodeBirth, bảng định tuyến của tất cả các nút được tính toán dựa vào phương thức fixFingerTables. Tiếp đến lớp ResourceGen được sử dụng để tạo số lượng các tài nguyên, cũng như danh sách truy vấn tương ứng. 44 Quá trình thực thi: Chương trình khởi tạo đối tượng thuộc lớp DoSchedule ứng với các thông số đã khởi tạo trước đó. Các thao tác thực hiện được đọc từ file schedule, bắt đầu bằng việc gán các tài nguyên vào từng nút, tiếp đến thực hiện các truy vấn từ file danh sách đã tạo ra trước đó. Quá trình thực hiện truy vấn theo đúng thiết kế của Chord thông qua hàm findSuccessor của lớp Node. 5.1.2. Các thay đổi đã áp dụng Để cài đặt phương pháp điều khiển tắc nghẽn đã nêu, ta tiến hành một số thay đổi trên chương trình:  Cấu trúc chương trình: với lớp FingerEntry ta thêm biến lưu trữ thông tin về nút đích ban đầu.  Quá trình sinh dữ liệu: ngoài các dữ liệu ban đầu, ta sinh thêm một số dữ liệu như: giới hạn khả năng đáp ứng của các nút, thời gian thực hiện các truy vấn, thứ tự các nút thực hiện các truy vấn.  Quá trình thực thi: thay đổi chủ yếu được thực hiện trên lớp Node bao gồm các phương thức nhằm thực hiện: o Phát hiện tắc nghẽn: trên mỗi nút duy trì một vector có kích thước bằng giới hạn khả năng đáp ứng của nút, chứa thời gian các truy vấn tới nút. Dựa vào vector này ta tính toán được tại thời điểm có một truy vấn tới nút đang trong tình trạng không tắc nghẽn, tắc nghẽn mềm hay tắc nghẽn hoàn toàn. o Xử lý tắc nghẽn: Ta tạo ra phương thức tìm kiếm Successor cho một khóa mới. Nếu nút đang nhận truy vấn không bị tắc nghẽn việc thực hiện tương tự như phương thức findSuccessor ban đầu. Nếu nút xảy ra tắc nghẽn “mềm” sẽ tiến hành đặt lại fingerTable trên nút gửi truy vấn: chuyển tất cả các mục có đích là nút tắc nghẽn thành nút lân cận. Đồng thời lưu định danh nút gửi truy vấn vào danh sách các nút đã tiến hành thay đổi định tuyến: nodeChangedRoute. Với mỗi truy vấn sau đó nếu khóa cần tìm thuộc khoảng nút đích ban đầu và nút đích đã thay đổi ta thực hiện hàm tìm kiếm successor trên nút đích ban đầu, ngược lại ta thực hiện trên nút đích mới. Nếu nút tắc nghẽn hoàn toàn truy vấn sẽ bị hủy bỏ và ghi lại để tiện thực hiện việc nhận xét sau này. o Xử lý khi nút hết tắc nghẽn: Khi một nút hết tắc nghẽn, sẽ thay đổi lại bảng fingerTable của một số nút thuộc danh sách nodeChangedRoute. Số lượng nút thay đổi lại fingerTable được 45 tính bằng kích thước danh sách nodeChangedRoute nhân với một hằng số quy định trước. 5.2. Kết quả 5.2.1. So sánh với mô hình Chord chuẩn Để xác định hiệu quả của phương pháp đã đưa ra chúng ta tiến hành so sánh với mô hình Chord truyền thống. Với cùng một số bộ dữ liệu ta sẽ chạy lần lượt hai chương trình, trong đó một là chương trình truyền thống, hai là chương trình có áp dụng việc điều khiển tắc nghẽn. Việc đánh giá sẽ dựa trên số lượng gói tin bị loại bỏ và số gói tin trung bình phát sinh thêm với mỗi một truy vấn thành công trong toàn quá trình thực thi. Mạng được xây dựng với một số thông số cơ bản như sau: số lượng node: 1000, độ dài khóa là 16 bit, số lượng query 10000, giá trị lambda để sinh ngẫu nhiên khả năng chịu tải của các nút trong mạng là 10. Ta lần lượt thay đổi tốc độ truy vấn của các nút trên mạng và quan sát sự thay đổi về số lượng truy vấn bị loại và số gói tin phát sinh. Kết quả thu được được trình bày ở biểu đồ dưới. Cột x thể hiện tốc độ truy vấn tính bằng số truy vấn gửi đi mỗi ms, cột y thể hiện phần trăm số query bị loại bỏ do được gửi đến nút bị tắc nghẽn hoàn toàn. Đường đứt thể hiện trường hợp Chord truyền thống, đường liền thể hiện trường hợp sử dụng phương pháp điều khiển tắc nghẽn. Hình 21: Biểu đồ số lượng gói tin bị loại bỏ khi áp dụng và không áp dụng việc điều khiển tắc nghẽn Thông qua biểu đồ trên ta có thể thấy phương pháp điều khiển tắc nghẽn đưa ra có khả năng làm giảm số lượng truy vấn bị loại bỏ qua đó tăng khả năng phục vụ 46 của toàn hệ thống. Tuy nhiên cũng có thể thấy rõ ràng rằng phương pháp đưa ra không có khả năng ngăn chặn việc mạng sụp đổ khi chịu tải quá cao do không có phương pháp điều khiển tắc nghẽn đi kèm. Tiếp đến ta xét tới số lượng trung bình gói tin mà một truy vấn thành công sử dụng nhằm đánh giá mức độ ảnh hưởng của việc sử dụng phương pháp điều khiển tắc nghẽn đã nêu. Hình 22: Biểu đồ thể hiện số gói tin trung bình phải sử dụng với mỗi truy vấn thành công Ở biểu đồ trên cột x ứng với tốc độ truy vấn, cột y thể hiện số gói tin trung bình trên mỗi truy vấn thành công. Ta tính toán giá trị một cách tương đối bằng cách chia tổng số gói tin sử dụng cho số truy vấn thành công. Qua biểu đồ có thể thấy khi tốc độ truy vấn tăng, tương ứng với mức độ tắc nghẽn tăng, số lượng các gói tin điều khiển và gói tin phát sinh thêm khi thay đổi đường định tuyến sẽ tăng. Tuy nhiên mức độ tăng có thể thấy là không quá lớn, chủ yếu là do các gói tin điều khiển. Qua đó có thể thấy mức độ ảnh hưởng khi sử dụng phương pháp là không quá lớn so với phương pháp định tuyến tham lam của Chord truyền thống. 47 5.2.2. Đánh giá hiệu năng khi tiến hành tùy chỉnh các tham số và cải tiến phương pháp Đầu tiên ta xét tới tham số xác định khi nào xảy ra hiện tượng tắc nghẽn “mềm” tính bằng số phần trăm mức chịu tải của từng nút. Hình 23: Ảnh hưởng của việc thay đổi giá trị xác định mức độ tắc nghẽn mềm của nút Ở biểu đồ trục x thể hiện giá trị xác định tắc nghẽn đã để cập bên trên, cột kẻ chéo thể hiện số truy vấn bị loại bỏ do tắc nghẽn, cột đặc thể hiện số gói tin trung bình trên một truy vấn thành công. Hai cột cuối tương ứng với việc không sử dụng việc điều khiển tắc nghẽn. Có thể thấy nếu ta thay đổi giá trị xác định tắc nghẽn lên quá cao sẽ khiến cho nút phản ứng chậm khi bị tắc nghẽn dẫn tới số lượng gói tin bị loại bỏ cao, nếu đặt giá trị này quá thấp làm nút phản ứng quá sớm với việc tắc nghẽn, làm tăng đột biến số lượng gói tin, đặc biệt là gói tin điều khiển, khiến cho tải trên các nút ngày càng cao và sẽ làm cho tình trạng tắc nghẽn trầm trọng hơn. Giá trị phù hợp nhất nằm trong khoảng từ 50% đến 70%. Khi đó ta giảm thiểu được số lượng truy vấn bị loại bỏ mà không làm số lượng gói tin phát sinh thêm tăng cao. Một tham số quan trọng khác đã được nhắc đến ở phần trước là số lượng các nút sẽ được phục hồi lại bảng định tuyến khi nút đích hết tắc nghẽn. Ta tiến hành thay đổi tham số này và quan sát kết quả thu được 48 Hình 24: Ảnh hưởng của số lượng nút được khôi phục bảng định tuyến lên hiệu năng của hệ thống Qua biểu đồ trên có thể thấy số lượng gói tin bị loại bỏ do tắc nghẽn giảm khi ta tiến hành phục hồi chậm trên các nút hết tắc nghẽn. Tuy nhiên cũng phải xét đến ảnh hưởng khi một nút phục hồi quá chậm mà ở đây chương trình mô phỏng chưa thể hiện được. Ta tiếp tục xét đến một hình thức cải tiến của phương pháp đã đưa ra. Trên một nút ta duy trì thêm một giá trị xác định tắc nghẽn thứ hai nhỏ hơn giá trị xác định mức độ tắc nghẽn “mềm” đã có. Khi một nút có lượng truy vấn đến vượt qua giá trị tắc nghẽn thứ hai, nút đó sẽ thực hiện việc gửi yêu cầu thay đổi bảng định tuyến đến các nút ở “xa”, khi nút đạt đến mức tắc nghẽn “mềm” nó sẽ gửi yêu cầu thay đổi bảng định tuyến đến tất cả các nút. Việc xác định một nút xa hay gần được dựa trên ID của các nút đó. Dưới đây là một số kết quả thu được khi áp dụng phương pháp này Hình 25: Hiệu năng của hệ thống thay đổi khi cải tiến phương pháp điều khiển tắc nghẽn. 49 Hai cột đầu tiên mô tả phương pháp ban đầu với mức tắc nghẽn mềm được đặt là 75% khả năng của nút. Hai cột tiếp theo mô tả phương pháp cải tiến với giá trị tắc nghẽn mềm được đặt là 75%, giá trị tắc nghẽn thứ hai được đặt là 50%. Hai cột cuối mô tả phương pháp ban đầu với mức tắc nghẽn mềm được đặt là 50%. Qua biểu đồ có thể thấy khi sử dụng phương pháp cải tiến sẽ cho kết quả tốt hơn thể hiện bằng việc có số lượng truy vấn bị loại bỏ nhỏ nhất, đồng thời không sử dụng thêm quá nhiều các gói tin điều khiển như trường hợp sử dụng phương pháp ban đầu với mức tắc nghẽn mềm là 50%. 50 6. Kết luận và hướng phát triển Luận văn đã đề xuất một phương thức điều khiển tắc nghẽn dựa vào việc điều chỉnh định tuyến trong mạng ngang hàng có cấu trúc. Tuy còn dừng ở mức đơn giản tuy nhiên thông qua thực nghiệm trên chương trình mô phỏng đã chứng tỏ khả năng giải quyết tắc nghẽn cục bộ, qua đó tăng thông lượng đạt được trên mạng. Phương pháp đưa ra vẫn còn một số vấn đề cần phát triển thêm như việc tính toán các thông số phù hợp để đem lại hiệu quả cao nhất. Ngoài ra có thể kết hợp phương pháp đã nêu với một phương pháp điều khiển tắc nghẽn dựa trên điều khiển lưu lượng nhằm giải quyết triệt để vấn đề tắc nghẽn khi mạng chịu tải cao, tránh bị sụp đổ do tắc nghẽn mà vẫn đảm bảo được khả năng phục vụ của toàn mạng. 51 Reference 1. Stephanos Androutsellis-Theotokis and Diomidis Spinellis. “A survey of peer-to-peer content distribution technologies”. ACM Computing Surveys, 36(4):335–371, December 2004. 2. R. Huebsch, B. N. Chun, J. M. Hellerstein, B. T. Loo, P. Maniatis, T. Roscoe, S. Shenker, I. Stoica, and A. R. Yumerefendi. “The architecture of pier: an internet-scale query processor”. In CIDR, pages 28–43, 2005. 3. F. Klemm, Jean-Yves Le Boudec, Dejan Kosti´c, and Karl Aberer, “Handling Very Large Numbers Of Messages In Distributed Hash Tables”, Proceeding COMSNETS'09 Proceedings of the First international conference on COMmunication Systems And NETworks, 2009. 4. F. Klemm, J.-Y. Le Boudec, and K. Aberer. “Congestion control for distributed hash tables”, In The 5th IEEE International Symposium on Network Computing and Applications (IEEE NCA06), 2006. 5. F. Klemm, J.-Y. Le Boudec, D. Kostic, and K. Aberer. “Improving the throughput of distributed hash tables using congestion-aware routing”. In International Workshop on Peer-to-Peer Systems (IPTPS), 2007. Ecole Polytechnique F´ed´erale de Lausanne (EPFL), Lausanne, Switzerland 6. Rüdiger Schollmeier, “A Definition of Peer-to-Peer Networking for the Classification of Peer-to-Peer Architectures and Applications”, Proceedings of the First International Conference on Peer-to-Peer Computing, IEEE (2002). 7. Ion Stoica, Robert Morris, David Karger, M. Frans Kaashoek, Hari Balakrishnan. Chord: “A scalable peer-to-peer lookup service for internet applications”. In Proceedings of the 2001 Conference on Applications, Technologies, Architectures, and Protocols For Computer Communications (San Diego, California, United States). SIGCOMM „01. ACM, New York, NY, 149-160. 2001. 8. C. Tang and S. Dwarkadas. “Hybrid global-local indexing for efficient peer-to-peer information retrieval”. In NSDI, pages 211–224, 2004. 9.

Các file đính kèm theo tài liệu này:

LUẬN VĂN- ĐIỀU KHIỂN TẮC NGHẼN TRÊN MẠNG NGANG HÀNG CÓ CẤU TRÚC.pdf