Luận văn Đảm bảo công bằng trong các ứng dụng cộng tác ngang hàng

Theo định nghĩa băng thông (bandwidth) trên mạng thì băng thông là đại lượng đặc trưng cho tốc độ truyền dữ liệu từ điểm này tới điểm khác trong một khoảng thời gian (thường tính bằng đơn vị của bit/giây). Chẳng hạn một modem làm việc ở tốc độ 56 kbs có hai băng thông làm việc ở 28 kbs.

pdf70 trang | Chia sẻ: lylyngoc | Lượt xem: 2427 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Luận văn Đảm bảo công bằng trong các ứng dụng cộng tác ngang hàng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ấn đề tài chính, danh tiếng, lợi ích,… của các đối tượng này. 3.2. Bài toán 3.2.1. Đặt vấn đề Khi một ứng dụng B (có thể là các peer) có nhu cầu truy cập (lấy hoặc chia sẻ tài nguyên hệ thống) tại một nút mạng A nào đó thì sẽ được xem xét để đảm bảo tính tin cậy, hợp pháp đối với nút mạng A. Ngoài ra khi nhiều ứng dụng cùng có nhu cầu lấy tài nguyên tại một nút thì cần phải phân quyền ưu tiên, và nếu ứng dụng nào đã chia sẻ nhiều tài nguyên hơn trong hệ thống cộng tác thì sẽ được quyền ưu tiên cao hơn trong truy cập giành tài nguyên của hệ thống. Để thỏa được điều này, giải pháp đề xuất là nút ứng dụng cấp phát tài nguyên (nút A) sẽ kiểm tra các ứng dụng (các peer-nút B) cần lấy hoặc chia sẻ tài nguyên. Nếu B muốn lấy tài nguyên thì A sẽ kiểm tra B thông qua tổng giá trị các cookie (số điểm như trong cách tính của Website thương mại) có được của mỗi ứng dụng (mỗi peer). Số các cookie này ở mỗi ứng dụng có được khi ứng dụng đó chia sẻ tài nguyên. Trường hợp B muốn chia sẻ tài nguyên thì A và B sẽ thực hiện giao dịch về chia sẻ tài nguyên. Rõ ràng nếu một ứng dụng càng -40- chia sẻ nhiều tài nguyên thì số cookie (và tương ứng tổng giá trị các cookie) mà ứng dụng này có được sẽ càng lớn, và như vậy quyền truy cập, ưu tiên của ứng dụng này sẽ càng cao. Ví dụ về việc một ứng dụng (hoặc người sử dụng) chia sẻ tài nguyên để được tính điểm vào hệ thống có thể được tiến hành như ở một số các Website như sau: nếu muốn tải một tài liệu của Website thì số điểm của người đó phải ở một mức tối thiểu nào đó. Trong trường hợp không đủ điểm để download tài liệu, thì người sử dụng phải thêm số điểm vào tài khoản của mình trên Website bằng cách upload tài liệu của mình lên Website hoặc nạp tiền vào tài khoản của mình trên Website đó. Càng upload nhiều tài liệu (hoặc nạp nhiều tiền vào tài khoản Website) thì sẽ càng có nhiều điểm trong tài khoản của mình trên Website đó. Thường thì khi upload một tài liệu, tài khoản của người upload sẽ được cộng thêm một số điểm, hoặc gửi một tin nhắn theo cú pháp của Website qui định thì được cộng thêm một số điểm (như đã mô tả trong phần 3.2 trên). Ví dụ trên được áp dụng trong mô hình mạng Client/Server. Trong mạng P2P cũng có thể áp dụng vì mỗi máy vừa đóng vai trò Client, vừa đóng vai trò Server. 3.2.2. Bài toán Sau đây là bài toán và giải thuật tương ứng đảm bảo công bằng cho các ứng dụng cộng tác ngang hàng: a) Input: Tập các node (peer) chia sẻ tài nguyên b) Output: - Xác định các node (các peer) cần cộng tác (lấy/chia sẻ) tài nguyên với các node khác. - Kiểm tra độ tin cậy của các peer, tính giá trị tin cậy mỗi peer. c) Giải thuật kiểm tra và tính giá trị tin cậy các peer: i) Kiểm tra trực tiếp tài khoản của peer cần cộng tác (kí hiệu là B) trong cơ sở dữ liệu của máy chia sẻ tài nguyên (kí hiệu là A): i1- Nếu đúng (bao gồm user name và password) thì kiểm tra giá trị tài khoản (là tổng điểm) của B. -41- - Nếu muốn download thì kiểm tra ngưỡng download (so sánh giá trị tài khoản với mức giá trị tối thiểu được phép download). Nếu thỏa ngưỡng download thì xếp hạng thứ tự từ cao xuống thấp về giá trị tài khoản với những peer khác cùng muốn download, thực hiện thủ tục giao dịch dựa trên cookie (phần 3.3.2) và kết thúc. Nếu không thỏa thì thông báo không đủ điều kiện, ra đề nghị (nếu cần) và kết thúc. - Nếu muốn chia sẻ tài nguyên thì thực hiện thủ tục giao dịch dựa trên cookie (phần 3.3.2) và kết thúc. i2- Nếu sai (chưa tồn tại tài khoản trực tiếp) thì sang bước ii. ii) Kiểm tra B qua hàng xóm - Nếu tìm thấy thì thực hiện bước i1. - Nếu không tìm thấy thì thông báo không đủ điều kiện, ra đề nghị (nếu cần) và kết thúc. 3.3.3. Đánh giá thuật toán Chứng minh thuật toán trên hội đủ các tính chất của thuật toán - Đầu vào: Tập các node (peer) chia sẻ tài nguyên - Đầu ra: - Xác định các node (các peer) cần cộng tác (lấy/chia sẻ tài nguyên) với các node khác. Kiểm tra độ tin cậy của các peer, tính giá trị tin cậy mỗi peer. - Tính xác định và khả thi: thuật toán có các bước kiểm tra tài khoản và giá trị tài khoản có sử dụng vòng lặp hữu hạn (vì số nút hữu hạn) và các phép so sánh  các bước đều được xác định chính xác và có thể thi hành. - Tính hữu hạn: thuật toán luôn luôn kết thúc sau khi tất cả các nút được kiểm tra - Tính hiệu quả: thuật toán luôn kết thúc trong 1 khoảng thời gian hữu hạn. - Tính phổ dụng: có thể áp dụng thuật toán này tìm nút bất kỳ trong dãy các nút. 3.3.4. Độ phức tạp của thuật toán -42- Về thời gian: Trong thuật toán này, ta thấy phép toán tích cực là phép tìm kiếm. Tùy thuộc vào cơ sở dữ liệu lưu tại mỗi nút và phương pháp sắp xếp, tìm kiếm mà thời gian thực hiện của chương trình dài hay ngắn. Trường hợp tốt nhất là tìm kiếm trực tiếp tại cơ sở dữ liệu của nút chia sẻ dữ liệu (nút A). Trường hợp xấu nhất là phải tìm trong lân cận hàng xóm, đồng thời phải sử dụng phép toán so sánh khóa và thông qua máy tin cậy AH(C) trong giao dịch tin cậy dựa trên cookie (phần 3.3.2). Nếu cơ sở dữ liệu có n bản ghi (tại nút A và hàng xóm), đồng thời sử dụng giao dịch tin cậy dựa trên cookie ,thì độ phức tạp của thuật toán cỡ n*n*n hay n3. 3.3.5. Các ví dụ mô phỏng thuật toán Ví dụ 1: Giao dịch qua thẻ ATM Một khách hàng (A) sử dụng thẻ ATM của ngân hàng X rút tiền qua case ATM của ngân hàng Y. Tại case giao dịch Y: - A cho thẻ vào ATM - Y kiểm tra tài khoản A (tìm kiếm) qua ngân hàng của Y, sau đó qua hàng xóm X. - Tìm thấy, Y đề nghị A nhập password (thỏa thuận giao dịch). - A nhập mật khẩu. - Y kiểm tra A qua hàng xóm X. Nếu sai thì ra thông báo và đề nghị làm lại (thỏa thuận giao dịch), nếu vẫn sai thì hủy giao dịch, nếu đúng sang bước kế tiếp. - Y yêu cầu A nhập số tiền cần rút - A nhập số tiền - Y kiểm tra số tiền trong tài khoản của A qua người nắm giữ tài khoản của A (là X). Nếu số tiền A nhập để rút vượt quá số tiền trong tài khoản của A có (sau khi trừ phí dịch vụ và số dư tài khoản của A), thì Y ra thông báo đề nghị A nhập lại, trường hợp ngược lại chuyển sang bước tiếp theo. - Y trả tiền cho A (Y cung cấp dịch vụ) và trừ vào tài khoản của A. Y giữ phần trừ này để giao dịch với X. -43- - Quá trình A nhập tiền và Y phục vụ diễn ra cho đến khi A không còn tiền để rút hoặc thỏa thuận với Y ngừng cung cấp dịch vụ thì chấm dứt. Ví dụ 2: Trường hợp gọi điện thoại khác mạng cũng diễn ra tương tự. Trong phần tiếp theo sẽ trình bày giao dịch dựa trên cookie cho các ứng dụng trong giao dịch cộng tác với nhau và kiểm tra tính tin cậy của các cookie của một peer đối với peer chia sẻ tài nguyên. 3.3. Giao dịch dựa trên cookie 3.3.1. Cấu trúc của một cookie [6] 5 trường thông tin đầu tiên: - Issuing date and time (tính theo mili giây) cùng với Serial Number và Owner ID: cung cấp định danh duy nhất của cookie. Đây là yêu cầu nhằm phát hiện cookie trùng lặp. - Account ID: dùng để xác định một cookie minh bạch cho một ứng dụng xác định. Đây là trường lựa chọn. - Signature SK: là chữ kí thông tin được chứa trong 4 trường trên, được kí với khóa riêng của hệ thống, nhằm ngăn sự giả mạo. 3 trường tiếp theo (Transaction Data): Ngày giao dịch, đối tượng tham gia giao dịch và thông tin chất lượng dịch vụ giao dịch. 2 trường cuối: Định danh nhà cung cấp dịch vụ và chữ kí chủ sở hữu nhằm tránh cookie bị đánh cắp. 3.3.2. Giao dịch [6] Trong các giao dịch, hệ thống kiểm soát dựa vào cookie sẽ kiểm soát việc sử dụng tài nguyên, dịch vụ hoặc kết hợp cả hai. Sử dụng dịch vụ được đánh giá cao hơn sử dụng tài nguyên. Một cookie có thể chứa thông tin về các tài nguyên được sử dụng và thông tin giá trị của dịch vụ chính nó. -44- Thông tin được thêm vào cookie trước khi nó được gửi tới nhà cung cấp dịch vụ. Bằng cách này, thông tin chứa trong cookie có thể được sử dụng làm cơ sở cho các cơ cấu thanh toán mở rộng. a) Giao dịch chuẩn (1) Người tiêu thụ dịch vụ C yêu cầu dịch vụ (2) Người cung cấp dịch vụ P thông báo cho C về các điều khoản và điều kiện của dịch vụ, bao gồm số cookie của dịch vụ mà nó chờ nhận lại. Nếu C chấp thuận các điều trên thì phase quá trình cung cấp dịch vụ bắt đầu được tiến hành. + Cookie có thể được vận chuyển trước, sau hoặc trong quá trình cung cấp dịch vụ. + Trước khi 1 cookie được vận chuyển, C điền thông tin kiểm soát yêu cầu. C không khuyến khích làm giả thông tin này vì nó chỉ ảnh hưởng tới cookie trao đổi của P (3) C kí vào cookie với khóa riêng thuộc sở hữu của nó và gửi tới P. (4) P sử dụng khóa chung của C kiểm tra chữ kí của cookie nhận được. Chữ kí có thể là định danh chủ sở hữu hoặc yêu cầu dịch vụ. Vì vậy P có thể sửa đổi được thông tin này. + P có thể ngừng cung cấp dịch vụ nếu phát hiện dữ liệu kiểm soát sai. + Các thành phần cùng tham gia giao dịch có thể cố gắng thu các cookie bằng cách không thanh toán các cookie sau khi nhận một dịch vụ hoặc bằng cách không phân phát dịch vụ sau khi nhận các cookie. => Để tránh các giao dịch đó có thể dùng cách phân chia thành phần -45- (5) C gửi một cookie được kí tới P sau khi P đã phân phát một thành phần của dịch vụ. Ví dụ: C gửi mỗi cookie sau mỗi Mbytes dữ liệu nhận được từ 5 Mbytes vận chuyển file. b) Giao dịch tin cậy Trong khi thực hiện các giao dịch thì giao dịch sau cùng thường có động cơ gian lận đối với các giao dịch khác. Thường thì giao dịch sau cùng vẫn nhận được đầy đủ các lợi ích, nhưng không chịu phân phát các thành phần của nó. Thủ tục sau đây sẽ hạn chế động cơ gian lận đó: (1) C gửi yêu cầu dịch vụ cho P (2) P nhận yêu cầu và gửi lại C các điều kiện và điều khoản của giao dịch, bao gồm số lượng các cookie được yêu cầu. (3) C trả lời với các định danh của cookie được dùng và gửi các cookie tới giao dịch. (4) P liên hệ với máy tin cậy AH(C), là máy chịu trách nhiệm nắm giữ tài khoản của C, để kiểm tra tính hiệu lực của các cookie mà C gửi (5) Máy AH(C) đóng dấu vào danh sách cookie với nhãn “planned to spend”. Những cookie này không có hiệu lực trong các giao dịch khác (6) Nếu tất cả các cookie có hiệu lực, P thông báo C rằng phase giao dịch có thể bắt đầu. -46- (7) C bắt đầu giao dịch bằng việc gửi các cookie chưa đánh dấu tới P. Lúc này C không còn cookie và không kí được nữa, nhưng P cũng không thể thay đổi cookie để sở hữu cho mình vì P không muốn cung cấp thêm dịch vụ. (8) P cung cấp các dịch vụ chấp nhận được. (9) Nếu C quên không gửi các cookie đã kí thì P có thể đề nghị các cookie chưa kí tới AH(C). Thủ tục chứng tỏ khi giao dịch bắt đầu thì các cookie cũng rời khỏi danh sách và C bị mất cookie. Phần thêm trong tiêu thụ kép có thể không bị phát hiện, nhưng bị vô hiệu hóa. Hệ thống danh tiếng đã nói ở trên có thể cung cấp nhiều hơn nữa khả năng chống lại các hành vi hiểm độc. c) Chấm dứt giao dịch Khi hai máy thỏa thuận muốn chấm dứt giao dịch, C không mất các cookie của mình, P thông báo tới AH(C) để xóa nhãn đánh dấu “planned to spend” được đánh dấu trong danh sách cookie. 3.4. Kiểm tra tính tin cậy của các cookie Để có thể đảm bảo được tính tin cậy của cookie trong mỗi giao dịch thì cần đảm bảo các điều kiện sau đây: a) Những người sử dụng hệ thống dựa vào cookie đều có định danh rõ ràng và không đổi. Điều này có thể thực hiện được bằng cách: + Qua sự xác minh cặp khóa riêng/khóa công cộng. Hiện nay có thể sử dụng phần mềm trong việc tạo ra cặp khóa theo chuẩn RSA, một trong những phần mềm nổi tiếng đó là PGP. Ở Việt Nam cho đến thời điểm này Bộ Công thương là chủ quản qui định về vấn đề đăng kí, sử dụng, giải quyết các vấn đề về sử dụng chữ kí số theo chuẩn RSA. + Qua chứng thực được phát ra từ một ủy quyền b) Có một máy danh tiếng trong hệ thống P2P: + Phát hiện được các hành vi gian lận mà các máy kĩ thuật không thể phát hiện được. + Gán một giá trị danh tiếng cho mỗi máy để đại diện tính tin cậy của máy đó như sau: Mỗi máy phát ra các nhãn cá nhân dùng để giao dịch với các -47- máy khác. Nếu máy A yêu cầu một dịch vụ từ máy B, máy A sẽ trả lại cho máy B một số các nhãn của máy B. Trong kiểu giao dịch này không có sự giới hạn việc một máy được phép phát ra bao nhiêu nhãn. Tuy nhiên nếu phát ra quá nhiều nhãn thì trong sự so sánh các dịch vụ được trả giá của nó, các nhãn sẽ không có giá trị, đồng thời các máy sẽ khó khăn trong việc kiếm được các nhãn khác, theo lí các nút sẽ không mong muốn tậu các nhãn của nó (càng nhiều nhãn thì càng phải cung cấp nhiều dịch vụ). + Theo cách này, giao thức các nhãn kết hợp 1 đồng tiền ảo và 1 máy danh tiếng. Có 3 giao thức cơ bản của hệ thống kiểm soát dựa trên cookie: Thu nạp cookie, kiểm tra tiêu thụ kép và thanh toán. 3.4.1. Thu nạp cookie Xử lí thu nạp cookie là thay đổi các cookie ngoài mà một máy tập hợp được thành những cookie mới được phát hành bởi máy đó. Việc này tựa như các ngân hàng ủy quyền thanh toán cho khách hàng của mình thông qua các giao dịch không cùng ngân hàng, khi một khách hàng chuyển/rút tiền tài khoản của mình (tài khoản thuộc ngân hàng A) qua tài khoản khác (thuộc ngân hàng B), chẳng hạn tại các cây ATM. Có 8 bước của thủ tục thu nạp cookie: -48- (1): Máy thay đổi EP xác định một máy tin cậy TP. Các máy tin cậy có đủ tư cách để thay đổi các cookie và xử lí thành phần của khóa riêng của hệ thống. (2): Máy EP gửi tập N các cookie ngoài (Fn1, Fn2, …, FnN) được nó tập hợp tới máy TP. Máy TP kiểm tra các cookie ngoài theo sự hợp lệ của nó. Chỉ những cookie được kí bởi người chủ và tiêu thụ chỉ một lần là có hiệu lực thay đổi. (3): Máy TP sử dụng hàm thu nạp M=A (Fn1, Fn2, …, FnN) tính toán M cookie mới máy EP phải nhận lại đối với các cookie ngoài. Đó là M cookie chưa được kí (Un1, Un2, …, UnM). Hàm thu nạp M là tổng quát và có thể thi hành đối với form bất kì. (4): Máy TP xác định các máy tin cậy ở xa. Lúc này máy EP không được phép chọn các máy đại diện tin cậy nữa, nhằm giảm sự gian lận cộng tác tiềm tàng. Số các máy tin cậy được yêu cầu để kí một cookie được xác định bằng việc sử dụng sơ đồ chia sẻ bí mật. Độ tin cậy của hệ thống tăng tỉ lệ với kích cỡ số các máy tin cậy. (5): Máy TP gửi các cookie mới tới các máy tin cậy này. (6): Mỗi máy tin cậy mới này kí các cookie bằng khóa riêng của hệ thống của nó. (7): Các cookie (Pn1, Pn2, …, PnM) được vận chuyển ngược trở lại máy EP. (8): Kết thúc, máy EP tổ chức các cookie riêng thành các cookie mới (Tn1, Tn2, …, TnM) Tính chất quan trọng của hàm thu nạp làm tăng thêm độ tự do trong hệ thống. Với một hàm thu nạp thích hợp, các hệ thống kinh tế đặc trưng có thể được vận hành. 3.4.2. Kiểm tra tiêu thụ kép - Điều kiện kiểm tra: Cookie phải có định danh rõ ràng - Kiểm tra như sau: -49- + Mỗi máy có một tập các máy nắm giữ tài khoản được tổ chức theo bảng băm phân tán (DHT), ví dụ như bảng băm Pastry. + Các máy nắm giữ tài khoản nắm giữ một danh sách các cookie hiện tại được phát hành tới người sở hữu tài khoản. Danh sách được điền thêm thông tin yêu cầu trong khi thu nạp cookie. + Sau khi một cookie mới được tạo (bước 3-thu nạp cookie), máy TP gửi danh sách các cookie mới này tới các máy nắm giữ tài khoản (EP) (bước 3-kiểm tra cookie). + Trong khi cookie được kiểm tra tính hiệu lực (theo thủ tục thu nạp cookie), máy TP sẽ yêu cầu các máy nắm giữ tài khoản chịu trách nhiệm đối với cookie, nếu cookie có hiệu lực (bước 2-kiểm tra cookie). + Các máy nắm giữ tài khoản sẽ di rời cookie từ danh sách. Nếu cookie không ở trong danh sách, nó là một cookie không có hiệu lực. Máy TP sẽ hủy bỏ cookie và cơ cấu danh tiếng sẽ được thông báo về tình trạng này. - Tránh thông báo lừa lọc + Thông báo gửi đến máy nắm giữ tài khoản phải được kí với khóa riêng của người gửi. - Giữ danh sách nhất quán giữa các máy nắm giữ tài khoản -50- + Tất cả những máy nắm giữ tài khoản đối với một tài khoản xác định thực hiện trao đổi danh sách bất cứ khi nào tập các máy nắm giữ tài khoản thay đổi. + Thay đổi tập nắm giữ này chỉ khi các máy của tập này kết nối hoặc rời khỏi hệ thống. Kiểm tra nhất quán chỉ cần thiết nếu người gửi không nhận được tất cả các thông báo xác nhận. 3.4.3. Đánh giá về an toàn và tin cậy  Mục đích - Làm cho việc sử dụng cơ cấu kiểm soát để cung cấp thông tin được chính xác. - Hệ thống dựa trên cookie được thiết kế để cung cấp độ tin cậy ở mức cao đối với các hệ thống phân tán.  Sự ăn cướp - Các cookie được thiết kế để thích nghi với sự ăn cướp. + Các cookie chứa định danh của chủ sở hữu và không thể thay đổi được khi bị phát hiện bên ngoài nhờ chữ kí hệ thống. + Các cookie tiêu thụ chứa người nhận cookie, được bảo mật nhờ chữ kí của người sở hữu.  Sự giả mạo - Cookie phải chắc chắn chỉ được người chủ hoặc ủy quyền phát hành tạo ra và phải được kí bởi khóa riêng của nó. - Chữ kí hệ thống trong mỗi một cookie là cơ sở đảm bảo dữ liệu của cookie không bị thay đổi và các máy khác không thể tạo được các cookie như vậy. + Chữ kí hệ thống ngăn cản giả mạo và quyết định độ tin cậy của hệ thống. + Cũng cần tránh sự cố ý lừa gạt.  Tiêu thụ kép - Việc xác định tiêu thụ kép dựa vào việc nắm giữ dữ liệu ở những máy nắm giữ tài khoản. -51- - Người sử dụng có thể làm sai lệch danh sách cookie của họ ở máy nắm giữ tài khoản hoặc di chuyển các cookie từ danh sách cookie của những máy khác. Điều này tránh được vì: - Ngăn không cho phép các máy gửi bất kì truy vấn hoặc đòi hỏi nào tới danh sách tài khoản. - Các vi phạm luật được báo cáo tới máy danh tiếng của hệ thống. - Bằng thủ tục thu nạp cookie. - Trường date and time được tạo theo mili giây và là số tuần tự ngẫu nhiên, rất khó đoán được chính xác. - Các hệ thống dựa trên cookie lưu trữ các cookie cục bộ (tự backup, luôn nghĩ tiêu thụ kép bị phát hiện). - Cookie phải được nhận biết rõ ràng: có định danh duy nhất, có thông tin kiểm soát như trong cookie có quy định về tên, loại ứng dụng, dung lượng ứng dụng chia sẻ,… - Có cơ cấu xây dựng trong hệ thống kiểm soát để kiểm tra. 3.5. Áp dụng mô hình tin cậy NICE đảm bảo công bằng trong ứng dụng chia sẻ file BitTorrent 3.5.1. Giới thiệu về BitTorrent 3.5.1.1. Tổng quan về BitTorrent BitTorrent là một mạng chia sẻ file được sáng lập bởi Bram Cohen. BitTorrent là một ứng dụng P2P với mục đích phân phối các file có dung lượng lớn nhanh và hiệu quả qua việc upload băng thông của các máy (peer) khi các máy này download dữ liệu. Nền tảng của vấn đề là phân chia các file thành các block có kích thước như nhau (mỗi block chiếm khoảng 32 đến 256 kbs) để các máy download đồng thời các block từ nhiều máy. Các block ở xa được chia nhỏ hơn để có thể sử dụng đường ống (pipelining) theo các yêu cầu. Giả sử bạn có 1 file dung lượng 1GB và 300 người cần, sẽ cần rất nhiều thời gian để chia sẻ 300GB dữ liệu. Nhưng nếu bạn chia file thành các mảnh nhỏ gửi cho mọi người và họ lại chia sẻ các mảnh đó cho người khác cho đến khi ai ai cũng có file hoàn chỉnh thì sẽ nhanh hơn rất nhiều. Các trang web lớn có thể sử dụng BitTorrent để cập nhật cho các phần mềm của họ, bằng cách này họ sẽ giảm được chi phí trả cho băng thông. Tốc độ của BitTorrent rất đáng kinh ngạc, chỉ mất vài giờ để truyền tải các file cực kỳ lớn. Một vài trang web đã ra đời dựa theo công nghệ này phân phát các nội dung có bản quyền. Ngay lập tức, các tổ -52- chức như MPAA đã đổ lỗi cho công nghệ này, điều đó hoàn toàn sai, thực tế lỗi là ở các cá nhân sử dụng công nghệ cho mục đích trái phép. Dù thế nào đi nữa, BitTorrent không phải sinh ra để phát tán tài nguyên bất hợp pháp, nó là một phát minh của Bram để giúp cho việc truyền tải trở nên nhanh hơn trong thế giới mạng. Nó được sử dụng trên các trang web trên khắp thể giới và Bram tự hào về điều này. 3.5.1.2. Các khái niệm và hoạt động của BitTorrent: Torrent: Mỗi một file lớn có hiệu lực download được gọi là một torrent. Thường thì torrent là một file mang phần mở rộng .torrent nhận từ server. File .torrent này chứa thông tin về dữ liệu muốn down (chứ không phải là bản thân dữ liệu đó). User có thể save file .torrent đó trên máy của mình, sau đó mở nó bằng trình BitTorrent để tiến hành việc download. Hoặc, bạn có thể down ngay bằng cách click thẳng vào link trên trang web - cách này mất thêm chút công sức nếu muốn down lại file đó sau này. BitTorrent không giống các mạng P2P khác như là eD2K hoặc FastTrack, bạn không thể search được file A bằng cách sử dụng các chương trình BitTorrent. Thay vào đó bạn phải vào các trang web có danh sách các file Torrent. Các file Torrent này chứa các thông tin về file A mà bạn muốn download và chứa thông tin về các “tracker” mà bạn phải kết nối để bắt đầu download. Các “tracker” là các máy chủ trung tâm, nó lưu giữ thông tin về từng người đang chia sẻ các file A, và các phần mà họ có. Khi bạn download file Torrent, và open nó, chương trình BitTorrent (như là. Bit Torrent, Bit Tornado, Azureus, ...vvv.) sẽ chạy và kết nối đến các tracker. Tracker sẽ kết nối bạn đến Seeds và Peers – những người đang chia sẻ file A này và quá trình download của bạn sẽ bắt đầu. Đến khi bạn có ít nhất một “mảnh” của file A, bạn đã có thể upload “mảnh” đó cho những người chưa có. Như vậy bạn đã có thể thấy rằng BitTorrent khác với các mạng P2P khác : cần có file Torrent cho các file (hoặc thư mục) mà bạn muốn download hoặc chia sẻ. Tracker: Có một thành phần trung tâm cho biết nơi mà một peer có thể lấy dữ liệu từ các node trong hệ thống, thành phần trung tâm này gọi là tracker. Tracker nhận updates từ các node định kì 30 phút giống như các nút khi kết nối hoặc rời torrent. Các trang web liệt kê các file torrent (như là torrentbox.com) có những tracker của họ để quản lý việc download và chia sẻ giữa mọi người. File torrent phải có thông tin chi tiết về tracker. Do đó bạn muốn kết nối đến tracker nào thì chỉ có thể sử dụng file torrent được tạo cho tracker đó. Có các phần mềm để giúp bạn thiết lập các tracker riêng và tạo file torrent. -53- Một server nằm trên mạng internet, phối hợp hoạt động của các trình BitTorrent. Khi bạn mở một file torrent, máy tính của bạn sẽ liên lạc với tracker để lấy danh sách các peer cần kết nối. Trong quá trình down file torrent, thỉnh thoảng máy tính của bạn sẽ lại liên lạc với tracker, thông báo cho tracker biết bạn đã down và up bao nhiêu, còn bao nhiêu nữa là down xong,... Nếu bạn chuẩn bị down một file mà tracker của nó hiện đang mất kết nối, bạn sẽ không thể tạo kết nối. Nếu đang down mà tracker mất kết nối, bạn vẫn có thể tiếp tục quá trình truyền tải file với các peer hiện có, nhưng sẽ không kết nối thêm được với peer mới nào khác. Thường các lỗi với tracker ít khi xảy ra trong một thời gian dài, do đó bạn chỉ việc chờ đợi và để mở trình BitTorrent. Seed: Một node trong hệ thống mà sau khi hoàn thành việc sao chép đầy đủ các file và có thể phục vụ cho các node khác thì được gọi là một seed. Seeds là những người đã có 100% file hoặc thư mục (file hoặc thư mục hoàn chỉnh) và vẫn đang tiếp tục upload cho những người khác. Một máy tính có bản copy hoàn hảo của file torrent bạn muốn down. Khi quá trình down của bạn kết thúc, bạn sẽ hoạt động như một seed cho đến khi bạn bấm Finish hoặc đóng hoàn toàn trình BitTorrent lại. Thường thì bạn nên seed một file đã down xong cho người khác. Đồng thời, khi một file torrent mới được đưa lên tracker, một ai đó phải seed nó cho người khác down. Hãy nhớ rằng, tracker không biết tí gì về nội dung thực sự của file, vì thế luôn cần phải có ít nhất một máy đóng vai trò seed. Reseed: Với một file torrent mà số seed của nó là con số 0 tròn trĩnh (hoặc không có đủ số peer để tạo thành một bản copy hoàn hảo), thì dù muốn hay không tất cả những gì các peer nhận được cũng sẽ là một file không hoàn chỉnh, vì không ai trong swarm đó có các phần còn thiếu. Khi điều đó xảy ra, một ai đó với file hoàn chỉnh (seed) sẽ phải đứng ra kết nối với swarm để tiến hành việc truyền tải các phần còn thiếu. Nó gọi là reseed. Thường thì khi một yêu cầu reseed được đưa ra và được chấp thuận, người được yêu cầu phải đảm bảo mình sẽ để trình BitTorrent của mình mở trong một thời gian nhất định, tạo điều kiện cho file torrent đó có thể được nhiều người down hơn. Swarm: Một nhóm các máy tính kết nối với nhau thông qua một file torrent. Ví dụ, nếu trình BitTorrent của bạn báo bạn đang nối với 10 peers và 3 seeds, thì điều đó nghĩa là trong swarm đó có 13 người (không kể bạn). Peer: -54- Peer là những người chưa có đủ 100% file (file chưa hoàn chỉnh) đang download các phần mà họ chưa có đồng thời upload các phần họ đã có cho người khác. Peer là một máy tính khác trên mạng internet. Bạn tạo kết nối với peer và truyền tải dữ liệu với nó. Thường thì một peer không có cả 100 % file mà bạn muốn down (nếu có nó sẽ được gọi là seed). Một vài người khi nói đến peer lại nghĩ tới leecher, những kẻ sau khi down xong không chịu để trình BitTorrent chạy tiếp và hoạt động như một seed. Leecher: Một node mà trong khi đang download các file nhưng vẫn phục vụ các block mà node này hiện có cho các node khác thì được gọi là leecher. Thường thì Leechers là những người download file nhưng không upload hoặc giảm mức upload xuống mức thấp nhất. Share rating: Nếu bạn dùng một trình BitTorrent với giao diện GUI, bạn sẽ thấy thông số share rating hiện trên giao diện. Nó đơn giản chỉ là tỉ lệ bạn up trên tỉ lệ down. Nếu thông số share ratio là 1.0, điều đó có nghĩa là lượng bạn down bằng với lượng bạn up. Số này càng cao thì nghĩa là bạn đóng góp càng nhiều. Nếu bạn thấy share ratio là vô cùng, thì nghĩa là bạn đang seed một file - bạn up nhưng không down. Vì lợi ích của người khác, hãy giữ cho share ratio của bạn lớn nhất có thể. Các trang có file torrent Có rất nhiều trang web liệt kê các file torrent. Bạn chọn rồi down load file torrent về. Sau đó open bằng chương trình BitTorrent của bạn. Ngay lập tức, bạn sẽ được kết nối với tracker và bắt đầu download. Một số trang web đó là: mininova.org Torrentbits.org TorrentReactor.com FileList.org – Phải đăng ký ... Tầm quan trọng của việc Upload. Việc upload trên BitTorrent là đương nhiên và cần thiết. Đặt trường hợp bạn đang download file có 3 seeds và 800 peers, và việc chia sẽ đã hoàn tất ở một số peers. Giả sử bạn là 1 peer đã download xong nhưng chỉ upload 10% của file rồi ngừng. Việc làm này sẽ dẫn đến hậu quả rất xấu bởi vì bạn làm vậy thì nhiều người khác cũng có thể làm như vậy, sau đó sẽ có rất ít seeds và có thể sẽ không còn seeds và những người chưa hoàn tất sẽ không có file hoàn chỉnh. Nếu -55- tất cả mọi người đều có thói quen ngừng upload ngay khi download xong thì file đó sẽ không tồn tại lâu. Hãy đảm bảo rằng dung lượng upload của bạn bằng với dung lượng download hoặc hơn. Nếu ai đó download 700MB và upload 700MB thì vẫn chưa tốt. Để file đó có thể tồn tại lâu và những người khác còn được download về với tốc độ cao, mọi người hãy cố upload bằng 150% dung lượng mình download. Khi bạn đã download xong, hãy tiếp tục upload đến khi bạn đạt tỉ lệ này. Các tracker luôn cấm các leechers do đó luôn theo dõi việc download/upload của bạn. Nếu bạn thích BitTorrent, đừng thử hoặc cố đánh lừa nó. Cơ chế hoạt động của BitTorrent Khi một node mới kết nối với một torrent, nó sẽ liên hệ với tracker để nắm được danh sách tập ngẫu nhiên các seed hoặc leecher có trong hệ thống hiện tại. Node mới sau đó sẽ thử thiết lập tới khoảng 40 node tồn tại hiện có trong hệ thống để trở thành hàng xóm với các node này. Nếu số các node hàng xóm của một nút thấp hoặc giảm xuống dưới 20 (do các node đó rời hệ thống - chẳng hạn) thì node mới này sẽ liên hệ lại với tracker để được bổ sung thêm các node mà node này có thể kết nối tới được. Mỗi một node sẽ tìm kiếm thời điểm thích hợp (thời cơ) để download các khối từ các node khác (hàng xóm) và upload các khối tới các node hàng xóm này. Thường thì một nút có thể chọn một vài khối mà nó có thể download. Nó sử dụng chính sách local rarest first (ưu tiên cục bộ-LRF) trong việc chọn các block để download, nghĩa là node thử download các khối được sao chép ít nhất xung quanh các hàng xóm của node đó. Chính sách tit-for-tat (có đi có lại – TFT) được sử dụng để cảnh giác chống lại cái gọi là free-riding, nghĩa là: một node sẽ thích hơn việc upload cho các node hàng xóm đã cung cấp cho node này tỉ lệ download tốt nhất. Mỗi một node giới hạn số các upload đồng thời thành một số nhỏ, số này vào khoảng 5. Các seed không có gì để download, nhưng chúng cho một chính sách như nhau, đó là chúng upload tới 5 nodes mà có tỉ lệ download cao nhất. Cơ cấu được sử dụng để giới hạn số các upload đồng thời gọi là choking (ngăn chặn, điều tiết), đó là khoảng thời gian từ chối của một node để upload tới hàng xóm. Chỉ những kết nối để chọn hàng xóm (vào khoảng 5) là unchoked ở bất kỳ thời điểm nào. Một node tính toán tỉ lệ download nhận được từ hàng xóm của nó từ 10 giây để quyết định hàng xóm này (chưa bị chokes) sẽ bị choke để thay thế bởi một hàng xóm khác. BitTorrent cũng kết hợp một chính sách gọi là optimistic unchoke (unchoke lạc quan) trong một node, trong việc unchoke bình thường đã mô tả ở trên, trong unchoke chọn ngẫu nhiên hàng xóm bất chấp tỉ lệ download đạt được từ hàng xóm đó. Optimistic unchoke thực hiện 30 giây mỗi lần. Cơ cấu này cho -56- phép các node khám phá các node hàng xóm thường có tỉ lệ download cao, giống như cho phép các node mới nhận được block đầu tiên của chúng. Có thể nói BitTorrent là một giao thức được tạo ra phục vụ cho quá trình truyền tải file. Dưới hình thức kết nối peer-to-peer, người sử dụng kết nối trực tiếp với nhau để gửi và nhận các phần của một file. Một server trung tâm, dưới tên gọi tracker, được lập ra để xác định vị trí những người dùng ấy. Tracker mang nhiệm vụ duy nhất là quản lý các kết nối, nó không cần biết gì về nội dung file đang được truyền tải, bởi thế ngay cả khi tracker có băng thông cực nhỏ, một số lượng người dùng cực lớn vẫn có thể tham gia vào việc truyền tải file. Điểm cơ bản trong BitTorrent chính là việc người dùng thực hiện việc up và down cùng một lúc trong khi băng thông được tổ chức sao cho tối ưu nhất. BitTorrent được thiết kế để khi số người dùng càng tăng cao thì càng làm việc hiệu quả - điều này trái ngược hẳn với các giao thức truyền tải file khác. Một ví dụ để dễ hình dung quá trình này này là hình ảnh một nhóm người ngồi quanh một cái bàn. Hiển nhiên ai cũng có thể nói và nghe người khác nói. Giờ hãy tưởng tượng họ đều đang cố lấy một bản copy của một cuốn sách. Người A cho biết anh ta có trang 1-10, 23, 42-50 và trang 75. Người C, D, E đều thiếu một số trang trong số các trang người A có, vì thế họ cần sắp xếp để lấy bản copy của những trang mà mình thiếu. Đến người B, anh cho biết mình có trang 11-22, 31-37, và 63-70. Người A, D và E bảo B rằng họ muốn một vài trang trong số đó, và B cần đưa cho họ bản copy các trang ấy. Quá trình cứ thế tiếp tục, mọi người lần lượt trao đổi cho nhau những phần mình có và người khác cần. Sau một lát, dù tất cả đã có bản copy của hầu hết các trang trong cuốn sách, song không ai trong số họ có đủ cả cuốn. Giờ hãy chú ý đến một người khác cũng ngồi bên bàn mà ta tạm gọi là S. Người này có bản copy của cả cuốn sách, và vì thế không cần nhận bất cứ trang nào. Anh ta có nhiệm vụ phân phát những trang mà không ai trong nhóm có. Còn người nhận sẽ không lấy các trang mà người khác trong nhóm đã có. Như vậy, người S có thể chia sẻ cuốn sách cho người khác mà không cần phải gửi cả bản copy cho từng người. Anh ta chỉ việc đưa bản copy các trang khác nhau cho những người khác nhau, và tự họ sẽ chia sẻ cho nhau. Người S ở đây được gọi là seed trong BitTorrent. Qui trình khi download với chương trình BitTorrent 1. Trước hết, bạn tải về một file có phần mở rộng là .torrent và mở nó với chương trình BitTorrent của mình. File torrent này không chứa file mà bạn muốn down, nó chỉ mang dữ liệu mô tả file mà bạn CHUẨN BỊ down. 2. Chương trình BitTorrent của bạn dùng thông tin ghi nhận được trong file torrent để kết nối với tracker. Tracker là server mang thông tin và danh sách các peer đang kết nối với file bạn muốn down. -57- 3. Trình BitTorrent của bạn gửi request tới các peer đang kết nối với file đó (swarm) và bắt đầu down về các phần nhỏ của file đó từ mỗi peer. 4. Khi đã down xong mỗi phần nhỏ, trình BitTorrent sẽ bắt đầu up phần đó lên cho những ai trong swarm chưa có cơ hội down phần nhỏ ấy. 5. Quá trình tiếp diễn cho và mọi người trong swarm tiến hành down các phần của file mình cần. 6. Sau khi down xong file bạn cần, trình BitTorrent sẽ chuyển máy bạn thành seed cho file đó và cho phép mọi người tiếp tục down cho đến khi bạn thoát khỏi chương trình. Để một file torrent có thể được truyền lại, cần ít nhất một seed. 3.5.2. Áp dụng mô hình tin cậy NICE đảm bảo công bằng trong ứng dụng chia sẻ file BitTorrent Như đã nói ở trên, trong ứng dụng BitTorrent thường xảy ra tình trạng một số peer download dữ liệu nhưng không chịu upload, đó là hiện tượng free- riding. Hiện tượng free-riding trong BitTorrent giống như các node nguy hiểm (malicious) trong NICE, đó là các node xấu trong giao dịch luôn gán cookie với giá trị trong khoảng 0.9 đến 1 cho các node không nguy hiểm khác, hoặc gán giá trị cookie trong khoảng 0 đến 0.2. Áp dụng mô hình NICE sẽ cho khả năng phát hiện và cô lập các nút nguy hiểm, đồng thời tạo ra các nhóm cộng tác thiết thực trong việc chia sẻ tài nguyên (như trong trường hợp download và upload trong BitTorrent), hạn chế các truy vấn, từ đó cải thiện băng thông. Việc phát hiện các nút free-rider được tiến hành trong NICE thông qua các cookie như sau: Trong khi giao dịch, các node sẽ kiểm tra giá trị tin cậy thông qua cookie. Nếu trong cơ sở dữ liệu của nút kiểm tra chưa có cookie của node bị kiểm tra thì tiến hành kiểm tra qua các node lân cận (hàng xóm). Giá trị cookie nếu trong khoảng gần, hoặc bằng 1 là tin cậy (trong đoạn [0.7:1] chẳng hạn). Nếu thấp (chẳng hạn qui định nhỏ hơn hoặc bằng 0.2) là không tin cậy. Tuy vậy, nếu giá trị của cookie là tin cậy, nhưng cookie này không có được một cách tin cậy (không nằm trong cơ sở dữ liệu hoặc thông qua hàng xóm tin cậy) thì cũng bị coi là giả mạo. Tỉ lệ các free-rider sẽ được tính thông qua tỉ số giữa các free-rider phát hiện được chia cho tổng các free-rider tham gia. -58- Trong quá trình giao dịch, mặc dù băng thông giữa hai điểm (node) là cố định, tuy nhiên nếu lượng giao dịch nhiều thì sẽ ảnh hưởng đến tốc độ của các tiến trình (download và upload chẳng hạn) giữa các điểm này. Trong NICE, việc ảnh hưởng đến băng thông chính là phụ thuộc vào số các truy vấn giữa các node. Vì vậy các free-rider tham gia càng nhiều thì càng ảnh hưởng đến băng thông sẽ càng lớn. Để có thể hạn chế các truy vấn, tăng khả năng phát hiện các node nguy hiểm (free-rider) thì NICE đề ra giao thức của mình và tạo ra các nhóm cộng tác thiết thực. Với các node nguy hiểm, chúng sẽ luôn chuyển các truy vấn với giá trị cookie là 1. NICE ngăn chặn các truy vấn này theo phương án tạo ra các nhóm cộng tác thiết thực bằng cách tìm các node tốt. Các truy vấn từ các node xấu sẽ bị các node tốt phát hiện và sẽ không được các node tốt chuyển đi, điều đó làm giảm số các truy vấn giữa các node. Càng nhiều các node tốt thì nhóm cộng tác càng mở rộng, từ đó càng ngăn được nhiều các truy vấn xấu từ các node nguy hiểm, và vì vậy băng thông sẽ càng được cải thiện. Chương trình Demo của NICE sau đây sẽ minh họa các vấn đề trong BitTorrent: - Tỉ lệ các nút tham gia mà không đóng góp (free-rider) - Tỉ lệ phát hiện các free-rider - Băng thông khi có free-rider 3.6. Chương trình Demo và các kết quả thu được 3.6.1. Giới thiệu chương trình, cài đặt và thực hiện mô phỏng Chương trình được cải tiến từ chương trình Demo của NICE. a) Yêu cầu: - Hệ điều hành linux (ở đây dùng ubuntu) - ctags: - nice: b) Cài đặt: Cài đặt ctags: giải nén ctags-5.8.tar.gz và thực hiện các lệnh: cd ctags-5.8 -59- ./configure make sudo make install Cài đặt nice.trustsim.extended: Giải nén nice.trustsim.extended.tgz và thực hiện lệnh: cd nice.trustsim.extended make Kết quả là: gcc -Wall -g -DDEBUG -c context.c gcc -Wall -g -DDEBUG -c event.c gcc -Wall -g -DDEBUG -c history.c gcc -Wall -g -DDEBUG -c link.c gcc -Wall -g -DDEBUG -c main.c gcc -Wall -g -DDEBUG -c node.c gcc -Wall -g -DDEBUG -c pqueue.c gcc -Wall -g -DDEBUG -c query.c gcc -Wall -g -DDEBUG -c toposerver.c gcc -Wall -g -DDEBUG -c truststore.c gcc -Wall -g -DDEBUG -c unittest.c gcc -o hiertrust context.o event.o history.o link.o main.o node.o pqueue.o query.o toposerver.o truststore.o -lm Sau khi make chương trình tạo ra file thực thi hiertrust cùng các file có đuôi .o tương ứng theo các file .c mã nguồn. c) Mô tả các file chương trình: Chức năng chính của các file chương trình File Chức năng main.c Thực hiện các chức năng của chương trình event.h event.c Định nghĩa cấu trúc sự kiện (event) cùng các thủ tục khác: Tạo sự kiện Giải phóng sự kiện node.h, node.c Định nghĩa các khối blocks, cookieQueryInfo, node và các thủ tục khác. Lưu trữ các thông tin của node: lịch sử giao dịch, vị trí các node tin cậy khác, các thông tin cho các node khác có các hàm chính: -60- In trạng thái kết thúc của node Giải phóng tất cả tài nguyên Lưu trữ các blocks của một node Đếm số blocks lưu trữ của một node Loại bỏ các blocks đang lưu trữ của một node Cho một node tham gia query.h, query.c Định nghĩa cấu trúc lấy và kiểm tra truy vấn cùng các hàm và thủ tục khác có liên quan. Lưu trữ các thông tin quảng cáo dùng để phát hiện các node mới có các chức năng chính: Thêm các node vào truy vấn Lấy danh sách các node thông báo Đánh dấu trong truy vấn các node đã được thăm Kiểm tra node đã được thăm chưa pqueue.h, pqueue.c Định nghĩa các cấu trúc về khóa, dữ liệu, độ dài và kích cỡ dữ liệu, hàng đợi cùng các thủ tục khac. Tạo hàng đợi lưu trữ theo cây nhị phân đầy đủ với đỉnh cha luôn nhỏ hơn các đỉnh con, chỉ số bắt đầu từ 1 Thêm dữ liệu vào pqueue Kiểm tra pqueue rỗng context.h, context.c Định nghĩa cấu trúc biến ngữ cảnh Khởi tạo các giá trị ban đầu cho các tham số trong mô phỏng. history.h, history.c Định nghĩa cấu trúc lịch sử giao dịch. Lưu trữ lịch sử giao dịch của các node có các chức năng chính: Giải phóng dữ liệu Cập nhập dữ liệu Thêm dữ liệu Thêm dữ liệu với các node tin cậy Loại các node giao dịch Lấy giao dịch lớn nhất Giải phóng dữ liệu vùng đệm khi in. link.h, link.c Mô phỏng liên kết có các chức năng chính: Tạo độ trễ liên kết Kiểm tra độ trễ Lập lịch biểu độ trễ toposerver. h, toposerver. c Định nghĩa cấu trúc toposerver mạng, Lưu trữ định danh của các node để mô tả topo của mạng có các chức năng chính: Giải phóng các node Thêm node Lấy node trustore.h, Định nghĩa ngưỡng cookie tốt, cấu trúc cookie, cấu trúc lưu trữ tin -61- trustore.c cậy và các hàm khác có liên quan. Lưu trữ giá trị tin cậy của các node có các chức năng chính: Thêm giá trị tin cậy Kiểm tra giá trị tin cậy Đếm các giá trị tin cậy Tìm kiếm giá trị tin cậy Xóa giá trị tin cậy Tạo giá trị tin cậy Lưu trũ vào cookie Kiểm tra độ tin cậy unittest.c Thực hiện thủ tục kiểm tra cấu trúc lưu trữ cookies100 00 Lưu trữ cấu hình của hệ thống dùng với tham số -config Các chức năng chính và mô phỏng trong main.c: parse_args(context * ctx, int argc, char * argv[]): Đọc và kiểm tra các tham số dòng lệnh, nếu hợp lệ thì chạy tiếp chương trình, nếu không hợp lệ thì thông báo cho người dùng. Các tham số : -l : log data[stdout] -L : log NO data[off] -s seed : randomseed[%ld] -config f : sử dụng file config f - read_config(context * ctx) Đọc tham số cấu hình từ dòng lệnh đưa vào biến ngữ cảnh ctx Nếu file config không có thì chạy stubconfig(ctx) <hàm khởi tạo cấu hình hệ thống mặc định> Tiếp theo kiểm tra có ghi log file và ghi ra đâu (stdout mặc định). Đọc file config nhập vào từ dòng lệnh. - stubconfig(context * ctx) Tạo cấu hình mặc định cho hệ thống vào biến ngữ cảnh ctx Cấu hình mặc định cho hệ thống: Bao gồm 10 node, mỗi node có độ tin cậy là 1.0, có 9 block -62- Các sự kiện node_join() được tạo ra nếu node được tạo thành công - init(context * ctx) Khởi tạo hệ thống, seed một số ngẫu nhiên, tạo một topo server gắn với biến ngữ cảnh hệ thống. - printstats(context *ctx) In ra thống kê hiện thời có bao nhiêu lỗi - newround(context * ctx) Tạo vòng mới - heartbeat(context *ctx, event *e, double t) In ra thống kê mỗi nhịp, sau đó tạo lịch mới - cleanup(context * ctx) - Đặt mọi giá trị về vị trí ban đầu (hoàn thành) - Lập sự kiện mới dạng khởi thủy. - main() - Tạo biến ngữ cảnh - Đọc và kiểm tra các tham số dòng lệnh - Đọc file config. - Khởi tạo hệ thống - Chạy mô phỏng. Mặc định chương trình chạy một vòng mô phỏng. - Kết thúc chương trình giải phóng bộ nhớ do các tham số chiếm trong quá trình chạy chương trình. 3.6.2. Chạy chương trình: Sau khi vào cửa sổ lệnh (Terminal) và chuyển đến thư mục chứa các file chương trình và biên dịch chương trình thành công, để chạy chương trình ta sử dụng file cấu hình, gõ lệnh: ./hiertrust –config cookies10000 File cookies10000 có các cấu trúc config như sau: COOKIES 1 -63- NODES 10000 good=1.0 want=10 have=11 state=11 sleep=0 NODES 10000 good=0.1 want=10 have=11 state=11 sleep=0 Kết quả chạy lệnh ./hiertrust -config cookies10000 sẽ hiển thị các kết quả tính toán ra màn hình. Để có được kết quả theo ý thì cần lọc và ghi ra một file cụ thể trên đĩa để tiện cho quá trình phân tích. Khi thay thế file cookies10000 bằng một file khác có cấu hình cụ thể, thì khi chạy lại chương trình sẽ cho kết quả khác. 3.6.3. Các kết quả mô phỏng Trong quá trình mô phỏng, tôi chọn cấu hình cho các file với các thông số như sau: COOKIES 1 HEARTBEAT 0.1 MAXRULE 1 BACKOFF 0.5 NODES 1000 good=1.0 want=100 have=101 state=80 sleep=0 NODES xxxx good=0.2 want=100 have=101 state=80 sleep=0 ở đây xxxx là số các node xấu (lấy giá trị tin cậy của cookie là 0.2). Số các node này thay đổi theo các file được chọn. Mô phỏng được tiến hành trên các file cấu hình được đặt tên là badnode- 0, badnode-1000, badnode-2000, badnode-10000 và badnode-20000 với số node xấu thay đổi tương ứng là 0, 1000, 2000, 10000 và 20000. Các tham số khác giữ nguyên, trừ file badnode-0 giới hạn số các truy vấn tối đa cho mỗi node là 20 để ổn định cho việc so sánh với các trường hợp khác. 3.6.3.1. Tỉ lệ các nút tham gia mà không đóng góp (free-rider) -64- Hình 3.1 cho biết tỉ lệ phát hiện các tương tác (gửi truy vấn theo các cookie) của các node xấu (đường cong có dấu *) so với tổng số các tương tác của các node (bao gồm cả node xấu và node tốt - đường cong có dấu ) tham gia giao dịch. Thời gian phân tích của mô phỏng là 5 phút. Trong kết quả thu được ta thấy khả năng phát hiện các nút xấu tại lân cận phút thứ 2 của mô phỏng là thấp nhất (thể hiện qua hiệu-khoảng cách của 2 đường cong), nhưng sau đó khả năng phát hiện đã ổn định và tỉ lệ đã tương đối cân bằng giữa các node xấu bị phát hiện so với tổng số các node tham gia. Điều này có thể giải thích là lúc đầu khi mà nhóm hợp tác giữa các node tốt chưa hình thành hoặc ít thì khả năng phát hiện node xấu là thấp. Khi nhóm này mở rộng và phát triển thì khả năng phát hiện tăng lên và đạt đến độ ổn định tương đối, đồng thời các truy vấn giảm đáng kể và cũng ổn định (dần về với số các tương tác của các node tốt), thể hiện qua đồ thị là khoảng cách giữa tổng số các tương tác và số tương tác của chỉ mình các node tốt. Hình 3.2 và 3.3 sau đây thể hiện kết quả tương tự. -65- 3.6.3.2. Tỉ lệ phát hiện các free-rider Hình 3.4 minh họa tổng hợp kết quả về khả năng phát hiện các node xấu tương ứng với cấu hình số lượng các node xấu tham gia là 1000, 2000, 10000 và 20000. -66- Hình 3.5 minh họa tỉ lệ phát hiện các node xấu. Tỉ lệ này được lấy bằng tỉ số giữa các tương tác của các node xấu phát hiện được chia cho tổng số các tương tác của các node tham gia. Tại lân cận của phút thứ 2 cho tỉ lệ thấp nhất. Lí do là tổng số các tương tác của các node ở đây lớn nhất (mẫu lớn nhất), trong khi số các tương tác phát hiện được ở thời điểm này là thấp (tử số nhỏ nhất), từ đó kết quả của phép chia là nhỏ nhất. Bắt đầu từ những phút sau phút thứ 2 thì tỉ lệ này là tăng dần, ổn định và gần với nhau. Số các tương tác của các node xấu phát hiện được gần với tổng số các tương tác của node tham gia, và vì vậy tỉ lệ này tiến dần tới 1, đạt kết quả cao nhất vào khoảng trên 90%. Có được kết quả này là do trong mạng tại thời điểm này đã hình thành và mở rộng các nhóm hợp tác thiết thực là các node tốt. Các node tốt sau khi phát hiện ra các node xấu thì ngăn chặn các node xấu chuyển các truy vấn và sau đó “tỉa” các node xấu này ra khỏi hệ thống. Vì vậy trong các đồ thị thì tổng số các tương tác của các node tham gia giao dịch sẽ giảm dần, và giảm về số các tương tác của các node xấu bị phát hiện. Số các tương tác tổng cộng cao hơn (đường cong nằm phía trên) là do có các tương tác của các node tốt cùng tham gia. -67- 3.6.3.3. Băng thông khi có free-rider Theo định nghĩa băng thông (bandwidth) trên mạng thì băng thông là đại lượng đặc trưng cho tốc độ truyền dữ liệu từ điểm này tới điểm khác trong một khoảng thời gian (thường tính bằng đơn vị của bit/giây). Chẳng hạn một modem làm việc ở tốc độ 56 kbs có hai băng thông làm việc ở 28 kbs. Trong một mạng nếu số lượng các truy vấn tham gia nhiều thì các truy vấn này sẽ ảnh hưởng đến tốc độ truyền dữ liệu trên mạng (có sự chia sẻ đường truyền giữa các ứng dụng), điều đó có nghĩa là băng thông bị hạn chế và ảnh hưởng đến hiệu năng của mạng. Trong NICE, các node tốt cùng với các nhóm cộng tác sẽ ngăn chặn việc gửi các truy vấn của các node xấu, từ đó cải thiện được hiệu năng và băng thông của mạng. Hình 3.6 trong thí nghiệm mô phỏng thể hiện tổng số các tương tác của toàn bộ các node tham gia giao dịch trong mạng (bao gồm cả các node tốt và xấu). Mô phỏng làm trên cấu hình trong đó các node nguy hiểm được lấy là 1000, 2000, 10000 và 20000. Mỗi đường cong thể hiện tổng số các tương tác (bao gồm cả các node tốt và node xấu) tương ứng với số các node xấu cho trong cấu hình của tệp mô phỏng. Rõ ràng số các tương tác này giảm nhanh và càng về -68- sau (tính từ phút thứ 3 trở đi) càng ổn định ở mức thấp. Điều này tạo điều kiện rất nhiều cho việc cải thiện băng thông của toàn mạng. Các ứng dụng truy cập dữ liệu, download/upload sẽ được cải thiện nhiều về tốc độ,… -69- Kết luận và hướng nghiên cứu Các ứng dụng của mạng ngang hàng ngày càng phát triển. Việc ngăn chặn các ảnh hưởng làm giảm hiệu năng và băng thông của mạng là cần thiết nhằm cải thiện chất lượng của toàn mạng. Bài viết đã nghiên cứu về các vấn đề tin cậy và đề xuất một khía cạnh là làm thế nào để đảm bảo công bằng trong các ứng dụng cộng tác ngang hàng dựa trên khái niệm tin cậy. Đóng góp chính của bài viết này là một đề xuất giải thuật định giá tin cậy dựa theo cookie, qua đó phát hiện được các trường hợp giả mạo, các truy vấn của các node nguy hiểm, từ đó hạn chế sự chiếm dụng băng thông đường truyền, tạo điều kiện nâng cao tốc độ của đường truyền. Cũng từ sự phát hiện các node nguy hiểm mà có thể ưu tiên cho các node tốt trong vấn đề truy cập và chia sẻ tài nguyên, từ đó đảm bảo công bằng trong các ứng dụng cộng tác. Giải thuật này có thể áp dụng trong môi trường cộng tác của mạng ngang hàng. Giải thuật là thiết thực, hạn chế sự biến đổi của các cuộc tấn công bởi những người sử dụng xấu. Hướng nghiên cứu tiếp theo của đề tài: Củng cố và mở rộng ứng dụng của giải thuật dựa trên khái niệm tin cậy và cookie, đồng thời kiểm định qua ứng dụng cụ thể trong môi trường thực, để có thể áp dụng được tốt hơn trong việc đảm bảo công bằng cho các ứng dụng cộng tác trong mạng ngang hàng. Mặc dù đã rất cố gắng, xong do năng lực còn hạn chế nên bài viết không tránh khỏi những thiếu sót. Rất mong nhận được sự đóng góp quí báu của quý Thầy, Cô và các bạn đồng nghiệp cũng như những ai quan tâm tới bài viết. Tôi xin chân thành cảm ơn. -70- Tài liệu tham khảo Tiếng Anh [1] Alfarez Abdul-Rahman & Stephen Hailes, “A Distributed Trust Model”, pp. 1-9. [2] Dinesh C. Verma (2005), Legitimate Applications of Peer to Peer Networks. Wiley-InterScience, pp. 1-17, 37-54. [3] Jing Zhao, Ping Zhang and Guohong Cao, “On Cooperative Caching inWireless P2P Networks”, pp. 1-3. [4] Karl Aberer, Zoran Despotovic, “Managing Trust in a Peer-2-Peer Information System”, pp.1-3. [5] Lik Mui, Mojdeh Mohtashemi, Ari Halberstadt, “A Computational Model of Trust and Reputation”, pp. 1-5. [6] Nicolas C. Liebau, Vasilios Darlagiannis, Oliver Heckmann, "Accounting in Peer-to-Peer-Systems”, pp. 11-13. [7] Ralf Steinmetz (2003), Peer-to-Peer Systems and Applications, pp.38-43 [8] Rob Sherwood, Seungjoon Lee, Bobby Bhattacharjee, “Cooperative Peer Groups in NICE”, pp. 1-11. [9] The Gnutella Protocol Specification v0.4 Document Revision 1.2. protocols@clip2.com [10] [11] Tiếng Việt [12] Hồ Sĩ Đàm (2007), Cấu trúc dữ liệu và giải thuật, Nhà xuất bản Giáo dục. [13] PGS.TS Hồ Sĩ Đàm: Bài giảng môn Cấu trúc dữ liệu & giải thuật. [14] Đinh Mạnh Tường (2001), Cấu trúc dữ liệu và thuật toán, nhà xuất bản Khoa học và Kỹ thuật Hà Nội, tr. 5-22.

Các file đính kèm theo tài liệu này:

  • pdfLUẬN VĂN- ĐẢM BẢO CÔNG BẰNG TRONG CÁC ỨNG DỤNG CỘNG TÁC NGANG HÀNG.pdf