Công nghệ thông tin với sự tự do, sáng tạo và chia sẻ

Thread trong .NET hỗ trợ phương thức suspend và resume, tuy nhiên việc dùng hai phương thức này vào xử lý trong thực tế có thể dẫn đến một số bất cập. Ta không thể biết thread đang làm gì lúc nó dừng, nếu thread đang nắm một tài nguyên dùng chung nào đó đột ngột bị dừng, nó có thể khiến các thread khác gặp exception hoặc tệ hơn gây deadlock. Để dừng một thread cách tốt nhất là sử dụng biến dùng chung và thay đổi giá trị biến ấy từ bên ngoài. Khi thread thực hiện công việc nó sẽ định kỳ kiểm tra biến này và dừng khi đến đúng điểm định trước và gặp đúng giá trị thích hợp. Một trong những cách dừng cơ bản nhất là dùng một biến làm cờ và bên trong đoạn code mà thread thực thi, ta đặt tại vị trí thích hợp một vòng lặp, có tác dụng như một bẫy: while(pauseFlag== true) ;

pdf45 trang | Chia sẻ: lylyngoc | Lượt xem: 2427 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Công nghệ thông tin với sự tự do, sáng tạo và chia sẻ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
iệp phần mềm có mức độ vận động sáng tạo và chuyển hóa nhanh đến nỗi những nền tảng pháp lý về sở hữu trí tuệ vốn trước nay được xem là để bảo vệ quyền lợi của nhà phát minh sáng chế lại trở thành rào cản cho sự tự do sáng tạo. Phần này sẽ điểm qua lịch sử của ngành công nghệ phần mềm và các xu hướng phát triển phần mềm hiện tại, các tranh cãi vẫn đang tiếp diễn liên quan đến sở hữu trí tuệ đối với phần mềm. Từ đó chúng ta có thể nhìn thấy một bức tranh muôn màu về việc áp dụng các nguyên lý sáng tạo vào ngành công nghiệp phần mềm cũng như làm sao thúc đẩy sự sáng tạo trong công nghệ thông tin. GVHD: Hoàng Văn Kiếm Trang 13/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Mục cuối cùng của phần này sẽ mô tả lại quá trình xây dựng một phần mềm sơ khai, chỉ tận dụng các nguyên tắc sáng tạo mà không theo một lối mòn cho trước nào. I. Sự giải phóng của ngành phần mềm và bùng nổ sáng tạo trong công nghệ thông tin Từ thời kỳ của những cỗ máy tính siêu lớn những năm 50, đến giai đoạn bùng nổ máy tính cá nhân, và cho đến thời kỳ chớm nở của điện toán đám mây và máy tính bảng. Mục này điểm qua sơ lược lịch sử ngành công nghệ phần mềm với những sáng tạo và phát kiến đã ghi dấu vào lịch sử. a. Giai đoạn 1: Phần mềm là gắn liền với phần cứng Thập niên 60 của thế kỷ XX đánh dấu một bước thay đổi to lớn đối với ngành công nghiệp phần mềm. Trước thập niên 60 không ai nghĩ đến một ngành công nghiệp phần mềm, người ta xem phần mềm như là một phần gắn liền với phần cứng máy tính. Những cổ máy tính khổng lồ to bằng cả toà nhà được lập trình trước một số chức năng nhất định và thường được cho thuể sử dụng theo giờ. Do thời gian làm việc với máy hạn chế, rất ít kỹ sư có khả năng cũng như điều kiện nghiên cứu phát triển phần mềm trên máy, nhà sản xuất chỉ sản xuất những phần mềm cần thiết để máy hoạt động và không thu phí phần mềm cũng như không đầu tư phát triển phần mềm cho máy tính. Tuy nhiên sự thay đổi đột phá đầu tiên đến từ một tên tuổi không mấy xa lạ: công ty IBM. Năm 1964, như một ví dụ điển hình cho “nguyên tắc linh động” trong 40 nguyên tắc sáng tạo khoa học/kỹ thuật, IBM công bố sản phẩm System/360. Thay vì các sản phẩm máy tính trước đây chỉ được thiết kế tối ưu cho một số công việc nhất định, IBM tung ra một họ các máy tính với một thiết kế tương tự nhau, sử dụng chung phần mềm nhưng có nhiều kích thước và tốc độ xử lý tính toán khác nhau. Các công ty vừa và nhỏ có thể dễ dàng trang bị một máy tính cỡ nhỏ của hệ thống System/360 cùng các phần mềm cần thiết và khi công ty phát triển họ có thể chuyển sang sử dụng một máy tính lớn hơn mà vẫn đảm bảo tương thích. Sự linh động này đánh dấu một bước đột phá trong ngành công nghiệp máy tính. Giờ đây máy tính từ những cổ máy khổng lồ chỉ có thể cho thuê chứ ít ai mua nổi nay đã trở nên dễ dàng tiếp cận hơn. Sự thành công mày System/360 mang lại cho IBM lớn đến nỗi GVHD: Hoàng Văn Kiếm Trang 14/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học chính hãng đã thừa nhận đây là sản phẩm quan trọng nhất trong lịch sử công ty từ trước đến nay[9]. Đồng thời, System/360 cũng mở ra một kỷ nguyên mới cho ngành công nghiệp phần mềm khi giờ đây phần mềm có thể chạy trên nhiều máy tính khác nhau. Không chỉ sáng tạo đôt phá về mặt kỹ thuật, năm 1969, IBM tiếp tục đề xuất một đột phá mới trong mô hình kinh doanh áp dụng “nguyên tắc phân nhỏ” khi chia sản phẩm máy tính thành 3 phần riêng biệt bao gồm: Phần cứng, phần mềm và dịch vụ. Theo đó IBM sẽ tính phí riêng cho việc cung cấp phần cứng, phát triển phần mềm theo yêu cầu, tổ chức các khóa đào tạo sử dụng máy tính, dịch vụ hỗ trợ khách hàng khi có sự cố, v.v... Mô hình kinh doanh đột phá này chính thức khai sinh ngành công nghiệp phần mềm và dịch vụ, mở đường cho sự bùng nổ sáng tạo không ngừng của công nghệ thông tin. b. Giai đoạn 2: Định hình nền công nghiệp với sự trỗi dậy của máy tính cá nhân Khi mới khai sinh ngành công nghiệp phần mềm phát triển khá chậm chạp. Các hệ thống phần cứng máy tính bấy giờ vẫn còn có giá khá cao và phần mềm chỉ tương thích với một số phần cứng nhất định. Điều này dẫn đến việc thị trường phần mềm khá manh múng với lượng khách hàng tương đối ít và vẫn còn lệ thuộc khá nhiều vào phần cứng. Các công ty lớn vẫn xem phần mềm là một loại hình dịch vụ giá trị gia tăng cho phần cứng và chưa đầu tư đúng mức cho lĩnh vực này. Giai đoạn đầu của thập niên 70 cũng đánh dấu sự ra đời của hai nhân tố quan trọng là mạng Internet và đĩa mềm (floppy disk). Hai công cụ này cho phép phần mềm được chia sẻ và trao đổi cực kỳ dễ dàng giữa những người dùng máy tính tạo ra một kênh phân phối phần mềm độc lập không cần thông qua các công ty sản xuất phần cứng. Và đặc biệt hơn internet cho phép trao đổi giữa những người đam mê máy tính (hobbyist) - những lập trình viên, những kỹ sư phần mềm tương lai. Họ có thể tự mình phát triển phần mềm, chia sẻ phần mềm đó với cộng đồng người dùng trên internet và nhận được các phản hồi góp ý để cùng nhau tiến bộ. Đây chính là hạt giống ban đầu cho phong trào mã nguồn mở và các công ty sản xuất phần cứng hết sức vui vẻ chào đón các cộng đồng những người đam mê máy tính này. Trước hết vì họ là những khách hàng tiềm năng và luôn sẵn sàng đó nhận sản phẩm mới, hơn nữa sự phong phú về phần mềm do những lập trình viên ban sơ này GVHD: Hoàng Văn Kiếm Trang 15/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học viết ra sẽ thúc đẩy doanh số phần cứng. Tuy nhiên môi trường phát triển và chia sẻ phần mềm dựa theo đam mê này lại gây ảnh hưởng đến doanh thu của những công ty chỉ chuyên phát triển phần mềm. Công ty Microsoft thành lập năm 1975 với sản phẩm đầu tay là phần mềm Altair BASIC cho máy MITS. Tuy nhiên trong khi máy MITS được bán ra hành nghìn chiếc mỗi tháng thì trong suốt cả năm ròng phần mềm Altair BASIC chỉ bán được vài trăm phiên bản. Tháng 2 năm 1976, Bill Gate, viết một bức thư ngỏ cho tất cả người đam mê máy tính (Open letter to Hobbyist) được xuất bản trên nhiều tạp chí. Trong đó ông than phiền về việc có quá ít người dùng Altair BASIC thật sự trả tiền mua phần mềm này. Cho rằng việc sao chép phần mềm sẽ làm nản lòng những nhà lập trình viên muốn tham gia ngành công nghiệp phần mềm vừa chớm nở, ông lên án hành vi sao chép phần mềm là bất công và trộm cắp. Bức thư của Bill Gate nhận được nhiều sự phản ứng dữ dội nhưng cũng có nhiều người tán đồng quan điểm của Bill Gate. Trong những phát biểu và hướng đi tiếp theo của mình, ông đã áp dụng triệt để “nguyên tắc chuyển sang chiều khác”, thay vì xem phần mềm là một sản phẩm phụ trợ được bán theo phần cứng, ông xem phần mềm là một tác phẩm của lao động sáng tạo, được bảo hộ bởi quyền tác giả và tác giả phần mềm có quyền thu hoa hồng trên mỗi phiên bản copy phần mềm được phát hành. Cách tiếp cận này nhanh chóng thu hút được sự chú ý của nhiều công ty phần mềm khác và xu hướng phần mềm mã nguồn đóng dần được hình thành. Theo đó phần mềm sẽ được phân phối dưới dạng mã nhị phân, độc lập với phần cứng và người dùng sẽ mua một license trong đó thường quy định rõ họ không được phép xem lén mã nguồn, không được phân phát phần mềm cho người khác và chỉ được dùng trên một số lượng máy tính nhất định. Phương thức kinh doanh phần mềm này nhận được một sự thúc đẩy vượt bậc hơn nữa khi máy tính cá nhân của IBM ra đời. Một dòng máy tính đủ rẻ để cá nhân và gia đình có thể mua được mở ra một thì trường vô cùng to lớn cho các nhà phát triển phần mềm. Microsoft nhanh chóng nhảy vào thị trường cung cấp phần mềm cho máy tính cá nhân với hệ điều hành DOS và nhanh chóng xác lập được vị trí thống trị của mình trong ngành công nghiệp phần mềm còn non trẻ này. GVHD: Hoàng Văn Kiếm Trang 16/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học c. Sự trỗi dậy của phần mềm mã nguồn mở và câu chuyện Tái ông thất mã Cuối thập niên 70, thị trường phần mềm chuyển hướng sang mô hình kinh doanh mã nguồn đóng do Bill Gate khởi sướng tuy mang lại một luồng sinh khí mới cho công nghệ thông tin nhưng cũng để lại một số mặt trái: Những người đam mê tin học, những nhà tiên phong trong lĩnh vực công nghệ phần mềm cảm thấy họ bị đặt vào một tình thế bị phản bội. Họ đã góp phần thúc đẩy sự phát triển của ngành công nghiệp máy tính nhưng bây giờ họ bị cấm không được xem mã nguồn phần mềm. Những phần mềm trước đây họ phát tham gia phát triển bị các công ty lớn đem về chỉnh sửa cho hoàn thiện và bán với giá không thể mua được. Thậm chí một số công ty đăng ký bảo hộ phần mềm bằng hình thức “bằng sáng chế” patent có thể yêu cầu cấm việc phát triển và sử dụng những phần mềm cùng tính năng. Bức bối trước tình trạng lợi dụng luật sở hữu trí tuệ để bóp chẹt sáng tạo hòng độc quyền kinh doanh, Richard Stallman - cha đẻ của tổ chức Phần mềm tự do đã tương kế tựu kế - sử dụng nguyên tắc “Biến hại thành lợi”, dùng chính luật sở hữu trí tuệ để xây dựng một hành lang pháp lý cho trào lưu phần mềm nguồn mở. Giấy phép công cộng phổ quát (General Public License – GPL) ra đời với phương châm của phần mềm tự do. Theo đó bất kỳ người nào có một bảng copy của phần mềm cũng sẽ sở hữu ngay quyền được tự do sửa đổi, sao chép, phân phối lai phần mềm đó với duy nhất một điều kiện: Mọi sản phẩm được phát triển tiếp theo dựa trên phần mềm đó cũng sẽ phải mang giấp phép GPL. Hành lang pháp lý vững chắc của GPL cho phép hoạt động chia sẻ phần mềm từ một hành vi bị lên án nhầm là trộm cắp nay trở thành một hoạt động tự do dưới sự bảo vệ của luật pháp. Dưới sự bảo trợ này Stallman và tổ chức phần mềm tự do bắt tay vào việc xây dựng một loạt phần mềm tự do mang giấy phép GPL để thay thế cho các phần mềm thương mại hiện có đang chuyển dần sang mã nguồn đóng, từ hoạt động này mà hệ điều hành linux ra đời và dần dần phát triển thành một sản phẩm duy nhất khả dĩ cạnh tranh được với Microsoft windows về thị phần hệ điều hành cho máy tính cá nhân. Phong trào phần mềm tự do hay mã nguồn mở tiếp tục phát triển lên một tầm mức mới với sự kiện có liên quan đến sự ra đời của world wide web. Đầu thập niên 90, Microsoft phát hành trình duyệt Internet Explorer để cạnh tranh với trình duyệt Netscape Navigator của công ty Netscape Communication. Tuy là một trong những GVHD: Hoàng Văn Kiếm Trang 17/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học công ty tiên phong với sự ra đời của world wide web và chiếm đến 95% thị phần trình duyệt web, Netscape nhanh chóng bị Microsoft đẩy lùi bằng con át chủ bài: Windows. Sau khi Microsoft quyết định phát hành miễn phí Internet Explorer như một phần Windows vào năm 1995, thị phần của Internet Explorer nhanh chóng tăng lên 50% và dần dần đẩy Netscape Navigator vào chỗ nguy khốn. Đến năm 1997 sau khi Microsoft tăng cường việc tích hợp một số chuẩn lạ vào Internet Explorer khiến cho các trang web duyệt tốt trên Internet Explorer có thể không chạy được trên trình duyệt Netscape, 90% thị trường trình duyệt web đã rơi vào tay Internet Explorer,. Trước tình thế đó, công ty Netscape communication đã có một quyết định cực kỳ táo bạo: “Phát hành mã nguồn Netscpae Navigator dưới giấy phép mã nguồn mở”. Quyết định này về sau được giải thích nhằm tránh thế độc quyền về trình duyệt web của Microsoft, một khi Microsoft nắm độc quyền trình duyệt web, họ sẽ có khả năng thao túng quá trình phát triển của giao thức HTTP và chuẩn world wide web, từ đó làm bàn đạp xâm chiếm thị trường máy chủ web và độc quyền gần như toàn bộ internet. Việc mã nguồn mở Netscape Navigator cho phép các chuyên gia về tin học có thể tiếp tục tham gia phát triển trình duyệt này dưới sự bảo trợ của giấy phép GPL và không bị Microsoft lợi dụng. Sự kiện này mở ra một hướng đi mới cho mã nguồn mở, từ chỗ là kẻ thù của doanh nghiệp thì nay mã nguồn mở trở thành một lợi thế trong kinh doanh. Thay vì thu phí phần mềm thật cao doanh nghiệp sẽ tận dụng sự trợ giúp của các cộng đồng người sử dụng có đam mê và kinh nghiệm để phát triển phần mềm. Phần mềm đó được mã nguồn mở để tránh sự lợi dụng đánh cắp mã nguồn từ đối thủ. Với việc giảm được gánh nặng trong phát triển phần mềm, công ty có thể tập trung vào thu lợi từ cách dịch vụ kèm theo. II. Áp dụng các nguyên tắc sáng tạo trong xây dựng phần mềm a. Nhu cầu thực tế. Chia sẻ dữ liệu giữa các máy là một nhu cầu khá phổ biến trong thực tế làm việc với máy tính. Nếu như trong môi trường mạng cục bộ (LAN) việc chia sẻ dữ liệu diễn ra khá dễ dàng, thì trong môi trường internet, mọi việc lại không được suôn sẻ như thế. Về cơ bản, việc chia sẻ file giữa các máy đang kết nối chung trong một mạng là không khó. Tuy nhiên, do đặt cao tính bảo mật nên khả năng chia sẻ file tích hợp GVHD: Hoàng Văn Kiếm Trang 18/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học trong hệ thống thường bị chặn trong mội trường internet. Để chia sẻ file người dùng thường có một số lựa chọn: 1. Chép file vào thiết bị lưu trữ ngoài rồi chạy đến chỗ máy cần nhận file. Dễ thấy phương án này không khả thi nếu hai máy cách nhau quá xa về địa lý... 2. Biến máy mình thành một server chia sẻ file trên máy (vd FTP server) Phương án này đòi hỏi nhiều kiến thức chuyên môn về công nghệ thông tin. 3. Sử dụng tính năng send file có sẵn trong các chương trình chat (instant message). Phương án này phải lệ thuộc vào nhà cung cấp dịch vụ tin nhắn tức thời, khi dịch vụ có sự cố, tính năng send file cũng tiêu tùng theo. 4. Upload file cần chia sẻ lên một server chuyên lưu trữ file. Phương án này tốn thời gian do đòi hỏi file phải được tải lên hoàn chỉnh trước khi người nhận có thể tải về 5. Sử dụng chương trình chia sẻ file qua mạng ngang hàng. Đây là phương án rất khả thi, tuy nhiên các trình chia sẻ file qua mạng ngang hàng hiện nay tương đối khó sử dụng với người dùng cuối. b. Phân tích các giải pháp đã có và tìm ra vấn đề: Với nhu cầu không ngừng gia tăng mỗi ngày của con người thì các phương án đã nêu ở mục trước không trán khỏi những hạn chế nhất định. Áp dụng các phương pháp phát hiện vấn đề đã được học, ta có thể thấy còn rất nhiều vướng mắc cần giải quyết. Áp dụng nguyên tắc thứ 4, từ thực tiễn quan sát và sử dụng các phương án đã nêu nhiều năm nay, ta nhận thấy còn một số vướng mắc: 1. Có nhiều phương án bị lệ thuộc vào một nhà cung cấp dịch vụ thứ 3. Khi tập tin được tải lên một dịch vụ chia sẻ file hay truyền qua một ứng dụng chat nào đó thì cả bên truyền và bên nhận đều phải tiếp cận được dịch vụ này. Bất kỳ sự cố nào khi kết nối với nhà cung cấp dịch vụ cũng khiến việc truyền tải tập tin không thực hiện được, mặc dù người gửi và nhận vẫn có thể kết nối trực tiếp với nhau. 2. Có nhiều phương án quá chuyên sâu về kỹ thuật. Việc thiết lập một mạng ngang hàng hoặc một máy chủ là một mảng khá chuyên biệt trong GVHD: Hoàng Văn Kiếm Trang 19/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học công nghệ thông tin. Và các công cụ để thực hiện việc này không được thiết kế dành cho người dùng ít kinh nghiệm. Áp dụng nguyên tắc thứ 5, lắng nghe những phàn nàn từ người dùng chúng ta có thể thấy còn những điểm sau: 1. Nhiều phương án không chú trọng tính năng tạm dừng truyền tải file và tiếp tục truyền tải khi thuận tiện. A truyền cho B một file khá lớn, giữa chừng A có việc phải đi không thể tiếp tục truyền file, khi A quay lại việc truyền file phải bắt đầu lại từ đầu. Hoặc A và B đang truyền file thì mạng có sự cố, khi sự cố được khắc phục việc truyền file phải bắt đầu lại từ đầu. Người dùng rất khó chịu khi truyền những file lớn bằng các phương án bất ổn như vậy. 2. Nhiều phương án không chú trọng đến việc kiểm tra file đã truyền đi có nguyên vẹn hay không: A send cho B một file video khá lớn, B mở ra xem và thấy có vẻ bình thường. Tuy nhiên, khi xem đến gần cuối video thì phát hiện file bị lỗi và video không hiển thị được phần cuối. Lúc này A đã đi đâu đó và không thể truyền lại tập tin. Mặc dù kết nối internet ngày nay dùng giao thức TCP/IP có khả năng kiểm tra lỗi. Tuy nhiên, với những sự cố phát sinh không phải trong lúc truyền mà trong lúc lưu dữ liệu trên máy hay lúc ngắt rồi tiếp tục quá trình truyền thì giao thức TCP/IP không can thiệp được. 3. Có thể phương án kiểm tra được file truyền đi có lỗi hay không nhưng không có cách sửa lỗi: A truyền cho B một file nén, các chuẩn nén file hiện nay có tích hợp chức năng kiểm tra tính toàn vẹn, nếu file bị lỗi sẽ không giải nén được. Tuy nhiên dù file chỉ bị lỗi nhỏ nhưng B không có cách nào khác ngoài việc báo A truyền lại toàn bộ file. c. Xác định lại vấn đề. Để giải quyết các vướng mắc trên, em quyết định cố gắng tạo ra một chương trình nhỏ gọn, có khả năng send file qua mạng, nhưng hội tụ đầy đủ tính năng cần thiết. Các yêu cầu mà em đặt ra cho chương trình của mình là: 1. Gọn nhẹ, đơn giản, dễ sử dụng. Chương trình sẽ có dung lượng cỡ 1 MB, để thuận lợi trong việc chia sẻ vì trước khi chia sẻ file, người dùng phải GVHD: Hoàng Văn Kiếm Trang 20/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học chia sẻ chính bản thân của chương trình. 2. Có thể send một file cho nhiều người, những người đang nhận file có thể cùng send cho nhau. Ý tưởng từ giao thức truyền dữ liệu bittorrent, tính năng này giúp quá trình chia sẽ dữ liệu sẽ nhanh chóng hơn. Đặc biệt là khi có nhiều người cùng tham gia quá. 3. Có khả năng resume sau khi bị gián đoạn. Tính năng cơ bản nhưng hầu hết nhung chương trình send file thông dụnng thường “quên” đưa vào. Nhờ tính năgn này, công việc chia sẽ trở nên thuận tiện và ngươi dùng có thể chủ động hơn về thời gian, nhất là với file có kích thước lớn 4. Có khả năng kiểm tra tính toàn vẹn của file sau khi send, những phần send sai sẽ bị phát hiện và send lại, không nhất thiết phải send lại toàn bộ file. 5. Hỗ trợ file với kích thước không giới hạn. Chỉ cần .Net framework có thể open file đó chương trình có thể send được, không có giới hạn về dung lượng. GVHD: Hoàng Văn Kiếm Trang 21/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học III. Sáng tạo, phát triển từ những công cụ đã có: Không ai có thể sáng tạo tất cả mọi thứ bắt nguồn từ con số 0 nên việc khắc phục các hạn chế nêu trên cũng phải bắt nguồn từ những phương án, giải pháp, công nghệ, công cụ đã có sẵn. Ở đây phương án được chọn để cải tiến là giao thức chia sẻ file qua mạng ngang hàng bittorrent. Nền tảng công nghệ được sử dụng là Windows và Microsoft .NET Framework. a. Giao thức bittorrent. Bittorrent là một giao thức được dùng để chia sẻ file trên mạng ngang hàng (peer-to-peer), được dùng để chuyển những file và dữ liệu lớn và rất lớn. Được thiết kế và cài đặt bởi Bram Cohen, phiên bản đầu tiên của bittorrent ra mắt vào ngày 2/7/2001 [1], hiện Bitttorrent là một trong những phương thức chia sẻ file phổ biến nhất thế giới. Năm 2002, bittorrent chiếm 35% tổng dung lượng truyền tải trên internet[2]. Torrent hoạt động bằng cách chia file thành nhiều “piece” kích thước mỗi piece dao động từ 256KiB đến 4MiB. Mỗi piece này được đánh số bắt đầu từ 0, SHA-1 Hash của mỗi piece cũng được tính và lưu vào một file siêu dữ liệu với phần đuôi thường là .torrent. Trước khi chia sẻ được dữ liệu thật, người dùng phải tìm cách chia sẻ file siêu dữ liệu này với nhau. Để máy của người dùng (peers) có thể kết nối với nhau, torrent sử dụng một server làm trung gian (tracker), server này không tham gia truyền dữ liệu mà chỉ lưu trữ thông tin về IP và port của những peers đang chia sẻ cùng file torrent đó và gửi thông tin này đến cho các peers. Trong giao thức bittorrent có 8 thông điệp (message) khác nhau, mỗi thông điệp mang một ý nghĩa riêng và không nhất thiết phải đi đồng bộ với nhau. Khi nhận thông điệp, clients có thể trả lời hoặc không, và nếu trả lời cũng không nhất thiết phải theo một quy ước nào. Việc sử dụng 8 thông điệp đó như thế nào là tùy vào clients. Cơ chế thoáng, không gò bó này cho phép mở ra nhiều kỹ thuật nhằm tận dụng hiệu quả giao thức bittorrent. Trong 8 thông điệp đó có 4 thông điệp chính phục vụ cho việc truyền dữ liệu: GVHD: Hoàng Văn Kiếm Trang 22/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Thông điệp Tham số Ý nghĩa 4 – Have Integer Peers vừa download hoàn chỉnh một piece 5 – Bitfield Một dãy bit chiều dài tương ứng số pieces Được send một lần ngay khi 2 peers vừa kết nối. Cho biết peers đang có những pieces nào. 6 – Request 3 số nguyên Yêu cầu dữ liệu từ peers. 3 số nguyên bao gồm:Số_thứ_tự_peice, Vị_trí_Byte_bắt_đầu, Kích_thước_dữ_liệu. 7 – Piece 2 số nguyên + 1 dãy bytes Thông điệp này chứa dữ liệu gửi. Tham số gồm: Số_thứ_tự_peice, Vị_trí_Byte_bắt_đầu, Dữ_liệu Được thiết kế dành riêng cho việc chia sẻ file giữa các máy trạm, có thể nói giao thức bittorrent cung cấp nền tảng cho mọi nhu cầu chía sẻ file. Tuy nhiên, các chương trình sử dụng giao thức bittorrent vẫn còn chịu một số hạn chế đã được nêu. Áp dung nguyên tắc phân nhỏ và tách khỏi ta sẽ lọc ra những phẩm chất cần thiết của giao thức bittorrent đồng thời loại bỏ những phẩm chất tiêu cực như: - Không để người dùng phải tự quản lý các file siêu dữ liệu. Thực tế cho thấy, khúc mắc của những người mới dùng torrent hầu hết là không hiểu được khái niệm và vai trò của file siêu dữ liệu .torrent. Với chương trình của em việc tạo ra file siêu dữ liệu, lưu trữ và send file này giữa các clients là hoàn toàn tự động. Đảm bảo tính thân thiện và dễ sử dụng với người dùng. - Không có tracker. Do chỉ nhằm đáp ứng nhu cầu send file giữa một nhóm người có quen biết trước và số lượng người không đông lắm nên chương trình hoạt động không cần một server lưu thông tin về IP và port, người dùng sẽ tự nhập thông tin này. Chương trình sẽ có chức năng tự động tìm IP đễ hỗ trợ người dùng. - Các thông điệp giờ đây là đồng bộ, không đặt nặng vấn đề “bánh ít đi bánh quy lại” (tick-tack-toe). Trong giao thức torrent có 4 thông điệp để quản lý peers, torrent clients thường chỉ ưu tiên send dữ liệu cho peers nào có dữ liệu để trao đổi với nó. Các peers mới tham gia chia sẻ file, không có tí dữ liệu nào sẽ bị chặn (choke) và được send dữ liệu một cách rất hạn chế. GVHD: Hoàng Văn Kiếm Trang 23/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Do chương trình của em phục vụ việc chia sẻ file giữa bạn bè với nhau nên mọi đối tượng tham gia chia sẻ file đều bình đẳng, khi nhận được thông điệp chương trình sẽ trả lời ngay. b. SHA-1 Hash và file checksum Giải thuật băm (hash) là thuật toán mã hóa, chuyển đổi một khối dữ liệu cho trước thành một đoạn dữ liệu có kích thước cố định gọi là hash value, sao cho với mỗi khối dữ liệu chỉ có thể có một hash value duy nhất. Một thuật toán hash được gọi là có khả năng “chống trùng lặp” (collision resistance)[5] nếu không thể tìm được hai khối dữ liệu khác nhau lại có hash value giống nhau, và khi khối dữ liệu này thay đổi thì hash value cũng sẽ thay đổi. Thực tế rất khó có giải thuật nào đảm bảo 100% khả năng chống trùng lặp, tuy nhiên ta vẫn có thể chấp nhận giải thuật có trùng lặp của nó là thấp. Các giải thuật hash chống trùng lặp được ứng dụng phổ biến vào các chiến thuật checksum, trong đó SHA-1 và MD5 là hai giải thuật hash được biết đến hơn cả. MD5(Message-Digest algorithm 5) được thiết kế bởi Ron Rivest [4] vào năm 1991 để thay thế giải thuật hash MD4, MD5 được ứng dụng vào các phần mềm đảm bảo độ tin cậy khi chuyển file . Năm 1993, Den Boer và Bosselaers đã đưa ra lời cảnh báo về lỗ hổng của giải thuật MD5. Năm 1996, Dobbertin đã tuyên bố về lỗi của MD5 và khuyên mọi người thay thế MD5 bằng SHA-1 hay RIPED-160. Kích thước của hash(128 bit) là khá nhỏ đủ cho các sự tấn công. Tháng 3 năm 2004 một dự án mang tên MD5CRK với mục đích chứng minh MD5 trên thực tế không an toàn bằng việc tìm các lỗi bởi các sự tấn công. Ngày 17 tháng 4 năm 2004, MD5CRK đã được kết thúc, khi mà Xiaoyun Wang, Dengguo Feng, Xuejia Lai, và Hongbo Yu tuyên bố đã tìm được lỗi của MD5. Hiện nay MD5 đã không còn được công nhận là chống trùng lặp, nhưng khả năng của nó vẫn còn đủ để dùng trong việc checksum file và một số ứng dụng cần bảo mật thấp. SHA (Secure Hash Algorithm) được phát triển bởi NSA (National Security Agency) và được xuất bản thành chuẩn của chính phủ Mỹ bởi viện công nghệ và chuẩn quốc gia Mỹ (National Institute of Standards and Technology hay NIST). SHA được chấp nhận bởi FIPS nhờ khả năng chống trùng lặp tốt. SHA có 5 thuật toán khác nhau: SHA-1, SHA-224, SHA-256, SHA-384, SHA-512. Trong đó, SHA-1 được sử dụng rộng rãi trong nhiều ứng dụng và giao thức khác nhau, SHA-1 sẽ cho ra đoạn mã hóa (hash value) có độ dài 160 bit từ một dữ liệu có kích thước tối đa là (2^64 – 1) bit. GVHD: Hoàng Văn Kiếm Trang 24/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học SHA-1 được dùng trong việc checksum dữ liệu, bên gửi khi chuyển dữ liệu cho bên nhận sẽ chuyển kèm hash value của khối dữ liệu, khi đã hoàn tất việc truyền dữ liệu bên nhận sẽ đối chiếu (checksum) hash value nhận được với hash value của dữ liệu vừa nhận, nếu giống nhau thì chứng tỏ dữ liệu đã được truyền chính xác. SHA-1 dựa trên cơ sở MD4 và MD5 của Ron Rivest, nhưng thiết kế phức tạp hơn. Lưu đồ SHA-1: Trước khi bắt đầu tính hash, giá trị hash value ban đầu phải được khởi tạo (số ghi ở dạng thập lục phân) A= 67452301 B= efcdab80 C= 98badcfe D= 10325476 E = c3d2e1f0. 5 giá trị hash value A, B, C, D, E này cuối cùng sẽ được ghép với nhau thành giá trị hash cho dữ liệu. Tuy nhiên, trước đó, dữ liệu sẽ được chia thành những khối 512 bit và được xử lý qua hai bước như hai hình bên dưới hình dưới:fffffff Bước 1: Mỗi khố 512 bit (bao gồm 16 từ, mỗi từ 32bit) sẽ được mở rộng thành 80 từ. GVHD: Hoàng Văn Kiếm Trang 25/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Bước 2: 80 từ đó sẽ XOR và dịch với các hash value A, B, C, D, E. Đây là quy trình tính toán chính của SHA-1 (SHA-1 Compress Function) c. Giao diện người dùng Trong giao diện người dùng của một số chương trình truyền file, giao diện trình GVHD: Hoàng Văn Kiếm Trang 26/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học bài chủ yếu là dạng bảng. Trong đó mỗi file đang được truyền chiếm một dòng, mỗi cột biểudiễn một thông tin trong quá trình truyền (tên file, dung lượng, tốc độ, thời gian, mức độ hoàn thành, v.v....). Cách bố trí giao diện này được hỗ trợ trong hầu hết các công cụ lập trình nhờ ưu thế đơn giản, dễ thiết kế, cho người dùng tầm nhìn bao quát trên toàn bộ các file đang được truyền tải. Tuy nhiên giao diện như vậy có nhược điểm chết người là khi ta điều chỉnh độ rộng một cột nào đó thì tất cả các hàng đều bị ảnh thưởng theo, hơn nữa bảng quá rộng sẽ khiến người dùng khó quan sát. Để khắc phục nhược điểm này ta sẽ áp dụng nguyên tắc tổ hợp. Ta gom nhiều thông tin liên quan đến một quá trình truyền tải vào cùng một mục và xếp chúng lên 2 hàng thay vì 1 như thường thấy. Ví dụ về giao diện truyền file với mỗi file được đặt trên 2 hàng. .Net cho phép tạo một control hòan tòan mới, kết thừa từ control cũ hoặc tạo một control trống rỗng, kế thừa từ class UserControl. Trong tình huống này, em cần một control với giao diện tương tự như danh sách download của các phần mềm firefox[3] và transmission[4]. Ý tưởng ban đầu là tạo một control thừa kế từ control ListView của .NET. Tuy nhiên control này có cấu trúc phức tạp và có nhiều tính năng không cần thiết, hơn nữa yêu cầu lớn nhất đặt ra là mỗi items phải có một thanh progressbar và hiển thị trên nhiều hành thì ListView lại thiếu. Cuối cùng em chọn giải pháp tạo một đối tượng mới hoàn toàn, bao gồm 2 control là ListItems và TheList ListItems bao gồm 1 picture box để, thể hiện icon; 3 label lần lượt cho Tên đối tượng, khối lượng dữ liệu đã gửi/nhận và tốc độ truyền dữ; 1 thanh progressbar. Trong GVHD: Hoàng Văn Kiếm Trang 27/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học các thông số thể hiện của items không thể truy cập vào mà chỉ được thay đổi bằng hàm update. Control TheList bao gồm một danh sách các ListItems ( List) và một thanh scroll bar. TheList có nhiệm vụ chứa các ListItems và hiển thị các ListItems này sao cho các items có màu xen kẽ nhau. Trước khi thực hiện một thay đổi nào đối với items người dùng phải báo hiệu cho TheList bằng cách gọi hàm StartUpdate(), sau khi hoàn tất thay đổi phải gọi hàm EndUpdate() để List vẽ lại các items. Trong khoảng thời gian từ lúc gọi StarUpdate đến lúc gọi EndUpdate, Control List sẽ không được vẽ lại tránh việc phải cập nhật danh sách các đối tượng (ListItems) trong khi chúng đang bị người dùng thay đổi. GVHD: Hoàng Văn Kiếm Trang 28/45 Giao diện chính.i i í . Bộ thư viện lõi t i l i Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học IV. Chi tiết thiết kế, mô tả hoạt động. a. Kết cấu chương trình. Khi người dùng sử dụng chương trình để chia sẻ file, họ được biết đến như một user. Mỗi user được đặc trưng bằng 3 thông số: Alias – bí danh người dùng chọn để miêu tả mình, IP – địa chỉ IP của máy người dùng, Port – port mà từ đó máy khác có thể connect vào máy người dùng. Chương trình quản lý các tác vụ chia sẻ file như là một task. Mỗi task có thể bao gồm nhiều file một danh sách các user cùng tham gia chia sẻ file các file đó (User có thể chọn chỉ tham gia chia sẻ một phần trong số các file của task) Chương trình có thể được chia làm hai thành phần chính, kết nối chặt chẽ với nhau: Phần lõi đảm nhận các công việc xử lý nền, phía sau giao diện chính. Cung cấp các công cụ để quản lý các task, tính toán thông tin cùng những thông tin cần thiết. Quản lý các kết nối đế từ máy khác, từ đó điều phối việc send file. Lưu lại dữ liệu đã nhận cùng với các thông tin mô tả cần thiết để phục hồi quá trình send file khi gặp sự cố. GVHD: Hoàng Văn Kiếm Trang 29/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Giao diện chính: Gồm các form và controls cần thiết để làm nhiệm vụ giao tiếp với người dùng, nhận lệnh và hiển thị thông tin. V. Giao diện chính. Sơ đồ các form trong giao diện. Theo như sơ đồ kết cấu bên trên thì ta thấy được giao diện gồm nhiều form nhỏ. Trong đó form Main là cửa sổ làm việc chính, từ đó người dùng điều khiể và tương tác với chương trình, các form khác sẽ được gọi ra ứng với mỗi tình huống tương ứng. Main Form GVHD: Hoàng Văn Kiếm Trang 30/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học • Thực hiện công việc tự động load các task trong thư mục TaskList, bao gồm cả những cái đã thuc hiện xong và những task còn đang dở dang. • Thiết lập cấu hình mặc định cho chương trình trong lần chạy đầu tiên, lưu các tùy chọn cấu hình của người dùng. • Tự động mở một kết nối lắng nghe trên port do người dùng chọn, sẵn sàng thực hiện việc chia sẻ dữ liệu giữa các máy tính với nhau. Chương trình có khả năng thu gọn xuống system tray GVHD: Hoàng Văn Kiếm Trang 31/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Các button phía dưới thanh toolbar được dùng để lọc (filter) các task dựa theo trạng thái của chúng. Create Task form: Form này cho phép người dùng tạo một task. Form sẽ gọi các hàm tương ứng trong bộ thư viện lõi để tính hash và các thông số cần thiết khác của task. Quá trình tính hash thường chiếm một thời gian tương đối lâu nên chương trình cung cấp khả năng hủy bỏ quá trình hash (tính năng pause quá trình hash không được đưa vào do mức độ cần thiết không cao và để đảm bảo giao diện ). Form Peer Input: GVHD: Hoàng Văn Kiếm Trang 32/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Được dùng nhưng một dialog box đặc biệt, dành riêng cho việc nhập các thông số đặc trưng cho user. Các textbox nhập IP và port đã được thiết kế kỹ để đảm bảo người dùng không thể thông số không hợp lý (dù là cố ý hay vô tình). Detail form Từ form này người dùng có thể xem lại các thông tin liên quan đến task, danh sách các file được chia sẻ và có thể điều chỉnh thêm hoặc bớt user trong danh sách. Option form Đây la nơi chứa các thiết lập của chuong trình, bên trong sẽ bao gồm các tính năng cơ bản nhung sẽ ảnh hưởng đến toàn bộ các hoạt động của chương trình. Request form GVHD: Hoàng Văn Kiếm Trang 33/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Form này chỉ được mở lên khi chương trình nhân được tín hiệu bắt đầu chia sẻ file từ user khác. Người dùng có thể chấp nhận chia sẻ hoặc không, và có quyền lựa chọn file mình sẽ nhận. a. Bộ thư viện lõi. Công cụ tính Hash: .NET hỗ trợ sẵn các hàm cần thiết để tính Md5 và SHA-1 hash trong namespace System.Security.Cryptograph. Tuy nhiên, qua thực tế sử dụng của em, các công cụ có sẵn này không phù hợp với việc tính Hash của một file, nhất là các file có kích thước lớn. Hơn nữa nếu dùng các hàm có sẵn này, không thể biết được quá trình tính hash đã chạy tới đâu và ước lượng thời gian tính toán cần thiết. Vì thế em tự cài đặt các công cụ để tính hash theo hai thuật toán MD5 và SHA-1 đã đề cập trong phần hai. GVHD: Hoàng Văn Kiếm Trang 34/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Interface IHash bao gồm ba phương thức dữ liệu đầu vào được nạp vào bằng hàm input. Hàm result được dùng để báo hiệu việc nhập dữ liệu kết thúc và trả về kết quả tính toán sau cùng. Hai clash MD5 và SHA1 implement Interface này và chứa các hàm cụ thể cho từng thuật toán. Class Task, là đơn vị quản lý các tác vụ send file mà chương trình đang thực hiện thông tin về task được lưu trong đĩa cứng, hiện tại định dạng file được sử dụng là dạng chữ trơn, một file thông tin sẽ có dạng thức như sau: 17/06/2009 1:09:46 SA /* Thời điểm task được tạo ra */ 01/01/0001 12:00:00 SA /* Thời điểm task hoành thành */ </ 3 dòng lưu thông tin về giới hạn tốc độ, hiện chưa cài đặt /> 1 /* Số lượng user tham gia task */ </Thông tin về user, mỗi user 3 dòng theo thứ tự: Alias IP Port /> 1 /* Số lượng file trong task */ </ Thông tin về file, mỗi file gồm Đường dẫn Kích thước Số mảnh Hash của từng mảnh /> /* Dòng cuối cùng: task hash */ GVHD: Hoàng Văn Kiếm Trang 35/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Các file thông tin này được lưu trong thư mục TaskList ở cùng thư mục với file thực thi chương trình. Thời task hoàn thất được để mặc định là ngày 1/1/1 để báo hiệu task chưa hoàn tất. Một task được tạo ngay trên máy (máy bắt đầu tiến hành chia sẻ) sẽ không có ngày hoàn tất. Task Hash được tính bằng cách lấy SHA-1 hash của chính phần hashcode của từng file. Class transmission và class peer, mỗi instance class task sẽ chứa một instance của class transmission, class này có nhiệm vụ quản lý hoạt động chia sẻ dữ liệu của task. Class peers đại diện cho một user khác đang kết nối vào máy. Trong class transmission sẽ có một list các peers hiện đang cùng chia sẻ dữ liệu. Một user nếu tham gia chia sẻ nhiều task sẽ được đại diện bằng nhiều peer trong các class transmission tương ứng. Khi người dùng Start một task, class transmission sẽ tạo ra một thread riêng biệt để chạy hàm private void download() hàm này lặp đến khi người dùng download hoàn chỉnh hoặc người dùng ra lệnh stop. Class peers có nhiệm vụ gửi message đến user và nhận các message từ user gửi đến, một peers có thể có tối đa 4 kết nối, mỗi kết nối có 1 hàm ListenToPeer để nhận các message được gửi đến từ kết nối này, hàm này được chạy trên một thread riêng, khi cả 4 kết nối cùng bị ngắt, peers sẽ bị hủy bỏ. Mối quan hệ giữa hai class trên và class task được được thể hiện bằng sơ đồ dưới đây: b. Cơ chế send file Khi chương trình bắt đầu chạy, form Main sẽ tạo một socket và listen trên port do người dùng chỉ định trong form Options. Các connections do main nhận được sẽ được giao cho các class tương ứng xử lý. Sau khi đã kết nối thành công việc send file sẽ diễn ra theo một giao thức gần tương tự bittorrent. Một file được chia làm nhiều piece - 2MiB, chương trình giữ hash code của từ piece để checksum ngay sau khi nhận dữ liệu. Mỗi piece lại được chia làm nhiều block – 16KiB, đây là đơn vị dữ liệu sẽ được gửi đi. Việc truyền – nhận dữ liệu thực hiện thông qua các message. Peers chỉ trả lời các message khi thật sự cần thiết. GVHD: Hoàng Văn Kiếm Trang 36/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Để cài đặt khả năng resume em dùng cách cơ bản nhất là tạo một file đánh dấu, nội dung file là một chuỗi các số 0,1 mỗi số tương ứng với trạng thái đã nhân, chưa nhận của một block. Mỗi file sẽ được lưu bằng một hàng riêng. Tên message Chú thích Announce Message bắt đầu quá trình chia sẻ file, sau message này sẽ là một chuỗi các message đồng bộ nhau nhằm gửi cho user toàn bộ thông tin về task. Connect Message báo hiệu bắt đầu hay chấp nhận một kết nối. Accept Trả lời cho connect, báo hiệu chấp nhận kết nối. Disconnect Message thông báo hủy bỏ kết nối. Have Peers gửi message này sau khi đã nhận hoàn chỉ một piece hoặc để trả lời cho message Ask Ask Dùng message để hỏi xem peers có một piece nào đó hay không. Nếu có peers sẽ trả lời bằng message have. Request Yêu cầu peers gửi một block xác định nào đó, nếu có peers sẽ trả lời bằng message block Block Gửi dữ liệu của block tới cho peers, dùng để trả lời cho message Request Bảng chú giải các message mà chương trình sử dụng: VI. Một số mẹo dùng trong lúc cài đặt chương trình a. Background Do đặc thù chương trình phải xử lý những công việc việc đòi hỏi nhiều thời gian như tính hash, chờ kết nối v.v… nên việc dùng kỹ thuật đa luồng (multi thread) là bắt buộc đảm bảo khả năng đáp ứng (responsiveness). Và BackgroundWorker là một đối tượng (control) sẵn có của .NET Framework nhằm đơn giản hóa việc lập trình đa luồng. Không như đa số control khác, BackgroundWorker nằm trong namespace System.ComponentModel. Hỗ trợ 3 sự kiện: DoWork, ProgressChage và RunWorkerComplete. BackgroundWorker được điều khiển thông qua các hàm: GVHD: Hoàng Văn Kiếm Trang 37/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học RunWorkAsync() có nhiệm vụ raise event DoWork, eventHandler của DoWork được thực hiện trong một tiến trình khác với tiến trình chạy RunWorkAsync(), sau khi kết thúc DoWork, sự kiện RunWorkerComplete được raise và eventHandler của sự kiện này thực thi thread đang điều khiển BackgroundWorker và thread trước đó được thu hồi. Em thường hay sử dụng chung BackgroundWorker với ProgressBar và timer (xem hình trên), để thể hiện cho người dùng biết được quá trình hoạt động của BackgroundWorker đang làm gì và chừng nào thì kết thúc. Tuy đơn giản hóa công việc lập trình đa luồng đi rất nhiều, nhưng khi sử dụng BackgroundWorker cũng không tránh khỏi một số khó khăn đặc trưng của việc lập trình luồng, sẽ đề cập chi tiết sau. b. Synchronous socket programming Để send dữ liệu qua mạng chúng ta phải quản lý được kết nối giữa hai máy. NET mô hình hóa kết nối này thông qua đối tượng socket. Một socket bao gồm hai IPEndPoint, hai đối tượng IPEndPoint này lần lượt chứa thông tin về IP, port của máy chủ và IP, Port của máy khách – nhưng thành phần đại diện cho một kết nối. Việc gửi và nhận dữ liệu được thực hiện thông qua hai Phương thức có sẵn của socket là Socket.Send() và Socket.Receive() Đối tượng socket trong .NET hỗ trợ nhiều giao thức transport khác nhau như GVHD: Hoàng Văn Kiếm Trang 38/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học TCP, IPX, UDP v.v… Do không có nhiều yêu cầu đặt biệt về giao thức transport nền cho chương trình nên em chọn sử dụng giao thức TCP phổ biến có sẵn khả năng checksum tương đối. Ở đây để đơn giản hóa những công việc liên quan nhiều đến network và kiến thức mạng máy tính. em chọn lập trình socket đồng bộ, tức là mỗi khi gọi phương thức Socket.Send() hoặc Socket.Receive(), chương trình sẽ bị khóa (block) cho đến khi dữ liệu được gửi/nhận thành công. Cách này có thể hạn chế tình trạng máy bị tràn ngập bởi tín hiệu gửi đến từ các máy khác, nhất là trong trường hợp một máy khi chia sẻ file phải kết nối với nhiều máy, mỗi máy lại có nhiều socket khác nhau. Tuy nhiên synchronous socket đôi khi khiến chương trình bị treo, đòi hỏi phải áp dụng thêm kỹ thuật lập trình đa luồng trong việc quản lý và sử dụng các socket này. c. Thread synchronization Việc trang bị khả năng đa luồng cho phép chương trình tận dụng tốt tài nguyên hệ thống, đảm bảo vẫn đáp ứng (responsiveness) ngay cả khi đang phải thực hiện những công việc nặng. Đổi lại, chương trình trở nên cực kỳ phức tạp so với ứng dụng đơn luồng và phát sinh nhiều vấn đề đặt trưng của lập trình đa xử lý. Ngày nay mọi chương trình hầu như đều đa luồng. Một chương trình có dùng window form của .NET chắc chắn là đa luồng, dù người lập trình không có ý định đụng đến đa luồng thì bên dưới những dòng code của người lập trình, bao giờ cũng là những đoạn code có sẵn của thư viện .NET và luôn luôn có luồng chạy song song đảm nhận việc vẽ lại các control. Thế nên việc sử dụng đa luồng khi lập trình ngày nay gần như là bắt buộc. Để một chương trình đa luồng có thể hoạt động suôn sẻ, các luồng này phải được đồng bộ hóa (synchronization) tốt. Đồng bộ hóa là quy tắc đảm bảo các tiến trình này chạy một cách “có tổ chức” và không xung đột với nhau về tài nguyên dùng chung. Đây là một công việc phức tạp, khó có thể lường hết các tình huống có thể xảy ra trên thực tế khi nhiều luồng cùng một lúc tranh giành nhau tài nguyên hệ thống. Và một sơ sẩy của người lập trình có thể dẫn đến hàng loạt vấn đề. Một trong những lỗi mà em thường hay gặp nhất là “Cross-thread operation not valid “ , như trong hình: GVHD: Hoàng Văn Kiếm Trang 39/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Lỗi thường gặp khi lập trình multi thread Lỗi này phát sinh khi một thread thay đổi thuộc tính một control được tạo ra bởi một thread khác. Do control có thể đang được redraw ngay tại thời điểm thread khác truy cập vào nên để đảm bảo nhất quán và tránh xung đột, .NET cấm việc thay đổi controls từ thread khác. Vấn đề này có thể được khắc phục bằng các sử dụng hàng loạt biến trung gian để giao tiếp giữa 2 thread thay vì can thiệp trực tiếp vào control của thread kia hoặc triệt để hơn là sử dụng cơ chế Invoke. Và cuối cùng là vấn đề lớn nhất phải đối mặt khi lập trình đa xử lý: chương trình có thể bị deadlock. Deadlock xảy ra khi một thread hay tiến trình nào đó không thể được kết thúc do nó đang chờ một điều kiện nào đấy từ thread khác, mà điều kiện này không bao giờ xảy ra. Điều này rất dễ gặp phải trong thực tế. Có bốn điều kiện để xảy ra deadlock (Coffman conditions) [6] 1. Tài nguyên không thể được dùng bởi nhiều thread (Mutual Exclusion). 2. Thread đang giữ tài nguyên vẫn cần có thêm một tài nguyên gì khác (Hold and wait). 3. Thread phải tự trả lại tài nguyên dùng chung, không ai có thể giành (No Premption). 4. Ít nhất hai thread hình thành một vòng tròn chờ tài nguyên lẫn nhau (circular wait). Trong trường hợp cụ thể của em, có rất nhiều khả năng có thể gây deadlock GVHD: Hoàng Văn Kiếm Trang 40/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học như: thread A vừa nhận dữ liệu và ghi vào file x, đang chờ truy cập file y từ thread B để hoàn tất. Thread B đang giữ file y, nhưng lại chờ truy cập file x từ A. Điểm đáng sợ của deadlock là nó không thể được khắc phục, chỉ có 2 chiến lược để lựa chọn khi deadlock: Cố tránh deadlock bằng cách đồng bộ hóa các tiến trình tốt hơn và tốt hơn nữa. Hoặc chúng ta phải chấp nhận deadlock, restart chương trình và hy vọng lần sau sẽ không gặp tình huống tương tự. Cách lấy external IP Để thực hiện kết nối, chương trình cần biết đến IP của máy đích, tuy nhiên ngay với hầu hết người hiểu biết về địa chỉ IP còn khá mập mờ. Để tiện sử dụng, chương trình tích hợp khả năng tự xác định địa chỉ IP khi truy cập internet của người dùng và hiển thị nó trong form options. Cần lưu ý rằng chỉ có gateway (thường là router) mà từ đó người dùng truy cập vào internet mới nắm được external IP, và việc truy cập vào gateway để lấy IP không phải lúc nào cũng làm được, mỗi thiết bị có một cách giao tiếp khác nhau hơn nữa cũng có thể máy người dùng không đủ quyền truy cập vào tran cung cấp thông tin của gateway. Để có thể lấy được một external IP trong mọi trường hợp, cách đơn giản nhất là nhờ vào một máy khác trên internet với công năng đặc biệt: Khi chúng ta gửi một gói tin đến máy này, máy này sẽ bóc phần source IP trong gói tin và gửi lại cho ta. Có nhiều trang web thực hiện việc này nhưng hầu hết bị chèn quảng cáo khá rối rắm vì thế, ta sẽ tự tạo ra một trang web chỉ hiển thị duy nhất một thứ là địa chỉ IP của máy vừa truy cập. + Đối với ASP, chỉ cần tạo một trang duy nhất một dòng: + Đối với PHP, : Sau khi tạo ra một trang có nội dung như trên , ta cần upload file lên một host thường trực nào đó. Ở đây địa chỉ em đã thực hiện là: GVHD: Hoàng Văn Kiếm Trang 41/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Dữ liệu trả về sẽ có dạng: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" ""> Untitled Document 118.69.168.69 Nếu ta để ý ở xung quanh IP trên, ta sẽ thấy nó nằm ngay sau chữ và cả chuỗi chỉ có duy nhất một dòng , công việc còn lại chỉ là xử lý chuỗi đơn giản. d. Lấy Icon của file – task Trong ListItem, với mỗi file hay task đều có Icon tương ứng để hiển thị cho file hay task đó. Với các file không thể lấy được Icon thì Icon của file đó sẽ là Icon chung được mặc định sẵn bởi chương trình. .Net cung cấp sẵn công cụ để lấy icon của một file: Namespace: system.Drawing Cú pháp: Icon.ExtractAssociatedIcon public static Icon ExtractAssociatedIcon( string filePath ) Trả về Icon của file được chỉ ra. Tham số cần truyền vào là đường dẫn của file(string filepath). Icon của task sẽ được được đại diện bằng Icon của loại file có tổng dung lượng lớn nhất. Để làm việc này ta dùng phương thức GetIcon được viết trong task.cs. Public string GetIcon() GVHD: Hoàng Văn Kiếm Trang 42/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học Tất cả các file của task sẽ được phân thành từng nhóm, mỗi nhóm tương ứng với một loại của file, và mỗi loại file này có dung lượng bằng tổng dung lượng của tất cả các file có cùng loại, sau đó ta sẽ so sánh dung lượng của các loại file với nhau, kết quả trả về là đường dẫn của 1 file với dung lượng của loại của file đó là lớn nhất. Dựa vào đường dẫn của file này, ta dùng phương thức Icon.ExtractAssociatedIcon để xác định Icon cho task. e. Cách dừng một thread Thread trong .NET hỗ trợ phương thức suspend và resume, tuy nhiên việc dùng hai phương thức này vào xử lý trong thực tế có thể dẫn đến một số bất cập. Ta không thể biết thread đang làm gì lúc nó dừng, nếu thread đang nắm một tài nguyên dùng chung nào đó đột ngột bị dừng, nó có thể khiến các thread khác gặp exception hoặc tệ hơn gây deadlock. Để dừng một thread cách tốt nhất là sử dụng biến dùng chung và thay đổi giá trị biến ấy từ bên ngoài. Khi thread thực hiện công việc nó sẽ định kỳ kiểm tra biến này và dừng khi đến đúng điểm định trước và gặp đúng giá trị thích hợp. Một trong những cách dừng cơ bản nhất là dùng một biến làm cờ và bên trong đoạn code mà thread thực thi, ta đặt tại vị trí thích hợp một vòng lặp, có tác dụng như một bẫy: while (pauseFlag == true) ; Thread sẽ bị mắc bẫy và dừng đến khi nào ta đặt lại giá trị của pauseFlag từ bên ngoài thành false. Ngoài phương pháp thô sơ trên, ta có thể sử dụng cơ chế đồng bộ hóa hỗ trợ sẵn trong .NET để dừng thread: khai báo một biến dùng chung: ManualResetEvent PauseEvent = new ManualResetEvent(true); Bên trong thread, ta lại đặt tại vị trí thích hợp lệnh: ResumeEvent.WaitOne(); Để dừng thread ta dùng: ResumeEvent.Reset(); và ResumeEvent.Set(); để thread tiếp tục thực thi. f. Cách ngăn không cho hệ thống vẽ lại chương trình. Việc vẽ lại các control được thực hiện tự động từ base class, đây là công việc đòi hỏi khá nhiều khả năng xử lý của hệ thống. Chúng ta có thể handle sự kiện OnPaint để xử lý mỗi khi control được vẽ lại nhưng không thể can thiệp vào quá trình GVHD: Hoàng Văn Kiếm Trang 43/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học vẽ này. Tuy nhiên trong một số tình huống đặc biệt, sẽ phát sinh nhu cầu tạm hoãn việc vẽ lại control. Nếu ta sắp thực hiện một loạt thay đổi lớn thì việc vẽ lại control liên tục sẽ tốn rất nhiều tìa nguyên hệ thống, nếu hoãn cơ chế redraw này đến khi tòan bộ thay đổi hoàn tất sẽ hợp lý hơn nhiều. Việc override hàm OnPaint không thể giải quyết được vấn đề, để chặn hệ thống tự vẽ lại chương trình, ta phải gọi hàm API: [DllImport("user32.dll")] public static extern int SendMessage(IntPtr hWnd, Int32 wMsg, bool wParam, Int32 lParam); Để chặn việc vẽ lại chương trình: SendMessage(Parent.Handle, WM_SETREDRAW, false, 0); Để cho phép quá trình vẽ lại bắt đầu: SendMessage(Parent.Handle, WM_SETREDRAW, true, 0); GVHD: Hoàng Văn Kiếm Trang 44/45 Phạm Nguyễn Trường An Phương pháp nghiên cứu khoa học trong tin học D.TÀI LIỆU THAM KHẢO: 1. Cohen, Bram (2001-07-02). "BitTorrent — a new P2P app" 2. 3. Microsoft Developer Network www.msdn.com 4. 5. 6. Giáo sư Coffman, đại học columbia: 7. Slide Phương pháp nghiên cứu khoa học - GS-TSKH Hoàng Văn Kiếm 8. Các thủ thuật sáng tạo cơ bản – Phan Dũng 9. IBM Archives: 1960s - 03.ibm.com/ibm/history/history/year_1964.html GVHD: Hoàng Văn Kiếm Trang 45/45

Các file đính kèm theo tài liệu này:

  • pdfpham_nguyen_truong_an_ch1101062_ppnckhtth_3097.pdf