Đề tài Nghiên cứu công nghệ truyền thoại qua internet sử dụng giao thức tcp/ip (voip)

CHƯƠNG 1 GIAO THỨC TCP/IP 1.1. Một số khái niệm của mạng TCP/IP .2 1.2. Các thành phần vật lý của mạng TCP/IP .3 1.2.1. Các thiết bị tính toán (Computing devices) 3 1.2.2. Đường truyền 3 1.2.3. Các bộ giao tiếp mạng (NIC-Network Interface Card) .3 1.2.4. Bộ tập trung (Hub) 3 1.2.5. Bộ điều chế và giải điều chế (Modem) .4 1.2.6. Bộ chọn đường (Router) 4 1.2.7. Phần mềm mạng 4 1.3. Các giao thức trong TCP/IP 6 1.3.1. Giao thức dòng thời gian thực RTP (Real Time Protocol) 9 1.3.2. Giao thức UDP (User Datagram Protocol) .11 1.3.3. Giao thức điều khiển truyền tin (TCP) .12 1.3.4. Giao thức IP (Internet Protocol) 15 1.3.4.1. Khái quát về giao thức IP .15 1.3.4.2. Tầng giao diện mạng 15 1.3.4.3. Tầng Internet .16 1.3.4.4. Tầng giao vận 16 1.3.4.5. Tầng ứng dụng .16 1.3.4.6. Địa chỉ IP .18 1.4. Tiêu chuẩn H.323 20 1.4.1. Phạm vi của H.323 21 1.4.2. Các dịch vụ H.323 .22 1.4.3. Các kiểu dữ liệu được định nghĩa trong H.323 .22 1.4.4. Các thành phần trong H.323 23 1.5. Quá trình truyền dữ liệu trong TCP/IP 24 CHƯƠNG 2 TỔNG QUAN VỀ VOIP 2.1. Tổng quan về VOIP .27 2.1.1. Giới thiệu chung về VOIP .27 2.1.2. Hoạt động của VOIP .28 2.1.3. So sánh giữa VOIP và mạng chuyển mạch công cộng (PSTN) .32 2.2. Các đặc trưng của VOIP .34 2.3. Hạn chế của việc sử dụng điện thoại VOIP 36 2.4. Ứng dụng của VOIP 37 2.5. Các thành phần trong mạng VOIP .39 2.5.1. Các thiết bị đầu cuối .39 2.5.2. Gateway 40 2.5.3. Gatekeeper 41 2.5.4. Khối điều khiển và xử lý đa điểm (MCU) 42 2.5.5. Các Proxy .42 CHƯƠNG 3 BÁO HIỆU VÀ XỬ LÝ CUỘC GỌI TRONG VOIP 3.1. Giới thiệu chung 43 3.2. Định tuyến kênh điều khiển và báo hiệu cuộc gọi 44 3.2.1. Định tuyến kênh điều khiển cuộc gọi .45 3.2.2. Định tuyến kênh báo hiệu cuộc gọi 46 3.3. Các thủ tục báo hiệu .47 3.3.1. Thiết lập cuộc gọi (Giai đoạn 1) 48 3.3.2. Thiết lập kênh điều khiển (Giai đoạn 2) .51 3.3.3. Thiết lập kênh truyền thông ảo (Giai đoạn 3) .51 3.3.4. Tham số cuộc gọi 52 3.3.4.1. Thay đổi độ rộng băng tần 52 3.3.4.2. Trạng thái 54 3.3.5. Kết thúc cuộc gọi 55 CHƯƠNG 4 VẤN ĐỀ NÉN TÍN HIỆU VÀ GIẢM THIỂU ĐỘ TRỄ TRONG VOIP 4.1. Tổng quát 59 4.2. Các kỹ thuật nén tín hiệu trong VOIP 60 4.2.1. Nguyên lý chung của bộ mã hoá CELP 63 4.2.2. Nguyên lý bộ mã hoá CS-CELP 65 4.2.3. Nguyên lý bộ giải mã CS-CELP 66 4.2.4. Chuẩn nén G.729A 67 4.2.5. Chuẩn nén G.729B 68 4.2.6. Chuẩn nén G.723.1 69 4.2.7. Chuẩn nén GSM 06.10 (Global System for Mobile) .71 4.2.8. Khử tiếng vọng .72 4.3. Trễ và vấn đề giảm thiểu độ trễ 73 4.4. Vấn đề giảm thiểu hoá nguồn trễ 75 4.4.1. Tối thiểu hoá ghi âm bên truyền 75 4.4.2. Tối thiểu hoá trễ Modem .76 4.4.3. Tối thiểu hoá bộ đệm Jitter 76 4.4.4. Trễ đầu cuối đến đầu cuối .77 CHƯƠNG 5 VẤN ĐỀ ĐẢM BẢO CHẤT LƯỢNG DỊCH VỤ. KHẢ NĂNG ÁP DỤNG VOIP Ở VIỆT NAM VÀ TRÊN THẾ GIỚI 5.1. Giới thiệu .78 5.2. Chất lượng dịch vụ (QoS) .79 5.3. Phân cấp chất lượng 80 5.4. Vấn đề đảm bảo chất lượng dịch vụ .81 5.5. Triển khai VOIP ở Việt Nam .82 5.6. Triển khai VOIP trên thế giới 83 ™ Kết luận

pdf95 trang | Chia sẻ: lvcdongnoi | Ngày: 11/06/2013 | Lượt xem: 2131 | Lượt tải: 8download
Bạn đang xem nội dung tài liệu Đề tài Nghiên cứu công nghệ truyền thoại qua internet sử dụng giao thức tcp/ip (voip), để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
mẫu) và gửi đi.Ở nơi thu, quá trình giải mã được thực hiện theo chiều ngược lại để khôi phục tín hiệu tiếng nói. Do quá trình lấy mẫu và lượng tử hoá các mẫu đó theo các mức lượng tử hữu hạn nên sẽ xảy ra sai số lượng tử (quantizise erro), nếu số các mức lượng tử tăng lên thì sai số lượng tử sẽ giảm đi nhưng lại yêu cầu số bit cần thiết để mã hoá các mẫu tăng lên làm cho tốc độ bit tăng lên. Chẳng hạn với 256 mức lượng tử thì cần 8 bit để biểu diễn chúng trong khi với 1024 mức lượng tử thì cần 10n bit để mã hoá. Mã hoá dạng sóng có ưu điểm là bộ mã hoá độc lập với nguồn âm, kỹ thuật mã hoá đơn giản, giá thành thiết kế rẻ, độ trễ và công suất tiêu thụ thấp. Bộ điều chế dạng sóng đơn giản nhất là bộ điều chế xung mã và điều chế Delta. Nhược điểm của mã hoá dạng sóng là không thể giảm được tốc độ xuống thấp, thường chất lượng âm thanh sẽ không cao ở tốc độ 16kbps. ™ Mã hoá theo nguồn âm: Nguyên tắc của các bộ mã hoá theo nguồn âm đó là phân tích các tín hiệu âm thanh sau đó tách ra các thông số đặc trưng của tín hiệu âm thanh, mã hoá các thông số đó và gửi đi, ở nơi thu cũng sử dụng một cơ chế phát âm tương tự, dùng các thông số nhận được để kích thích bộ phát âm, phát lại âm thanh như ở bên gửi. Điển hình của 70 các bộ mã hoá theo nguồn âm là bộ mã hoá dự báo tuyến tính LPC (Linear Prediction Coder). Các bộ mã hoá dạng này có thể thực hiện mã hoá với tốc độ rất thấp, có thể là 2kbps. Nhược điểm chủ yếu của các bộ mã hoá theo nguồn âm là bộ mã hoá phụ thuộc vào nguồn âm phát. Hình dưới thể hiện cơ chế phát âm của các bộ mã hoá theo nguồn âm. ¾ Bộ mã hoá Tiếng nói gốc Bộ tạo tín hiệu kích thích Bộ lọc tổng hợp Cực tiểu hoá sai số Tính trọng số sai số - s*(n) ew(n ) e(n) ¾ Bộ giải mã Trong đó: u(n): tín hiệu kích thích s(n): tín hiệu tiếng nói gốc S*(n): tín hiệu tiếng nói tổng hợp ew(n): tín hiệu sai số • Phần thứ nhất: Bộ lọc tổng hợp LPC là bộ lọc toàn cục biến đổi theo thời gian để mô hình hoá đường bao phổ ngắn hạn của dạng sóng tiếng nói. Đầu ra của bộ lọc tổng hợp là tín hiệu tiếng nói tổng hợp. • Phần thứ hai: Bộ tạo kích thích, bộ này sẽ cho ra dãy kích thích cấp cho bộ lọc tổng hợp để tạo ra tiếng nói tái tạo ở máy thu. Việc kích thích sẽ được tối ưu hoá bằng cách cực tiểu hoá sai lệch, có tính trọng số thụ cảm giữa tiếng nói gốc và tiếng nói tổng hợp. Bộ tạo tín hiệu kích thích Bộ lọc tổng hợp s*(n) U(n) Tiếng nói tổng hợp 71 • Phần thứ ba: Thủ tục được sử dụng trong việc tối thiểu hoá sai lệch gồm hai khối: tính trọng số sai số và cực tiểu hoá sai số. Tiêu chuẩn cực tiểu hoá sai lệch được sử dụng rộng rãi nhất là sai lệch bình phương trung bình. Trong mô hình này, tiêu chuẩn cực tiểu hoá sai số được sử dụng là: tín hiệu sai lệch ew(n) được đưa qua một bộ lọc đánh giá trọng số sai số, có tính trọng số thụ cảm và bộ lọc này sẽ tạo dạng phổ tạp âm theo một cách nào đó để công suất tín hiệu sẽ tập trung nhất tại các tần số formant của phổ tiếng nói. ™ Thủ tục mã hoá: bao gồm hai bước ¾ Bước 1: Thông số của bộ lọc tổng hợp được xác định từ các mẫu tiếng nói. ¾ Bước 2: dãy kích thích tối ưu đối với bộ lọc này được xác định bằng cách cực tiểu hoá, có tính theo trọng số thụ cảm giữa tiếng nói gốc và tiếng nói tổng hợp. Khoảng thời gian tối ưu hoá kích thích khoảng 4 – 7.5ms, thấp hơn khung con, việc kích thích được xác định riêng rẽ cho từng khung con. Các tham số của bộ lọc và tín hiệu kích thích sẽ được lượng tử hoá trước khi gửi đến phía thu. ™ Thủ tục giải mã: Cho tín hiệu kích thích đã được giải mã qua bộ lọc tổng hợp để tạo tiếng nói khôi phục. Có nhiều phương pháp mô hình hoá sự kích thích: phương pháp kích thích đa xung (MPE - Multi Pulse Excite), phương pháp kích thích xung đều RPE, phương pháp dự đoán tuyến tính kích thích mã CELP (Code Excited Linear Prediction). Trong đó phương pháp CELP hiện nay đã trở thành một công nghệ chủ yếu cho mã hoá tiếng nói tốc độ thấp. 4.2.1. Nguyên lý chung của bộ mã hoá CELP Tín hiệu kích thích được phân bố trong một danh sách rất lớn các nguồn âm từ việc thống kê một số lượng rất lớn các giọng nói gồm người già, người trẻ, giọng nam, giọng nữ được phân bố một cách ngẫu nhiên. Tại phía phát, nguồn kích thích được lần lượt so sánh với các nguồn được lấy từ trong bảng mẫu để xác định nguồn nào là phù hợp nhất, sau đó thông số về vị trí của nguồn trong bảng mẫu sẽ được mã hoá và gửi đi. Đến nơi thu sử dụng các thông số này để kích thích nguồn mẫu có cùng thứ tự trong một bảng các nguồn mẫu y hệt bên phát nhằm khôi phục tiếng nói. Phương pháp này tương tự như việc duyệt qua một cuốn từ điển nên yêu cầu các bộ vi xử lý rất mạnh. Co một 72 phương pháp được sử dụng để giảm công việc tính toán xuống, đó là phương pháp sử dụng các bảng mã đại số ACELP (Algebraic CELP) trong đó các bảng mã được tạo ra nhờ các mã sửa lỗi nhị phân đặc biệt. Để nâng cao hiệu quả rà soát bảng mã, người ta sử dụng các bảng mã đại số có cấu trúc liên kết CS – ACELP (Conjugate Structure ACELP). Đó là nguyên tắc của khuyến nghị G729. Khuếch đại Khuếch đại u(n) + Bộ lọc tổng hợp Trễ khung con Tiếng nói tổng hợp s*(n) Hình 4.1. Sơ đồ nguyên lý phương pháp tổng hợp CELP 73 4.2.2. Nguyên lý bộ mã hoá CS – ACELP Sơ đồ khối bộ mã hoá được mô tả: Khèi tiÒn xö lý Khèi tæng hîp LP sù l−îng tö ho¸ vµ néi suy Bé läc tæng hîp ++ B¶ng m· thÝch øng B¶ng m· cè ®Þnh Bé läc tæng hîp ®é cao T×m b¶ng m· cè ®Þnh §é c¶m nhËn Sù l−îng tö ho¸ ®é khuÕch ®¹i Sù l−îng tö ho¸ ®é khuÕch ®¹i luång bit ph¸t ®i LPC info LPC info tiÕng nãi ®Çu vµo LPC info Gc Gp Hình 4.2. Sơ đồ khối Bộ mã hoá Tín hiệu đầu vào đưa qua bộ tiền xử lý ,bộ này có hai chức năng: lọc thông cao và tính toán tín hiệu. Tín hiệu đầu ra bộ tiền xử lý là tín hiệu đầu vào của các khối tổng hợp tiếp sau. Sự tổng hợp dự báo tuyến tính (LP)được thực hiện một lần trong một khung 10ms để tính các hệ số của bộ lọc dự báo tuyến tính (LP). Các hệ số này được biến đổi thành các cặp vạch phổ (LSP) và được lượng tử bằng phương pháp lượng tử hoá véctơ dự báo hai bước (VQ) 8 bit. Tín hiệu kích thích được lựa chọn bằng cách cực tiểu hoá sai số, có tính đến trọng số thụ cảm, giữa tiếng nói gốc và tiếng nói tổng hợp. Các tham số kích thích (gồm :bảng mã cố định và bảng mã thích ứng) được xác dịnh qua từng khung con 5ms (tương đương 40mẫu). Các hệ số của bộ lọc LP đã được lượng tử và chưa được lượng tử được sử dụng cho phân khung thứ 2, còn tại phân khung thứ nhất các hệ số của bộ lọc LP đã được nội suy sẽ được sử dụng (trong cả hai trường hợp đã lượng tử và chưa lượng tử). Độ trễ bước mạch vòng hở sẽ được tính toán một lần trong một khung 10ms dựa trên độ lớn tín hiệu thoại. Sau đó các phép tính này sẽ lặp lại trong từng phân khung tiếp theo. Tín hiệu ban đầu x(n) được tính bằng các lọc độ dư LP thông qua bộ lọc tổng hợp W(z)/A(z). Trạng thái ban đầu của bộ lọc này là tín hiệu lỗi giữa tín hiêu dư LP và tín hiệu 74 kích thích. Sự phân tích bước của mạch vòng đóng sẽ thực hiện sau đó (để tìm độ trễ mã thích ứng và độ khuếch đại) dùng tín hiệu ban đầu x(n) và đặc tuyến xung h(n), bằng cách làm tròn giá trị độ trễ bước của mạch vòng hở. Độ trễ bước được mã hoá bằng mã 8 bit trong phân khung thứ nhất, độ vi sai của độ trễ được mã hoá bằng mã 5 bit trong phân khung thứ 2. Tín hiệu x’(n) là tín hiệu của 2 tín hiệu: tín hiệu ban đầu x(n) và tín hiệu mã thích ứng - là tín hiệu mã cố định. Tín hiệu này được dùng trong việc tìm tín hiệu kích thích tối ưu. Giá trị kích thích mã cố định được mã hoá bằng mã đại số 17 bit (trong đó: chỉ số bảng mã cố định được mã hoá bằng từ mã C1, C2-13 bit. Dấu bảng mã cố định được mã hoá bằng từ mã S1, S2-3bit). Các bộ khuếch đại bảng mã cố định và bảng mã thích ứng được lượng tử hoá bằng véc tơ 7 bit (Trong đó:ở bước 1 được mã hoá bằng từ mã GA1,GA2 -3 bit. Ở bước 2 được mã hoá bằng từ mã GB1, GB2-4 bit ). Tại đây sự dự đoán trung bình động MA cho bộ khuếch đại mã cố định. Cuối cùng, dựa vào các bộ nhớ lọc sẽ xác định được tín hiệu kích thích. 4.2.3 Nguyên lý bộ giải mã CS-ACELP. Sơ đồ khối của bộ giải mã được mô tả trong hình 2.4 B¶ng m· cè ®Þnh B¶ng m· thÝch øng Bé läc ng¾n h¹n bé xö lý tr¹m Gc Gp Hình 4.3. Sơ đồ nguyên lý của bộ giải mã CS-ACELP Đầu tiên, các chỉ số của các tham số được trích ra từ buồng bit thu. Các chỉ số này sẽ được giải mã để thu lại các tham số của bộ mã hoá trong 1 khung tiếng nói 10 ms. Các tham số đó là: các hệ số LSP, 2 phần độ trễ bước (độ trễ bước và độ vi sai của độ trễ bước), 2 vec tơ bảng mã cố định (chỉ số mã cố định và chỉ số bảng mã cố định ) và 2 tập hợp độ khuếch đại bảng mã cố định và bảng mã thích ứng. Các hệ số LSP được nội suy và được chuyển đổi thành các hệ số bộ lọc LP cho mỗi phân khung. Sau đó, cứ mỗi phân khung thực hiện các bước tiếp theo. 75 Giá trị kích thích được khôi phục là tổng của véc tơ bảng mã cố định và bảng mã thích ứng nhân với các giá trị khuếch đại tương ứng của chúng.Tiếng nói được khôi phục bằng cách lọc giá trị kích thích này thông qua bộ lọc tổng hợp LP. Tín hiệu tiếng nói khôi phục đưa qua bước xử lý trạm, bao gồm bộ lọc thích ứng dựa trên cơ sở các bộ lọc tổng hợp ngắn hạn và dài hạn, sau đó qua bộ lọc thông cao và bộ nâng tín hiệu. 4.2.4. Chuẩn nén G.729A. G729A là thuật toán mã hoá tiếng nói tiêu chuẩn cho thoại và số liệu đồng thời số hoá (DSVD). G.729A là sự trao đổi luồng bit với G.729, có nghĩa là tín hiệu được mã hoá bằng thuật toán G.729A có thể được giải mã thông qua thuật toán G.729 và ngược lại. Giống như G.729, nó sử dụng thuật toán dự báo tuyến tính mã kích thích đại số được cấu trúc liên kết (CS-ACELP) với các khung 10ms. Tuy nhiên một vài thuật toán thay đổi sẽ được giới thiệu mà kết quả của các thuật toán này làm giảm 50% độ phức tạp. Nguyên lý chung của bộ mã hoá và giải mã của thuật toán G.729A giống với G.729. Các thủ tục lượng tử hoá và phân tích LP của các độ khuyếch đại bảng mã cố định và thích ứng giống như G.729. Các thay đổi thuật toán chính so với G.729 sẽ tổng kết như sau: Bộ lọc trọng số thụ cảm sử dụng các tham số bộ lọc LP đã lượng tử và được biểu diễn là: W(z) = )/( )( γzA zA với γ =0,75 Các tính toán phản ứng xung của bộ lọc tổng hợp trọng số W(z)/A(z) của tín hiệu ban đầu và việc thiết lập trạng thái ban đầu của bộ lọc được đơn giản hoá bằng cách thay thế: W(z) = 56 )/( 1 yzA Việc tìm bảng mã thích ứng được đơn giản hoá. Thay vì tìm tập trung ở mạch vòng tổ ong, giải pháp tìm sơ đồ hình cây độ sâu trước được sử dụng. Tại bộ giải mã, hoạ ba của bộ lọc sau sẽ được đơn giản bằng cách sử dụng chỉ các độ trễ nguyên. 76 4.2.5. Chuẩn nén G.729B G.729B đưa ra một nguyên lý nén im lặng tốc độ bit thấp được thiết kế và tối ưu hoá để làm việc trung được với cả G.729 và G.729A phức tạp thấp. Để đạt được việc nén im lặng tốc độ bit thấp chất lượng tốt, một môđun bộ dò hoạt động thoại khung cơ bản là yếu tố cần thiết để dò các khung thoại không tích cực, gọi là các khung tạp âm nền hoặc khung im lặng. Đối với các khung thoại không tích cực đã dò được này, mộtmô đun truyền gián đoạn do sự thay đổi theo thời gian của đặc tính tín hiệu thoại không tích cực và quyết định xem có một khung mô tả thông tin im lặng mới không có thể được gửi đi để duy trì chất lượng tái tạo của tạp âm nền tại đầu cuối thu. Nếu có một khung như thế được yêu cầu, các tham số năng lượng và phổ mô tả các đặc tính cảm nhận được của tạp âm nền được mã hoá và truyền đi một cách hiệu quả dùng khung 15 bit/khung. Tại đầu cuối thu, môđun tạo ra âm phù hợp sẽ tạo tạp âm nền đầu ra sử dụng tham số cập nhật đã phát hoặc các tham số đã có trước đó. Tạp âm nền tổng hợp đạt được bằng cách lọc dự báo tuyến tính tín hiệu kích thích giả trắng được tạo ra trong nội bộ của mức điều khiển. Phương pháp mã hoá tạp âm nền tiết kiệm tốc độ bit cho tiếng nói mã hoá tại tốc độ bit trung bình thấp 4kbps trong cuộc đàm thoại tiếng nói bình thường để duy trì chất lượng tái tạo. Đối với các ứng dụng DSVD (Digital Simultaneous Voice and Data: thoại và số liệu đồng thời số hoá) và độ nhạy tốc độ bit khác, G729B là điều kiện tối cần thiết để giảm tốc độ bit hơn nữa bằng cách sử dụng công nghệ nén im lặng. Khi không có tiếng nói, tốc độ bit có thể giảm, giải phóng dung lượng kênh cho các ứng dụng xảy ra đồng thời, ví dụ như các đường truyền tiếng khác trong điện thoại tế bào đa truy nhập phân kênh theo mã theo thời gian (TDMA/CDMA) hoặc truyền số liệu đồng thời. Một phần đáng kể trong các cuộc đàm thoại thông thường là im lặng, trung bình lên tới 60% của một cuộc đàm thoại hai chiều. Trong suốt quá trình im lặng, thiết bị đầu vào tiếng ví dụ như tai nghe, sẽ thu thông tin từ môi trường ồn. Mức và đặc tính ồn có thể thay đổi đáng kể, từ một phòng im lặng tới đường phố ồn ào hoặc từ một chiếc xe ô tô chuyển bánh nhanh. Tuy nhiên, hầu hết các nguồn tạp âm thường mang ít thông tin hơn thông tin tiếng. Vì vậy trong các chu kỳ không tích cực tỷ số nén sẽ cao hơn. Nhiều ứng dụng điển hình, ví dụ hệ thống toàn cầu đối với điện thoại di động GSM, sử dụng việc dò tìm chu kỳ im lặng và chèn tạp âm phù hợp để tạo được hiệu quả mã hoá cao hơn. 77 Xuất phát từ quan niệm về dò tìm im lặng và chèn tạp âm phù hợp dẫn tới các công nghệ mã hoá tiếng mẫu kép. Các mẫu khác nhau bởi tín hiệu đầu vào, được biểu thị là: thoại tích cực đối với tiếng nói và là thoại không tích cực đối với im lặng hoặc tạp âm nền, được xác định bởi sự phân loại tín hiệu. Sự phân loại này có thể được thực hiện bên trong hoặc bên ngoài bộ mã hoá tiếng nói. Bộ mã hoá tiếng toàn tốc có thể có tác dụng trong quá trình tiếng thoại tích cực, nhưng có một nguyên lý mã hoá khác được dùng đối với tín hiệu thoại không tích cực, sử dụng bit ít hơn và tạo ra tỷ số nén trung bình cao hơn. Sự phân loại này được gọi chung là bộ dò hoạt động thoại (VAD: Voice Activity Detector) và đầu ra của bộ này gọi là mức hoạt động thoại. Mức hoạt động thoại là 1 khi có mặt hoạt động thoại và là 0 khi không có hoạt động thoại. Thuật toán VAD và bộ mã hoá tiếng nói không tích cực, giống với các bộ mã hoá G.729 và G.729A, được thực hiện trên các khung của tiếng nói đã được số hoá. Để phù hợp, kích thước các khung giống nhau được dùng cho mọi sơ đồ và không có độ trễ thêm vào nào được tạo ra bởi thuật toán VAD hoặc bộ mã hoá thoại không tích cực. Đầu vào bộ mã hoá tiếng nói là tín hiệu tiếng nói đến đã được số hoá. Với mỗi khung tiếng nói đầu vào, VAD đưa ra mức hoạt động thoại, mức này được dùng như một chuyển mạch giữa các bộ mã hoá thoại tích cực và thoại không tích cực. Khi bộ mã hoá thoại tích cực có tác dụng, luồng bit thoại tích cực sẽ gửi tới bộ giải mã tích cực cho mỗi khung. Tuy nhiên, trong các chu kỳ không tích cực, bộ mã hoá thoại không tích cực có thể được chọn để gửi các thông tin mới nhất gọi là bộ mô tả việc chèn im lặng (SID: Silence Insertion Descriptor) tới bộ giải mã không tích cực hoặc không gửi gì cả. Kỹ thuật này có tên là truyền gián đoạn (DTX: Discontinuous Transmission). Với mỗi khung, đầu ra của mỗi bộ giải mã được dùng làm tín hiệu khôi phục. 4.2.6. Chuẩn nén G.723.1 Khuyến nghị G.723.1 đưa ra một bộ mã hoá tiêu chuẩn dùng để nén tín hiệu tiếng nói hoặc các tín hiệu audio khác của các dịch vụ đa phương tiện tại tốc độ rất thấp, giống với phần tiêu chuẩn của họ H.323. Về tốc độ bit: Bộ mã hoá này có hai tốc độ bit: 5,3 kbps và 6,3 kbps. Bộ mã hoá có tốc độ cao hơn sẽ có chất lượng tốt và, cộng thêm tính linh hoạt, cung cấp cho các nhà thiết kế hệ thống. Bộ mã hóa và giải mã bắt buộc phải có cả hai tốc độ bit này. Chúng có thể chuyển mạch được giữa hai tốc độ bit tại bất kỳ đường biên giới nào đó của khung. Khi tín hiệu là phi thoại thì có thể 78 lựa chọn một tốc độ bit biến thiên để truyền không liên tục và điều khiển những khoảng trống. Tín hiệu đầu vào có thể có của bộ mã hoá này tối ưu hoá tín hiệu tiếng nói với chất lượng cao tại các tốc độ bit đã nói ở trên với một độ hạn chế về độ phức tạp. Bộ mã hoá này dùng để mã hoá tiếng nói và các tín hiệu audio khác với các khung dùng kỹ thuật mã hoá phân tích bằng tổng hợp dự báo tuyến tính. Tín hiệu kích thích, đối với bộ mã hoá tốc độ bit cao hơn, là lượng tử hoá đúng cực đại đa xung (MP-MLQ: Multipulse Maximum Likelihood Quantilization) và đối với bộ mã hoá có tốc độ bit thấp hơn, là dự đoán tuyến tính kích thích mã đại số (ACELP). Kích thích khung là 30ms, cộng thêm 7,5ms look-ahead, tạo ra trễ xử lý thuật toán tổng cộng là 37,5ms. Toàn bộ trễ thêm vào bộ mã hoá là tổng của: Trễ xử lý, trễ truyền dẫn trên các đường truyền thông tin và trễ đệm của các giao thức ghép kênh. ™ Nguyên lý bộ mã hoá G.723.1 Tín hiệu PCM 64kbps đầu vào (theo luật A hoặc µ) qua bộ mã hoá này được lấy mẫu tại tần số 8kHz, sau đó qua bộ chuyển đổi thành tín hiệu PCM đều 16 bit đưa tới đầu vào bộ mã hoá. Tín hiệu đầu ra bộ giải mã sẽ được chuyển đổi thành tín hiệu PCM theo đúng tín hiệu đầu vào. Các đặc tính đầu vào/ đầu ra khác, giống như của tín hiệu PCM 64kbps (theo khuyến nghị ITU G.711), sẽ được chuyển đổi thành tín hiệu PCM đều 16 bit tại đầu vào bộ mã hoá, hoặc tín hiệu PCM đều 16 bit sẽ được chuyển đổi thành tín hiệu ra PCM theo đúng quy luật của tín hiệu đầu vào ở bộ giải mã. Bộ mã hoá dựa trên nguyên lý bộ mã hoá phân tích bằng tổng hợp dự báo tuyến tính và cố gắng cực tiểu hóa sai số có tính trọng số thụ cảm. Bộ mã hoá thực hiện theo từng khung 240 mẫu. Điều này tương đương với chu kỳ khung là 30ms và tần số lấy mẫu là 8kHz. Tại mỗi khối, đầu tiên tín hiệu được đưa qua bộ lọc thông cao để loại bỏ thành phần tín hiệu một chiều DC và sau đó được chia thành 4 khung con. Với mỗi khung con sử dụng tín hiệu đầu vào chưa xử lý để tính toán bộ lọc mã hoá dự báo tuyến tính bậc 10 (LPC). Bộ lọc LPC của khung con cuối cùng sẽ được lượng tử hoá bằng phương pháp lượng tử hoá vectơ phân chia dự báo (PSVQ: Predictive Split Vector Quantizer). Các hệ số LPC chưa được lượng tử sẽ được dùng để khôi phục bộ lọc trọng số thụ cảm ngắn hạn. Với mỗi hai phân khung (120) mẫu, sẽ sử dụng tín hiệu tiếng nói trọng số để tính toán chu kỳ lên giọng tiếng nói mạch vòng kín, LOL. Chu kỳ lên giọng tiếng nói được tính trong khoảng từ 18 đến 142 mẫu. 79 Sau đó tín hiệu tiếng nói sẽ được xử lý theo từng phân khung cơ bản 60 mẫu. Sử dụng đánh giá chu kỳ lên giọng tiếng nói trước để khôi phục bộ lọc dạng ồn sóng hài. Phản ứng xung được tạo bởi việc đấu nối bộ lọc tổng hợp LPC, bộ lọc có tính trọng số thụ cảm formant và bộ lọc dạng tạp âm sóng hài. Người ta sử dụng phản ứng xung này cho các phép tính toán tiếp sau. Bộ dự đoán chu kỳ lên giọng mạch vòng kín được tính toán bằng cách sử dụng đánh giá chu kỳ lên giọng, LOL và phản ứng xung. Người ta sử dụng bộ dự đoán lên giọng bậc 5. Chu kỳ lên giọng sẽ được tính là gần đúng giá trị vi sai nhỏ của đánh giá lên giọng mạch vòng hở. Thành phần thêm vào bộ dự đoán lên giọng sau đó sẽ được loại bỏ khỏi vectơ ban đầu. Cả hai giá trị chu kỳ lên giọng và giá trị vi sai của nó sẽ được truyền về phía bộ giải mã. Cuối cùng, các thành phần không được dự đoán của tín hiệu kích thích sẽ được lấy gần đúng. Đối với bộ mã hoá có tốc độ bít cao, người ta sử dụng giá trị kích thích lượng tử hoá gần đúng cực đại đa xung (MP-MLQ) và đối với bộ mã hoá có tốc độ bit thấp, người ta sử dụng giá trị kích thích mã đại số (ACELP). ™ Nguyên lý bộ giải mã G.723.1 Bộ giải mã được thực hiện trên nguyên lý cơ bản từng khung. Đầu tiên các chỉ số của bộ lọc LPC sẽ được giải mã, sau đó bộ giải mã sẽ khôi phục bộ lọc tổng hợp LPC. Đối với mỗi phân khung, cả hai giá trị kích thích bản mã cố định và giá trị kích thích bảng mã thích ứng sẽ được giải mã và đưa tới đầu vào bộ lọc tổng hợp LPC. Bộ lọc sau thích ứng bao gồm formant và bộ lọc sau lên giọng phía sau-phía trước (forward-backward). Tín hiệu kích thích sẽ được đưa tới đầu vào bộ lọc sau lên giọng, đầu ra bộ lọc sau lên giọng được đưa tới đầu vào bộ lọc tổng hợp, và đầu ra bộ lọc tổng hợp sẽ được đưa tới đầu vào bộ lọc sau formant (formant posfilter). 4.4.7. Chuẩn nén GSM 06.10 ( Global System for Mobile ) Đầu vào bộ nén GSM 06.10 bao gồm các khung 160 mẫu các tín hiệu PCM tuyến tính lấy mẫu tại tần số 8kHz. Chu kỳ mỗi khung là 20 ms, khoảng một chu kỳ thanh môn đối với những người có giọng nói cực thấp, và khoảng mười chu kỳ thanh môn đối với những người có giọng nói cực cao. Đây là khoảng thời gian rất ngắn và trong khoảng này sóng tiếng nói thay đổi không nhiều lắm. Độ trễ truyền dẫn thông tin được tính bằng tổng thời gian xử lý và kích thước khung của thuật toán. 80 Bộ mã hoá thực hiện nén một khung tín hiệu đầu vào 160 mẫu (20ms) vào một khung 260 bit. Như vậy một giây nó sẽ thực hiện nén được 13.103 bit (tương đương với 1625 byte). Do vậy để nén một megabyte tín hiệu chỉ cần một thời gian chưa đầy 10 phút. Trung tâm của quá trình xử lý tín hiệu là bộ lọc. Đầu ra bộ lọc phụ thuộc rất nhiều vào giá trị đầu vào đơn của nó. Khi có một dãy các giá trị đưa qua bộ lọc thì dãy tín hiệu này sẽ được dùng để kích thích bộ lọc. Dạng của bộ nén GSM 06.10 dùng để nén tín hiệu tiếng nói bao gồm hai bộ lọc và một giá trị kích thích ban đầu. Bộ lọc ngắn hạn dự báo tuyến tính, được đặt tại tầng đầu tiên của quá trình nén và tại tầng cuối cùng trong suốt quá trình giãn, được giả sử tuân theo quy luật âm thanh của mũi và cơ quan phát thanh. Nó được kích thích bởi đầu ra của bộ lọc dự báo dài hạn (LTP: long-term predictor). 4.4.8. Khử tiếng vọng Trong mạng IP đường truyền tiếng vọng là đường tròn (round –trip) và tạo ra do mạch hybrid (chuyển 2 dây-4 dây) ,mặt khác tín hiệu sẽ tích luỹ qua các quá trình xử lý (mã hóa và giải mã ,đóng gói và giải đó gói ) và truyền dẫn tín hiệu. Vì vậy tiếng vọng là một trong những yếu tố chủ yếu ảnh hưởng đến chất lượng cuộc thoại trên mạng Internet . Thông thường việc khử tiếng vọng được thực hiện trong các Gateway và khối này tuân theo các khuyến nghị G.165 và G.167. Hình 1.3 sau đây mô tả đường truyền của tín hiệu trên đó có các mạch triệt tiếng vọng. Hình 4.4: Mạch triệt tiếng vọng E cho C anceller Speech Decoding Packe t Buffer Speech Encoding E cho C anceler Speech Decoding Packe t Buffer Speech Encoding Echo - + Echo- + P ac ke t T ra ns m is si on TelephoneTelephone 81 4.3. Trễ và vấn đề giảm thiểu độ trễ trong toàn bộ quá trình xử lý gói tin trong VOIP Thứ Loại trễ ‰ Các nguồn của trễ Về cơ bản, có 10 bước có thể gây ra trễ theo thứ tự xuất hiện của chúng theo thời gian được liệt kê trong bảng sau: tự 1 Trễ ghi âm bên truyền ( Transmitter Recording ) 2 Trễ mã hoá ( Encode ) 3 Trễ nén ( Compresion ) 4 Trễ bộ đệm Modem ( Transmitter Modem ) 5 Trễ Internet 6 Trễ bộ đệm nhận ( Receiver buffer ) 7 Trễ Jitter ( Jitter buffer ) 8 Trễ giải nén ( Decompression ) 9 Trễ giải mã ( Decode ) 10 Trễ phát lại ( Playback ) ™ Trễ ghi âm bên truyền: oàn bộ quá trình gửi thoại qua Internet. Không iống : hoảng 15 - 30m. Đó là bởi vì dữ liệu tiếng nói thường Đây là trễ đầu tiên trong t g trong mạng PSTN, trong đó tín hiệu thoại gần như tức thời vì các gói không cần phải định dạng, trong VOIP, các gói tin phải được xử lý rất cẩn thận trước khi chúng được truyền trên Internet. Hệ thống phải ghi âm một số lượng tín hiệu nào đó trước khi có thể bắt đầu làm mọi việc khác. Điều kiện lý tưởng khi mà số liệu ngay lập tức được xử lý, tuy nhiên việc này gây ra nhiều phiền toái, trễ này thường cỡ 20ms. Chúng tồn tại trực tiếp trong cấu hình PC - PC và tồn tại ở các Gateway khi chuyển đổi từ mạng PSTN sang mạng IP trong cấu hình PC - Phone. ™ Trễ mã hoá Trễ mã hoá k chiếm một không gian dung lượng và giải thông cần thiết rất lớn. Do đó, chúng cần phải được nén lại trước khi truyền. Thực tế, tuy có các phần mềm khá tinh xảo hiện nay nhằm hạn chế tối đa sự trễ này nhưng thế hệ các PC và các hệ điều hành hiện nay được thiết kế không phải cho mục đích xử lý tiếng nói. 82 Trong vài năm tới, chúng ta hy vọng sẽ có các bộ vi xử lý riêng phục vụ cho các ứng dụng này một cách chuyên nghiệp hơn. ™ Trễ do bộ vi xử lý và do quá trình đóng gói các số liệu: à rất nhỏ (bit) với n trên Internet, chúng cũng không thể ngay cơ sở hạ tầng của mạng Internet hiện nay được sử dụng Các chip vi xử lý có đơn vị dữ liệu có thể hiểu và xử lý l so các mãu thoại (byte). Trong khi các mẫu thoại được chia thành các mẫu chiếm khá nhiều dung lượng, các bộ vi xử lý này không thể tính toán một cách tức thì, bộ vi xử lý càng nhanh thì độ trễ tính toán do chúng gây ra càng nhỏ. Hơn nữa, trong bước này số liệu tiếng nói phải được tạo khuôn dạng để có thể truyền đi được trên Internet gọi là quá trình đóng gói dữ liệu. Các dữ liệu phải được sắp xếp, đóng khung, thêm phần tiêu đề như địa chỉ đích, địa chỉ nguồn, các thông số đường truyền và định tuyến ... Các bước này cũng gây ra trễ. ™ Trễ do Modem bên truyền: Khi dữ liệu đã sẵn sàng truyề lập tức truyền trên mạng được, vì nó còn phụ thuộc vào tốc độ đường truyền. Tuy nhiên, các tín hiệu mà máy tính hiểu được là khác với các tín hiệu được truyền trên mạng điện thoại. Các máy tính hiểu và xử lý tín hiệu số trong khi mạng điện thoại lại chỉ cho phép truyền các tín hiệu tương tự trên nó. Do đó cần có một thiết bị chuyển đổi từ các tín hiệu số sang dạng tương từ, đó chính là Modem (MOdulation - DEModulation). Trong giai đoạn này, modem cũng cần thực hiện các tính toán để các tín hiệu số có thể được chuyển dổi thành dạng tương tự theo các quy tắc nhất định, như việc điều chế theo luật gì, ghép kênh ra sao ... Các quá trình này cũng gây ra trễ, gọi là trễ Modem. Mặc dù các trễ này khá thấp nhưng chúng cũng góp phần vào tổng độ trễ chung toàn hệ thống. Hơn nữa, các trễ này không chỉ xảy ra một lần mà còn xảy ra tới bốn lần trong một kết nối hai chiều ( 2 lần đi và lần về ). Tất nhiên, trễ modem chỉ tồn tại trong các cấu hình có sự tham gia của PC, vì trong các cấu hình trực tiếp với điện thoại là đầu cuối thì không cần modem vì chúng có thể được kết nối trực tiếp vào đường điện thoại và do đó không có trễ. Trễ modem xảy ra ở bước này gọi là trễ modem bên truyền để phân biệt với trễ modem bên nhận sau này. ™ Trễ Internet: Trễ Internet do cho tất cả các loại hình dịch vụ trên cơ sở IP chứ không riêng cho thoại. Các ứng dụng khác như email, Web, FTP ... cùng chia sẻ băng thông của mạng, làm cho việc truyền các gói tin trở nên chậm chạp. Trong một mạng cơ sở hạ tầng tốt thì trễ này sẽ giảm đi đáng kể vì nó gây ra khả năng sai lỗi ít, tốc độ truyền 83 nhanh hơn, ít khả năng yêu cầu phát lại gói tin. hơn nữa trễ này còn gây ra một vấn đề rất đặc trưng trong mạng VOIP, đó là Jitter. ™ Trễ bộ đệm Jitter: m để chỉ sự đến cách nhau không đồng đều về mặt ời gi Khi dữ liệu đến bên nhận, nó phải được c giải nén và mã hoá để tái tạo lại tín hiệu ™ ận được dưới dạng số hoá cần phải được chuyển đổi thành ạng t rong các nguyên nhân gây trễ trên ta đã giả thiết nghiên cứu một cách ng q rên Internet, chúng cần được chặt ra itter là một khái niệ th an của các gói tin IP. Đối với các ứng dụng khác thì việc các gói tin đến không đều nhau thực sự không gây ảnh hưởng nhiều đến chất lượng dịch vụ vì việc này chỉ gây ra sự chậm trễ trong việc sắp xếp lại gói tin, xử lý gói tin. Nhưng trong VOIP, vấn đề thời gian thực sự được quan tâm hàng đầu. Các gói tin được định tuyến theo các con đường khác nhau để đến đích, do đó không có gì đảm bảo chúng đến đều nhau. Để giải quyết vấn đề này cần sử dụng bộ đệm ( Jitter buffer ). Do đó đây cũng là một nguồn trễ, trễ bộ đệm Jitter. ™ Trễ bộ đệm modem bên nhận: Tương tự trễ modem bên truyền. chuyển đổi lại dạng số và việc này gây ra trễ. ™ Trễ giải nén và mã hoá: Ở nơi nhận, dữ liệu cần đượ ban đầu, việc này gây ra một khoảng trễ nào đó. Trễ phát lại: Các gói tin nh d ương tự để có thể phát ra âm thanh đến người nghe qua loa. Sự chuyển đổi số - tương tự này được thực hiện bởi soundcard và phần mềm điều khiển (driver). Đây là nguồn trễ cuối cùng mà hệ thống phải chịu, trễ này thường cỡ 150ms. T tổ uát cho các ứng dụng VOIP với sự có mặt của các PC, có loại trễ mang tính khách quan, có lại trễ lại có thể khắc phục bằng thiết kế, bằng các giải thuật và có loại trễ chỉ tồn tại trong các cấu hình với sự có mặt của PC. 4.4. VẤN ĐỀ GIẢM THIỂU HOÁ NGUỒN TRỄ. 4.4.1. Tối thiểu hoá ghi âm bên truyền Các tín hiệu thoại, để có truyền t thành các mảnh nhỏ, nén, mã hoá và đóng thành các khung, các khung này sau đó lại được tổ chức thành các gói (thường gồm từ 2 – 4 khung). Các gói này được cộng thêm các thông tin điều khiển, chẳng hạn các thông tin về địa chỉ trạm đầu, trạm cuối, các thông tin về dịch vụ ... Các thông tin này là cần thiết cho quá trình truyền các gói tin trên mạng thông qua các bộ định tuyến, tuy 84 nhiên các thông tin này không bao gồm thông tin về tín hiệu thoại. Do đó, chúng làm giảm hiệu suất thực tế truyền dữ liệu. Có thể giải quyết vấn đề này bằng cách truyền nhiều khung nhất có thể trong một gói tin nhưng điều đó lại làm cho việc phải đợi một lượng lớn thông tin đến trước khi được xử lý, gây ra trễ ghi âm bên truyền nhiều hơn. Như đã trình bày, tiếng nói được xử lý nhờ các sản phẩm phần mềm gọi là bộ mã hoá/giải mã, trước khi được truyền trên Internet. Do đó giải pháp tốt nhất là sử dụng các bộ mã hoá/giải mã có khả năng nén tiếng nói xuống tốc độ thấp nhất có thể. Một đặc trưng quan trọng khác của các bộ mã hoá đó là kích thước khung nhỏ nhất có thể được sử dụng. Việc xử lý các khung càng nhỏ càng làm giảm độ trễ ghi âm vì yêu cầu thời gian chờ tín hiệu ít hơn. 4.4.2. Tối thiểu hoá trễ modem ể trong tổng các nguồn gây trễ vì với một iệc khôi phục âm thanh là các bộ đệm Trễ modem gây ra sự trễ đáng k cuộc gọi hai chiều thì trễ modem gây ra tất cả bốn lần trễ ( hai lần trễ mỗi bên từ tương tự ra số và từ số ra tương tự ). Do đó việc giảm thiểu sự trễ modem là rất cần thiết sẽ giúp tiết kiệm đáng kể trễ toàn hệ thống. Các modem được đặc trưng bởi tốc độ truyền của nó hoặc số liệu mà chúng có thể xử lý trong một đơn vị thời gian. Các modem có tốc độ xử lý càng chậm càng làm tăng thời gian tổng của các tính toán cần thiết để chuyển đổi từ tín hiệu số sang tín hiệu tương tự và ngược lại. Thực tế có 3 nguồn gây trễ modem có thể tính toán được. Đó là trễ để chuyển dữ liệu vào bộ đệm của modem, trễ tính toán và trễ truyền lại. Trong đó trễ truyền lại kéo theo sự gia tăng của trễ bộ đệm Jitter do số lượng các gói tin truyền thực tế tăng. Sử dụng các modem có tốc độ xử lý cao sẽ giúp giảm trễ modem một cách đáng kể, dễ thấy nhất đó là việc làm giảm trễ tính toán. Hơn nữa, sự sử dụng các bộ mã hoá tốc độ thấp đã đề cập ở phần trên đã giúp cho việc giảm thiểu trễ modem hiệu quả hơn do tốc độ bit thấp sẽ giúp cho modem xử lý nhanh hơn. 4.4.3. Tối thiểu hoá trễ bộ đệm Jitter Trường hợp lý tưởng nhất cho v Jitter có thể chờ ngay cả gói tin đến đích trễ nhất. Tuy nhiên điều này sẽ là tăng độ trễ của bộ đệm Jitter đến mức không thể chấp nhận được. Vậy để thu nhỏ thời gian chờ các gói tin, do đó sẽ làm giảm độ trễ bộ đệm Jitter, các gói đến quá muộn sau một khoảng thời gian nào đó cần phải bỏ đi. Nếu các bộ mã hoá/giải mã không có khả năng khôi phục hay dự đoán các gói tin bị mất dựa 85 vào các gói đã đến, các bộ mã hoá như vậy có thể được sử dụng là các bộ mã hoá tham số. Có thể nói rằng việc sử dụng các bộ mã hoá/giải mã không tham số như G.723.1 hay G.729 có thể khôi phục được phần nào các gói tin bị mất, song chất lượng âm thanh của các bộ mã hoá/giải mã dạng sóng như vậy kém hơn rất nhiều các bộ mã hoá/giải mã tham số. 4.4.4. Trễ đầu cuối đến đầu cuối Để có thể giảm thiểu độ trễ, tăng chất lượng hội thoại thì việc tối thiểu oá trễh ghi âm bên truyền, trễ modem và trễ bộ đệm Jitter là những biện pháp hiệu quả để thu nhỏ trễ end to end thường hay gặp trong hệ thống VOIP. Việc sử dụng các bộ mã hoá/giải mã tốc độ bit thấp là một giải pháp hiệu quả thường đước chú trọng, chẳng hạn như bộ mã hoá/giải mã tham số Voxware RT24 cung cấp một tốc độ bit thấp và khả năng khôi phục gói tin lớn đem lại một chất lượng tốt hơn khi được triển khai trong các hệ thống VOIP. Thứ tự Nguồn trễ Giá trị đặc trưng (ms) trong cấu hình PC - PC Giá trị tương ứng trong cấu hình Phone - Phone 1 Ghi âm bên truyền 150 – 300 0 20 – 15 2 Trễ mã hoá 5 5 3 Nén 5 5 4 Modem phía 38 truyền 5 – 0 5 70 – 150 70 – 150 Internet 6 Modem phía nhận 5 – 38 0 7 Bộ đệm Jitter 150 – 300 0 – 300 15 8 Giải nén 5 5 9 Giải mã hoá 10 10 10 300 Trễ phát lại 40 – 0 86 CHƯƠNG 5 VẤN ĐỀ ĐẢM BẢO CHẤT LƯỢNG DỊCH VỤ. KHẢ NĂNG ÁP DỤNG VOIP Ở VIỆT NAM VÀ TRÊN THẾ GIỚI 5.1. GIỚI THIỆU. Một trong những lý do chính khiến cho mạng điện thoại chuyển mạch công cộng (PSTN: Public Switched Telephone Network) được gọi là mạng chuyển mạch kênh là vì "tất cả băng thông, tất cả thời gian". Chỉ đơn giản là đưa tín hiệu thoại vào mạng, chất lượng thoại ra sẽ phụ thuộc chủ yếu vào khả năng duy trì trễ thấp và ổn định trên suốt dọc đường tín hiệu truyền qua. Cách dễ nhất (và đã từng là cách duy nhất trong một khoảng thời gian dài) để đảm bảo trễ nhỏ và ổn định (hay giới hạn jitter) là thông qua chuyển mạch kênh. Băng thông và trễ là hai thông số chất lượng dịch vụ quan trọng nhất (QoS), chúng xác định đặc điểm của mạng, và trong một vài trường hợp có thể nói rằng chúng là hai thông số đáng quan tâm duy nhất. Tuy nhiên, ngày nay, thoại không phải là dịch vụ duy nhất trên mạng PSTN. Fax được xem như loại dịch vụ thoại có khả năng chịu lỗi cao, và nó không phụ thuộc vào độ ổn định của trễ như thoại. Mạng dữ liệu nhạy cảm với giới hạn băng thông hơn là với trễ nhỏ và giới hạn trôi pha. Đây là một trong những lý do chính khiến cho trong quá khứ mạng thuần dữ liệu được xây dựng độc lập với mạng thoại. Ngày nay tất cả các mạng đều được sử dụng cho dịch vụ thoại, dữ liệu, và một số còn cho cả Fax và Video. Các mạng riêng có thể được xây dựng để đáp ứng các yêu cầu đặc biệt về băng thông hay trễ, tuy nhiên mạng công cộng lại hấp dẫn ở khía cạnh thuận lợi cho việc kết nối. Cùng với việc Internet và Web đang ngày càng trở nên không thể thiếu được trong cuộc sống hàng ngày, thì áp lực cho việc sử dụng một mạng IP (Internet Protocol) toàn cầu cho tất cả các loại dịch vụ ngày càng lớn và cấp thiết. Bản thân IP là một mạng "cố gắng tối đa" và "không tin cậy", theo đó mạng sẽ cố gắng chuyển giao các gói tin, nhưng nếu có gói nào bị mất giữa các bộ định tuyến vì bất cứ một lý do gì, thì IP không có nhiệm vụ phải truyền lại 87 gói đó. Và thuật ngữ không tin cậy đối với mạng IP cũng là một vấn đề khó giải quyết. Thêm vào đó, nếu một bộ chuyển mạch thoại bị hỏng thì tất cả các cuộc thoại đang được chuyển mạch qua nó sẽ bị kết thúc ngay lập tức. Trong khi, nếu một bộ định tuyến IP trên mạng hỏng, thì các gói sẽ nhanh chóng được tự động định tuyến lại qua một tuyến khác, mặc dù có thể bị mất một vài gói. Tại sao PSTN lại được coi là "đáng tin cậy" còn Internet lại "không tin cậy"? Lý do chính bởi vì thuật ngữ đáng tin cậy trong ngữ cảnh này không phải áp dụng cho các đặc tính sẵn sàng của mạng mà là khả năng mạng có thể tin tưởng được để chuyển giao QoS cần thiết cho ứng dụng hay không. Với nghĩa này, mạng PSTN tốt hơn mạng IP nhiều khi nó đảm bảo được QoS cho các ứng dụng, không phải chỉ là QoS của thoại. Còn IP (Internet và Web) cung cấp dịch vụ mạng không tin cậy giữa các bộ định tuyến. Tuy nhiên, nếu một mạng IP không có một đảm bảo nào về QoS cho ứng dụng, thì làm thế nào Internet có thể được sử dụng tin cậy cho thoại? Người sử dụng có thể dễ dàng thêm các thiết bị vào mạng để có được QoS cần thiết hay không? Và mạng sẽ đóng vai trò gì? Chương này sẽ đề cập đến các vấn đề này. 5.2. CHẤT LƯỢNG DỊCH VỤ (QoS). QoS được định nghĩa là “khả năng của mạng đảm bảo và duy trì các mức thực hiện nhất định cho mỗi ứng dụng theo như các yêu cầu đã được chỉ rõ của mỗi người sử dụng”. Nhà cung cấp dịch vụ mạng đảm bảo QoS cung cấp cho người sử dụng, và thực hiện các biện pháp để duy trì mức QoS khi điều kiện mạng bị thay đổi vì các nguyên nhân như nghẽn, hỏng hóc thiết bị hay lỗi liên kết... QoS cần được cung cấp cho mỗi ứng dụng để người sử dụng có thể chạy ứng dụng đó, và mức QoS mà ứng dụng đòi hỏi chỉ có thể được xác định bởi người sử dụng, bởi vì chỉ người sử dụng mới có thể biết được chính xác ứng dụng của mình cần gì để hoạt động tốt. Không phải là người sử dụng tự động có thể biết được mạng cần phải cung cấp những gì cần thiết cho ứng dụng, nhưng cũng giống như các yêu cầu cho các ứng dụng phần mềm của máy tính cá nhân (ví dụ "64 MB RAM, 100 MB ổ cứng trống..."), họ phải tìm hiểu các thông tin. Chắc chắn rằng, mạng không thể tự động đặt ra QoS cần thiết cho một ứng dụng của người sử dụng. Về quan niệm thì QoS là một tài nguyên của mạng, hay đúng hơn là một nhóm tài nguyên mạng, ví dụ như băng thông và trễ. QoS ở "bên trong" mạng và mạng sẽ cung cấp QoS thích hợp cho các ứng dụng khi cần thiết. 88 Các nhà cung cấp dịch vụ mạng đưa ra thông tin đặc tả về giá trị thực tế của các thông số QoS theo một trong hai cách sau. Với môi trường kênh ảo cố định (PVC: Permanent Virtual Circuit), các giá trị của các tham số QoS có thể chỉ đơn giản được ghi trên một mẩu giấy và trao cho đại diện của nhà cung cấp dịch vụ mạng. Fax, thư điện tử, và thậm chí cả các cuộc gọi có thể được sử dụng để cung cấp cùng một thông tin, miễn là khách hàng và nhà cung cấp dịch vụ thống nhất được với nhau về cách thức sử dụng. QoS có hiệu lực trên PVC khi PVC sẵn sàng. Với môi trường kênh ảo chuyển mạch (SVC: Switched Virtual Circuit), các giá trị của thông số QoS được gửi cho nhà cung cấp dịch vụ trong bản tin báo hiệu thiết lập cuộc gọi, nó là một phần của giao thức báo hiệu được sử dụng để cung cấp dịch vụ chuyển mạch trên mạng. Cả hai phương pháp đều có thể được sử dụng trong mọi cách kết hợp trên mạng. Phương pháp PVC cho phép QoS được cung cấp rảnh rang hơn, trong khi phương pháp SVC đòi hỏi QoS trên một kết nối cho trước được thiết lập liên tục. Nếu một mạng được tối ưu hoàn toàn cho một loại dịch vụ, thì người sử dụng ít phải xác định chi tiết các thông số QoS. Ví dụ, với mạng PSTN, được tối ưu cho thoại, không cần phải xác định băng thông hay trễ cần cho một cuộc gọi. Tất cả các cuộc gọi đều được đảm bảo QoS như đã được quy định trong các chuẩn liên quan cho điện thoại. Nếu MODEM được sử dụng để truyền dữ liệu trên kết nối thoại, thì các thông số được cung cấp bởi PSTN vẫn không thể bị vi phạm. PSTN thích hợp cho thoại do bản chất của nó, tuy nhiên nó lại không hoàn toàn phù hợp cho nhiều ứng dụng ngày nay, đặc biệt đối với khía cạnh băng thông. Tuy nhiên, cố định tất cả các thông số QoS trong mạng PSTN rất phù hợp cho thiết lập cuộc gọi và định tuyến khá đơn giản, hiệu quả, và nhanh. 5.3. PHÂN CẤP CHẤT LƯỢNG. Một cách tự nhiên, có nhiều mức QoS khác nhau cũng giống như là có nhiều ứng dụng vậy. Các ứng dụng lại thay đổi rất lớn thậm chí cả với những yêu cầu đơn giản về băng thông. Thoại số có thể yêu cấu bất kỳ tốc độ nào trong khoảng từ 8 đến 64 kb/s. Video có thể chấp nhận được ở tốc độ 1,5 Mb/s, nhưng sẽ tốt hơn nhiều nếu là 6 Mb/s. Truy nhập Web và truyền tập tin sử dụng băng thông càng nhiều càng tốt trong phạm vi có thể, nhưng lại không cần liên tục... Tuy nhiên, băng thông trên PSTN và của mạng dữ liệu nhận được từ các đường thuê riêng dựa trên PSTN lại chỉ phục vụ giới hạn tại tốc độ 64 kb/s. Một ứng dụng cần 100 kb/s thì hoặc là cố gắng hoạt động ở 64 kb/s, hoặc là bỏ 89 phí 28 kb/s trong 128 kb/s. Đây là mặt hạn chế của các mạng chuyển mạch kênh "tất cả băng thông tất cả thời gian". Một mạng chuyển mạch gói có thể chia băng thông ra thành nhiều phần rất thích hợp cho các ứng dụng dữ liệu bùng nổ, nhưng đó không phải là tất cả. Một mạng cần phải có khả năng cung cấp QoS yêu cầu cho mỗi ứng dụng, không cần biết băng thông cần thiết là cố định hay không. Khả năng về phía mạng cung cấp cho các ứng dụng các đảm bảo QoS, ví dụ như là đảm bảo băng thông, được xem là phân cấp QoS của mạng. Phân cấp là một khía cạnh quan trọng của QoS. Phân cấp xác định các thông số QoS tốt đến mức nào mà người sử dụng có thể định rõ cho một ứng dụng cụ thể. Nếu mạng cung cấp QoS không đủ độ mịn, thì nó có thể giới hạn người sử dụng truy nhập vào mạng. Lấy một ví dụ đơn giản, xét một nhà cung cấp dịch vụ mạng thiết lập nhiều loại lớp dịch vụ cho các ứng dụng của người sử dụng. Có nhiều lúc lớp dịch vụ được dùng đồng nghĩa với QoS, nhưng ở đây sử dụng thuật ngữ lớp dịch vụ với nghĩa là một tập hợp của các giá trị thông số QoS có khả năng cung cấp cho một lớp, hay loại ứng dụng nào đó. Nhà cung cấp dịch vụ có thể đưa ra một lớp dịch vụ thoại trên một mạng gói mà nó đảm bảo băng thông 64 kb/s giữa các điểm cuối và trễ 100 ms với jitter nhỏ hơn 10 ms. Điều này tốt, miễn là tất cả người sử dụng thoại đều cần 64 kb/s. Nhưng nếu một ứng dụng thoại mới chỉ yêu cầu 8 kb/s thôi thì sao? Hay thậm chí chỉ 4 kb/s. Bởi vì người sử dụng được đảm bảo ở 64 kb/s, nên lượng băng thông này nói chung phải được chia ra từ toàn bộ băng thông trên mạng. Như thế bởi vì mạng có thể không bao giờ chỉ ra khi nào 64 kb/s có thể được yêu cầu. Theo đó, người sử dụng trả cho phần băng thông không sử dụng, và nhà cung cấp dịch vụ dự trữ băng thông để có thể dùng để cung cấp cho những người sử dụng khác. Phân cấp QoS tốt hơn sẽ cho phép người sử dụng thoại, thậm chí trong cùng lớp dịch vụ, xác định băng thông họ yêu cầu chính xác hơn. Sự chính xác này muốn đạt được thì phải trả giá bằng độ phức tạp của mạng, đây là lý do chính cho việc giới hạn các giá trị thông số QoS và đặt ra các lớp dịch vụ trong giai đoạn đầu. 5.4. VẤN ĐỀ ĐẢM BẢO CHẤT LƯỢNG DỊCH VỤ. Điều gì sẽ xảy ra nếu mạng không thành công trong việc đảm bảo và duy trì QoS chính xác cho một ứng dụng cho trước? Điều này tuỳ thuộc vào sự thoả 90 thuận giữa người sử dụng và nhà cung cấp dịch vụ trong trường hợp dịch vụ được quản lý bởi hợp đồng, hay là giữa nhà cung cấp dịch vụ và bộ phận điều chỉnh trong trường hợp dịch vụ bảng giá. Đảm bảo chất lượng cũng là phần quan trọng của hợp đồng cho các dịch vụ mạng giữa khách hàng (đại diện cho người sử dụng) và nhà cung cấp dịch vụ. Thông thường thì khách hàng phải trả tiền hàng tháng cho các dịch vụ. Đảm bảo chất lượng có thể thiết lập một hệ thống phạt dưới hình thức giảm bớt giá tiền dịch vụ một tháng nếu nhà cung cấp dịch vụ không cung cấp đúng chất lượng yêu cầu trong tháng đó. Trong những trường hợp nghiêm trọng nếu vấn đề về mạng xảy ra trong toàn bộ tháng đó, khách hàng có thể nhận được dịch vụ miễn phí. 5.5. TRIỂN KHAI VOIP Ở VIỆT NAM. Với ưu thế giá cước rẻ, chất lượng cuộc gọi chấp nhận được, điện thoại qua Internet đã thu hút được nhiều khách hàng Trung bình mỗi ngày , điện thoại VoIP thu hút 15.207 cuộc gọi; lưu lượng là 53.187 phút và thời gian trung bình mỗi cuộc là 3,5 phút, hệ thống mạng lưới hoạt động tốt và liên tục. Trong 3 tháng đầu thử nghiệm chỉ có một lần xảy ra sự cố suy giảm chất lượng luồng trung kế đường Hà Nội-Thành phố Hồ Chí Minh trong buổi sáng 3/1/2001. Về việc này, Tổng cục Bưu điện đã có ý kiến đóng góp cho Vietel sử dụng một luồng 2M cáp quang để cung cấp dịch vụ trong thời gian chờ khắc phục sự cố. Cũng theo báo cáo từ Vietel, tỷ lệ mất gói là 0%; tỷ lệ trễ sau quay số từ 9-15s, độ khả dụng đạt 99%; tỷ lệ hoàn thành cuộc gọi đạt trên 65%, các cuộc gọi không hoàn thành bao gồm cả các cuộc gọi không có người nhấc máy, máy bị gọi bận... Hiện nay, sản lượng dịch vụ đường dài VoIP tăng dần và dao động ở mức 3.9 đến 4.2 triệu phút/tháng, chiếm hơn 38% trong tổng sản lượng điện thoại đường dài Hà Nội-Thành phố Hồ Chí Minh, tương đương khoảng 1,4% sản lượng điện thoại đường dài liên tỉnh. Doanh thu từ dịch vụ này đưa lại khoảng 7.5 tỷ đồng/tháng, chiếm khoảng 26% doanh thu điện thoại đường dài Hà Nội- Thành phố Hồ Chí Minh, tương đương gần 2 % tổng doanh thu điện thoại đường dài liên tỉnh. Số thuê bao hàng tháng sử dụng dịch vụ điện thoại IP của Vietel tại Hà Nội và Thành phố Hồ Chí Minh dao động từ 70.000 đến 90.000. Song song với Vietel, công ty SPT cũng xây dựng đề án cung cấp dịch vụ đường dài trong nước, quốc tế trên cơ sở công nghệ VoIP, công ty NETNAM cũng có đơn xin phép cung cấp dịch vụ điện thoại IP Phone to Phone. Và gần 91 đây nhất, Tổng công ty Bưu chính Viễn thông Việt Nam cũng xin phép mở dịch vụ VoIP trong nước và quốc tế. Như vậy, trong tương lai không xa sẽ có nhiều doanh nghiệp cùng tham gia cung cấp dịch vụ cho người sử dụng và thúc đẩy cạnh tranh dịch vụ này trên thị trường. Cùng với Vietel sẽ có công ty VDC cùng kinh doanh dịch vụ này và là một đối tác cạnh tranh. Từ nay cho đến khoảng thời gian đó, Tổng công ty Bưu chính Viễn thông Việt Nam và Vietel đang khẩn trương thống nhất về việc kết nối, giá cước, phân chia cước trong lĩnh vực kinh doanh VoIP. Tuy vậy, về lâu dài Việt Nam cần xây dựng mạng đường trục IP có khả năng đáp ứng tất cả các loại hình dịch vụ tiếng nói, hình ảnh và đa phương tiện. 5.6. TRIỂN KHAI VOIP TRÊN THẾ GIỚI. Các công ty điện thoại truyền thống trên thế giới thu được một khoản lợi nhuận bình quân trong một năm từ các dịch vụ thoại vào khoảng 250 tỷ USD, và hiện nay họ đang nhằm vào một kho báu vô chủ là giao thức Internet trên cơ sở hệ thống điện thoại. Điện thoại IP đang phát triển mạnh mẽ trong giới khách hàng kinh doanh. Theo con số điều tra gần đây của Cahners In-Stat Group thì trên một nửa trong số 128 công ty mua công nghệ đã sẵn sàng chuyển hướng vào các mạng IP. Các công ty sử dụng các mạng IP đang tăng nhanh, chiếm một số tỷ lệ là 54% so với sử dụng các mạng Frame Relay (37%) và ATM (28%) Tuy nhiên mức độ triển khai điện thoại IP ở các nước trên thế giới là rất khác nhau, từ việc cho phép không điều kiện đến việc cấm hoàn toàn dịch vụ này. Tại các nước phát triển như Mỹ, Uc, Canada, Singapore, dịch vụ điện thoại IP loại PC-PC và PC-Điện thoại đều được cho phép không điều kiện. Trong khi đó, các nước đang phát triển không cho phép triển khai dịch vụ này một cách rộng rãi. Có hai nguyên nhân chủ yếu làm cản trở quá trình triển khai dịch vụ này: - Mức độ tự do hoá thấp hay không cho phép cạnh tranh với nhà khai thác chính. - Do cơ sở hạ tầng yếu kém không đảm bảo được chất lượng. Nhằm từng bước triển khai VoIP, hầu hết các nước phát triển đều tập trung vào việc xây dựng các mạng đường trục đáp ứng được các yêu cầu đối với việc truyền thông đa phương tiện. Khi đó thông tin trên mạng sẽ không còn phân biệt là tín hiệu thoại, dữ liệu hay hình ảnh nữa. Các mạng IP đường trục này cũng là một thành phần cấu thành nên cơ sở hạ tầng thông tin quốc gia. 92 Điện thoại IP là một xu thế không thể tránh khỏi, đang phát triển và dần dần thay thế điện thoại thông thường. Theo đánh giá của công ty IDC, trong năm 2006 thị trường điện thoại IP đạt khoảng 4,7 tỷ phút với mức tăng trưởng bình quân hàng năm là 92 %. 93 Kết Luận Mạng điện thoại qua Internet sử dụng giao thức IP (Internet Protocol) có nhiều ưu điểm so với mạng điện thoại truyền thống PSTN (Public Switching Telephone Network) như: chi phí thấp, cơ cấu mạng đơn giản, có thể khai thác cơ sở hạ tầng mạng IP sẵn có. Với việc số hoá tín hiệu và việc sử dụng công nghệ chuyển mạch gói để truyền thông tin trên mạng cho phép tiết kiệm băng thông, tài nguyên trên mạng. Ngày nay Internet phát triển rộng khắp trên thế giới và cả ở Việt Nam. Vì vậy VOIP sẽ là một công nghệ đem lại nhiều lợi ích cho người sử dụng và các nhà cung cấp dịch vụ. Tuy nhiên, VOIP cũng có những mặt hạn chế và gặp nhiều khó khăn trong việc triển khai trên diện rộng. Do hoạt động trên nền IP và cơ sở hạ tầng còn yếu kém nên chất lượng dịch vụ không được bảo đảm. Các yếu tố như trễ, trượt, mất gói ... đã làm giảm chất lượng dịch vụ. Để phát triển công nghệ VOIP cần có chính sách đầu tư, nâng cấp hạ tầng mạng, sử dụng các hỗ trợ để đảm bảo chất lượng dịch vụ. Trong tương lai, điện thoại Internet sẽ thay thế được công nghệ hiện nay với chất lượng dịch vụ đảm bảo và giá thành hạ. 94 TÀI LIỆU THAM KHẢO 1. Mạng máy tính và các hệ thống mở - Nguyễn Thúc Hải – NXB Giáo Dục 1999. 2. Giáo trình hệ thống mạng máy tính CCNA – Nguyễn Hồng Sơn – NXB Giáo dục 2001. 3. Nghiên cứu công nghệ truyền tín hiệu thoại trên mạng Internet. Các dịch vụ và ứng dụng trong Viễn Thông (Luận văn thạc sĩ) – Lê Thanh Hào - Đại học Bách Khoa 2000. 4. Kỹ thuật điện thoại qua IP & Internet (IP Telephone & Internet Telephone) NXB LĐXH 08/2003. 5. Công nghệ IP và ứng dụng điện thoại qua giao thức Internet - Tạp chí Bưu điện 8 -2004. 6. Tổng quan về VOIP và các giao thức điều khiển trạm trung chuyển MGCP – Hoàng Trọng Minh - Khoá luận tốt nghiệp ngành ĐTVT Đại học Quốc Gia HN 2002. 7. Nghiên cứu công nghệ VOIP - Nguyễn Công Bánh - Đồ án tốt nghiệp ngành ĐTVT Đại học Bách Khoa Hà Nội 2003. 8. Voice Over IP – L.Baker – Asian Communications. August 1998. 9. VocalTec Internet Phone 5 . 10. ITU-T H.245. 11. G.723.1 – Dual rate speech coder for mutimedia communications transmitting at 5.3 and 6.3 kbit/s. 12. G.729A – Reduced complexity 8 kbit/s. CS-CELP speech codec. 13. G.729B – A science compression scheme for G.729 optimized for terminals conforming to Recommendation V.70. 14. 95

Các file đính kèm theo tài liệu này:

  • pdfNghiên cứu công nghệ truyền thoại qua internet sử dụng giao thức tcp-ip (voip).pdf