Với sự phát triển của mạng lưới Internet ngày càng dày đặc, tốc độ ngày càng cao, nhu cầu multipmedia ngày càng cao của người dùng, đòi hỏi phải có một phương thức mới, tốc độ cao, dễ sử dụng và triển khai. Vì vậy công nghệ IPTV đã ra đời nhằm đáp ứng những nhu cầu đó.
Đồ án này sẽ trình bày chủ yếu:
+ Tổng quan về IPTV.
+ Mã hóa MPEG II, h.264.
+ Tình hình hiện trạng và tương lai của IPTV ở Việt Nam.
Nội dung Trang
Chương 1: Tổng quan về IPTV . 1
1.1 Mở đầu . 2
1.2 Giới thiệu sơ lược IPTV . 3
1.3 Mạng tổng thể IPTV . 5
1.3.1 Mạng nội dung 6
1.3.2 Mạng truyền tải (truyền dẫn) 6
1.3.3Mạng đầu cuối (mạng gia đình) . 7
1.3.4Bộ quản trị 7
Phương thức phát truyền tín hiệu của IPTV 9
Chương 2: MPEG II và H.264 . 11
2.1 Giới thiệu về MPEG 12
2.2 Mã hóa MPEG II 17
2.3 Mã hóa MPEG IV 21
2.4 Mã hóa MPEG IV part 10 (H.264) 22
2.4.1 Giới thiệu chung . 23
2.4.2 Tính kế thừa của H.264 . 24
2.4.3 Cơ chế nén của H.264 25
2.4.5Các ưu điểm nổi bật của chuẩn H.264 28
Kết luận 32
Chương 3: Tình hình và tương lai IPTV Việt Nam . 33
3.1 Tình hình IPTV trong khu vực . 34
3.2 Tình hình IPTV tại Việt Nam 35
3.3 Một số dịch vụ điển hình 37
3.4 Tương lai IPTV tại Việt Nam 39
Tài liệu tham khảo 41
41 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 3474 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Đồ án Tổng quan về iptv, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
tạp hơn nhiều.
Giới thiệu về MPEG:
MPEG là tên viết tắt của hội phim ảnh thế giới (The Moving Picture Experts Group) là một sản phẩm nhóm mang tính ISO/IEC được phát triển cho các thiết bị âm thanh và hình ảnh bằng cách nén dữ liệu chuẩn. Chuẩn MPEG lần đầu tiên được ra mắt vào tháng 5 năm 1988 tại Ottawa, Canada. Cho đến ngày nay, MPEG đã phát triển hơn 350 thành viên từ các hội nghi trên tất cả các lĩnh vực công nghiệp, các khu nghiên cứu, đến các trường đại học. Tiêu chuẩn chính thức của MPEG là ISO/IEC JTC1/SC29 WG11. MPEG được chuẩn hóa theo định dạng nén và các chuẩn phụ thuộc như sau:
Hình 2.1. Phân loại MPEG.
• MPEG-1: Viết tắt của chuẩn video và audio nén. Sau đó được sử dụng như là chuẩn dành cho đĩa VCD (Video CD) và chứa cả âm thanh thông thương ở lớp 3 (MP3) là dạng âm thanh nén. Mpeg-1 có thể nén tín hiệu video tới 1.5Mbit/s với chất lượng VHS và âm thanh lập thể (stereo audio) với tốc độ 192 kbit/s. Nó được dùng để lưu trữ video và âm thanh trên CD-ROM.
• MPEG-2: Truyền tải, hình ảnh và âm thanh trên các kênh truyền hình, quảng bá chất lượng cao. Được sử dụg cho các buổi phát hình ATSC, DVB và ISDB, các dịch vụ truyền hình kỹ thuật số vệ tinh, truyền hình cap và dành cho định dạng đĩa DVD.
• MPEG-3: Nguyên bản được thiết kế dành cho HDTV, nhưng bị loại bỏ khi phát hiện ra MPEG-2 (với tên đuôi) phù hợp với HDTV (Đừng nhầm với MP3, được định nghĩa là MPEG-1 lớp 3)
• MPEG-4: Phát triển từ MPEG1 vứi sự hỗ trợ về âm thanh, hình ảnh, “vật thể”, và nội dụng 3 chiều, mã hóa bitrate thấm và hỗ trợ Quản lý quyền số hóa. Có một vài chức năng mới hơn (MPEG-2) với hiệu quả âm thah và hình ảnh chuẩn. (Chứa cả các định dạng MPEG-2 video thay thế) Mpeg-4 trở thành một tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ hoạ và Video tương tác hai chiều (Games, Video Conferencing) và các ứng dụng Multimedia tương tác hai chiều (World Wide Web hoặc các ứng dụng nhằm phân phát dữ liệu Video như truyền hình cáp, Internet Video...). Mpeg-4 đã trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phối và truy cập vào các hệ thống Video. Nó đã góp phần giải quyết vấn đề về dung lượng cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường truyền tín hiệu Video hoặc kết hợp cả hai vấn đề trên.
• MPEG-7: chứa đặc tả thông tin, giao diện cho việc tìm kiếm thông tin.
Mpeg-1 và Mpeg-2 đã được chuẩn hoá trong khi Mpeg-4 và Mpeg-7 đang được phát triển.
Dữ liệu Mpeg bao gồm 2 lớp:
+Lớp hệ thống (System Layer) chứa thông tin về thời gian (Timing) và các thông tin khác cần thiết cho việc tách các dòng dữ liệu Video và Audio đồng thời đồng bộ hoá Video và Audio trong quá trình phát (Playback).
+Lớp dữ liệu nén (Compression Layer) bao gồm các dòng dữ liệu Video và Audio.
Hình 2.2. Giải mã MPEG
Hệ thống giải mã sẽ tách các thông tin về thời gian từ dữ liệu hệ thống Mpeg và gửi nó đến thiết bị hệ thống khác (Việc đồng bộ hoá sẽ cần thêm nhiều thông tin về thời gian). Hệ thống giải mã cũng tách các dữ liệu Video và Audio từ dữ liệu ban đầu. sau đó gửi chúng đến từng bộ giải mã thích hợp.
Bộ giải mã Video (Video Decoder) và Audio (Audio Decoder) giải nén các dòng dữ liệu Video và Audio. Hầu hết các sơ đồ nén Mpeg đều dùng kỹ thuật lấy mẫu bổ xung (Subsampling) và lượng tử hoá (Quantization) trước khi mã hoá. Lấy mẫu bổ xung nhằm mục đích để làm giảm kích thước khung hình đầu vào theo cả theo chiều ngang và chiều dọc, như vậy sẽ giảm số lượng các điểm ảnh trước mã hoá. Trong một số trường hợp người ta còn lấy mẫu bổ xung theo thời gian để làm giảm số lượng các khung hình trong cảnh trước khi mã hoá. Đây được xem như là một kỹ thuật rất cơ bản nhằm loại bỏ sự dư thừa dựa vào khả năng lưu ảnh của mắt người cảm thụ.
Chuẩn Mpeg định nghĩa một kiểu phân cấp cấu trúc trong dữ liệu Video như sau:
-Cảnh (Video Sequence): bắt đầu với một Sequence Header, bao gồm một hoặc một nhóm khung hình và kết thúc với mã End-of-Sequence.
-GOP (Group of Picture): Một dãy liên tiếp các ảnh (Picture) trong cảnh.
-Khung hình (Picture): là thành phần mã hoá chính. Thường thường chúng ta có thể phân biệt sự thay đổi về độ sáng của ảnh (Brightness) tốt hơn so với sự thay đổi về màu (Chrominance). Do đó trước hết các sơ đồ nén Mpeg sẽ tiến hành chia khung hình thành các thành phần độ sáng Y và thành phần độ màu Cb, Cr (một thành phần về độ sáng và hai thành phần về độ màu). Một khung hình sẽ gồm có 3 ma trận ứng với các thành phần về độ sáng (Y) và hai thành phần về độ màu Cb và Cr.
Hình 2.3. Video Frame trong MPEG.
Ma trận Y có số hàng và cột bằng nhau (ma trận vuông). Ma trận Cb và Cr có số hàng và cột bằng nửa ma trận Y. Hình cho thấy quan hệ và vị trí của Y và các thành phần Cb và Cr. Lưu ý rằng cứ 4 giá trị Y lại có 2 giá trị kết hợp một của Cb và một của Cr (Vị trí của giá trị Cb và Cr là tương đương).
-Slide: Dãy các Macroblock, thứ tự của các Macroblock bên trong Slide được xác định từ trái qua phải, trên xuống dưới. Slide rất quan trọng trong việc định lỗi. Nếu dòng dữ liệu (Bitstream) có chứa lỗi, bộ giải mã có thể bỏ qua và tiếp tục ở Slide kế tiếp. Nhiều Slide trên dòng dữ liệu cho phép che dấu lỗi tốt hơn và được dùng để cải thiện chất lượng hình ảnh.
-Macroblock: 16 pixel trong 16 hàng của thành phần Y tương ứng với 8 pixel trong 8 hàng của thành phần Cb và Cr. Trong hình cho thấy không gian của thành phần Y và Cb, Cr. Một Macroblock chứa 4 Y Block với 1 Cb Block và 1 Cr Block như trong hình với các con số ứng với thứ tự của Block trong dòng dữ liệu.
-Block: là tập hợp 8 pixel trong 8 hàng các giá trị của thành phần Y hoặc Cb, Cr.
Chuẩn Mpeg cũng định nghĩa cấu trúc phân cấp dữ liệu được chấp nhận, giải mã và xuất ra Audio số. Dữ liệu Mpeg Audio cũng như Mpeg Video gồm hàng loạt các gói (Packet). Mỗi gói chứa Audio Packet Header và dãy các Audio Frame.
Mỗi Audio Packet Header chứa các thông tin sau:
+Packet Start Code: xác định gói là Audio Parket.
+Packet Length: xác định lượng thông tin trong Audio Packet.
Hình 2.4. Audio Packet trong MPEG.
Mỗi Audio Frame chứa các thông tin:
+Audio Frame Header: chứa đồng bộ, ID, độ nén thông tin (Bit rate), thông tin về tần số lấy mẫu.
+Error Checking Code: chứa thông tin cho việc kiểm tra lỗi.
+Audio Data: chứa thông tin.
+Ancillary Data (dữ liệu phụ thuộc): chứa dữ liệu do người dùng xác định.
Nén Mpeg là sự kết hợp hài hoà của bốn kỹ thuật cơ bản: Tiền xử lý (Preprocessing), đoán trước sự chuyển động của các khung hình (Picture) ở bộ mã hoá (Temporal Prediction), bù chuyển động ở bộ giải mã (Motion Compensation) và mã lượng tử hoá (Quatization Coding).
Các bộ lọc tiền xử lý sẽ lọc ra những thông tin không cần thiết từ tín hiệu Video và những thông tin khó mã hoá nhưng không quan trọng cho sự cảm thụ của mắt người. Kỹ thuật đoán chuyển động dựa trên nguyên tắc là các khung hình trong một cảnh Video (Video Sequence) dường như có liên quan mật thiết với nhau theo thời gian: Mỗi khung hình tại một thời điểm nhất định sẽ có nhiều khả năng giống với các khung hình đứng ngay phía trước và ngay phía sau nó. Các bộ mã hoá sẽ tiến hành quét lần lượt từng phần nhỏ trong mỗi khung hình gọi là Macroblock, sau đó nó sẽ phát hiện Macroblock nào không thay đổi từ khung hình này tới khung hình khác. Bộ mã hoá sẽ tiên đoán trước sự xuất hiện của các Macroblock khi biết vị trí và hướng chuyển động của nó. Do đó chỉ những sự thay đổi giữa các Macroblock trong khung hình hiện tại và các Macroblock được tiên đoán mới được truyền tới bên phía thu. Phía bên thu tức bộ giải mã đã lưu trữ sẵn những thông tin mà không thay đổi từ khung hình này tới khung hình khác trong bộ nhớ đệm của nó và chúng được dùng để điền thêm một cách đều đặn vào các vị trí trống trong ảnh được khôi phục.
Nén tín hiệu Video được thực hiện nhờ việc loại bỏ cả sự dư thừa về không gian (Spatial Coding) và thời gian (Temporal Coding). Trong Mpeg, việc loại bỏ dư thừa về thời gian (nén liên khung hình) được thực hiện trước hết nhờ sử dụng các tính chất giống nhau giữa các khung hình liên tiếp (Inter-Picture). Chúng ta có thể sử dụng tính chất này để tạo ra các khung hình mới nhờ vào những thông tin từ những khung hình đã gửi trước nó. Do vậy ở phía bộ mã hoá, chỉ cần gửi những khung hình có thay đổi so với những khung hình trước trước, sau đó dùng phương pháp nén về không gian (Spatial Coding) để loại bỏ sự dư thừa về không gian trong chính khung hình sai khác này. Nén về không gian dựa trên nguyên tắc là phát hiện sự giống nhau của các điểm ảnh (pixel) lân cận nhau (Intra-Picture).
Mã hóa MPEG-II:
MPEG-2 là một tiêu chuẩn mã hóa nén(thường được gọi tắt là chuẩn nén) trong bộ tiêu chuẩn MPEG dùng để mã hóa luồng dữ liệu hình có kết hợp với các thông tin về âm thanh. Đây là một phương thức mã hóa dữ liệu có tổn hao cho phép lưu trữ và truyền phim ảnh trên nền hệ thống và băng thông hiện thời. Mpeg-2 được mở rộng dựa trên chuẩn Mpeg để hỗ trợ việc nén dữ liệu để truyền Video số chất lượng cao. Để hiểu được tại sao nén Video là rất quan trọng, ta cần tìm hiểu băng thông (Bandwidth) cần thiết để truyền các khung hình Video số không nén.
PAL (Phase Alternate Line) là chuẩn để truyền tín hiệu TV tuần tự (Analog) được sử dụng ở khá nhiều nước trên thế giới. Khung hình TV dùng PAL không nén đòi hỏi băng thông rất lớn tới 216 Mbps, lớn hơn rất nhiều khả năng của truyền sóng radio. Một số nước dùng hệ thống Analog TV là NTSC. Hệ thống này cung cấp các thông tin về màu sắc kém trung thực hơn với tỉ lệ truyền các khung khác nhau. Tín hiệu NTSC không nén đòi hỏi dung lượng đường truyền thấp hơn không đáng kể ở mức 168 Mbps. TV độ phân giải cao HDTV (High Definition TV) yêu cầu băng thông tối thiểu là 1 Gbps.
Mpeg-2 cung cấp cách nén các tín hiệu Video số thành các mức có thể quản lý được. Khả năng nén Video của Mpeg-2 liệt kê theo bảng sau:
Hình 2.5. Bảng so sánh đòi hỏi băng thông của các chuẩn MPEG.
Do chuẩn Mpeg-2 cung cấp khả năng nén rất cao bằng cách dùng các thuật toán tiêu chuẩn, nó trở thành chuẩn cho TV số với các đặc tính:
+Nén Video tương thích với Mpeg-1.
+Chế độ Full-screen kết hợp với cải tiến chất lượng Video (cho TV và màn hình PC).
+Cải tiến mã hoá Audio (chất lượng cao, mono, stereo...).
+Truyền phối hợp nhiều thành phần.
+Các dịch vụ khác.
Các hệ thống sử dụng Mpeg-2 đang rất phát triển như: TV số, VoD, Digital Versatile Disc (DVD)... Thuật toán nén Video Mpeg-2 đạt được khả năng nén cao nhờ lợi dụng sự dư thừa in thông tin Video. Mpeg-2 loại bỏ cả dư thừa về không gian và dư thừa về thời gian trong các cảnh Video.
Dư thừa thời gian xuất hiện khi các khung Video liên tiếp hiển thị hình ảnh của những hình ảnh giống nhau. Nó chứa các hình ảnh gần như không đổi hoặc thay đối rất nhỏ giữa các khung hình liên tiếp. Dư thừa không gian xảy ra khi một phần của ảnh được tái tạo lại (với thay đổi không đáng kể) trong một khung Video.
Dữ liệu từ các Macroblock cần được mã hoá sẽ được đưa đến cả bộ trừ (Subtractor) và bộ đoán chuyển động (Motion Estimator). Bộ đoán chuyển động sẽ so sánh các Macroblock mới được đưa vào này với các Macroblock đã được đưa vào trước đó và được lưu lại dùng để tham khảo. Kết quả là bộ đoán chuyển động sẽ tìm ra các Macroblock trong khung hình tham khảo gần giống nhất với Macroblock mới này. Bộ đoán chuyển động sau đó sẽ tính toán Vector chuyển động (Motion Vector), Vector này sẽ đặc trưng cho sự dịch chuyển theo cả hai chiều dọc và ngang của Macroblcok mới cần mã hoá so với khung hình tham khảo. Lưu ý rằng Vector chuyển động có độ phân giải bằng một nửa do thực hiện quét xen kẽ.
Hình 2.6. Dự đoán chuyển động.
Bộ đoán chuyển động cũng đồng thời gửi các Macroblock tham khảo được gọi là các Macroblock tiên đoán (Predicted Macroblock) tới bộ trừ để trừ với Macroblock mới cần mã hoá. Từ đó ta sẽ được các sai số tiên đoán (Error Prediction) hoặc tín hiệu dư, chúng sẽ đặc trưng cho sự sai khác giữa Macroblock cần tiên đoán và Macroblock thực tế cần mã hoá.
Tín hiệu dư hay sai số tiên đoán này sẽ được biến đổi DCT, các hệ số nhận được sau biến đổi DCT sẽ được lượng tử hoá để làm giảm số lượng các bits cần truyền. Các hệ số này sẽ được đưa tới bộ mã hoá Huffman, tại đây số bits đặc trưng cho các hệ số tiếp tục được làm giảm đi một cách đáng kể. Dữ liệu từ đầu ra của mã hoá Huffman sẽ được kết hợp với Vector chuyển động và các thông tin khác (thông tin về I, P, B-picture) để gửi tới bộ giải mã.
Đối với trường hợp P-picture, các hệ số DCT cũng được đưa đến bộ giải mã nội bộ (nằm ngay trong bộ mã hoá). Tín hiệu dư hay sai số tiên đoán được biến đổi ngược lại dùng phép biến đổi IDCT và được cộng thêm vào khung hình đứng trước để tạo nên khung hình tham khảo (tiên đoán). Vì dữ liệu khung hình trong bộ mã hoá được giải mã luôn nhờ vào bộ giải mã nội bộ ngay chính bên trong bộ mã hoá, do đó có thể thực hiện thay đổi thứ tự các khung hình và dùng các phương pháp tiên đoán ở trên.
Quá trình khôi phục lại khung hình tại bộ giải mã là hoàn toàn ngược lại. Từ luồng dữ liệu nhận được ở đầu vào, Vector chuyển động được tách ra và đưa vào bộ bù chuyển động (Motion Compensator), các hệ số DCT được đưa vào bộ biến đổi ngược IDCT để biến tín hiệu từ miền tần số thành tín hiệu ở miền không gian. Đối với P-picture và B-picture, Vector chuyển động sẽ được kết hợp với các Macroblock tiên đoán để tạo thành các khung hình tham khảo.
Không cần thiết phải luôn nén mọi khung hình Video cùng một mức độ, một phần của Clip có thể có độ dư thừa không gian thấp (ví dụ các hình ảnh phức tạp) trong khi đó các phần khác của Clip lại có độ dư thừa thời gian thấp (ví dụ các cảnh chuyển động nhanh). Vì thế dữ liệu Video đương nhiên sẽ ở các tỉ lệ nén (Bit rate) thay đổi trong khi việc truyền dữ liệu thường yêu cầu tốc độ cố định. Chìa khoá để điều khiển tốc độ truyền là trật tự dữ liệu đã nén trong bộ đệm (Buffer).Việc nén có thể được tiến hành với việc loại bỏ một vài thông tin đã được lựa chọn. Ảnh hưởng nhỏ nhất đối với chất lượng toàn bộ khung hình có thể đạt được bằng cách bỏ bớt các thông tin chi tiết. Điều này đảm bảo giới hạn tỉ lệ nén dữ liệu trong khi chất lượng của khung hình suy giảm tối thiểu.
Hình 2.7. Cơ chế nén MPEG II.
Mpeg-2 bao gồm cơ chế nén trong một phạm vi rộng. Một bộ mã hoá với cơ chế nén phải phù hợp với một hoặc đoạn cảnh riêng biệt. Nói chung bộ mã hoá rất phức tạp, nó phải lựa chọn được cơ chế nén thích hợp nhất bởi vậy tăng chất lượng khung hình đối với tỉ lệ nén dữ liệu truyền. Bộ giải mã Mpeg-2 cũng có nhiều kiểu, khả năng đa dạng và các lựa chọn khi kết nối.
Số lượng các Level và Profile được định nghĩa cho việc nén Video Mpeg-2. Hệ thống Mpeg-2 được phát triển trên một tập nào đó các Level và Profile:
+Profile: chất lượng của Video.
+Level: độ phân giải của Video.
Hệ thống cơ bản với tên MP@ML (Man Profile Man Level) nén dữ liệu Video từ 1-15 Mbps. Các Level khác nhau như: High Level, High Level 1440, Low Level và các Profile như: Simple, SNR, Spatial, 4:2:2 & High.
Các bộ giải mã điển hình:
+ 720 x 576 x 25 fps (PAL CCIR 601).
+ 352 x 576 x 25 fps (PAL Half-D1).
+ 720 x 480 x 30 fps (NTSC CCIR 601).
+ 352 x 480 x 30 fps (NTSC Half-D1).
Hầu hết các bộ giải mã đều hỗ trợ Mpeg-1:
+ 352 x 288 x 25 fps (PAL SIF).
+ 352 x 240 x 30 fps (NTSC SIF).
Chuẩn Mpeg-2 định nghĩa một sự phối hợp mã hoá Audio. Audio số có thể được mã hoá trong các dạng mã hoá khác nhau ở các tỉ lệ nén khác nhau.Mpeg-2 cũng cung cấp các hỗ trợ cho việc truyền dữ liệu. Mpeg-2 phân biệt hai kiểu dữ liệu:
+ Service Information: thông tin về Video, Audio và Data truyền bởi Mpeg-2.
+ Private Data: thông tin người sử dụng hoặc thiết bị thu.
Chuẩn mã hóa MPEG-IV:
MPEG-4 là 1 tiêu chuẩn nén âm thanh/ hình ảnh được thiết lập bởi tổ chức Moving Picture Experts Group gọi tắt là MPEG. Chuẩn này gồm nhiều tiêu chuẩn nhỏ, gọi là các phần của MPEG-4. Các phần đáng chú ý là:
+Part 2: codec cho dữ liệu trực quan(hình ảnh, ảnh động,…) Có tên thường gọi là MPEG-4 ASP. Điển hình như DivX, Xvid...
+Part 3: codec âm thanh AAC. Điển hình: Nero AAC, CT AAC(winamp xài cái này), Real AAC,..
+Part 10: 1 codec hình khác. Tên thường dùng là MPEG-4 AVC. Cài đặt: Nero Avc, MainConcept, Elecard, x264(miễn phí)
+Part 12: container để chứa hình/tiếng, .mp4.
Nếu 1 file mpeg-4 chuẩn ISO thì container phải là mp4, âm thanh là AAC, hình thì mpeg-4 ASP hoặc là mpeg-4 AVC. Hiện nay, có rất nhiều phần mềm có thể chuyển đổi các định dạng khác sang mp4. Thực sự, các phần mềm này thường xuất ra file AVI, video thì xài DivX, âm thanh thì thường là mp3. AVI không phải là container chính thức của chuẩn MPEG-4.
AVI :
- Không hỗ trợ VFR (variable frame rate, tốc độ hình thay đổi),
- Không thể chứa âm thanh AAC( nhất nhì thời nay).
- Nó cũng không hỗ trợ MP3 VBR. Có 1 số phần mềm đã hack và có thể nhét được: VirtualDubMod, Mencoder. Nhưng đáng tiếc là không có nhiều phần mềm nghe nhạc hỗ trợ dạng AVI như vậy.
Vậy sao thị trường vẫn dùng AVI nhiều? Vì nó thâm niên. Mp4 mới ra đời nên chưa được phổ biến mà AVI được phát triển và hỗ trợ bởi Microsoft.
Các bản AAC:
+Nero AAC: miễn phí, hỗ trợ ABR, VBR,... âm thanh 5.1
+CT AAC: coding technology AAC, hỗ trợ 5.1 nhưng không có VBR. Được dùng trong winamp, miễn phí.
+Real AAC: cũng miễn phí đã hỗ trợ VBR và 5.1
Các bản MPEG4- AVC:
+x264: miễn phí.
+Vorbis: cũng miễn phí.
GUI để encode âm thanh:
+Belight: GUI của Besweet.
+BeHappy: mở file bằng DirectShow.
GUI để encode video:
+Xvid, x264: Megui.
Tiêu chuẩn mã hóa MPEG-4 part 10 (H.264):
H.264 là chuẩn nén mở được công bố chính thức vào năm 2003, hiện là chuẩn hỗ trợ công nghệ nén tiên tiến và hiệu quả nhất hiện nay. Và nó đang dần được đưa vào thành chuẩn nén tiêu chuẩn của ngành công nghệ an ninh giám sát bằng hình ảnh. H.264 (còn được gọi là chuẩn MPEG-4 Part 10/AVC for Advanced Video Coding hay MPEG-4 AVC) nó kế thừa những ưu điểm nổi trội của những chuẩn nén trước đây. Đồng thời sử dụng những thuật toán nén và phương thức truyền hình ảnh mới phức tạp, phương pháp nén và truyền hình ảnh mà chuẩn H.264 sử dụng đã làm giảm đáng kể dữ liệu và băng thông truyền đi của video.
Với cách nén và truyền thông tin bằng chuẩn H.264 làm giảm đến 50% băng thông và kích thước file dữ liệu lưu trữ so với cách nén thông thường hiện nay (chuẩn nén thông thường hiện nay đang được sử dụng rộng rãi là MPEG-4 Part 2) và giảm tới hơn 80% băng thông và kích thước file dữ liệu lưu trữ so với nén bằng chuẩn Motion JPEG. Điều đó cho chúng ta thấy với cùng một hệ thống nếu chúng ta sử dụng chuẩn nén mới chúng ta có thời gian lưu trữ gấp đôi và băng thông mạng giảm đi một nửa, lợi ích mà chúng ta thấy ngay đó là chi phí cho lưu trữ dữ liệu video giảm một nửa so với dùng hệ thống có chuẩn nén thông thường. Ngoài ra việc truyền hình ảnh chiếm băng thông giảm một nửa, vì vậy chi phí dành cho thuê băng thông mạng cũng giảm đáng kể. Hoặc chúng ta có thể tăng chất lượng hình ảnh giám sát lên gấp đôi nhưng vẫn đảm bảo được băng thông và thời gian lưu trữ như trước đây. Đây là một lợi thế rất lớn, bởi với một hệ thống an ninh lớn, giải quyết vấn đề băng thông mạng và thời gian lưu trữ là rất phức tạp. Với chuẩn nén H.264 nó đã giải quyết được rất nhiều những khó khăn như vậy.
Với việc giảm được băng thông của chuẩn nén H.264 đã thúc đẩy cho dòng camera độ nét cao (hay còn gọi Camera Megapixel) có cơ hội phát triển mạnh mẽ. Với những hệ thống giám sát quan trọng cần hình ảnh rõ nét thì lựa chọn các camera độ nét cao và đầu ghi hỗ trợ chuẩn nén H.264 là hoàn toàn hợp lý.
Chuẩn nén H.264 được kỳ vọng là cơn gió mới, tạo thêm sinh khí để thúc đẩy sự phát triển của ngành an ninh giám sát phát triển mạnh mẽ hơn.
Giới thiệu chung:
Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn nén video MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền thông. Cũng trong thập kỷ này, chuẩn nén MPEG-2 đã được cải tiến về nhiều mặt. Giờ đây nó có tốc độ bit thấp hơn và việc ứng dụng nó được mở rộng hơn nhờ có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối ngẫu và phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh thống kê.
Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một cách vô hạn định. Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến hết giới hạn ứng dụng của mình trong lĩnh vực truyền truyền hình từ sản xuất tiền kỳ đến hậu kỳ và lưu trữ Video số. Bên cạnh đó, nhu cầu nén Video lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng IP mà tiêu biểu là mạng Internet. Khối lượng nội dung mà các công ty truyền thông cũng như các nhà cung cấp dịch vụ thông tin có thể mang lại ngày càng lớn, ngoài ra họ còn có thể cung cấp nhiều dịch vụ theo yêu cầu thông qua hệ thống cáp, vệ tinh và các hạ tầng viễn thông đặt biệt là mạng Internet.
Các tiêu chuẩn mã hoá Video ra đời và phát triển với mục tiêu cung cấp các phương tiện cần thiết để tạo ra sự thống nhất giữa các hệ thống được thiết kế bởi những nhà sản xuất khác nhau đối với mọi loại ứng dụng Video; Nhờ vậy thị trường Video có điều kiện tăng trưởng mạnh. Chính vì lý do này nên những người sử dụng bộ giải mã cần có một chuẩn nén mới để đi tiếp chặng đường mà MPEG-2 đã bỏ dở.
Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/ Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá Video. Theo ITU-T, các tiêu chuẩn mã hoá Video được coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264). Với tiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4).
Những khuyến nghị của ITU được thiết kế dành cho các ứng dụng truyền thông Video thời gian thực như Video Conferencing hay điện thoại truyền hình. Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ Video chẳng hạn như trên đĩa quang DVD, quảng bá Video số trên mạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng Video trên mạng Internet hoặc thông qua mạng không dây (wireless).
Với đối tượng để truyền dẫn Video là mạng Internet thì ứng cử viên hàng đầu là chuẩn nén MPEG-4 AVC, còn được gọi là H.264, MPEG-4 part 10, H.26L hoặc JVT.
Tính kế thừa của H.264:
Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp Video có chất lượng tốt hơn nhiều so với những chuẩn nén Video trước đây. Điều này có thể đạt được nhờ sự kế thừa các lợi điểm của các chuẩn nén Video trước đây. Không chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trước đó là H.263 và MPEG-4 bao gồm 4 đặc điểm chính như sau:
• Phân chia mỗi hình ảnh thành các Block (bao gồm nhiều điểm ảnh), do vậy quá trình xử lý từng ảnh có thể được tiếp cận tới mức Block.
• Khai thác triệt để sự dư thừa về mặt không gian tồn tại giữa các hình ảnh liên tiếp bởi một vài mã của những Block gốc thông qua dự đoán về không gian, phép biến đổi, quá trình lượng tử và mã hoá Entropy (hay mã có độ dài thay đổi VLC).
• Khai thác sự phụ thuộc tạm thời của các Block của các hình ảnh liên tiếp bởi vậy chỉ cần mã hoá những chi tiết thay đổi giữa các ảnh liên tiếp. Việc này được thực hiện thông qua dự đoán và bù chuyển động. Với bất kỳ Block nào cũng có thể được thực hiện từ một hoặc vài ảnh mã hoá trước đó hay ảnh được mã hoá sau đó để quyết định véc tơ chuyển động, các véc tơ này được sử dụng trong bộ mã hoá và giải mã để dự đoán các loại Block.
• Khai thác tất cả sự dư thừa về không gian còn lại trong ảnh bằng việc mã các block dư thừa. Ví dụ như sự khác biệt giữa block gốc và Block dự đoán sẽ được mã hoá thông qua quá trình biến đổi, lượng tử hoá và mã hoá Entropy.
Cơ chế nén hình ảnh của H.264:
Với chuẩn nén H264, mỗi hình ảnh được phân chia thành nhiều Block, mỗi block tương ứng với một số lượng nhất định các MacroBlock. Ví dụ một hình ảnh có độ phân giải QCIF (tương đương với số lượng điểm ảnh 176x144) sẽ được chia thành 99 MacroBlock với kích cỡ 16x16. Một sự phân đoạn các MacroBlock tương tự được sử dụng các kích cỡ ảnh khác. Thành phần chói của ảnh được lấy mẫu tương ứng với độ phân giải của ảnh đó, trong khi đó thành phần màu CR và CB được lấy mẫu với tần số thấp hơn theo 2 chiều ngang và dọc. Thêm vào đó mỗi hình ảnh có thể được phân thành số nguyên lần các lát mỏng (slice), việc này rất có giá trị cho việc tái đồng bộ trong trường hợp lỗi dữ liệu.
Mỗi hình ảnh thu được được xem như một ảnh I. Ảnh I là ảnh được mã hoá bởi việc áp dụng trực tiếp các phép biến đổi lên các MacroBlock khác nhau trong ảnh. Các ảnh I được mã hoá sẽ có kích cỡ lớn bởi nó được xây dựng từ một khối lượng lớn thông tin của bản thân ảnh hiện tại mà không sử dụng bất cứ thông tin nào từ miền thời gian trong quá trình xử lý mã hoá để tăng hiệu quả xử lý mã hoá bên trong trong H.264.
+Giảm bớt độ dư thừa:
Cũng giống như các bộ lập giải mã khác, H.264 nén video bằng cách giảm bớt độ dư thừa cả về không gian và thời gian trong hình ảnh. Những dư thừa về mặt thời gian là những hình ảnh giống nhau lặp đi lặp lại từ khung (frame) này sang khung khác, ví dụ như phần phông nền không chuyển động của một chương trình đối thoại trên truyền hình. Dư thừa về không gian là những chi tiết giống nhau xuất hiện trong cùng một khung, ví dụ như nhiều điểm ảnh giống nhau tạo thành một bầu trời xanh. Hình 1 biểu diễn một cách sơ lược các bước mà bộ lập giải mã MPEG-4 phải tiến hành để nén không gian và thời gian.
+Chọn chế độ, phân chia và chế ngự:
Bộ lập giải mã bắt đầu bằng việc quyết định loại khung cần nén tại một thời điểm nhất định và chọn chế độ mã hoá phù hợp. Chế độ "trong khối" tạo ra ảnh "I", trong khi chế độ "giữa khối" tạo ra khung "P" hoặc "B". Sau đó, bộ mã hoá sẽ chia ảnh thành hàng trăm hàng và cột các điểm ảnh của ảnh video số chưa nén thành các khối nhỏ hơn, mỗi khối có chứa một vài hàng và cột điểm ảnh.
+Nén theo miền thời gian:
Khi bộ mã hoá đang hoạt động ở chế độ "giữa khối" (inter), khối này sẽ phải qua công đoạn hiệu chỉnh chuyển động. Quá trình này sẽ phát hiện ra bất kỳ chuyển động nào diễn ra giữa khối đó và một khối tương ứng ở một hoặc hơn một ảnh tham chiếu đã được lưu trữ từ trước, sau đó tạo ra một khối "chênh lệch" hoặc "lỗi". Thao tác này sẽ giảm bớt dữ liệu trong mỗi block một cách hiệu quả do chỉ phải trình bày chuyển động của nó mà thôi. Tiếp đến là công đoạn biến đổi côsin rời rạc (DCT) để bắt đầu nén theo miền không gian. Khi bộ mã hoá hoạt động ở chế độ "trong khối" (intra), khối này sẽ bỏ qua công đoạn hiệu chỉnh chuyển động và tới thẳng công đoạn DCT.
Hình 2.8.Sơ đồ khối mã hoá MPEG, đường đứt nét đặc trưng cho phần bổ sung của MPEG-4 AVC trong việc nén theo miền không gian.
+Nén theo miền không gian:
Các khối thường có chứa các điểm ảnh tương tự hoặc thậm chí giống hệt nhau. Trong nhiều trường hợp, các điểm ảnh thường không thay đổi mấy (nếu có). Như vậy có nghĩa là tần số thay đổi giá trị điểm ảnh trong khối này là rất thấp. Những khối như thế được gọi là khối có tần số không gian thấp. Bộ lập mã lợi dụng đặc điểm này bằng cách chuyển đổi các giá trị điểm ảnh của khối thành các thông tin tần số trong công đoạn biến đổi cosin rời rạc.
* Biến đổi cosin rời rạc:
Công đoạn DCT biến đổi các giá trị điểm ảnh của khối thành một ma trận gồm các hệ số tần số ngang, dọc đặt trong không gian tần số. Khi khối ban đầu có tần số không gian thấp, DCT sẽ tập hợp phần lớn năng lượng tần số vào góc tần số thấp của mạng. Nhờ vậy, những hệ số tần số thấp ở góc đó sẽ có giá trị cao hơn.
Một số lượng lớn các hệ số khác còn lại trên ma trận đều là các hệ số có tần số cao, năng lượng thấp và có giá trị thấp. Hệ số DC và một vài hệ số tần số thấp sẽ hàm chứa phần lớn thông tin được mô tả trong khối ban đầu. Điều này có nghĩa là bộ lập mã có thể loại bỏ phần lớn hệ số tần số cao còn lại mà không làm giảm đáng kể chất lượng hình ảnh của khối.
Bộ lập mã chuẩn bị các hệ số cho công đoạn này bằng cách quét chéo mạng lưới theo đường zig-zag, bắt đầu từ hệ số DC và qua vị trí của các hệ số ngang dọc tăng dần. Do vậy nó tạo ra được một chuỗi hệ số được sắp xếp theo tần số.
* Lượng tử hoá và mã hoá entropy:
Tại đây thao tác nén không gian mới thực sự diễn ra. Dựa trên một hệ số tỷ lệ (có thể điều chỉnh bởi bộ mã hoá), bộ lượng tử hoá sẽ cân đối tất cả các giá trị hệ số. Do phần lớn hệ số đi ra từ DCT đều mang năng lượng cao nhưng giá trị thấp nên bộ lượng tử hoá sẽ làm tròn chúng thành 0. Kết quả là một chuỗi các giá trị hệ số đã được lượng tử hoá bắt đầu bằng một số giá trị cao ở đầu chuỗi, theo sau là một hàng dài các hệ số đã được lượng tử hoá về 0. Bộ lập mã entropy có thể theo dõi số lượng các giá trị 0 liên tiếp trong một chuỗi mà không cần mã hoá chúng, nhờ vậy giảm bớt được khối lượng dữ liệu trong mỗi chuỗi.
Các ưu điểm nổi bật của chuẩn nén H.264:
+ Ưu điểm của nén không gian:
Chuẩn nén MPEG-4 AVC có hai cải tiến mới trong lĩnh vực nén không gian. Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các macroblock 16x16 điểm ảnh thay vì các block 8x8 như trước đây. Điều này giúp tăng cường đáng kể khả năng nén không gian đối với các hình ảnh có chứa nhiều khoảng lớn các điểm ảnh giống nhau.
Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi công đoạn DCT diễn ra. Chuẩn nén MPEG-4 AVC so sánh macroblock hiện thời với các macroblock kế bên trong cùng một khung, tính toán độ chênh lệch, và sau đó sẽ chỉ gửi đoạn chênh lệch tới DCT. Hoặc là nó có thể chia nhỏ macroblock 16x16 điểm ảnh thành các khối 4x4 nhỏ hơn và so sánh từng khối này với các khối kế bên trong cùng một macroblock. Điều này giúp cải thiện khả năng nén ảnh chi tiết.
+ Ưu điểm của nén thời gian:
Điểm cải tiến lớn nhất ở MPEG-4 AVC là chế độ mã hoá giữa. Những phương pháp tiên tiến ở chế độ này khiến cho nén thời gian đạt đến một cấp độ cao hơn nhiều, cùng với chất lượng chuyển động tốt hơn so với các chuẩn MPEG trước đây.
+ Kích cỡ khối:
Ở chế độ giữa khối, MPEG-2 chỉ hỗ trợ các macroblock 16x16 điểm ảnh, không đủ độ phân giải để mã hoá chính xác các chuyển động phức tạp hoặc phi tuyến tính, ví dụ như phóng to thu nhỏ. Ngược lại, MPEG-4 AVC lại tăng cường hiệu chỉnh chuyển động bằng cách cho phép bộ lập mã biến đổi kích cỡ thành phần chói của mỗi macroblock. (Bộ lập mã sử dụng thành phần chói như vậy là do mắt người nhạy cảm với chuyển động chói hơn nhiều so với chuyển động màu.) Như có thể thấy trong Hình 2, MPEG-4 AVC có thể chia thành phần chói của từng macroblock thành 4 cỡ: 16x16, 16x8, 8x16 hoặc 8x8. Khi sử dụng khối 8x8, nó còn có thể chia tiếp 4 khối 8x8 này thành 4 cỡ nữa là 8x8, 8x4, 4x8 hoặc 4x4.
Hình 2.9.MPEG-4 AVC có thể phân chia thành phần chói của từng MacroBlock theo nhiều cách để tối ưu hoá việc bù chuyển động.
Việc phân chia các macroblock cho phép bộ lập mã xử lý được một vài loại chuyển động tuỳ theo độ phức tạp của chuyển động đó cũng như nguồn lực về tốc độ bit. Nhìn chung, kích cỡ phân chia lớn phù hợp với việc xử lý chuyển động tại các khu vực giống nhau trong ảnh, trong khi đó kích cỡ phân chia nhỏ lại rất có ích khi xử lý chuyển động tại các chỗ có nhiều chi tiết hơn. Kết quả là chất lượng hình ảnh cao hơn, ít bị vỡ khối hơn.
Các cuộc thử nghiệm đã chỉ ra rằng việc sắp xếp hợp lý các khung có thể tăng tỷ lệ nén thêm 15%. MPEG-4 AVC lấy phần chói của ảnh gốc và sử dụng các macroblock đã được chia nhỏ tại các khu vực có nhiều chi tiết nhằm tăng cường khả năng hiệu chỉnh chuyển động.
* Độ chính xác trong hiệu chỉnh chuyển động:
Trong đa số trường hợp, chuyển động tại rìa mỗi macroblock hay khối thường diễn ra với độ phân giải nhỏ hơn một điểm ảnh. Do vậy, chuẩn nén MPEG-4 AVC có thể đảm bảo độ chính xác trong hiệu chỉnh chuyển động lên tới 1/4 hoặc 1/8 điểm ảnh, trong khi các chuẩn MPEG trước đây chỉ dừng lại ở mức 1/2 điểm ảnh. Khả năng đạt mức chính xác 1/8 ảnh điểm của MPEG-4 AVC giúp tăng hiệu suất mã hoá tại tốc độ bit cao và độ phân giải video cao. Các thử nghiệm cho thấy độ chính xác đến 1/4 điểm ảnh có thể làm giảm tốc độ bit xuống hơn 15% so với độ chính xác 1 điểm ảnh.
* Chọn nhiều hình tham chiếu:
Chuẩn nén MPEG-2 chỉ dựa trên 2 khung tham chiếu để dự đoán các chuyển động mang tính chu kỳ, giống như trong trò kéo quân. Tuy nhiên, khi camera thay đổi góc quay hay chuyển qua chuyển lại giữa các cảnh, việc chỉ sử dụng 2 khung tham chiếu không còn phù hợp để dự đoán chính xác chuyển động. Tương tự như vậy, để đoán trước các chuyển động phức tạp như sóng biển hay một vụ nổ, ta cần phải có nhiều hơn 2 khung tham chiếu. Vì thế, chuẩn MPEG-4 AVC cho phép có tới 5 khung tham chiếu phục vụ cho việc mã hoá giữa khung. Kết quả là chất lượng video tốt hơn và hiệu suất nén cao hơn.
* Giải khối tích hợp:
Video số sau khi nén thường tạo ra một hiệu ứng gọi là "kết khối", có thể thấy rõ tại điểm giao nhau giữa các khối, đặc biệt là khi có tốc độ bit thấp. Hiệu ứng này là do công đoạn xử lý sử dụng nhiều loại chuyển động và bộ lượng tử khác nhau. Đối với MPEG-2, cách duy nhất để ngăn chặn hiệu ứng này là sử dụng các cơ chế hậu xử lý phù hợp, tuy nhiên các cơ chế này lại không tương thích được với tất cả các máy thu. Chuẩn nén MPEG-4 AVC đưa vào sử dụng một bộ lọc giải khối hoạt động ở hai cấp độ: macroblock 16x16 và khối 4x4. Việc giải khối thường tạo ra một tỉ số tín hiệu trên nhiễu (PSNR) cực điểm thấp hơn, tuy nhiên nhìn một cách chủ quan thì nó tạo ra hình ảnh chất lượng tốt hơn.
+ Ưu điểm về lượng tử hoá và biến đổi:
Chấm di động 8x8 DCT cùng với dung sai của lỗi làm tròn chính là phần cốt lõi của các chuẩn MPEG trước đây. MPEG-4 AVC độc đáo hơn ở chỗ nó sử dụng biến đổi không gian nguyên (gần giống như DCT) đối với các khối 4x4 điểm ảnh. Kích cỡ nhỏ giúp giảm bớt hiện tượng "kết khối", trong khi thông số nguyên tuyệt đối giúp loại bỏ nguy cơ không thích ứng giữa bộ lập mã và giải mã trong phép biến đổi ngược. Thêm vào đó, dãy hệ số xích lượng tử lớn hơn khiến cho cơ chế kiểm soát tốc độ dữ liệu ở bộ lập mã hoạt động một cách linh hoạt hơn dựa trên một tỉ lệ phức hợp vào khoảng 12,5% thay cho một mức tăng lượng gia không đổi.
+ Ưu điểm đối với mã hoá entropy:
Sau khi tiến hành hiệu chỉnh, biến đổi và lượng tử hoá chuyển động, các bộ lập mã MPEG trước đây sẽ vạch ra các symbol biểu diễn véctơ chuyển động và hệ số đã lượng tử hoá thành các bit thực sự. Ví dụ như chuẩn nén MPEG-2 sử dụng phương pháp mã có chiều dài biến thiên tĩnh (VLC) không thể tối ưu hoá trong môi trường video thời gian thực (trong đó nội dung và các cảnh biến đổi theo thời gian).
MPEG-4 AVC sử dụng mã hoá thuật toán nhị phân theo tình huống CABAC (Context-Adaptive Binary Arithmetic Coding). Hiệu suất mã hoá của CABAC cao hơn hẳn nhờ khả năng thích nghi với các thay đổi có thể xảy ra trong phân bổ symbol. Ví dụ, nó có thể khai thác sự tương quan giữa các symbol và từ đó sử dụng sự tương quan bit và thuật toán mã hoá. Cơ chế này có thể giúp tiết kiệm thêm một lượng bit vào khoảng hơn 5%.
+ Một ví dụ về ưu thế của MPEG-4 so với MPEG-2:
Hình sau là biểu đồ so sánh chất lượng giữa MPEG-4 AVC với MPEG-2. Nó so sánh hoạt động của các bộ lập mã tối tân khi mã hoá một đoạn video 30 khung/s có độ phân giải CIF ghi hình một trận thi đấu tennis.
Hình 2.10. So sánh chất lượng giữa MPEG-4 và MPEG-2.
Biểu diễn mức tiết kiệm tốc độ bit của MPEG-4 AVC so với một số chuẩn hiện có khác.
Kết luận:
MPEG-4 AVC đánh dấu một bước ngoặt trong lĩnh vực nén video, áp dụng các kỹ thuật tiên tiến nhằm mục đích sử dụng băng thông hiệu quả hơn và đem lại chất lượng ảnh cao hơn. Với các kỹ thuật này, MPEG-4 AVC có thể giảm tốc độ bit xuống hơn 50% so với chuẩn MPEG-2. Tuy nhiên, MPEG-4 AVC đòi hỏi một cấp độ phức tạp cao hơn trong cả quá trình lập mã lẫn giải mã. Mặc dù vậy, thử thách này hoàn toàn có thể chinh phục được nhờ có những tiến bộ mới liên tiếp trong khả năng xử lý phần mềm cũng như phần cứng. Điều này có nghĩa là MPEG-4 AVC là một ứng cử viên nặng ký có khả năng thay thế MPEG-2 trong những năm sắp tới.
IPTV có cơ hội rất lớn để phát triển nhanh chóng khi mà mạng băng rộng đã có mặt ở khắp mọi nơi và hiện nay đã có trên 100 triệu hộ gia đình sử dụng dịch vụ băng rộng trên toàn cầu. Rất nhiều nhà cung cấp dịch vụ viễn thông lớn trên thế giới đang triển khai thăm dò IPTV và xem như một cơ hội mới để thu lợi nhuận từ thị trường hiện có của họ và coi đó như một giải pháp tự bảo vệ trước sự lấn sân của các dịch vụ truyền hình cáp. Tại thị trường cung cấp dịch vụ ở Việt Nam, dịch vụ IPTV đã bắt đầu được thử nghiệm cung cấp với một số dịch vụ cơ bản. Điều này xem như là cơ hội kinh doanh dịch vụ mới của các nhà cung cấp dịch vụ tại Việt Nam, khi mà cơ sở hạ tầng mạng băng rộng đã và đang phát triển mạnh mẽ cùng với sự đòi hỏi nhu cầu của khách hàng ngày càng cao. Nội dung bài viết sẽ cho chúng ta thấy rõ tiềm năng to lớn của dịch vụ IPTV trong mạng băng rộng và khả năng ứng dụng triển khai IPTV trên thị trường viễn thông Việt Nam.
Tình hình IPTV trong khu vực:
Cuối thập kỷ trước, cùng sự phát triển của các dịch vụ truyền hình vệ tinh, sự tăng trưởng của dịch vụ truyền hình cáp số, và đặc biệt là sự ra đời của HDTV đã để lại dấu ấn đối với lĩnh vực truyền hình. Tuy nhiên, hiện nay trên thế giới đã xuất hiện một phương thức cung cấp dịch vụ mới còn mạnh hơn với đe dọa sẽ làm lung lay mọi thứ đã có. Internet Protocol Television (IPTV) đã ra đời, dựa trên sự hậu thuẫn của ngành viễn thông, đặc biệt là mạng băng rộng, IPTV dễ dàng cung cấp nhiều hoạt động tương tác hơn, tạo nên sự cạnh tranh mạnh mẽ hơn cho các doanh nghiệp kinh doanh dịch vụ truyền hình. Hãng In-Stat, một hãng nghiên cứu thị trường công nghệ cao có uy tín, gần đây đã dự báo rằng thị trường các dịch vụ IP video tại khu vực châu Á – Thái Bình Dương sẽ tăng trưởng tới gần 80% mỗi năm từ nay đến năm 2010 và sẽ tạo ra một thị trường 4,2 tỷ USD. Hãng này cũng dự đoán châu Á sẽ chiếm tới một nửa trong tổng số thuê bao TV của các công ty điện thoại trên toàn thế giới vào năm 2009 với tổng số thuê bao tối thiểu 32 triệu. Các số liệu này cho thấy trong những năm còn lại của thập kỷ này, IPTV sẽ trở thành một dịch vụ có thị trường rộng lớn trên toàn cầu với châu Á tiếp tục dẫn đầu trong việc thu hút khách hàng. Các con số này cũng cho thấy đây là một thị trường năng động với rất nhiều cơ hội cho các nhà cung cấp dịch vụ truyền hình có mô hình kinh doanh, hình thức cung cấp dịch vụ và công nghệ hợp lý.
Informa Telecoms Media dự báo IPTV sẽ được sử dụng bởi trên 35% các hộ gia đình sử dụng dịch vụ truyền hình số ở Hồng Kông vào năm 2010, con số này sẽ gần tương đương với số hộ gia đình dùng dịch vụ truyền hình cáp (khoảng 37%). Công ty này cũng dự báo sẽ có đến 13% các hộ sử dụng dịch vụ truyền hình số ở Singapore sẽ nhận tín hiệu truyền hình số thông qua đường dây DSL của họ, điều này làm cho IPTV trở thành một nền tảng truy nhập số phổ biến hơn rất nhiều so với truyền hình số mặt đất (DDT). Informa cũng dự báo rằng DSL sẽ chiếm tới 9,2% các hộ gia đình sử dụng truyền hình số ở Úc, 6,2% ở New Zealand, 5,8% ở Đài Loan, 5,7% ở Nhật Bản và 4,2% ở Hàn Quốc. Truyền hình cáp vẫn sẽ thống trị đến năm 2010, nhưng sau đó IPTV sẽ thực sự là đối thủ cạnh tranh với truyền hình số mặt đất và vệ tinh đối với người xem truyền hình châu Á.
Sự phát triển của IPTV chắc chắn sẽ nhanh hơn, nhưng với sự số hóa của truyền hình cáp và vệ tinh, các nhà cung cấp sẽ phải cạnh tranh để giành được khách hàng mới. Tùy thuộc vào thị trường cụ thể, các nhà khai thác dịch vụ IPTV sẽ phải bổ sung vào dịch vụ truyền hình quảng bá nhiều kênh với việc mở rộng cung cấp các dịch vụ như VoD, Replay-TV (network DVR), In-home DVR, Multi-room Service, v.v... PCCW ở Hồng Kông, nhà cung cấp dịch vụ IPTV lớn nhất thế giới với trên 500.000 thuê bao, đã đưa HDTV và VoD vào cung cấp trên mạng DSL của mình. SOFTBANK của Nhật Bản cũng đã nhắm đến xây dựng nội dung lên đến 5.000 giờ cho các phim truyện Nhật Bản và Holywood trên dịch vụ DSL/FTTH Video-On-Demand.
Tình hình IPTV tại Việt Nam:
Tại Việt Nam, hiện có nhiều nhà khai thác dịch vụ viễn thông lớn đang cạnh tranh nhau nhằm cung cấp cho khách hàng các dịch vụ băng rộng với chất lượng cao và giá rẻ. Họ cũng đã nhận ra xu hướng phát triển của truyền hình trực tuyến và video theo yêu cầu, và đang có những bước đi mạnh mẽ. Một số Website cung cấp thử nghiệm các chuơng trình truyền hình trực tuyến của VietNamNet, Công ty VTC, Đài truyền hình thành phố Hồ Chí Minh đã ghi nhận số lượng truy cập rất lớn, cho thấy sức hấp dẫn của dịch vụ này đối với công chúng.
FPT Telecom là doanh nghiệp viễn thông đầu tiên chính thức khai thác và cung cấp dịch vụ IPTV trên hệ thống mạng băng rộng ADSL/ADSL2+ từ ngày 03/03/2006 sau một năm thử nghiệm và hiện tại đã có 500 khách hàng thử nghiệm đầu tiên. FPT Telecom đã mua các thiết bị nhận sóng từ vệ tinh để truyền trên mạng và cũng đã ký kết bản quyền từ VTV và HTV để phát sóng 32 kênh truyền hình trên Internet để phục vụ cho các khách hàng của FPT. Hiện FPT đang tìm kiếm các phương thức hợp tác tương tự như với VTC để có thêm một số kênh phim truyện của đài này. Với một thuê bao ADSL 2+ của FPT, khách hàng có thể xem một lúc 3 kênh truyền hình đồng thời. Hiện FPT đang có gần 100.000 thuê bao ADSL, FPT sẽ cung cấp dịch vụ giá trị gia tăng IPTV cho các khách hàng này. Ngoài FPT, các doanh nghiệp khác như VNPT, Viettel cũng đang chuẩn bị cho quá trình triển khai dịch vụ IPTV trên mạng băng rộng.
Được biết, để đánh giá nhu cầu của thị trường (khách hàng) đối với dịch vụ IPTV, nhà cung cấp nội dung VASC đã từng tổ chức một cuộc thăm dò nhu cầu tại 04 thành phố Hà Nội, thành phố Hồ Chí Minh, Đà Nẵng, Hải Phòng.
Kết quả thăm dò nhu cầu thị trường: Hầu hết các gia đình đều đã có TV và đầu đĩa DVD, VCD, CD. Thói quen xem TV/phim, nghe nhạc tại nhà chiếm phần lớn thời gian giải trí. Tại 4 thành phố được khảo sát, gần 1/3 người dân có nhu cầu truy cập Internet và khoảng 1/8 dân chúng có thói quen xem phim tại rạp và chơi video game. Một nửa đối tượng khảo sát có đăng ký sử dụng truyền hình cáp/kỹ thuật số cho thấy, người dân rất hứng thú với các loại hình dịch vụ giải trí truyền hình, đặc biệt là hình thức dịch vụ tivi có trả tiền.
Thị phần của các nhà cung cấp dịch vụ là khác nhau, nhưng xét một cách tổng thể thì các nhà cung cấp dịch vụ TH cáp/KTS đã đáp ứng được hơn 70% nhu cầu giải trí truyền hình của khách hàng. Gần một nửa khách hàng hài lòng với nhà cung cấp dịch vụ nhờ sự đa dạng về các kênh và chương trình truyền hình, 1/4 còn lại hài lòng về chất lượng nội dung chương trình.
Trong khi đó có khoảng 1/3 khách hàng mong đợi có thêm nhiều kênh truyền hình,… Tại Đà Nẵng, 90% người được hỏi đều thú vị với dịch vụ IPTV này. Kế đến là TP.HCM và Hải Phòng với 81% và 80%, cuối cùng là Hà Nội với chỉ hơn 54%. Trong chuyến khảo sát thực tế phát triển dịch vụ IPTV ở Hải Phòng, cho thấy con số thuê bao ADSL đăng ký sử dụng dịch vụ IPTV tại Hải Phòng chưa nhiều.
Tuy nhiên, theo anh Vũ Hồng Minh, phó Giám đốc VNPT Hải Phòng thì hồ sơ đăng ký lắp đặt đã khá dày, thậm chí có nhiều người gọi điện đến Trung tâm khách hàng để đăng ký. Được biết, quá trình triển khai dịch vụ cũng gặp không ít khó khăn chưa có hướng giải quyết. Ví dụ như nhiều gia đình ở quá xa trung tâm, khó có điều kiện kéo cáp quang. Hoặc có gia đình đòi lắp chung 1 set-top-box cho 3 phòng trong 3 tầng nhà.
Một số dịch vụ điển hình:
Dịch vụ truyền hình: các nội dung truyền hình được quảng bá theo lịch trình thời gian cố định như truyền hình truyền thống. Sự lựa chọn các gói kênh theo yêu cầu của khách hàng có thể bao gồm các kênh truyền hình công cộng (public), các kênh truyền hình trả tiền (pay TV), các kênh truyền hình được ưa thích, các kênh về mua sắm, các kênh về thời trang, v.v...
Dịch vụ truyền hình theo yêu cầu: việc phát các nội dung truyền hình được lựa chọn bắt đầu khi người sử dụng lựa chọn nội dung đó. Thông thường, nội dung là các bộ phim hay các phim đã được ghi lại từ một thư viện. Dịch vụ này có thể được sử dụng trong một thời gian giới hạn. Các chức năng thường giống như chức năng của máy ghi hình (VCR) hay đầu DVD (DVD player): phát hình (play), dừng hình (pause), tua hình (fast forward), v.v...
Máy ghi hình các nhân (Personal Video Recorder, PVR): PVR là một thiết bị điện tử dân dụng cho phép ghi lại các nội dung quảng bá để xem lại ở một thời điểm sau đó.
Máy ghi hình cá nhân qua mạng (Network PVR, NPVR): đây là phiên bản sử dụng trên mạng của PVR. Nó có thể được xem như là một VCR ảo với việc lưu trữ và các chức năng khác cung cấp từ mạng. Nội dung truyền hình quảng bá có thể được ghi và xem lại sau đó.
Hướng dẫn chương trình điện tử (Electronic Program Guide, EPG): một hướng dẫn để cung cấp cho người sử dụng các thông tin về các chương trình IPTV đang và sắp phát. Có thể nói một EPG là phương thức để người sử dụng tìm kiếm các nội dung của nhà cung cấp.
Các dịch vụ thông tin: các dịch vụ thông tin có thể bao gồm tin tức thời sự, tin thể thao, dự báo thời tiết, thông tin về các chuyến bay, các sự kiện trong khu vực/địa phương, v.v...
Truyền hình tương tác: “kênh phụ” (back-channel) IP không chỉ cung cấp khả năng lấy thông tin mà còn cho phép tương tác với các show truyền hình hoặc khởi tạo các ứng dụng liên kết đến các chương trình đang chạy. Các ví dụ điển hình của truyền hình tương tác là tham dự vào các trò chơi truyền hình, bình chọn qua truyền hình, phản hồi của người xem truyền hình, các chương trình thương mại, v.v...
Các ứng dụng tương tác: sự tương tác không chỉ được liên kết đến một chương trình truyền hình truyền thống. Đấu giá, mua sắm, dịch vụ ngân hàng là các ứng dụng truyền hình được sử dụng rộng rãi, tạo ra sự hội tụ của thiết bị và sự phát triển các giao diện người sử dụng mới. Truyền hình khiến cho việc sử dụng các ứng dụng tương tác (giống như việc sử dụng Internet) trở thành một trong những thành phần chiếm ưu thế của IPTV/VoD tương lai. Đây cũng là một yếu tố khác biệt chủ yểu nhất so với truyền hình quảng bá truyền thống vốn không có một “kênh phụ” nào (có chăng là một đường điện thoại).
Các ứng dụng băng rộng: các ứng dụng dùng cho người tiêu dùng và doanh nghiệp cũng có thể được thực hiện thông qua hạ tầng IPTV/VoD như hội nghị truyền hình, đào tạo từ xa, giám sát an ninh, v.v...
Pay-per-View (PPV): là hình thức trả tiền để xem một phần chương trình truyền hình, ví dụ: trả tiền để xem một sự kiện thể thao hay trả tiền để nghe một bản nhạc. Hệ thống cung cấp một kênh phim truyền hình theo hình thức PPV cho các thuê bao.
Trò chơi theo yêu cầu (Games on Demand): dịch vụ này sẽ cung cấp nhiều loại game tùy chọn đến thuê bao từ một danh sách có sẵn. IPTV yêu cầu game đơn giản dựa trên HTML.
Âm nhạc theo yêu cầu (Muics on Demand): các thuê bao có thể xem những clip ca nhạc theo yêu cầu, giống như dịch vụ VoD.
Truyền hình của hôm trước (TV of Yesterday, TVoY): dịch vụ này cho phép thuê bao xem phim truyền hình đã được phát những ngày trước.
Karaoke theo yêu cầu (Karaoke on Demand): các thuê bao có thể chọn và xem các bài Karaoke qua Set-top Box (ST trên TV. Từ list các bài karaoke đã được giới thiệu, thuê bao có thể mua một hoặc nhiều bài hát cùng lúc. Dịch vụ sẽ được triển khai trong tương lai.
Tương lai IPTV tại VN:
Xét trên khía cạnh công nghệ, xu hướng công nghệ hiện nay là sự hội tụ của nhiều công nghệ để đưa ra những loại hình dịch vụ tổng hợp (như kết hợp các dịch vụ thoại, số liệu và băng rộng) cho khách hàng, đồng thời tận dụng được những cơ sở hạ tầng sẵn có để giảm thiểu chi phí đầu tư nâng cấp. Dịch vụ IPTV chính là một sản phẩm của sự hội tụ đó khi mà chỉ với một thiết bị đầu cuối khách hàng có thể sử dụng khoảng 6-7 loại hình dịch vụ con (truyền hình quảng bá, truyền hình theo yêu cầu, điện thoại thông thường, điện thoại IP, điện thoại truyền hình, truy cập Internet, v.v...). Hơn nữa việc áp dụng công nghệ để triển khai những dịch vụ với các chi phí nhỏ, tối ưu hoá hạ tầng viễn thông sẵn có sẽ tăng sức cạnh tranh khi mà Việt Nam đã gia nhập WTO.
Đồng thời có thể khẳng định với hạ tầng mạng truy nhập hữu tuyến và vô tuyến băng rộng trên cơ sở mạng NGN hiện đại mà các nhà khai thác cung cấp dịch vụ của Việt Nam đã và đang hướng tới xây dựng thì việc triển khai dịch vụ IPTV là hợp lý và khả năng bảo đảm đáp ứng yêu cầu triển khai dịch vụ này là hoàn toàn khả thi.
Các dịch vụ IPTV ngày càng trở nên là dịch vụ phổ biến được các công ty viễn thông cung cấp. Trong khi đó, hệ thống không dây WiMAX có khả năng hỗ trợ băng thông rộng và trễ thấp rất phù hợp cho việc phân phối các dịch vụ multimedia. Hơn nữa, hệ thống này cũng cung cấp vùng phủ sóng rộng, hỗ trợ thu phát di động, và không yêu cầu tầm nhìn thẳng (line-of-sight). Do đó, WiMAX là giải pháp hứa hẹn để phân phối các dịch vụ IPTV với bất cứ khi nào và bất kỳ nơi đâu. Với các ưu điểm của hệ thống WiMAX thì việc phân phối các dịch vụ IPTV sẽ hứa hẹn mang đến chi phí phân phối thấp nhưng hỗ chất lượng dịch vụ audio/video cao và đặc biệt là hỗ trợ khả năng di động.
Với sự phổ biến của truyền thông không dây hiện nay, việc ứng dụng IPTV trên mạng không dây hứa hẹn sẽ giúp cho các dịch vụ IPTV hiện nay có nhiều thuận tiện, linh hoạt, chi phí thấp nhờ các ưu thế về kỹ thuật của mạng diện rộng không dây WMAN (wireless metropolitan area network) như IEEE 802.16d/e (là một phiên bản của chuẩn WiMAX). Kỹ thuật WiMAX dựa trên chuẩn 802.16-2004 và 802.16e-2005 hỗ trợ tốc độ dữ liệu lên đến 70Mbps trên khoảng cách 30Km và hỗ trợ khả năng di động. Hiện nay, WiMAX là hệ thống không dây duy nhất có khả năng hỗ trợ chất lượng QoS ở tốc độ dữ liệu cao trên nền tảng IP. Lớp MAC (Medium Access Control) của WiMAX hỗ trợ rtPS (time real Polling Services) bảo đảm yêu cầu về băng thông và trễ tối thiểu cho các dịch vụ video yêu cầu chất lượng QoS. Kỹ thuật này dùng điều chế OFDM (Orthogonal Frequency Division Multiplex) và lớp vật lý OFDMA (Orthogonal Frequency Division Multiple Access). Nó cũng sử dụng các cơ chế điều chế, mã hóa và sửa lỗi FEC (Forward Error Correction) để gia tăng chất lượng dịch vụ. Hơn nữa, WiMAX là một mạng truy cập IP và hỗ trợ chuyển gói dữ liệu dựa trên mạng lõi. Do đó, WiMAX được xem là hệ thống phù hợp nhất để mở rộng các dịch vụ IPTV theo hướng không dây và di động.
Hiện nay, nhiều nhà cung cấp viễn thông đã triển khai các hệ thống IPTV nhưng không phân phối dịch vụ trên WiMAX mà phân phối trên cáp quang kéo trực tiếp đến nhà thuê bao. Trong tương lai, WiMAX sẽ là hướng phát triển được quan tâm để phát triển IPTV nhằm đáp ứng nhu cầu của các thiết bị di động, và trong những vùng khó triển khai cơ sở hạ tầng mạng.
TÀI LIỆU THAM KHẢO
Các file đính kèm theo tài liệu này:
- Tổng Quan Về IPTV.doc