Tìm hiểu cơ sở dữ liệu đa phương tiện

Dữ liệu đa phương tiện có thể được quản lý tốt nhất bằng CSDL Oracle. Dữ liệu đa phương tiện của bạn cần phải được nạp vào CSDL để tận dụng các ưu thế về độ tin cậy, khả năng mở rộng, tính sẵn có, và khả năng quản lý dữ liệu. Để đưa dữ liệu đa phương tiện vào CSDL với số lượng lớn, bạn có thể sử dụng:  SQL*Loader SQL*Loader là một tiện ích của Oracle cho phép bạn nạp dữ liệu, và trong trường hợp này, dữ liệu đa phương tiện (dữ liệu LOB), từ các tập tin đa phương tiện bên ngoài vào một bảng của một CSDL có chứa các cột thuộc kiểu đối tượng OM.  PL/SQL Một sự mở rộng các thủ tục của SQL, PL/SQL là một ngôn ngữ lập trình tiên tiến thế hệ thứ tư (4GL) của Oracle. Bạn có thể viết các thủ tục PL/SQL để nạp dữ liệu đa phương tiện từ BLOB, hệ thống tập tin, và các nguồn dữ liệu media theo URL vào các cột thuộc kiểu đối tượng OM.

pdf33 trang | Chia sẻ: lylyngoc | Lượt xem: 6094 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu Tìm hiểu cơ sở dữ liệu đa phương tiện, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
nguyên lý tự trị là mô hình kiến trúc thích hợp nhất. Các kỹ thuật hướng đối tượng chính là công cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý này bằng cách xem mỗi loại dữ liệu nguồn là một đối tượng mà các phương thức của nó có thể truy cập được từ một CSDL đa phương tiện tổng thể. 4.2. Nguyên lý đồng nhất (uniformity): Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là nguyên lý đồng nhất, nguyên lý này giúp chúng ta tìm được một cấu trúc tóm tắt chung cho tất cả các loại dữ liệu. Cấu trúc này có thể được dùng trong việc chỉ số hóa tất cả các loại dữ liệu qua đó tạo ra một “chỉ số thống nhất” mà chúng ta có thể dùng để truy cập tới các đối tượng khác nhau. Hay nói một cách khác là chúng ta có thể trình bày tất cả các đối tượng khác nhau 9 (ảnh, video, âm thanh, văn bản) trong một cấu trúc dữ liệu duy nhất và qua đó phát triển các thuật toán để truy vấn cấu trúc dữ liệu này. Hình 2: Mô tả nguyên lý đồng nhất Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất đòi hỏi chúng ta phải tìm ra được một cấu trúc dữ liệu chung mà có thể dùng để lưu trữ các thông tin về nội dung của hình ảnh, video, văn bản, âm thanh và các loại dữ liệu khác. Điều này đòi hỏi chúng ta phải phân tích nội dung của mỗi kiểu dữ liệu và tóm tắt được phần chung của chúng, qua đó xây dựng một bộ chỉ số dựa trên các yếu tố chung đã được xác định này.ưu điểm nổi bật của nguyên lý đồng nhất là dễ dàng triển khai và các thuật toán thường được thực hiện rất nhanh. Nhược điểm chính của nguyên lý này là các sự chú giải phải được tạo ra theo một cách riêng nào đó, thường là được tạo ra một cách thủ công hoặc là tự động, việc tạo ra các chú giải một cách thủ công thường đỏi hòi nhiều về mặt thời gian cũng như chi phí, mặt khác trong quá trình tạo các chú giải này thường xảy ra sự mất mát thông tin nếu ngôn ngữ dùng để chú giải không trình bày hết được các khía cạnh của nội dung. Có thể đưa ra đây một số ví dụ như ngôn ngữ chú giải nội dung của hình ảnh có thể làm mất các thông tin về bề mặt của một điểm ảnh (pixel) hoặc một nhóm điểm ảnh. Tương tự như vậy ngôn ngữ chú giải nội dung của âm thanh có thể làm mất các thông tin về biên độ, tần số của tín hiệu tại một thời điểm nào đó. 10 4.3. Nguyên lý lai (hybrid): Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý đã trình bày ở trên. Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ số (index) riêng của chúng, trong khi đó các kiểu dữ liệu khác sẽ sử dụng một chỉ số (Index) “thống nhất”. Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc vào các đặc tính khác nhau. Hình 3: Mô tả nguyên lý lai ghép Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên, đồng thời giảm thiểu được một số các nhược điểm của chúng. Giả sử chúng ta muốn tạo ra một CSDL đa phương tiện bao gồm các kiểu dữ liệu M1, …….,Mn, chúng ta bắt đầu bằng việc phân chia tập này thành 2 phần:  Phần 1: bao gồm các loại dữ liệu kế thừa từ các nguồn dữ liệu có sẵn, tồn tại sẵn các chỉ số và các thuật toán để thao tác với chỉ số. Với việc bố trí này chúng ta đã tận dụng được lợi thế của các chỉ số và mã nguồn sẵn có.  Phần 2: bao gồm các dữ liệu không được kế thừa từ bất kỳ nguồn nào và do đó không có sẵn các chỉ số của mình (điều này đồng nghĩa với việc là cũng không có bất kỳ thuật toán nào để có thể thao tác với tập chỉ số). Trong trường hợp này việc tiếp cận xây dựng hệ thống theo nguyên lý đồng nhất là cách thức thích hợp nhất ngay cả khi là cách tiếp cận này có thể nảy sinh ra việc gây mất mát các thông tin vật lý chi tiết. 11 Sau khi đã tiến hành xong việc phân chia, chúng ta bắt đầu tiến hành việc xây dựng các thuật toán cần thiết để kết hợp các nguồn dữ liệu khác nhau lại bằng việc sử dụng các tập chỉ số riêng của chúng. Cách tiếp cận này giúp chúng ta thừa kế được tối đa các tài nguyên có sẵn, đồng thời giảm thiểu được các công việc phải thực hiện thêm bởi vì các tệp chỉ số riêng có sẵn đối với mỗi loại dữ liệu đã được tận dụng. NGÔN NGỮ TRUY VẤN DỮ LIỆU CHƯƠNG II. ĐA PHƯƠNG TIỆN Ngày nay, với sự phát triển vượt bậc của công nghệ thu giữ (capture) dữ liệu nghe nhìn và không gia lưu trữ ngày càng gia tăng đã cho phép tạo ra các bộ sưu tập khổng lồ các dữ liệu đa phương tiện. Tuy nhiên, khi CSDL ngày càng phình to ra thì những khó khăn trong việc tìm kiếm một bức ảnh hay video mong muốn lại cũng tăng lên. Để giải quyết vấn đề này, người ta có hai phương pháp đã được phát triển:  Phương pháp thứ nhất: sử dụng các thông tin được nhập thủ công hay được bao gồm trong thiết kế của bảng, như tiêu đề, các từ khóa mô tả - thường đã được xác định từ trước trong lược đồ phân loại (classification schemes). Phương pháp này được biết đến với tên gọi là truy xuất dựa trên thuộc tính (attribute-based retrieval);  Phương pháp thứ hai: sử dụng các đặc trưng được rút trích từ nội dung của đối tượng đa phương tiện và sự nhận diện đối tượng để phân loại nội dung dữ liệu đa phương tiện. Phương pháp này được biết đến với tên gọi là truy xuất dựa trên nội dung (content-based retrieval). Phương pháp này đề xuất ý tưởng sử dụng vectơ đặc trưng – một bộ giá trị số có kích thước cố định được rút trích từ nội dung để truy vấn. Do tính chất phức tạp và độ rộng của phương pháp thứ hai nên nghiên cứu này chỉ tập trung tìm hiểu phương pháp thứ nhất. Cụ thể, chúng ta sẽ tìm hiểu một ngôn ngữ truy vấn đơn giản được xây dựng dựa trên SQL dùng để khai thác dữ liệu đa phương tiện. Ở phần trên chúng ta đã tìm hiểu cách tổ chức dữ liệu theo nguyên lý đồng nhất và lai ghép. Việc mở rộng ngôn ngữ truy vấn SQL sử dụng cho việc truy vấn dữ liệu được xây dựng bởi kiến trúc mô tả đồng nhất sẽ là tiền đề để chúng ta tiếp tục mở rộng ngôn ngữ truy vấn dùng cho việc khai thác các dữ liệu media được xây dựng theo kiến trúc lai ghép. Chúng ta sẽ cùng tìm hiểu xem xét một hệ thống cơ sở dữ liệu đa phương tiện đơn giản (SMDS – Simple multimedia database system). 1. Truy vấn SMDSs (mô tả đồng nhất): Các hàm cơ bản của SMDSs bao gồm: 12  FindType(Obj): hàm này dùng đối tượng Obj như là dữ liệu đầu vào và trả về kiểu của đối tượng, ví dụ: + FindType(image1.gif) = gif. + FindType(movie1.mpg) = mpg.  FindObjWithFeature(f): hàm này này sử dụng đặc trưng f là giá trị đầu vào và trả về một tập tất cả các loại đối tượng media mà có chứa đặc trưng f, ví dụ: + FindObjWithFeature(john)= {iml.gif,im2.gif,im3.gif,videol.mpg:[1,5]}. + FindObjWithFeature(mary)= {videol.mpg:[1,5],videol.mpg:[15,50]}.  FindObjWithFeatureandAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc tính tên a kết hợp với đặc trưng này và một giá trị v là đầu vào. Giá trị trả về sẽ là tất cả các đối tượng obj có chứa đặc trưng và giá trị của thuộc tính a trong đối tượng obj là v. Ví dụ: + FindObjWithFeatureandAttr(Big Spender,suit,blue): Truy vấn này yêu cầu tìm tất cả các đối tượng media mà có sự xuất hiện của Big Spender trong bộ đồ màu xanh.  FindFeaturesinObj(Obj): câu truy vấn này đòi hỏi phải tìm tất cả các đặc trưng có mặt trong một đối tượng media đã cho. Kết quả trả về là một tập bao gồm tất cả các đặc trưng. Ví dụ: + FindFeaturesinObj (iml.gif): câu truy vấn này yêu cầu trả về tất cả các đặc trưng có trong file ảnh im1.gif. + FindFeaturesinObj(videol.mpg:[1,15]): câu truy vấn này yêu cầu trả về tất cả các đặc trưng có trong 15 frame đầu tiên của file video video1.mpg.  FindFeaturesandAttrinObj(Obj): truy vấn này cũng có chức năng tương tự như hàm trước ngoại trừ việc nó trả về một quan hệ có schema như sau: (Feature, Attribute,Value) trong đó cặp 3 (f,a,v) xuất hiện trong quan hệ đầu ra nếu tính năng f xảy ra trong câu truy vấn FindFeaturesinObj(Obj) và thuộc tính a của đặc trưng f được xác định và có giá trị là v. Ví dụ: + FindFeaturesandAttrinObj(iml.gif) có thể trả về kết quả được mô tả ở bảng sau: 13 Bảng 1: Bảng mô tả kết quả của truy vấn FindFeaturesandAttrinObj(iml.gif) SMDS-SQL của chúng ta sẽ bao gồm tất cả các câu lệnh chuẩn của SQL có bổ sung thêm một số đặc trưng của dữ liệu đa phương tiện vào SQL (bổ sung thêm vào Select, From, Where)  Mệnh đề SELECT có thể chứa thực thể media. Một thực thể media được định nghĩa như sau: + Nếu m là một đối tượng media liên tục, i và j là 2 số nguyên khi đó m: [i,j] là một thực thể media thể hiện một tập tất cả các frame của đối tượng media m nằm trong (và chỉ trong) khoảng i và j. + Nếu m không phải là một đối tượng media liên tục thì khi đó m là một thực thể media. + Nếu m là một thực thể media và a là một thuộc tính của m thì khi đó m.a là một thực thể media.  Mệnh đề FROM có thể chứa các thực thể theo mẫu sau: , có nghĩa là chỉ có các đối tượng media kết hợp với tên của kiểu media và tên của dữ liệu nguồn được xem xét đến khi thực hiện truy vấn và M là một biến được xếp loại trên các đối tượng media đó.  Mệnh đề WHERE cho phép có các biểu thức có dạng term IN func_call. Trong đó: + Term có thể là một biến (trong trường hợp này được sắp xếp trên kiểu trả về của func.call) hoặc là một đối tượng có kiểu đầu ra giống như func.call. + Func.call là một trong 5 hàm đã nêu ra ở trên. Chúng ta xem xét một vài ví dụ: 14 + Tìm tất cả các đối tượng ảnh hoặc video có chứa cả Jane Shady và Denis Dopeman. Select M FROM smds source1 M WHERE (FindType(M)= Video OR FindType(M)=Image AND M IN FindObjWithFeatureand(Jane Shady) AND M IN FindObjWithFeatureand(Denis Dopeman) + Tìm tất cả các ảnh và video mà đối tượng Jane Shady mặc áo vét mầu tím SELECT M FROM smds source1 M WHERE FindType(M)=Video OR FindType(M)=Image AND M IN FindObjWithFeatureandAttr(Jane Shady,suit,purple) + Tìm tất cả các ảnh có Jane Shady cùng với đối tượng xuất hiện trong đoạn Video cùng với Denis Hopeman. Khác với câu hỏi trước, câu hỏi này đòi hỏi phải có các thao tác kết hợp giữa các loại dữ liệu khác nhau. Để thực hiện được câu hỏi này, chúng ta phải sử dụng các biến mở rộng như là Person, biến này được dùng để tham chiếu đến đối tượng chưa xác định được danh tính trong đoạn băng video. SELECT M,Person FROM smds source1 M,M1 WHERE (FindType(M)=Image) AND (FindType(M1)=Video) AND M IN FindObjWithFeature(Jane Shady) AND M1 IN FindObjWithFeature(Big Spender) AND Person IN FindFeaturesinObj (M) AND Person IN FindFeaturesinObj (M1) AND Person  Jane Shady AND Person  Big Spender 2. Truy vấn dữ liệu đa phương tiện mô tả dưới kiến trúc lai tạo: Như đã trình bày, SMDS-SQL có thể được sử dụng để truy vấn các đối tượng đa phương tiện lưu trữ trong kiến trúc đồng nhất. Trong kiến trúc đồng nhất, tất cả các dữ liệu nguồn được truy vấn đều là SMDSs, trong khi trong kiến trúc lai tạo các cách thức mô tả khác (non-SMDS) cũng được sử dụng. Cách thức mô tả dữ liệu kiểu lai tạo thường có hai phần chính:  Một tập các đối tượng media được mô tả dưới dạng đồng nhất. 15  Một tập các kiểu media khác nhau mà có cấu trúc để truy nhập và truy vấn riêng. Để mở rộng ngôn ngữ truy vấn SMDS-SQL thành ngôn ngữ có thể truy vấn được các dữ liệu được mô tả dưới dạng lai tạo (HM-SQL) các yêu cầu sau bắt buộc phải có:  HM-SQL phải có khả năng thực hiện tất cả các câu hỏi sử dụng ngôn ngữ riêng đối với nguồn dữ liệu không đồng nhất này.  HM-SQL phải có cơ chế “joins” hoặc các thao tác đại số nhị phân có trách nhiệm “joins” giữa 2 nguồn dữ liệu SMDS và non-SMDS. Ngôn ngữ HM-SQL cũng tương tự như ngôn ngữ SQL chuẩn ngoại trừ các mệnh đề Select, From. Where được mở rộng như sau:  Mệnh đề SELECT và FROM được mở rộng giống như với ngôn ngữ SMDS- SQL.  Mệnh đề WHERE cho phép sự có mặt của biểu thức có dạng Term IN MS: func_call trong đó: + Term:có thể là một biến hoặc là một đối tượng có kiểu đầu ra giống hệt với của func_call đã được định nghĩa trong media gốc và + Nếu MS=SMDS hoặc họ func_call thuộc 1 trong 5 hàm đã đinh nghĩa ở trên hoặc + MS không phải là một nguồn SDMS và func_call là một câu hỏi trong QL(MS).  Khi đó, có 2 sự khác nhau giữa SMDS-SQL và HM-SQL là: + func_call xuất hiện trong mệnh đề where cần được chú thích một cách tường minh với media gốc kèm theo và + Các câu truy vấn được xây dựng từ các ngôn ngữ truy vấn của từng loại dữ liệu non-SMDS có thể được nhúng vào bên trong câu lệnh truy vấn của HM- SQL. Điều này làm cho HM_SQL trở nên hết sức mạnh mẽ và linh hoạt. Căn cứ vào điều này chúng ta có thể thực thi các câu truy vấn đối với các nguồn dữ liệu khác nhau. Xem xét một vài ví dụ:  Giả sử chúng ta có 2 nguồn dữ liệu video video1 và video2, nguồn video1 được triển khai qua hình thức SDMS, nguồn video2 được triển khai qua hình thức non- SDMS (gọi là videodb). Câu hỏi của chúng ta ở đây là “hãy tìm tất cả các video clip 16 có mặt Denis Hopeman từ cả 2 nguồn dữ liệu video1 và video2. Câu hỏi này có thể được diễn đạt bằng ngôn ngữ HM-SQL như sau: SELECT M FROM smds video1, videodb video2 WHERE M IN smds:FindObjWithFeature(Denis Hopeman) OR M IN videodb:FindVideoWithObject(Denis Hopeman) Trong câu truy vấn này, chúng ta tìm kiếm tất cả các M mà chúng trả về kết quả mong muốn từ cả 2 nguồn dữ liệu (SDMS và non-SDMS).  Cũng với câu hỏi trên nhưng ở đây chúng ta thêm vào một nguồn dữ liệu mới là dữ liệu hình ảnh (idb) được triền khai dưới hình thức non-SDMS và giả sử dữ liệu hình ảnh này có riêng chức năng tìm kiếm getpic(obj) với tham số đầu vào là obj và kết quả trả về là một cặp bao gồm một ảnh (file ảnh) và thứ tự có liên quan. Giả sử chúng ta muốn tìm kiếm trên cả 3 loại dữ liệu này (video1, video2, idb) có mặt của đối tượng Denis Hopeman thì câu hỏi diễn đạt bằng ngôn ngữ HM-SQL có thể như sau: Select M From sdms Video1, videodb Video2 Where M IN sdms: FindObjWithFeature(Denis Hopeman) OR M IN videodb: FindVideoWithObj(Denis Dopeman) UNION (Select M.file From imagedb idb M Where M In imagedb:getpic(Denis Dopeman)  Giả sử chúng ta muốn tìm tất cả các đối tượng có mặt cùng với Denis Dopeman trong tất cả các nguồn dữ liệu (video1, video2, idb), câu hỏi sẽ như sau: 17 HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU CHƯƠNG III. ĐA PHƯƠNG TIỆN 1. Định nghĩa về hệ quản trị cơ sở dữ liệu đa phương tiện: Hệ quản trị CSDL đa phương tiện (Multimedia Database Management System – MDBMS) là một hệ quản trị CSDL (DBMS) hỗ trợ tạo lập, cập nhật và khai thác CSDL đa phương tiện. Một MDBMS phải cung cấp gần như tất cả các chức năng của một DBMS truyền thống bên cạnh việc cung cấp thêm một số chức năng mới và tính năng nâng cao. MDBMS kế thừa các tính chất từ DBMS truyền thống – ACID: atomicity (tính đơn nhất), consistency (tính nhất quán), isolation (tính độc lập) và durability (tính bền vững). Ngoài ra, sự khác nhau của các kiểu dữ liệu trong CSDL đa phương tiện có thể đòi hỏi các phương thức đặc biệt để tối ưu hoá việc lưu trữ, truy cập, chỉ số hoá và khai thác. MDBMS cần phải cung cấp các yêu cầu đặc biệt này bằng cách cung cấp các cơ chế tóm tắt bậc cao để quản lý các kiểu dữ liệu khác nhau cũng như các giao diện thích hợp để thể hiện chúng. 2. Kiến trúc hệ quản trị cơ sở dữ liệu đa phương tiện: Kiến trúc của MDBMS được mô tả ở hình 4 bao gồm 3 lớp: (1)Lớp quản trị CSDL đơn phương tiện (monomedia database-management layer), (2)Lớp quản trị/thành phần đa phương tiện (multimedia composition/management layer), (3)Lớp giao diện người dùng (user-interface layer). 18 Lớp quản trị CSDL đơn phương tiện cung cấp các chức năng cần thiết cho việc quản lý các phương tiện đơn lẻ hoặc cá thể (individual media). Các phương diện chính của mỗi DBMS tại mức này bao gồm việc duy trì cơ chế đánh chỉ mục một cách hiệu quả, và cho phép người dùng phát triển các việc mô hình hóa và gom nhóm dựa trên ngữ nghĩa của các thông tin phức tạp với mỗi phương tiện. Mục tiêu căn bản của lớp này là để xử lý các truy vấn dựa trên nội dung và tạo thuận lợi cho sự truy xuất của các mảnh phù hợp của dữ liệu đơn phương tiện, như các video clip, các phần của bức ảnh hay các đoạn âm thanh. Một chức năng quan trọng khác được tích hợp trong lớp này là sự quản trị về mặt vật lý của các CSDL đơn lẻ (individual databases). Việc quản lý này có thể yêu cầu một vị trí phù hợp của dữ liệu trên hệ thống đĩa đơn/song song nhằm mang lại hiệu quả cao hơn. Hình 4: Kiến trúc MDBMS Mục tiêu chính của lớp ở giữa là nhằm giải quyết việc tích hợp đơn phương tiện để tạo ra các tài liệu đa phương tiện và liên kết chéo tới các thông tin được lưu trữ trong các CSDL đơn phương tiện. Hiện tại, sự đòi hỏi về việc quản lý các tài liệu và thư viện đa phương tiện đang ngày càng gia tăng và nhu cầu về các mô hình tích hợp hiệu quả đang là một trong những vấn đề nghiên cứu chính trong việc phát triển một MDBMS. Việc tích hợp các phương tiện có thể mở rộng ra nhiều chiều bao gồm không gian, thời gian và các ngữ nghĩa. Do đó lớp này cần phải duy trì một mô hình tích hợp đơn phương tiện đa chiều, dưới hình thức của một siêu lược đồ (meta-schema). Về cơ bản, lớp này xử lý các truy vấn của người dùng cho việc tổng hợp các thông tin đa phương tiện và tạo ra các 19 truy vấn con (subqueries) cho các CSDL đơn phương tiện. Việc truy xuất của dữ liệu đơn phương tiện được điều khiển bởi các mô hình tích hợp được duy trì bởi siêu lược đồ. Cần phải lưu ý rằng nhằm mục đích nhất quán dữ liệu, siêu lược đồ này cần phải được giao tiếp với các lược đồ có liên quan với CSDL đơn phương tiện trình diễn ở lớp thấp hơn, bởi vì cả 2 lược đồ đều chia sẻ thông tin về dữ liệu đơn phương tiện, bao gồm các ngữ nghĩa dựa trên nội dung của chúng. Một chức năng quan trọng khác của lớp này là cung cấp sự phối hợp giữa các CSDL đơn phương tiện nếu chúng được phân phối. Một trong những mục tiêu chính trong trường hợp này là để cung cấp truy cập “trong suốt về vị trí” (location-transparent) tới các site CSDL khác nhau và duy trì sự đồng bộ giữa các dòng phương tiện truyền thông có nguồn gốc từ các máy chủ không đồng nhất. Theo quan điểm CSDL, thông tin về vị trí của các đối tượng tổng hợp đa phương tiện khác nhau và sơ đồ của chúng phải được duy trì bởi lớp này. Lớp tương tác bao gồm nhiều phương tiện giao tiếp người dùng nhằm hỗ trợ các chức năng trình diễn đa phương tiện, như hiển thị hình ảnh, bản diễn thử của các video clip hay các đoạn âm thanh. Các phương tiện tương tác này có thể yêu cầu vài ngôn ngữ truy vấn chính quy mà cũng được sử dụng tại lớp dưới cùng, với một vài tính năng nâng cao để thao tác với các thông tin đa phương tiện tổng hợp. Để thay thế, người ta có thể sử dụng một vài giao diện truy vấn đồ họa, bao gồm các tính năng bổ sung như duyệt, biên tập dữ liệu phương tiện… 3. Các yêu cầu của hệ quản trị cơ sở dữ liệu đa phương tiện: Một MDBMS cung cấp một môi trường thích hợp để sử dụng và quản lý các thông tin CSDL đa phương tiện. Để MDBMS hoạt động có hiệu quả, đáp ứng được các nhu cầu đa dạng của người dùng thì nó phải thỏa mãn một số yêu cầu sau:  Đầy đủ các khả năng của một DBMS truyền thống;  Có khả năng lưu trữ lớn;  Có khả năng khai thác dữ liệu thuận tiện;  Có khả năng tích hợp, tổng hợp và thể hiện;  Hỗ trợ truy vấn đa phương tiện;  Có giao diện đa phương tiện và tương tác. 4. Các vấn đề của hệ quản trị cơ sở dữ liệu đa phương tiện: 4.1. Mô hình hóa dữ liệu đa phương tiện: Mô hình dữ liệu là đơn vị trung tâm của một hệ thống CSDL đa phương tiện. Một mô hình dữ liệu cần phải tách rời người dùng ra khỏi chi tiết của việc quản lý các thiết bị lưu 20 trữ và cấu trúc lưu trữ. Điều này đòi hỏi phải phát triển các mô hình dữ liệu tương ứng để tổ chức các kiểu dữ liệu khác nhau từng gặp trong các hệ thống CSDL đa phương tiện. Các mô hình dữ liệu đa phương tiện (cũng giống như các mô hình dữ liệu truyền thống khác) nắm bắt các đặc tính cố định cũng như động của nội dung CSDL và vì vậy nó cung cấp các khuôn mẫu cơ bản cho việc phát triển các công cụ cần thiết để sử dụng dữ liệu đa phương tiện. Các thuộc tính cố định có thể bao gồm các đối tượng tạo nên dữ liệu đa phương tiện, mối liên hệ giữa các đối tượng, thuộc tính của các đối tượng… Các đặc tính động bao gồm sự tương tác giữa các đối tượng, sự hoạt động trên đối tượng, các tương tác của người dùng. Tuy nhiên, do các tính chất đặc biệt của nó, dữ liệu đa phương tiện đòi hỏi phải có các quan tâm mới khi chọn lựa mô hình dữ liệu. Ví dụ, một vài kiểu dữ liệu đa phương tiện (chẳng hạn video) hoặc một nhóm các kiểu (video và hình ảnh) có thể đòi hỏi các mô hình dữ liệu đăc biệt để cải thiện hiệu quả và tính mềm dẻo. Hơn nữa, do tầm quan trọng của việc tương tác trong các hệ thống đa phương tiện nên việc nó được hỗ trợ bỏi các mô hình dữ liệu trở nên quan trọng. Rất nhiều các mô hình dữ liệu khác nhau như mô hình mạng, quan hệ, ngữ nghĩa, và hướng đối tượng đang tồn tại và một vài mô hình trong số đó đã được xem xét để thiết lập CSDL đa phương tiện. Có hai cách tiếp cận cơ bản trong việc mô hình hoá dữ liệu đa phương tiện là:  Phương pháp thứ nhất: xây dựng một mô hình dữ liệu đa phương tiện trên nền tảng của mô hình dữ liệu của một CSDL truyền thống (thường là CSDL quan hệ hoặc CSDL hướng đối tượng) bằng cách sử dụng các giao diện tương ứng đối với dữ liệu đa phương tiện. Các vấn đề nảy sinh với cách tiếp cận này là các cấu trúc bên dưới (của CSDL truyền thống) không được thiết kế dành cho dữ liệu đa phương tiện, hơn nữa sự khác biệt cơ bản các yêu cầu của một CSDL truyền thống đối với CSDL đa phương tiện khiến cho giao diện trở thành nơi nghẽn cổ chai trong toàn bộ hệ thống. Các vấn đề này dẫn tới cách tiếp cận thứ hai;  Phương pháp thứ hai: phát triển các mô hình dữ liệu thực thụ dành cho dữ liệu đa phương tiện từ đầu chứ không xây dựng trên cơ sở của các CSDL truyền thống, tuy nhiên mọi người đều nhất trí rằng các nỗ lực như vậy đều phải dựa trên kỹ thuật hướng đối tượng. Liên quan đến kỹ thuật này thì có 2 mô hình tiêu biểu là mô hình đối tượng và mô hình quan hệ - đối tượng. Hiện nay, người ta vẫn đang tranh cãi mô hình nào là tốt hơn cho CSDL đa phương tiện. Mô hình quan hệ - đối tượng có ưu thế hơn vì nó có thể đại diện cho các kiểu dữ liệu phức tạp. Nó bao gồm cả 2 kiểu mô hình và có thể mở rộng để nắm bắt các cấu trúc tạm thời và các tính năng đặc biệt khác. 4.2. Lưu trữ đối tượng đa phương tiện: 21 Lưu trữ vật lý các dữ liệu đa phương tiện đòi hỏi các phương thức để chuyển đổi, quản lý, trao đổi và phân phối một khối lượng dữ liệu khổng lồ, các hệ thống đa phương tiện thông thường sử dụng phương thức phân cấp đối với các thiết bị lưu trữ. Các thiết bị lưu trữ có tốc độ cao như RAM, Cache lưu trữ các dữ liệu đang được xử lý trong khi đó các thiết bị lưu trữ có tốc độ chậm như HDD, CD dùng để lưu trữ các dữ liệu có tính chất dài hạn, cố định. Khi đó, hiệu suất sẽ phụ thuộc vào khả năng của cơ chế chuyển đổi các dữ liệu đa phương tiện tương ứng với mức tối ưu hoá trong hệ thống lưu trữ phân cấp. Các cơ chế nén dữ liệu kết hợp với các cơ chế chuyển đổi dữ liệu góp phần làm giảm các yêu cầu khổng lồ về mặt lưu trữ, phương thức cơ bản được sử dụng ở đây là chuyển đổi dữ liệu đa phương tiện sang một số vùng chuyển đổi để loại bỏ sự dư thừa của dữ liệu gốc, các quá trình giải nén sẽ làm nhiệm vụ chuyển đổi ngược các dữ liệu này về dạng gốc của nó. Quá trình này sẽ dẫn đến việc mất mát dữ liệu, tuy nhiên việc mất mát này đươc hầu hết các ứng dụng multimedia cho phép. Phụ thuộc vào mức độ của hạt nhân mà một đối tượng đa phương tiện có thể thể hiện toàn bộ hoặc một phần đoạn video, một frame, một hình ảnh riêng lẻ thậm chí cả từng đối tượng cá thể trong một ảnh hoặc một đoạn video. Vấn đề chính đặt ra ở đây là khả năng lưu trữ có hạn, băng thông hạn chế của hệ thống lưu trữ các kênh truyền thông, tỷ lệ sẵn sàng của các loại dữ liệu đa phương tiện. Tỷ lệ sẵn sàng của dữ liệu chỉ ra số lượng dữ liệu tối thiểu cần thiết đối với mỗi đơn vị thời gian cần đáp ứng đối với các đòi hỏi về yêu cầu chất lượng trong quá trình thể hiện các đối tượng đa phương tiện. Đứng từ quan điểm này, các yêu cầu về lưu trữ của dữ liệu multimedia được giải quyết bằng cách phân chia dữ liệu thành các đối tượng đa phương tiện nhỏ hơn để có thể lưu trữ trong các đơn vị lưu trữ nhỏ hơn. Với việc sắp xếp lưu trữ phân cấp, các đối tượng đa phương tiện có thể được lưu trữ ở các mức độ khác nhau. Khi tỷ lệ sử dụng các đối tượng dữ liệu đa phương tiện thay đổi, các đối tượng này cần phải được phân phối lại, và có thể được lưu trữ trên các thiết bị khác, tại các mức khác nhau của hệ thống lưu trữ. Vấn đề cần giải quyết lúc này chỉ là tìm ra giải pháp tối ưu cho việc phân rã, phân phối và tái phân phối các đối tượng đa phương tiện. 4.3. Chỉ số hóa đa phương tiện: Cũng như trong các CSDL truyền thống, các dữ liệu multimedia có thể được khai thác thông qua các định danh, các thuộc tính, các từ khoá và sự liên kết giữa chúng. Sử dụng các từ khoá là phương pháp chiếm ưu thế để chỉ số hoá dữ liệu đa phương tiện. Con người thường chọn các từ khoá từ một tập các từ vựng nhất định, điều này tạo ra một số khó khăn khi áp dụng đối với dữ liệu đa phương tiện vì chúng thường được làm một cách 22 thủ công và rất tốn thời gian và các kết quả thường là chủ quan và rất hạn chế phụ thuộc vào từ vựng. Một phương pháp khác được sử dụng dựa trên việc truy cập nội dung, nó xem xét đến nội dung thực sự của dữ liệu đa phương tiện hoặc xuất phát từ ngữ cảnh của thông tin. Trong thời gian gần đây, việc nghiên cứu chỉ số hoá dựa trên nội dung đã được tiến hành hết sức mạnh mẽ với mục đích là chỉ số hoá dữ liệu đa phương tiện dựa trên các đặc trưng xác định thu được trực tiếp từ dữ liệu. Các đặc trưng khác nhau như màu sắc, hình dạng, kết cấu bề mặt, các chuỗi đặc trưng và các đặc trưng khác đã được dùng để chỉ số hoá các ảnh. Để thu được các đặc trưng này đòi hỏi phải phân tích tự động dữ liệu đa phương tiện, các phương thức chính được sử dụng đối với dữ liệu ảnh và dữ liệu video là xử lý ảnh, đón nhận ảnh và phân tích chuỗi video. Đối với dữ liệu video, chuỗi video trước tiên được phân tách thành các chuỗi hợp thành, sau đó các đặc trưng tóm tắt (thường là các frame khoá) sẽ được lựa chọn để đặc trưng cho mỗi chuỗi. Việc chỉ số hoá tiếp theo đối với dữ liệu video cũng dựa trên các frame khoá cũng giống như đối với dữ liệu ảnh Đối với dữ liệu âm thanh, việc chỉ số hoá dựa trên nội dung có thể có sự tham gia của việc phân tích tín hiệu, tự động nhận biết lời nói cùng với việc chỉ số hoá dựa trên từ khoá. Mặt khác, việc chỉ số hoá có thể dựa trên các thông tin khác phụ thuộc vào kiểu của dữ liệu âm thanh, ví dụ một vài nhà phát triển đã sử dụng các đặc trưng về nhịp điệu, hợp âm và giai điệu cho việc chỉ số hoá dựa trên nội dung đối với dữ liệu âm thanh. Tương tự như vậy, việc tìm kiếm và khai thác dữ liệu âm thanh dựa trên nội dung đã được đề xuất dựa trên các đặc tính của dữ liệu âm thanh như đã được chỉ ra qua các đặc trưng về âm học và giác quan… Việc chỉ số hoá dựa trên nội dung cũng gợi ra một vài vấn đề cần quan tâm. Trước hết, cũng với một dữ liệu đa phương tiện nhưng mỗi người có thể hiểu theo một cách khác nhau. Thứ hai, người dùng thường cần các thông tin thay đổi khác nhau, vì vậy một đặc trưng duy nhất có thể là không đủ để chỉ số hoá hoàn toàn một kiểu dữ liệu đa phương tiện cho trước. Một vấn đề khác cần phải xem xét là vấn đề hiệu quả, việc chỉ số hoá phải nhanh và các chỉ số này phải được lưu trữ một cách hiệu quả để phục vụ cho việc truy cập dễ dàng khi mà số lượng các dữ liệu đa phương tiện được lưu trữ là rất lớn. Bởi vì đặc tính vốn có của dữ liệu multimedia là rất khác nhau nên việc chỉ số hoá không thể tiến hành một cách hoàn toàn tự động, đơn cử như máy tính có thể phân tích dễ dàng một bức ảnh có chứa các tác phẩm nghệ thuật, nhưng nó gần như không thể tự động xác định được ý nghĩa của tác phẩm đó, điều đó chỉ có con người làm được. 4.4. Hỗ trợ truy vấn đa phương tiện, khai thác và duyệt: 23 Các truy vấn của người dùng thường được xử lý bằng cách sử dụng các chỉ số có sẵn, tuy nhiên khác với CSDL truyền thống, tính chính xác trong tìm kiếm đối với dữ liệu đa phương tiện không phải là chính xác tuyệt đối. Thông thường khi so sánh hai dữ liệu đa phương tiện thì kết quả thu được thường là gần đúng hoặc tương tự, giả sử trong trường hợp các dữ liệu này có cùng dữ liệu đầu vào thì kết quả thu được từ một truy vấn có thể sinh ra rất nhiều giá trị. Đã có rất nhiều các nghiên cứu đi sâu vào việc tìm ra một phương thức thích hợp trợ giúp cho người dùng có được khả năng khai thác hiệu quả các dữ liệu đa phương tiện, chẳng hạn thông qua việc cung cấp các giao diện thích hợp để người dùng có thể duyệt một cách thuận lợi các kết quả có được từ quá trình tìm kiếm. Việc hỗ trợ duyệt một cách trực tiếp cho phép người sử dụng có thể khai thác bất kỳ thông tin nào có khả năng liên quan đến kết quả hiện thời bằng cách lựa chọn các mục dữ liệu tương ứng cần quan tâm sâu hơn. Truy vấn bằng ví dụ (Query-by-Example) là một phương pháp chính được sử dụng để nhập các truy vấn đối với CSDL đa phương tiện, đặc biệt là đối với dữ liệu ảnh. Ở đây người dùng đưa ra các yêu cầu bằng cách sử dụng một mẫu có sẵn (ví dụ như một ảnh tương tự), vì vậy giao diện được sử dụng để nhập truy vấn vào hệ thống trở thành một vấn đề cần phải quan tâm. Do tính chất đa dạng của các kiểu dữ liệu đa phương tiện nên mỗi kiểu dữ liệu đa phương tiện có thể phải có các giao diện truy vấn khác nhau, vấn đề cần được xem xét ở đây là làm thế nào để tích hợp được các giao diện khác nhau vào một hệ thống tích hợp CSDL đa phương tiện. Một vấn đề khác cũng cần phải giải quyết là việc bao gồm truy vấn các dữ liệu không gian hoặc truy vấn các dữ liệu thời gian đòi hỏi phải có các thông tin không gian hoặc thời gian. ----------------------------- Ngoài các vấn đề nêu trên, các MDBMS còn có một số vần đề khác mà do phạm vi của đề tài nghiên cứu cấp môn học nên đã không đề cập đến. Cụ thể đó là:  Tích hợp đa phương tiện, thể hiện và chất lượng của dịch vụ (QoS);  Quản trị CSDL đa phương tiện phân tán;  Sự hỗ trợ của hệ thống. ỨNG DỤNG CỦA CƠ SỞ DỮ LIỆU CHƯƠNG IV. ĐA PHƯƠNG TIỆN – ORACLE MULTIMEDIA 1. Giới thiệu chung: Oracle Multimedia (OM – trước đây là Oracle Intermedia) là một tính năng cho phép CSDL Oracle lưu trữ, quản lý, và truy xuất hình ảnh, video, âm thanh, hoặc các dữ liệu 24 media hỗn hợp. OM mở rộng độ tin cậy, tính sẵn có, và khả năng quản lý dữ liệu của CSDL Oracle đối với nội dung đa phương tiện kiểu truyền thống, trên Internet, trong thương mại điện tử, và trong các ứng dụng đa phương tiện. OM không kiểm soát các thiết bị thu giữ media (media capture) hoặc các thiết bị đầu ra, chức năng này được giao lại cho phần mềm ứng dụng. 2. Công nghệ quan hệ - đối tượng: OracleDB là một hệ quản trị CSDL quan hệ - đối tượng. Điều này có nghĩa là, ngoài vai trò truyền thống của mình trong việc quản lý an toàn và hiệu quả dữ liệu quan hệ, nó còn cung cấp sự hỗ trợ cho sự định nghĩa về các loại đối tượng, bao gồm cả các dữ liệu liên quan với các đối tượng và các phương thức có thể được thực hiện trên chúng. Công nghệ quan hệ - đối tượng bao gồm việc hỗ trợ tích hợp BLOBs để cung cấp cơ sở cho việc bổ sung các đối tượng phức tạp, chẳng hạn như âm thanh, hình ảnh, và video được số hóa vào CSDL. Trong Oracle Multimedia, đặc trưng dữ liệu âm thanh được lưu trữ dưới một kiểu dữ liệu quan hệ đối tượng là ORDAudio, tương tự với dữ liệu hỗn hợp là ORDDoc, hình ảnh là ORDImage, video là ORDVideo. Cả 4 kiểu trên đều lưu trữ thông tin nguồn dữ liệu trong một kiểu dữ liệu quan hệ đối tượng khác gọi là ORDSource. 3. Các khả năng của Oracle Multimedia: Các khả năng đa phương tiện Oracle bao gồm lưu trữ, thu hồi, quản lý, và thao tác với các dữ liệu đa phương tiện được quản lý bởi CSDL Oracle. OM hỗ trợ lưu trữ các định dạng tập tin thông dụng, bao gồm các hình ảnh tạo ra trên máy tính, và các định dạng âm thanh, video trong CSDL. OM cung cấp các phương tiện để thêm các cột hay đối tượng chứa dữ liệu âm thanh, hình ảnh, và video, hay các dữ liệu media hỗn hợp khác vào các bảng có sẵn, và chèn vào và lấy ra các dữ liệu đa phương tiện. Điều này cho phép các nhà thiết kế CSDL mở rộng các CSDL hiện có với dữ liệu đa phương tiện, hoặc để xây dựng các ứng dụng CSDL đa phương tiện mới dành cho người dùng cuối. OM sử dụng các loại đối tượng, tương tự như các lớp Java hay C++, để mô tả dữ liệu đa phương tiện. Những loại đối tượng này được gọi là ORDAudio, ORDDoc, ORDImage, và ORDVideo. Một thể hiện của các loại đối tượng này bao gồm các thuộc tính, siêu dữ liệu, dữ liệu media, và các phương thức. Dữ liệu media chính là dữ liệu âm thanh, hình ảnh, video, hoặc các dữ liệu media hỗn hợp khác. Siêu dữ liệu là thông tin về dữ liệu, chẳng hạn như độ dài đối tượng, kiểu nén, hoặc định dạng. Các phương thức là các thủ tục mà có thể được thực hiện trên các đối tượng, chẳng hạn như getContent() và setProperties(). 25 Các đối tượng OM có một mô hình lưu trữ dữ liệu media chung. Các thành phần dữ liệu media của các đối tượng này có thể được lưu trữ trong cơ sở dữ liệu, trong một đối tượng kiểu BLOB dưới sự kiểm soát giao dịch. Các dữ liệu media cũng có thể được lưu trữ bên ngoài cơ sở dữ liệu, mà không nằm trong sự kiểm soát giao dịch. Trong trường hợp này, một con trỏ được lưu trữ trong cơ sở dữ liệu dưới sự kiểm soát giao dịch, và các dữ liệu media được lưu trữ trong:  Đối tượng lớn dựa trên tập tin (BFILE);  Một đường dẫn URL trên mạng;  Một nguồn do người dùng xác định trên một máy chủ dữ liệu media chuyên biệt, hoặc máy chủ khác. Siêu dữ liệu media được lưu trữ trong CSDL dưới sự kiểm soát của OM. Dù cho dữ liệu media được lưu trữ bên trong hay bên ngoài CSDL, OM đều quản lý siêu dữ liệu cho tất cả các loại media và có thể tự động trích xuất siêu dữ liệu cho âm thanh, hình ảnh, video. Siêu dữ liệu này bao gồm các thuộc tính sau:  Lưu trữ thông tin về âm thanh, hình ảnh, video, hay các dữ liệu media hỗn hợp khác, bao gồm loại nguồn, đường dẫn, tên nguồn, và dữ liệu được lưu trữ cục bộ (trong CSDL) hay bên ngoài;  Cập nhật thông tin nhãn thời gian cho âm thanh, hình ảnh, và video, hoặc các dữ liệu media hỗn hợp khác;  Mô tả dữ liệu âm thanh và video;  Định dạng của dữ liệu âm thanh, hình ảnh, video, hoặc các dữ liệu media hỗn hợp khác;  Kiểu MIME của dữ liệu âm thanh, hình ảnh, và video, hoặc các dữ liệu media hỗn hợp khác;  Các đặc trưng âm thanh: kiểu mã hóa, số kênh, tỉ lệ mẫu, kích thước mẫu, kiểu nén, và thời gian phát (duration);  Các đặc trưng hình ảnh: chiều cao và chiều rộng, độ dài nội dung hình ảnh, định dạnh nội dung hình ảnh, và định dạng nén hình ảnh;  Các đặc trưng video: chiều rộng và cao của khung, độ phân giải của khung, tỉ lệ khung, thời gian phát, số khung, kiểu nén, số lượng màu sắc và bit rate.  Các siêu dữ liệu được trích xuất trong XML, như đạo diễn hay nhà sản xuất của một bộ phim. Một vài ví dụ về ứng dụng của OM:  Nơi lưu trữ cho các hình ảnh kiểm tra kĩ thuật số;  Hồ sơ sức khỏe điện tử; 26  Tổng đài điện thoại;  Học từ xa và học trực tuyến;  Tiếp thị bất động sản;  Phòng trưng bày nghệ thuật kĩ thuật số;  Nơi lưu trữ các tài liệu hình ảnh;  Thông tin tin tức dịch vụ khách hàng tài chính;  Xuất bản web;  Lưu trữ các web nhạc và video. 4. Khái niệm âm thanh: 4.1. Âm thanh số hóa: ORDAudio hợp nhất việc lưu trữ, truy xuất và quản lý dữ liệu âm thanh số hóa trong một CSDL. Âm thanh có thể được tạo ra bằng máy thu âm, một nguồn âm thanh như microphone, âm thanh số hóa, các thiết bị ghi âm chuyên biệt khác, hoặc thậm chí bởi các thuật toán chương trình. Thiết bị thu âm tạo ra một tín hiệu tương tự hay tín hiệu liên tục, chẳng hạn như âm thanh do một micro thu vào hoặc âm thanh được ghi lại trên các media từ tính và chuyển đổi nó thành những giá trị số với các đặc trưng điển hình của âm thanh như định dạng, kiểu mã hóa, số kênh, sampling rate, kích thước mẫu, kiểu nén, và thời gian phát. 4.2. Các thành phần trong âm thanh: Âm thanh số hóa chứa dữ liệu âm thanh (các bit đã số hóa) và các thuộc tính mô tả dữ liệu âm thanh. Âm thanh có thể có các định dạng khác nhau, các kiểu mã hóa, các kiểu nén, các số kênh, các sampling rate, các kích thước mẫu và thời gian phát khác nhau phụ thuộc vào cách mà dữ liệu âm thanh được thu lại theo kĩ thuật số hóa. ORDAudio có thể lưu trữ và truy xuất dữ liệu âm thanh của bất cứ định dạng dữ liệu có hỗ trợ nào. ORDAudio có thể tự động trích xuất các siêu dữ liệu từ dữ liệu âm thanh của nhiều định dạng âm thanh thông dụng, ví dụ như: wav, ra, rm, ram, mp4, mpg, 3gp, au, aff, atf. Kích thước của âm thanh số hóa (số byte) có xu hướng lớn hơn so với các đối tượng máy tính truyền thống, chẳng hạn như số và văn bản. Do đó, một số cơ chế mã hóa được sử dụng để nén các dữ liệu âm thanh xuống còn ít byte hơn, do đó chiếm một dung lượng tải nhỏ hơn trên các thiết bị lưu trữ và mạng. 5. Khái niệm ORDDoc – dữ liệu media hỗn hợp: 5.1. Dữ liệu media hỗn hợp được số hóa: 27 ORDDoc hợp nhất việc lưu trữ, truy xuất và quản lý các dữ liệu media hỗn hợp trong CSDL. Kiểu ORDDoc có thể lưu trữ bất kỳ dữ liệu media hỗn hợp nào bao gồm cả âm thanh, hình ảnh, và các dữ liệu video trong một cột CSDL. Thay vì có các cột riêng biệt cho các đối tượng âm thanh, hình ảnh, văn bản và video, bạn có thể sử dụng một cột của các đối tượng ORDDoc để đại diện cho tất cả các loại đa phương tiện trên. 5.2. Các thành phần trong dữ liệu media hỗn hợp: Các thành phần dữ liệu media hỗn hợp bao gồm các dữ liệu (các bit được số hóa) và các thuộc tính mô tả các dữ liệu media hỗn hợp. Dữ liệu media hỗn hợp có thể có các định dạng khác nhau, tùy thuộc vào ứng dụng tạo ra các dữ liệu media. OM có thể lưu trữ và truy xuất dữ liệu media của bất kì định dạng dữ liệu nào được hỗ trợ. Kiểu ORDDoc có thể được sử dụng trong các ứng dụng mà yêu cầu bạn phải lưu trữ các kiểu dữ liệu media hỗn hợp trong cùng một cột, do đó bạn có thể xây dựng một chỉ mục siêu dữ liệu chung trên tất cả các kiểu dữ liệu media khác nhau. Sử dụng chỉ mục này, bạn có thể tìm kiếm trên tất cả các loại dữ liệu media hỗn hợp khác nhau. Lưu ý rằng bạn không thể sử dụng kỹ thuật tìm kiếm tương tự nếu các loại dữ liệu media hỗn hợp khác nhau được lưu trữ trong các loại đối tượng khác nhau, trong các cột khác nhau của các bảng. ORDDoc có thể tự động trích xuất siêu dữ liệu từ dữ liệu của nhiều định dạng âm thanh, hình ảnh và video phổ biến. ORDDoc cũng có thể trích xuất các thuộc tính ứng dụng và lưu trữ chúng trong thuộc tính comments của đối tượng ở dạng XML. 6. Khái niệm hình ảnh: 6.1. Hình ảnh số hóa: ORDImage tích hợp việc lưu trữ, truy xuất, và quản lý hình ảnh kĩ thuật số trong một cơ sở dữ liệu. ORDImage hỗ trợ các hình ảnh hai chiều, tĩnh, và các hình ảnh raster số hóa được lưu trữ như sự biểu diễn nhị phân của các đối tượng hoặc các cảnh trong thế giới thực. Hình ảnh có thể được tạo ra bởi một văn bản hoặc máy quét ảnh, một nguồn video (như máy ảnh kỹ thuật số hoặc một VCR kết nối với một bộ số hóa video, các thiết bị chuyên chụp ảnh, hay thậm chí là một thuật toán chương trình). Thiết bị chụp tiếp nhận một tín hiệu tương tự hay tín hiệu liên tục như ánh sáng chiếu vào phim trong máy ảnh, và chuyển nó thành các giá trị số trên một lưới các điểm dữ liệu hai chiều được gọi là pixel. 6.2. Các thành phần trong hình ảnh: 28 Hình ảnh số hóa bao gồm các dữ liệu hình ảnh (các bit đã được mã hóa) và các thuộc tính mô tả dữ liệu hình ảnh. Các dữ liệu hình ảnh (pixel) có thể có độ sâu khác nhau tùy thuộc vào ảnh được chụp như thế nào và có thể được tổ chức theo nhiều cách khác nhau. Việc tổ chức dữ liệu hình ảnh gọi là định dạng dữ liệu. ORDImage có thể lưu trữ và truy xuất dữ liệu hình ảnh của bất kỳ định dạng dữ liệu nào. ORDImage có thể xử lý và tự động trích xuất các thuộc tính hình ảnh của nhiều định dạng dữ liệu phổ biến như: bmp, cal, dcm, fpx, gif, jpg, pcx, png,… Các không gian lưu trữ cần thiết cho hình ảnh số hóa có thể lớn hơn so với các thuộc tính dữ liệu truyền thống như số và văn bản. Nhiều chương trình nén có sẵn để giảm bớt các byte, do đó giảm dung lượng trên thiết bị lưu trữ và giảm dung lượng tải trên mạng. 6.3. Metadata in Images Tính năng siêu dữ liệu nâng cao hành vi của các loại đối tượng ORDImage bằng cách thêm khả năng đọc (hay trích xuất) và ghi (hay nhúng) siêu dữ liệu của ứng dụng trong hình ảnh. Ngoài ra, tính năng này đã thông qua một tiêu chuẩn để biểu diễn siêu dữ liệu khi nó được phân tách từ một tập tin hình ảnh. Siêu dữ liệu có thể được lưu trữ trong một CSDL, đánh chỉ mục, tìm kiếm và tạo ra sự sẵn sàng cho các ứng dụng sử dụng các cơ chế chuẩn của CSDL Oracle. 7. Khái niệm video: 7.1. Video số hóa: ORDVideo tích hợp lưu trữ, truy xuất và quản lý dữ liệu video số hóa trong một CSDL. Video có thể được tạo ra bởi một đầu thu video, máy quay phim, video hoạt hình số hóa, các thiết bị quay video chuyên dụng khác, hoặc thậm chí bởi các thuật toán chương trình. Một số thiết bị ghi video tiếp nhận một tín hiệu tương tự hay liên tục, chẳng hạn như video được thu vào một máy quay phim hoặc video được ghi lại trên các media từ tính và chuyển đổi nó thành giá trị số với các đặc trưng điển hình của video chẳng hạn như định dạng, kiểu mã hóa, tỷ lệ khung hình, kích thước khung hình (chiều rộng và chiều cao), độ phân giải khung hình, độ dài video, kiểu nén , số lượng màu sắc, và bit rate. 7.2. Các thành phần của video: Video số hóa bao gồm các dữ liệu video (các bit đã được số hóa) và các thuộc tính mô tả cho các dữ liệu video. 29 Dữ liệu video có thể có định dạng khác nhau, các kiểu nén, tỉ lệ khung hình, kích thước khung hình, độ phân giải khung hình, thời gian chơi, loại nén, số lượng màu sắc và tốc độ bit phụ thuộc vào cách dữ liệu video kỹ thuật số đã được ghi lại. ORDVideo có thể lưu trữ và truy xuất dữ liệu video của bất kỳ định dạng dữ liệu nào được hỗ trợ. ORDVideo có thể:  Tự động trích xuất siêu dữ liệu từ dữ liệu video của nhiều định dạng video phổ biến;  Trích xuất các thuộc tính ứng dụng và lưu trữ chúng trong các thuộc tính “comments” của các đối tượng ở dạng XML;  Được thiết kế để có thể nhận ra và hỗ trợ thêm định dạng video (bởi vì nó có thể mở rộng). Kích thước của video số hóa (số byte) có xu hướng lớn so với các đối tượng máy tính truyền thống, chẳng hạn như số và văn bản. Do đó, một số cơ chế mã hóa được sử dụng dữ liệu để nén dữ liệu video còn byte ít hơn, do đó chiếm một dung lượng nhỏ trên các thiết bị lưu trữ và mạng. 8. Lưu trữ và truy vấn đa phương tiện: Media có thể được lưu trữ trong các loại đối tượng OM, hoặc trực tiếp trong BLOBs hoặc BFILEs. Bạn sẽ nhận thấy lợi ích lớn nhất bởi việc lưu trữ media trong các loại đối tượng OM. Tuy nhiên, nhiều tính năng của OM có sẵn để lưu trữ media trong các BLOBs và BFILEs đang sử dụng giao diện quan hệ. Giao diện quan hệ OM cho phép các nhà phát triển sử dụng các phương thức tĩnh của các loại đối tượng OM với các media hiện có và mới được lưu trữ trong BLOBs và BFILEs. Cụ thể, các nhà phát triển có thể di chuyển dữ liệu media giữa hệ thống tập tin cục bộ và cơ sở dữ liệu; phân tích và trích xuất các thuộc tính của dữ liệu media; và lưu trữ các đặc tính này dưới dạng một XMLType hoặc một CLOB được định dạng XML, và tùy chọn, trong các cột quan hệ cá nhân. Các nhà phát triển không cần phải thay đổi lược đồ ứng dụng hiện có hoặc khởi tạo các loại đối tượng OM để tận dụng lợi thế của giao diện quan hệ này. Các phương thức tĩnh của OM cũng có thể được sử dụng để thực hiện các hoạt động xử lý hình ảnh như cắt, scale, nén, chuyển đổi định dạng. Các kiểu đối tượng ORDAudio, ORDDoc, ORDImage và ORDVideo đều chứa một thuộc tính của kiểu ORDSource và các phương thức cho việc thao tác trên các nguồn dữ liệu đa phương tiện. 8.1. Lưu trữ dữ liệu đa phương tiện 30 OM có thể lưu trữ dữ liệu đa phương tiện như là một nguồn nội bộ trong CSDL, dưới sự kiểm soát giao tác như một BLOB. Nó cũng có thể tham chiếu mở rộng các dữ liệu đa phương tiện số hóa được lưu trữ như một nguồn bên ngoài trong một tập tin (tập tin này chỉ thuộc về một hệ điều hành cụ thể) trong một hệ thống tập tin cục bộ, như một URL trên một máy chủ HTTP, hoặc như là một nguồn được định nghĩa bởi người dùng trên các máy chủ khác, chẳng hạn như các máy chủ media. Mặc dù các cơ chế lưu trữ bên ngoài này đặc biệt thuận lợi cho việc tích hợp các bộ dữ liệu đa phương tiện hiện có với một CSDL, nhưng các dữ liệu đa phương tiện sẽ không được đặt dưới sự kiểm soát giao tác nếu nó không được lưu trữ trong CSDL. Các BLOB được lưu trữ trong các tablespace của CSDL bằng cách tối ưu hóa không gian và cung cấp các truy cập hiệu quả. Các BLOB lớn có thể không được lưu trữ nội tuyến (BLOBs dưới 4 kilobyte có thể được lưu trữ nội tuyến) với các dòng dữ liệu khác. Tùy thuộc vào kích thước của BLOB, một bộ định vị (locator) được lưu trữ trong hàng và một BLOB đích thực (lên đến 8-128 TB, tùy thuộc vào kích thước khối) được lưu trữ trong các tablespace khác. Bộ định vị có thể được coi là một con trỏ đến vị trí thực tế của giá trị BLOB. Khi bạn chọn một BLOB, thì có nghĩa là bạn đang chọn định vị thay vì giá trị, mặc dù điều này được thực hiện minh bạch. Một lợi thế của thiết kế này là định vị của nhiều BLOB có thể tồn tại trong một dòng đơn. Ví dụ, bạn có thể muốn lưu trữ một đoạn clip ngắn của một cuốn băng dạy học, một đoạn ghi âm chứa mô tả ngắn gọn về nội dung của nó, một đề cương của khóa học, một tấm ảnh của giảng viên, và một bộ bản đồ và chỉ dẫn đến mỗi trung tâm đào tạo đều nằm trong cùng một dòng. Bởi vì BFILE không đặt dưới sự kiểm soát giao tác của CSDL, người dùng có thể thay đổi nguồn bên ngoài mà không cần cập nhật CSDL, do đó gây ra một sự mâu thuẫn với định vị BFILE. Các loại đối tượng OM như ORDAudio, ORDDoc, ORDImage và ORDVideo cung cấp phương thức bao gói để làm các việc sau:  Thiết lập nguồn dữ liệu là cục bộ hoặc ở bên ngoài;  Sửa đổi thời gian lần cập nhật mới nhất của đối tượng;  Thiết lập thông tin về các kiểu nguồn bên ngoài, vị trí, và tên của dữ liệu ;  Chuyển dữ liệu vào hoặc ra khỏi CSDL;  Lấy ra các thông tin về nội dung dữ liệu cục bộ như chiều dài, vị trí của nó, đưa nội dung vào một BLOB tạm thời, hoặc xóa nó;  Truy cập nguồn dữ liệu bằng cách mở, đọc, viết, cắt xén và đóng nó lại. 8.2. Truy vấn dữ liệu đa phương tiện: 31 Khi được lưu trữ trong một CSDL, dữ liệu đa phương tiện có thể được truy vấn và lấy ra bằng cách sử dụng các cột chữ-hoặc-số khác nhau hoặc các thuộc tính đối tượng của bảng để tìm một hàng có chứa dữ liệu mong muốn. Ví dụ, bạn có thể chọn một video clip từ bảng Traning với tên khóa học là 'Oracle Database Concepts'. Dữ liệu đa phương tiện có thể được truy vấn theo các siêu dữ liệu được trích xuất, theo các cột trong bảng khác và theo nội dung, chẳng hạn như truy xuất dựa trên nội dung hình ảnh với các chỉ mục chuyên biệt tùy chọn. 9. Nạp dữ liệu đa phương tiện Dữ liệu đa phương tiện có thể được quản lý tốt nhất bằng CSDL Oracle. Dữ liệu đa phương tiện của bạn cần phải được nạp vào CSDL để tận dụng các ưu thế về độ tin cậy, khả năng mở rộng, tính sẵn có, và khả năng quản lý dữ liệu. Để đưa dữ liệu đa phương tiện vào CSDL với số lượng lớn, bạn có thể sử dụng:  SQL*Loader SQL*Loader là một tiện ích của Oracle cho phép bạn nạp dữ liệu, và trong trường hợp này, dữ liệu đa phương tiện (dữ liệu LOB), từ các tập tin đa phương tiện bên ngoài vào một bảng của một CSDL có chứa các cột thuộc kiểu đối tượng OM.  PL/SQL Một sự mở rộng các thủ tục của SQL, PL/SQL là một ngôn ngữ lập trình tiên tiến thế hệ thứ tư (4GL) của Oracle. Bạn có thể viết các thủ tục PL/SQL để nạp dữ liệu đa phương tiện từ BLOB, hệ thống tập tin, và các nguồn dữ liệu media theo URL vào các cột thuộc kiểu đối tượng OM. Ưu điểm của việc sử dụng SQL*Loader là nó rất dễ dàng để tạo ra và kiểm tra tập tin kiểm soát hoạt động nạp dữ liệu của bạn. Ưu điểm của việc sử dụng các đoạn mã PL/SQL để tải dữ liệu của bạn là bạn có thể gọi các phương thức khi bạn tải dữ liệu để tạo ra các hình ảnh thu nhỏ, hoặc trích xuất thuộc tính.  32 TÀI LIỆU THAM KHẢO Tiếng Anh [1] Arif Ghafoor (1995). Multimedia Database Management System. ACM Computing Surveys, Vol. 27, No 4, December. Retrievaled December 16, 2012 from pilani.ac.in/discipline/csis/vimal/267MMC/AdditionalReadings/Multimedia%20Database s.pdf [2] Prof. Dr. Gunter Saake (2012). Multimedia Retrieval in Databases. Foundations and Index Structures. OvG Universität Magdeburg, Fakultät für Informatik, Institut für Technische und Betriebliche Informationssysteme. Retrievaled December 16, 2012 from [3] V.S. Subrahmanian (1998). Multimedia Database. Principles of Multimedia Database Systems, chapter 9. Morgan Kaufmann Publishers Inc. San Francisco, CA, USA. Retrievaled December 17, 2012 from [4] Chien Yu and Teri Brandenburg (2011). Multimedia database applications: issues and concerns for classroom teaching. Department of Instructional Systems & Workforce Development, Mississippi State University. Retrievaled December 15, 2012 from Tiếng Việt [5] Trần Hoài Nam (2004). Luận văn thạc sĩ. Cơ sở dữ liệu đa phương tiện – yêu cầu và các vấn đề. Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội. Truy xuất vào ngày 16/12/2012 từ D%E1%BB%AE-LI%E1%BB%86U-%C4%90A-PH%C6%AF%C6%A0NG- TI%E1%BB%86N-Multimedia-Database [6] Khuyết danh. Bài giảng Cơ sở dữ liệu đa phương tiện. Truy xuất vào ngày 17/12/2012 từ Liên kết [7] [8] [9]

Các file đính kèm theo tài liệu này:

  • pdfbaocaocsdldaphuongtien_nhom04_tin4_5051.pdf