Dữ liệu đa phương tiện có thể được quản lý tốt nhất bằng CSDL Oracle. Dữ liệu đa
phương tiện của bạn cần phải được nạp vào CSDL để tận dụng các ưu thế về độ tin cậy,
khả năng mở rộng, tính sẵn có, và khả năng quản lý dữ liệu. Để đưa dữ liệu đa phương
tiện vào CSDL với số lượng lớn, bạn có thể sử dụng:
SQL*Loader
SQL*Loader là một tiện ích của Oracle cho phép bạn nạp dữ liệu, và trong trường hợp
này, dữ liệu đa phương tiện (dữ liệu LOB), từ các tập tin đa phương tiện bên ngoài vào
một bảng của một CSDL có chứa các cột thuộc kiểu đối tượng OM.
PL/SQL
Một sự mở rộng các thủ tục của SQL, PL/SQL là một ngôn ngữ lập trình tiên tiến thế
hệ thứ tư (4GL) của Oracle. Bạn có thể viết các thủ tục PL/SQL để nạp dữ liệu đa
phương tiện từ BLOB, hệ thống tập tin, và các nguồn dữ liệu media theo URL vào các
cột thuộc kiểu đối tượng OM.
33 trang |
Chia sẻ: lylyngoc | Lượt xem: 6518 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Tìm hiểu cơ sở dữ liệu đa phương tiện, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
nguyên lý tự trị là mô hình kiến trúc thích hợp nhất. Các kỹ thuật hướng
đối tượng chính là công cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý này
bằng cách xem mỗi loại dữ liệu nguồn là một đối tượng mà các phương thức của nó có
thể truy cập được từ một CSDL đa phương tiện tổng thể.
4.2. Nguyên lý đồng nhất (uniformity):
Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là nguyên lý đồng nhất,
nguyên lý này giúp chúng ta tìm được một cấu trúc tóm tắt chung cho tất cả các loại dữ
liệu. Cấu trúc này có thể được dùng trong việc chỉ số hóa tất cả các loại dữ liệu qua đó
tạo ra một “chỉ số thống nhất” mà chúng ta có thể dùng để truy cập tới các đối tượng khác
nhau. Hay nói một cách khác là chúng ta có thể trình bày tất cả các đối tượng khác nhau
9
(ảnh, video, âm thanh, văn bản) trong một cấu trúc dữ liệu duy nhất và qua đó phát triển
các thuật toán để truy vấn cấu trúc dữ liệu này.
Hình 2: Mô tả nguyên lý đồng nhất
Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất đòi hỏi chúng ta phải tìm ra
được một cấu trúc dữ liệu chung mà có thể dùng để lưu trữ các thông tin về nội dung của
hình ảnh, video, văn bản, âm thanh và các loại dữ liệu khác. Điều này đòi hỏi chúng ta
phải phân tích nội dung của mỗi kiểu dữ liệu và tóm tắt được phần chung của chúng, qua
đó xây dựng một bộ chỉ số dựa trên các yếu tố chung đã được xác định này.ưu điểm nổi
bật của nguyên lý đồng nhất là dễ dàng triển khai và các thuật toán thường được thực
hiện rất nhanh. Nhược điểm chính của nguyên lý này là các sự chú giải phải được tạo ra
theo một cách riêng nào đó, thường là được tạo ra một cách thủ công hoặc là tự động,
việc tạo ra các chú giải một cách thủ công thường đỏi hòi nhiều về mặt thời gian cũng
như chi phí, mặt khác trong quá trình tạo các chú giải này thường xảy ra sự mất mát
thông tin nếu ngôn ngữ dùng để chú giải không trình bày hết được các khía cạnh của nội
dung. Có thể đưa ra đây một số ví dụ như ngôn ngữ chú giải nội dung của hình ảnh có thể
làm mất các thông tin về bề mặt của một điểm ảnh (pixel) hoặc một nhóm điểm ảnh.
Tương tự như vậy ngôn ngữ chú giải nội dung của âm thanh có thể làm mất các thông tin
về biên độ, tần số của tín hiệu tại một thời điểm nào đó.
10
4.3. Nguyên lý lai (hybrid):
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý đã trình bày ở trên.
Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ số (index) riêng của
chúng, trong khi đó các kiểu dữ liệu khác sẽ sử dụng một chỉ số (Index) “thống nhất”.
Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc vào các đặc tính khác nhau.
Hình 3: Mô tả nguyên lý lai ghép
Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên, đồng thời
giảm thiểu được một số các nhược điểm của chúng. Giả sử chúng ta muốn tạo ra một
CSDL đa phương tiện bao gồm các kiểu dữ liệu M1, …….,Mn, chúng ta bắt đầu bằng
việc phân chia tập này thành 2 phần:
Phần 1: bao gồm các loại dữ liệu kế thừa từ các nguồn dữ liệu có sẵn, tồn tại sẵn
các chỉ số và các thuật toán để thao tác với chỉ số. Với việc bố trí này chúng ta đã tận
dụng được lợi thế của các chỉ số và mã nguồn sẵn có.
Phần 2: bao gồm các dữ liệu không được kế thừa từ bất kỳ nguồn nào và do đó
không có sẵn các chỉ số của mình (điều này đồng nghĩa với việc là cũng không có bất
kỳ thuật toán nào để có thể thao tác với tập chỉ số). Trong trường hợp này việc tiếp
cận xây dựng hệ thống theo nguyên lý đồng nhất là cách thức thích hợp nhất ngay cả
khi là cách tiếp cận này có thể nảy sinh ra việc gây mất mát các thông tin vật lý chi
tiết.
11
Sau khi đã tiến hành xong việc phân chia, chúng ta bắt đầu tiến hành việc xây dựng
các thuật toán cần thiết để kết hợp các nguồn dữ liệu khác nhau lại bằng việc sử dụng các
tập chỉ số riêng của chúng. Cách tiếp cận này giúp chúng ta thừa kế được tối đa các tài
nguyên có sẵn, đồng thời giảm thiểu được các công việc phải thực hiện thêm bởi vì các
tệp chỉ số riêng có sẵn đối với mỗi loại dữ liệu đã được tận dụng.
NGÔN NGỮ TRUY VẤN DỮ LIỆU CHƯƠNG II.
ĐA PHƯƠNG TIỆN
Ngày nay, với sự phát triển vượt bậc của công nghệ thu giữ (capture) dữ liệu nghe
nhìn và không gia lưu trữ ngày càng gia tăng đã cho phép tạo ra các bộ sưu tập khổng lồ
các dữ liệu đa phương tiện. Tuy nhiên, khi CSDL ngày càng phình to ra thì những khó
khăn trong việc tìm kiếm một bức ảnh hay video mong muốn lại cũng tăng lên. Để giải
quyết vấn đề này, người ta có hai phương pháp đã được phát triển:
Phương pháp thứ nhất: sử dụng các thông tin được nhập thủ công hay được bao
gồm trong thiết kế của bảng, như tiêu đề, các từ khóa mô tả - thường đã được xác định
từ trước trong lược đồ phân loại (classification schemes). Phương pháp này được biết
đến với tên gọi là truy xuất dựa trên thuộc tính (attribute-based retrieval);
Phương pháp thứ hai: sử dụng các đặc trưng được rút trích từ nội dung của đối
tượng đa phương tiện và sự nhận diện đối tượng để phân loại nội dung dữ liệu đa
phương tiện. Phương pháp này được biết đến với tên gọi là truy xuất dựa trên nội
dung (content-based retrieval). Phương pháp này đề xuất ý tưởng sử dụng vectơ đặc
trưng – một bộ giá trị số có kích thước cố định được rút trích từ nội dung để truy vấn.
Do tính chất phức tạp và độ rộng của phương pháp thứ hai nên nghiên cứu này chỉ tập
trung tìm hiểu phương pháp thứ nhất. Cụ thể, chúng ta sẽ tìm hiểu một ngôn ngữ truy vấn
đơn giản được xây dựng dựa trên SQL dùng để khai thác dữ liệu đa phương tiện. Ở phần
trên chúng ta đã tìm hiểu cách tổ chức dữ liệu theo nguyên lý đồng nhất và lai ghép. Việc
mở rộng ngôn ngữ truy vấn SQL sử dụng cho việc truy vấn dữ liệu được xây dựng bởi
kiến trúc mô tả đồng nhất sẽ là tiền đề để chúng ta tiếp tục mở rộng ngôn ngữ truy vấn
dùng cho việc khai thác các dữ liệu media được xây dựng theo kiến trúc lai ghép. Chúng
ta sẽ cùng tìm hiểu xem xét một hệ thống cơ sở dữ liệu đa phương tiện đơn giản (SMDS
– Simple multimedia database system).
1. Truy vấn SMDSs (mô tả đồng nhất):
Các hàm cơ bản của SMDSs bao gồm:
12
FindType(Obj): hàm này dùng đối tượng Obj như là dữ liệu đầu vào và trả về
kiểu của đối tượng, ví dụ:
+ FindType(image1.gif) = gif.
+ FindType(movie1.mpg) = mpg.
FindObjWithFeature(f): hàm này này sử dụng đặc trưng f là giá trị đầu vào và
trả về một tập tất cả các loại đối tượng media mà có chứa đặc trưng f, ví dụ:
+ FindObjWithFeature(john)= {iml.gif,im2.gif,im3.gif,videol.mpg:[1,5]}.
+ FindObjWithFeature(mary)= {videol.mpg:[1,5],videol.mpg:[15,50]}.
FindObjWithFeatureandAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc
tính tên a kết hợp với đặc trưng này và một giá trị v là đầu vào. Giá trị trả về sẽ là tất
cả các đối tượng obj có chứa đặc trưng và giá trị của thuộc tính a trong đối tượng obj
là v. Ví dụ:
+ FindObjWithFeatureandAttr(Big Spender,suit,blue): Truy vấn này yêu cầu tìm
tất cả các đối tượng media mà có sự xuất hiện của Big Spender trong bộ đồ
màu xanh.
FindFeaturesinObj(Obj): câu truy vấn này đòi hỏi phải tìm tất cả các đặc trưng
có mặt trong một đối tượng media đã cho. Kết quả trả về là một tập bao gồm tất cả
các đặc trưng. Ví dụ:
+ FindFeaturesinObj (iml.gif): câu truy vấn này yêu cầu trả về tất cả các đặc
trưng có trong file ảnh im1.gif.
+ FindFeaturesinObj(videol.mpg:[1,15]): câu truy vấn này yêu cầu trả về tất cả
các đặc trưng có trong 15 frame đầu tiên của file video video1.mpg.
FindFeaturesandAttrinObj(Obj): truy vấn này cũng có chức năng tương tự như
hàm trước ngoại trừ việc nó trả về một quan hệ có schema như sau: (Feature,
Attribute,Value) trong đó cặp 3 (f,a,v) xuất hiện trong quan hệ đầu ra nếu tính năng f
xảy ra trong câu truy vấn FindFeaturesinObj(Obj) và thuộc tính a của đặc trưng f
được xác định và có giá trị là v. Ví dụ:
+ FindFeaturesandAttrinObj(iml.gif) có thể trả về kết quả được mô tả ở bảng sau:
13
Bảng 1: Bảng mô tả kết quả của truy vấn FindFeaturesandAttrinObj(iml.gif)
SMDS-SQL của chúng ta sẽ bao gồm tất cả các câu lệnh chuẩn của SQL có bổ sung
thêm một số đặc trưng của dữ liệu đa phương tiện vào SQL (bổ sung thêm vào Select,
From, Where)
Mệnh đề SELECT có thể chứa thực thể media. Một thực thể media được định
nghĩa như sau:
+ Nếu m là một đối tượng media liên tục, i và j là 2 số nguyên khi đó m: [i,j] là
một thực thể media thể hiện một tập tất cả các frame của đối tượng media m
nằm trong (và chỉ trong) khoảng i và j.
+ Nếu m không phải là một đối tượng media liên tục thì khi đó m là một thực thể
media.
+ Nếu m là một thực thể media và a là một thuộc tính của m thì khi đó m.a là một
thực thể media.
Mệnh đề FROM có thể chứa các thực thể theo mẫu sau:
, có nghĩa là chỉ có các đối tượng media kết hợp với tên của
kiểu media và tên của dữ liệu nguồn được xem xét đến khi thực hiện truy vấn và M là
một biến được xếp loại trên các đối tượng media đó.
Mệnh đề WHERE cho phép có các biểu thức có dạng term IN func_call. Trong
đó:
+ Term có thể là một biến (trong trường hợp này được sắp xếp trên kiểu trả về
của func.call) hoặc là một đối tượng có kiểu đầu ra giống như func.call.
+ Func.call là một trong 5 hàm đã nêu ra ở trên.
Chúng ta xem xét một vài ví dụ:
14
+ Tìm tất cả các đối tượng ảnh hoặc video có chứa cả Jane Shady và Denis
Dopeman.
Select M
FROM smds source1 M
WHERE (FindType(M)= Video OR FindType(M)=Image
AND
M IN FindObjWithFeatureand(Jane Shady)
AND
M IN FindObjWithFeatureand(Denis Dopeman)
+ Tìm tất cả các ảnh và video mà đối tượng Jane Shady mặc áo vét mầu tím
SELECT M
FROM smds source1 M
WHERE FindType(M)=Video OR FindType(M)=Image
AND
M IN FindObjWithFeatureandAttr(Jane Shady,suit,purple)
+ Tìm tất cả các ảnh có Jane Shady cùng với đối tượng xuất hiện trong đoạn
Video cùng với Denis Hopeman. Khác với câu hỏi trước, câu hỏi này đòi hỏi
phải có các thao tác kết hợp giữa các loại dữ liệu khác nhau. Để thực hiện được
câu hỏi này, chúng ta phải sử dụng các biến mở rộng như là Person, biến này
được dùng để tham chiếu đến đối tượng chưa xác định được danh tính trong
đoạn băng video.
SELECT M,Person
FROM smds source1 M,M1
WHERE (FindType(M)=Image) AND
(FindType(M1)=Video) AND
M IN FindObjWithFeature(Jane Shady) AND
M1 IN FindObjWithFeature(Big Spender) AND
Person IN FindFeaturesinObj (M) AND
Person IN FindFeaturesinObj (M1) AND
Person Jane Shady AND Person Big Spender
2. Truy vấn dữ liệu đa phương tiện mô tả dưới kiến trúc lai tạo:
Như đã trình bày, SMDS-SQL có thể được sử dụng để truy vấn các đối tượng đa
phương tiện lưu trữ trong kiến trúc đồng nhất. Trong kiến trúc đồng nhất, tất cả các dữ
liệu nguồn được truy vấn đều là SMDSs, trong khi trong kiến trúc lai tạo các cách thức
mô tả khác (non-SMDS) cũng được sử dụng. Cách thức mô tả dữ liệu kiểu lai tạo thường
có hai phần chính:
Một tập các đối tượng media được mô tả dưới dạng đồng nhất.
15
Một tập các kiểu media khác nhau mà có cấu trúc để truy nhập và truy vấn riêng.
Để mở rộng ngôn ngữ truy vấn SMDS-SQL thành ngôn ngữ có thể truy vấn được các
dữ liệu được mô tả dưới dạng lai tạo (HM-SQL) các yêu cầu sau bắt buộc phải có:
HM-SQL phải có khả năng thực hiện tất cả các câu hỏi sử dụng ngôn ngữ riêng
đối với nguồn dữ liệu không đồng nhất này.
HM-SQL phải có cơ chế “joins” hoặc các thao tác đại số nhị phân có trách nhiệm
“joins” giữa 2 nguồn dữ liệu SMDS và non-SMDS.
Ngôn ngữ HM-SQL cũng tương tự như ngôn ngữ SQL chuẩn ngoại trừ các mệnh đề
Select, From. Where được mở rộng như sau:
Mệnh đề SELECT và FROM được mở rộng giống như với ngôn ngữ SMDS-
SQL.
Mệnh đề WHERE cho phép sự có mặt của biểu thức có dạng Term IN MS:
func_call trong đó:
+ Term:có thể là một biến hoặc là một đối tượng có kiểu đầu ra giống hệt với của
func_call đã được định nghĩa trong media gốc và
+ Nếu MS=SMDS hoặc họ func_call thuộc 1 trong 5 hàm đã đinh nghĩa ở trên
hoặc
+ MS không phải là một nguồn SDMS và func_call là một câu hỏi trong
QL(MS).
Khi đó, có 2 sự khác nhau giữa SMDS-SQL và HM-SQL là:
+ func_call xuất hiện trong mệnh đề where cần được chú thích một cách tường
minh với media gốc kèm theo và
+ Các câu truy vấn được xây dựng từ các ngôn ngữ truy vấn của từng loại dữ liệu
non-SMDS có thể được nhúng vào bên trong câu lệnh truy vấn của HM- SQL.
Điều này làm cho HM_SQL trở nên hết sức mạnh mẽ và linh hoạt. Căn cứ vào
điều này chúng ta có thể thực thi các câu truy vấn đối với các nguồn dữ liệu
khác nhau.
Xem xét một vài ví dụ:
Giả sử chúng ta có 2 nguồn dữ liệu video video1 và video2, nguồn video1 được
triển khai qua hình thức SDMS, nguồn video2 được triển khai qua hình thức non-
SDMS (gọi là videodb). Câu hỏi của chúng ta ở đây là “hãy tìm tất cả các video clip
16
có mặt Denis Hopeman từ cả 2 nguồn dữ liệu video1 và video2. Câu hỏi này có thể
được diễn đạt bằng ngôn ngữ HM-SQL như sau:
SELECT M
FROM smds video1, videodb video2
WHERE M IN smds:FindObjWithFeature(Denis Hopeman) OR
M IN videodb:FindVideoWithObject(Denis Hopeman)
Trong câu truy vấn này, chúng ta tìm kiếm tất cả các M mà chúng trả về kết quả mong
muốn từ cả 2 nguồn dữ liệu (SDMS và non-SDMS).
Cũng với câu hỏi trên nhưng ở đây chúng ta thêm vào một nguồn dữ liệu mới là
dữ liệu hình ảnh (idb) được triền khai dưới hình thức non-SDMS và giả sử dữ liệu
hình ảnh này có riêng chức năng tìm kiếm getpic(obj) với tham số đầu vào là obj và
kết quả trả về là một cặp bao gồm một ảnh (file ảnh) và thứ tự có liên quan. Giả sử
chúng ta muốn tìm kiếm trên cả 3 loại dữ liệu này (video1, video2, idb) có mặt của
đối tượng Denis Hopeman thì câu hỏi diễn đạt bằng ngôn ngữ HM-SQL có thể như
sau:
Select M
From sdms Video1, videodb Video2
Where M IN sdms: FindObjWithFeature(Denis Hopeman)
OR
M IN videodb: FindVideoWithObj(Denis Dopeman)
UNION
(Select M.file
From imagedb idb M
Where M In imagedb:getpic(Denis Dopeman)
Giả sử chúng ta muốn tìm tất cả các đối tượng có mặt cùng với Denis Dopeman
trong tất cả các nguồn dữ liệu (video1, video2, idb), câu hỏi sẽ như sau:
17
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU CHƯƠNG III.
ĐA PHƯƠNG TIỆN
1. Định nghĩa về hệ quản trị cơ sở dữ liệu đa phương tiện:
Hệ quản trị CSDL đa phương tiện (Multimedia Database Management System –
MDBMS) là một hệ quản trị CSDL (DBMS) hỗ trợ tạo lập, cập nhật và khai thác CSDL
đa phương tiện. Một MDBMS phải cung cấp gần như tất cả các chức năng của một
DBMS truyền thống bên cạnh việc cung cấp thêm một số chức năng mới và tính năng
nâng cao. MDBMS kế thừa các tính chất từ DBMS truyền thống – ACID: atomicity (tính
đơn nhất), consistency (tính nhất quán), isolation (tính độc lập) và durability (tính bền
vững).
Ngoài ra, sự khác nhau của các kiểu dữ liệu trong CSDL đa phương tiện có thể đòi
hỏi các phương thức đặc biệt để tối ưu hoá việc lưu trữ, truy cập, chỉ số hoá và khai
thác. MDBMS cần phải cung cấp các yêu cầu đặc biệt này bằng cách cung cấp các cơ
chế tóm tắt bậc cao để quản lý các kiểu dữ liệu khác nhau cũng như các giao diện thích
hợp để thể hiện chúng.
2. Kiến trúc hệ quản trị cơ sở dữ liệu đa phương tiện:
Kiến trúc của MDBMS được mô tả ở hình 4 bao gồm 3 lớp: (1)Lớp quản trị CSDL
đơn phương tiện (monomedia database-management layer), (2)Lớp quản trị/thành phần
đa phương tiện (multimedia composition/management layer), (3)Lớp giao diện người
dùng (user-interface layer).
18
Lớp quản trị CSDL đơn phương tiện cung cấp các chức năng cần thiết cho việc quản
lý các phương tiện đơn lẻ hoặc cá thể (individual media). Các phương diện chính của mỗi
DBMS tại mức này bao gồm việc duy trì cơ chế đánh chỉ mục một cách hiệu quả, và cho
phép người dùng phát triển các việc mô hình hóa và gom nhóm dựa trên ngữ nghĩa của
các thông tin phức tạp với mỗi phương tiện. Mục tiêu căn bản của lớp này là để xử lý các
truy vấn dựa trên nội dung và tạo thuận lợi cho sự truy xuất của các mảnh phù hợp của dữ
liệu đơn phương tiện, như các video clip, các phần của bức ảnh hay các đoạn âm thanh.
Một chức năng quan trọng khác được tích hợp trong lớp này là sự quản trị về mặt vật lý
của các CSDL đơn lẻ (individual databases). Việc quản lý này có thể yêu cầu một vị trí
phù hợp của dữ liệu trên hệ thống đĩa đơn/song song nhằm mang lại hiệu quả cao hơn.
Hình 4: Kiến trúc MDBMS
Mục tiêu chính của lớp ở giữa là nhằm giải quyết việc tích hợp đơn phương tiện để
tạo ra các tài liệu đa phương tiện và liên kết chéo tới các thông tin được lưu trữ trong các
CSDL đơn phương tiện. Hiện tại, sự đòi hỏi về việc quản lý các tài liệu và thư viện đa
phương tiện đang ngày càng gia tăng và nhu cầu về các mô hình tích hợp hiệu quả đang
là một trong những vấn đề nghiên cứu chính trong việc phát triển một MDBMS. Việc tích
hợp các phương tiện có thể mở rộng ra nhiều chiều bao gồm không gian, thời gian và các
ngữ nghĩa. Do đó lớp này cần phải duy trì một mô hình tích hợp đơn phương tiện đa
chiều, dưới hình thức của một siêu lược đồ (meta-schema). Về cơ bản, lớp này xử lý các
truy vấn của người dùng cho việc tổng hợp các thông tin đa phương tiện và tạo ra các
19
truy vấn con (subqueries) cho các CSDL đơn phương tiện. Việc truy xuất của dữ liệu đơn
phương tiện được điều khiển bởi các mô hình tích hợp được duy trì bởi siêu lược đồ. Cần
phải lưu ý rằng nhằm mục đích nhất quán dữ liệu, siêu lược đồ này cần phải được giao
tiếp với các lược đồ có liên quan với CSDL đơn phương tiện trình diễn ở lớp thấp hơn,
bởi vì cả 2 lược đồ đều chia sẻ thông tin về dữ liệu đơn phương tiện, bao gồm các ngữ
nghĩa dựa trên nội dung của chúng. Một chức năng quan trọng khác của lớp này là cung
cấp sự phối hợp giữa các CSDL đơn phương tiện nếu chúng được phân phối. Một trong
những mục tiêu chính trong trường hợp này là để cung cấp truy cập “trong suốt về vị trí”
(location-transparent) tới các site CSDL khác nhau và duy trì sự đồng bộ giữa các dòng
phương tiện truyền thông có nguồn gốc từ các máy chủ không đồng nhất. Theo quan
điểm CSDL, thông tin về vị trí của các đối tượng tổng hợp đa phương tiện khác nhau và
sơ đồ của chúng phải được duy trì bởi lớp này.
Lớp tương tác bao gồm nhiều phương tiện giao tiếp người dùng nhằm hỗ trợ các chức
năng trình diễn đa phương tiện, như hiển thị hình ảnh, bản diễn thử của các video clip hay
các đoạn âm thanh. Các phương tiện tương tác này có thể yêu cầu vài ngôn ngữ truy vấn
chính quy mà cũng được sử dụng tại lớp dưới cùng, với một vài tính năng nâng cao để
thao tác với các thông tin đa phương tiện tổng hợp. Để thay thế, người ta có thể sử dụng
một vài giao diện truy vấn đồ họa, bao gồm các tính năng bổ sung như duyệt, biên tập dữ
liệu phương tiện…
3. Các yêu cầu của hệ quản trị cơ sở dữ liệu đa phương tiện:
Một MDBMS cung cấp một môi trường thích hợp để sử dụng và quản lý các thông
tin CSDL đa phương tiện. Để MDBMS hoạt động có hiệu quả, đáp ứng được các nhu cầu
đa dạng của người dùng thì nó phải thỏa mãn một số yêu cầu sau:
Đầy đủ các khả năng của một DBMS truyền thống;
Có khả năng lưu trữ lớn;
Có khả năng khai thác dữ liệu thuận tiện;
Có khả năng tích hợp, tổng hợp và thể hiện;
Hỗ trợ truy vấn đa phương tiện;
Có giao diện đa phương tiện và tương tác.
4. Các vấn đề của hệ quản trị cơ sở dữ liệu đa phương tiện:
4.1. Mô hình hóa dữ liệu đa phương tiện:
Mô hình dữ liệu là đơn vị trung tâm của một hệ thống CSDL đa phương tiện. Một mô
hình dữ liệu cần phải tách rời người dùng ra khỏi chi tiết của việc quản lý các thiết bị lưu
20
trữ và cấu trúc lưu trữ. Điều này đòi hỏi phải phát triển các mô hình dữ liệu tương ứng để
tổ chức các kiểu dữ liệu khác nhau từng gặp trong các hệ thống CSDL đa phương tiện.
Các mô hình dữ liệu đa phương tiện (cũng giống như các mô hình dữ liệu truyền thống
khác) nắm bắt các đặc tính cố định cũng như động của nội dung CSDL và vì vậy nó cung
cấp các khuôn mẫu cơ bản cho việc phát triển các công cụ cần thiết để sử dụng dữ liệu đa
phương tiện. Các thuộc tính cố định có thể bao gồm các đối tượng tạo nên dữ liệu đa
phương tiện, mối liên hệ giữa các đối tượng, thuộc tính của các đối tượng… Các đặc tính
động bao gồm sự tương tác giữa các đối tượng, sự hoạt động trên đối tượng, các tương
tác của người dùng.
Tuy nhiên, do các tính chất đặc biệt của nó, dữ liệu đa phương tiện đòi hỏi phải có các
quan tâm mới khi chọn lựa mô hình dữ liệu. Ví dụ, một vài kiểu dữ liệu đa phương tiện
(chẳng hạn video) hoặc một nhóm các kiểu (video và hình ảnh) có thể đòi hỏi các mô
hình dữ liệu đăc biệt để cải thiện hiệu quả và tính mềm dẻo. Hơn nữa, do tầm quan trọng
của việc tương tác trong các hệ thống đa phương tiện nên việc nó được hỗ trợ bỏi các mô
hình dữ liệu trở nên quan trọng.
Rất nhiều các mô hình dữ liệu khác nhau như mô hình mạng, quan hệ, ngữ nghĩa, và
hướng đối tượng đang tồn tại và một vài mô hình trong số đó đã được xem xét để thiết
lập CSDL đa phương tiện. Có hai cách tiếp cận cơ bản trong việc mô hình hoá dữ liệu đa
phương tiện là:
Phương pháp thứ nhất: xây dựng một mô hình dữ liệu đa phương tiện trên nền
tảng của mô hình dữ liệu của một CSDL truyền thống (thường là CSDL quan hệ hoặc
CSDL hướng đối tượng) bằng cách sử dụng các giao diện tương ứng đối với dữ liệu
đa phương tiện. Các vấn đề nảy sinh với cách tiếp cận này là các cấu trúc bên dưới
(của CSDL truyền thống) không được thiết kế dành cho dữ liệu đa phương tiện, hơn
nữa sự khác biệt cơ bản các yêu cầu của một CSDL truyền thống đối với CSDL đa
phương tiện khiến cho giao diện trở thành nơi nghẽn cổ chai trong toàn bộ hệ thống.
Các vấn đề này dẫn tới cách tiếp cận thứ hai;
Phương pháp thứ hai: phát triển các mô hình dữ liệu thực thụ dành cho dữ liệu đa
phương tiện từ đầu chứ không xây dựng trên cơ sở của các CSDL truyền thống, tuy
nhiên mọi người đều nhất trí rằng các nỗ lực như vậy đều phải dựa trên kỹ thuật
hướng đối tượng. Liên quan đến kỹ thuật này thì có 2 mô hình tiêu biểu là mô hình
đối tượng và mô hình quan hệ - đối tượng. Hiện nay, người ta vẫn đang tranh cãi mô
hình nào là tốt hơn cho CSDL đa phương tiện. Mô hình quan hệ - đối tượng có ưu thế
hơn vì nó có thể đại diện cho các kiểu dữ liệu phức tạp. Nó bao gồm cả 2 kiểu mô
hình và có thể mở rộng để nắm bắt các cấu trúc tạm thời và các tính năng đặc biệt
khác.
4.2. Lưu trữ đối tượng đa phương tiện:
21
Lưu trữ vật lý các dữ liệu đa phương tiện đòi hỏi các phương thức để chuyển đổi,
quản lý, trao đổi và phân phối một khối lượng dữ liệu khổng lồ, các hệ thống đa phương
tiện thông thường sử dụng phương thức phân cấp đối với các thiết bị lưu trữ. Các thiết bị
lưu trữ có tốc độ cao như RAM, Cache lưu trữ các dữ liệu đang được xử lý trong khi đó
các thiết bị lưu trữ có tốc độ chậm như HDD, CD dùng để lưu trữ các dữ liệu có tính chất
dài hạn, cố định. Khi đó, hiệu suất sẽ phụ thuộc vào khả năng của cơ chế chuyển đổi các
dữ liệu đa phương tiện tương ứng với mức tối ưu hoá trong hệ thống lưu trữ phân cấp.
Các cơ chế nén dữ liệu kết hợp với các cơ chế chuyển đổi dữ liệu góp phần làm giảm
các yêu cầu khổng lồ về mặt lưu trữ, phương thức cơ bản được sử dụng ở đây là chuyển
đổi dữ liệu đa phương tiện sang một số vùng chuyển đổi để loại bỏ sự dư thừa của dữ liệu
gốc, các quá trình giải nén sẽ làm nhiệm vụ chuyển đổi ngược các dữ liệu này về dạng
gốc của nó. Quá trình này sẽ dẫn đến việc mất mát dữ liệu, tuy nhiên việc mất mát này
đươc hầu hết các ứng dụng multimedia cho phép.
Phụ thuộc vào mức độ của hạt nhân mà một đối tượng đa phương tiện có thể thể hiện
toàn bộ hoặc một phần đoạn video, một frame, một hình ảnh riêng lẻ thậm chí cả từng đối
tượng cá thể trong một ảnh hoặc một đoạn video. Vấn đề chính đặt ra ở đây là khả năng
lưu trữ có hạn, băng thông hạn chế của hệ thống lưu trữ các kênh truyền thông, tỷ lệ sẵn
sàng của các loại dữ liệu đa phương tiện. Tỷ lệ sẵn sàng của dữ liệu chỉ ra số lượng dữ
liệu tối thiểu cần thiết đối với mỗi đơn vị thời gian cần đáp ứng đối với các đòi hỏi về yêu
cầu chất lượng trong quá trình thể hiện các đối tượng đa phương tiện. Đứng từ quan điểm
này, các yêu cầu về lưu trữ của dữ liệu multimedia được giải quyết bằng cách phân chia
dữ liệu thành các đối tượng đa phương tiện nhỏ hơn để có thể lưu trữ trong các đơn vị lưu
trữ nhỏ hơn.
Với việc sắp xếp lưu trữ phân cấp, các đối tượng đa phương tiện có thể được lưu trữ ở
các mức độ khác nhau. Khi tỷ lệ sử dụng các đối tượng dữ liệu đa phương tiện thay đổi,
các đối tượng này cần phải được phân phối lại, và có thể được lưu trữ trên các thiết bị
khác, tại các mức khác nhau của hệ thống lưu trữ. Vấn đề cần giải quyết lúc này chỉ là
tìm ra giải pháp tối ưu cho việc phân rã, phân phối và tái phân phối các đối tượng đa
phương tiện.
4.3. Chỉ số hóa đa phương tiện:
Cũng như trong các CSDL truyền thống, các dữ liệu multimedia có thể được khai thác
thông qua các định danh, các thuộc tính, các từ khoá và sự liên kết giữa chúng. Sử dụng
các từ khoá là phương pháp chiếm ưu thế để chỉ số hoá dữ liệu đa phương tiện. Con
người thường chọn các từ khoá từ một tập các từ vựng nhất định, điều này tạo ra một số
khó khăn khi áp dụng đối với dữ liệu đa phương tiện vì chúng thường được làm một cách
22
thủ công và rất tốn thời gian và các kết quả thường là chủ quan và rất hạn chế phụ thuộc
vào từ vựng.
Một phương pháp khác được sử dụng dựa trên việc truy cập nội dung, nó xem xét đến
nội dung thực sự của dữ liệu đa phương tiện hoặc xuất phát từ ngữ cảnh của thông tin.
Trong thời gian gần đây, việc nghiên cứu chỉ số hoá dựa trên nội dung đã được tiến hành
hết sức mạnh mẽ với mục đích là chỉ số hoá dữ liệu đa phương tiện dựa trên các đặc
trưng xác định thu được trực tiếp từ dữ liệu. Các đặc trưng khác nhau như màu sắc, hình
dạng, kết cấu bề mặt, các chuỗi đặc trưng và các đặc trưng khác đã được dùng để chỉ số
hoá các ảnh.
Để thu được các đặc trưng này đòi hỏi phải phân tích tự động dữ liệu đa phương tiện,
các phương thức chính được sử dụng đối với dữ liệu ảnh và dữ liệu video là xử lý ảnh,
đón nhận ảnh và phân tích chuỗi video. Đối với dữ liệu video, chuỗi video trước tiên
được phân tách thành các chuỗi hợp thành, sau đó các đặc trưng tóm tắt (thường là các
frame khoá) sẽ được lựa chọn để đặc trưng cho mỗi chuỗi. Việc chỉ số hoá tiếp theo đối
với dữ liệu video cũng dựa trên các frame khoá cũng giống như đối với dữ liệu ảnh
Đối với dữ liệu âm thanh, việc chỉ số hoá dựa trên nội dung có thể có sự tham gia của
việc phân tích tín hiệu, tự động nhận biết lời nói cùng với việc chỉ số hoá dựa trên từ
khoá. Mặt khác, việc chỉ số hoá có thể dựa trên các thông tin khác phụ thuộc vào kiểu của
dữ liệu âm thanh, ví dụ một vài nhà phát triển đã sử dụng các đặc trưng về nhịp điệu, hợp
âm và giai điệu cho việc chỉ số hoá dựa trên nội dung đối với dữ liệu âm thanh. Tương tự
như vậy, việc tìm kiếm và khai thác dữ liệu âm thanh dựa trên nội dung đã được đề xuất
dựa trên các đặc tính của dữ liệu âm thanh như đã được chỉ ra qua các đặc trưng về âm
học và giác quan…
Việc chỉ số hoá dựa trên nội dung cũng gợi ra một vài vấn đề cần quan tâm. Trước
hết, cũng với một dữ liệu đa phương tiện nhưng mỗi người có thể hiểu theo một cách
khác nhau. Thứ hai, người dùng thường cần các thông tin thay đổi khác nhau, vì vậy một
đặc trưng duy nhất có thể là không đủ để chỉ số hoá hoàn toàn một kiểu dữ liệu đa
phương tiện cho trước. Một vấn đề khác cần phải xem xét là vấn đề hiệu quả, việc chỉ số
hoá phải nhanh và các chỉ số này phải được lưu trữ một cách hiệu quả để phục vụ cho
việc truy cập dễ dàng khi mà số lượng các dữ liệu đa phương tiện được lưu trữ là rất lớn.
Bởi vì đặc tính vốn có của dữ liệu multimedia là rất khác nhau nên việc chỉ số hoá không
thể tiến hành một cách hoàn toàn tự động, đơn cử như máy tính có thể phân tích dễ dàng
một bức ảnh có chứa các tác phẩm nghệ thuật, nhưng nó gần như không thể tự động xác
định được ý nghĩa của tác phẩm đó, điều đó chỉ có con người làm được.
4.4. Hỗ trợ truy vấn đa phương tiện, khai thác và duyệt:
23
Các truy vấn của người dùng thường được xử lý bằng cách sử dụng các chỉ số có sẵn,
tuy nhiên khác với CSDL truyền thống, tính chính xác trong tìm kiếm đối với dữ liệu đa
phương tiện không phải là chính xác tuyệt đối. Thông thường khi so sánh hai dữ liệu đa
phương tiện thì kết quả thu được thường là gần đúng hoặc tương tự, giả sử trong trường
hợp các dữ liệu này có cùng dữ liệu đầu vào thì kết quả thu được từ một truy vấn có thể
sinh ra rất nhiều giá trị. Đã có rất nhiều các nghiên cứu đi sâu vào việc tìm ra một phương
thức thích hợp trợ giúp cho người dùng có được khả năng khai thác hiệu quả các dữ liệu
đa phương tiện, chẳng hạn thông qua việc cung cấp các giao diện thích hợp để người
dùng có thể duyệt một cách thuận lợi các kết quả có được từ quá trình tìm kiếm. Việc hỗ
trợ duyệt một cách trực tiếp cho phép người sử dụng có thể khai thác bất kỳ thông tin nào
có khả năng liên quan đến kết quả hiện thời bằng cách lựa chọn các mục dữ liệu tương
ứng cần quan tâm sâu hơn.
Truy vấn bằng ví dụ (Query-by-Example) là một phương pháp chính được sử dụng để
nhập các truy vấn đối với CSDL đa phương tiện, đặc biệt là đối với dữ liệu ảnh. Ở đây
người dùng đưa ra các yêu cầu bằng cách sử dụng một mẫu có sẵn (ví dụ như một ảnh
tương tự), vì vậy giao diện được sử dụng để nhập truy vấn vào hệ thống trở thành một
vấn đề cần phải quan tâm. Do tính chất đa dạng của các kiểu dữ liệu đa phương tiện nên
mỗi kiểu dữ liệu đa phương tiện có thể phải có các giao diện truy vấn khác nhau, vấn đề
cần được xem xét ở đây là làm thế nào để tích hợp được các giao diện khác nhau vào một
hệ thống tích hợp CSDL đa phương tiện. Một vấn đề khác cũng cần phải giải quyết là
việc bao gồm truy vấn các dữ liệu không gian hoặc truy vấn các dữ liệu thời gian đòi hỏi
phải có các thông tin không gian hoặc thời gian.
-----------------------------
Ngoài các vấn đề nêu trên, các MDBMS còn có một số vần đề khác mà do phạm vi
của đề tài nghiên cứu cấp môn học nên đã không đề cập đến. Cụ thể đó là:
Tích hợp đa phương tiện, thể hiện và chất lượng của dịch vụ (QoS);
Quản trị CSDL đa phương tiện phân tán;
Sự hỗ trợ của hệ thống.
ỨNG DỤNG CỦA CƠ SỞ DỮ LIỆU CHƯƠNG IV.
ĐA PHƯƠNG TIỆN – ORACLE MULTIMEDIA
1. Giới thiệu chung:
Oracle Multimedia (OM – trước đây là Oracle Intermedia) là một tính năng cho phép
CSDL Oracle lưu trữ, quản lý, và truy xuất hình ảnh, video, âm thanh, hoặc các dữ liệu
24
media hỗn hợp. OM mở rộng độ tin cậy, tính sẵn có, và khả năng quản lý dữ liệu của
CSDL Oracle đối với nội dung đa phương tiện kiểu truyền thống, trên Internet, trong
thương mại điện tử, và trong các ứng dụng đa phương tiện. OM không kiểm soát các thiết
bị thu giữ media (media capture) hoặc các thiết bị đầu ra, chức năng này được giao lại
cho phần mềm ứng dụng.
2. Công nghệ quan hệ - đối tượng:
OracleDB là một hệ quản trị CSDL quan hệ - đối tượng. Điều này có nghĩa là, ngoài
vai trò truyền thống của mình trong việc quản lý an toàn và hiệu quả dữ liệu quan hệ, nó
còn cung cấp sự hỗ trợ cho sự định nghĩa về các loại đối tượng, bao gồm cả các dữ liệu
liên quan với các đối tượng và các phương thức có thể được thực hiện trên chúng. Công
nghệ quan hệ - đối tượng bao gồm việc hỗ trợ tích hợp BLOBs để cung cấp cơ sở cho
việc bổ sung các đối tượng phức tạp, chẳng hạn như âm thanh, hình ảnh, và video được
số hóa vào CSDL.
Trong Oracle Multimedia, đặc trưng dữ liệu âm thanh được lưu trữ dưới một kiểu dữ
liệu quan hệ đối tượng là ORDAudio, tương tự với dữ liệu hỗn hợp là ORDDoc, hình ảnh
là ORDImage, video là ORDVideo. Cả 4 kiểu trên đều lưu trữ thông tin nguồn dữ liệu
trong một kiểu dữ liệu quan hệ đối tượng khác gọi là ORDSource.
3. Các khả năng của Oracle Multimedia:
Các khả năng đa phương tiện Oracle bao gồm lưu trữ, thu hồi, quản lý, và thao tác với
các dữ liệu đa phương tiện được quản lý bởi CSDL Oracle.
OM hỗ trợ lưu trữ các định dạng tập tin thông dụng, bao gồm các hình ảnh tạo ra trên
máy tính, và các định dạng âm thanh, video trong CSDL. OM cung cấp các phương tiện
để thêm các cột hay đối tượng chứa dữ liệu âm thanh, hình ảnh, và video, hay các dữ liệu
media hỗn hợp khác vào các bảng có sẵn, và chèn vào và lấy ra các dữ liệu đa phương
tiện. Điều này cho phép các nhà thiết kế CSDL mở rộng các CSDL hiện có với dữ liệu đa
phương tiện, hoặc để xây dựng các ứng dụng CSDL đa phương tiện mới dành cho người
dùng cuối.
OM sử dụng các loại đối tượng, tương tự như các lớp Java hay C++, để mô tả dữ liệu
đa phương tiện. Những loại đối tượng này được gọi là ORDAudio, ORDDoc,
ORDImage, và ORDVideo. Một thể hiện của các loại đối tượng này bao gồm các thuộc
tính, siêu dữ liệu, dữ liệu media, và các phương thức. Dữ liệu media chính là dữ liệu âm
thanh, hình ảnh, video, hoặc các dữ liệu media hỗn hợp khác. Siêu dữ liệu là thông tin về
dữ liệu, chẳng hạn như độ dài đối tượng, kiểu nén, hoặc định dạng. Các phương thức là
các thủ tục mà có thể được thực hiện trên các đối tượng, chẳng hạn như getContent() và
setProperties().
25
Các đối tượng OM có một mô hình lưu trữ dữ liệu media chung. Các thành phần dữ
liệu media của các đối tượng này có thể được lưu trữ trong cơ sở dữ liệu, trong một đối
tượng kiểu BLOB dưới sự kiểm soát giao dịch. Các dữ liệu media cũng có thể được lưu
trữ bên ngoài cơ sở dữ liệu, mà không nằm trong sự kiểm soát giao dịch. Trong trường
hợp này, một con trỏ được lưu trữ trong cơ sở dữ liệu dưới sự kiểm soát giao dịch, và các
dữ liệu media được lưu trữ trong:
Đối tượng lớn dựa trên tập tin (BFILE);
Một đường dẫn URL trên mạng;
Một nguồn do người dùng xác định trên một máy chủ dữ liệu media chuyên biệt,
hoặc máy chủ khác.
Siêu dữ liệu media được lưu trữ trong CSDL dưới sự kiểm soát của OM. Dù cho dữ
liệu media được lưu trữ bên trong hay bên ngoài CSDL, OM đều quản lý siêu dữ liệu cho
tất cả các loại media và có thể tự động trích xuất siêu dữ liệu cho âm thanh, hình ảnh,
video. Siêu dữ liệu này bao gồm các thuộc tính sau:
Lưu trữ thông tin về âm thanh, hình ảnh, video, hay các dữ liệu media hỗn hợp
khác, bao gồm loại nguồn, đường dẫn, tên nguồn, và dữ liệu được lưu trữ cục bộ
(trong CSDL) hay bên ngoài;
Cập nhật thông tin nhãn thời gian cho âm thanh, hình ảnh, và video, hoặc các dữ
liệu media hỗn hợp khác;
Mô tả dữ liệu âm thanh và video;
Định dạng của dữ liệu âm thanh, hình ảnh, video, hoặc các dữ liệu media hỗn hợp
khác;
Kiểu MIME của dữ liệu âm thanh, hình ảnh, và video, hoặc các dữ liệu media hỗn
hợp khác;
Các đặc trưng âm thanh: kiểu mã hóa, số kênh, tỉ lệ mẫu, kích thước mẫu, kiểu
nén, và thời gian phát (duration);
Các đặc trưng hình ảnh: chiều cao và chiều rộng, độ dài nội dung hình ảnh, định
dạnh nội dung hình ảnh, và định dạng nén hình ảnh;
Các đặc trưng video: chiều rộng và cao của khung, độ phân giải của khung, tỉ lệ
khung, thời gian phát, số khung, kiểu nén, số lượng màu sắc và bit rate.
Các siêu dữ liệu được trích xuất trong XML, như đạo diễn hay nhà sản xuất của
một bộ phim.
Một vài ví dụ về ứng dụng của OM:
Nơi lưu trữ cho các hình ảnh kiểm tra kĩ thuật số;
Hồ sơ sức khỏe điện tử;
26
Tổng đài điện thoại;
Học từ xa và học trực tuyến;
Tiếp thị bất động sản;
Phòng trưng bày nghệ thuật kĩ thuật số;
Nơi lưu trữ các tài liệu hình ảnh;
Thông tin tin tức dịch vụ khách hàng tài chính;
Xuất bản web;
Lưu trữ các web nhạc và video.
4. Khái niệm âm thanh:
4.1. Âm thanh số hóa:
ORDAudio hợp nhất việc lưu trữ, truy xuất và quản lý dữ liệu âm thanh số hóa trong
một CSDL.
Âm thanh có thể được tạo ra bằng máy thu âm, một nguồn âm thanh như microphone,
âm thanh số hóa, các thiết bị ghi âm chuyên biệt khác, hoặc thậm chí bởi các thuật toán
chương trình. Thiết bị thu âm tạo ra một tín hiệu tương tự hay tín hiệu liên tục, chẳng hạn
như âm thanh do một micro thu vào hoặc âm thanh được ghi lại trên các media từ tính và
chuyển đổi nó thành những giá trị số với các đặc trưng điển hình của âm thanh như định
dạng, kiểu mã hóa, số kênh, sampling rate, kích thước mẫu, kiểu nén, và thời gian phát.
4.2. Các thành phần trong âm thanh:
Âm thanh số hóa chứa dữ liệu âm thanh (các bit đã số hóa) và các thuộc tính mô tả dữ
liệu âm thanh. Âm thanh có thể có các định dạng khác nhau, các kiểu mã hóa, các kiểu
nén, các số kênh, các sampling rate, các kích thước mẫu và thời gian phát khác nhau phụ
thuộc vào cách mà dữ liệu âm thanh được thu lại theo kĩ thuật số hóa. ORDAudio có thể
lưu trữ và truy xuất dữ liệu âm thanh của bất cứ định dạng dữ liệu có hỗ trợ nào.
ORDAudio có thể tự động trích xuất các siêu dữ liệu từ dữ liệu âm thanh của nhiều định
dạng âm thanh thông dụng, ví dụ như: wav, ra, rm, ram, mp4, mpg, 3gp, au, aff, atf.
Kích thước của âm thanh số hóa (số byte) có xu hướng lớn hơn so với các đối tượng
máy tính truyền thống, chẳng hạn như số và văn bản. Do đó, một số cơ chế mã hóa được
sử dụng để nén các dữ liệu âm thanh xuống còn ít byte hơn, do đó chiếm một dung lượng
tải nhỏ hơn trên các thiết bị lưu trữ và mạng.
5. Khái niệm ORDDoc – dữ liệu media hỗn hợp:
5.1. Dữ liệu media hỗn hợp được số hóa:
27
ORDDoc hợp nhất việc lưu trữ, truy xuất và quản lý các dữ liệu media hỗn hợp trong
CSDL.
Kiểu ORDDoc có thể lưu trữ bất kỳ dữ liệu media hỗn hợp nào bao gồm cả âm thanh,
hình ảnh, và các dữ liệu video trong một cột CSDL. Thay vì có các cột riêng biệt cho các
đối tượng âm thanh, hình ảnh, văn bản và video, bạn có thể sử dụng một cột của các đối
tượng ORDDoc để đại diện cho tất cả các loại đa phương tiện trên.
5.2. Các thành phần trong dữ liệu media hỗn hợp:
Các thành phần dữ liệu media hỗn hợp bao gồm các dữ liệu (các bit được số hóa) và
các thuộc tính mô tả các dữ liệu media hỗn hợp.
Dữ liệu media hỗn hợp có thể có các định dạng khác nhau, tùy thuộc vào ứng dụng
tạo ra các dữ liệu media. OM có thể lưu trữ và truy xuất dữ liệu media của bất kì định
dạng dữ liệu nào được hỗ trợ. Kiểu ORDDoc có thể được sử dụng trong các ứng dụng mà
yêu cầu bạn phải lưu trữ các kiểu dữ liệu media hỗn hợp trong cùng một cột, do đó bạn
có thể xây dựng một chỉ mục siêu dữ liệu chung trên tất cả các kiểu dữ liệu media khác
nhau. Sử dụng chỉ mục này, bạn có thể tìm kiếm trên tất cả các loại dữ liệu media hỗn
hợp khác nhau. Lưu ý rằng bạn không thể sử dụng kỹ thuật tìm kiếm tương tự nếu các
loại dữ liệu media hỗn hợp khác nhau được lưu trữ trong các loại đối tượng khác nhau,
trong các cột khác nhau của các bảng.
ORDDoc có thể tự động trích xuất siêu dữ liệu từ dữ liệu của nhiều định dạng âm
thanh, hình ảnh và video phổ biến. ORDDoc cũng có thể trích xuất các thuộc tính ứng
dụng và lưu trữ chúng trong thuộc tính comments của đối tượng ở dạng XML.
6. Khái niệm hình ảnh:
6.1. Hình ảnh số hóa:
ORDImage tích hợp việc lưu trữ, truy xuất, và quản lý hình ảnh kĩ thuật số trong một
cơ sở dữ liệu.
ORDImage hỗ trợ các hình ảnh hai chiều, tĩnh, và các hình ảnh raster số hóa được lưu
trữ như sự biểu diễn nhị phân của các đối tượng hoặc các cảnh trong thế giới thực. Hình
ảnh có thể được tạo ra bởi một văn bản hoặc máy quét ảnh, một nguồn video (như máy
ảnh kỹ thuật số hoặc một VCR kết nối với một bộ số hóa video, các thiết bị chuyên chụp
ảnh, hay thậm chí là một thuật toán chương trình). Thiết bị chụp tiếp nhận một tín hiệu
tương tự hay tín hiệu liên tục như ánh sáng chiếu vào phim trong máy ảnh, và chuyển nó
thành các giá trị số trên một lưới các điểm dữ liệu hai chiều được gọi là pixel.
6.2. Các thành phần trong hình ảnh:
28
Hình ảnh số hóa bao gồm các dữ liệu hình ảnh (các bit đã được mã hóa) và các thuộc
tính mô tả dữ liệu hình ảnh.
Các dữ liệu hình ảnh (pixel) có thể có độ sâu khác nhau tùy thuộc vào ảnh được chụp
như thế nào và có thể được tổ chức theo nhiều cách khác nhau. Việc tổ chức dữ liệu hình
ảnh gọi là định dạng dữ liệu. ORDImage có thể lưu trữ và truy xuất dữ liệu hình ảnh của
bất kỳ định dạng dữ liệu nào. ORDImage có thể xử lý và tự động trích xuất các thuộc tính
hình ảnh của nhiều định dạng dữ liệu phổ biến như: bmp, cal, dcm, fpx, gif, jpg, pcx,
png,…
Các không gian lưu trữ cần thiết cho hình ảnh số hóa có thể lớn hơn so với các thuộc
tính dữ liệu truyền thống như số và văn bản. Nhiều chương trình nén có sẵn để giảm bớt
các byte, do đó giảm dung lượng trên thiết bị lưu trữ và giảm dung lượng tải trên mạng.
6.3. Metadata in Images
Tính năng siêu dữ liệu nâng cao hành vi của các loại đối tượng ORDImage bằng cách
thêm khả năng đọc (hay trích xuất) và ghi (hay nhúng) siêu dữ liệu của ứng dụng trong
hình ảnh. Ngoài ra, tính năng này đã thông qua một tiêu chuẩn để biểu diễn siêu dữ liệu
khi nó được phân tách từ một tập tin hình ảnh. Siêu dữ liệu có thể được lưu trữ trong một
CSDL, đánh chỉ mục, tìm kiếm và tạo ra sự sẵn sàng cho các ứng dụng sử dụng các cơ
chế chuẩn của CSDL Oracle.
7. Khái niệm video:
7.1. Video số hóa:
ORDVideo tích hợp lưu trữ, truy xuất và quản lý dữ liệu video số hóa trong một
CSDL.
Video có thể được tạo ra bởi một đầu thu video, máy quay phim, video hoạt hình số
hóa, các thiết bị quay video chuyên dụng khác, hoặc thậm chí bởi các thuật toán chương
trình. Một số thiết bị ghi video tiếp nhận một tín hiệu tương tự hay liên tục, chẳng hạn
như video được thu vào một máy quay phim hoặc video được ghi lại trên các media từ
tính và chuyển đổi nó thành giá trị số với các đặc trưng điển hình của video chẳng hạn
như định dạng, kiểu mã hóa, tỷ lệ khung hình, kích thước khung hình (chiều rộng và
chiều cao), độ phân giải khung hình, độ dài video, kiểu nén , số lượng màu sắc, và bit
rate.
7.2. Các thành phần của video:
Video số hóa bao gồm các dữ liệu video (các bit đã được số hóa) và các thuộc tính mô
tả cho các dữ liệu video.
29
Dữ liệu video có thể có định dạng khác nhau, các kiểu nén, tỉ lệ khung hình, kích
thước khung hình, độ phân giải khung hình, thời gian chơi, loại nén, số lượng màu sắc và
tốc độ bit phụ thuộc vào cách dữ liệu video kỹ thuật số đã được ghi lại. ORDVideo có thể
lưu trữ và truy xuất dữ liệu video của bất kỳ định dạng dữ liệu nào được hỗ trợ.
ORDVideo có thể:
Tự động trích xuất siêu dữ liệu từ dữ liệu video của nhiều định dạng video phổ
biến;
Trích xuất các thuộc tính ứng dụng và lưu trữ chúng trong các thuộc tính
“comments” của các đối tượng ở dạng XML;
Được thiết kế để có thể nhận ra và hỗ trợ thêm định dạng video (bởi vì nó có thể
mở rộng).
Kích thước của video số hóa (số byte) có xu hướng lớn so với các đối tượng máy tính
truyền thống, chẳng hạn như số và văn bản. Do đó, một số cơ chế mã hóa được sử dụng
dữ liệu để nén dữ liệu video còn byte ít hơn, do đó chiếm một dung lượng nhỏ trên các
thiết bị lưu trữ và mạng.
8. Lưu trữ và truy vấn đa phương tiện:
Media có thể được lưu trữ trong các loại đối tượng OM, hoặc trực tiếp trong BLOBs
hoặc BFILEs. Bạn sẽ nhận thấy lợi ích lớn nhất bởi việc lưu trữ media trong các loại đối
tượng OM. Tuy nhiên, nhiều tính năng của OM có sẵn để lưu trữ media trong các BLOBs
và BFILEs đang sử dụng giao diện quan hệ.
Giao diện quan hệ OM cho phép các nhà phát triển sử dụng các phương thức tĩnh của
các loại đối tượng OM với các media hiện có và mới được lưu trữ trong BLOBs và
BFILEs. Cụ thể, các nhà phát triển có thể di chuyển dữ liệu media giữa hệ thống tập tin
cục bộ và cơ sở dữ liệu; phân tích và trích xuất các thuộc tính của dữ liệu media; và lưu
trữ các đặc tính này dưới dạng một XMLType hoặc một CLOB được định dạng XML, và
tùy chọn, trong các cột quan hệ cá nhân. Các nhà phát triển không cần phải thay đổi lược
đồ ứng dụng hiện có hoặc khởi tạo các loại đối tượng OM để tận dụng lợi thế của giao
diện quan hệ này. Các phương thức tĩnh của OM cũng có thể được sử dụng để thực hiện
các hoạt động xử lý hình ảnh như cắt, scale, nén, chuyển đổi định dạng.
Các kiểu đối tượng ORDAudio, ORDDoc, ORDImage và ORDVideo đều chứa một
thuộc tính của kiểu ORDSource và các phương thức cho việc thao tác trên các nguồn dữ
liệu đa phương tiện.
8.1. Lưu trữ dữ liệu đa phương tiện
30
OM có thể lưu trữ dữ liệu đa phương tiện như là một nguồn nội bộ trong CSDL, dưới
sự kiểm soát giao tác như một BLOB. Nó cũng có thể tham chiếu mở rộng các dữ liệu đa
phương tiện số hóa được lưu trữ như một nguồn bên ngoài trong một tập tin (tập tin này
chỉ thuộc về một hệ điều hành cụ thể) trong một hệ thống tập tin cục bộ, như một URL
trên một máy chủ HTTP, hoặc như là một nguồn được định nghĩa bởi người dùng trên
các máy chủ khác, chẳng hạn như các máy chủ media. Mặc dù các cơ chế lưu trữ bên
ngoài này đặc biệt thuận lợi cho việc tích hợp các bộ dữ liệu đa phương tiện hiện có với
một CSDL, nhưng các dữ liệu đa phương tiện sẽ không được đặt dưới sự kiểm soát giao
tác nếu nó không được lưu trữ trong CSDL.
Các BLOB được lưu trữ trong các tablespace của CSDL bằng cách tối ưu hóa không
gian và cung cấp các truy cập hiệu quả. Các BLOB lớn có thể không được lưu trữ nội
tuyến (BLOBs dưới 4 kilobyte có thể được lưu trữ nội tuyến) với các dòng dữ liệu khác.
Tùy thuộc vào kích thước của BLOB, một bộ định vị (locator) được lưu trữ trong hàng và
một BLOB đích thực (lên đến 8-128 TB, tùy thuộc vào kích thước khối) được lưu trữ
trong các tablespace khác. Bộ định vị có thể được coi là một con trỏ đến vị trí thực tế của
giá trị BLOB. Khi bạn chọn một BLOB, thì có nghĩa là bạn đang chọn định vị thay vì giá
trị, mặc dù điều này được thực hiện minh bạch. Một lợi thế của thiết kế này là định vị của
nhiều BLOB có thể tồn tại trong một dòng đơn. Ví dụ, bạn có thể muốn lưu trữ một đoạn
clip ngắn của một cuốn băng dạy học, một đoạn ghi âm chứa mô tả ngắn gọn về nội dung
của nó, một đề cương của khóa học, một tấm ảnh của giảng viên, và một bộ bản đồ và chỉ
dẫn đến mỗi trung tâm đào tạo đều nằm trong cùng một dòng.
Bởi vì BFILE không đặt dưới sự kiểm soát giao tác của CSDL, người dùng có thể
thay đổi nguồn bên ngoài mà không cần cập nhật CSDL, do đó gây ra một sự mâu thuẫn
với định vị BFILE.
Các loại đối tượng OM như ORDAudio, ORDDoc, ORDImage và ORDVideo cung
cấp phương thức bao gói để làm các việc sau:
Thiết lập nguồn dữ liệu là cục bộ hoặc ở bên ngoài;
Sửa đổi thời gian lần cập nhật mới nhất của đối tượng;
Thiết lập thông tin về các kiểu nguồn bên ngoài, vị trí, và tên của dữ liệu ;
Chuyển dữ liệu vào hoặc ra khỏi CSDL;
Lấy ra các thông tin về nội dung dữ liệu cục bộ như chiều dài, vị trí của nó, đưa
nội dung vào một BLOB tạm thời, hoặc xóa nó;
Truy cập nguồn dữ liệu bằng cách mở, đọc, viết, cắt xén và đóng nó lại.
8.2. Truy vấn dữ liệu đa phương tiện:
31
Khi được lưu trữ trong một CSDL, dữ liệu đa phương tiện có thể được truy vấn và lấy
ra bằng cách sử dụng các cột chữ-hoặc-số khác nhau hoặc các thuộc tính đối tượng của
bảng để tìm một hàng có chứa dữ liệu mong muốn. Ví dụ, bạn có thể chọn một video clip
từ bảng Traning với tên khóa học là 'Oracle Database Concepts'.
Dữ liệu đa phương tiện có thể được truy vấn theo các siêu dữ liệu được trích xuất,
theo các cột trong bảng khác và theo nội dung, chẳng hạn như truy xuất dựa trên nội dung
hình ảnh với các chỉ mục chuyên biệt tùy chọn.
9. Nạp dữ liệu đa phương tiện
Dữ liệu đa phương tiện có thể được quản lý tốt nhất bằng CSDL Oracle. Dữ liệu đa
phương tiện của bạn cần phải được nạp vào CSDL để tận dụng các ưu thế về độ tin cậy,
khả năng mở rộng, tính sẵn có, và khả năng quản lý dữ liệu. Để đưa dữ liệu đa phương
tiện vào CSDL với số lượng lớn, bạn có thể sử dụng:
SQL*Loader
SQL*Loader là một tiện ích của Oracle cho phép bạn nạp dữ liệu, và trong trường hợp
này, dữ liệu đa phương tiện (dữ liệu LOB), từ các tập tin đa phương tiện bên ngoài vào
một bảng của một CSDL có chứa các cột thuộc kiểu đối tượng OM.
PL/SQL
Một sự mở rộng các thủ tục của SQL, PL/SQL là một ngôn ngữ lập trình tiên tiến thế
hệ thứ tư (4GL) của Oracle. Bạn có thể viết các thủ tục PL/SQL để nạp dữ liệu đa
phương tiện từ BLOB, hệ thống tập tin, và các nguồn dữ liệu media theo URL vào các
cột thuộc kiểu đối tượng OM.
Ưu điểm của việc sử dụng SQL*Loader là nó rất dễ dàng để tạo ra và kiểm tra tập tin
kiểm soát hoạt động nạp dữ liệu của bạn.
Ưu điểm của việc sử dụng các đoạn mã PL/SQL để tải dữ liệu của bạn là bạn có thể
gọi các phương thức khi bạn tải dữ liệu để tạo ra các hình ảnh thu nhỏ, hoặc trích xuất
thuộc tính.
32
TÀI LIỆU THAM KHẢO
Tiếng Anh
[1] Arif Ghafoor (1995). Multimedia Database Management System. ACM Computing
Surveys, Vol. 27, No 4, December. Retrievaled December 16, 2012 from
pilani.ac.in/discipline/csis/vimal/267MMC/AdditionalReadings/Multimedia%20Database
s.pdf
[2] Prof. Dr. Gunter Saake (2012). Multimedia Retrieval in Databases. Foundations and
Index Structures. OvG Universität Magdeburg, Fakultät für Informatik, Institut für
Technische und Betriebliche Informationssysteme. Retrievaled December 16, 2012 from
[3] V.S. Subrahmanian (1998). Multimedia Database. Principles of Multimedia Database
Systems, chapter 9. Morgan Kaufmann Publishers Inc. San Francisco, CA, USA.
Retrievaled December 17, 2012 from
[4] Chien Yu and Teri Brandenburg (2011). Multimedia database applications: issues
and concerns for classroom teaching. Department of Instructional Systems & Workforce
Development, Mississippi State University. Retrievaled December 15, 2012 from
Tiếng Việt
[5] Trần Hoài Nam (2004). Luận văn thạc sĩ. Cơ sở dữ liệu đa phương tiện – yêu cầu và
các vấn đề. Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội. Truy xuất vào ngày
16/12/2012 từ
D%E1%BB%AE-LI%E1%BB%86U-%C4%90A-PH%C6%AF%C6%A0NG-
TI%E1%BB%86N-Multimedia-Database
[6] Khuyết danh. Bài giảng Cơ sở dữ liệu đa phương tiện. Truy xuất vào ngày
17/12/2012 từ
Liên kết
[7]
[8]
[9]
Các file đính kèm theo tài liệu này:
- baocaocsdldaphuongtien_nhom04_tin4_5051.pdf