Lời nói đầu
Chương I. Tín hiệu tiếng nói
1. Quá trình phát âm của con người
2. Đặc tính thống kê của tín hiệu tiếng nói
3. Các mô hình biểu diễn
Chương II. Mã hoá vùng thời gian
1. Công nghệ PCM
2. Các phương pháp mã hoá khác
3. Phương pháp mã hoá ADPCM (Điều chế xung mã vi sai thích ứng)
Chương III. Mã hoá vùng tần số
1. Mã hoá dải nhỏ (SBC)
2. Mã hoá biến đổi thích nghi (ATC)
Chương IV. Phương pháp mã hoá tham số nguồn (Resourd Parameters Method)
1. Bộ mã hoá nguồn theo kênh
2. Bộ mã nguồn tiếng nói formant
3. Bộ mã nguồn tiếng nói phổ tách
4 Phương pháp dự đoán tuyến tính LPC
5. Bộ mã hoá nguồn tiếng nói âm thanh được kích thích
Chương V. Phương pháp đánh giá
I. Kiểm tra định lượng
II. Phương pháp đánh giá định tính
Kết luận
Giáo viên HD: Trần Quốc Thịnh
123 trang |
Chia sẻ: lvcdongnoi | Lượt xem: 2498 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Tín hiệu tiếng nói và các phương pháp mã hoá, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
}: §¸p øng tuÇn hoµn trong bé läc th¸c.
Nh− vËy mét phÇn tö ®−îc x¸c ®Þnh bëi c¸c chØ sè i vµ j.
TÝn hiÖu qua bé läc H(z) cã thÓ ®−îc biÓu diÔn:
x`Þj= Hδ(n)giyj.
Trong ®ã H lµ ma trËn sau:
)()1()2()3()4(
0)()1()2()3(
00)()1()2(
000)()1(
0000)(
ohhhhh
ohhhh
ohhh
ohh
oh
H =
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 87
Gi¸ trÞ tèi −u t×m ®−îc b»ng ph−¬ng ph¸p cùc tiÓu ho¸, møc sai sè b×nh
ph−¬ng trung b×nh:
D=|| x(n)-x`ij || = σ2(n)||x`(n)-giHyi||2
Trong ®ã x`(n)=x(n)/ σ(n gäi lµ vÐc t¬ ®Ých biªn ®é chuÈn ho¸, suy ra
D=σ2(n) ( ||x`(n)||2-2gix`T(n)Hyi|| + gi 2Hyi||2)
Trong ®ã x`(n)||2 vµ σ2(n) lµ h»ng sè trong chu tr×nh t×m kiÕm do ®ã cùc
tiÓu ho¸ D t−¬ng ®−¬ng víi cùc tiÓu ho¸ D`
D`=-2gip
T(n)yi + g
2
iEj
víi p(n)= HTx`(n) vµ Ej=||Hyj||
2
Víi Ej lµ n¨ng l−îng thùc tÕ cña vÐct¬ m« h×nh ®· ®−îc läc nã kh«ng phô
thuéc vµo vÐct¬ môc ®Ých x(n).
Còng chó ý r»ng vÐct¬ m· h×nh d¹ng lµ cè ®Þnh vµ ma trËn H chØ phô
thuéc vµo bé läc tæng hîp vµ bé läc träng sè. Do ®ã Ej còngkh«ng ®æi trong
chu kú 4 vÐct¬ . Trªn c¬ së quan s¸t nµy khi hai bé läc ®−îc cËp nhËt ta cã thÓ
tÝnh vµ l−u gi¸ trÞ n¨ng l−îng cña 128 gi¸ trÞ Ej (0-127) (t−¬ng øng 128 vÐct¬
m· h×nh) vµ sau ®ã sö dông c¸c gi¸ trÞ nµy lËp l¹i cho qu¸ tr×nh t×m kiÕm víi 4
vÐct¬ tiÕp theo. Gi¶i thuËt nµy lµm gi¶m ®é phøc t¹p còng nh− thuËt to¸n t×m
kiÕm ®i rÊt nhiÒu.
Ta cã thÓ tÝnh tr−íc vµ l−u hai d·y sè:
bi=2gi vµ cj = gj
2.
Vµ ta cã thÓ biÓu diÔn
D`=-biPj +ciEj = -biP
T(n)yi +ciEj
Ej , bi , ci ®−îc ®−îc tÝnh vµ l−u tr÷ d−íi d¹ng b¶ng. Thñ tôc t×m kiÕm sæ
m· thùc hiÖn tõng b−íc qua sæ m· h×nh yj.vµ chØ sè biªn ®é i t−¬ng øng yj.
C¸c c¸ch t×m chØ sè biªn ®é i tèi −u nhÊt víi mçi vÐct¬ m· yi.
a. C¸ch thø nhÊt: −íc l−îng 8 gi¸ trÞ cã thÓ D t−¬ng øng víi 8 gi¸ trÞ cã
thÓ cña i, vµ sau ®ã lÊy chØ sè i cã D nhá nhÊt .
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 88
b. C¸ch thø hai: TÝnh to¸n tèi −u gi¸ trÞ biªn ®é g`=Pj/Ej sau ®ã l−îng tö
ho¸ biªn ®é nµy thµnh mét trong 8 møc ë 3 bit sæ m· biªn ®é. ChØ sè i tèt nhÊt
lµ chØ sè cña møc biªn ®é gi gÇn nhÊt.
c. C¸ch thø ba: Thùc hiÖn phæ biÕn ë c¸c IC DSP g` l−îng tö cã thÓ xem
nh− so s¸nh hai chuçi g` vµ biªn ®é l−îng tö ho¸ mµ ®iÓm gi÷a cña nã ®iÒu
chØnh møc khuyÕch ®¹i.
§Æt di lµ ®iÓm gi÷a gi vµ gi+1 sao cho hai gi¸ trÞ nµy cïng dÊu, sau ®ã
kiÓm tra g`<di . bëi vËy b»ng viÖc sö dông ph−¬ng thøc nµy ta cã thÓ tr¸nh
®−îc ph¶i thùc hiÖn c¸c c©u lÖnh chia rÊt tr¸nh trong c¸c vi xö lý dÊu phÈy cè
®Þnh. Sau khi t×m ®−îc ta tiÕn hµnh nèi c¸c gi¸ trÞ nµy sÏ ®−îc tõ m· 10 bÝt.
Gi¶i m·:
VÒ ph−¬ng thøc còng nh− c¸c khèi chøc n¨ng khèi gi¶i m·, gi¶ thuËt tÝnh
to¸n gi¶i m· LD-CELP còng gÇn gièng víi c¸c modul m· ho¸ ®· nghiªn cøu.
ThÝch
øng
läc
th«ng
K§
Bé
läc th«ng
Bé läc
tæng hîp
Khèi thÝch
øng biªn ®é
ph¶n håi
Sæ m· VQ
kÝch thÝch
BiÕn ®æi vÒ
PCM ban ®Çu
Khèi
thÝch
øng
biªn ®é
ph¶n
håi
29 31 32 34 28
30 33 35
hÖ sè bé läc bËc 10
vµ hÖ sè ph¶n x¹ ®Çu tiªn
S¬ ®å chi tiÕt khèi gi¶i m· LD-CELP.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 89
Bao gåm sæ m· kÝch thÝch VQ, khèi ph©n kho¶ng biªn ®é, bé läc tæng
hîp, khèi t−¬ng thÝch biªn ®é vÐc t¬ ph¶n håi, khèi t−¬ng thÝch bé läc tæng
ph¶n håi gi«ng nh− phÝa m· ho¸ chØ cã bé läc th«ng vµ t−¬ng thÝch bé läc
th«ng lµ kh¸c ®«i chót.
¾ Bé läc th«ng:
Bao gåm ba phÇn :
- Bé läc dµi h¹n(hay cßn gäi lµ bé läc cao ®é) cã hµm truyÒn:
Hl(z)=gl(1+bZ
-P)
T−¬ng tù phÝa m· ho¸ c¸c hÖ sè trªn ®−îc cËp nhËt theo khung tÝn
hiÖu bé 4 vect[ mét lÇn.
- Bé läc ng¾n h¹n:
Hµm truyÒn:
)1(
`1
1
)( 110
1
10
1
`
−
=
−
=
−
+
−
−
=
∑
∑
z
za
zb
zH
i
i
i
i
i
i
μ
Trong ®ã bi`=a`(0,65)
i vµ a`i=a`(0,75)
i μ=0,15k1
i=1,...,10
k1 lµ hÖ sè ph¶n x¹ ®Çu tiªn, c¸c hÖ s« a`, b` gi¶i m· ®−îc.
¾ Bé t−¬ng thÝch bé läc th«ng, môc ®Ých ®Ó tÝnh to¸n vµ cËp nhËt
c¸c hÖ sè cña bé läc th«ng theo tõng khung tÝn hiÖu, nã bao gåm
c¸c khèi: läc ®¶o LPC bËc 10, modul ph¸t hiÖn chu kú cao ®é,
tÝnh to¸n kiÓm tra cao ®é pháng ®o¸n , bé tÝnh hÖ sè bé läc dµi
h¹n, tÝnh hÖ sè bé lä ng¾n h¹n.
¾ Bé biÕn ®æi vÒ PCM ®Ó tÝn hiÖu gi¶i m· gièng víi tÝn hiÖu vµo th×
ta ph¶i tÝn hµnh biÕn ®æi vÒ c¸c d¹ng PCM ®Þnh d¹ng ban ®Çu
theo luËn nÐn d·n t−¬ng øng.
NhËn xÐt chung:
C¶ phÝa m· ho¸ vµ gi¶i m· ®Òu cã c¸c thñ tôc gièng nhau v× vËy ta cã thÓ
x©y dùng c¸c modul thµnh c¸c ch−¬ng tr×nh con, vµ sö dông chung ®Ó gäi mçi
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 90
cÇn ®iÒu nµy ®Æc biÖt cã ý nghÜa khi dïng thuËt to¸n nµy ®Ó l−u tiÕng nãi d−íi
d¹ng c¬ së d÷ liÖu th× thuËt to¸n thùc hiÖn cµng dÔ dµng vµ gän nhÑ h¬n.
D. Ph−¬ng ph¸p CS-ACELP
1. Giíi thiÖu:
CS-ACELP lµ ph−¬ng ph¸p m· hãa tèc ®é thÊp dùa trªn c«ng nghÖ
CELP, ®· ®−îc ITU-T giíi thiÖu trong khuyÕn nghÞ G729, víi tèc ®é bit lµ
8kbps. TÝn hiÖu 8 Khz , tèc ®é 64 Kbps phÝa ®Çu vµo vµ ®−îc biÕn ®æi thµnh
tÝn hiÖu PCM víi sè bÝt m· hãa lµ 16 bit. C¸c modul phÇn thu vµ phÇn ph¸t lµ
c¬ b¶n gièng nhau nªn em chØ xin phÐp tr×nh bµy c¸c modul gi¶ thuËt chÝnh.
2. Tæng quan:
M· ho¸ CS- ACELP dùa trªn ph−¬ng ph¸p m· ho¸ dù ®o¸n tuyÕn tÝnh
kÝch thÝch, mçi khung tÝn hiÖu xö lý cã chiÒu dµi lµ 10ms, tøc lµ 80 mÉu øng
víi tÝn hiÖu sè cã tÇn sè lÊy mÉu lµ 8 Khz. ë mçi khung nµy tÝn hiÖu sÏ ®−îc
ph©n tÝch vµ tÝnh to¸n (c¸c th«ng sè vÒ bé läc, th«ng sè vÒ biªn ®é, ©m kªu
kh«ng kªu... ) sau ®ã ®−îc m· ho¸ vµ truyÒn ®i.
PhÝa thu c¸c th«ng sè trªn sau khi nhËn ®−îc thùc hiÖn c¸c chøc n¨ng
biÕn ®æi ng−îc l¹i(kÝch thÝch c¸c bé läc tæng hîp thêi h¹n vµ mét sè c¸c biÕn
®æi kh¸c) sÏ nhËn ®−îc tÝn hiÖu analogue phÝa ra.
Th«ng sè Tõ m· Khung
con 1
Khung
con 2
Toµn
khung
CÆp phæ ®−êng L0,L1,L2 ,L3 18
§é trÔ sæ m· ®éng P1 , P2 8 5 13
TrÔ cao ®é P0 1 1
ChØ sè sæ m· ®éng C1 ,C2 13 13 16
DÊu sæ m· ®éng S1 ,S1 4 8
Biªn ®é sæ m· b1 GA1 ,GA2 3 3 6
Biªn ®é sæ m· b1 Gb1 ,GB2 4 4 8
Tæng sè 80
Ph©n bè bÝt m· ho¸ trong CS - ACELP.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 91
Tõ b¶ng ta tÝnh ®−îc tèc ®é m· ho¸ nh− sau:
C= 80/10.10-3=8.000 bps = 8 Kbps
3. Bé m· ho¸
TÝn hiÖu ®Çu vµo ®−îc ®−a qua bé läc th«ng cao vµ ®−îc chia thang t¹i
bé tiÒn xö lý, TÝn hiÖu nµy sÏ ®−îc dïng cho c¸c qu¸ tr×nh gia c«ng ë c¸c
b−íc tiÕp theo.
Vai trß cña khèi nµy lµ t¹o ra tÝn hiÖu PCM cã sè bÝt m· ho¸ lµ 16 bÝt(
t−¬ng øng víi 216 = 65536 møc ) nh− ®· nãi ë trªn, Khèi nµy thùc hiÖn hai
chøc n¨ng :
• §o tÝn hiÖu (®Ó chia thang).
• Läc th«ng cao.
Thùc hiÖn cña viÖc chia tÝn hiÖu lµ v× thuËt to¸n ®−îc thùc hiÖn víi dÊu
phÈy tÜnh(thùc hiÖn b»ng vi xö lý hu¹c phÇn mÒm- xem phô lôc) cho nªn ®Ó
tr¸nh viÖc trµn phÐp tÝnh ph¶i chia thµnh hai phÇn : phÇn d−¬ng vµ phÇn ©m.
Bé läc th«ng cao thùc hiÖn vai trß läc bá c¸c thµnh phÇn tÇn sè thÊp kh«ng
mong muèn, tÇn sè c¾t lµ 140hz , cã hµm truyÒn :
Hh1(z) = 21
21
Z9114024,0Z9059465,11
Z4636378,0Z92724705,046363718,0
−−
−−
+−
+− (pt.1)
Ph©n tÝch LP (Linear Predictor- tiªn ®o¸n t−¬ng thÝch) ph©n tÝch tÝn hiÖu
cã thêi gian 10 ms ®Ó t¹o ra c¸c hÖ sè cña bé läc LP, HÖ sè nµy biÕn ®æi thµnh
nh÷ng cÆp phæ ®−êng (LSP) vµ ®−îc l−îng tö ho¸ sö dông bé l−îng tö vÐc t¬
pháng ®o¸n hai møc 18 bit. TÝn hiÖu kÝch thÝch ®−îc chän nhê ph−¬ng ph¸p
mµ ta ®· bµn ®Õn ë ch−¬ng tr−íc ®ã lµ ph−¬ng ph¸p : Ph©n tÝch dùa trªn tæng
hîp. Trong ®ã sai sè gi÷a tÝn hiÖu nguån vµ tÝn hiÖu kh«i phôc ®−îc tèi thiÓu
ho¸.
Theo ph−¬ng ph¸p ®o ®é mÐo träng sè c¶m nhËn. ViÖc nµy ®−îc thùc
hiÖn bëi läc tÝn hiÖu sai sè dïng bé läc träng sè c¶m nhËn, víi c¸c hÖ sè cña
bé läc lÊy tõ bé läc LP gi¶i l−îng tö hãa. (thµnh phÇn cña bé läc träng sè c¶m
nhËn cã t¸c dông c¶i thiÖn nh÷ng tÝn hiÖu vµo cã ®¸p øng tÇn sè ph¼ng.
C¸c th«ng sè kÝch thÝch (th«ng sè m· t−¬ng thÝch(hay cßn gäi lµ ®éng)
&th«ng sè m· cè ®Þnh) ®−îc tÝnh tõ viÖc ph©n tÝch mÉu tÝn hiÖu cã chiÒu dµi
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 92
5ms (40 mÉu). HÖ sè läc LP ®−îc l−îng tö ho¸ vµ gi¶i l−îng tö hãa ®Ó sö
dông cho khung con thø hai, trong khi c¸c hÖ sè bé läc cña khung con thø
nhÊt ®−îc tÝnh b»ng phÐp néi suy . TrÔ cao ®é (picth delay) vßng më ®−îc −íc
l−îng cø 10ms mét lÇn / 1 khung (cña tÝn hiÖu tiÕng nãi ®· ®−îc ®¸nh träng sè
c¶m nhËn).
C¸c tÝn hiÖu môc tiªu(target signal) x(n) ®−îc tÝnh bëi läc phÇn d− LP
th«ng qua bé läc tæng hîp träng sè W(z)/A(z). Tr¹ng th¸i khëi t¹o cña bé läc
®−îc cËp nhËt bëi sai sè gi÷a tÝn hiÖu kÝch thÝch vµ tÝn hiÖu d−, tøc lµ thùc hiÖn
phÐp trõ tÝn hiÖu ra cña bé läc tæng hîp khi tÝn hiÖu vµo lµ ZERO vµ tÝn hiÖu
tiÕng nãi träng sè.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 93
+
TiÒn
xö lý
Ph©n tÝch cao
®é
Ph©n tÝch
LP
Sæ m·
cè ®éng
Bé läc
tæng hîp
Sæ m·
cè ®Þnh
Sæ m·
cè ®éng
Sæ m·
cè ®Þnh
T×m sæ m· cè
®Þnh
Läc träng sè
c¶m nhËn
Läc
thêi h¹n ng¾n
Xö lý
th«ng +
+
L−îng tö
biªn ®é
M· ho¸
c¸c th«ng sè
TiÕng nãi vµo
TiÕng nãi ra
Chuçi bit
truyÒn
Th«ng
sè
vµo
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 94
§¸p øng xung h(n) cña bé läc tæng hîp träng sè ®−îc tÝnh to¸n vµ ph©n
tÝch trong chu kú khÐp kÝn cao ®é, kÕt hîp sö dông x(n) ®Ó t×m c¸c th«ng sè
biªn ®é vµ trÔ biªn ®é cña sæ m· thÝch øng. Trong thuËt to¸n nµy ng−êi ta ®·
chän gi¸ trÞ trÔ cao ®é lµ 1/3, nã ®−îc m· hãa víi khung con ®Çu lµ 8 bit vµ
khung con thø hai lµ 5 bit.
X(n) ®−îc cËp nhËt theo tõng khung. Víi sæ m· cè ®Þnh (gäi lµ sæ m·
GAUSS).
4. Sù trÔ cña c¸c phÐp tÝnh :
Bé m· ho¸ lµm viÖc víi chiÒu dµI cña tÝn hiÖu lµ 10 ms, Thêi gian look-
ahead lµ 5ms,phÇn trÔ bao gåm :
• Thêi gian xö lý cÇn thiÕt cho c¸c to¸n h¹ng m· ho¸ vµ gi¶I
m·, víi c¸c tèc ®é xö lý chËm th«ng th−êng phÐp nh©n cã
thÓ mÊt tõ 2- 3 chu kú m¸y(cña bé ®Þnh thêi).
• Thêi gian trÔ trªn ®−êng truyÒn .
• TrÔ khi ghÐp kªnh khi tiÕn hµnh ghÐp kªnh gi÷a tho¹i vµ c¸c
tÝn hiÖu kh¸c(trung kÕ hay c¸c trôc chÝnh).
5. C¸c hµm thùc hiÖn m· ho¸:
a. Bé läc ph©n tÝch, tæng hîp thêi h¹n ng¾n dùa trªn bé läc dù ®o¸n tuyÕn
tÝnh bËc 10 cã hµm truyÒn ®¹t:
∑=
=
−+
= 10
1
1
1
)(
1
i
i
i
zZa
zA
(pt.2)
Trong ®ã ai lµ c¸c hÖ sè dù ®o¸n tuyÕn tÝnh. Dù ®o¸n tuyÕn tÝnh ®−îc
thùc hiÖn mçi khung tÝn hiÖu mét lÇn sö dông ph−¬ng ph¸p tù t−¬ng quan víi
cöa sæ tÝn hiÖu dµI 30ms. Cø 80 mÉu(20ms) hÖ sè tù t−¬ng quan cña cöa sæ tÝn
hiÖu ®−îc tÝnh vµ chuyÓn ®æi thµnh hÖ sè LP (linear Pridiction-dù ®o¸n tuyÕn
tÝnh),b»ng gi¶I thuËt Levinson(hay cßn gäi lµ phÐp ®Ö quy), sau ®ã c¸c hÖ sè
LP ®−îc truyÒn ®Õn LSP cung cÊp cho c¸c phÐp tÝnh néi suy vµ tù t−¬ng quan.
Bé läc l−îng tö vµ gi¶I l−îng tö néi suy biÕn ®æi ng−îc trë l¹i ®Ó ®−îc c¸c hÖ
sè LP(nh− phÇn tr−íc ®ã) ®Ó cÊu thµnh nªn bé läc träng sè vµ bé läc tæng hîp
cho mçi khung con.
b. TÝnh to¸n cöa sæ tÝn hiÖu vµ hµm tù t−¬ng quan:
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 95
Cöa sæ tÝn hiÖu bao gåm hai thµnh phÇn : cöa sæ Hamming vµ cöa sæ
hµm COSIN:
Wlp(n) = 0,54 – 0,36 cos 399
2 nΠ víi n=0,…,199
= cos )
159
)200(2( −Π n víi n=200,…,239 (pt.3)
Cã 5ms phÇn ®Çu trong ph©n tÝch LP, tøc lµ 40 mÉu cho khung tiÕp theo.
Cöa sæ ph©n tÝch LP cung cÊp 120 mÉu tõ khung tiÕng nãi cuèi cïng, 80 mÉu
tõ khung hiÖn t¹i, vµ 40 mÉu tõ khung tiÕp.
Cöa sæ tiÕng nãi:
S’(n)=Wlp(n)S(n) víi n=0,…239 (pt4)
C«ng thøc tÝnh hÖ sè tù t−¬ng quan lµ:
r(k) = ∑
=
−
239
'' )()(
kn
knsns víi k=0,…10 (pt5)
§Ó tr¸nh sö lý phøc t¹p øng víi c¸c tÝn hiÖu vµo ë møc thÊp, ta chän nh−
sau: giíi h¹n d−íi r(0)=1,0 vµ ®é déng b¨ng tÇn lµ 60 Hz sö dông :
Wlag(k) = exp(-
20 )
2
(
2
1
sf
kfΠ
) (pt6)
Trong ®ã f0 = 60hz , vµ fs = 8000hz (tÇn sè lÊy mÉu) . H¬n n÷a hÖ sè tù t−¬ng
quan ®−îc nh©n víi hÖ sè tù t−¬ng quan nhiÔu tr¾ng 1,0001, øng víi møc
nhiÔu nÒn lµ -40dB. Khi ®ã hÖ sè tù t−¬ng quan thay ®æi nh− sau:
r’(0) = 1,001.r(0)
r’(k) = Wlag(k).r(k) k= 1,…, 10 (pt7)
c. ThuËt to¸n ®Ò quy Levinson-Purbin:
HÖ sè tù t−¬ng quan thay ®æi r’ (k) th−êng dïng hÖ sè läc LP, ai
(I=1,…10), ®−îc tÝnh theo ph−¬ng tr×nh sau:
)(|)(| '
10
1
' krkira
i
i −=−∑
=
k= 1,…10 (pt8)
Ph−¬ng tr×nh nµy ®−îc tÝnh theo gi¶I thuËt Levinson-Purbin :
b¾t ®Çu;
g¸n E[0] = r’(0);
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 96
b¾t ®Çu tõ i=1 ®Õn i=10
a0
[i-1] =1
k=-[ )('
1
0
]1[ jira
i
j
j
i −∑−
=
− ]/E[i-1]
ai
[i] = ki
tõ j=1 ®Õn i-1
aj
[i] = aj
[i-1] + k. ai-j
[i-1]
kÕt thóc vßng trong ;
E[i] = (1- ki
2)E[i-1]
kÕt thóc c¶ ch−¬ng tr×nh;
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 97
th«ng cao vµ chia
thang
A(z)->LSP
cöa sæ
tù t−¬ng
quan
t−¬ng
thÝch
c¶m
nhËn
cöa sæ
tù t−¬ng
quan
cöa sæ
tù t−¬ng
quan
cöa sæ
tù t−¬ng
quan
TÝnh to¸n
tiÕng nãi ®·
®−îc ®¸nh
träng sè
A(z) A`(z)
L0, L1,
L2,L3
t×m trÔ cao
®é vßng më
t×m tÝn hiÖu
®Ých cao ®é
tÝnh ®¸p
øng xung
t×m biªn ®é
vµ trÔ cao
®é vßng
®ãng
tÝnh phÇn
®ãng gãp
cña chu kú
cao ®ä
A(z) A`(z)
Po
p1
P2
A(z) A`(z)
+
v(n)
t×m vect¬
®Ých
t×m tõ m· Ck
t×m φ
lùa chän
tr−íc mét
biªn ®é
xung tèi −u
Läc tr−íc
cao ®é
Dù ®o¸n
biªn
®é m· MA
kÕt hîp
cÊu tróc
VQ tÝnh tõ
m·
P(z)
TÝnh
kÝch
thÝch vµ
cËp nhËt
tr¹ng
th¸i bé
läc
S1, C1
S2, C2
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 99
d. BiÕn ®æi LP /LSP:
C¸c hÖ sè ai ®−îc biÕn ®æi thµnh c¸c cÆp phæ ®−êng (LSP) ®Ó cung cÊp
cho qu¸ tr×nh néi suy, vµ l−îng tö. Víi bé läc LP bËc 10, hÖ sè LSP ®−îc ®Þnh
nghÜa lµ tæng vµ hiÖu cña nghiÖm ®a thøc:
F’1(z) = A(z) + Z
-11A(Z-1)
F’2(z) = A(z) -Z
-11A(Z-1) (pt10)
§a thøc F1
’(z ) lµ ®a thøc ®èi xøng, F’2(z) lµ ®a thøc kh«ng ®èi xøng, cã
thÓ chøng minh tÊt c¶ c¸c nghiÖm cña ®a thøc nµy n»m trªn ®−êng trßn ®¬n vÞ
(Z=1) .
F’1(z) cã nghiÖm z=-1(khi ω=1). F’2(z) cã nghiÖm z=1 (khi ω=0). Hai
nghiÖm nµy ®−îc lo¹i bá víi ®a thøc míi (®¹o hµm):
F’1(z)= F
’
1(z)/1+z
-1
F’2(z)= F
’
2(z)/1+z
-1 (pt11)
Víi vßng trßn ®¬n vÞ (e±ω) mçi ®a thøc trªn cã 5 nghiÖm
Cã thÓ viÕt lµ :
F1 = ∏
=
−
9,..,3,1
21(
i
qiz
-1 + z-2)
F1 = ∏ −
10,..,4,21
21(
i
qiz
-1 + z-2) (pt12)
Trong ®ã qi = cos(ωi), ωi lµ tÇn sè phæ ®−êng LSF cã khoangr nh− sau:
0<ω1<ω2<... <ω10<∏.
H»ng sè qi lµ hÖ sè LSP trong vïng cosin.
C¶ hai ®a thøc trªn lµ ®èi xøng chØ víi 5 hÖ sè ®Çu tiªn, ®−îc tÝnh b»ng
vßng lÆp :
f1(i+1) = ai+1 +a10-i – f1(i) i = 0,...., 5
f2(i+1) = ai+1 +a10-i – f2(i) i = 0,...., 5
Gi¸ trÞ khëi ®Çu lµ f1(0)= f2(0)=1,0. HÖ sè LSP ®−îc t×m ra b»ng c¸ch
−íc l−îng hai ®a thøc trªn t¹i 60 ®iÓm chia ®Òu trªn ®o¹n (0; ∏), sau ®ã tiÕn
hµnh kiÓm tra dÊu (nÕu cã sù thay ®æi dÊu cã nghÜa lµ cã nghiÖm ). Dïng ®a
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 100
thøc ChebyShev ®Ó −íc l−îng, nghiÖm ®−îc t×m trùc tiÕp tõ trong mét vïng
cosin, tøc lµ t¹i gi¸ trÞ z=ejω, khi ®ã ®a thøc ®−îc viÕt lµ:
F(ω)= 2. e-jsωC(x) (pt13)
C(x)= T5(x) + f(1)T4(x)+ f(2)T3(x) + f(3)T2(x) + f(4)T1(x) + f(5)/2 (pt14)
Tm(x) = cos(mω) lµ ®a thøc ChebyShev thø m.
C(x) ®−îc −íc lù¬ng víi gia trÞ chÝnh x¸c theo vßng lÆp :
b5 = 1 ; b6= 0
for k = 4 downto 1
bk = 2xbk+1 -2xbk+2 + f(5-k)
end;
C(x)= xb1 – b2 +f(5)/2 ;
e. HÖ sè l−îng tö ho¸ LSP, qi
qi ®−îc l−îng tö ho¸ b»ng viÖc sö dông tÇn sè LSF, ωi trong vïng tÇn sè
tiªu chuÈn [0; ∏] : ωi= arccos(qi) ,i=1,...,10
Dù ®o¸n dÞch chuyÓn trung b×nh (MA) thø 4 th−êng hay ®o¸n qi t¹i
khung hiÖn t¹i , sö dông bé l−îng tö vecter hai b−íc .
Gi¶i thÝch qu¸ tr×nh nµy nh− sau, ®Ó thuËn tiÖn miªu t¶ qu¸ tr×nh gi¶i m·,
mçi hÖ sè bao gåm tæng hai sæ m·
I`i = Li
1(L1) + Li
2(L2) khi i=1,...,5
I`i = Li
1(L1) + Li-5
3(L3) khi i=1,...,5
Li lµ c¸c chØ sè sæ m·. §Ó tr¸nh hiÖn t−îng céng h−ëng s¾c trong bé läc
tæng hîp LP th× ii ®−îc ph©n kho¶ng t¹o ra c¸c sè nh− lµ hÖ sè ®iÒu chØnh cã
kho¶ng c¸ch tèi thiÓu ho¸ ký hiÖu lµ J, theo thuËt to¸n :
J= 0,0012
dem=1;
nh·n : for i= 2 to 10
nÕu (I`i-1> I`i-J) th×
thùc hiÖn:
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 101
I`i-1> (I`i- + I`i-1 - J )/ 2
I`2> (I`i- + I`i+1 - J )/ 2
kÕt thóc;
dem=dem+1;
nÕu dem>=2 kÕt thóc;
nÕu kh«ng:
J=0,0006 quay l¹i nh·n;
Chó ý r»ng sau qu¸ tr×nh nµy ta tÝnh ®−îc ω`mi nh− sau:
ω`mi = (1 -∑
=
4
1
,`
k
kiP )I`
m
i +∑
=
4
1
,`
k
kiP I`
m-k
i , víi i=1,...,10 (pt15 )
Trong ®ã P`lµ hÖ sè chuyÓn ®æi MAd cña bé ®o¸n.
Sau khi tÝnh ®−îc ω`mi, bé läc t−¬ng øng ®−îc kiÓm tra theo c¸c b−íc :
1. T¨ng gi¸ trÞ cña ωi thø i
2. NÕu ω`i < 0,005 th× g¸n = 0,005
3. NÕu ωi+1-ωi = 0,0391 th× ωi+1=ωi + 0,0391
4. NÕu ω`i > 3,135 th× g¸n = 3,135
Thñ tôc m· ho¸ tham sè cã thÓ tãm t¾t nh− sau:
øng víi mçi hai bé ®o¸n MA, sù xÊp xØ ®óng nhÊt cña hÖ sè LSP hiÖn t¹i
ph¶i ®−îc t×m ra, th«ng sè nµy ®−îc ®Þnh nghÜa lµ gi¸ trÞ sai sè trung b×nh b×nh
ph−¬ng ®−îc ®¸nh träng sè ®−îc tèi thiÓu ho¸ .
Elsf =
210
1
`)(∑ − iii ωωω (pt16)
Träng sè ωi ®−îc t¹o mét c¸ch t−¬ng øng mét hµm cña hÖ sè LSF gi¶i
l−îng tö ho¸:
ω1 = 10(ωi – 0,04∏ -1)2 nÕu ωi – 0,04∏ -1 >0 (pt 17)
= 1,0 nÕu ωi+1- ωi-1-1>0
ω20 (pt18)
= 10(ωi+1 – ωi-1 -1)2 +1 Gi¸ trÞ kh¸c
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 102
ω10 = 1,0 nÕu -ω9 – 0,92∏ -1>0
= 10(-ω9 – 0,92∏ -1)2 +1) , gi¸ trÞ kh¸c (pt 19)
kÕt qu¶ cuèi cïng ω5 , ω6 ®−îc nh©n víi 1,2.
VÐc t¬ l−îng tö ho¸ cho khung thø m ®−îc tÝnh theo ph−¬ng tr×nh:
Li=[ωmi - ∑
=
4
1
,`
k
kiP I`
m-k
i ] /[1-∑
=
4
1
,`
k
kiP ] (pt20)
Sæ m· L1 ®Çu tiªn ®−îc t×m ra b»ng ph−¬ng ph¸p sai sè b×nh ph−¬ng
trung b×nh , ®iÒu nµy cho phÐp t¹o ra sæ m· thø hai L2 (coi lµ b−íc thø 2) , víi
mçi gi¸ trÞ xem xÐt cã thÓ ®−îc gi¶i cÊu tróc theo ph−¬ng tr×nh (pt15), víi ®é
ph©n gi¶i (khi tÝnh gÇn ®óng)lµ 0,0012 tèi thiÓu ho¸ theo (pt16) tÝnh ®−îc
träng sè MSE,vect¬ L2 lµ kÕt qu¶ cña gi¸ trÞ øng víi sai sè thÊp nhÊt , còng víi
ph©n kho¶ng nh− trªn tÝnh ®−îc L3(b−íc 3) , còng cã nghÜa lµ c¸c vect¬ I`i
®−îc ph©n thang víi ®é ph©n gi¶i lµ 0,0006.
f. HÖ sè néi suy LSP
Khung con ®Çu ®−îc tÝnh bëi néi suy tuyÕn tÝnh víi c¸c th«ng sè t−¬ng
øng trong khung ®iÒu chØnh,sö dông cho khung con thø hai th× dïng hÖ sè
l−îng tö LP (& gi¶i l−îng tö), gäi qi (tr−íc)cña khung hiÖn hµnh lµ hÖ sè LSP
®−îc tÝnh tõ 10ms cöa sæ tÝn hieu cña khung hiÖn hµnh vµ gäi qi(sau) cña
khung hiÖn hµnh lµ hÖ sè LSP ®−îc tÝnh tõ 10ms cöa sæ tÝn hieu cña khung
tr−íc ®ã, ta tÝnh ®−îc hÖ sè néi suy LSP cña hai khung con:
Khung con1: qi
1=0,5qi(tr−íc) +0,5 qi(hiÖn t¹i)
Khung con2: qi
2=qi(hiÖn t¹i)
víi i =1,...10
g. ChuyÓn ®æi LSP thµnh LP.
Tøc lµ ta ph¶i t×m c¸c hÖ sè ai tõ qi, c¸c b−íc tÝnh to¸n nh− sau:
Ta cã : ai= 0,5 f1
’(i) +0,5 f2
’(i) khi i =1,...5;
= 0,5 f1
’(11-i) +0,5 f2
’(11-i) khi i =6,...10;
Trong ®ã :
f1’(i)= f1(i)+ f1(i-1) víi i=1,....,5
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 103
f2’(i)= f2(i)- f2(i-1) víi i=6,....,10
vµ gi¸ trÞ cña f1(i) tÝnh tõ thuËt to¸n:
f(0)=1; f(-1)=0;
tõ i=1 ®Õn 5
f1(i) = -2qi-1f1(i-1) +2f1(i-2)
tõ j=i-1 xuèng 1
f1
i(j) = f1
i-1(j) - 2q2i-1 f1
i-1(j -1) + f1
i-1(j-2);
kÕt thóc;
KÕt thóc ;
Gi¸ trÞ cña f2(i) còng tÝnh t−¬ng tù (b»ng c¸ch gäi ch−¬ng tr×nh con).
J. Bé läc th«ng sè c¶m nhËn.
Cã hµm truyÒn trong miÒn tÇn sè nh− sau:
W(z) =
∑
∑
=
−
=
−
+
+
=
10
1
2
10
1
1
21
1
1
1
)/(
)/(
i
i
i
i
i
i
i
i
za
za
zA
zA
γ
γ
γ
γ
(pt21)
C¸c gi¸ trÞ γ1,γ2 QuyÕt ®Þnh t©n sè ®¸p øng cña bé läc. §iÒu chØnh thÝch
hîp hai biÕn nµy, cã thÓ t¹o ®−îc sù ¶nh h−ëng “träng sè” lín. LËp hµm
cñaγ1,γ2 theo d¹ng phæ tÝn hiÖu vµo t−¬ng øng 1laanf / 1khung (tøc lµ 10ms),
cïng víi thùc hiÖn qóa tr×nh néi suy khung con ®Çu tiªn. D¹ng phæ ®−îc lÊy tõ
bé läc tiªn ®o¸n tuyÕn tÝnh thø hai pheo ph−¬ng ph¸p lÆp Levinson-Durbin.HÖ
sè ph¶n x¹ ki ®−îc tÝnh theo c«ng thøc biÕn ®æi ký hiÖu lµ Oi, ®−îc gäi lµ tØ sè
loga diÖn tÝch(LAR), cã gi¸ trÞ nh− sau:
Oi=log
i
i
k
k
−
+
0,1
0,1
, i= 1,2 (pt22)
Th«ng sè nµy lÊy tõ khung con thø hai cña khung hiÖn t¹i , cßn khung
thø nhÊt tÝnh tõ phÐp néi suy tuyÕn tÝnh:
khung con 1 : Oi = 0,5Oi(tr−íc) + 0,5Oi(hiÖn t¹i) víi i=1,2
khung con 2 : Oi =Oi(hiÖn t¹i)
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 104
§−êng bao phæ ®−îc ®Æc tÝnh ho¸ theo th«ng sè flat,nÕu flat=1, cã phæ
nghiªng , nÕu flat = 0 ta cã phæ dÑt. Víi mçi khung con ®Æc tÝnh nµy ®−îc tÝnh
tõ sù cung cÊp mét hµm gäi lµ hµm ng−ìng tÝnh hÖ sè LAR. Tr¸nh sù thay ®æi
qu¸ nhanh, mét gi¸ trÞ trÔ ®−îc sö dông bëi xem xÐt gi¸ trÞ cña flat trong
khung con tr−íc ®ã, khung thø m-1 .
flatm = 0 nÕu O1
m
0,65flat
m-1 = 1
= 1 nÕu O1
m>- 1,52 vµ O2 <0,43flat
m-1 = 0 (pt24)
=flatm-1 c¸c tr−êng hîp kh¸c
Thùc nghiÖm cã ®−îc nÕu flat=1 th× chänγ1=0,94 vµ γ2=0,6; nÕu flat=0
th× γ1= 0,98 ,γ2=®é lín céng h−ëng cña bé läc tæng hîp LP nh−ng ph¶i n»m
trong ®o¹n 0,4- 0,7 theo c¸ch :
γ2=-6,0dmim+1,0 , i= 1,...9
víi dmin= min(ωi+1 - ωi)
Khi ®ã hiÖu tiÕng nãi träng sè trong khung con ®−îc tÝnh:
sw(n)= s(n) + ∑
=
−
10
1
1 )(
i
i
i insa γ +∑
=
−
10
1
2 )(
i
i
i insa γ (pt25)
i= 0,...39
h. Ph©n tÝch vßng më cao ®é.
Nh− ®· nãi ë c¸c phÇn tr−íc tÝn hiÖu tiÕng nãi ®−îc xem xÐt bao gåm
thµnh phÇn cao ®é øng víi ©m kªu, xem xÐt chu kú cao ®é lµ dùa vµo cöa sæ
tÝn hiÖu ®Ó t×m ra c¸c th«ng sè cÇn thiÕt, chñ yÕu lµ ®é trÔ. §Ó gi¶m ®é phøc
t¹p (do viÖc trÔ cña sæ m· thÝch øng c¸c c©u lÖnh sÏ phøc t¹p), th× kho¶ng xem
xÐt ®−îc giíi h¹n xung quanh gi¸ trÞ tèi −u T0P.
T0P ®−îc tÝnh
T0P=t1
R(T0P) = R’(T0P)
nÕu R’(t2)>= 0,85 R’(T0P)
R’(T0P)= R’(t2)
T0P= t2
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 105
kÕt thóc
nÕu R’(t3)>= 0,85 R’(T0P)
R’(T0P)= R’(t3)
T0P= t3
kÕt thóc
C¸c ti ®−îc t×m nh− sau:
Chia kho¶ng nghiªn cøu lµm ba vïng: V1 t−¬ng øng cã t1 , víi i ch¹y tõ
80 ®Õn 143; t−¬ng tù V2 ,i=40- 70 cã t2; V3 , i=20-39 cã t3 . Gi¸ trÞ ti ®−îc
chän lµ gi¸ trÞ cùc ®¹i cña hµm:
R(k) = ∑
=
−
79
0
)()(
n
knswnsw
k. TÝnh to¸n ®¸p øng xung.
§¸p øng xung h(n) cña bé läc tæng hîp träng sè W(z)/A`(z) cÇn trong
viÖc t×m sæ m· ®éng vµ sæ m· cè ®Þnh. h(n) ®−îc tÝnh cho mçi khung con bëi
viÖc läc tÝn hiÖu nhê ba bé läc A(z/γ1) vµ 1/A`(z) vµ1/A(z/γ2).
L.TÝnh to¸n tÝn hiÖu ®Ých(target signal) x(n).
Thùc hiÖn trªn mçi khung con, cã gi¸ trÞ lµ hiÖu kÕt qu¶ cña bé läc tæng
hîp träng sè W(z)/A`(z) khi ®Çu vµo lµ Rezo vµ sw(n).
M. T×m sæ m· ®éng.
Th«ng sè sæ m· ®éng
L. T×m ®é cao vßng ®ãng.
∑
∑
=
==
39
0
39
0
)()(
)()(
)(
n
kk
n
k
nyny
nynx
kR (pt37)
Trong ®ã x(n ) lµ tÝn hiÖu ®Ých , y(n )lµ kÝch thÝch bé läc tr−íc ®ã t¹i thêi
®iÓm trÔ thø k, chó ý r»ng kho¶ng t×m kiÕm xung quanh gi¸ trÞ chän tr−íc lµ
Top cho khung con ®Çu , khung con thø hai l¹i coi gi¸ trÞ t×m ®−îc T1 lµ gi¸ trÞ
trung t©m ,TÝch chËp yk(n) tÝnh theo tmin , víi gi¸ trÞ nhËn trong kho¶ng
k=tmin+1,....,tmax, yk(n) ®−îc cËp nhËt trong vßng lÆp
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 106
yk(n)= yk-1(n-1) +U(-k)h(-n) , víi n=0,....,39 (pt38)
gi¸ trÞ U(n) (n=-139-39) lµ bé ®Õm kÝch thÝch , gi¸ trÞ khëi t¹o yk-1(-1)=0
cÇn chän U(n) sau cho trÔ cao ®é <40
§Ó tÝnh T2 cho khung con thø hai, thùc hiÖn b»ng ph−¬ng ph¸p néi suy
theo t−¬ng quan chuÈn nh− (pt37) vµ tÝnh nã ë gi¸ trÞ max, néi suy ®−îc thùc
hiÖn b»ng viÖc sö dông biÕn ®æi Furier nhanh hµm sinc, bé läc cã tÇn sè c¾t
khuyÕn nghÞ lµ 3,6khz, gi¸ trÞ néi suy R(k) víi c¸c ph©n sè –2/3, -1/3, 0 , 1/3,
2/3, ®−îc tÝnh theo c«ng thøc néi suy
Rt(k)=∑
=
+
3
0
)3(i)b-R(k
12
i
it +∑
=
+−++
3
0
)33(i)b1R(k
12
i
it
m. T¹o ra vÐc t¬ sæ m· ®éng.
Khi trÔ cao ®é ®−îc tÝnh to¸n, th× vect¬ sæ m· ®éng ®−îc tÝnh theo
ph−¬ng ph¸p néi suy tÝn hiÖu vµo u(n) nnh− sau:
v(n)=∑
=
+−−
9
0
30 )3()(
n
itbiknu +∑
=
+−++−
9
0
30 )33()1(
n
itbiknu (pt40)
b30 tÝnh dùa trªn cöa sæ Hamming hµm sinc giíi h¹n +39 huÆc –39.
C¸c modul gi¶i m· còng gièng nh− modul phÇn m· ho¸ nªn kh«ng tr×nh
bµy n÷a.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 107
Ch−¬ng V. Ph−¬ng ph¸p ®¸nh gi¸:
Cã vÊn ®Ò ®Æt ra lµ lµm sao ®¸nh gi¸ ®−îc ph−¬ng ph¸p m· ho¸ nµo lµ
tèt, tøc lµ ph¶i x¸c ®Þnh c¸ch ®¸nh gi¸ cho mçi ph−¬ng ph¸p m· ho¸ biÕt
tr−íc.
Nh×n chung c¸c tiªu chuÈn ®¸nh gi¸ cho ph−¬ng ph¸p m· ho¸ mét c¸ch
cô thÓ hiÖn nay ch−a cã chuÈn, ITU-T chØ quy ®Þnh trong khuyÕn nghÞ P800 vÒ
c¸ch thøc ®¸nh gi¸ chÊt l−îng nãi chung. Tuy nhiªn nÕu so s¸nh víi c¸c
ph−¬ng ph¸p thùc nghiÖm trong phßng thÝ ngiÖm th× nã kh«ng kh¸c lµ bao.
Trong ®iÒu kiÖn ViÖt Nam tiªu chuÈn cho ®¸nh gi¸ chÊt l−îng m· ho¸
tho¹i lµ ch−a cã trong c¸c tiªu chuÈn nghµnh, ta ®Òu chÊp nhËn c¸c s¶n phÈm
®−a ra cña c¸c h·ng chiÕm thÞ phÇn lín vÒ c¸c s¶m phÈm cung cÊp cho m¹ng
viÔn th«ng ViÖt nam, thÓ hiÖn mÆt næi ë c¸c thiÕt bÞ ®Çu cuèi di ®éng,
VoiceIP, dÞch vô viÔn th«ng qua vÖ tinh...
ChÝnh v× c¸c ph©n tÝch trªn mµ ë ®©y chØ ®−a ra c¸ch chung thùc hiÖn
viÖc ®¸nh gi¸ chÊt l−îng m· ho¸.
Quy tr×nh ®¸nh gi¸ mét hÖ thèng cã thÓ m« t¶ theo gi¶i thuËt trang sau,
Nh×n chung rÊt khã cã thÓ ®−a ra mét tiªu chuÈn ®¸nh gi¸ mét c¸ch
chÝnh x·c chÊt l−îng cña tÝn hiÖu tiÕng nãi ®−îc m· ho¸ theo ph−¬ng thøc hay
hÖ thèng nµo ®ã b»ng mét con sè cô thÓ, tøc lµ muèn nãi vÒ kh¶ n¨ng biÓu
diÔn nã nh− mét ®¹i l−îng gièng nh− c¸c ®¹i l−îng nh− kg,m, pa...kh«ng
nh÷ng thÕ do ®Æc tÝnh sinh häc cña thÝnh gi¸c kh¸c nhau cña con ng−êi, tøc lµ
cïng mét c©u nãi nh−ng ta sÏ nhËn ®−îc sù ®¸nh gi¸ kh¸c nhau ë c¸c con
ng−êi kh¸c nhau, c¸c giíi tÝnh ®é tuæi kh¸c nhau lµ kh¸c nhau, ngay c¶ khi
cña chÝnh ®èi t−îng ®ã trong c¸c kho¶ng kh«ng gian vµ thêi gian kh¸c nhau lµ
kh¸c nhau.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 108
HÖ thèng m· ho¸
KiÓm tra ®èi t−îng
chØ sè ®Þnh l−îng
Kiªm tra ®èi t−îng
§¹t yªu
cÇu
§ñ tèt
Nghe thùc tÕ
So s¸nh víi hÖ thèng kh¸c
S¬ ®å khèi quy tr×nh kiÓm tra chÊt l−îng m· ho¸.
Kh«ng
Kh«ng
®¹t
®¹t
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 109
Theo nh− quy tr×nh trªn th× qua tr×nh ®¸nh gi¸ ®−îc chia lµm hai b−íc:
• §Çu tiªn lµ hÖ thèng cÇn ®−îc ®¸nh gi¸ ®−îc ®o b»ng c¸c th«ng sè
®Þnh tÝnh, b»ng ph−¬ng ph¸p ®o ®èi t−îng thÓ hiÖn cô thÓ ë c¸c chØ
sè nh− SNR, kho¶ng phæ log, tØ lÖ gÇn ®óng IJAKURA.
• NÕu kh«ng ®¹t ®−îc chØ tiªu ®Æt ra ë c¸ch trªn th× kh«ng hÖ thèng sÏ
ph¶i ®−îc ®iÒu chØnh l¹i c¸c th«ng sè, thËm chÝ thay ®æi ph−¬ng
ph¸p cho ®Õn khi ®¹t ®−îc yªu cÇu ®Æt ra, NÕu ®¹t ®−îc c¸c chØ
tiªu ®Æt ra ë c¸ch trªn th× b−íc theo sÏ ®−îc thùc hiÖn, ®ã lµ qu¸
tr×nhkiÓm tra ®Þnh tÝnh sÏ ®−îc thùc hiÖn tiÕp theo, b»ng c¸c ph−¬ng
ph¸p kiÓm tra c¸c hÖ sè DAM, MRT, MOS .
I. KiÓm tra ®Þnh l−îng
1. TÝnh tØ sè tÝn hiÖu trªn nhiÔu(SNR):
Gi¶ sö t¹i thêi ®iÓm xem xÐt ta cã tÝn hiÖu s(n) gäi lµ tiÕng nãi nguån t¹i
thêi xem xÐt thø n, s`(n) lµ tÝn hiÖu xö lý b»ng ph−¬ng ph¸p m· ho¸ t−¬ng
øng.
Do ®ã ta cã tÝn hiÖu sai s«: e(n)=s(n)- s`(n)
Víi N mÉu tÝn hiÖu, ®Ó tÝnh SNR ta tÝnh n¨ng l−îng cña tÝn hiÖu nguån
vµ tÝn hiÖu sai sè:
Es
2 = ∑
=
N
n
ns
N 1
2 )(1 - ( ∑
=
N
n
ns
N 1
2 )(1 )
2
Ee
2 = ∑
=
N
n
ne
N 1
2 )(1 - ( ∑
=
N
n
ne
N 1
2 )(1 )
2
Ta cã :
SNR = E2s/E2e
NÕu gi¸ trÞ ban ®Çu, vµ sai sè cã gi¸ trÞ trung b×nh lµ zero th× thµnh phÇn
thø hai cña c«ng thøc trªn ®−îc bá qua.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 110
Th«ng th−êng SNR ®−îc chuyÓn sang ®¬n vÞ dB theo c«ng thøc:
SNR(dB)=10log10(SNR)
Mét trong nh÷ng ®Æc tÝnh cña tÝn hiÖu tiÕng nãi lµ thay ®æi mét c¸ch tù
nhiªn theo thêi gian, ®iÒu nµy dÉn ®Õn cã ®o¹n n¨ng l−îng tÝn hiÖu tiÕng nãi
cao, nh÷ng tr−êng hîp kh¸c l¹i thÊp. NÕu n¨ng l−îng sai sè lín h¬n hay nhá
h¬n mét h»ng sè cho tr−íc(th−êng lµ tuú ph−¬ng ph¸p m· ho¸), kÕt qu¶ cña
phÐp tÝnh SNR lµ kh«ng trung thùc bëi ¶nh h−ëng c¶m nhËn cña nhiÔu trung
vïng thÊp lµ nghiªm träng h¬n vïng cao, ®Ó tÝnh ®Õn kh¶ n¨ng nµy ta dung tØ
sè tÝn hiÖu trªn nhiÔu ®o¹n ký hiÖu lµ SNRSEG.
Xem xÐt c¸c ®o¹n tÝn hiÖu th«ng th−êng cã chiÒu dµi (15-20) ms , ta cã
SNRSEG= dB
M m
∑
=
M
1
SNR(m)1
TØ sè tÝn hiÖu trªn nhiÔu cña c¸c ph−¬ng ph¸p m· ho¸
tÝn hiÖu tiÕng nãi.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 111
Trong ®ã SNR(m) lµ tØ sè tÝn hiÖu trªn nhiÔu tÝnh theo c¸c c«ng thøc trªn
víi m lµ thêi ®iÓm xem xÐt thø m trong ®o¹n M, ®é ph©n gi¶i cña ®o¹n M
cang nhá th× sù ¶nh h−ëng cña c¸c gi¸ trÞ trªnh lÖch lµ kh«ng ®¸ng kÓ.
Mét ®Æc ®iÓm kh¸c lµ trong c¸c kho¶ng yªn lÆng SNR(dB) cã thÓ cã gi¸
trÞ ©m rÊt nhá, sù nh¹y c¶m cña tÝn hiÖu nµy cã thÓ thùc hiÖn theo hai c¸ch:
o Ph¸t hiÖn ®o¹n yªn lÆng khi tÝnh SNR(dB).
o §Æt ng−ìng thÊp T nÕu SNR(dB) r¬i xuèng mét gi¸ trÞ
thÊp h¬n ng−ìng th× ®Æt b»ng gi¸ trÞ thÝch hîp nµo ®ã.
2 ChØ sè ®é râ AI (articulation index):
Do ®Æc tÝnh cña tÝn hiÖu tiÕng nãi cã thÓ ®¹i diÖn bëi c¸c th«ng sè tÇn sè
khi tÝnh SNR, th«ng sè nµy quyÕt ®Þnh chØ sè râ AI khi sö dông tÝn hiÖu xem
xÐt lµ analogue .
TiÕn hµnh chia tÝn hiÖu sau khi qua bé läc th«ng b¨ng thµnh 20 ®o¹n nhá
theo b¶ng sau:
Sè b¨ng nhá Giíi h¹n tÇn s«(hz)
1 200-330
2 330-430
3 430-560
4 560-700
5 700-840
6 840-1000
7 1000-1150
8 1150-1310
9 1310-1480
10 1480-1660
11 1660-1830
12 1830-2020
13 2020-2240
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 112
14 2240-2500
15 2500-2820
16 2820-3200
17 3200-3650
18 3650-4250
19 4250-5050
20 5050-6100
Ta tÝnh AI theo c«ng thøc:
AI = ∑
=
20
1 30
)30),)((min(
20
1
m
dBmSNR
3. Kho¶ng phæ Log.
Khi m· ho¸ tÝn hiÖu tiÕng nãi, trªn c¬ së c¸ bé VOCODER, biªn ®é cña
phæ th−êng ®−îc sö dông tr−íc so víi tÝn hiÖu ph¸t ra ®Õn tai ng−êi, lý do tai
ng−êi cã qu¸n tÝnh, do vËy kÕt qu¶ tÝn hiÖu tæng hîp cã thÓ kh¸c so víi tÝn
hiÖu nguån, nh−ng ©m thanh nghe ®−îc vÉn gièng nhau, râ rµng SNR kh«ng
lín h¬n gÝa trÞ trung b×nh cña tÝn hiÖu ©m thanh khi ghi ©m vµ ph¸t l¹i, ®Ó thay
thÕ cho sù biÓu diÔn nµy ta dïng th«ng sè Log- phæ(cßn gäi lµ ph−¬ng ph¸p
Itakara).
Kho¶ng c¸ch biÓu diÔn sù kh¸c nhau gi÷a tÝn hiÖu nguån vµ tÝn hiÖu tæng
hîp huÆc gi÷a hai tÝn hiÖu tæng hîp, gi¸ trÞ kho¶ng c¸ch bé VOCODER
th−êng ®−îc dïng nhÊt trong ph−¬ng ph¸p LPC(m· ho¸ dù ®o¸n tuyÕn tÝnh),
biªn phæ thÓ hiÖn thµnh phÇn ph¸t ©m:
H(ej ω ) =
)( ωjeA
G
Trong ®ã A(z)= 1+a1 z
-1 + .....+ an z
-n
n tuú theo ph−¬ng ph¸p m· ho¸ :10, 12, 15...
KÝch th−íc phæ Log gi÷a H1(e
j ω) vµ H2(ej
ω) ®−îc tÝnh nh− sau:
d=[ Π−∫
Π
Π− 2
||)(|ln||)(|ln| 222
2
1
ωωω deHeH jj ]1/2
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 113
Trong ®ã c¸c hÖ sè ai lµ c¸c hÖ sè pháng ®o¸n theo ph−¬ng ph¸p ®· tr×nh
bµy , sau ®ã ta cã hÖ s« ceptral, ci ®−îc tÝnh nh− sau:
c1= - a1
ci = - ai + kki
i
k
ac
i
ki
−
−
=
∑ −1
1
i= 2,....,p
ci= kki
p
k
ac
i
ki
−
=
∑ −
1
i= p+1,...N
Cßn c0 n¨ng l−îng cña tÝn hiÖu, do mèi t−¬ng quan kh«ng trÔ t¹o ra(tøc
lµ chÝnh t¹i thêi ®iÓm ®ã). Khi ®ã kho¶ng c¸ch Log - phæ dLS ®−îc tÝnh:
dLS = [(c0-c`0) + 2
2
1
)`(∑
=
−
N
k
kk cc ]
1/2
ci vµ c`i lµ hÖ sè ceptral cña H1 vµ H2.
Trong ph−¬ng ph¸p ®o ®Þnh l−îng nµy cßn dïng c¸c chØ sè nh−: TØ lÖ
gÇn ®óng IJAKURA, kho¶ng c¸ch Euclidean.
II. Ph−¬ng ph¸p ®¸nh gi¸ ®Þnh tÝnh :
Nh− ®· tr×nh bµy trªn sau khi c¬ b¶n tho¶ m·n ®−îc nh÷ng yªu cÇu cña
b−íc trªn ta tiÕn hµnh b−íc tiÕp theo lµ kiÓm tra ®Þnh tÝnh, ph−¬ng ph¸p nµy
chÝnh lµ dùa trªn c¸c øng dông thùc tÕ,tøc lµ sÏ ®em ra thö nghiÖm. Víi qu¸
tr×nh nµy l¹i chia thµnh hai giai ®o¹n : kiÓm tra ®é dÔ hiÓu vµ kiÓm tra chÊt
l−îng.
1. KiÓm tra ®é dÔ hiÓu :
KiÓm tra ®é dÔ hiÓu dùa trªn kh¶ n¨ng ng−êi nghe cã thÓ ph©n biÖt ®−îc
c¸c phonemes víi c¸c ®Æc tÝnh th«ng th−êng, sö dông mét b¶ng c¸c cÆp tõ víi
tÝnh chÊt lµ cã 1 phonemes vµ 1 phô ©m, kiÓm tra b»ng c¸ch ng−êi nghe ®−îc
nghe mét tõ vµ ®−îc hái xem tõ ®ã lµ tõ nµo trong cÆp tõ.
Ph−¬ng ph¸p kiÓm tra chuÈn ®o¸n cã vÇn DRTC (Diagrostic Rhyme
Test).
veal-feel bean-peen zoo-sue dune-tune
meat-beat need-deed moot-boot news-dues
vee-beat sheet-cheat foo-pooh shoes-shoose
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 114
vee-bee cheep-keep juice-goose chew-choo
zee-thee peak-teak moon-noon pool-tool
weed-reed tey-tea coop-poop you-rue
yield-weild dint-tint vole-foal goat-coat
gin-chin nip-dip moan-mone note-dote
mitt-bit thick-tick those-doze though-dough
vill-bill sing-thing joe-go sole-thole
jilt-gilt fin-thin bowl-dole fore-thor
bid-did gill-dill ghost-boast show-so
hit-fit dense-tense vault-fault daunt-taunt
zed-said neck-deck moss-boss gnaw-daw
mead-bead fence-pence thong-tong shaw-chaw
then-den chair-care jaws-gauze saw-thaw
jest-guest pent-tent fought-thought bong-dong
met-peg hen-wren browl-wall caught-taught
vast-fast gaff-calf jock-chock bond-pond
mad-bad nab-dab mom-bomb knock-dock
than-dan shad-chad von-bon vox-box
jab-gab sank-thank jot-got chop-cop
bank-dank fad-thad wad-rod pot-tot
gat-bat shag-sag hop-fop got-dot
Ph−¬ng ph¸p nµy cã 6 ®Æc tÝnh cña tÝn hiÖu tiÕng nãi cÇn ®−îc kiÓm tra :
giäng, ©m mòi, sustention, ©m giã, graveness, c« ®äng.
TiÕn hµnh lËp b¶ng b»ng c¸ch ®¸nh dÊu víi ý nghÜa:
+ cã nghÜa lµ tõ ®· nhËn d¹ng ®−îc.
tõ biÕn mÊt.
thÓ hiÖn tõ trung lËp.
PhÇn tr¨m ®¸nh gi¸ tÝnh:
P =
T
W-R %
R : sè c©u tr¶ lêi ®óng.
W: sè c©u tr¶ lêi sai.
T : Tæng sè tõ kiÓm tra.
Gi¸ trÞ th«ng th−êng lµ( 75-95) %
HÖ thèng tèt lµ 90%.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 115
Sè ng−êi ®−îc kiÓm tra th−êng lµ 6 , 3 nam vµ 3 n÷ (®Ó ®¶m b¶o tÝnh
kh¸ch quan do cÊu t¹o c¬ quan ph¸t ©m cña nam vµ n÷ kh¸c nhau). Ta thÊy
c¸c cÆp vÇn kiÓm tra trªn kh«ng mang tÝnh quy ®Þnh bëi vËy hoµn toµn cã thÓ
x©y dùng mÉu cho tiÕng viÖt nh− cÆp vÇn : co-cã; mang- m¹ng; sung – sóng...
Ph−¬ng ph¸p kiÓm tra thay ®æi ©m vÇn MRT(Modified Rhyme Test).
Dùa trªn triÕt lý kiÓm tra sù kh¸c gi÷a hai céng h−ëng (formant), ph−¬ng
ph¸p nµy, ng−êi nghe ®−îc yªu cÇu chän tõ ®−îc nghe trong s¸u tõ, b¶ng d−íi
chØ ra bé tõ kiÓm tra:
1 2 3 4 5 6
PhÇn I ©m b¾t ®Çu lµ sù céng h−ëng
1 bat bad back bass ban bath
2 tab tan tam tang tack tap
3 pun puff pup puck pus pub
4 teach tear tease teal team teak
5 hear heath heal heave heat heap
6 cut cub cuff cup cud cuss
7 fill fic fin fizz fib fit
8 bun bus but buff buck bug
9 rave rake race rate raze ray
10 peage peas peak peal peat peach
11 dig dip did dim dill din
12 sing sit sin sip sick sill
13 map mat math man mass map
14 kick king kid kit kin kill
15 sad sass sag sack sap sat
16 sud sum sub sun sup sung
17 came cape cane cake cave case
18 sake sale save sane safe same
19 pass pat pack pad path pan
20 seep seen seetthe seed seem seek
21 late lake lay lace lane lame
22 pill pick pip pig pin pit
23 duck dud dung dub dug dun
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 116
24 page pane pace pay pale pave
25 bean beach beat beam bead beak
PhÇn II ©m kÕt thóc lµ sù céng h−ëng
26 led shed red bed fed wed
27 raw paw law jaw thaw saw
28 sip rip tip dip hip lip
29 way may say gay day pay
30 will hill kill till fill bill
31 book took shook cook hook look
32 peel reel feel heel keel eel
33 dig wig big rig pig fig
34 top hop pog cop mop shop
35 rang fang gang bang sang hang
36 hark dark mark lark park bark
37 nest vest west test best rest
38 ten pen den hen then men
39 foil coil boil oil toil soil
40 kit jit fit rit git hit
41 bust bust rust hust pust dust
42 Kick lick sick pick wick tick
43 meat feat heat seat beat neat
44 Sun nun gun fun bun run
45 Hot got not pot lot tot
46 fame same game name tame game
47 Tent bent went dent rent sent
48 Gale male tale bale sale pale
49 Pin sin tin win din fin
50 Sold told hold fold gold cold
2. KiÓm tra chÊt l−îng:
Tu©n theo khuyÕn nghÞ P800 cña ITU-T, c¸c ph−¬ng ph¸p chÝnh nh− sau:
Sau khi liÖt kª c¸c tham sè t¸c ®éng ®Õn chÊt l−îng cña m∙ ho¸ vµ
nh÷ng nguyªn t¾c phÇn nµy ph©n tÝch kh¶ n¨ng ®o vµ so s¸nh chÊt l−îng tho¹i
m∙ ho¸, cã thÓ ®o chÊt l−îng nhê sö dông c¸c kü thuËt ®o kh¸c nhau.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 117
Ph−¬ng ph¸p ®iÓm ®¸nh gi¸ trung b×nh MOS (MOS-Mean Opinion
Score).
§−îc m« t¶ trong KhuyÕn nghÞ P.800 cña ITU-T, MOS lµ mét phÐp ®o
chÊt l−îng tho¹i rÊt næi tiÕng. §©y lµ mét ph−¬ng ph¸p ®o chÊt l−îng mang
tÝch chÊt chñ quan. Cã hai ph−¬ng ph¸p tr¾c nghiÖm: ®¸nh gi¸ ®µm tho¹i vµ
®¸nh gi¸®é nghe. Tr¾c nghiÖm nµy xÐt ®o¸n chÊt l−îng cña hÖ thèng truyÒn
dÉn tho¹i hoÆc b»ng viÖc tiÕn hµnh mét cuéc ®µm tho¹i hoÆc b»ng viÖc nghe
c¸c mÉu tiÕng nãi. Sau ®ã ng−êi ta s¾p xÕp chÊt l−îng theo cÊp ®é sau ®©y:
Thang chÊt l−îng §iÓm Thang cè g¾ng nghe
RÊt tèt 5 Kh«ng cÇn cè g¾ng nghe
Tèt 4 Kh«ng cÇn cè g¾ng nghe ®¸ng kÓ
T¹m ®−îc 3 Ph¶i cè g¾ng võa ph¶i
Tåi 2 Ph¶i cè g¾ng nghe ®¸ng kÓ
XÊu 1 Kh«ng hiÓu nghÜa khi cè g¾ng hîp lý
Sau ®ã, MOS ®−îc tÝnh to¸n b»ng viÖc lÊy trung b×nh c¸c ®iÓm cña c¸c
®èi t−îng tr¾c nghiÖm. Sö dông cÊp ®é nµy, mét ®iÓm ®¸nh gi¸ trung b×nh lµ 4
hoÆc h¬n sÏ ®−îc coinh− chÊt l−îng ®−êng dµi. Lóc ®Çu MOS ®−îc thiÕt kÕ ®Ó
®¸nh gi¸ chÊt l−îng c¸c tiªu chuÈn m· hãa kh¸c nhau. D−íi ®©y lµ tãm l−îc
cña MOS cho c¸c thuËt to¸n m· hãa kh¸c nhau :
Tiªu chuÈn m· hãa MOS
PCM 4,3 (64kbit/s)
ADPCM 4,1 (32kbit/s)
QCELP13 4,2 (14,4kbit/s)
CELP 3,7(8kbps)
GSM 3,54(13kbps)
QCELP 3,54(9,6kbps)
CELP 3(4,8kbps)
LPC 2,5(2,4kbps)
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 118
MOS lµ tr¾c nghiÖm thÝch hîp nhÊt, bëi v× sö dông m¹ng tho¹i lµ con
ng−êi vµ tÝnh ®iÓm ®¸nh gi¸ còng lµ con ng−êi. Tuy nhiªn sù tr¾c nghiÖm chñ
quan kÐo theo c¸c chñ thÓ lµ con ng−êi cã thÓ rÊt mÊt thêi gian. Do vËy, ng−êi
ta chó ý nhiÒu ®Õn viÖc ®i t×m c¸c phÐp ®o thö kh¸ch quan cã thÓ ®−îc sö
dông ®Ó ®¸nh gi¸ gÇn ®óng víi c¶m nhËn cña con ng−êi vÒ chÊt l−îng tho¹i.
• §o chÊt l−îng tiÕng nãi theo c¶m nhËn (PSQM)
§−îc m« t¶ trong P.861 cña ITU-T, PSQM (h×nh 6) sö dông mét m« h×nh
©m thanh t©m lý häc (Psychoacoustic) ®Ó tÝnh to¸n theo to¸n häc nh÷ng sù
kh¸c nhau gi÷a c¸c tÝn hiÖu vµo vµ tÝn hiÖu ra.
Sö dông ph−¬ng ph¸p nµy, nÕu c¸c tÝn hiÖu ®Çu vµo vµ ®Çu ra gièng nhau,
®iÓm sè PSQM sÏ b»ng kh«ng. Sù kh¸c nhau cµng lín th× ®iÓm sè cµng cao,
tíi møc tèi ®a sÏlµ 6,5. Tuy nhiªn, kh«ng gièng nh− c¸c sè ®o truyÒn thèng
kh¸c, ch¼ng h¹n nh− tû so átÝn hiÖu trªn t¹p ©m (SNR), tÇm quan träng cña
PSQM lµ ë chç nh÷ng sù kh¸c nhau sÏ t¸c ®éng tíi c¶m nhËn cña con ng−êi
vÒ chÊt l−îng tiÕng nãi.
Mét trong nh÷ng sù chØ trÝch ®èi víi PSQM lµ ë chç lóc ban ®Çu nã ®·
®−îc thiÕt kÕ ®Ó ®o chÊt l−îng cña c¸c tiªu chuÈn m· hãa. Do vËy, nã kh«ng
tÝnh ®Õn mét c¸ch ®Çy ®ñ sù t¸c ®éng cña nh÷ng sù cè truyÒn dÉn kh¸c nhau.
PSQM+ ®· ®−îc ®Ò xuÊt vµo th¸ng 12 n¨m 1997 vµ cã tÝnh ®Õn:
- Nh÷ng c¶m nhËn kh¸c nhau do mÐo ©m l−îng.
- TiÕng nãi cã c¸c ®o¹n bÞ mÊt.
Víi PSQM+, mèi t−¬ng quan gi÷a ®iÓm ®¸nh gi¸ kh¸ch quan vµ MOS
®−îc c¶i thiÖn.
• C¸c ph−¬ng ph¸p kh¸c
Cã nhiÒu phÐp ®o kh¸ch quan kh¸c hoÆc míi ®−îc ®Ò xuÊt hoÆc ®· ®−îc
sö dông, bao gåm:
- C¸c khèi tiªu chuÈn hãa phÐp ®o (MNB-Measuring Normalizing
Blocks) ®−îc m« t¶
trong phô lôc II cña P.861.
- HÖ thèng ®o ph©n tÝch cã thÓ c¶m nhËn ®−îc (PAMS-Perceptual
Analysis
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 119
Measurement System) mét hÖ thèng ®éc quyÒn ®−îc ph¸t triÓn ë viÔn
th«ng Anh.
- §¸nh gi¸ c¶m nhËn chÊt l−îng tho¹i (PESQ-Perceptual Evalution of
Speech Quality)
- Mét tiªu chuÈn míi ®−îc ®Ò xuÊt vµ ®ang ®−îc ITU-T xem xÐt.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 120
KÕt luËn
Víi sù ph¸t triÓn m¹nh cña c«ng nghÖ chÕ t¹o phÇn cøng xö lý tÝn hiÖu
sè nãi chung vµ xö lý tÝn hiÖu tiÕng nãi nãi riªng còng ®¹t ®−îc rÊt nhiÒu
thµnh tùu, gióp cho thùc hiÖn ®−îc c¸c thuËt to¸n tinh vi phøc t¹p. KÕt qu¶
nµy kh«ng nh÷ng thùc hiÖn ®−îc cho c¸c thiÕt bÞ ®Çu cuèi phøc t¹p mµ cßn
gãp phÇn quyÕt ®Þnh cho c¸c lý thuyÕt viÔn th«ng ®i vµo thùc tÕ ch¼ng h¹n nh−
c¸c c«ng nghÖ ®iÖn tho¹i thÕ hÖ thø ba (3G), ®iÖn tho¹i IP ®a dÞch vô qua vÖ
tinh... GÇn ®©y ng−êi ta cßn chó ý nhiÒu ®Õn viÖc ¸p dông kü thuËt ph©n tÝch
Walets vµo lÜnh vùc xö lý tÝn hiÖu sè trong ®ã cã tÝn hiÖu tho¹i (c¸c ph−¬ng
thøc ®· tr×nh bµy chØ lµ ¸p dông c¸c biÕn ®æi Furier truyÒn thèng), ®· cã rÊt
nhiÒu c¸c ch−¬ng tr×nh nghiªn cøu cña c¸c quèc gia vµ c¸c h·ng lín, trong
t−¬ng lai kh«ng xa c¸c kü thuËt xö lý dùa trªn c«ng nghÖ nµy ch¾c ch¾n sÏ
®−îc giíi thiÖu.
ë ViÖt nam lÜnh vùc xö lý tÝn hiÖu tiÕng nãi gÇn ®©y míi ®−îc chó ý,
th¸ng 7-2001 phÇn mÒm nhËn d¹ng tiÕng viÖt ®−îc giíi thiÖu bëi viÖn c«ng
nghÖ th«ng tin, vµ c¸c ph−¬ng thøc ph©n tÝch tæng hîp tiÕng nãi b»ng formant
còng ®· ®−îc giíi thiÖu bëi t¸c gi¶ Lª Hång Minh (t¹p chÝ b−u chÝnh viÔn
th«ng th¸ng 3-2002). Tuy chóng kh«ng ph¶i lµ c¸c s¶n phÈm m· ho¸ tèc ®é
thÊp nh−ng nã còng lµ kÕt qu¶ cña sù ph©n tÝch nghiªn cøu b¶n chÊt ng«n ng÷
tiÕng ViÖt. V× vËy c«ng t¸c nghiªn cøu tiÕng viÖt cÇn ®−îc triÓn khai víi c¸c
vÊn ®Ò nh− x©y dùng ®Æc tÝnh thèng kª cho tiÕng viÖt, x©y dùng sæ m· chuÈn
cho tiÕng viÖt vµ tiÕp ®ã lµ s¶n xuÊt c¸c s¶n phÈm m· ho¸ tèc ®é thÊp cho ViÖt
nam. Ta cã thÓ tù tin mµ nghÜ r»ng c¸c s¶n phÈm m· ho¸ tèc ®é thÊp cho ViÖt
nam sÏ ®−îc ra ®êi trong thêi gian kh«ng xa.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 121
Môc lôc
Lêi nãi ®Çu ............................................................................................................. 1
Ch−¬ng I . TÝn hiÖu tiÕng nãi ................................................................................. 6
1. Qu¸ tr×nh ph¸t ©m cña con ng−êi: .................................................................. 6
2. §Æc tÝnh thèng kª cña tÝn hiÖu tiÕng nãi: ....................................................... 9
2.1, Hµm ph©n bè mËt ®é x¸c suÊt(pdf). ...................................................... 10
2.2, Hµm tù t−¬ng quan(ACF)...................................................................... 10
2.3, Hµm mËt ®é phæ c«ng suÊt PSD............................................................ 11
3. C¸c m« h×nh biÓu diÔn.................................................................................. 13
a. C¬ quan ph¸t ©m (vocal tract)................................................................... 13
b. M« h×nh sù kÝch thÝch............................................................................... 14
Ch−¬ng II . M· ho¸ vïng thêi gian. ..................................................................... 18
1. C«ng nghÖ PCM: .......................................................................................... 18
1.1 CÊu h×nh c¬ b¶n cña kiÓu truyÒn tin PCM: ............................................ 18
1.2 LÊy mÉu:................................................................................................. 19
1.3 L−îng tö ho¸: ......................................................................................... 21
1.4 Sù nÐn vµ gi·n: ....................................................................................... 22
1.5 M· ho¸ vµ Gi¶i m·: ................................................................................ 25
2.C¸c ph−¬ng ph¸p m· ho¸ kh¸c:..................................................................... 27
2.1 ph−¬ng ph¸p m· ho¸ DPCM ( §iÒu xung m· vi sai): ............................ 27
2.2 Ph−¬ng ph¸p DM ( ®iÒu chÕ delta): ....................................................... 29
2.3. §iÒu chÕ Deta tù thÝch nghi (ADM):..................................................... 31
3 Ph−¬ng ph¸p m· ho¸ ADPCM (§iÒu chÕ xung m· vi sai thÝch øng)
(DAPTIVE DIFFERENTIAL PULSE CODE MODULATION ): ............... 32
3.1. Tæng quan:............................................................................................. 32
3.1.1. M· ho¸ ADPCM(ADPCM encoder):............................................. 34
3.1.2 Gi¶i m· ADPCM (ADPCM decoder):............................................. 34
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 122
3.2. Nguyªn lý m· hãa ADPCM( ADPCM encoder principles): ................. 35
3.2.1. BiÕn ®æi ®Þnh d¹ng ®Çu vµo(Input PCM format conversion): ....... 35
3.2.2. TÝnh to¸n tÝn hiÖu vi sai (Difference signal computation): ............ 35
3.2.3. Bé l−îng tö t−¬ng thÝch (Adaptive quantizer): .............................. 35
3.2.3.1. Tèc ®é 40 kbps(Operation at 40 kbit/s): ................................. 35
3.2.3.2. Tèc ®é 32 kbps(Operation at 32 kbit/s): ................................. 36
3.2.3.3. Tèc ®é 24kbps(Operation at 24 kbit/s): .................................. 37
3.2.3.4. Tèc ®é 16 kbps(Operation at 16 kbit/s): ................................. 38
3.2.4. Bé l−îng tö ho¸ t−¬ng thÝch ng−îc( Inverse adaptive quantizer): 38
3.2.5. T−¬ng thÝch hÖ sè ph©n thang bé l−îng tö (Quantizer scale
factor adaptation): ................................................................................... 39
3.2.6. §iÒu khiÓn t−¬ng thÝch tiÕng nãi(Adaptation speed control): ....... 40
3.2.7. Bé tinh to¸n tÝn hiÖu håi phôc vµ bé pháng ®o¸n t−¬ng thÝch
(Adaptive predictor and reconstructed signal calculator): ..................... 42
3.2.8 Bé ph¸t hiÖn truyÒn vµ tone (Tone and transition detector): .......... 43
3.3. Nguyªn lý gi¶i m· ADPCM(ADPCM decoder principles):.................. 43
3.3.1. Bé l−îng tö thÝch øng ®¶o (Inverse adaptive quantizer): .............. 43
3.3.2.Bé l−îng tö t−¬ng thÝch hÖ sè thang (Quantizer scale factor
adaptation):............................................................................................... 44
3.3.3. §iÒu khiÓn tèc ®é thÝch øng ( Adaptation speed control): ............. 44
3.3.4. Bé tÝnh tÝn hiÖu håi phôc vµ bé tiÕn ®o¸n t−¬ng thÝch (Adaptive
predictor and reconstructed signal calculator): ........................................ 44
3.3.5. Ph¸t hiÖn truyÒn vµ tone (Tone and transition detector): ............... 45
3.3.6. BiÕn ®æi ®Þnh d¹ng ®Çu ra PCM (Output PCM format
conversion): .............................................................................................. 45
3.3.7. §iÒu chØnh m· ho¸ ®ång bé (Synchronous coding adjustment): ... 45
Ch−¬ng III . M· ho¸ vïng tÇn sè.......................................................................... 46
1. M· ho¸ d¶i nhá(Sbc). ................................................................................... 47
2. M· ho¸ biÕn ®æi thÝch nghi (ATC). .............................................................. 53
ch−¬ng IV. Ph−¬ng ph¸p m· ho¸ tham sè nguån (resourd parameters method) .55
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 123
1. Bé m· ho¸ nguån theo kªnh: ........................................................................ 57
2. Bé m· nguån tiÕng nãi formant.................................................................... 57
3. Bé m· nguån tiÕng nãi phæ t¸ch.................................................................. 58
4 Ph−¬ng ph¸p dù ®o¸n tuyÕn tÝnh LPC........................................................... 58
5. Bé m· ho¸ nguån tiÕng nãi ©m thanh ®−îc kÝch thÝch................................. 64
• M· ho¸ CELP ....................................................................................... 65
A. RPE- LPT (Bé lËp m· vµ gi¶i m· tiªn ®o¸n thêi h¹n dµi kÝch thÝch
xung ®Òu ®Æn). .............................................................................................. 68
B. V-CELP (m· ho¸ tiªn ®o¸n kÝch thÝch xung tæng hîp): .......................... 70
C. Ph−¬ng ph¸p LD-CELP(m· ho¸ tiªn ®o¸n kÝch thÝch xung cã ®é trÔ
nhá)............................................................................................................... 73
D. Ph−¬ng ph¸p CS-ACELP......................................................................... 90
Ch−¬ng V. Ph−¬ng ph¸p ®¸nh gi¸:..................................................................... 107
I. KiÓm tra ®Þnh l−îng .................................................................................... 109
1. TÝnh tØ sè tÝn hiÖu trªn nhiÔu(SNR):....................................................... 109
2 ChØ sè ®é râ AI (articulation index): ....................................................... 111
3. Kho¶ng phæ Log..................................................................................... 112
II. Ph−¬ng ph¸p ®¸nh gi¸ ®Þnh tÝnh : .............................................................. 113
1. KiÓm tra ®é dÔ hiÓu : ............................................................................. 113
2. KiÓm tra chÊt l−îng:............................................................................... 116
KÕt luËn .............................................................................................................. 120
Môc lôc............................................................................................................... 121
Các file đính kèm theo tài liệu này:
- Tín hiệu tiếng nói và các phương pháp mã hoá.pdf