Tín hiệu tiếng nói và các phương pháp mã hoá

Lời nói đầu Chương I. Tín hiệu tiếng nói 1. Quá trình phát âm của con người 2. Đặc tính thống kê của tín hiệu tiếng nói 3. Các mô hình biểu diễn Chương II. Mã hoá vùng thời gian 1. Công nghệ PCM 2. Các phương pháp mã hoá khác 3. Phương pháp mã hoá ADPCM (Điều chế xung mã vi sai thích ứng) Chương III. Mã hoá vùng tần số 1. Mã hoá dải nhỏ (SBC) 2. Mã hoá biến đổi thích nghi (ATC) Chương IV. Phương pháp mã hoá tham số nguồn (Resourd Parameters Method) 1. Bộ mã hoá nguồn theo kênh 2. Bộ mã nguồn tiếng nói formant 3. Bộ mã nguồn tiếng nói phổ tách 4 Phương pháp dự đoán tuyến tính LPC 5. Bộ mã hoá nguồn tiếng nói âm thanh được kích thích Chương V. Phương pháp đánh giá I. Kiểm tra định lượng II. Phương pháp đánh giá định tính Kết luận Giáo viên HD: Trần Quốc Thịnh

pdf123 trang | Chia sẻ: lvcdongnoi | Lượt xem: 2498 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Tín hiệu tiếng nói và các phương pháp mã hoá, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
}: §¸p øng tuÇn hoµn trong bé läc th¸c. Nh− vËy mét phÇn tö ®−îc x¸c ®Þnh bëi c¸c chØ sè i vµ j. TÝn hiÖu qua bé läc H(z) cã thÓ ®−îc biÓu diÔn: x`Þj= Hδ(n)giyj. Trong ®ã H lµ ma trËn sau: )()1()2()3()4( 0)()1()2()3( 00)()1()2( 000)()1( 0000)( ohhhhh ohhhh ohhh ohh oh H = TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 87 Gi¸ trÞ tèi −u t×m ®−îc b»ng ph−¬ng ph¸p cùc tiÓu ho¸, møc sai sè b×nh ph−¬ng trung b×nh: D=|| x(n)-x`ij || = σ2(n)||x`(n)-giHyi||2 Trong ®ã x`(n)=x(n)/ σ(n gäi lµ vÐc t¬ ®Ých biªn ®é chuÈn ho¸, suy ra D=σ2(n) ( ||x`(n)||2-2gix`T(n)Hyi|| + gi 2Hyi||2) Trong ®ã x`(n)||2 vµ σ2(n) lµ h»ng sè trong chu tr×nh t×m kiÕm do ®ã cùc tiÓu ho¸ D t−¬ng ®−¬ng víi cùc tiÓu ho¸ D` D`=-2gip T(n)yi + g 2 iEj víi p(n)= HTx`(n) vµ Ej=||Hyj|| 2 Víi Ej lµ n¨ng l−îng thùc tÕ cña vÐct¬ m« h×nh ®· ®−îc läc nã kh«ng phô thuéc vµo vÐct¬ môc ®Ých x(n). Còng chó ý r»ng vÐct¬ m· h×nh d¹ng lµ cè ®Þnh vµ ma trËn H chØ phô thuéc vµo bé läc tæng hîp vµ bé läc träng sè. Do ®ã Ej còngkh«ng ®æi trong chu kú 4 vÐct¬ . Trªn c¬ së quan s¸t nµy khi hai bé läc ®−îc cËp nhËt ta cã thÓ tÝnh vµ l−u gi¸ trÞ n¨ng l−îng cña 128 gi¸ trÞ Ej (0-127) (t−¬ng øng 128 vÐct¬ m· h×nh) vµ sau ®ã sö dông c¸c gi¸ trÞ nµy lËp l¹i cho qu¸ tr×nh t×m kiÕm víi 4 vÐct¬ tiÕp theo. Gi¶i thuËt nµy lµm gi¶m ®é phøc t¹p còng nh− thuËt to¸n t×m kiÕm ®i rÊt nhiÒu. Ta cã thÓ tÝnh tr−íc vµ l−u hai d·y sè: bi=2gi vµ cj = gj 2. Vµ ta cã thÓ biÓu diÔn D`=-biPj +ciEj = -biP T(n)yi +ciEj Ej , bi , ci ®−îc ®−îc tÝnh vµ l−u tr÷ d−íi d¹ng b¶ng. Thñ tôc t×m kiÕm sæ m· thùc hiÖn tõng b−íc qua sæ m· h×nh yj.vµ chØ sè biªn ®é i t−¬ng øng yj. C¸c c¸ch t×m chØ sè biªn ®é i tèi −u nhÊt víi mçi vÐct¬ m· yi. a. C¸ch thø nhÊt: −íc l−îng 8 gi¸ trÞ cã thÓ D t−¬ng øng víi 8 gi¸ trÞ cã thÓ cña i, vµ sau ®ã lÊy chØ sè i cã D nhá nhÊt . TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 88 b. C¸ch thø hai: TÝnh to¸n tèi −u gi¸ trÞ biªn ®é g`=Pj/Ej sau ®ã l−îng tö ho¸ biªn ®é nµy thµnh mét trong 8 møc ë 3 bit sæ m· biªn ®é. ChØ sè i tèt nhÊt lµ chØ sè cña møc biªn ®é gi gÇn nhÊt. c. C¸ch thø ba: Thùc hiÖn phæ biÕn ë c¸c IC DSP g` l−îng tö cã thÓ xem nh− so s¸nh hai chuçi g` vµ biªn ®é l−îng tö ho¸ mµ ®iÓm gi÷a cña nã ®iÒu chØnh møc khuyÕch ®¹i. §Æt di lµ ®iÓm gi÷a gi vµ gi+1 sao cho hai gi¸ trÞ nµy cïng dÊu, sau ®ã kiÓm tra g`<di . bëi vËy b»ng viÖc sö dông ph−¬ng thøc nµy ta cã thÓ tr¸nh ®−îc ph¶i thùc hiÖn c¸c c©u lÖnh chia rÊt tr¸nh trong c¸c vi xö lý dÊu phÈy cè ®Þnh. Sau khi t×m ®−îc ta tiÕn hµnh nèi c¸c gi¸ trÞ nµy sÏ ®−îc tõ m· 10 bÝt. Gi¶i m·: VÒ ph−¬ng thøc còng nh− c¸c khèi chøc n¨ng khèi gi¶i m·, gi¶ thuËt tÝnh to¸n gi¶i m· LD-CELP còng gÇn gièng víi c¸c modul m· ho¸ ®· nghiªn cøu. ThÝch øng läc th«ng K§ Bé läc th«ng Bé läc tæng hîp Khèi thÝch øng biªn ®é ph¶n håi Sæ m· VQ kÝch thÝch BiÕn ®æi vÒ PCM ban ®Çu Khèi thÝch øng biªn ®é ph¶n håi 29 31 32 34 28 30 33 35 hÖ sè bé läc bËc 10 vµ hÖ sè ph¶n x¹ ®Çu tiªn S¬ ®å chi tiÕt khèi gi¶i m· LD-CELP. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 89 Bao gåm sæ m· kÝch thÝch VQ, khèi ph©n kho¶ng biªn ®é, bé läc tæng hîp, khèi t−¬ng thÝch biªn ®é vÐc t¬ ph¶n håi, khèi t−¬ng thÝch bé läc tæng ph¶n håi gi«ng nh− phÝa m· ho¸ chØ cã bé läc th«ng vµ t−¬ng thÝch bé läc th«ng lµ kh¸c ®«i chót. ¾ Bé läc th«ng: Bao gåm ba phÇn : - Bé läc dµi h¹n(hay cßn gäi lµ bé läc cao ®é) cã hµm truyÒn: Hl(z)=gl(1+bZ -P) T−¬ng tù phÝa m· ho¸ c¸c hÖ sè trªn ®−îc cËp nhËt theo khung tÝn hiÖu bé 4 vect[ mét lÇn. - Bé läc ng¾n h¹n: Hµm truyÒn: )1( `1 1 )( 110 1 10 1 ` − = − = − + − − = ∑ ∑ z za zb zH i i i i i i μ Trong ®ã bi`=a`(0,65) i vµ a`i=a`(0,75) i μ=0,15k1 i=1,...,10 k1 lµ hÖ sè ph¶n x¹ ®Çu tiªn, c¸c hÖ s« a`, b` gi¶i m· ®−îc. ¾ Bé t−¬ng thÝch bé läc th«ng, môc ®Ých ®Ó tÝnh to¸n vµ cËp nhËt c¸c hÖ sè cña bé läc th«ng theo tõng khung tÝn hiÖu, nã bao gåm c¸c khèi: läc ®¶o LPC bËc 10, modul ph¸t hiÖn chu kú cao ®é, tÝnh to¸n kiÓm tra cao ®é pháng ®o¸n , bé tÝnh hÖ sè bé läc dµi h¹n, tÝnh hÖ sè bé lä ng¾n h¹n. ¾ Bé biÕn ®æi vÒ PCM ®Ó tÝn hiÖu gi¶i m· gièng víi tÝn hiÖu vµo th× ta ph¶i tÝn hµnh biÕn ®æi vÒ c¸c d¹ng PCM ®Þnh d¹ng ban ®Çu theo luËn nÐn d·n t−¬ng øng. NhËn xÐt chung: C¶ phÝa m· ho¸ vµ gi¶i m· ®Òu cã c¸c thñ tôc gièng nhau v× vËy ta cã thÓ x©y dùng c¸c modul thµnh c¸c ch−¬ng tr×nh con, vµ sö dông chung ®Ó gäi mçi TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 90 cÇn ®iÒu nµy ®Æc biÖt cã ý nghÜa khi dïng thuËt to¸n nµy ®Ó l−u tiÕng nãi d−íi d¹ng c¬ së d÷ liÖu th× thuËt to¸n thùc hiÖn cµng dÔ dµng vµ gän nhÑ h¬n. D. Ph−¬ng ph¸p CS-ACELP 1. Giíi thiÖu: CS-ACELP lµ ph−¬ng ph¸p m· hãa tèc ®é thÊp dùa trªn c«ng nghÖ CELP, ®· ®−îc ITU-T giíi thiÖu trong khuyÕn nghÞ G729, víi tèc ®é bit lµ 8kbps. TÝn hiÖu 8 Khz , tèc ®é 64 Kbps phÝa ®Çu vµo vµ ®−îc biÕn ®æi thµnh tÝn hiÖu PCM víi sè bÝt m· hãa lµ 16 bit. C¸c modul phÇn thu vµ phÇn ph¸t lµ c¬ b¶n gièng nhau nªn em chØ xin phÐp tr×nh bµy c¸c modul gi¶ thuËt chÝnh. 2. Tæng quan: M· ho¸ CS- ACELP dùa trªn ph−¬ng ph¸p m· ho¸ dù ®o¸n tuyÕn tÝnh kÝch thÝch, mçi khung tÝn hiÖu xö lý cã chiÒu dµi lµ 10ms, tøc lµ 80 mÉu øng víi tÝn hiÖu sè cã tÇn sè lÊy mÉu lµ 8 Khz. ë mçi khung nµy tÝn hiÖu sÏ ®−îc ph©n tÝch vµ tÝnh to¸n (c¸c th«ng sè vÒ bé läc, th«ng sè vÒ biªn ®é, ©m kªu kh«ng kªu... ) sau ®ã ®−îc m· ho¸ vµ truyÒn ®i. PhÝa thu c¸c th«ng sè trªn sau khi nhËn ®−îc thùc hiÖn c¸c chøc n¨ng biÕn ®æi ng−îc l¹i(kÝch thÝch c¸c bé läc tæng hîp thêi h¹n vµ mét sè c¸c biÕn ®æi kh¸c) sÏ nhËn ®−îc tÝn hiÖu analogue phÝa ra. Th«ng sè Tõ m· Khung con 1 Khung con 2 Toµn khung CÆp phæ ®−êng L0,L1,L2 ,L3 18 §é trÔ sæ m· ®éng P1 , P2 8 5 13 TrÔ cao ®é P0 1 1 ChØ sè sæ m· ®éng C1 ,C2 13 13 16 DÊu sæ m· ®éng S1 ,S1 4 8 Biªn ®é sæ m· b1 GA1 ,GA2 3 3 6 Biªn ®é sæ m· b1 Gb1 ,GB2 4 4 8 Tæng sè 80 Ph©n bè bÝt m· ho¸ trong CS - ACELP. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 91 Tõ b¶ng ta tÝnh ®−îc tèc ®é m· ho¸ nh− sau: C= 80/10.10-3=8.000 bps = 8 Kbps 3. Bé m· ho¸ TÝn hiÖu ®Çu vµo ®−îc ®−a qua bé läc th«ng cao vµ ®−îc chia thang t¹i bé tiÒn xö lý, TÝn hiÖu nµy sÏ ®−îc dïng cho c¸c qu¸ tr×nh gia c«ng ë c¸c b−íc tiÕp theo. Vai trß cña khèi nµy lµ t¹o ra tÝn hiÖu PCM cã sè bÝt m· ho¸ lµ 16 bÝt( t−¬ng øng víi 216 = 65536 møc ) nh− ®· nãi ë trªn, Khèi nµy thùc hiÖn hai chøc n¨ng : • §o tÝn hiÖu (®Ó chia thang). • Läc th«ng cao. Thùc hiÖn cña viÖc chia tÝn hiÖu lµ v× thuËt to¸n ®−îc thùc hiÖn víi dÊu phÈy tÜnh(thùc hiÖn b»ng vi xö lý hu¹c phÇn mÒm- xem phô lôc) cho nªn ®Ó tr¸nh viÖc trµn phÐp tÝnh ph¶i chia thµnh hai phÇn : phÇn d−¬ng vµ phÇn ©m. Bé läc th«ng cao thùc hiÖn vai trß läc bá c¸c thµnh phÇn tÇn sè thÊp kh«ng mong muèn, tÇn sè c¾t lµ 140hz , cã hµm truyÒn : Hh1(z) = 21 21 Z9114024,0Z9059465,11 Z4636378,0Z92724705,046363718,0 −− −− +− +− (pt.1) Ph©n tÝch LP (Linear Predictor- tiªn ®o¸n t−¬ng thÝch) ph©n tÝch tÝn hiÖu cã thêi gian 10 ms ®Ó t¹o ra c¸c hÖ sè cña bé läc LP, HÖ sè nµy biÕn ®æi thµnh nh÷ng cÆp phæ ®−êng (LSP) vµ ®−îc l−îng tö ho¸ sö dông bé l−îng tö vÐc t¬ pháng ®o¸n hai møc 18 bit. TÝn hiÖu kÝch thÝch ®−îc chän nhê ph−¬ng ph¸p mµ ta ®· bµn ®Õn ë ch−¬ng tr−íc ®ã lµ ph−¬ng ph¸p : Ph©n tÝch dùa trªn tæng hîp. Trong ®ã sai sè gi÷a tÝn hiÖu nguån vµ tÝn hiÖu kh«i phôc ®−îc tèi thiÓu ho¸. Theo ph−¬ng ph¸p ®o ®é mÐo träng sè c¶m nhËn. ViÖc nµy ®−îc thùc hiÖn bëi läc tÝn hiÖu sai sè dïng bé läc träng sè c¶m nhËn, víi c¸c hÖ sè cña bé läc lÊy tõ bé läc LP gi¶i l−îng tö hãa. (thµnh phÇn cña bé läc träng sè c¶m nhËn cã t¸c dông c¶i thiÖn nh÷ng tÝn hiÖu vµo cã ®¸p øng tÇn sè ph¼ng. C¸c th«ng sè kÝch thÝch (th«ng sè m· t−¬ng thÝch(hay cßn gäi lµ ®éng) &th«ng sè m· cè ®Þnh) ®−îc tÝnh tõ viÖc ph©n tÝch mÉu tÝn hiÖu cã chiÒu dµi TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 92 5ms (40 mÉu). HÖ sè läc LP ®−îc l−îng tö ho¸ vµ gi¶i l−îng tö hãa ®Ó sö dông cho khung con thø hai, trong khi c¸c hÖ sè bé läc cña khung con thø nhÊt ®−îc tÝnh b»ng phÐp néi suy . TrÔ cao ®é (picth delay) vßng më ®−îc −íc l−îng cø 10ms mét lÇn / 1 khung (cña tÝn hiÖu tiÕng nãi ®· ®−îc ®¸nh träng sè c¶m nhËn). C¸c tÝn hiÖu môc tiªu(target signal) x(n) ®−îc tÝnh bëi läc phÇn d− LP th«ng qua bé läc tæng hîp träng sè W(z)/A(z). Tr¹ng th¸i khëi t¹o cña bé läc ®−îc cËp nhËt bëi sai sè gi÷a tÝn hiÖu kÝch thÝch vµ tÝn hiÖu d−, tøc lµ thùc hiÖn phÐp trõ tÝn hiÖu ra cña bé läc tæng hîp khi tÝn hiÖu vµo lµ ZERO vµ tÝn hiÖu tiÕng nãi träng sè. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 93 + TiÒn xö lý Ph©n tÝch cao ®é Ph©n tÝch LP Sæ m· cè ®éng Bé läc tæng hîp Sæ m· cè ®Þnh Sæ m· cè ®éng Sæ m· cè ®Þnh T×m sæ m· cè ®Þnh Läc träng sè c¶m nhËn Läc thêi h¹n ng¾n Xö lý th«ng + + L−îng tö biªn ®é M· ho¸ c¸c th«ng sè TiÕng nãi vµo TiÕng nãi ra Chuçi bit truyÒn Th«ng sè vµo TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 94 §¸p øng xung h(n) cña bé läc tæng hîp träng sè ®−îc tÝnh to¸n vµ ph©n tÝch trong chu kú khÐp kÝn cao ®é, kÕt hîp sö dông x(n) ®Ó t×m c¸c th«ng sè biªn ®é vµ trÔ biªn ®é cña sæ m· thÝch øng. Trong thuËt to¸n nµy ng−êi ta ®· chän gi¸ trÞ trÔ cao ®é lµ 1/3, nã ®−îc m· hãa víi khung con ®Çu lµ 8 bit vµ khung con thø hai lµ 5 bit. X(n) ®−îc cËp nhËt theo tõng khung. Víi sæ m· cè ®Þnh (gäi lµ sæ m· GAUSS). 4. Sù trÔ cña c¸c phÐp tÝnh : Bé m· ho¸ lµm viÖc víi chiÒu dµI cña tÝn hiÖu lµ 10 ms, Thêi gian look- ahead lµ 5ms,phÇn trÔ bao gåm : • Thêi gian xö lý cÇn thiÕt cho c¸c to¸n h¹ng m· ho¸ vµ gi¶I m·, víi c¸c tèc ®é xö lý chËm th«ng th−êng phÐp nh©n cã thÓ mÊt tõ 2- 3 chu kú m¸y(cña bé ®Þnh thêi). • Thêi gian trÔ trªn ®−êng truyÒn . • TrÔ khi ghÐp kªnh khi tiÕn hµnh ghÐp kªnh gi÷a tho¹i vµ c¸c tÝn hiÖu kh¸c(trung kÕ hay c¸c trôc chÝnh). 5. C¸c hµm thùc hiÖn m· ho¸: a. Bé läc ph©n tÝch, tæng hîp thêi h¹n ng¾n dùa trªn bé läc dù ®o¸n tuyÕn tÝnh bËc 10 cã hµm truyÒn ®¹t: ∑= = −+ = 10 1 1 1 )( 1 i i i zZa zA (pt.2) Trong ®ã ai lµ c¸c hÖ sè dù ®o¸n tuyÕn tÝnh. Dù ®o¸n tuyÕn tÝnh ®−îc thùc hiÖn mçi khung tÝn hiÖu mét lÇn sö dông ph−¬ng ph¸p tù t−¬ng quan víi cöa sæ tÝn hiÖu dµI 30ms. Cø 80 mÉu(20ms) hÖ sè tù t−¬ng quan cña cöa sæ tÝn hiÖu ®−îc tÝnh vµ chuyÓn ®æi thµnh hÖ sè LP (linear Pridiction-dù ®o¸n tuyÕn tÝnh),b»ng gi¶I thuËt Levinson(hay cßn gäi lµ phÐp ®Ö quy), sau ®ã c¸c hÖ sè LP ®−îc truyÒn ®Õn LSP cung cÊp cho c¸c phÐp tÝnh néi suy vµ tù t−¬ng quan. Bé läc l−îng tö vµ gi¶I l−îng tö néi suy biÕn ®æi ng−îc trë l¹i ®Ó ®−îc c¸c hÖ sè LP(nh− phÇn tr−íc ®ã) ®Ó cÊu thµnh nªn bé läc träng sè vµ bé läc tæng hîp cho mçi khung con. b. TÝnh to¸n cöa sæ tÝn hiÖu vµ hµm tù t−¬ng quan: TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 95 Cöa sæ tÝn hiÖu bao gåm hai thµnh phÇn : cöa sæ Hamming vµ cöa sæ hµm COSIN: Wlp(n) = 0,54 – 0,36 cos 399 2 nΠ víi n=0,…,199 = cos ) 159 )200(2( −Π n víi n=200,…,239 (pt.3) Cã 5ms phÇn ®Çu trong ph©n tÝch LP, tøc lµ 40 mÉu cho khung tiÕp theo. Cöa sæ ph©n tÝch LP cung cÊp 120 mÉu tõ khung tiÕng nãi cuèi cïng, 80 mÉu tõ khung hiÖn t¹i, vµ 40 mÉu tõ khung tiÕp. Cöa sæ tiÕng nãi: S’(n)=Wlp(n)S(n) víi n=0,…239 (pt4) C«ng thøc tÝnh hÖ sè tù t−¬ng quan lµ: r(k) = ∑ = − 239 '' )()( kn knsns víi k=0,…10 (pt5) §Ó tr¸nh sö lý phøc t¹p øng víi c¸c tÝn hiÖu vµo ë møc thÊp, ta chän nh− sau: giíi h¹n d−íi r(0)=1,0 vµ ®é déng b¨ng tÇn lµ 60 Hz sö dông : Wlag(k) = exp(- 20 ) 2 ( 2 1 sf kfΠ ) (pt6) Trong ®ã f0 = 60hz , vµ fs = 8000hz (tÇn sè lÊy mÉu) . H¬n n÷a hÖ sè tù t−¬ng quan ®−îc nh©n víi hÖ sè tù t−¬ng quan nhiÔu tr¾ng 1,0001, øng víi møc nhiÔu nÒn lµ -40dB. Khi ®ã hÖ sè tù t−¬ng quan thay ®æi nh− sau: r’(0) = 1,001.r(0) r’(k) = Wlag(k).r(k) k= 1,…, 10 (pt7) c. ThuËt to¸n ®Ò quy Levinson-Purbin: HÖ sè tù t−¬ng quan thay ®æi r’ (k) th−êng dïng hÖ sè läc LP, ai (I=1,…10), ®−îc tÝnh theo ph−¬ng tr×nh sau: )(|)(| ' 10 1 ' krkira i i −=−∑ = k= 1,…10 (pt8) Ph−¬ng tr×nh nµy ®−îc tÝnh theo gi¶I thuËt Levinson-Purbin : b¾t ®Çu; g¸n E[0] = r’(0); TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 96 b¾t ®Çu tõ i=1 ®Õn i=10 a0 [i-1] =1 k=-[ )(' 1 0 ]1[ jira i j j i −∑− = − ]/E[i-1] ai [i] = ki tõ j=1 ®Õn i-1 aj [i] = aj [i-1] + k. ai-j [i-1] kÕt thóc vßng trong ; E[i] = (1- ki 2)E[i-1] kÕt thóc c¶ ch−¬ng tr×nh; TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 97 th«ng cao vµ chia thang A(z)->LSP cöa sæ tù t−¬ng quan t−¬ng thÝch c¶m nhËn cöa sæ tù t−¬ng quan cöa sæ tù t−¬ng quan cöa sæ tù t−¬ng quan TÝnh to¸n tiÕng nãi ®· ®−îc ®¸nh träng sè A(z) A`(z) L0, L1, L2,L3 t×m trÔ cao ®é vßng më t×m tÝn hiÖu ®Ých cao ®é tÝnh ®¸p øng xung t×m biªn ®é vµ trÔ cao ®é vßng ®ãng tÝnh phÇn ®ãng gãp cña chu kú cao ®ä A(z) A`(z) Po p1 P2 A(z) A`(z) + v(n) t×m vect¬ ®Ých t×m tõ m· Ck t×m φ lùa chän tr−íc mét biªn ®é xung tèi −u Läc tr−íc cao ®é Dù ®o¸n biªn ®é m· MA kÕt hîp cÊu tróc VQ tÝnh tõ m· P(z) TÝnh kÝch thÝch vµ cËp nhËt tr¹ng th¸i bé läc S1, C1 S2, C2 TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 99 d. BiÕn ®æi LP /LSP: C¸c hÖ sè ai ®−îc biÕn ®æi thµnh c¸c cÆp phæ ®−êng (LSP) ®Ó cung cÊp cho qu¸ tr×nh néi suy, vµ l−îng tö. Víi bé läc LP bËc 10, hÖ sè LSP ®−îc ®Þnh nghÜa lµ tæng vµ hiÖu cña nghiÖm ®a thøc: F’1(z) = A(z) + Z -11A(Z-1) F’2(z) = A(z) -Z -11A(Z-1) (pt10) §a thøc F1 ’(z ) lµ ®a thøc ®èi xøng, F’2(z) lµ ®a thøc kh«ng ®èi xøng, cã thÓ chøng minh tÊt c¶ c¸c nghiÖm cña ®a thøc nµy n»m trªn ®−êng trßn ®¬n vÞ (Z=1) . F’1(z) cã nghiÖm z=-1(khi ω=1). F’2(z) cã nghiÖm z=1 (khi ω=0). Hai nghiÖm nµy ®−îc lo¹i bá víi ®a thøc míi (®¹o hµm): F’1(z)= F ’ 1(z)/1+z -1 F’2(z)= F ’ 2(z)/1+z -1 (pt11) Víi vßng trßn ®¬n vÞ (e±ω) mçi ®a thøc trªn cã 5 nghiÖm Cã thÓ viÕt lµ : F1 = ∏ = − 9,..,3,1 21( i qiz -1 + z-2) F1 = ∏ − 10,..,4,21 21( i qiz -1 + z-2) (pt12) Trong ®ã qi = cos(ωi), ωi lµ tÇn sè phæ ®−êng LSF cã khoangr nh− sau: 0<ω1<ω2<... <ω10<∏. H»ng sè qi lµ hÖ sè LSP trong vïng cosin. C¶ hai ®a thøc trªn lµ ®èi xøng chØ víi 5 hÖ sè ®Çu tiªn, ®−îc tÝnh b»ng vßng lÆp : f1(i+1) = ai+1 +a10-i – f1(i) i = 0,...., 5 f2(i+1) = ai+1 +a10-i – f2(i) i = 0,...., 5 Gi¸ trÞ khëi ®Çu lµ f1(0)= f2(0)=1,0. HÖ sè LSP ®−îc t×m ra b»ng c¸ch −íc l−îng hai ®a thøc trªn t¹i 60 ®iÓm chia ®Òu trªn ®o¹n (0; ∏), sau ®ã tiÕn hµnh kiÓm tra dÊu (nÕu cã sù thay ®æi dÊu cã nghÜa lµ cã nghiÖm ). Dïng ®a TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 100 thøc ChebyShev ®Ó −íc l−îng, nghiÖm ®−îc t×m trùc tiÕp tõ trong mét vïng cosin, tøc lµ t¹i gi¸ trÞ z=ejω, khi ®ã ®a thøc ®−îc viÕt lµ: F(ω)= 2. e-jsωC(x) (pt13) C(x)= T5(x) + f(1)T4(x)+ f(2)T3(x) + f(3)T2(x) + f(4)T1(x) + f(5)/2 (pt14) Tm(x) = cos(mω) lµ ®a thøc ChebyShev thø m. C(x) ®−îc −íc lù¬ng víi gia trÞ chÝnh x¸c theo vßng lÆp : b5 = 1 ; b6= 0 for k = 4 downto 1 bk = 2xbk+1 -2xbk+2 + f(5-k) end; C(x)= xb1 – b2 +f(5)/2 ; e. HÖ sè l−îng tö ho¸ LSP, qi qi ®−îc l−îng tö ho¸ b»ng viÖc sö dông tÇn sè LSF, ωi trong vïng tÇn sè tiªu chuÈn [0; ∏] : ωi= arccos(qi) ,i=1,...,10 Dù ®o¸n dÞch chuyÓn trung b×nh (MA) thø 4 th−êng hay ®o¸n qi t¹i khung hiÖn t¹i , sö dông bé l−îng tö vecter hai b−íc . Gi¶i thÝch qu¸ tr×nh nµy nh− sau, ®Ó thuËn tiÖn miªu t¶ qu¸ tr×nh gi¶i m·, mçi hÖ sè bao gåm tæng hai sæ m· I`i = Li 1(L1) + Li 2(L2) khi i=1,...,5 I`i = Li 1(L1) + Li-5 3(L3) khi i=1,...,5 Li lµ c¸c chØ sè sæ m·. §Ó tr¸nh hiÖn t−îng céng h−ëng s¾c trong bé läc tæng hîp LP th× ii ®−îc ph©n kho¶ng t¹o ra c¸c sè nh− lµ hÖ sè ®iÒu chØnh cã kho¶ng c¸ch tèi thiÓu ho¸ ký hiÖu lµ J, theo thuËt to¸n : J= 0,0012 dem=1; nh·n : for i= 2 to 10 nÕu (I`i-1> I`i-J) th× thùc hiÖn: TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 101 I`i-1> (I`i- + I`i-1 - J )/ 2 I`2> (I`i- + I`i+1 - J )/ 2 kÕt thóc; dem=dem+1; nÕu dem>=2 kÕt thóc; nÕu kh«ng: J=0,0006 quay l¹i nh·n; Chó ý r»ng sau qu¸ tr×nh nµy ta tÝnh ®−îc ω`mi nh− sau: ω`mi = (1 -∑ = 4 1 ,` k kiP )I` m i +∑ = 4 1 ,` k kiP I` m-k i , víi i=1,...,10 (pt15 ) Trong ®ã P`lµ hÖ sè chuyÓn ®æi MAd cña bé ®o¸n. Sau khi tÝnh ®−îc ω`mi, bé läc t−¬ng øng ®−îc kiÓm tra theo c¸c b−íc : 1. T¨ng gi¸ trÞ cña ωi thø i 2. NÕu ω`i < 0,005 th× g¸n = 0,005 3. NÕu ωi+1-ωi = 0,0391 th× ωi+1=ωi + 0,0391 4. NÕu ω`i > 3,135 th× g¸n = 3,135 Thñ tôc m· ho¸ tham sè cã thÓ tãm t¾t nh− sau: øng víi mçi hai bé ®o¸n MA, sù xÊp xØ ®óng nhÊt cña hÖ sè LSP hiÖn t¹i ph¶i ®−îc t×m ra, th«ng sè nµy ®−îc ®Þnh nghÜa lµ gi¸ trÞ sai sè trung b×nh b×nh ph−¬ng ®−îc ®¸nh träng sè ®−îc tèi thiÓu ho¸ . Elsf = 210 1 `)(∑ − iii ωωω (pt16) Träng sè ωi ®−îc t¹o mét c¸ch t−¬ng øng mét hµm cña hÖ sè LSF gi¶i l−îng tö ho¸: ω1 = 10(ωi – 0,04∏ -1)2 nÕu ωi – 0,04∏ -1 >0 (pt 17) = 1,0 nÕu ωi+1- ωi-1-1>0 ω20 (pt18) = 10(ωi+1 – ωi-1 -1)2 +1 Gi¸ trÞ kh¸c TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 102 ω10 = 1,0 nÕu -ω9 – 0,92∏ -1>0 = 10(-ω9 – 0,92∏ -1)2 +1) , gi¸ trÞ kh¸c (pt 19) kÕt qu¶ cuèi cïng ω5 , ω6 ®−îc nh©n víi 1,2. VÐc t¬ l−îng tö ho¸ cho khung thø m ®−îc tÝnh theo ph−¬ng tr×nh: Li=[ωmi - ∑ = 4 1 ,` k kiP I` m-k i ] /[1-∑ = 4 1 ,` k kiP ] (pt20) Sæ m· L1 ®Çu tiªn ®−îc t×m ra b»ng ph−¬ng ph¸p sai sè b×nh ph−¬ng trung b×nh , ®iÒu nµy cho phÐp t¹o ra sæ m· thø hai L2 (coi lµ b−íc thø 2) , víi mçi gi¸ trÞ xem xÐt cã thÓ ®−îc gi¶i cÊu tróc theo ph−¬ng tr×nh (pt15), víi ®é ph©n gi¶i (khi tÝnh gÇn ®óng)lµ 0,0012 tèi thiÓu ho¸ theo (pt16) tÝnh ®−îc träng sè MSE,vect¬ L2 lµ kÕt qu¶ cña gi¸ trÞ øng víi sai sè thÊp nhÊt , còng víi ph©n kho¶ng nh− trªn tÝnh ®−îc L3(b−íc 3) , còng cã nghÜa lµ c¸c vect¬ I`i ®−îc ph©n thang víi ®é ph©n gi¶i lµ 0,0006. f. HÖ sè néi suy LSP Khung con ®Çu ®−îc tÝnh bëi néi suy tuyÕn tÝnh víi c¸c th«ng sè t−¬ng øng trong khung ®iÒu chØnh,sö dông cho khung con thø hai th× dïng hÖ sè l−îng tö LP (& gi¶i l−îng tö), gäi qi (tr−íc)cña khung hiÖn hµnh lµ hÖ sè LSP ®−îc tÝnh tõ 10ms cöa sæ tÝn hieu cña khung hiÖn hµnh vµ gäi qi(sau) cña khung hiÖn hµnh lµ hÖ sè LSP ®−îc tÝnh tõ 10ms cöa sæ tÝn hieu cña khung tr−íc ®ã, ta tÝnh ®−îc hÖ sè néi suy LSP cña hai khung con: Khung con1: qi 1=0,5qi(tr−íc) +0,5 qi(hiÖn t¹i) Khung con2: qi 2=qi(hiÖn t¹i) víi i =1,...10 g. ChuyÓn ®æi LSP thµnh LP. Tøc lµ ta ph¶i t×m c¸c hÖ sè ai tõ qi, c¸c b−íc tÝnh to¸n nh− sau: Ta cã : ai= 0,5 f1 ’(i) +0,5 f2 ’(i) khi i =1,...5; = 0,5 f1 ’(11-i) +0,5 f2 ’(11-i) khi i =6,...10; Trong ®ã : f1’(i)= f1(i)+ f1(i-1) víi i=1,....,5 TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 103 f2’(i)= f2(i)- f2(i-1) víi i=6,....,10 vµ gi¸ trÞ cña f1(i) tÝnh tõ thuËt to¸n: f(0)=1; f(-1)=0; tõ i=1 ®Õn 5 f1(i) = -2qi-1f1(i-1) +2f1(i-2) tõ j=i-1 xuèng 1 f1 i(j) = f1 i-1(j) - 2q2i-1 f1 i-1(j -1) + f1 i-1(j-2); kÕt thóc; KÕt thóc ; Gi¸ trÞ cña f2(i) còng tÝnh t−¬ng tù (b»ng c¸ch gäi ch−¬ng tr×nh con). J. Bé läc th«ng sè c¶m nhËn. Cã hµm truyÒn trong miÒn tÇn sè nh− sau: W(z) = ∑ ∑ = − = − + + = 10 1 2 10 1 1 21 1 1 1 )/( )/( i i i i i i i i za za zA zA γ γ γ γ (pt21) C¸c gi¸ trÞ γ1,γ2 QuyÕt ®Þnh t©n sè ®¸p øng cña bé läc. §iÒu chØnh thÝch hîp hai biÕn nµy, cã thÓ t¹o ®−îc sù ¶nh h−ëng “träng sè” lín. LËp hµm cñaγ1,γ2 theo d¹ng phæ tÝn hiÖu vµo t−¬ng øng 1laanf / 1khung (tøc lµ 10ms), cïng víi thùc hiÖn qóa tr×nh néi suy khung con ®Çu tiªn. D¹ng phæ ®−îc lÊy tõ bé läc tiªn ®o¸n tuyÕn tÝnh thø hai pheo ph−¬ng ph¸p lÆp Levinson-Durbin.HÖ sè ph¶n x¹ ki ®−îc tÝnh theo c«ng thøc biÕn ®æi ký hiÖu lµ Oi, ®−îc gäi lµ tØ sè loga diÖn tÝch(LAR), cã gi¸ trÞ nh− sau: Oi=log i i k k − + 0,1 0,1 , i= 1,2 (pt22) Th«ng sè nµy lÊy tõ khung con thø hai cña khung hiÖn t¹i , cßn khung thø nhÊt tÝnh tõ phÐp néi suy tuyÕn tÝnh: khung con 1 : Oi = 0,5Oi(tr−íc) + 0,5Oi(hiÖn t¹i) víi i=1,2 khung con 2 : Oi =Oi(hiÖn t¹i) TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 104 §−êng bao phæ ®−îc ®Æc tÝnh ho¸ theo th«ng sè flat,nÕu flat=1, cã phæ nghiªng , nÕu flat = 0 ta cã phæ dÑt. Víi mçi khung con ®Æc tÝnh nµy ®−îc tÝnh tõ sù cung cÊp mét hµm gäi lµ hµm ng−ìng tÝnh hÖ sè LAR. Tr¸nh sù thay ®æi qu¸ nhanh, mét gi¸ trÞ trÔ ®−îc sö dông bëi xem xÐt gi¸ trÞ cña flat trong khung con tr−íc ®ã, khung thø m-1 . flatm = 0 nÕu O1 m 0,65flat m-1 = 1 = 1 nÕu O1 m>- 1,52 vµ O2 <0,43flat m-1 = 0 (pt24) =flatm-1 c¸c tr−êng hîp kh¸c Thùc nghiÖm cã ®−îc nÕu flat=1 th× chänγ1=0,94 vµ γ2=0,6; nÕu flat=0 th× γ1= 0,98 ,γ2=®é lín céng h−ëng cña bé läc tæng hîp LP nh−ng ph¶i n»m trong ®o¹n 0,4- 0,7 theo c¸ch : γ2=-6,0dmim+1,0 , i= 1,...9 víi dmin= min(ωi+1 - ωi) Khi ®ã hiÖu tiÕng nãi träng sè trong khung con ®−îc tÝnh: sw(n)= s(n) + ∑ = − 10 1 1 )( i i i insa γ +∑ = − 10 1 2 )( i i i insa γ (pt25) i= 0,...39 h. Ph©n tÝch vßng më cao ®é. Nh− ®· nãi ë c¸c phÇn tr−íc tÝn hiÖu tiÕng nãi ®−îc xem xÐt bao gåm thµnh phÇn cao ®é øng víi ©m kªu, xem xÐt chu kú cao ®é lµ dùa vµo cöa sæ tÝn hiÖu ®Ó t×m ra c¸c th«ng sè cÇn thiÕt, chñ yÕu lµ ®é trÔ. §Ó gi¶m ®é phøc t¹p (do viÖc trÔ cña sæ m· thÝch øng c¸c c©u lÖnh sÏ phøc t¹p), th× kho¶ng xem xÐt ®−îc giíi h¹n xung quanh gi¸ trÞ tèi −u T0P. T0P ®−îc tÝnh T0P=t1 R(T0P) = R’(T0P) nÕu R’(t2)>= 0,85 R’(T0P) R’(T0P)= R’(t2) T0P= t2 TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 105 kÕt thóc nÕu R’(t3)>= 0,85 R’(T0P) R’(T0P)= R’(t3) T0P= t3 kÕt thóc C¸c ti ®−îc t×m nh− sau: Chia kho¶ng nghiªn cøu lµm ba vïng: V1 t−¬ng øng cã t1 , víi i ch¹y tõ 80 ®Õn 143; t−¬ng tù V2 ,i=40- 70 cã t2; V3 , i=20-39 cã t3 . Gi¸ trÞ ti ®−îc chän lµ gi¸ trÞ cùc ®¹i cña hµm: R(k) = ∑ = − 79 0 )()( n knswnsw k. TÝnh to¸n ®¸p øng xung. §¸p øng xung h(n) cña bé läc tæng hîp träng sè W(z)/A`(z) cÇn trong viÖc t×m sæ m· ®éng vµ sæ m· cè ®Þnh. h(n) ®−îc tÝnh cho mçi khung con bëi viÖc läc tÝn hiÖu nhê ba bé läc A(z/γ1) vµ 1/A`(z) vµ1/A(z/γ2). L.TÝnh to¸n tÝn hiÖu ®Ých(target signal) x(n). Thùc hiÖn trªn mçi khung con, cã gi¸ trÞ lµ hiÖu kÕt qu¶ cña bé läc tæng hîp träng sè W(z)/A`(z) khi ®Çu vµo lµ Rezo vµ sw(n). M. T×m sæ m· ®éng. Th«ng sè sæ m· ®éng L. T×m ®é cao vßng ®ãng. ∑ ∑ = == 39 0 39 0 )()( )()( )( n kk n k nyny nynx kR (pt37) Trong ®ã x(n ) lµ tÝn hiÖu ®Ých , y(n )lµ kÝch thÝch bé läc tr−íc ®ã t¹i thêi ®iÓm trÔ thø k, chó ý r»ng kho¶ng t×m kiÕm xung quanh gi¸ trÞ chän tr−íc lµ Top cho khung con ®Çu , khung con thø hai l¹i coi gi¸ trÞ t×m ®−îc T1 lµ gi¸ trÞ trung t©m ,TÝch chËp yk(n) tÝnh theo tmin , víi gi¸ trÞ nhËn trong kho¶ng k=tmin+1,....,tmax, yk(n) ®−îc cËp nhËt trong vßng lÆp TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 106 yk(n)= yk-1(n-1) +U(-k)h(-n) , víi n=0,....,39 (pt38) gi¸ trÞ U(n) (n=-139-39) lµ bé ®Õm kÝch thÝch , gi¸ trÞ khëi t¹o yk-1(-1)=0 cÇn chän U(n) sau cho trÔ cao ®é <40 §Ó tÝnh T2 cho khung con thø hai, thùc hiÖn b»ng ph−¬ng ph¸p néi suy theo t−¬ng quan chuÈn nh− (pt37) vµ tÝnh nã ë gi¸ trÞ max, néi suy ®−îc thùc hiÖn b»ng viÖc sö dông biÕn ®æi Furier nhanh hµm sinc, bé läc cã tÇn sè c¾t khuyÕn nghÞ lµ 3,6khz, gi¸ trÞ néi suy R(k) víi c¸c ph©n sè –2/3, -1/3, 0 , 1/3, 2/3, ®−îc tÝnh theo c«ng thøc néi suy Rt(k)=∑ = + 3 0 )3(i)b-R(k 12 i it +∑ = +−++ 3 0 )33(i)b1R(k 12 i it m. T¹o ra vÐc t¬ sæ m· ®éng. Khi trÔ cao ®é ®−îc tÝnh to¸n, th× vect¬ sæ m· ®éng ®−îc tÝnh theo ph−¬ng ph¸p néi suy tÝn hiÖu vµo u(n) nnh− sau: v(n)=∑ = +−− 9 0 30 )3()( n itbiknu +∑ = +−++− 9 0 30 )33()1( n itbiknu (pt40) b30 tÝnh dùa trªn cöa sæ Hamming hµm sinc giíi h¹n +39 huÆc –39. C¸c modul gi¶i m· còng gièng nh− modul phÇn m· ho¸ nªn kh«ng tr×nh bµy n÷a. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 107 Ch−¬ng V. Ph−¬ng ph¸p ®¸nh gi¸: Cã vÊn ®Ò ®Æt ra lµ lµm sao ®¸nh gi¸ ®−îc ph−¬ng ph¸p m· ho¸ nµo lµ tèt, tøc lµ ph¶i x¸c ®Þnh c¸ch ®¸nh gi¸ cho mçi ph−¬ng ph¸p m· ho¸ biÕt tr−íc. Nh×n chung c¸c tiªu chuÈn ®¸nh gi¸ cho ph−¬ng ph¸p m· ho¸ mét c¸ch cô thÓ hiÖn nay ch−a cã chuÈn, ITU-T chØ quy ®Þnh trong khuyÕn nghÞ P800 vÒ c¸ch thøc ®¸nh gi¸ chÊt l−îng nãi chung. Tuy nhiªn nÕu so s¸nh víi c¸c ph−¬ng ph¸p thùc nghiÖm trong phßng thÝ ngiÖm th× nã kh«ng kh¸c lµ bao. Trong ®iÒu kiÖn ViÖt Nam tiªu chuÈn cho ®¸nh gi¸ chÊt l−îng m· ho¸ tho¹i lµ ch−a cã trong c¸c tiªu chuÈn nghµnh, ta ®Òu chÊp nhËn c¸c s¶n phÈm ®−a ra cña c¸c h·ng chiÕm thÞ phÇn lín vÒ c¸c s¶m phÈm cung cÊp cho m¹ng viÔn th«ng ViÖt nam, thÓ hiÖn mÆt næi ë c¸c thiÕt bÞ ®Çu cuèi di ®éng, VoiceIP, dÞch vô viÔn th«ng qua vÖ tinh... ChÝnh v× c¸c ph©n tÝch trªn mµ ë ®©y chØ ®−a ra c¸ch chung thùc hiÖn viÖc ®¸nh gi¸ chÊt l−îng m· ho¸. Quy tr×nh ®¸nh gi¸ mét hÖ thèng cã thÓ m« t¶ theo gi¶i thuËt trang sau, Nh×n chung rÊt khã cã thÓ ®−a ra mét tiªu chuÈn ®¸nh gi¸ mét c¸ch chÝnh x·c chÊt l−îng cña tÝn hiÖu tiÕng nãi ®−îc m· ho¸ theo ph−¬ng thøc hay hÖ thèng nµo ®ã b»ng mét con sè cô thÓ, tøc lµ muèn nãi vÒ kh¶ n¨ng biÓu diÔn nã nh− mét ®¹i l−îng gièng nh− c¸c ®¹i l−îng nh− kg,m, pa...kh«ng nh÷ng thÕ do ®Æc tÝnh sinh häc cña thÝnh gi¸c kh¸c nhau cña con ng−êi, tøc lµ cïng mét c©u nãi nh−ng ta sÏ nhËn ®−îc sù ®¸nh gi¸ kh¸c nhau ë c¸c con ng−êi kh¸c nhau, c¸c giíi tÝnh ®é tuæi kh¸c nhau lµ kh¸c nhau, ngay c¶ khi cña chÝnh ®èi t−îng ®ã trong c¸c kho¶ng kh«ng gian vµ thêi gian kh¸c nhau lµ kh¸c nhau. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 108 HÖ thèng m· ho¸ KiÓm tra ®èi t−îng chØ sè ®Þnh l−îng Kiªm tra ®èi t−îng §¹t yªu cÇu §ñ tèt Nghe thùc tÕ So s¸nh víi hÖ thèng kh¸c S¬ ®å khèi quy tr×nh kiÓm tra chÊt l−îng m· ho¸. Kh«ng Kh«ng ®¹t ®¹t TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 109 Theo nh− quy tr×nh trªn th× qua tr×nh ®¸nh gi¸ ®−îc chia lµm hai b−íc: • §Çu tiªn lµ hÖ thèng cÇn ®−îc ®¸nh gi¸ ®−îc ®o b»ng c¸c th«ng sè ®Þnh tÝnh, b»ng ph−¬ng ph¸p ®o ®èi t−îng thÓ hiÖn cô thÓ ë c¸c chØ sè nh− SNR, kho¶ng phæ log, tØ lÖ gÇn ®óng IJAKURA. • NÕu kh«ng ®¹t ®−îc chØ tiªu ®Æt ra ë c¸ch trªn th× kh«ng hÖ thèng sÏ ph¶i ®−îc ®iÒu chØnh l¹i c¸c th«ng sè, thËm chÝ thay ®æi ph−¬ng ph¸p cho ®Õn khi ®¹t ®−îc yªu cÇu ®Æt ra, NÕu ®¹t ®−îc c¸c chØ tiªu ®Æt ra ë c¸ch trªn th× b−íc theo sÏ ®−îc thùc hiÖn, ®ã lµ qu¸ tr×nhkiÓm tra ®Þnh tÝnh sÏ ®−îc thùc hiÖn tiÕp theo, b»ng c¸c ph−¬ng ph¸p kiÓm tra c¸c hÖ sè DAM, MRT, MOS . I. KiÓm tra ®Þnh l−îng 1. TÝnh tØ sè tÝn hiÖu trªn nhiÔu(SNR): Gi¶ sö t¹i thêi ®iÓm xem xÐt ta cã tÝn hiÖu s(n) gäi lµ tiÕng nãi nguån t¹i thêi xem xÐt thø n, s`(n) lµ tÝn hiÖu xö lý b»ng ph−¬ng ph¸p m· ho¸ t−¬ng øng. Do ®ã ta cã tÝn hiÖu sai s«: e(n)=s(n)- s`(n) Víi N mÉu tÝn hiÖu, ®Ó tÝnh SNR ta tÝnh n¨ng l−îng cña tÝn hiÖu nguån vµ tÝn hiÖu sai sè: Es 2 = ∑ = N n ns N 1 2 )(1 - ( ∑ = N n ns N 1 2 )(1 ) 2 Ee 2 = ∑ = N n ne N 1 2 )(1 - ( ∑ = N n ne N 1 2 )(1 ) 2 Ta cã : SNR = E2s/E2e NÕu gi¸ trÞ ban ®Çu, vµ sai sè cã gi¸ trÞ trung b×nh lµ zero th× thµnh phÇn thø hai cña c«ng thøc trªn ®−îc bá qua. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 110 Th«ng th−êng SNR ®−îc chuyÓn sang ®¬n vÞ dB theo c«ng thøc: SNR(dB)=10log10(SNR) Mét trong nh÷ng ®Æc tÝnh cña tÝn hiÖu tiÕng nãi lµ thay ®æi mét c¸ch tù nhiªn theo thêi gian, ®iÒu nµy dÉn ®Õn cã ®o¹n n¨ng l−îng tÝn hiÖu tiÕng nãi cao, nh÷ng tr−êng hîp kh¸c l¹i thÊp. NÕu n¨ng l−îng sai sè lín h¬n hay nhá h¬n mét h»ng sè cho tr−íc(th−êng lµ tuú ph−¬ng ph¸p m· ho¸), kÕt qu¶ cña phÐp tÝnh SNR lµ kh«ng trung thùc bëi ¶nh h−ëng c¶m nhËn cña nhiÔu trung vïng thÊp lµ nghiªm träng h¬n vïng cao, ®Ó tÝnh ®Õn kh¶ n¨ng nµy ta dung tØ sè tÝn hiÖu trªn nhiÔu ®o¹n ký hiÖu lµ SNRSEG. Xem xÐt c¸c ®o¹n tÝn hiÖu th«ng th−êng cã chiÒu dµi (15-20) ms , ta cã SNRSEG= dB M m ∑ = M 1 SNR(m)1 TØ sè tÝn hiÖu trªn nhiÔu cña c¸c ph−¬ng ph¸p m· ho¸ tÝn hiÖu tiÕng nãi. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 111 Trong ®ã SNR(m) lµ tØ sè tÝn hiÖu trªn nhiÔu tÝnh theo c¸c c«ng thøc trªn víi m lµ thêi ®iÓm xem xÐt thø m trong ®o¹n M, ®é ph©n gi¶i cña ®o¹n M cang nhá th× sù ¶nh h−ëng cña c¸c gi¸ trÞ trªnh lÖch lµ kh«ng ®¸ng kÓ. Mét ®Æc ®iÓm kh¸c lµ trong c¸c kho¶ng yªn lÆng SNR(dB) cã thÓ cã gi¸ trÞ ©m rÊt nhá, sù nh¹y c¶m cña tÝn hiÖu nµy cã thÓ thùc hiÖn theo hai c¸ch: o Ph¸t hiÖn ®o¹n yªn lÆng khi tÝnh SNR(dB). o §Æt ng−ìng thÊp T nÕu SNR(dB) r¬i xuèng mét gi¸ trÞ thÊp h¬n ng−ìng th× ®Æt b»ng gi¸ trÞ thÝch hîp nµo ®ã. 2 ChØ sè ®é râ AI (articulation index): Do ®Æc tÝnh cña tÝn hiÖu tiÕng nãi cã thÓ ®¹i diÖn bëi c¸c th«ng sè tÇn sè khi tÝnh SNR, th«ng sè nµy quyÕt ®Þnh chØ sè râ AI khi sö dông tÝn hiÖu xem xÐt lµ analogue . TiÕn hµnh chia tÝn hiÖu sau khi qua bé läc th«ng b¨ng thµnh 20 ®o¹n nhá theo b¶ng sau: Sè b¨ng nhá Giíi h¹n tÇn s«(hz) 1 200-330 2 330-430 3 430-560 4 560-700 5 700-840 6 840-1000 7 1000-1150 8 1150-1310 9 1310-1480 10 1480-1660 11 1660-1830 12 1830-2020 13 2020-2240 TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 112 14 2240-2500 15 2500-2820 16 2820-3200 17 3200-3650 18 3650-4250 19 4250-5050 20 5050-6100 Ta tÝnh AI theo c«ng thøc: AI = ∑ = 20 1 30 )30),)((min( 20 1 m dBmSNR 3. Kho¶ng phæ Log. Khi m· ho¸ tÝn hiÖu tiÕng nãi, trªn c¬ së c¸ bé VOCODER, biªn ®é cña phæ th−êng ®−îc sö dông tr−íc so víi tÝn hiÖu ph¸t ra ®Õn tai ng−êi, lý do tai ng−êi cã qu¸n tÝnh, do vËy kÕt qu¶ tÝn hiÖu tæng hîp cã thÓ kh¸c so víi tÝn hiÖu nguån, nh−ng ©m thanh nghe ®−îc vÉn gièng nhau, râ rµng SNR kh«ng lín h¬n gÝa trÞ trung b×nh cña tÝn hiÖu ©m thanh khi ghi ©m vµ ph¸t l¹i, ®Ó thay thÕ cho sù biÓu diÔn nµy ta dïng th«ng sè Log- phæ(cßn gäi lµ ph−¬ng ph¸p Itakara). Kho¶ng c¸ch biÓu diÔn sù kh¸c nhau gi÷a tÝn hiÖu nguån vµ tÝn hiÖu tæng hîp huÆc gi÷a hai tÝn hiÖu tæng hîp, gi¸ trÞ kho¶ng c¸ch bé VOCODER th−êng ®−îc dïng nhÊt trong ph−¬ng ph¸p LPC(m· ho¸ dù ®o¸n tuyÕn tÝnh), biªn phæ thÓ hiÖn thµnh phÇn ph¸t ©m: H(ej ω ) = )( ωjeA G Trong ®ã A(z)= 1+a1 z -1 + .....+ an z -n n tuú theo ph−¬ng ph¸p m· ho¸ :10, 12, 15... KÝch th−íc phæ Log gi÷a H1(e j ω) vµ H2(ej ω) ®−îc tÝnh nh− sau: d=[ Π−∫ Π Π− 2 ||)(|ln||)(|ln| 222 2 1 ωωω deHeH jj ]1/2 TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 113 Trong ®ã c¸c hÖ sè ai lµ c¸c hÖ sè pháng ®o¸n theo ph−¬ng ph¸p ®· tr×nh bµy , sau ®ã ta cã hÖ s« ceptral, ci ®−îc tÝnh nh− sau: c1= - a1 ci = - ai + kki i k ac i ki − − = ∑ −1 1 i= 2,....,p ci= kki p k ac i ki − = ∑ − 1 i= p+1,...N Cßn c0 n¨ng l−îng cña tÝn hiÖu, do mèi t−¬ng quan kh«ng trÔ t¹o ra(tøc lµ chÝnh t¹i thêi ®iÓm ®ã). Khi ®ã kho¶ng c¸ch Log - phæ dLS ®−îc tÝnh: dLS = [(c0-c`0) + 2 2 1 )`(∑ = − N k kk cc ] 1/2 ci vµ c`i lµ hÖ sè ceptral cña H1 vµ H2. Trong ph−¬ng ph¸p ®o ®Þnh l−îng nµy cßn dïng c¸c chØ sè nh−: TØ lÖ gÇn ®óng IJAKURA, kho¶ng c¸ch Euclidean. II. Ph−¬ng ph¸p ®¸nh gi¸ ®Þnh tÝnh : Nh− ®· tr×nh bµy trªn sau khi c¬ b¶n tho¶ m·n ®−îc nh÷ng yªu cÇu cña b−íc trªn ta tiÕn hµnh b−íc tiÕp theo lµ kiÓm tra ®Þnh tÝnh, ph−¬ng ph¸p nµy chÝnh lµ dùa trªn c¸c øng dông thùc tÕ,tøc lµ sÏ ®em ra thö nghiÖm. Víi qu¸ tr×nh nµy l¹i chia thµnh hai giai ®o¹n : kiÓm tra ®é dÔ hiÓu vµ kiÓm tra chÊt l−îng. 1. KiÓm tra ®é dÔ hiÓu : KiÓm tra ®é dÔ hiÓu dùa trªn kh¶ n¨ng ng−êi nghe cã thÓ ph©n biÖt ®−îc c¸c phonemes víi c¸c ®Æc tÝnh th«ng th−êng, sö dông mét b¶ng c¸c cÆp tõ víi tÝnh chÊt lµ cã 1 phonemes vµ 1 phô ©m, kiÓm tra b»ng c¸ch ng−êi nghe ®−îc nghe mét tõ vµ ®−îc hái xem tõ ®ã lµ tõ nµo trong cÆp tõ. Ph−¬ng ph¸p kiÓm tra chuÈn ®o¸n cã vÇn DRTC (Diagrostic Rhyme Test). veal-feel bean-peen zoo-sue dune-tune meat-beat need-deed moot-boot news-dues vee-beat sheet-cheat foo-pooh shoes-shoose TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 114 vee-bee cheep-keep juice-goose chew-choo zee-thee peak-teak moon-noon pool-tool weed-reed tey-tea coop-poop you-rue yield-weild dint-tint vole-foal goat-coat gin-chin nip-dip moan-mone note-dote mitt-bit thick-tick those-doze though-dough vill-bill sing-thing joe-go sole-thole jilt-gilt fin-thin bowl-dole fore-thor bid-did gill-dill ghost-boast show-so hit-fit dense-tense vault-fault daunt-taunt zed-said neck-deck moss-boss gnaw-daw mead-bead fence-pence thong-tong shaw-chaw then-den chair-care jaws-gauze saw-thaw jest-guest pent-tent fought-thought bong-dong met-peg hen-wren browl-wall caught-taught vast-fast gaff-calf jock-chock bond-pond mad-bad nab-dab mom-bomb knock-dock than-dan shad-chad von-bon vox-box jab-gab sank-thank jot-got chop-cop bank-dank fad-thad wad-rod pot-tot gat-bat shag-sag hop-fop got-dot Ph−¬ng ph¸p nµy cã 6 ®Æc tÝnh cña tÝn hiÖu tiÕng nãi cÇn ®−îc kiÓm tra : giäng, ©m mòi, sustention, ©m giã, graveness, c« ®äng. TiÕn hµnh lËp b¶ng b»ng c¸ch ®¸nh dÊu víi ý nghÜa: + cã nghÜa lµ tõ ®· nhËn d¹ng ®−îc. tõ biÕn mÊt. thÓ hiÖn tõ trung lËp. PhÇn tr¨m ®¸nh gi¸ tÝnh: P = T W-R % R : sè c©u tr¶ lêi ®óng. W: sè c©u tr¶ lêi sai. T : Tæng sè tõ kiÓm tra. Gi¸ trÞ th«ng th−êng lµ( 75-95) % HÖ thèng tèt lµ 90%. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 115 Sè ng−êi ®−îc kiÓm tra th−êng lµ 6 , 3 nam vµ 3 n÷ (®Ó ®¶m b¶o tÝnh kh¸ch quan do cÊu t¹o c¬ quan ph¸t ©m cña nam vµ n÷ kh¸c nhau). Ta thÊy c¸c cÆp vÇn kiÓm tra trªn kh«ng mang tÝnh quy ®Þnh bëi vËy hoµn toµn cã thÓ x©y dùng mÉu cho tiÕng viÖt nh− cÆp vÇn : co-cã; mang- m¹ng; sung – sóng... Ph−¬ng ph¸p kiÓm tra thay ®æi ©m vÇn MRT(Modified Rhyme Test). Dùa trªn triÕt lý kiÓm tra sù kh¸c gi÷a hai céng h−ëng (formant), ph−¬ng ph¸p nµy, ng−êi nghe ®−îc yªu cÇu chän tõ ®−îc nghe trong s¸u tõ, b¶ng d−íi chØ ra bé tõ kiÓm tra: 1 2 3 4 5 6 PhÇn I ©m b¾t ®Çu lµ sù céng h−ëng 1 bat bad back bass ban bath 2 tab tan tam tang tack tap 3 pun puff pup puck pus pub 4 teach tear tease teal team teak 5 hear heath heal heave heat heap 6 cut cub cuff cup cud cuss 7 fill fic fin fizz fib fit 8 bun bus but buff buck bug 9 rave rake race rate raze ray 10 peage peas peak peal peat peach 11 dig dip did dim dill din 12 sing sit sin sip sick sill 13 map mat math man mass map 14 kick king kid kit kin kill 15 sad sass sag sack sap sat 16 sud sum sub sun sup sung 17 came cape cane cake cave case 18 sake sale save sane safe same 19 pass pat pack pad path pan 20 seep seen seetthe seed seem seek 21 late lake lay lace lane lame 22 pill pick pip pig pin pit 23 duck dud dung dub dug dun TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 116 24 page pane pace pay pale pave 25 bean beach beat beam bead beak PhÇn II ©m kÕt thóc lµ sù céng h−ëng 26 led shed red bed fed wed 27 raw paw law jaw thaw saw 28 sip rip tip dip hip lip 29 way may say gay day pay 30 will hill kill till fill bill 31 book took shook cook hook look 32 peel reel feel heel keel eel 33 dig wig big rig pig fig 34 top hop pog cop mop shop 35 rang fang gang bang sang hang 36 hark dark mark lark park bark 37 nest vest west test best rest 38 ten pen den hen then men 39 foil coil boil oil toil soil 40 kit jit fit rit git hit 41 bust bust rust hust pust dust 42 Kick lick sick pick wick tick 43 meat feat heat seat beat neat 44 Sun nun gun fun bun run 45 Hot got not pot lot tot 46 fame same game name tame game 47 Tent bent went dent rent sent 48 Gale male tale bale sale pale 49 Pin sin tin win din fin 50 Sold told hold fold gold cold 2. KiÓm tra chÊt l−îng: Tu©n theo khuyÕn nghÞ P800 cña ITU-T, c¸c ph−¬ng ph¸p chÝnh nh− sau: Sau khi liÖt kª c¸c tham sè t¸c ®éng ®Õn chÊt l−îng cña m∙ ho¸ vµ nh÷ng nguyªn t¾c phÇn nµy ph©n tÝch kh¶ n¨ng ®o vµ so s¸nh chÊt l−îng tho¹i m∙ ho¸, cã thÓ ®o chÊt l−îng nhê sö dông c¸c kü thuËt ®o kh¸c nhau. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 117 Ph−¬ng ph¸p ®iÓm ®¸nh gi¸ trung b×nh MOS (MOS-Mean Opinion Score). §−îc m« t¶ trong KhuyÕn nghÞ P.800 cña ITU-T, MOS lµ mét phÐp ®o chÊt l−îng tho¹i rÊt næi tiÕng. §©y lµ mét ph−¬ng ph¸p ®o chÊt l−îng mang tÝch chÊt chñ quan. Cã hai ph−¬ng ph¸p tr¾c nghiÖm: ®¸nh gi¸ ®µm tho¹i vµ ®¸nh gi¸®é nghe. Tr¾c nghiÖm nµy xÐt ®o¸n chÊt l−îng cña hÖ thèng truyÒn dÉn tho¹i hoÆc b»ng viÖc tiÕn hµnh mét cuéc ®µm tho¹i hoÆc b»ng viÖc nghe c¸c mÉu tiÕng nãi. Sau ®ã ng−êi ta s¾p xÕp chÊt l−îng theo cÊp ®é sau ®©y: Thang chÊt l−îng §iÓm Thang cè g¾ng nghe RÊt tèt 5 Kh«ng cÇn cè g¾ng nghe Tèt 4 Kh«ng cÇn cè g¾ng nghe ®¸ng kÓ T¹m ®−îc 3 Ph¶i cè g¾ng võa ph¶i Tåi 2 Ph¶i cè g¾ng nghe ®¸ng kÓ XÊu 1 Kh«ng hiÓu nghÜa khi cè g¾ng hîp lý Sau ®ã, MOS ®−îc tÝnh to¸n b»ng viÖc lÊy trung b×nh c¸c ®iÓm cña c¸c ®èi t−îng tr¾c nghiÖm. Sö dông cÊp ®é nµy, mét ®iÓm ®¸nh gi¸ trung b×nh lµ 4 hoÆc h¬n sÏ ®−îc coinh− chÊt l−îng ®−êng dµi. Lóc ®Çu MOS ®−îc thiÕt kÕ ®Ó ®¸nh gi¸ chÊt l−îng c¸c tiªu chuÈn m· hãa kh¸c nhau. D−íi ®©y lµ tãm l−îc cña MOS cho c¸c thuËt to¸n m· hãa kh¸c nhau : Tiªu chuÈn m· hãa MOS PCM 4,3 (64kbit/s) ADPCM 4,1 (32kbit/s) QCELP13 4,2 (14,4kbit/s) CELP 3,7(8kbps) GSM 3,54(13kbps) QCELP 3,54(9,6kbps) CELP 3(4,8kbps) LPC 2,5(2,4kbps) TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 118 MOS lµ tr¾c nghiÖm thÝch hîp nhÊt, bëi v× sö dông m¹ng tho¹i lµ con ng−êi vµ tÝnh ®iÓm ®¸nh gi¸ còng lµ con ng−êi. Tuy nhiªn sù tr¾c nghiÖm chñ quan kÐo theo c¸c chñ thÓ lµ con ng−êi cã thÓ rÊt mÊt thêi gian. Do vËy, ng−êi ta chó ý nhiÒu ®Õn viÖc ®i t×m c¸c phÐp ®o thö kh¸ch quan cã thÓ ®−îc sö dông ®Ó ®¸nh gi¸ gÇn ®óng víi c¶m nhËn cña con ng−êi vÒ chÊt l−îng tho¹i. • §o chÊt l−îng tiÕng nãi theo c¶m nhËn (PSQM) §−îc m« t¶ trong P.861 cña ITU-T, PSQM (h×nh 6) sö dông mét m« h×nh ©m thanh t©m lý häc (Psychoacoustic) ®Ó tÝnh to¸n theo to¸n häc nh÷ng sù kh¸c nhau gi÷a c¸c tÝn hiÖu vµo vµ tÝn hiÖu ra. Sö dông ph−¬ng ph¸p nµy, nÕu c¸c tÝn hiÖu ®Çu vµo vµ ®Çu ra gièng nhau, ®iÓm sè PSQM sÏ b»ng kh«ng. Sù kh¸c nhau cµng lín th× ®iÓm sè cµng cao, tíi møc tèi ®a sÏlµ 6,5. Tuy nhiªn, kh«ng gièng nh− c¸c sè ®o truyÒn thèng kh¸c, ch¼ng h¹n nh− tû so átÝn hiÖu trªn t¹p ©m (SNR), tÇm quan träng cña PSQM lµ ë chç nh÷ng sù kh¸c nhau sÏ t¸c ®éng tíi c¶m nhËn cña con ng−êi vÒ chÊt l−îng tiÕng nãi. Mét trong nh÷ng sù chØ trÝch ®èi víi PSQM lµ ë chç lóc ban ®Çu nã ®· ®−îc thiÕt kÕ ®Ó ®o chÊt l−îng cña c¸c tiªu chuÈn m· hãa. Do vËy, nã kh«ng tÝnh ®Õn mét c¸ch ®Çy ®ñ sù t¸c ®éng cña nh÷ng sù cè truyÒn dÉn kh¸c nhau. PSQM+ ®· ®−îc ®Ò xuÊt vµo th¸ng 12 n¨m 1997 vµ cã tÝnh ®Õn: - Nh÷ng c¶m nhËn kh¸c nhau do mÐo ©m l−îng. - TiÕng nãi cã c¸c ®o¹n bÞ mÊt. Víi PSQM+, mèi t−¬ng quan gi÷a ®iÓm ®¸nh gi¸ kh¸ch quan vµ MOS ®−îc c¶i thiÖn. • C¸c ph−¬ng ph¸p kh¸c Cã nhiÒu phÐp ®o kh¸ch quan kh¸c hoÆc míi ®−îc ®Ò xuÊt hoÆc ®· ®−îc sö dông, bao gåm: - C¸c khèi tiªu chuÈn hãa phÐp ®o (MNB-Measuring Normalizing Blocks) ®−îc m« t¶ trong phô lôc II cña P.861. - HÖ thèng ®o ph©n tÝch cã thÓ c¶m nhËn ®−îc (PAMS-Perceptual Analysis TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 119 Measurement System) mét hÖ thèng ®éc quyÒn ®−îc ph¸t triÓn ë viÔn th«ng Anh. - §¸nh gi¸ c¶m nhËn chÊt l−îng tho¹i (PESQ-Perceptual Evalution of Speech Quality) - Mét tiªu chuÈn míi ®−îc ®Ò xuÊt vµ ®ang ®−îc ITU-T xem xÐt. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 120 KÕt luËn Víi sù ph¸t triÓn m¹nh cña c«ng nghÖ chÕ t¹o phÇn cøng xö lý tÝn hiÖu sè nãi chung vµ xö lý tÝn hiÖu tiÕng nãi nãi riªng còng ®¹t ®−îc rÊt nhiÒu thµnh tùu, gióp cho thùc hiÖn ®−îc c¸c thuËt to¸n tinh vi phøc t¹p. KÕt qu¶ nµy kh«ng nh÷ng thùc hiÖn ®−îc cho c¸c thiÕt bÞ ®Çu cuèi phøc t¹p mµ cßn gãp phÇn quyÕt ®Þnh cho c¸c lý thuyÕt viÔn th«ng ®i vµo thùc tÕ ch¼ng h¹n nh− c¸c c«ng nghÖ ®iÖn tho¹i thÕ hÖ thø ba (3G), ®iÖn tho¹i IP ®a dÞch vô qua vÖ tinh... GÇn ®©y ng−êi ta cßn chó ý nhiÒu ®Õn viÖc ¸p dông kü thuËt ph©n tÝch Walets vµo lÜnh vùc xö lý tÝn hiÖu sè trong ®ã cã tÝn hiÖu tho¹i (c¸c ph−¬ng thøc ®· tr×nh bµy chØ lµ ¸p dông c¸c biÕn ®æi Furier truyÒn thèng), ®· cã rÊt nhiÒu c¸c ch−¬ng tr×nh nghiªn cøu cña c¸c quèc gia vµ c¸c h·ng lín, trong t−¬ng lai kh«ng xa c¸c kü thuËt xö lý dùa trªn c«ng nghÖ nµy ch¾c ch¾n sÏ ®−îc giíi thiÖu. ë ViÖt nam lÜnh vùc xö lý tÝn hiÖu tiÕng nãi gÇn ®©y míi ®−îc chó ý, th¸ng 7-2001 phÇn mÒm nhËn d¹ng tiÕng viÖt ®−îc giíi thiÖu bëi viÖn c«ng nghÖ th«ng tin, vµ c¸c ph−¬ng thøc ph©n tÝch tæng hîp tiÕng nãi b»ng formant còng ®· ®−îc giíi thiÖu bëi t¸c gi¶ Lª Hång Minh (t¹p chÝ b−u chÝnh viÔn th«ng th¸ng 3-2002). Tuy chóng kh«ng ph¶i lµ c¸c s¶n phÈm m· ho¸ tèc ®é thÊp nh−ng nã còng lµ kÕt qu¶ cña sù ph©n tÝch nghiªn cøu b¶n chÊt ng«n ng÷ tiÕng ViÖt. V× vËy c«ng t¸c nghiªn cøu tiÕng viÖt cÇn ®−îc triÓn khai víi c¸c vÊn ®Ò nh− x©y dùng ®Æc tÝnh thèng kª cho tiÕng viÖt, x©y dùng sæ m· chuÈn cho tiÕng viÖt vµ tiÕp ®ã lµ s¶n xuÊt c¸c s¶n phÈm m· ho¸ tèc ®é thÊp cho ViÖt nam. Ta cã thÓ tù tin mµ nghÜ r»ng c¸c s¶n phÈm m· ho¸ tèc ®é thÊp cho ViÖt nam sÏ ®−îc ra ®êi trong thêi gian kh«ng xa. TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 121 Môc lôc Lêi nãi ®Çu ............................................................................................................. 1 Ch−¬ng I . TÝn hiÖu tiÕng nãi ................................................................................. 6 1. Qu¸ tr×nh ph¸t ©m cña con ng−êi: .................................................................. 6 2. §Æc tÝnh thèng kª cña tÝn hiÖu tiÕng nãi: ....................................................... 9 2.1, Hµm ph©n bè mËt ®é x¸c suÊt(pdf). ...................................................... 10 2.2, Hµm tù t−¬ng quan(ACF)...................................................................... 10 2.3, Hµm mËt ®é phæ c«ng suÊt PSD............................................................ 11 3. C¸c m« h×nh biÓu diÔn.................................................................................. 13 a. C¬ quan ph¸t ©m (vocal tract)................................................................... 13 b. M« h×nh sù kÝch thÝch............................................................................... 14 Ch−¬ng II . M· ho¸ vïng thêi gian. ..................................................................... 18 1. C«ng nghÖ PCM: .......................................................................................... 18 1.1 CÊu h×nh c¬ b¶n cña kiÓu truyÒn tin PCM: ............................................ 18 1.2 LÊy mÉu:................................................................................................. 19 1.3 L−îng tö ho¸: ......................................................................................... 21 1.4 Sù nÐn vµ gi·n: ....................................................................................... 22 1.5 M· ho¸ vµ Gi¶i m·: ................................................................................ 25 2.C¸c ph−¬ng ph¸p m· ho¸ kh¸c:..................................................................... 27 2.1 ph−¬ng ph¸p m· ho¸ DPCM ( §iÒu xung m· vi sai): ............................ 27 2.2 Ph−¬ng ph¸p DM ( ®iÒu chÕ delta): ....................................................... 29 2.3. §iÒu chÕ Deta tù thÝch nghi (ADM):..................................................... 31 3 Ph−¬ng ph¸p m· ho¸ ADPCM (§iÒu chÕ xung m· vi sai thÝch øng) (DAPTIVE DIFFERENTIAL PULSE CODE MODULATION ): ............... 32 3.1. Tæng quan:............................................................................................. 32 3.1.1. M· ho¸ ADPCM(ADPCM encoder):............................................. 34 3.1.2 Gi¶i m· ADPCM (ADPCM decoder):............................................. 34 TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 122 3.2. Nguyªn lý m· hãa ADPCM( ADPCM encoder principles): ................. 35 3.2.1. BiÕn ®æi ®Þnh d¹ng ®Çu vµo(Input PCM format conversion): ....... 35 3.2.2. TÝnh to¸n tÝn hiÖu vi sai (Difference signal computation): ............ 35 3.2.3. Bé l−îng tö t−¬ng thÝch (Adaptive quantizer): .............................. 35 3.2.3.1. Tèc ®é 40 kbps(Operation at 40 kbit/s): ................................. 35 3.2.3.2. Tèc ®é 32 kbps(Operation at 32 kbit/s): ................................. 36 3.2.3.3. Tèc ®é 24kbps(Operation at 24 kbit/s): .................................. 37 3.2.3.4. Tèc ®é 16 kbps(Operation at 16 kbit/s): ................................. 38 3.2.4. Bé l−îng tö ho¸ t−¬ng thÝch ng−îc( Inverse adaptive quantizer): 38 3.2.5. T−¬ng thÝch hÖ sè ph©n thang bé l−îng tö (Quantizer scale factor adaptation): ................................................................................... 39 3.2.6. §iÒu khiÓn t−¬ng thÝch tiÕng nãi(Adaptation speed control): ....... 40 3.2.7. Bé tinh to¸n tÝn hiÖu håi phôc vµ bé pháng ®o¸n t−¬ng thÝch (Adaptive predictor and reconstructed signal calculator): ..................... 42 3.2.8 Bé ph¸t hiÖn truyÒn vµ tone (Tone and transition detector): .......... 43 3.3. Nguyªn lý gi¶i m· ADPCM(ADPCM decoder principles):.................. 43 3.3.1. Bé l−îng tö thÝch øng ®¶o (Inverse adaptive quantizer): .............. 43 3.3.2.Bé l−îng tö t−¬ng thÝch hÖ sè thang (Quantizer scale factor adaptation):............................................................................................... 44 3.3.3. §iÒu khiÓn tèc ®é thÝch øng ( Adaptation speed control): ............. 44 3.3.4. Bé tÝnh tÝn hiÖu håi phôc vµ bé tiÕn ®o¸n t−¬ng thÝch (Adaptive predictor and reconstructed signal calculator): ........................................ 44 3.3.5. Ph¸t hiÖn truyÒn vµ tone (Tone and transition detector): ............... 45 3.3.6. BiÕn ®æi ®Þnh d¹ng ®Çu ra PCM (Output PCM format conversion): .............................................................................................. 45 3.3.7. §iÒu chØnh m· ho¸ ®ång bé (Synchronous coding adjustment): ... 45 Ch−¬ng III . M· ho¸ vïng tÇn sè.......................................................................... 46 1. M· ho¸ d¶i nhá(Sbc). ................................................................................... 47 2. M· ho¸ biÕn ®æi thÝch nghi (ATC). .............................................................. 53 ch−¬ng IV. Ph−¬ng ph¸p m· ho¸ tham sè nguån (resourd parameters method) .55 TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸ Tr−êng §HGTVT - Hµ Néi 123 1. Bé m· ho¸ nguån theo kªnh: ........................................................................ 57 2. Bé m· nguån tiÕng nãi formant.................................................................... 57 3. Bé m· nguån tiÕng nãi phæ t¸ch.................................................................. 58 4 Ph−¬ng ph¸p dù ®o¸n tuyÕn tÝnh LPC........................................................... 58 5. Bé m· ho¸ nguån tiÕng nãi ©m thanh ®−îc kÝch thÝch................................. 64 • M· ho¸ CELP ....................................................................................... 65 A. RPE- LPT (Bé lËp m· vµ gi¶i m· tiªn ®o¸n thêi h¹n dµi kÝch thÝch xung ®Òu ®Æn). .............................................................................................. 68 B. V-CELP (m· ho¸ tiªn ®o¸n kÝch thÝch xung tæng hîp): .......................... 70 C. Ph−¬ng ph¸p LD-CELP(m· ho¸ tiªn ®o¸n kÝch thÝch xung cã ®é trÔ nhá)............................................................................................................... 73 D. Ph−¬ng ph¸p CS-ACELP......................................................................... 90 Ch−¬ng V. Ph−¬ng ph¸p ®¸nh gi¸:..................................................................... 107 I. KiÓm tra ®Þnh l−îng .................................................................................... 109 1. TÝnh tØ sè tÝn hiÖu trªn nhiÔu(SNR):....................................................... 109 2 ChØ sè ®é râ AI (articulation index): ....................................................... 111 3. Kho¶ng phæ Log..................................................................................... 112 II. Ph−¬ng ph¸p ®¸nh gi¸ ®Þnh tÝnh : .............................................................. 113 1. KiÓm tra ®é dÔ hiÓu : ............................................................................. 113 2. KiÓm tra chÊt l−îng:............................................................................... 116 KÕt luËn .............................................................................................................. 120 Môc lôc............................................................................................................... 121

Các file đính kèm theo tài liệu này:

  • pdfTín hiệu tiếng nói và các phương pháp mã hoá.pdf
Luận văn liên quan