VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ


1 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ &...
Author:  Hynek Vlček

0 downloads 7 Views 3MB Size

Recommend Documents


No documents


VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF TELECOMMUNICATIONS

METODY PRO ZVÝRAZNĚNÍ ŘEČI

BAKALÁŘSKÁ PRÁCE BACHELOR'S THESIS

AUTOR PRÁCE AUTHOR

BRNO 2011

PETER KUKUČKA

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF TELECOMMUNICATIONS

METODY PRO ZVÝRAZNĚNÍ ŘEČI SPEECH ENHANCEMENT METHODS

BAKALÁŘSKÁ PRÁCE BACHELOR'S THESIS

AUTOR PRÁCE

PETER KUKUČKA

AUTHOR

VEDOUCÍ PRÁCE SUPERVISOR

BRNO 2011

Ing. ANTONÍN HUDEC

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta elektrotechniky a komunikačních technologií Ústav telekomunikací

Bakalářská práce bakalářský studijní obor Teleinformatika Student: Ročník:

Peter Kukučka 3

ID: 120603 Akademický rok: 2010/2011

NÁZEV TÉMATU:

Metody pro zvýraznění řeči POKYNY PRO VYPRACOVÁNÍ: Seznamte se s metodami pro zvýraznění řečového signálu z hluku a šumu. Zaměřte se na jednokanálové metody, porovnejte jejich vlastnosti z hlediska výpočetní náročnosti, možného vzniku hudebního šumu, apod. Zvolené metody implementujte v prostředí Matlab a implementaci otestujte na nahrávkách řečového signálu z reálného prostředí. Diskutujte vhodnost použití jednokanálových metod pro zvýraznění řeči. DOPORUČENÁ LITERATURA: [1] JAN, J. Číslicová filtrace, analýza a restaurace signálů. Brno: Vysoké učení technické v Brně, 2002. ISBN 80-214-1558-4. [2] PSUTKA, J.; MÜLLER, L.; MATOUŠEK, J.; RADOVÁ, V. Mluvíme s počítačem česky. 1. vydání. Praha: Academia, 2006. 752 s. ISBN 80-200-1309-1 [3] DELLER, J. R.; HANSEN, J. H. L.; PROAKIS, J. G. Discrete-Time Processing of Speech Signals. 1. edition. New York: IEEE Press, 2000. 908 p. ISBN 0-7803-5386-2 Termín zadání:

7.2.2011

Termín odevzdání:

Vedoucí práce:

Ing. Antonín Hudec

2.6.2011

prof. Ing. Kamil Vrba, CSc. Předseda oborové rady UPOZORNĚNÍ: Autor bakalářské práce nesmí při vytváření bakalářské práce porušit autorská práva třetích osob, zejména nesmí zasahovat nedovoleným způsobem do cizích autorských práv osobnostních a musí si být plně vědom následků porušení ustanovení § 11 a následujících autorského zákona č. 121/2000 Sb., včetně možných trestněprávních důsledků vyplývajících z ustanovení části druhé, hlavy VI. díl 4 Trestního zákoníku č.40/2009 Sb.

Prohl´ aˇ sen´ı o p˚ uvodnosti pr´ ace Prohlaˇsuji, ˇze svou semestr´ aln´ı pr´ aci na t´ema Metody pro zv´ yraznˇen´ı ˇreˇci“ jsem vypracoval ” samostatnˇe pod veden´ım vedouc´ıho semestr´aln´ı pr´ace s pouˇzit´ım odborn´e literatury a dalˇs´ıch informaˇcn´ıch zdroj˚ u, kter´e jsou vˇsechny uvedeny v seznamu literatury na konci pr´ace. Jako autor uveden´e semestr´ aln´ı pr´ ace d´ ale prohlaˇsuji, ˇze v souvislosti s vytvoˇren´ım t´eto semestr´aln´ı pr´ace jsem neporuˇsil autorsk´ a pr´ ava tˇret´ıch osob, zejm´ena jsem nezas´ahl nedovolen´ ym zp˚ usobem do ciz´ıch autorsk´ ych pr´ av osobnostn´ıch a jsem si plnˇe vˇedom n´ asledk˚ u poruˇsen´ı ustanoven´ı § 11 a n´asleduj´ıc´ıho autorsk´eho z´akona ˇc. 121/2000 Sb., vˇcetnˇe moˇzn´ ych trestnˇe pr´avn´ıch d˚ usledk˚ u vypl´ yvaj´ıc´ıch z ustanoven´ı § 152 trestn´ıho z´ akona ˇc. 140/1961 Sb.

ABSTRAKT C´ılem pr´ ace je objasnit nˇekter´e jednokan´alov´e metody pro zpracov´ani ˇreˇci. V t´eto pr´aci jsou rozebran´e metody: z´ akladn´ı metoda spektr´ aln´ıho odeˇc´ıt´an´ı, modifikovan´a metoda spektr´aln´ıho odeˇc´ıt´an´ı, p´ asmov´e spektr´ aln´ı odeˇc´ıt´ an´ı a spektr´ aln´ı odeˇc´ıt´an´ı MMSE, Wienerovo filtrov´an´ı. Vˇsechny metody jsou implementov´ any. Kromˇe toho jsou v t´eto pr´aci popsan´e pˇredzpracov´an´ı ˇreˇci, detektor ˇreˇcov´e aktivity a hodnocen´ı ˇreˇci.

ˇ ´ SLOVA KL´ICOV A jednokan´ alov´e zv´ yrazˇ nov´ an´ı ˇreˇci, detektor ˇreˇcov´e aktivity, segmentace, spektr´aln´ı odeˇc´ıt´an´ı, Wienerovo filtrov´ an´ı, SNR.

ABSTRACT Aim of this work is summarize some single-channel methods of speech enhancement. These methods are explained in this work: Basic Spectral Subtraction Method, Modified Spectral Subtraction, Multi-band Spectral subtraction, spectral subtraction MMSE and Wiener filtering. All methods are implemented. Preprocessing, voice activity detector and speech scores are explained in this paper, too.

KEYWORDS single-channel speech enhancement, voice activity detection, segmentation, spectral subtraction, Wiener filtering, SNR.

Prohlášení o původnosti práce Prohlašuji, že svou bakalářskou práci na téma „Metody pro zvýrazněni řeči“ jsem vypracoval samostatně pod vedením vedoucího bakalářské práce s použitím odborné literatury a dalších informačních zdrojů, které jsou všechny uvedeny v seznamu literatury na konci práce. Jako autor uvedené bakalářské práce dále prohlašuji, že v souvislosti s vytvořením této semestrální práce jsem neporušil autorská práva třetích osob, zejména jsem nezasáhl nedovoleným způsobem do cizích autorských prav osobnostních a jsem si plně vědom následků porušeni ustanoveni § 11 a následujícího autorského zákona č. 121/2000 Sb., včetně možných trestně pravních důsledků vyplývajících z ustanoveni § 152 trestního zákona č. 140/1961 Sb.

V Brně ...................

.................... Podpis autora

Poděkování Děkuji vedoucímu bakalářské práce Ing. Antonínovi Hudecovi za odbornou asistenci a pomoc při zpracováni práce

V Brně ......................

....................... Podpis autora

KUKUČKA, P. Metody pro zvýraznění řeči. Brno: Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií, 2011. 46 s. Vedoucí bakalářské práce Ing. Antonín Hudec.

Obsah 1 Pˇ redzpracov´ an´ı vstupn´ıho sign´ alu

11

1.1

Segmentace ˇreˇci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2

Detektor ˇreˇcov´e aktivity: VAD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.2.1

Princip VAD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.2.2

Adaptivnˇe nastaviteln´ y pr´ah . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.2.3

VAD zaloˇzen´ y na vyuˇzit´ı energie . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Jednokan´ alov´ e metody pro zv´ yraznˇ en´ı ˇ reˇ ci

16

2.1

Z´ akladn´ı metoda spektr´ aln´ıho odeˇc´ıt´an´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2

Modifikovan´ a metoda spektr´ aln´ıho odeˇc´ıt´an´ı . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3

P´ asmov´e spektr´ aln´ı odeˇc´ıt´ an´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.4

Spektr´ aln´ı odeˇc´ıt´ an´ı pomoc´ı Minimum Mean Square Estimator . . . . . . . . . . . . . . 20

2.5

Wiener˚ uv filtr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3 Porovn´ an´ı metod 3.1

23

Metody hodnocen´ı kvality ˇreˇcov´eho sign´alu . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.1.1

Subjektivn´ı metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.1.2

Objektivn´ı metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.2

Spektr´ aln´ı odeˇc´ıt´ an´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3

Modifikovan´ a metoda spektr´ aln´ıho odeˇc´ıt´an´ı . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.4

P´ asmov´e spektr´ aln´ı odeˇc´ıt´ an´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.5

Spektr´ aln´ı odeˇc´ıt´ an´ı pomoc´ı Minimum Mean Square Estimator . . . . . . . . . . . . . . 33 3.5.1

3.6

Zhrnut´ı v´ ysledk˚ u metod spektr´aln´ıho odeˇc´ıt´an´ı . . . . . . . . . . . . . . . . . . . 33

Wiener˚ uv filtr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

´ Uvod T´ematem t´eto bakal´ aˇrsk´e pr´ ace jsou jednokan´alov´e metody zpracov´an´ı ˇreˇci, jejich implementace a porovn´ an´ı. Jednokan´ alov´e metody sn´ımaj´ı zvuk pouze jedn´ım mikrofonem. Pouˇzit´ı jednoho mikrofonu je v´ yhodn´e z hlediska ceny, nev´ yhodou na druh´e stranˇe je, ˇze nen´ı zn´am ˇsum, kter´ y znehodnocuje ˇreˇc. Existuje mnoˇzstv´ı jednokan´ alov´ ych metod pro potlaˇcen´ı ˇsumu, kter´e se dˇel´ı podle toho, jesli je sign´ al zpracov´ an v ˇcasov´e nebo frekvenˇcn´ı oblasti. Pro u ´spˇeˇsn´e potlaˇcen´ı ˇsumu, kter´ ym je znehodnocen´ y ´reˇcov´ y sign´al je nutn´e dan´ y ˇsum odhadnout. Proto se pouˇz´ıv´ a detektor ˇreˇcov´e aktivity, kter´ y urˇc´ı v kter´ ych u ´sec´ıch se ˇreˇc nenach´az´ı. V prvn´ı ˇc´ast´ı se pr´ ace vˇenuje pˇredzpracov´ an´ı sign´ alu. Jsou tu vysvˇetleny z´akladn´ı operace, kter´e se prov´adˇej´ı pˇred zpracov´ an´ım samotnou metodou a n´ aslednˇe po zpracov´an´ı. V dalˇs´ı ˇc´asti jsou podrobnˇeji pops´any jednotliv´e jednokan´ alov´e metody: spektr´ aln´ı odeˇc´ıt´an´ı, jeho modifikace a Wienerova filtrace. V tˇret´ı ˇc´asti pr´ ace jsou zobrazeny v´ ysledky simulac´ı proveden´ ych na jednotliv´ ych metod´ach, kter´e byly uvedeny.

10

1

Pˇ redzpracov´ an´ı vstupn´ıho sign´ alu

Pˇredt´ım, neˇz se zaˇcne ˇreˇcov´ y sign´ al zpracov´avat, tedy se pouˇzije nˇekter´a z metod pro zv´ yraznˇen´ı ˇreˇci, mus´ı b´ yt provedeny nˇekter´e z´ akladn´ı kroky. Tˇemito z´akladn´ımi kroky se mysl´ı segmentace ˇreˇci, n´ asledn´e vyuˇzit´ı v´ ahovac´ıch oken a detektoru ˇreˇcov´e aktivity.

1.1

Segmentace ˇ reˇ ci

Z´ akladn´ı operac´ı pˇri zpracov´ an´ı ˇreˇci je rozdˇelen´ı ˇreˇci na r´amce (segmenty). V´ ych´az´ıme z poznatku, ˇze parametry ˇreˇci jsou konstantn´ı jen na kr´atk´em ˇcasov´em u ´seku. Segmenty mus´ı b´ yt dostateˇcnˇe kr´ atk´e, aby byla zachov´ ana kvazistacionarita ˇreˇci, ale dostateˇcnˇe dlouh´e, aby bylo moˇzn´e postˇrehnout kvaziperiodick´ y charakter ˇreˇcov´eho sign´alu. Obvykle se vol´ı d´elka 10–30 ms.[8] Segmentace sign´ alu m˚ uˇze b´ yt: 1. bez vz´ ajemn´eho pˇrekryvu 2. s pˇrekryt´ım sousedn´ıch segment˚ u Segmentace sign´ alu s pˇrekryt´ım sousedn´ıch segment˚ u vede k pˇresnˇejˇs´ım v´ ypoˇct˚ um parametr˚ u ˇreˇcov´eho sign´ alu.

Obr´ azek 1: Princip segmentace bez pˇrekryt´ı sousedn´ıch segment˚ u a s pˇrekryt´ım sousedn´ıch segment˚ u. Poˇcet segment˚ u po segmentaci s pˇrekryt´ım sousedn´ıch oken se d´a vypoˇc´ıtat n´asledovnˇe:

SN = [

L−P ], N −P

(1.1)

kde L je d´elka segmentovan´eho sign´ alu, N je d´elka jedn´eho segmentu a P je d´elka pˇrekryvu. Protoˇze 11

spracov´ an´ı sign´ alu prob´ıha ˇcasto za pomoci algoritm˚ u vyuˇz´ıvaj´ıc´ıch Fouerierovou transformaci, je nutn´e volit d´elku segmentu n´ asledovnˇe:

N = 2n ,

(1.2)

kde n = 0, 1, 2, . . . N´ aslednˇe jsou segmenty v´ aˇzeny v´ ahovac´ım oknem. V´ahovac´ı okna m˚ uˇzou b´ yt napˇr´ıklad pravo´ uhl´e okno nebo Hammingovo okno a jin´e [3]. V´ ybˇer okna z´avis´ı od charakteru vstupn´ıho sign´alu [3]. Hammingovo okno utlum´ı sign´ al na okraj´ıch r´amce a zabr´an´ı pˇrechodov´ ym jev˚ um, vyuˇz´ıv´a se hlavnˇe, kdyˇz se pouˇzije segmentace ˇreˇci s pˇrekryt´ım. Na druh´e stranˇe m´a horˇs´ı kmitoˇctov´e rozliˇsen´ı neˇz pravo´ uhl´e okno. Hammingovo okno je definov´ ano n´asledovnˇe:

pro n = 0, 1, ..., N − 1 : w[n] = 0, 54 − 0, 46 cos(n pro ostatn´ı n : w[n] = 0.

2π ), N

(1.3) (1.4)

Pravo´ uhl´e okno je definov´ ano n´ asledovnˇe:

pro n = 0, 1, ..., N − 1 : w[n] = 1,

(1.5)

pro ostatn´ı n : w[n] = 0.

(1.6)

kde w[n] je diskr´etn´ı v´ ahovac´ı funkce. Pˇri anal´ yze ˇreˇci rozkl´ ad´ ame ˇreˇcov´ y sign´al na segmenty, ze kter´ ych pak analyzujeme jednotliv´e parametry. Po zpracov´ an´ı sign´ alu je nutn´e prov´est desegmentaci, aby sme opˇet dostali cel´ y sign´ al. Desegmentace, neboli zpˇetn´ a synt´eza sign´alu, se prov´az´ı pomoc´ı [4]: • metoda ostranˇen´ı pˇresahu • metoda pˇriˇcten´ı pˇresahu V´ıce se vyuˇz´ıv´ a metoda pˇriˇcten´ı pˇresahu. Princip t´eto metody spoˇc´ıv´a v realizaci diskr´etn´ı konvoluci dvou posloupnost´ı. Podm´ınkou je, aby jedna posloupnosti byla podstatnˇe delˇs´ı neˇz druh´a. Vstupn´ı sign´ al x[n] je rozˇclenˇen´ y na u ´seky xi [n] po L vzorc´ıch a druh´ y vstupn´ı sign´al h[n] m´a d´elku M a plat´ı L >> M . V´ ysledn´ı konvoluce se pak rovn´a: 12

yi [n] = xi [n] ∗ h[n],

(1.7)

kde i = 0, 1, 2, . . . Koncov´e ˇc´ asti d´ılˇc´ıch konvoluc´ı je nutn´e seˇc´ıst.

1.2

Detektor ˇ reˇ cov´ e aktivity: VAD

Detektor ˇreˇci nebo detektor ˇreˇc-pauza (angl. Voice activity detection: VAD) je velmi d˚ uleˇzit´a souˇc´ ast zpracov´ an´ı ˇreˇci. Vˇetˇsina jednokan´ alov´ ych metod vyuˇz´ıvaj´ıc´ıch spektr´aln´ı odeˇc´ıtan´ı vyuˇz´ıv´a VAD aby rozhodli, ve kter´ ych u ´sec´ıch se nenach´az´ı ˇreˇcov´ y sign´al. Toto se vyuˇz´ıv´a na spr´avn´ y odhad ˇsumu. Z´ akladn´ı pˇredpoklad je, ˇze ˇsum je stacion´arn´ı v kr´atk´ ych u ´sec´ıch, proto m˚ uˇze b´ yt ˇsum z tˇechto u ´sek˚ u pouˇzit na odstranˇen´ı ˇsumu z u ´sek˚ u, kde je ˇreˇc pˇr´ıtomna. Rozhodnut´ı, zda je, nebo nen´ı ˇreˇc pˇr´ıtomna v dan´em u ´sek˚ u, je jedna z nejcitlivˇejˇs´ıch ˇc´ast´ı kvalitn´ıho zv´ yraznˇen´ı ˇreˇci, protoˇze nespr´avn´e odhadnut´ı ˇsumu m˚ uˇze v´est k znehodnocen´ı v´ ysledn´eho zv´ yraznˇen´eho sign´alu. Pˇresnost VAD silnˇe ovlivˇ nuje zkreslen´ı ˇreˇci a potlaˇcen´ı ˇsumu. Prvn´ı VAD algoritmy vyuˇz´ıvali kr´atkodobou energii a koeficienty line´ arn´ı pˇredpovˇedi. VAD zaloˇzen´e na vyuˇzit´ı energie se hodnˇe vyuˇz´ıvaj´ı hlavnˇe kv˚ uli jejich n´ızk´ ym v´ ypoˇcetn´ım n´ arok˚ um. 1.2.1

Princip VAD

ˇ c VAD zaˇr´ızen´ı pracuj´ı na principu porovnan´ı energie sign´alu s prahem z´avisl´ ym na u ´rovni ˇsumu. Reˇ je detekovan´ a, kdyˇz odhadnut´ a energie je nad u ´rovn´ı prahu a v tomto pˇr´ıpade se nastav´ı v´ ystup VAD na hodnotu 1. Vˇetˇsina VAD algoritm˚ u m´a na v´ ystupu bin´arn´ı rozhodnut´ı zaloˇzen´e na porovn´avac´ı metodˇe r´ amec po r´ amci. R´ amec vstupn´ıho sign´alu je kr´atk´ y ˇcasov´ yu ´sek s d´elkou 10–30 ms. Z´akladn´e blokov´e sch´ema VAD je zobrazeno na Obr. 2 1.2.2

Adaptivnˇ e nastaviteln´ y pr´ ah

Nastav´ı se poˇc´ ateˇcn´ı hodnota prahu. Z prvn´ıch r´amc˚ u, kde se nenach´az´ı ˇreˇc se vypoˇcte stˇredn´ı hodnota E(X) a rozptyl D(X). Pak se hodnota prahu nastav´ı podle vztahu

tr = E(X) + α

p

D(X),

(1.8)

kde α je konstanta. E(X) a D(X) mohou b´ yt vypoˇcteny n´asledovnˇe:

E(X) =

X

(xi )p(xi ),

xi =Q

13

(1.9)

Obr´ azek 2: Blokov´e sch´ema VAD

D(X) =

X

[xi − E(X)]2 p(xi ),

(1.10)

xi =Q

kde n´ ahodn´ a veliˇcina X je diskr´etn´ı, kdyˇz posloupnost re´aln´ ych ˇc´ısel xi a nez´aporn´ ych re´aln´ ych ˇc´ısel pi takov´ a, ˇze plat´ı n´ asleduj´ıc´ı:

p(X = xi ) = pi ,

(1.11)

a z´ aroveˇ n: X

p(X = xi ) =

X

xi pi = 1.

(1.12)

N´ aslednˇe se urˇc´ı hodnota vybran´e charakteristiky sign´alu v aktu´aln´ım r´amci X. Kdyˇz nab´ yv´a vˇetˇs´ı hodnoty neˇz prahov´ a hodnota tr , je detekovan´a ˇreˇc. Kdyˇz menˇs´ı, je detekovan´a pauza. Souˇcasn´e se upravuj´ı hodnoty E(X) a D(X) charakteristiky a stanov´ı se nov´a prahov´a hodnota 1.2.3

VAD zaloˇ zen´ y na vyuˇ zit´ı energie

Vzhledem na to, ˇze ˇreˇc je segmentov´ ana na r´amce, m´a kaˇzd´ y r´amec svou kr´atkodobou energii Eseg , kterou VAD zjiˇst’uje v´ ypoˇctem

Eseg =

∞ X

[s(t)w(n − t)]2 ,

t=−∞

14

(1.13)

kde s(t) je vzorek sign´ alu v ˇcase t a w[n] je typ v´ahovac´ıho okna. Pˇri v´ ypoˇctu kr´atkodob´e energie je doporuˇcen´ a d´elka r´ amc˚ u 10–30 ms a vzorkovac´ı frekvence fvz = 8–10 kHz[5]. Funkce je velmi citliv´ a na zmˇeny u ´rovnˇe sign´ alu, proto se vyuˇz´ıv´a kr´atkodob´a intenzita, kter´a tento nedostatek odbour´av´ a

Mn =

∞ X

|s(t)|w(n − t).

(1.14)

t=−∞

Segment energie se pak porovn´ av´ a s prahovou hodnotou energie Ep definovanou jako:

Ep = 1, 5Ed ,

(1.15)

kde Ed je u ´roveˇ n energie ˇsumu v pozad´ı. Aktualizuje se podle En = (1 − p)Ed0 + pE,

(1.16)

kde E0d je posledn´ı zn´ am´ a hodnota energie. N´asledn´a aktualizace se prov´ad´ı v ˇreˇcov´ ych pauz´ach. Parametr p se vol´ı podle potˇreb a E je energie dan´eho segmentu. Kdyˇz Eseg > Ep , VAD detekuje ˇreˇc, jinak se aktualizuje energie ˇsumu.

15

2

Jednokan´ alov´ e metody pro zv´ yraznˇ en´ı ˇ reˇ ci

Jednokan´ alov´e metody se jinak daj´ı jednoduˇse nazvat jednovstup´e metody. Zpracov´avan´ y sign´al je sn´ıman´ y jen jedn´ım mikrofonem a n´ aslednˇe je upraven algoritmem pro zpracov´an´ı ˇreˇci. Velkou v´ yhodou jednokan´ alov´ ych metod je vyuˇzit´ı jen jednoho kan´alu Pro sn´ım´an´ı sign´alu je zapotˇreb´ı jen jeden mikrofon, co v´ yraznˇe zniˇzuje n´aklady. Oproti tomu zase nen´ı k dispozici ˇz´adn´ y referenˇcn´ı sign´ al, kter´ y by mohl b´ yt pouˇzit k odhadu ruˇsen´ı. Odhad ruˇsiv´eho sign´alu pak mus´ı b´ yt proveden v period´ ach, kde se ˇreˇcov´ y sign´al nenach´az´ı. K tomu je nutn´e pouˇz´ıt detektor ˇreˇcov´e aktivity. Obvykl´ ym pˇredpokladem b´ yv´ a, ˇze vstupuj´ıc´ı ˇsum je aditivn´ı a stacion´arn´ı. Jednokan´alov´e metody m˚ uˇzou zpracov´ avat sign´ al ve frekvenˇcn´ı nebo ˇcasov´e oblasti.

2.1

Z´ akladn´ı metoda spektr´ aln´ıho odeˇ c´ıt´ an´ı

V´ yhodou metody spektr´ aln´ıho odeˇc´ıt´ an´ı spoˇc´ıv´a v jej´ı jednoduchosti a schopnosti pˇrizp˚ usoben´ı vlastnost´ı pomoc´ı vhodn´ ych u ´prav a moˇznosti nastaven´ı parametr˚ u. Blokov´e sch´ema z´akladn´ı metody spektr´ aln´ıho odeˇc´ıt´ an´ı je na Obr. 3.

Obr´ azek 3: Blokov´e sch´ema spektr´aln´ıho odeˇc´ıt´an´ı [7] Princip metody spoˇc´ıv´ a v odhadu spektra ˇsumu zaˇsumˇen´eho sign´alu a jeho n´asledn´e odeˇc´ıt´an´ı. K tomu se vyuˇz´ıvaj´ı nˇekter´e pomocn´e u ´kony vysvˇetlen´e v kapitole 1. Odhad spektra ˇsumu je urˇcen za pomoc´ı VAD v u ´sec´ıch kde nen´ı ˇreˇc. Z´ akladn´ım pˇredpokladem t´eto metody je nekorelovan´ y aditivn´ı ˇsum. To n´ am dovoluje vyuˇz´ıt n´ asleduj´ıc´ı model:

16

y(n) = s(n) + d(n),

(2.1)

kde s(n) pˇredstavuje z´ akladn´ y ˇreˇcov´ y sign´al, d(n) nekorelovan´ y ˇsum, kter´ y ovlivn´ı ˇreˇc a y(n) pˇredstavuje ˇsumem znehodnocenou ˇreˇc. Pˇredpokl´ad´ame taky, ˇze ˇreˇc a ˇsum jsou v kr´atkodob´em zpracov´ an´ı stacion´ arn´ı sign´ aly. Vzhledem k tomuto pˇredpokladu si oznaˇc´ıme sign´aly z rovnice (2.1) n´ asledovnˇe:

yw (n) = sw (n) + dw (n).

(2.2)

Pˇred samotn´ ym pouˇzit´ım metody spektr´aln´ıho odeˇc´ıt´an´ı, mus´ı b´ yt nejdˇr´ıv ˇreˇc segmentov´ana a n´aslednˇe n´ asobena pomoc´ı v´ ahovac´ıho okna. Tento proces je podrobnˇeji pops´an v kapitole 2. N´aslednˇe je pomoc´ı diskr´etn´ı Fourierov´e transformace (Discrete Fourier transform: DFT) [3] vstupn´ı sign´al pˇreveden z ˇcasov´e oblasti do frekvenˇcn´ı oblasti. Ve frekvenˇcn´ı oblast´ı m˚ uˇzeme poˇc´ıtat s modulem spektra nebo s v´ ykonov´ ym spektrem sign´ alu. Potom:

|Yw (ω)|2 = |Sw (ω)|2 + |Dw (ω)|2 + Sw (ω)Dw ∗ (ω) + Sw ∗ (ω)Dw (ω),

(2.3)

kde Dw ∗ a Sw ∗ reprezentuj´ı komplexn´ı ˇc´ısla Dw (ω) a Sw (ω). |Sw (ω)| vyj´adˇruje kr´atkodobou energii spektra ˇreˇci. Dw (ω) je aproximovan´e E[|Dw (ω)|2 ], E[Sw (ω)Dw ∗(ω)] a E[Sw ∗(ω)Dw (ω)], E[.] je v´ ypoˇcet statistick´eho parametru stˇredn´ı hodnoty, kter´ y je vypoˇcten pomoc´ı VAD. Vzhledem na nekorelovan´ y 2 ˆ ˇsum se sign´ alem, E[Sw (ω)Dw ∗ (ω)] a E[Sw ∗ (ω)Dw (ω)] jsou nulov´e a odhad v |S(ω)| z |S(ω)|2 je

odvozen´ y z rovnice (2.3) jako

2 ˆ |S(ω)| = |Yw (ω)2 | − E[|Dw (ω)|2 ],

(2.4)

kde E[|Dw (ω)|2 ] je odvozen´e se zn´ am´ ych vlastnost´ı ˇsumu d(n) nebo z vlasntnost´ı ˇsumu, kter´e jsme zmˇe´rili v intervalech, kde je p´r´ıtomen pouze ˇsum, tedy v pauz´ach mezi ˇreˇc´ı. Nev´ yhodou a znaˇcn´ım omezen´ım vˇsech algoritm˚ u spektr´ aln´ıho odeˇc´ıt´an´ı jsou tzv. hudebn´ı t´ony [7]. Pˇriˇcinou vzniku je pˇredevˇs´ım ˇspatn´ y odhad spektra hluku. V pˇr´ıpadech, ˇze |Sw (ω)| je z´aporn´e z d˚ uvodu nadhocnocen´ı ˇsumu, je d´ ano rovno nule. 17

|Sw (ω)|2 > 0, |Sw (ω)|2 = |Yw (ω)2 | − E[|Dw (ω)|2 ], jinak |Sw (ω)|2 = 0.

(2.5) (2.6)

S vyuˇzit´ım pˇredpokladu, ˇze kr´ atkodob´a f´aze je nepodstatn´a, m˚ uˇzeme aproximovat RSw (ω), f´ az´ı Sw (ω) pomoc´ı RYw (ω)

Sˆw (ω) = |Sw (ω)|exp[jRYw (ω)].

(2.7)

N´ asledn´ı inverzn´ı Fouerierovou transformac´ı dostaneme

Sˆw (n) = F −1 Sˆw (ω).

2.2

(2.8)

Modifikovan´ a metoda spektr´ aln´ıho odeˇ c´ıt´ an´ı

Protoˇze v z´ akladn´ı metodˇe spektr´ aln´ıho odeˇc´ıt´an´ı doch´azelo k tzv. hudebn´ım t´on˚ um. Byly vyvinuty r˚ uzn´e modifikovan´e metody spektr´ aln´ıho odeˇc´ıt´an´ı. Jedna z metod, kter´a ˇreˇs´ı tento probl´em je algoritmus navrˇzen Berouti [7], viz Obr. 2.2. Tato metoda vylepˇsuje ˇsiroko p´ asmov´e potlaˇcen´ı ˇsumu a z´aroveˇ n potlaˇcuje vznik hudebn´ıch t´on˚ u. Narozd´ıl od z´ akladn´ı metody, spektr´ aln´ı sloˇzky v´ ysledn´ıho sign´alu jsou modifikovan´e

2 2 ˆ ˆ w (ω)|2 ], |S(ω)| ˆ ˆ w (ω)|2 ], |S(ω)| > β[|D = |Yw (ω)2 | − α[|D 2 ˆ ˆ w (ω)|2 ], jinak |S(ω)| = β|D

(2.9) (2.10)

kde α ≥ 1 je subtrakˇcn´ı faktor, 0 < β << 1 je parametr spektr´aln´ıho pozad´ı. V z´akladn´ı metodˇe je subtrakˇcn´ı faktor α = 1. Vyˇsˇs´ım subtrakˇcn´ım faktorem doch´az´ı k poklesu amplitudy ˇsirokop´asmov´ ych vrcholk˚ u ve spektru. Parametr α tak´e ovlivˇ nuje zkreslen´ı v´ ysledn´eho sign´alu. Dalˇs´ım zlepˇsen´ım doch´ az´ı vhodn´ ym nastaven´ım parametru β. Parametr β ovlivˇ nuje mnoˇzstv´ı zbytkov´eho ˇsumu, kter´ y je pˇr´ıtomen ve zpracov´ avan´em sign´ ale. Velkou nev´ yhodou tohoto algoritmu je neschopnost reagovat na zmˇeny ˇsumu, kter´ y ovlivˇ nuje vstupn´ı ˇreˇcov´ y sign´ al [7].

2.3

P´ asmov´ e spektr´ aln´ı odeˇ c´ıt´ an´ı

P´ asmov´e spektr´ aln´ı odeˇc´ıt´ an´ı v´ ych´ az´ı z pˇredpokladu, ˇze SNR jednotliv´ ych diskr´etn´ıch kmitoˇct˚ u se m˚ uˇze mˇenit r´ amec od r´ amce. Tyto zmˇeny jsou pˇr´ıˇcinou hudebn´ıch t´on˚ u. 18

Obr´ azek 4: Blokov´e sch´ema modifikovan´e metody spektr´aln´ıho odeˇc´ıt´an´ı. [7]

19

Odhad zv´ yraznˇen´e ˇreˇci v j-t´em kmitoˇctov´em p´asmu je

ˆ j (ω)|2 , |Sˆj (ω)|2 = |Yj (ω)|2 − αj δj |D

(2.11)

kde δj je pˇr´ıdavn´ y subtrakˇcn´ı faktor pro jednotliiv´a kmitoˇctov´a subp´asma. Hodnoty parametru δj se stanovuj´ı empiricky. Nastaven´ı se prov´az´ı n´asledovnˇe [11]:

δj = 1 pro fj < 1 kHz,

(2.12)

= 2.5 pro 1 kHz < fj < Fs /2 − 2 kHz,

(2.13)

= 1.5 pro fj > Fs /2 − 2 kHz,

(2.14)

kde fj je nejvyˇsˇs´ı kmitoˇcet j-t´eho subp´ asma a Fs je vzorkovac´ı kmitoˇcet. Na niˇzˇs´ıch kmitoˇctech jsou pouˇz´ıv´ any niˇzˇs´ı hodnoty parametru δj , protoˇze je tam soustˇredˇena vˇetˇsina energie ˇreˇcov´eho sign´ alu [11].

2.4

Spektr´ aln´ı odeˇ c´ıt´ an´ı pomoc´ı Minimum Mean Square Estimator

V´ yhodou tohoto algoritmu je optim´ aln´ı stanoven´ı subtrakˇcn´ıch parametr˚ u. Obecn´e vyj´adˇren´ı algoritmu spektr´ aln´ıho odeˇc´ıt´ an´ı MMSE je n´ asledovn´e [2]:

2 2 ˆ ˆ |S(ω)| = γp |Y (ω)|2 − αp |D(ω)| ,

(2.15)

kde γp a αp jsou subtrakˇcn´ı parametry, kter´e je moˇzn´e v´ ypoˇc´ıtat podle vztah˚ u (2.16) a (2.17). ξ2 {1 − ξ}, 1 + ξ2 ξ2 αp = . 1 + ξ2 γp =

(2.16) (2.17)

Pro v´ ypoˇcet hodnot ξ je nutn´e zn´ at ˇcist´ y sign´al. V re´aln´ıch podm´ınk´ach, pˇri nahr´av´an´ı jedn´ım mikrofonem, vˇetˇsinou nen´ı zn´ am ˇcist´ y sign´ al, proto ho pro u ´ˇcely algoritmu nahrad´ıme:

ξ = (1 − η) max (

|Y (ω)|2 |Sˆprev (ω)| − 1, 0) + η , 2 ˆ ˆ |D(ω)| D(ω) 20

(2.18)

kde η je konstanta rovna 0,96 a |Sˆprev (ω)| je vypoˇcten´e spektrum zv´ yraznˇen´e ˇreˇci z pˇredchoz´ıho r´amce [2].

2.5

Wiener˚ uv filtr

Wiener˚ uv filtr byl navrˇzen Norbertem Wienerem a publikov´an byl v roku 1949 [13]. C´ılem Wienerova filtru je minimalizovat Euklidovsku vzd´alenost mezi origin´aln´ım a filtrovan´ ym sign´alem

e2 = E{[ˆ s(n) − s(n)]2 }.

(2.19)

Princip Wienerova filtra je zobrazen na Obr. 5. Pro odhad spektra ˇsumu a ˇreˇci se vyuˇz´ıv´a VAD.

Obr´ azek 5: Princip Wienerova filtra Blok H(ω) se naz´ yva Wiener˚ uv korekˇcn´ı faktor a je matematicky vyj´adˇren n´asledovnˇe:

H(ω) =

|S(ω)| , |Y (ω)|

(2.20)

kde |Sω)| a |Y (ω|) jsou moduly spektra ˇsumu a ˇreˇci. Protoˇze tyto spektra nejsou zn´ame, uprav´ıme rovnici jejich nahrazen´ım:

H(ω) =

ˆ |Yˆ (ω)| − |D(ω)| , |Yˆ (ω)| 21

(2.21)

ˆ kde Yˆ (ω) je modul odhadu spektra zaˇsumˇen´e ˇreˇci a D(ω) je modul odhadu spektra ˇsumu. Wiener˚ uv korekˇcn´ı faktor nab´ yva hodnot v rozmez´ı < 0, 1 >. Pro ˇc´asti, ve kter´ ych se nach´az´ı pouze ˇsum, nebo je spektrum ˇreˇci nab´ yv´ a neporovnatelnˇe menˇs´ıch hodnot neˇz spektrum ˇsumu, nab´ yv´a Wener˚ uv korekˇcn´ı faktor nulov´ ych hodnot. Pro ˇc´ asti s ˇreˇcov´ ym sign´alem nab´ yv´a hodnot H(ω) = 1. Potlaˇcen´ı hluku ze zaruˇsen´eho sign´ alu lze dos´ahnout vyn´asoben´ım kr´atk´ ych spektr´aln´ıch hodnot zaˇsum´el´e ˇreˇci Wienerov´ ym korekˇcn´ım faktorem.

ˆ |S(ω)| = H(ω)|Y (ω)|.

22

(2.22)

3

Porovn´ an´ı metod

Metody uveden´e v kapitole 3 jsem implementoval v prostˇred´ı Matlab. V t´eto kapitole se budu vˇenovat porovn´ an´ı implementovan´ ych metod a jejich zhodnocen´ı. ˇ a ˇreˇc je nahr´ Cist´ avka ’cista 10s’, obsahuje muˇzsk´ y hlas, m´a d´elku 10 s a obsahuje minim´aln´ı mnoˇzstv´ı ˇsumu, kter´e je zp˚ usobeno nahr´avac´ım zaˇr´ızen´ım. Vzorkovac´ı frekvence fs = 8000 Hz, sign´ al m´ a proto 80 000 vzork˚ u, viz Obr. 6.

ˇ Obr´ azek 6: Casov´ y pr˚ ubˇeh nezaˇsumˇen´e ˇreˇci. N´ aslednˇe byla ˇreˇc zaˇsumˇen´ a r˚ uzn´ ymi ˇsumy. Jednotliv´e ˇsumy jsou nahr´avky z re´aln´ıho prostˇred´ı. ˇ Sumy jsou vybr´ any tak, aby ovˇeˇrili funkˇcnost implementovan´ ych metod. Vˇetˇsina energie lidsk´e ˇreˇci je soustˇredena v rozsahu od 80–1200 Hz [1]. Proto jsem vybral ˇsumy kter´e maj´ı r˚ uzn´a spektra. Napˇr´ıklad spektrum hluku motoru auta m´ a energii soustˇredenou hlavnˇe na niˇzˇs´ıch frekvenc´ıch do 400 Hz, ˇc´ım ˇ pˇrekr´ yv´ a ˇc´ ast ˇreˇci, viz Obr. 7. Energie ˇsumu vrtaˇcky je rozprestˇrena po cel´em spektru. Sum vrtaˇcky ˇ nav´ıc obsahuje n´ ahodn´e impulzn´ı ˇsumy, kter´e se opakuj´ı v pravideln´em intervalu, viz. Obr. 10. Sum mix´eru obsahuje minim´ aln´ı hodnoty energie v oblasti od 0–400 Hz, na nˇekter´ ych frekvenc´ıch zcela pˇrekr´ yv´ a ˇreˇcov´ y sign´ al, viz. Obr. 8. Zaˇsumˇen´ y sign´ al byl n´ aslednˇe segmentov´an. Poˇcet vzork˚ u v jednom segmentu byl zvolen 256, tak, aby bylo zachov´ ano pravidlo podle rovnice (1.2). D´elka pˇrekryvu byla zvolena 50% z d´elky segmentu, teda 128 vzork˚ u. Kaˇzd´ y segment byl vyn´asoben Hammingov´ ym oknem, kter´e m´a schopnost potlaˇcit

23

Obr´ azek 7: Modul spektra zvuku motoru auta

Obr´ azek 8: Modul spektra zvuku mix´eru

24

Obr´ azek 9: Modul spektra zvuku sprchy

Obr´ azek 10: Modul spektra zvuku vrtaˇcky

25

postrann´ı laloky ve spektru, kter´e zkresluj´ı spektr´aln´ı koeficienty, viz rovnice (1.3). Pro odhad ˇsumu a z´ aroveˇ n v´ ypoˇcet SNR je nutn´e vyuˇz´ıt VAD. V tomto pˇr´ıpadˇe jsem vyuˇzil VAD, kter´eho princip je pops´ an v kapitole 1. Uk´azka funkˇcnosti VAD je na Obr. 11. Pro segmentaci a VAD byla naps´ ana funkce VADseg.m, pro n´ aslednou desegmentaci deseg.m

Obr´ azek 11: Uk´aˇzka funkˇcnosti VAD.

3.1

Metody hodnocen´ı kvality ˇ reˇ cov´ eho sign´ alu

Pro hodnocen´ı kvality ˇreˇci se pouˇz´ıvaj´ı dvˇe z´akladn´ı metody hodnocen´ı, a to subjektivn´ı a objektivn´ı. 3.1.1

Subjektivn´ı metody

Subjektivn´ı metody se pouˇz´ıvaj´ı hlavnˇe pro jejich schopnost posuzovat kvalitu z hlediska lidsk´eho vn´ım´ an´ı. Jejich nev´ yhodou je subjektivn´ı vn´ım´an´ı ˇclovˇeka. Metody jsou detailnˇe popsan´e v doporuˇcen´ıch ITU-T ˇrady P [14]. Pro hodnocen´ı kvality vyuˇziju stanard ITU-T doporuˇcen´ı P.835, kter´e vyuˇz´ıv´ a tˇri samosatn´e hodnocen´ı. Nejdˇr´ıv hodnot´ı sign´al a jeho zkreslen´ı, viz Tab. 1, pak samostatnˇe hodnot´ı ˇsum pozad´ı, viz Tab. 2 a n´ aslednˇe hodnot´ı celkovou kvalitu pomoc´ı stupnice, kterou pouˇz´ıv´ a metoda MOS [14], viz Tab. 3.

26

hodnocen´ı

popis ˇreˇci

5

velmi pˇrirozen´a, ˇz´adne ruˇsen´ı

4

pˇrijatelnˇe pˇrirozen´a, mal´e ruˇsen´ı

3

trochu pˇrirozen´a, trochu degradovan´a

2

trochu nepˇrirozen´a, pˇrijatelnˇe degradovan´a

1

velmi nepˇrirozen´a, velmi ruˇsen´a

Tabulka 1: Tabulka hodnocen´ı SIG (Scale of Signal Distortion).

hodnocen´ı

vliv pozad´ı

5

miziv´ y

4

trochu n´apadn´ y

3

n´apadn´ y, neobtˇeˇzuj´ıc´ı

2

zˇreteln´ y, pomˇernˇe obtˇeˇzuj´ıc´ı

1

velmi zˇreteln´ y, velmi obtˇeˇzuj´ıc´ı

Tabulka 2: Tabulka hodnocen´ı BAK (Scale of Background Intrusiveness).

hodnocen´ı

kvalita ˇreˇci

u ´roveˇ n zkreslen´ı

5

vynikaj´ıc´ı

ˇz´adn´e zkreslen´ı

4

dobr´ a

rozpoznateln´a, ale nepˇr´ıjemn´a

3

pˇrijateln´a

rozpoznateln´a, trochu nepˇr´ıjemn´a

2

ˇspatn´ a

nepˇr´ıjemn´a, ale ne protivn´a

1

nepˇrijateln´a

nepˇrijateln´a

Tabulka 3: Tabulka hodnocen´ı MOS (Mean Opinion Scores).

27

3.1.2

Objektivn´ı metody

Prov´ adˇen´ı subjektivn´ıch test˚ u je ˇcasovˇe i finanˇcnˇe n´aroˇcn´e, proto se vyuˇz´ıvaj´ı i objektivn´ı metody, jejichˇz c´ılem je nahradit hodnocen´ı sign´ alu vhodn´ ym algoritmem. Pro hodnocen´ı vyuˇziju metodu odhadu Signal to Noise ratio (pomˇer sign´ al/ˇsum), konkr´etnˇe metodu segment´aln´ıho SNR, kter´a se nejv´ıce ze vˇsech metod vyuˇz´ıvaj´ıch´ıch SNR pˇribliˇzuje re´aln´ ym hodnot´am SNR. Objektivn´ı metody jsou popsan´e v doporuˇcen´ıch rady ITU-T ˇrady P [14], [3].

3.2

Spektr´ aln´ı odeˇ c´ıt´ an´ı

Metoda spektr´ aln´ıho odeˇc´ıt´ an´ı byla pops´ana v kapitole 2. Pro testov´an´ı metody byla pouˇzita funkce spectral.m. Postupnˇe byly aplikov´ any vˇsechny ˇsumy s r´ uzn´ ymi u ´rovnˇema.

ˇ Pˇri SNRin = 10 je metoda u ´ˇcinn´ a pˇri vˇsech druz´ıch ˇsumu. Sum je potlaˇcen a nevznikaj´ı skoro ˇz´adn´e hudebn´ı t´ ony. Zkreslen´ı sign´ alu pri vysok´ ych SNRin je nepoznateln´e lidsk´ ym uchem. Z klesaj´ıc´ım SNRin se zhorˇsuje kvalita v´ ystupn´ıho sign´ alu, zaˇc´ınaj´ı se objevovat hudebn´ı t´ony, kter´e jsou pri SNRin = 0 uˇz docela siln´e a zaˇc´ınaj´ı b´ yt ruˇsivˇejˇs´ı neˇz samotn´ y ˇsum. Nejl´epe se metoda spektr´aln´ıho odeˇc´ıt´ an´ı poradila se ˇsumem mix´eru, co je moˇzn´e vidˇet pˇri porovn´an´ı hodnot SNRout z jednotliv´ ych tabulek. Zkreslen´ı sign´ alu u ˇsumu mix´er bylo pomernˇe slab´e, hudebn´ı t´ony nebyly tak nepˇr´ıjemn´e a zˇreteln´e ˇ jak u ostatn´ıch. Sum vˇsak u z´ aporn´ ych hodnot SNRin byl pomˇernˇe zle potlaˇcen. U ˇsumu z motoru auta byla pozorovateln´a zmˇena ˇsumu v pozad´ı, kter´ y nabyl neurˇcit´ y charakter a byl dokonce ruˇsivˇejˇs´ı neˇz p˚ uvodn´ı ˇsum. Metoda spektr´aln´ıho odeˇc´ıt´an´ı si nejh˚ uˇr poradila s t´ımto ˇsumem, u kladn´ ych hodnot SNRin vznikaly velmi siln´e hudebn´ı t´ony a sign´al byl zkreslen. ˇ Sum z vrtaˇcky byl odbour´ an pomˇernˇe dobˇre pˇri kladn´ ych hodnot´ach SNRin . Pˇri niˇzˇs´ıch hodnot´ ach vˇsak zaˇc´ınal b´ yt sign´ al zkreslen, objevily se siln´e hudebn´ı t´ony kter´e byly velmi ruˇsiv´e pro vˇsechny posluchaˇce. Nakonec byl ˇreˇcov´ y sign´ al silnˇe potlaˇcen spolu ze ˇsumem. Impulzn´ı ˇsumy nebyly potlaˇceny v˚ ubec. Hodnoty SNRout u ˇsumu Sprcha byly podobn´e hodnot´am u ˇsumu Mix´er, avˇsak hudebn´ı t´ony byly ruˇsivˇejˇs´ı.

3.3

Modifikovan´ a metoda spektr´ aln´ıho odeˇ c´ıt´ an´ı

Pro implementaci byl pouˇzit skript spectral berouti.m. Podobnˇe jako u pˇredeˇsl´e metody spektr´ aln´ıho odeˇc´ıt´ an´ı, postupnˇe jsem znehodnotil ˇreˇc ˇsumy, kter´e jsou urˇcen´e k testov´an´ı metod. Tato

28

ˇ Sum

Mix´er

SNRin

SNRout

SNRE

SIG

BAK

MOS

(dB)

(dB)

(dB)

-

-

-

10

11,3

1,3

5

5

5

5

9,05

4,05

5

4

4

0

6,4

6,4

5

4

4

-5

3,3

8,3

4

3

3

-10

0,1

9,9

4

2

2

ˇ Sum

Auto

10

10,9

0,9

5

4

4

5

8,4

3,4

4

4

4

0

5,11

5,11

4

3

3

-5

2,17

7,17

3

2

3

-10

-1,4

8,6

2

2

2

ˇ Sum

Sprcha

10

11,1

1,1

5

4

5

5

8,72

3,72

5

4

4

0

5,7

5,7

4

3

3

-5

3,37

8,37

3

3

3

-10

0,04

10,04

3

2

2

ˇ Sum

Vrtaˇcka

10

11,3

1,3

5

5

5

5

8,2

3,2

5

4

4

0

5,2

5,2

4

4

4

-5

1,85

6,85

4

3

3

-10

-1,6

8,4

2

2

2

Tabulka 4: Pˇrehled v´ ystupn´ıch u ´daj˚ u a hodnocen´ı metody spektr´aln´ıho odeˇc´ıt´an´ı.

29

metoda byla zloˇzitˇejˇs´ı na testov´ an´ı, vzhledem k nastavov´an´ı parametru β a tak´e upravov´an´ı rozsahu parametru α, kter´ y se poˇc´ıt´ a pomoc´ı lok´aln´ıho SNR [3]. Bylo pomˇernˇe zloˇzit´e ide´alnˇe urˇcit parametry. Kdyˇz byl parametr β pˇr´ıliˇs vysok´ y, ˇsum nebyl odstranˇen dostateˇcnˇe a v pln´em rozsahu moˇznost´ı t´eto metody, kdyˇz byl naopak pˇr´ıliˇs mal´ y, ve v´ ysledn´e ˇreˇci se objevovali hudebn´ı t´ony. Nastaven´ı parametru β pro jednotliv´e ˇsumy a jednotliv´e hodnoty SNRin jsou uvedeny v Tab. 5. Rozsah parametru α jsem nastavil v rozmez´ı 1–3, u z´ aporn´ıch hodnot SNRin jsem zvyˇsoval rozsah na α = 1–4. To ˇc´asteˇcne utlmilo hudebn´ı t´ ony, avˇsak na u ´kor toho jemnˇe zkreslilo v´ ystupn´ı sign´al.

U kladn´ ych hodnot SNRin byl ˇsum mix´er potlaˇcen bez vedlejˇs´ıch efekt˚ u jako jsou hudebn´ı t´ony, prask´ an´ı nebo zkreslen´ı sign´ alu. U hodnoty SNRin = −5 (dB) byla kvalita sign´alu ovlivnˇena hudebn´ımi t´ ony a jemn´ ym zkreslen´ım ˇreˇci a n´ aslednˇe pak u hodnoty SNRin = −10 (dB) bylo zkreslen´ı znateln´e, ˇsum siln´ y a hudebn´ı t´ ony velmi ruˇsiv´e. Podobnˇe jako u pˇredoˇsl´e metody, i tato metoda mˇela nejvˇetˇs´ı probl´em s odstranˇen´ım ˇsumu z motoru auta. Po potlaˇcen´ı ˇsumu, kter´e nebylo velice u ´spˇeˇsn´e, vznikaly v nahr´avce hudebn´ı t´ony a hlavnˇe pˇri z´ aporn´ ych hodnot´ ach SNRin byly t´ ony velice ruˇsiv´e aˇz nepˇr´ıjemn´e. S klesaj´ıc´ımi hodnotami SNRin pomˇernˇe rychle klesala schopnost potlaˇcit ˇsum. Hodnoty SNRout jsou sice uspokojiv´e, ale to m˚ uˇze b´ yt zp˚ usobeno nepˇr´ıtomnost´ı hudebn´ıch t´on˚ u i pˇri vysok´e u ´rovn´ı ˇsumu. Po aplikaci metody na ˇreˇc znehodnocenou ˇsumem vrtaˇcky bylo slyˇset velmi ruˇsiv´e hudebn´ı t´ony, impulzn´ı ˇsumy nebyly potlaˇceny v˚ ubec, stejnˇe jako u pˇredoˇsl´e metody. Pomoc´ı parametr˚ u se dal regulovat pomˇer ˇsumu a hudebn´ıch t´onu ve v´ ystupn´ım sign´alu. Ide´aln´ı hodnoty parametru β byli nastaveny v rozmez´ı β = 0,06–0.09, v z´avislosti charakteru a u ´rovnˇe ˇsumu. Nastaven´ı bylo provedeno tak, aby byl co nejl´epe odstranˇen ˇsum a z´aroveˇ n nevznikaly hudebn´ı t´ony.

3.4

P´ asmov´ e spektr´ aln´ı odeˇ c´ıt´ an´ı

Pro testov´ an´ı metody je pouˇzit skript spectral pasmove.m. Parametr α byl nastaven v rozsahu 1–5, vˇetˇs´ı rozsah umoˇzn ˇuje rozdˇelen´ı sign´ alu na subp´asma a vyuˇzit´ı parametru δj . Hodnoty parametru β, v´ ysledn´e hodnoty SNRout a hodnocen´ı u ´spˇeˇsnosti metody je uvedeno v Tab. 6.

Metoda p´ asmov´eho spektr´ aln´ıho odeˇc´ıt´an´ı velice dobˇre potlaˇcila ˇsum v sign´alech s SNRin = 0– 10 (dB) a to bez n´ aznak˚ u hudebn´ıch t´on˚ u. Avˇsak, u niˇzˇs´ıch hodnot SNRin byl sign´al znehodnocen velice ruˇsiv´ ymi hudebn´ımi t´ ony, speci´ alnˇe u sign´alu znehodnocen´eho ˇsumem z motoru auta. V tomto pˇr´ıpadˇe byl sign´ al velice zkreslen´ y. Hodnoty parametru β, oproti modifikovan´e metodˇe spektr´aln´ıho 30

ˇ Sum

Mix´er

α

β

SNRin

SNRout

SNRE

SIG

BAK

MOS

-

-

(dB)

(dB)

(dB)

-

-

-

1-3

0.09

10

12,38

2,38

5

5

5

1-3

0.09

5

9,2

4,2

5

4

5

1-3

0.08

0

7,9

7,9

5

4

4

1-4

0.06

-5

5,21

10,21

4

3

4

1-4

0.05

-10

1,1

8,9

3

2

2

ˇ Sum

Auto

1-3

0.08

10

13,05

3,05

5

4

5

1-3

0.08

5

9,2

4,2

5

4

4

1-3

0.07

0

6,5

6,5

4

3

3

1-4

0.06

-5

4

9

4

2

3

1-4

0.05

-10

0,5

9,5

2

2

2

ˇ Sum

Sprcha

1-3

0.1

10

12,18

2,18

5

4

5

1-3

0.09

5

9,8

4,8

5

4

4

1-4

0.09

0

7,12

7,12

4

4

4

1-4

0.09

-5

4,15

9,15

4

3

3

1-4

0.07

-10

1,56

8,44

4

2

3

ˇ Sum

Vrtaˇcka

1-3

0.07

10

11,8

1,8

5

4

5

1-3

0.06

5

10

15

5

4

4

1-3

0.06

0

6,8

6,8

4

3

3

1-3.5

0.05

-5

4,7

9,7

3

3

3

1-4

0.05

-10

2,56

12,56

2

2

2

Tabulka 5: Pˇrehled v´ ystupn´ıch u ´daj˚ u, nastaven´ı parametr˚ u a hodnocen´ı metody modifikovan´eho spektr´ aln´ıho odeˇc´ıt´ an´ı.

31

ˇ Sum

Mix´er

α

β

SNRin

SNRout

SNRE

SIG

BAK

MOS

-

-

(dB)

(dB)

(dB)

-

-

-

1-5

0.05

10

11,73

1,73

5

4

5

1-5

0.05

5

10,6

5,6

5

4

4

1-5

0.09

0

7,9

7,9

5

3

4

1-5

0.1

-5

5,17

10,17

4

3

4

1-5

0.1

-10

1,99

11,99

3

2

2

ˇ Sum

Auto

1-5

0.07

10

11,3

1,3

5

5

5

1-5

0.01

5

10,6

5,6

5

4

4

1-5

0.01

0

6,4

6,4

4

4

4

1-5

0.01

-5

3,7

8,7

3

3

3

1-5

0.01

-10

1,01

11,01

2

2

2

ˇ Sum

Sprcha

1-5

0.09

10

11,74

1,74

5

4

4

1-5

0.09

5

10,2

5,2

5

3

4

1-5

0.08

0

8,3

8,3

4

3

4

1-5

0.07

-5

5,9

10,9

4

3

3

1-5

0.06

-10

2,3

12,3

4

2

3

ˇ Sum

Vrtaˇcka

1-5

0.09

10

11,8

1,8

5

4

5

1-5

0.09

5

10

5

5

4

4

1-5

0.08

0

6,8

6,8

4

3

3

1-5

0.07

-5

4,7

9,7

3

3

3

1-5

0.05

-10

2,56

7,44

2

2

2

Tabulka 6: Pˇrehled v´ ystupn´ıch hodnot, nastaven´ı parametr˚ u a hodnocen´ı metody p´asmov´eho spektr´ aln´ıho odeˇc´ıt´ an´ı.

32

odeˇc´ıt´ an´ı, jsem u vyˇsˇs´ıch hodnot SNRin nastavil na vyˇsˇs´ı hodnoty, protoˇze tato metoda l´epe odstranila ˇsum z pozad´ı. Proto jsem se snaˇzil, aby ve v´ ystupn´ım sign´alu nebyly ˇz´adne hudebn´ı t´ony a z´aroveˇ n ˇsum byl minim´ aln´ı. Na niˇzˇs´ıch hodnot´ ach jsem hodnoty β sniˇzoval, vzhledem k tomu, ˇze ˇsum i t´ony byly pomˇernˇe siln´e. Vyˇsˇs´ı hodnoty parametru β odstranily ˇsum z pozad´ı v´ıce neˇz zesilnily hudebn´ı t´ ony.

3.5

Spektr´ aln´ı odeˇ c´ıt´ an´ı pomoc´ı Minimum Mean Square Estimator

Parametry t´eto metody se nastavuj´ı pr˚ ubˇeˇznˇe podle rovnic (2.16) a (2.17). Skript spectral MMSE.m byl pouˇzit pro testov´ an´ı metody. Pˇrehled v´ ysledk˚ u je zobrazen v Tab. 7.

Algoritmus MMSE potlaˇcuje ˇsum u ´ˇcinnˇe, avˇsak hudebn´ı t´ony kter´e vznikaj´ı jsou ruˇsiv´e aˇz nepˇr´ıjemn´e, nˇekdy dokonce nepˇr´ıjemnˇejˇs´ı neˇz samotn´ y ˇsum a to u vˇsech hodnot SNRin a u vˇsech druh˚ u ˇsumu. 3.5.1

Zhrnut´ı v´ ysledk˚ u metod spektr´ aln´ıho odeˇ c´ıt´ an´ı

Na obr´ azku 12 m˚ uˇzeme vidˇet spektrogram zaˇsumˇen´e ˇreˇci ˇsumem mixer. Na dalˇs´ıch obr´azc´ıch (13, 14, 15, 16) pak vid´ıme spektrogramy zv´ yraznˇen´ ych sign´al˚ u pomoc´ı jednotliv´ ych metod spektr´aln´ıho odeˇc´ıt´an´ı. Metoda MMSE mˇela nejlepˇs´ı v´ ysledky co se t´ yˇce hodnot SNRout , avˇsak vytv´aˇrela siln´e hudebn´ı t´ony. Metoda p´ asmov´eho odeˇc´ıt´ an´ı je vhodn´ a na potlaˇcen´ı ˇsumu jen do hodnot SNRin = 0 (dB), pak uˇz sign´ al znehodnocuj´ı velmi siln´e hudebn´ı t´ ony a v´ ystupn´ı sign´al je zkreslen. Nejuniverz´alnˇejˇs´ı metoda je modifikovan´ a metoda spektr´ aln´ıho odeˇc´ıt´ an´ı, kter´a dosahuje dobr´e v´ ysledky aj u niˇzˇs´ıch hodnot SNRin a z´ aroveˇ n vytv´ aˇr´ı pomˇerne m´ alo hudebn´ıch t´on˚ u, kter´e jsou pˇrijateln´e oproti ostatn´ım metod´am. Z´ akladn´ı metoda spektr´ aln´ıho odeˇc´ıt´ an´ı dosahuje nejhorˇs´ı v´ ysledky, na druhou stranu je nejjednoduˇs´ı na implementaci a z´ aroveˇ n v´ ypoˇcetnˇe nejm´enˇe n´aroˇcn´a.

33

ˇ Sum

Mix´er

SNRin

SNRout

SNRE

SIG

BAK

MOS

(dB)

(dB)

(dB)

-

-

-

10

11,05

1,05

5

4

5

5

9,04

4,04

5

4

4

0

7,99

7,99

5

3

4

-5

6,52

11,52

4

3

3

-10

4,68

14,68

4

2

2

ˇ Sum

Auto

10

10,9

0,9

5

4

4

5

8,4

3,4

4

4

4

0

5,11

5,11

4

3

3

-5

2,17

7,17

3

2

3

-10

-1,4

11,4

2

2

2

ˇ Sum

Sprcha

10

11,1

1,1

5

4

5

5

8,72

3,72

5

4

4

0

5,7

5,7

4

3

3

-5

3,37

8,37

3

3

3

-10

0,04

10,04

3

2

2

ˇ Sum

Vrtaˇcka

10

11,3

1,3

5

5

5

5

8,6

3,6

5

3

4

0

7,3

7,3

4

3

4

-5

5,4

10,4

4

2

3

-10

3,3

13,3

4

2

2

Tabulka 7: Pˇrehled v´ ystupn´ıch hodnot a hodnocen´ı metody algoritmu MMSE.

34

Obr´ azek 12: Spektrogram zaˇsumˇen´e ˇreˇci ˇsumem mixer, SNRin = -5.

Obr´ azek 13: Spektrogram zv´ yraznˇen´e ˇreˇci pomoc´ı metody spektr´aln´ıho odeˇc´ıt´an´ı, ˇreˇc byla znehodnocena ˇsumem mixer, SNRin = -5.

35

Obr´ azek 14: Spektrogram zv´ yraznˇen´e ˇreˇci pomoc´ı modifikovan´e metody spektr´aln´ıho odeˇc´ıt´an´ı, ˇreˇc byla znehodnocena ˇsumem mixer, SNRin = -5.

Obr´ azek 15: Spektrogram zv´ yraznˇen´e ˇreˇci pomoc´ı metody p´asmov´eho spektr´aln´ıho odeˇc´ıt´an´ı, ˇreˇc byla znehodnocena ˇsumem mixer, SNRin = -5.

36

Obr´ azek 16: Spektrogram zv´ yraznˇen´e ˇreˇci pomoc´ı algoritmu MMSE spektr´aln´ıho odeˇc´ıt´an´ı, ˇreˇc byla znehodnocena ˇsumem mixer, SNRin = -5.

3.6

Wiener˚ uv filtr

Princip Wienerova filtra byl podrobnˇeji uveden v kapitole 2. K testov´ani filtra byl pouˇzit skript wiener.m. Simulace probˇehli rovnako jako u metod spektr´aln´ıho odeˇc´ıt´an´ı, v´ ysledky jsou uvedeny v Tab. 8

Wiener˚ uv filtr byl u ´speˇsn´ y z hlediska potlaˇcen´ı ˇsumu, kter´e bylo opravdu kvalitn´e, ale jen pˇri niˇzˇs´ıch u ´rovn´ıch ˇsumu. Velk´ y probl´em Wienerove filtrace vˇsak spoˇc´ıv´a v potl´aˇcen´ı ˇreˇci na frekvenc´ıch, ve kter´ ych se nach´ azej´ı siln´e ˇsumov´e sloˇzky, nebo kde se nach´az´ı ˇreˇc s n´ızkou amplitudou. V tomto pˇr´ıpadˇe je ˇreˇc potlaˇcena spolu ze ˇsumem nebo ˇsum nen´ı potlaˇcen v˚ ubec. To zp˚ usobuje zkreslen´ı ˇreˇci ve v´ ystupn´ım sign´ alu, kter´e se zhorˇsuje se silnˇej´ıc´ım ˇsumem. Tento efekt je ˇc´asteˇcnˇe vidˇet pˇri porovnan´ı Obr. 17 a Obr. 18. Nejvˇetˇs´ı probl´emy Wienerove filtraci dˇelaly ˇsumy vrtaˇcka a sprcha, kter´e maj´ı energii je rozloˇzenou v ˇsirˇs´ım frekvenˇcn´ım p´ asme. U z´ aporn´ ych hodnot SNRin byl vytvoˇren v pozad´ı nov´ y ˇsum, kter´ y byl hodnˇe ruˇsiv´ y a nepˇr´ıjemn´ y. Sign´ aly pˇred/po zv´ yraznˇen´ı Wienerovou filtrac´ı jsou na Obr. 19, Obr. 20 a Obr. 21.

37

ˇ Sum

Mix´er

SNRin

SNRout

SNRE

SIG

BAK

MOS

(dB)

(dB)

(dB)

-

-

-

10

10,45

0,45

4

5

5

5

8,7

3,7

5

4

4

0

7,2

7,2

5

3

3

-5

6,01

11,01

2

3

2

-10

3,5

13,5

1

2

1

ˇ Sum

Auto

10

10,57

0,57

5

5

5

5

8,2

3,2

4

4

4

0

5,7

5,7

3

4

3

-5

4,6

9,6

3

3

3

-10

3,1

13,1

2

3

2

ˇ Sum

Sprcha

10

11,03

1,03

4

5

5

5

9,2

4,2

4

4

4

0

8,2

8,2

3

3

3

-5

5,9

10,9

2

2

2

-10

2,1

12,1

1

1

1

ˇ Sum

Vrtaˇcka

10

10,8

0,8

4

5

4

5

8,5

3,5

3

4

4

0

7,1

7,1

3

3

3

-5

4,7

9,7

2

3

3

-10

2,05

12,05

1

1

1

Tabulka 8: Pˇrehled v´ ystupn´ıch hodnot a hodnocen´ı Wienerove filtrace.

38

Obr´ azek 17: Spektrogram nezaˇsumˇen´e ˇreˇci.

Obr´ azek 18: Spektrogram zv´ yraznˇen´e ˇreˇci pomoc´ı Wienerova filtru, ˇreˇc byla znehodnocena ˇsumem mixer, SNRin = 0.

39

Obr´ azek 19: Spektrogram zaˇsumˇen´e ˇreˇci (hoˇre) a spektrogram zv´ yraznˇen´e ˇreˇci pomoc´ı Wienerova filtru (dole), ˇreˇc byla znehodnocena ˇsumem vrtaˇcka, SNRin = -10.

40

Obr´ azek 20: Spektrogram zaˇsumˇen´e ˇreˇci (hoˇre) a spektrogram zv´ yraznˇen´e ˇreˇci pomoc´ı Wienerova filtru (dole), ˇreˇc byla znehodnocena ˇsumem sprcha, SNRin = -10.

41

Obr´ azek 21: Spektrogram zaˇsumˇen´e ˇreˇci (hoˇre) a spektrogram zv´ yraznˇen´e ˇreˇci pomoc´ı Wienerova filtru (dole), ˇreˇc byla znehodnocena ˇsumem auta, SNRin = 0.

42

Z´ avˇ er C´ılem t´eto pr´ ace bylo sezn´ amit se s jednokan´alov´ ymi metodami pro zv´ yrazˇ nov´an´ı ˇreˇci, implementovat vybran´e metody v prostˇred´ı Matlab a porovnat je. V t´eto pr´ aci byl pops´ an proces pˇredzpracov´an´ı ˇreˇci, detektor ˇreˇcov´e aktivity a vybran´e jednokan´ alov´e metody pro zpracov´ an´ı ˇreˇci. Konkr´etnˇe bylo zpracovan´e Wienerovo filtrov´an´ı, spektr´aln´ı odeˇc´ıt´ an´ı, modifikovan´e spektr´ aln´ı odeˇc´ıt´an´ı, p´asmov´e spektr´aln´ı odeˇc´ıt´an´ı a spektr´aln´ı odeˇc´ıt´ an´ı MMSE. Pro testov´ an´ı implementovan´ ych metod zpracov´an´ı ˇreˇci byly v MATLABu vytvoˇren´e skripty pro jednotliv´e metody, pro proces pˇredzpracov´an´ı a detektor ˇreˇcov´e aktivity. Byla zvolena nahr´avka s muˇzsk´ ym hlasem, kter´ a byla n´ aslednˇe zaˇsumˇena 4 druhy ˇsumu. V´ ysledky testov´an´ı byly zpracov´any a jsou uvedeny v posledn´ı ˇc´ asti pr´ ace. Pro hodnocen´ı v´ ysledk˚ u byla zvolena jedna subjektivn´ı metoda a jedna objektivn´ı metoda hodnocen´ı ˇreˇci. Nejuniverz´ alnˇejˇs´ı metodou se uk´ azalo modifikovan´e spektr´aln´ı odeˇc´ıt´an´ı, kter´e dosahovalo dobr´e v´ ysledky u vˇsech testovan´ ych ˇsum˚ u na vˇsech u ´rovn´ıch. Nej´ uˇcinnˇeji odstraˇ novaly ˇsum Wiener˚ uv filtr a metoda spektr´ aln´ıho odeˇc´ıt´ an´ı MMSE, kter´e ale zp˚ usobovaly nepˇr´ıjemn´e hudebn´ı t´ony v pˇr´ıpadˇe spektr´ aln´ıho odeˇc´ıt´ an´ı MMSE a nepˇr´ıjemn´e zkreslen´ı sign´alu v pˇr´ıpadˇe Wienerova filtru. Nejhorˇs´ı v´ ysledky dos´ ahla metoda spektr´ aln´ıho odeˇc´ıt´an´ı. Metoda zpracov´ an´ı ˇreˇci pomoc´ı Wienerova filtra nen´ı pˇr´ıliˇs vhodn´a pro potlaˇcov´an´ı ˇsumu vzhledem k zkreslen´ı v´ ysledn´ıho sign´ alu. Vhodn´e by bylo pouˇz´ıt nˇekter´e modifikovan´e metody, kter´e ˇreˇs´ı zkreslen´ı v´ ysledn´eho sign´ alu, napˇr. Iterativn´ı Wiener˚ uv filtr.

43

Reference ¨ ˇ ´ V. Mluv´ıme s poˇc´ıtaˇcem ˇcesky. 1. vyd´an´ı, [1] PSUTKA, J., MULLER, L., MATOUSEK, J., RADOVA, Praha: Academia, 2006. 752 s. ISBN 80-200-1309-1. [2] HOVORKA, M. Algoritmy spektr´ aln´ıho odeˇc´ıt´ an´ı pro zv´yraznˇen´ı reˇci v bojov´ych p´ asov´ych vozidlech. Elektrorevue.cz [online]. 2009. 35 s. ISSN 1213-1539. Dostupn´e na URL: Eletrorevue.cz [3] DELLER, J.R., HANSEN, J.H.L., PROAKIS, J.G. Discrete-Time Processing of Speech Signal. 1. vyd´ an´ı, New York (IEEE Press), 2000. 908 p. ISBN 0-7803-5386-2. [4] PROAKIS, J.G., MANOLAKIS, D.G. Digital Signal Processing - Principles, Algorithms and Applications. Prentice Hall, New Jersey 1996. ISBN 0-13-373762-L. [5] ADAMEC, M. Modern´ı rozpozn´ avaˇce ˇreˇcov´e aktivity. Diplomov´a pr´ace Brno: Vysok´e u ´ˇcen´ı tech´ nick´e v Brnˇe. Fakulta elektrotechniky a komunikaˇcn´ıch technologi´ı. Ustav telekomunikac´ı, 2008. 75 s. [6] SAKHNOV, K., VERTELETSKAYA, E., SIMAK B. Dynamical Energy-based Speech/Silence Detector for Speech Enhancement Applications. 1. vyd´an´ı, Proc. of WCE, 2009. World Congress of Engineering. [7] MANOHAR, K. Spectral Subtraction Method for Speech Enhancement. M.Tech thesis, Department of Electrical Engineering, I.I.T Bombay, Mumbai, India, 2002. ´ ˇ ıslicov´e zpracov´ [8] SMEKAL, Z. C´ an´ı ˇreˇci. Elektronick´a skripta pro magistersk´a studia, Vysok´e uˇcen´ı ´ technick´e v Brnˇe, Fakulta elektrotechniky a komunikaˇcn´ıch technologi´ı. Ustav telekomunikac´ı, 2009. [9] BOLL, S.F. Suppression of acoustic noise in speech using spectral subtraction. IEEE Trans. Acoust., Speech, Signal Process., vol. 27, pp. 113–120, Apr. 1979. [10] BEROUTI, M., SCHWARTZ, R., MAKHOUL, J. Enhancement of speech corrupted by acoustic noise. Proc. IEEE Int. Conf. Acoust., Speech, Signal Process., pp. 208–211, Apr. 1979. [11] KAMATH, S., LOIZOU,P. A multi-band spectral subtraction method for enhancing speech corrupted by colored noise. Proc. IEEE Int. Conf. Acoust. Speech Signal Process, 2002. ˇ ıslicov´ [12] JAN, J. C´ a filtrace, anal´yza a restaurace sign´ al˚ u. Brno: Vysok´e uˇcen´ı technick´e v Brnˇe, 2002. ISBN 80-214-1558-4. [13] WIENER, N. Extrapolation, Interpolation, and Smoothing of Stationary Time Series. New York: Wiley, ISBN 0-262-73005-7.

44

[14] ITU-T Rec.P.800. Series P: Telephone transmission quality. Methods for subjective determination of transmission quality. ITU.int [online]. 1996. Dostupn´e na URL: www.itu.int.

45

Seznam pouˇ zit´ ych veliˇ cin, symbol˚ u a zkratek

DFT

diskr´etn´ı Fourierova transformace

FFT

rychl´ a Fourierova transformace

IFFT

rychl´ a inverzn´ı Fourierova transformace

SNR

odstup sign´ al˚ u od ˇsumu

VAD

detektor ˇreˇcov´e aktivity

αp

subtrakˇcn´ı parametr

δp

pˇr´ıdavn´ y subtrakˇcn´ı parametr

d(n)

aditivn´ı nekorelovan´ y ˇsum

D(ω)

modul spektra ˇsumu

ˆ D(ω)

modul odhadu spektra ˇsumu

Dw

spektrum ˇsumu

D(.)

rozptyl veliˇciny

E

energie aktu´ aln´ıho segmentu

Es eg

kr´ atkodob´ a energie segmentu

E (.)

stˇredn´ı hodnota veliˇciny

Ey

energie ˇreˇci

En

energie ˇsumu

Ep

prahov´ a energie

Ed0

prahov´ a energie

H(ω)

Wiener˚ uv korekˇcn´ı faktor

Mn

kr´ atkodob´ a intenzita segmentu

s(n)

ˇcist´ a ˇreˇc

S(ω)

modul spektra ˇcist´e ˇreˇci

ˆ S(ω)

modul odhadu spektra ˇcist´e ˇreˇci

tr

hodnota prahu

t

ˇcas

w[n]

diskr´etn´ı v´ ahov´ ac´ı funkce

y(n)

zaˇsumˇen´ a ˇreˇc

Y (ω)

modul spektra zaˇsumˇen´e ˇreˇci

Yˆ (ω)

modul odhadu spektra zaˇsumˇen´e ˇreˇci

γp

subtrakˇcn´ı parametr

46

Life Enjoy

" Life is not a problem to be solved but a reality to be experienced! "

Get in touch

Social

© Copyright 2013 - 2019 TIXPDF.COM - All rights reserved.