FI110726B - Äänen aktiivisuuden ilmaisu - Google Patents

Äänen aktiivisuuden ilmaisu Download PDF

Info

Publication number
FI110726B
FI110726B FI904410A FI904410A FI110726B FI 110726 B FI110726 B FI 110726B FI 904410 A FI904410 A FI 904410A FI 904410 A FI904410 A FI 904410A FI 110726 B FI110726 B FI 110726B
Authority
FI
Finland
Prior art keywords
signal
speech
coefficients
filter
noise
Prior art date
Application number
FI904410A
Other languages
English (en)
Swedish (sv)
Other versions
FI904410A0 (fi
Inventor
Daniel Kenneth Freeman
Ivan Boyd
Original Assignee
British Telecomm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB888805795A external-priority patent/GB8805795D0/en
Priority claimed from GB888813346A external-priority patent/GB8813346D0/en
Priority claimed from GB888820105A external-priority patent/GB8820105D0/en
Application filed by British Telecomm filed Critical British Telecomm
Publication of FI904410A0 publication Critical patent/FI904410A0/fi
Application granted granted Critical
Publication of FI110726B publication Critical patent/FI110726B/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

1 110726 Äänen aktiivisuuden ilmaisu - Detektion av röstaktivitet Äänen aktiivisuuden ilmaisin on laite, jolle syötetään signaali puhejaksojen tai vain kohinaa sisältävien jaksojen ilmaisemista varten. Vaikka esillä oleva kek-5 sintö ei rajoitu tähän, tällaisten ilmaisinten eräänä erikoisen mielenkiintoisena sovelluskohteena ovat matkaradiopuhelinjärjestelmät, joissa puhekooderi voi käyttää tietoa puheen esiintymisestä tai puuttumisesta parantamaan radio-spektrin hyväksikäyttöä ja joissa myös kohinataso (kulkuvälineeseen asennetusta yksiköstä) on todennäköisesti suuri.
10 Äänen aktiviisuuden ilmaisun olennaisena sisältönä on löytää mitta, joka eroaa selvästi puhejaksoilla ja puheettomilla jaksoilla. Puhekooderin sisältävässä laitteessa kooderin eri asteista voidaan saada helposti useita parametrejä ja tarvittavaa prosessointia on tämän vuoksi suotavaa vähentää käyttämällä 15 jotakin tällaista parametria. Monissa ympäristöissä pääkohinalähteet esiintyvät taajuusspektrin määrätyillä tunnetuilla alueilla. Esimerkiksi liikkuvassa autossa suuri osa kohinasta (esim. moottorin melu) keskittyy spektrin pien-taajuisille alueille. Kun tällaista tietoa kohinan spektriasemasta on käytettä- · vissä, päätös puheen esiintymisestä tai puuttumisesta on edullista perustaa 20 mittauksiin, jotka on suoritettu spektrin siinä osassa, joka sisältää suhteelli-··; sen vähän kohinaa. Käytännössä olisi luonnollisesti mahdollista suodattaa ·;;; signaali ennakolta ennen puheen aktiivisuuden ilmaisemiseksi suoritettua analyysia, mutta silloin kun äänen aktiivisuuden ilmaisin seuraa puhekooderin lähtöä, esisuodatus vääristäisi koodattavaa äänisignaalia.
25
Keksintö kohdistuu siten patenttivaatimuksen 1 johdanto-osan mukaiseen äänen aktiivisuuden ilmaisinlaitteeseen, jolle on tunnusomaista se, että laite sisältää analyysivälineet tuottamaan sellaisen suotimen kertoimet, jonka ' spektrivaste on käänteinen mainituista kahdesta signaalista yhden taajuus- .... 30 spektrille; ja mitan muodostavat välineet kykenevät muodostamaan mitan M, ; .· joka on suhteessa sellaisen signaalin nollakertaluvun autokorrelaatioon (R’0), > · 2 110726 joka signaali on saatu suodattamalla mainituista kahdesta signaalista jäljelle jäävää signaalia suodattimena, jolla on mainitut kertoimet.
Mitta on edullisesti Itakura-Saito-vääristymämitta.
5
Keksintö kohdistuu myös menetelmään äänen aktiivisuuden ilmaisemiseksi sekä laitteeseen puhesignaalien koodaamiseksi ja matkapuhelinlaitteeseen. Näiden keksintöjen tunnusomaiset piirteet selviävät itsenäisistä vaatimuksista 15,16 ja 17.
10
Esillä olevan keksinnön muut muodot ovat patenttivaatimuksissa määritellyn mukaisia.
Keksinnön eräitä suoritusmuotoja selitetään seuraavassa esimerkkeinä ohei-15 siin piirustuksiin viitaten, joissa:
Kuvio 1 on lohkokaavio keksinnön ensimmäisestä suoritusmuodosta.
' · * · ^ Kuvio 2 esittää keksinnön toista suoritusmuotoa.
: 20 ' ·; Kuvio 3 esittää keksinnön kolmatta edullista suoritusmuotoa.
!" Keksinnön ensimmäisen suoritusmuodon mukaisen ensimmäisen äänen aktii visuuden ilmaisimen perustana oleva yleinen periaate on seuraava.
25
Kehyksestä, jossa on n signaalinäytettä (so, Si, S2, s3, S4... Sn-1), saadaan, kun se johdetaan neljännen kertaluvun äärellisen impulssivasteen (FIR) digitaalisen laskentasuotimen kautta, jonka impulssivaste on (1, ho, hi, h2, h3), ' tuloksena suodatettu signaali (kun näytteet aikaisemmista kehyksistä jäte- .... 30 tään huomiotta) s’ = (so), ; (si + hoSo), > 3 110726 (s2 + hosi + hiso), (S 3 + hoS2 + hlSl + h2So) (S 4 + hoS3 + hlS2 + h2Sl + hiso), (S 5 + hoS4 + hlS3 + h2S2 + h3Sl), (S 6 + hoS5 + hlS4 + h2S3 + h3S2)/ (S7 .··)
Kertaluvun nolla autokorrelaatiokerroin on termien neliösumma, joka voidaan normalisoida ts. jakaa termien kokonaislukumäärällä (kehysten ollessa vakiopituisia jakolasku on helpointa jättää pois). Suodatetun signaalin kerroin on siten n-1 R'o = (s'i)2 i = 0 ja tämä muodostaa siten mitan laskennallisen suodatetun signaalin s'- toisin sanoen laskentasuotimen päästökaistan sisälle osuvan signaalin s osan - teholle.
Kun lauseke ratkaistaan, saadaan jätettäessä 4 ensimmäistä termiä huomiotta ”1. s’o ’ (S4 * »0*3 * »1*2 * V: * Vo)2 + (*5 * V»+ "Λ * V:* »3si)2 + ...
* *4 * »0*4*3 + »1*4*2 * V4*l * »3*4*0 * "0*4*3 *4*0 * »0»1*3*2 * »0»2*3*1 * ty>3*3*0 * »1*4*2 * »0»iS3*2 + »1*2 * »1»2*2S1 + »AVa * ”2*4*1 * Vl*j*l * »lV2*l * »2*1 * !>2·»3*1*0 4 110726 + il3Vo + V3V0 + *1l‘13S2S0 + V3S Λ + h3S0 + · ' « 3 S0 (1 + h0+ "r h2' h3} + sx (2»0 + 2Vl + 2tllh2 + ^31 + R2 (2hj_ * »J&3 + 21^) + s3 (2¾ * a0n3) r (21l3) R'o voidaan siten saada autokorrelaatiokertoimien Ri yhdistelmästä painotettuina suluissa olevilla vakioilla, jotka määräävät taajuuskaistan, jossa kertoimen R'o arvo vaikuttaa. Suluissa olevat termit ovat itse asiassa laskentasuotimen impulssivasteen autokorrelaatiokertoimia, joten edellä esitetty lauseke voidaan yksinkertaistaa muotoon » »
H
;'i! *·ο * *oV *Σ!*α..............111 ··· i » 1 ♦ « 4 « missä N on suotimen kertaluku ja Hi ovat suotimen impulssi-,··. vasteen (normalisoimattomia) autokorrelaatikertoimia.
Toisin sanoen signaalin suodatuksen vaikutusta signaalin autokorrelaatiokertoimiin voidaan simuloida muodostamalla (suodattamattoman) signaalin autokorrelaatiokertoimien painotettu summa käyttämällä impulssivastetta, joka vaaditulla suotimella olisi ollut.
Suhteellisen yksinkertainen algoritmi, jossa käytetään vain vähän kertolaskutoimituksia, voi siten simuloida digitaalisen suotimen vaikutusta, jossa tarvitaan tyypillisesti sata kertaa 5 110726 tämä lukumäärä kertolaskutoimituksia.
Suodatustoimitusta voidaan vaihtoehtoisesti tarkastella sen muotoisena spektrivertailuna, jossa signaalispektriä verrataan vertailuspektriin (laskentasuotimen vasteen käänteisarvoon). Koska laskentasuodin valitaan tässä sovelluksessa siten, että se approksimoi kohinaspektrin käänteisarvoa, tämä toimitus voidaan katsoa puhe- ja kohinaspektrien spektrivertailuksi ja siten kehitetty nollas autokorrelaatiokerroin (ts. käänteis-suodatetun signaalin energia) voidaan katsoa spektrien erilaisuuden mitaksi. Itakura-Saito-mittaa käytetään lineaaripredik-tiokoodauksessa LPC prediktorisuotimen ja tulospektrin välisen yhteensopivuuden arvioimiseksi ja se voidaan ilmaista eräässä muodossa
N
M = Vo + ^ 8iAi' ui missä Ao jne. ovat LPC-parametrijoukon autokorrelaatioker-toimia. Havaitaan, että lauseke on hyvin samankaltainen kuin edellä johdettu riippuvuus ja kun muistetaan, että LPC-kertoimet ovat sellaisen FIR-suotimen tappeja, jolla on ··· tulosignaalin käänteinen spektrivaste, niin että LPC-kerroin- 1 > · · . " joukko on käänteisen LPC-suotimen impulssivaste, on ilmeistä, /:·. että Itakura-Saito-vääristymämitta on itse asiassa vain yhtälön 1 sellainen muoto, jossa suotimen vaste H on tulosignaalin pelkkiä napoja sisältävän mallin spektrimuodon käänteisarvo.
Itse asiassa on myös mahdollista muuntaa spektrit käyttämällä testispektrin LPC-kertoimia ja vertailuspektrin autokor-relaatiokertoimia erilaisen mitan saamiseksi spektrien saman-; laisuudelle.
6 110726
Vector Quantisation", IEEE Trans on ASSP, Voi ASSP-28, No 5, lokakuu 1980.
Koska signaalikehyksillä on vain äärellinen pituus ja tietty lukumäärä termejä (N, missä N on suotimen kertaluku) jätetään ottamatta huomioon, edellä esitetty tulos on vain likiarvo. Se antaa kuitenkin hämmästyttävän hyvän ilmaisun puheen esiintymisestä tai puuttumisesta ja sitä voidaan siten käyttää mittana M puheen ilmaisussa. Ympäristössä, jossa kohinaspektri on hyvin tunnettu ja muuttumaton, on täysin mahdollista käyttää yksinkertaisesti kiinteitä kertoimia ho, hi jne. käänteisen kohina-suotimen mallintamiseksi.
Kuitenkin sellaista laitetta, joka voi adaptoitua erilaisiin kohinaympäristöihin, voidaan käyttää yleisemmin.
Kuten kuviosta 1 ilmenee, ensimmäisessä suoritusmuodossa mikrofonista (ei esitetty) tuleva signaali vastaanotetaan tulossa 1 ja muunnetaan digitaalisiksi näytteiksi s sopivalla : näytteenottotaajuudella analogia-digitaalimuuntimella 2. LPC- ·’· analyysiyksikkö 3 (sisältyy tunnetun tyyppiseen LPC-kooderiin) johtaa tällöin n (esim. 160) näytteen peräkkäisille kehyksille joukon N (esim. 8 tai 12) LPC-suodinkertoimia Li, jotka siirretään edustamaan tulevaa puhetta. Puhesignaali s syötetään « « ! myös korrelaattoriyksikölle 4 (sisältyy normaalisti osana LPC- < i kooderiin 3, koska myös puheen autokorrelaatiovektori Ri kehitetään LPC-analyysin yhtenä vaiheena, vaikka on selvää, että myös erillistä korrelaattoria voitaisiin käyttää). Korrelaattori 4 kehittää autokorrelaatiovektorin Ri, johon sisältyy nollakertaluvun korrelaatiokerroin Ro ja ainakin kaksi muuta autokorrelaatiokerrointa Ri, R2, R3. Ne syötetään tämän j>’ jälkeen kertojayksikölle 5.
>
Toinen tulo 11 on kytketty toiseen mikrofoniin, joka on kaukana '* puhujasta siten, että tämä mikrofoni vastaanottaa vain tausta- 7 11072ο kohinaa. Tästä mikrofonista tuleva tulo muunnetaan AD-muuntimella 12 digitaaliseksi tulonäytejonoksi ja se LPC-analysoidaan toisella LPC-analysaattorilla 13. Analysaattorista 13 kehitetyt ”kohina,,-LPC-kertoimet johdetaan korrelaattori-yksikölle 14 ja siten kehitetty autokorrelaattorivektori kerrotaan termeittäin puhemikrofonista tulevan tulosignaalin autokorrelaatiokertoimien Ri kanssa kertojassa 5 ja siten kehitetyt painotetut kertoimet yhdistetään summaimessa 6 yhtälön 1 mukaan, jotta saataisiin suodinvaikutus, jolla on pelkkää kohinaa havaitsevan mikrofonin kohinaspektriin (joka on käytännössä sama kuin kohinaspektrin muoto signaalin ja kohinan vastaanottavassa mikrofonissa) nähden käänteinen muoto ja joka siten suodattaa pois suurimman osan kohinasta. Tuloksena olevaa mittaa M verrataan kynnysarvoon kynnysarvopiirissä 7 logiikka-lähdön 8 kehittämiseksi, joka ilmaisee puheen esiintymisen tai puuttumisen. Jos M on suuri, puheen katsotaan esiintyvän.
Tämä suoritusesimerkki vaatii kuitenkin kaksi mikrofonia ja kaksi LPC-analysaattoria, mikä lisää tarvittavan laitteiston kustannuksia ja monimutkaisuutta.
Toisessa suoritusmuodossa käytetään vaihtoehtoisesti vastaavaa mittaa, joka muodostettu käyttämällä kohinamikrofonista 11 saatuja autokorrelaatioita ja päämikrofonista 1 saatuja LPC-kertoimia, joten ylimääräisen LPC-analysaattorin sijasta tarvitaan ylimääräinen autokorrelaattori.
Nämä suoritusmuodot voivat siten toimia erilaisissa ympäristöissä, joissa esiintyy kohinaa eri taajuuksilla, tai kohina-spektrin muuttuessa määrätyssä ympäristössä.
Kuten kuviosta 2 ilmenee, keksinnön eräässä edullisessa suoritusmuodossa on puskuri 15, johon on tallennettu LPC-kerroin-joukko (tai joukon autokorrelaatiovektori), joka on johdettu mikrofonitulosta 1 sellaisen jakson aikana, joka on tunnistettu 3 1Ί 0726 "puheettomaksi" jaksoksi (ts. pelkäksi kohinajaksoksi). Näitä kertoimia käytetään tämän jälkeen mitan johtamiseksi käyttämällä yhtälöä 1, joka mitta myös tietenkin vastaa Itakura-Saito-vääristymämittaa, paitsi että tällöin käytetään yhtä tallennettua LPC-kerrointen kehystä, joka vastaa käänteisen kohinaspektrin approksimaatiota, eikä sen hetkistä LPC-kerrointen kehystä.
Analysaattorin 3 antama LPC-kerroinvektori johdetaan myös korrelaattorille 14, joka muodostaa LPC-kerroinvektorin autokorrelaatiovektorin. Kynnysarvopiirin 7 puhe/puheeton-lähtö ohjaa puskurimuistia 15 sillä tavalla, että puskuri säilyttää "puhekehysten" aikana "kohinan" autokorrelaatioker-toimet, mutta "kohinakehysten" aikana voidaan käyttää uutta LPC-kerrointen joukkoa puskurin päivittämiseksi, esimerkiksi monikkokytkimellä 16, jonka välityksellä korrelaattorin 14 lähdöt, joissa kussakin on autokorrelaatiokerroin, on kytketty puskuriin 15. On selvää, että korrelaattori 14 voitaisiin sijoittaa puskurin 15 jälkeen. Lisäksi puhe/puheeton-päätöstä kerrointen päivittämiseksi ei tarvitse tehdä lähdöstä 8, vaan se voitaisiin johtaa (ja edullisesti johdetaan) muulla tavalla.
• ’·' Koska puheettomia jaksoja esiintyy usein, puskuriin tallennetut _ LPC-kertoimet tulevat päivitetyiksi ajoittain, niin että laite kykenee siten seuraamaan kohinaspektrin muutoksia. On selvää että tällainen puskurin päivitys saattaa olla tarpeen vain satunnaisesti tai se voi tapahtua vain kerran ilmaisimen toiminan alussa, jos (kuten usein on asianlaita) kohinaspektri on ajallisesti suhteellisen muuttumaton, mutta matkaradio-puheiinympäristossä usein tapahtuva päivitys on edullisempi.
Tämän suoritusesimerkin eräässä muunnoksessa järjestelmä käyttää aluksi yhtälöä 1 kerrointermien vastatessa yksinkertaista kiinteää ylipäästösuodinta ja tämän jälkeen järjestelmä alkaa adaptoitua siirtymällä käyttämään "kohinajakson" LPC- 9 110726 kertoimia. Jos puheenilmaisu jostakin syystä epäonnistuu, järjestelmä voi palata käyttämään yksinkertaista ylipäästö-suodinta.
Edellä esitetty mitta voidaan normalisoida jakamalla arvolla Ro, niin että lauseke, jota verrataan kynnysarvoon, on muodoltaan N RjA, M = A0 + 2Σ- 1=1 Rq Tämä mitta on riippumaton kehyksen kokonaissignaalienergiasta ja kokonaissignaalitason muutokset on siten kompensoitu siinä, mutta se antaa heikomman kontrastin "kohina-" ja "puhetasojen" välillä ja sitä ei tämän vuoksi edullisimmin käytetä erittäin häiriöllisissä ympäristöissä.
Sen sijaan että käytettäisiin LPC-analyysiä kohinasignaalin känteisen suotimen kertoimien johtamiseen (joko kohinamikro-fonista tai pelkkää kohinaa sisältävistä jaksoista, kuten edellä selitetyissä eri esimerkeissä), käänteinen kohinaspektri • . on mahdollista mallintaa käyttämällä tunnetun tyyppistä adaptiivista suodinta. Koska kohinaspektri muuttuu vain hitaasti (kuten seuraavassa selitetään), tällaisissa suotimissa tavallinen suhteellisen hidas kertoimien adaptoitumisnopeus voidaan hyväksyä. Eräässä suoritusmuodossa, joka vastaa kuviota 1, LPC-analyysiyksikkö 13 korvataan yksinkertaisesti adaptii-: : visella suotimella (esimerkiksi FIR-poikittaissuotimella tai verkkosuotimella), joka on kytketty siten, että se tekee tulevan kohinan valkoisemmaksi mallintamalla käänteistä suodinta, ja sen kertoimet syötetään kuten edellä autokorre-. laattorille 14.
’·;·* Eräässä toisessa suoritusmuodossa, joka vastaa kuvion 2 10 110726 suoritusmuotoa, LPC-analyysiväline 3 on korvattu tällaisella adaptiivisella suotimella, ja puskuriväline 15 jätetään pois, mutta kytkin 16 toimii siten, että se estää adaptiivista suodinta adaptoimasta kertoimiaan puhejaksojen aikana.
Seuraavassa selitetään toista äänen aktiivisuuden ilmaisinta, joka on tarkoitettu käytettäväksi keksinnön erään toisen suoritusmuodon yhteydessä.
Edellä olevan perusteella on selvää, että LPC-kerroinvektori on yksinkertaisesti sellaisen FIR-suotimen impulssivaste, jonka vaste approksimoi tulosignaalin käänteistä spektrimuotoa. Kun muodostetaan viereisten kehysten välinen Itakura-Saito-vääristymämitta, tämä on itse asiassa yhtä suuri kuin signaalin teho edellisen kehyksen LPC-suotimen suodattamana. Siten jos viereisten kehysten spektrit erovat vähän, vastaava pieni päärä kehyksen spektritehosta jää suodattamatta ja mitta on pieni. Vastaavasti kehysten välinen suuri ero kehittää suuren Itakura-Saito-vääristymämitan, niin että mitta kuvastaa vierekkäisten kehysten spektraalista samankaltaisuutta. Puhekooderissa on toivottavaa minimoida datataajuus, joten kehyksen pituus tehdään niin suureksi kuin mahdollista. Toisin sanoen jos kehyksen pituus on tarpeeksi suuri, tällöin puhesignaalissa olisi esiinnyttävä huomattava spektrimuutos kehysten välillä :* (jos näin ei ole, kyseessä on ylimääräkoodaus). Kohinalla on toisaalta spektrimuoto, joka vaihtelee hitaasti kehyksestä toiseen, ja siten jaksolla, jossa signaalissa ei esiinny puhetta, Itakura-Saito-vääristymämitta on siten vastaavasti pieni - koska aikaisemman kehyksen Käänteisen LPC-suotimen käyttäminen "suodattaa pois" suurimman osan kohinatehosta.
Itakura-Saito-vääristymämitta ajoittaista puhetta sisältävän kohinaisen signaalin vierekkäisten kehysten välillä on tyypillisesti suurempi puhejaksojen aikana kuin kohinajaksojen aikana. Vaihtelun aste (standardipoikkeaman kuvaamana) on myös 11 110726 suurempi ja vähemmän ajoittain vaihteleva.
On huomattava, että mitan M standardipoikkeaman standardi-poikkeama on myös luotettava mitta. Kunkin standardipoikkeaman muodostamisen vaikutus itse asiassa tasoittaa mittaa.
Tässä äänen aktiivisuuden ilmaisimen toisessa muodossa mitattu parametri, jota käytetään päätettäessä esiintyykö puhetta, on edullisesti Itakura-Saito-vääristymämitan standardipoikkeama, mutta myös muita vaihtelumittoja ja muita spektrivääristymän mittoja (jotka perustuvat esimerkiksi FFT-analyysiin) voitaisiin käyttää.
Adaptiivisen kynnyksen käyttö äänen aktiivisuuden ilmaisussa on havaittu edulliseksi. Tällaisia kynnyksiä ei saa asetella puhejaksojen aikana tai muuten puhesignaali tulee leikatuksi. Kynnyksenadaptointipiiriä on tämän vuoksi ohjattava käyttämällä puhe/puheeton-ohjaussignaalia ja tämän ohjaussignaalin tulisi edullisesti olla kynnyksenadaptointipiirin lähdöstä riippumaton .
Kynnys T asetellaan adaptiivisesti siten, että kynnysarvo , pidetään juuri mitan M tason yläpuolella pelkän kohinan ’· ; esiintyessä. Koska mitta vaihtelee yleensä satunnaisesti : kohinan esiintyessä, kynnystä muutetaan määräämällä kes- kimääräinen taso useiden lohkojen aikana ja kynnys asetetaan tähän keskiarvoon verrannolliselle tasolle. Tämä ei kuitenkaan yleensä riitä kohinaisessa ympäristössä ja siten myös parametrin vaihtelun asteen määritys useiden lohkojen ajalta otetaan myös huomioon.
Kynnysarvo T lasketaan siten edullisesti seuraavan lausekkeen mukaan [· T = M' + K.d 12 110726 missä M' on mitan keskiarvo useiden peräkkäisten kehysten yli, d on mitan standardipoikkeama näiden kehysten aikana ja K on vakio (joka voi olla tyypillisesti 2).
Käytännössä on edullista, että adaptoimista ei aloiteta uudelleen välittömästi sen jälkeen, kun puheen on ilmaistu puuttuvan, vaan että odotetaan sen varmistamiseksi, että pudotus on stabiili (jotta vältettäisiin nopea toistuva kytkentä adaptoituvan ja ei-adaptoituvan tilan välillä).
Kuten kuviosta 3 ilmenee, edellä mainitut piirteet sisältävässä keksinnön edullisessa suoritusmuodossa tulo 1 vastaanottaa signaalin, josta on otettu näytteitä ja joka on muunnettu digitaaliseksi analogia-digitaalimuuntimen (ADC) 2 avulla ja signaali syötetään käänteisen suotimen analysaattorin 3 tuloon, joka käytännössä kuuluu osana siihen puhekooderiin, jonka kanssa äänen aktiivisuuden ilmaisimen on tarkoitus toimia ja joka kehittää tulosignaalispektrin käänteisarvoa vastaavan suotimen kertoimet Li (tyypillisesti 8). Digitalisoitu signaali syötetään myös autokorrelaattorille 4 (joka sisältyy osana analysaattoriin 3), joka kehittää tulosignaalin autokorrelaa- • » tiovektorin Ri (tai ainakin yhtä monta kertaluvultaan alempaa termiä kuin LPC-kertoimia on). Laitteen näiden osien toiminta on kuvioissa 1 ja 2 selitetyn mukainen. Tällöin muodostetaan ;· edullisesti autokorrelaatiokertoimien Ri keskiarvot useiden peräkkäisten puhekehysten yli (pituus tyypillisesti 5-20 ms) * niiden luotettavuuden parantamiseksi. Tämä voidaan saada aikaan tallentamalla jokainen autokorrelaattorin 4 antama autokorrelaatiokertoimien joukko puskuriin 4a ja käyttämällä keskiar-vonmuodostajaa 4b sen hetkisten autokorrelaatiokertoimien Ri ja puskuriin 4a tallennettujen ja sieltä syötettyjen aikaisempien kehysten kertoimien painotetun summan muodostamiseksi. Siten johdetut keskimääräiset autokorrelaatiokertoimet Rai syötetään painotus- ja summausvälineil1 e 5, 6, jotka vastaanottavat myös tallennetut kohinajakson käänteisen suotimen suodinkertoimien ia 110726
Li autokorrelaatiovektorin Ai autokorrelaattorilta 14 puskurin 15 kautta ja jotka muodostavat arvoista Rai ja Ai mitan M, joka on edullisesti määritelty seuraavasti: S * &0 ΜΑ·
Ro Tätä mittaa verrataan tämän jälkeen kynnystasoon kynnys-arvopiirissä 7 ja looginen tulos antaa ilmaisun puheen esiintymisestä tai puuttumisesta lähdöstä 8.
Jotta käänteisen suotimen kertoimet Li vastaisivat kohtuullista estimaattia kohinaspektrin käänteisarvosta, nämä kertoimet on suotavaa päivittää kohinajaksojen aikana (ja tietenkin olla päivittämättä puhejaksojen aikana). On kuitenkin edullista, että puhe/puheeton-päätös, johon päivitys perustuu, ei riipu päivityksen tuloksesta tai muuten yksi ainoa väärin tunnistettu signaalikehys voi aiheuttaa äänen aktiivisuuden ilmaisimen "lukituksen katoamisen" tämän jälkeen ja seuraavien kehysten ·. virheellisen tunnistamisen. Tämän vuoksi on edullista käyttää ohjaussignaalinkehityspiiriä 20, joka on itse asiassa erillinen äänen aktiivisuuden ilmaisin, joka muodostaa riippumattoman ' ; ohjaussignaalin, joka osoittaa puheen esiintymisen tai ; puuttumisen, käänteisen suotimen analysaattorin 3 (eli puskurin 8) ohjaamiseksi, niin että mitan M muodostamiseen käytettyjä käänteisen suotimen autokorrelaatiokertoimia Ai päivitetään vain "kohinajaksojen" aikana. Ohjaussignaalinkehityspiiri 20 sisältää LPC-analysaattorin 21 (joka myös voi kuulua osana puhekooderiin ja jonka erikoisesti voi toteuttaa analysaattori 3), joka kehittää tulosignaalia vastaavan LPC-kerrointen Hi joukon, ja autokorrelaattorin 21a (jonka voi toteuttaa auto-korrelaattori 3a), joka johtaa kertoimien Mi autokorrelaatio-kertoimet Bi. Jos analysaattorin 21 toteuttaa analysaattori 3, tällöin Mi = Li ja Bi = Ai. Nämä autokorrelaatiokertoimet 110726 14 syötetään tällöin painotus- ja summausvälineille 22, 23 (vastaavat elimiä 5, 6), jotka vastaanottavat myös tulosig-naalin autokorrelaatiovektorin Ri autokorrelaattorilta 4. Siten j lasketaan mitta spektraaliselle samankaltaisuudelle tulevan I puhekehyksen ja edellisen puhekehyksen välillä. Tämä mitta voi olla Itakura-Saito-vääristymämitta sen hetkisen kehyksen kertoimien Ri ja edellisen kehyksen kertoimien Bi välillä, kuten edellä on esitetty, tai se voidaan sen sijaan johtaa laskemalla Itakura-Saito-vääristymämitta sen hetkisen kehyksen kertoimille Ri ja Bi ja vähentämällä (vähennyslaskuelimessä 25) puskuriin 24 tallennettu vastaava aikaisempi mitta spektri-erosignaalin kehittämiseksi (kummassakin tapauksessa mitan energia normalisoidaan jakamalla arvolla Ro). Tämän jälkeen puskuri 24 luonnollisesti päivitetään. Tämä spektrierosignaali muodostaa edellä selitetyn mukaisen kynnysarvopiirissä 26 suoritetun kynnysarvovertailun jälkeen ilmaisimen puheen esiintymiselle tai puuttumiselle. Olemme kuitenkin havainneet, että vaikka tämä mitta on erinomainen kohinan erottamiseksi ääntiöttömästä puheesta (tehtävä, johon tunnetut järjestelmät , , eivät yleensä pysty), se kykenee yleensä jonkin verran « · huonommin erottamaan kohinan ääntiöl 1 isestä puheesta. Tämän * ' 1 · I · mukaisesti piirissä 20 käytetään edullisesti lisäksi ääntiöl-lisen puheen ilmaisinpiiriä, jossa on äänenkorkeuden analy- t ·' saattori 27 (joka voi käytännössä toimia puhekooderin osana ja ' voi erikoisesti mitata monipulssi-LPC-kooderissa syntyvää pitkäaikaista prediktorin viivearvoa). Äänenkorkeuden analysaattori 27 kehittää loogisen signaalin, joka on "tosi", kun ääntiöllinen puhe havaitaan, ja tämä signaali johdetaan yhdessä kynnysarvopiiri1tä 26 johdetun kynnysarvovertai11 un mitan kanssa (joka on yleensä "tosi" ääntiöttömän puheen esiintyessä) TAI-EI-portin 28 tuloihin signaalin kehittämiseksi, joka on "epätosi" puheen esiintyessä ja "tosi" kohinan esiintyessä.
Tämä signaali syötetään puskuriin 8 (tai käänteisen suotimen analysaattorille 3), niin että käänteisen suotimen kertoimia Li > ' päivitetään vain kohinajaksojen aikana.
» ‘ » 15 110726
Kynnyksenadaptointipiiri 29 on myös kytketty vastaanottamaan ohjaussignaaligeneraattoripiirin 20 puheettoman signaalin ohjauslähdön. Kynnyksenadaptointipiirin 29 lähtö syötetään kyn-nysarvopiiri11 e 7. Kynnyksenadaptointipiiri suurentaa tai pienentää kynnystä portaissa, jotka ovat verrannollisia sen hetkiseen kynnysarvoon, kunnes kynnys approksimoi kohinateho-tasoa (joka voidaan käytännöllisesti johtaa esimerkiksi painotus- ja summauspiireistä 22, 23).
Kun tulosignaali on erittäin alhainen, saattaa olla edullista, ! että kynnys asetetaan automaattisesti kiinteään alhaiseen tasoon, koska analogia-digitaalimuuntimen 2 synnyttämä signaalin kvantisointivaikutus saattaa aiheuttaa alhaisilla signaalitasoilla epäluotettavia tuloksia.
Lisäksi voidaan käyttää "ylityksen" kehittäviä välineitä 30, jotka mittaavat puheilmaisujen kestot kynnysarvopiirin 7 jälkeen, ja kun puheen esiintymisen on ilmaistu jatkuvan ennaltamäärätyn aikavakion yli, lähtö pidetään ylemmässä tilassa lyhyen "ylitysjakson" ajan. Tällä tavalla vältetään ' : pientasoisten puhepurskeiden leikkautuminen keskeltä ja ‘ "i aikavakion oikea valinta estää ylitysgeneraattorin 30 liipaisun ·· lyhyiden, virheellisesti puheeksi ilmaistujen kohinapiikkien vaikutuksesta.
♦ t • On luonnollisesti selvää, että kaikki edellä mainitut toiminnat voi suorittaa yksi sopivasti ohjelmoitu digitaalinen prosesso-riväline, kuten digitaalinen signaalinkäsittelypiiri (DSP), joka on siten toteutetun LPC-koodekin osana (tämä on parhaana pidetty toteutus), tai sopivasti ohjelmoitu mikrotietokone tai mikrokontrolleripiiri siihen liittyvine muistilaitteineen.
·. · Kuten edellä on selitetty, äänen ilmaisulaite voidaan käytän nöllisesti toteuttaa LPC-koodekin osana. Vaihtoehtoisesti kun signaalin autokorrelaatiokertoimet tai niihin liittyvät mitat 110726 16 (osittaiskorrelaatio eli "parcor"-kertoimet) lähetetään etäällä olevalle asemalle äänen ilmaisu voi tapahtua kaukana koode-kista.

Claims (17)

17 110726 1. Äänen aktiivisuuden ilmaisinlaite, johon kuuluu: (i) välineet (1) ensimmäisen, tulosignaalin vastaanottamiseksi; 5 (ii) välineet (14,15) toisen signaalin, joka edustaa ensimmäisen signaalin kohinasignaalikomponentin estimaattia, kehittämiseksi jaksollisesti adaptiivisesti; (iii) välineet (4, 5, 6) muodostamaan ensimmäisestä ja toisesta signaalista jaksollisesti mitta M tulosignaalin osan ja mainitun estimoidun kolo hinasignaalikomponentin spektraaliselle samankaltaisuudelle; ja (iv) välineet (7) vertaamaan mittaa M kynnysarvoon T kehittämään lähtö ilmaisemaan puheen esiintymisen tai puuttumisen; tunnettu siitä, että (v) laite sisältää analyysivälineet (13, 3) tuottamaan sellaisen suotimen 15 kertoimet, jonka spektrivaste on käänteinen mainituista kahdesta sig naalista yhden taajuusspektrille; ja (vi) mitan muodostavat välineet (4, 5, 6) kykenevät muodostamaan mitan M, joka on suhteessa sellaisen signaalin nollakertaluvun autokorrelaati- • · · ‘ oon (R’o), joka signaali on saatu suodattamalla mainituista kahdesta 20 signaalista jäljelle jäävää signaalia suodattimena, jolla on mainitut ker- ' ‘; toimet.
2. Patenttivaatimuksen 1 mukainen laite, tunnettu siitä, että analysointivälineet (13, 3) sisältävät adaptiivisen suotimen. 25
3. Patenttivaatimuksen 1 mukainen laite, tunnettu siitä, että kehittämisväli-neet (14,15) kykenevät laskemaan mainittujen kertoimien impulssivasteen :" ‘ autokorrelaatiokertoimet A ja mitan muodostavat välineet (4, 5, 6) käsittävät .. ‘ · välineet laskemaan mainitun jäljelle jäävän signaalin autokorrelaatiokertoimet .... 30 Ri, ja välineet (5, 6) kytkettynä vastaanottamaan arvot Rj ja A ja laskemaan mitan M niistä. 18
4. Patenttivaatimuksen 2 mukainen laite, tunnettu siitä, että välineet (4) laskemaan mainitun jäljelle jäävän signaalin autokorrelaation kertoimet R* ovat järjestetyt (4a, 4b) tekemään niin signaalin useiden peräkkäisten osien autokorrelaatiokertoimista riippuvaisesti. 5
5. Patenttivaatimuksen 3 tai 4 mukainen laite, tunnettu siitä, että M = RoAo + 2 Σ, RtAj 10 missä Aj edustaa mainitun suotimen impulssivasteen i:nnettä autokorrelaa-tiokerrointa.
6. Patenttivaatimuksen 3 tai 4 mukainen laite, tunnettu siitä, että
7. Jonkin patenttivaatimuksen 1 - 6 mukainen laite, tunnettu siitä, että mai- . ’ ·. nittu yksi signaali on toinen, kohinaa edustava signaali ja mainittu jäljelle jäävä signaali on ensimmäinen, tulosignaali. 25
8. Patenttivaatimuksen 7 mukainen laite, tunnettu siitä, että siihen lisäksi :' ·. kuuluu sisääntulo (11), joka on järjestetty vastaanottamaan toisen sisääntu- losignaalin, vastaavasti alttiina kohinalle, mistä puhe puuttuu, missä kehittämisvälineet käsittävät LPC-analyysivälineet (13) johtamaan Ajin arvot toisesta 30 sisääntulosignaalista. 110726 19
9. Jonkin patenttivaatimuksen 1 - 7 mukainen laite, tunnettu siitä, että se lisäksi käsittää puskurin (15), joka on kytkettynä tallentamaan dataa, josta mainitun suotimen vasteen autokorrelaatiokertoimet A voidaan saada, missä mainittu suotimen vaste lasketaan jaksollisesti signaalista LPC-analyysiväli- 5 neitiä (3), jolloin laite on siten kytketty ja ohjattu, että mitta M lasketaan käyttämällä mainittua tallennettua dataa, ja mainittu tallennettu data päivitetään vain jaksoista, joista puheen on ilmaistu puuttuvan.
10. Patenttivaatimuksen 9 mukainen laite, tunnettu siitä, että se lisäksi kä-10 sittää välineet (20) osoittamaan puheen puuttumisen tallennetun datan päivityksen ohjaamiseksi, jolloin välineet (20) puheen puuttumisen osoittamiseksi ovat toiset äänen aktiivisuuden ilmaisinvälineet (20).
11. Jonkin edellä olevan patenttivaatimuksen mukainen laite, tunnettu siitä, 15 että se lisäksi käsittää välineet (29) kynnysarvon T säätämiseksi niiden jaksojen aikana, jolloin puheen on ilmaistu puuttuvan.
12. Patenttivaatimuksen 11 mukainen laite, tunnettu siitä, että se lisäksi • käsittää toisen äänen aktiivisuuden ilmaisinvälineen (20) järjestettynä estä- 20 mään kynnysarvon säätämisen kun puhetta esiintyy.
: 13. Patenttivaatimuksen 10 mukainen laite, tunnettu siitä, että se lisäksi : käsittää välineet (20) mainitun kynnysarvon T säätämiseksi niiden jaksojen aikana, jolloin puheen on ilmaistu puuttuvan, jolloin mainittu toinen äänen 25 aktiviteetin ilmaisinlaite (20) on järjestetty estämään kynnysarvon säätäminen kun puhetta esiintyy.
.“· 14. Patenttivaatimuksen 11,12 tai 13 mukainen laite, tunnettu siitä, että ; ' kynnysarvo T on, kun se on säädetty, säädetty olemaan yhtä suuri mitan , 30 keskiarvon kanssa lisättynä termillä, joka on murto-osa mitan standardipoik- keamasta. 20 110726
15. Menetelmä äänen aktiivisuuden ilmaisemiseksi ensimmäisessä, tulosig-naalissa, käsittäen vaiheet: (a) kehitetään jaksottaisesti adaptiivisesti toinen signaali, joka edustaa ensimmäisen signaalin estimoitua kohinasignaalikomponenttia; 5 (b) muodostetaan jaksottaisesti ensimmäisestä ja toisesta signaalista mitta M tulosignaalin osan ja mainitun estimoidun kohinasignaalikomponentin spektraaliselle samankaltaisuudelle; ja (c) verrattaan mittaa M kynnysarvoon T tuottamaan lähtö, joka ilmaisee puheen esiintymisen tai puuttumisen; 10 tunnettu: (d) vaiheesta muodostaa sellaisen suotimen kertoimet, jolla on spektraali-vaste, joka on mainituista kahdesta signaalista yhden taajuusspektrin käänteisarvo; ja että (e) mitta M on suhteessa sellaisen signaalin nollakertaluvun autokorrelaati- 15 oon R’o, joka on saatu suodattamalla mainitusta kahdesta signaalista jäljelle jäävää suotimella, jolla on mainitut kertoimet.
15 R/A, M = A0 +2£------- Ro missä A, edustaa mainitun suotimen impulssivasteen i:nnettä autokorrelaa-20 tiokerrointa.
16. Laite puhesignaalien koodaamiseksi, tunnettu siitä, että se sisältää jonkin patenttivaatimuksen 1 -14 mukaisen laitteen. ' 20
17. Matkapuhelinlaite, tunnettu siitä, että se sisältää jonkin patenttivaatimuksen 1-14 mukaisen laitteen. 21 110726
FI904410A 1988-03-11 1990-09-07 Äänen aktiivisuuden ilmaisu FI110726B (fi)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
GB8805795 1988-03-11
GB888805795A GB8805795D0 (en) 1988-03-11 1988-03-11 Voice activity detector
GB8813346 1988-06-06
GB888813346A GB8813346D0 (en) 1988-06-06 1988-06-06 Voice activity detection
GB888820105A GB8820105D0 (en) 1988-08-24 1988-08-24 Voice activity detection
GB8820105 1988-08-24
GB8900247 1989-03-10
PCT/GB1989/000247 WO1989008910A1 (en) 1988-03-11 1989-03-10 Voice activity detection

Publications (2)

Publication Number Publication Date
FI904410A0 FI904410A0 (fi) 1990-09-07
FI110726B true FI110726B (fi) 2003-03-14

Family

ID=27263821

Family Applications (2)

Application Number Title Priority Date Filing Date
FI904410A FI110726B (fi) 1988-03-11 1990-09-07 Äänen aktiivisuuden ilmaisu
FI20010933A FI115328B (fi) 1988-03-11 2001-05-04 Äänen aktiivisuuden ilmaisu

Family Applications After (1)

Application Number Title Priority Date Filing Date
FI20010933A FI115328B (fi) 1988-03-11 2001-05-04 Äänen aktiivisuuden ilmaisu

Country Status (16)

Country Link
EP (2) EP0335521B1 (fi)
JP (2) JP3321156B2 (fi)
KR (1) KR0161258B1 (fi)
AU (1) AU608432B2 (fi)
BR (1) BR8907308A (fi)
CA (1) CA1335003C (fi)
DE (2) DE68929442T2 (fi)
DK (1) DK175478B1 (fi)
ES (2) ES2047664T3 (fi)
FI (2) FI110726B (fi)
HK (1) HK135896A (fi)
IE (1) IE61863B1 (fi)
NO (2) NO304858B1 (fi)
NZ (1) NZ228290A (fi)
PT (1) PT89978B (fi)
WO (1) WO1989008910A1 (fi)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0435458B1 (en) * 1989-11-28 1995-02-01 Nec Corporation Speech/voiceband data discriminator
CA2040025A1 (en) * 1990-04-09 1991-10-10 Hideki Satoh Speech detection apparatus with influence of input level and noise reduced
US5241692A (en) * 1991-02-19 1993-08-31 Motorola, Inc. Interference reduction system for a speech recognition device
FR2697101B1 (fr) * 1992-10-21 1994-11-25 Sextant Avionique Procédé de détection de la parole.
SE470577B (sv) * 1993-01-29 1994-09-19 Ericsson Telefon Ab L M Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
JPH06332492A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 音声検出方法および検出装置
SE501305C2 (sv) * 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
EP0633658A3 (en) * 1993-07-06 1996-01-17 Hughes Aircraft Co Automatic gain control circuit coupled to the transmission and activated by speech.
IN184794B (fi) * 1993-09-14 2000-09-30 British Telecomm
SE501981C2 (sv) * 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
FR2727236B1 (fr) * 1994-11-22 1996-12-27 Alcatel Mobile Comm France Detection d'activite vocale
WO1996034382A1 (en) * 1995-04-28 1996-10-31 Northern Telecom Limited Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
GB2306010A (en) * 1995-10-04 1997-04-23 Univ Wales Medicine A method of classifying signals
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
DE69716266T2 (de) 1996-07-03 2003-06-12 British Telecomm Sprachaktivitätsdetektor
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
DE10052626A1 (de) * 2000-10-24 2002-05-02 Alcatel Sa Adaptiver Geräuschpegelschätzer
CN1617606A (zh) * 2003-11-12 2005-05-18 皇家飞利浦电子股份有限公司 一种在语音信道传输非语音数据的方法及装置
US7139701B2 (en) * 2004-06-30 2006-11-21 Motorola, Inc. Method for detecting and attenuating inhalation noise in a communication system
US7155388B2 (en) * 2004-06-30 2006-12-26 Motorola, Inc. Method and apparatus for characterizing inhalation noise and calculating parameters based on the characterization
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
US8708702B2 (en) * 2004-09-16 2014-04-29 Lena Foundation Systems and methods for learning using contextual feedback
US8775168B2 (en) * 2006-08-10 2014-07-08 Stmicroelectronics Asia Pacific Pte, Ltd. Yule walker based low-complexity voice activity detector in noise suppression systems
US8175871B2 (en) 2007-09-28 2012-05-08 Qualcomm Incorporated Apparatus and method of noise and echo reduction in multiple microphone audio systems
US8954324B2 (en) 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
US8223988B2 (en) 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8275136B2 (en) 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
US8244528B2 (en) 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8611556B2 (en) 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
ES2371619B1 (es) * 2009-10-08 2012-08-08 Telefónica, S.A. Procedimiento de detección de segmentos de voz.
CN104485118A (zh) 2009-10-19 2015-04-01 瑞典爱立信有限公司 用于语音活动检测的检测器和方法
CN108985277B (zh) * 2018-08-24 2020-11-10 广东石油化工学院 一种功率信号中背景噪声滤除方法及***

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3509281A (en) * 1966-09-29 1970-04-28 Ibm Voicing detection system
US4052568A (en) * 1976-04-23 1977-10-04 Communications Satellite Corporation Digital voice switch
US4358738A (en) * 1976-06-07 1982-11-09 Kahn Leonard R Signal presence determination method for use in a contaminated medium
JPS5636246A (en) * 1979-08-31 1981-04-09 Nec Corp Stereo signal demodulating circuit
JPS59115625A (ja) * 1982-12-22 1984-07-04 Nec Corp 音声検出器
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
JPS6196817A (ja) * 1984-10-17 1986-05-15 Sharp Corp フイルタ−

Also Published As

Publication number Publication date
NO316610B1 (no) 2004-03-08
EP0335521B1 (en) 1993-11-24
FI904410A0 (fi) 1990-09-07
NO903936L (no) 1990-11-09
NZ228290A (en) 1992-01-29
DE68910859D1 (de) 1994-01-05
PT89978A (pt) 1989-11-10
EP0548054A3 (fi) 1994-01-12
FI115328B (fi) 2005-04-15
JPH03504283A (ja) 1991-09-19
WO1989008910A1 (en) 1989-09-21
KR0161258B1 (ko) 1999-03-20
DE68929442T2 (de) 2003-10-02
NO982568D0 (no) 1998-06-04
PT89978B (pt) 1995-03-01
EP0548054A2 (en) 1993-06-23
DK175478B1 (da) 2004-11-08
NO982568L (no) 1990-11-09
NO304858B1 (no) 1999-02-22
IE61863B1 (en) 1994-11-30
FI20010933A (fi) 2001-05-04
EP0335521A1 (en) 1989-10-04
KR900700993A (ko) 1990-08-17
ES2047664T3 (es) 1994-03-01
JP2000148172A (ja) 2000-05-26
IE890774L (en) 1989-09-11
DE68929442D1 (de) 2003-01-23
JP3423906B2 (ja) 2003-07-07
CA1335003C (en) 1995-03-28
JP3321156B2 (ja) 2002-09-03
DE68910859T2 (de) 1994-12-08
HK135896A (en) 1996-08-02
EP0548054B1 (en) 2002-12-11
NO903936D0 (no) 1990-09-10
DK215690D0 (da) 1990-09-07
ES2188588T3 (es) 2003-07-01
AU3355489A (en) 1989-10-05
BR8907308A (pt) 1991-03-19
AU608432B2 (en) 1991-03-28
DK215690A (da) 1990-09-07

Similar Documents

Publication Publication Date Title
FI110726B (fi) Äänen aktiivisuuden ilmaisu
US5276765A (en) Voice activity detection
KR100363309B1 (ko) 음성액티비티검출기
US9646621B2 (en) Voice detector and a method for suppressing sub-bands in a voice detector
CA1123514A (en) Speech analysis and synthesis apparatus
CA1123955A (en) Speech analysis and synthesis apparatus
US5579435A (en) Discriminating between stationary and non-stationary signals
JPH09212195A (ja) 音声活性検出装置及び移動局並びに音声活性検出方法
EP0501421A2 (en) Speech coding system
US5579432A (en) Discriminating between stationary and non-stationary signals
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
US20040151303A1 (en) Apparatus and method for enhancing speech quality in digital communications
Vahatalo et al. Voice activity detection for GSM adaptive multi-rate codec
KR0138878B1 (ko) 보코더용 피치검색 처리시간 단축법
JP2772598B2 (ja) 音声符号化装置
FI118022B (fi) Signaalinkäsittelylaite
JPH07283860A (ja) ノイズ除去装置
WO2001026094A1 (fr) Dispositif de codage vocal et procede de codage vocal
JPH06250696A (ja) 音声符号化・復号化装置
NZ286953A (en) Speech encoder/decoder: discriminating between speech and background sound
KR20050070338A (ko) 지연시간 예측에 따른 반향 제거 기능을 가지는 음성코딩/디코딩 장치 및 그 방법

Legal Events

Date Code Title Description
FG Patent granted

Owner name: LG ELECTRONICS INC.

MA Patent expired