FI113903B - Puheen koodaus - Google Patents
Puheen koodaus Download PDFInfo
- Publication number
- FI113903B FI113903B FI980502A FI980502A FI113903B FI 113903 B FI113903 B FI 113903B FI 980502 A FI980502 A FI 980502A FI 980502 A FI980502 A FI 980502A FI 113903 B FI113903 B FI 113903B
- Authority
- FI
- Finland
- Prior art keywords
- frame
- delay
- frames
- weighting
- prediction
- Prior art date
Links
- 238000005311 autocorrelation function Methods 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 25
- 230000001934 delay Effects 0.000 claims abstract description 17
- 230000001413 cellular effect Effects 0.000 claims description 4
- 230000007774 longterm Effects 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 19
- 238000005314 correlation function Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/725—Cordless telephones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
113903 l
Puheen koodaus
Esillä oleva keksintö liittyy puheen koodaamiseen ja se on sovellettavissa erityisesti sellaisiin puheenkoodausmenetelmiin ja -laitteisiin, joissa käytetään pitkän aikavälin 5 (LTP) ennusteparametria.
Puheen koodaamista käytetään monissa viestintäsovelluksissa, joissa halutaan pakata puhesignaalia lähetettävän, muokattavan tai tallennettavan tietomäärän pienentämiseksi. Erityisesti, puheen koodausta sovelletaan laajalti solukkopuhelin-10 verkoissa joissa matkaviestimet ja tukiasemaohjainasemat on varustettu niin kutsutuilla äänikoodekeilla, jotka suorittavat puhesignaalien koodaamisen ja dekoodaamisen. Datan pakkaamisen puheen koodauksen avulla tekee tarpeelliseksi tarve maksimoida verkon puhelukapasiteetti.
15 Nykyaikaiset puhekoodekit toimivat tyypillisesti käsittelemällä puhetta lyhyinä segmentteinä, joita kutsutaan kehyksiksi. Eurooppalaisen digitaalisen solukkoverkon tapauksessa, joka tunnetaan nimellä GSM (jonka on määritellyt European Telecommunications Standards Institute - ETSI - spesifikaatiossa 06.60) kunkin sellaisen kehyksen pituus on 20 ms, mikä vastaa 160 puhenäytettä 8 kHz • » 20 näytteenottotaajuudella. Lähettävällä asemalla puhekooderi analysoi jokaisen * * · ...: puhekehyksen muodostaakseen sarjan koodausparametrejä vastaanottavalle ·: : asemalle lähetettäväksi. Vastaanottavalla asemalla dekooderi tuottaa vastaanotettujen parametrien perusteella syntetisoituja puhekehyksiä. Tyypillinen muodostettu parametrijoukko sisältää spektriparametrejä (tunnetaan LPC - • · v ’ 25 parametreinä), joita käytetään signaalin lyhyen aikavälin ennustamisessa, signaalin pitkän aikavälin ennustamiseen käytettäviä parametrejä (tunnetaan LTP -!.. parametreinä), erilaisia vahvistusparametrejä, heräteparametrejä ja koodikirjavektoreja.
* » · * · * 30 Kuva 1 esittää kaaviona ns. CELP-koodekin enkooderia (sekä matkaviestimissä että · tukiasemaohjaimissa on oleellisesti identtiset CELP -koodekit). Jokainen vastaanotettu näytteistetyn puhesignaalin s(n) kehys, jossa n ilmaisee näytteen 2 113903 numeron, analysoidaan ensiksi lyhyen aikavälin ennustusyksiköllä 1 LPC parametrien määrittelemiseksi kehykselle. Nämä parametrit syötetään multiplekserille 2, joka yhdistää koodausparametrit lähetettäväksi radioteitse. Lyhyen aikavälin ennustusyksikön 1 jäännössignaali, eli puhekehys josta on poistettu lyhyen 5 aikavälin redundanssi, syötetään sitten pitkän aikavälin ennustusyksikköön 3, joka määrittää LTP -parametrit. Nämä parametrit syötetään vuorostaan multiplekserille 2.
Kooderi käsittää LTP -synteesisuodattimen 4 ja LPC - synteesisuodattimen 5, jotka vastaanottavat vastaavasti LTP ja LPC parametrit. Nämä suodattimet lisäävät ίο lyhyen aikavälin ja pitkän aikavälin redundanssit signaaliin c(n), joka tuotetaan käyttäen koodikirjaa 6, syntetisoidun puhesignaalin ss(n) muodostamiseksi.
Syntetisoitua puhesignaalia verrataan vertailuyksikössä 7 varsinaiseen puhesignaaliin s(n), kehys kehykseltä, virhesignaalin e(n) muodostamiseksi. Kun virhesignaali on painotettu painotussuodattimella 8 (joka korostaa signaalin 15 'formantteja' tunnetulla tavalla), signaali syötetään koodikirjan hakuyksikköön 9.
Hakuyksikkö 9 suorittaa koodikirjan 6 haun kehyskohtaisesti tunnistaakseen sen koodikirjan tallennetun tiedon, joka lähinnä vastaa (LTP- ja LPC -suodatuksen ja kertojayksikössä 10 suoritetun vahvistuksella g kertomisen jälkeen) käsiteltävänä olevaa puhekehystä, eli sen signaalin c(n) määrittämiseksi, joka minimoi ;'· j20 virhesignaalin (en). Se vektori jonka avulla ilmaistaan lähinnä vastaava tallennettu »»· tieto, syötetään multiplekserille 2 lähetettäväksi ilma-rajapinnan kautta osana * .: : koodattua puhesignaalia t(n).
« • · ‘V Kuva 2 esittää kaaviona CELP-koodekin dekooderia. Vastaanotettu koodattu '·* *25 signaali t(n) puretaan demultiplekserissä 11 erillisiksi koodausparametreiksi.
Koodikirjavektorit syötetään koodikirjaan 12, joka on identtinen kooderin koodikirjan 6 » » ;*/ kanssa, koodikirjatietojen c(n) virran luomiseksi. Signaali c(n) kerrotaan tämän \ * jälkeen vastaanotetulla vahvistuksella g kertojayksikössä 13 ennen kuin signaali : V syötetään sarjaan kytkettyihin LTP synteesisuodattimeen 14 ja LPC- * · · ·: 30 synteesisuodattimeen 15. LTP- ja LPC -suodattimet vastaanottavat asiaan liittyvät : parametrit lähetyskanavalta ja lisäävät takaisin lyhyen ja pitkän aikavälin • t redundanssit signaaliin tuottaakseen, ulostulona, syntetisoitun puhesignaalin ss(n).
3 113903 LTP parametrit käsittävät ns. ennusteviiveparametrin (engl. pitch lag parameter), joka kuvaa puhesignaalin perustaajuutta. Ennusteviiveen määrittäminen jäännösignaalin käsiteltävänä olevalle kehykselle tapahtuu kahdessa vaiheessa. Aluksi suoritetaan 5 avoimen silmukan haku, joka käsittää jäännössignaalin karkeahkon haun, ennalta asetun maksimi- ja minimiviiveen puitteissa, sellaiselle signaalin osalle joka parhaiten vastaa käsiteltävänä olevaa kehystä. Sen jälkeen suoritetaan suljetun silmukan haku jo syntetisoidulle signaalille. Suljetun silmukan haku suoritetaan pienelle alueelle viiveitä ennusteviiveen avoimen silmukan estimaatin lähistössä. On tärkeää ίο muistaa, että jos avoimen silmukan haussa tehdään erehdys, sitä ei voi korjata suljetun silmukan haussa.
Varhaisimmissa tunnetuissa koodekeissa, avoimen silmukan LTP -analyysi määrittää ennusteviiveen jäännössignaalin tietylle kehykselle määrittämällä kehyksen 15 autokorrelaatiofunktion puheen jäännössignaalin sisällä, eli: N-1
R(d) = ^ r(n - d)r(n) d = dL,..., dH
n=0 jossa d on viive, r(n) on jäännössignaali, ja dL ja dH ovat viiveen hakurajat. N on kehyksen pituus. Ennusteviiveeksi dpi voidaan silloin tunnistaa viive dmax, joka • · • » · *;,/ vastaa autokorrelaatiofunktion R(d)maksimia. Tämä on esitetty Kuvassa 3.
!:··! .o » ·
Sellaisissa koodekeissa oli kuitenkin se mahdollisuus, että autokorrelaatio-funktion ·, maksimi vastaa ennustusviiveen monikertaa tai alikertaa, ja että estimoitu ennustusviive on tämän takia virheellinen. EP0628947 lähestyy tätä ongelmaa soveltamalla painotusfunktiota w(d) autokorrelaatiofunktioon R(d) ,eli 25 Rw(d) = w(d)^r(n-d)r(n) ‘ ,, * n=0 * jossa painotusfunktio on seuraavaa muotoa:
:v. w(d) = d{0%lK
4 113903 K on hienosäätöparametri, jonka arvo asetetaan tarpeeksi alas, jotta se pienentää todennäköisyyttä saada maksimiarvo i^(i/):lle ennustusviiveen monikerran kohdalla, mutta samalla tarpeeksi korkealle sulkemaan pois ennustusviiveen alikerrat.
5 EP0628947 ehdottaa myös otettavaksi huomioon aikaisemmille kehyksille määritetyt ennustusviiveet määritettäessä ennustusviivettä käsiteltävänä olevalle kehykselle. Tarkemmin sanoen, kehykset luokitellaan joko 'soinnillisiksi' tai 'soinnittomiksi' ja, käsiteltävänä olevalle kehykselle, suoritetaan maksimiarvon haku viimeisimmälle soinnilliselle kehykselle määritetyn ennustusviiveen lähialueella. Jos R^id) :n ίο kokonaismaksimi on tämän lähialueen ulkopuolella, eikä ylitä lähialueen maksimiarvoa enempää kuin ennalta asetetun kertoimen (3/2) verran, lähialueen maksimiarvo tunnistetaan ennustusviivettä vastaavaksi. Tällä tavoin ylläpidetään ennustusviiveen estimaatin jatkuvuus, ja pienennetään ennustusviiveen satunnaisten muutosten mahdollisuutta.
15
Esillä olevan keksinnön erään ensimmäisen toteutustavan mukaan esitetään menetelmä näytteistetyn signaalin puhekoodaamiseksi käyttäen ennustusviiveparametriä jokaiselle signaalin kehyssarjan kehykselle, joka menetelmä • # . käsittää jokaista kehystä kohti: ."••‘20 autokorrelaatiofunktion määrittämisen signaaliin kuuluvalle kehykselle, * · : ennalta määritettyjen maksimi- ja minimiviiveen välillä, ja menetelmälle on .···. tunnusomaista se, että se käsittää jokaista kehystä kohti: ·:’. autokorrelaatiofunktion painottamisen funktion korostamiseksi viiveille :' ·*: aikaisemmalle kehykselle määritetyn ennustusviiveparametrin läheisyydessä ja 25 painotetun autokorrelaatiofunktion maksimia vastaavan viiveen tunnistamisen kehyksen ennustusviiveparametriksi.
Mainittu näytteistetty signaali on edullisesti jäännössignaali, joka on saatu audiosignaalista poistamalla oleellisesti lyhyen aikavälin redundanssi . ‘. 30 audiosignaalista. Vaihtoehtoisesti, näytteistetty signaali voi olla audiosignaali.
* * · 5 113903
Mainittu painotus saavutetaan edullisesti yhdistämällä autokorrelaatiofunktio ja painotusfunktio, joka on muotoa: w(d) = {\Tpm-d\^dL)'^K- jossa TpreV on ennustusviiveparametri, joka on määritetty yhden tai usean 5 aikaisemman kehyksen perusteella, dt. on mainittu minimiviive, ja Knw on lähialueen painotuksen määrittelevä hienosäätöparametri. Lisäksi, painotusfunktio voi korostaa lyhyempien viiveiden autokorrelaatiofunktioita pitempiin viiveisiin verrattuna. Tässä tapauksessa, käytetään muunnettua painotusfunktiota:
w(d) = (|Tpn, -d\ + dL )'°81 K~. dloK
io jossa Kw on vielä eräs hienosäätöparametri.
Eräissä keksinnön toteutusmuodoissa, Tprev on yhden aikaisemman kehyksen ennustusviive T0id· Kuitenkin muissa toteutusmuodoissa, Tprev johdetaan useiden aikaisempien kehysten ennustusviiveistä. Erityisesti, Tprev voi vastata 15 lukumäärältään ennalta määrättyjen aikaisempien kehysten ennustusviiveiden mediaaniarvoa. Lisäksi voidaan soveltaa vielä erästä painotusta, joka on kääntäen verrannollinen mainittua mediaaniarvoa määritettäessä käytettyn n ennustusviiveen standardipoikkeamaan. Käytettäessä tätä viimeistä lähestymistapaa voidaan pienentää virheellisten ennustusviivearvojen vaikutusta autokorrelaatiofunktion ' ·.. ’ 20 painotukseen.
> *« ·
Menetelmä käsittää edullisesti mainittujen kehysten luokittelun soinnillisiin ja soinnittomiin kehyksiin, jolloin mainittu aikaisempi kehys on/ viimeisin soinnillinen • · kehys/ mainitut aikaisemmat kehykset ovat viimeisimmät soinnilliset kehykset.
... 25 Soinnittomat kehykset voivat sisältää soinnittomia kehyksiä ja kehyksiä jotka sisältävät hiljaisuutta tai taustamelua. Vielä edullisemmin, jos mainittu aikaisempi kehys ei / mainitut aikaisemmat kehykset eivät kuulu viimeisimpiin kehyksiin, : ·' painotusta vähennetään. Eräässä toteutusmuodossa, jossa vastaanotetaan ;·’ peräkkäisten soinnittomien kehysten jakso, painotusta vähennetään oleellisesti !.: · 30 verrannollisena jakson kehysten määrään. Edellisessä kappaleessa esitetyn : i painotusfunktion wn(d) hienosäätöparametriä Knw voidaan muuttaa siten että: 6 113903 wd(d) = (|^,„ ~4 + di )'°S! K’"'A-d"*1*-jossa A n vielä eräs hienosäätökerroin, jota kasvatetaan jokaisen peräkkäisten soinnittomien kehysten jakson kehyksen vastaanottamisen jälkeen. Painotus palautetaan maksimiarvoonsa seuraavaa soinnillista kehystä varten palauttamalla A 5 minimiarvoonsa. A:n arvoa voidaan vastaavasti kasvattaa soinnillisen kehyksen vastaanottamisen jälkeen, mikä nosta avoimen silmukan vahvistusta joka on pienempi kuin ennalta määrätty kynnysvahvistus.
Esillä olevan keksinnön erään toisen toteutustavan mukaan esitetään laite ίο näytteistetyn signaalin puhekoodausta varten käyttäen ennustusviiveparametriä jokaiselle signaalin kehyssarjan kehykselle, joka laite käsittää: välineet kehyksen autokorrelaatiofunktion määrittämiseksi jokaiselle signaalin kehykselle ennalta määrättyjen maksimi-ja minimiviiveen välillä; ja laitteelle on tunnusomaista se, että se käsittää: 15 painotusvälineet autokorrelaatiofunktion painottamiseksi funktion korostamiseksi viiveille jollekin aikaisemmalle kehykselle määritetyn ennustusviiveparametrin lähialueella; ja välineet painotetun autokorrelaatiofunktion maksimia vastaavan viiveen : tunnistamiseksi käsiteltävän kehyksen ennustusviiveparametriksi.
.·. 20 * · ' ·
Esillä olevan keksinnön erään kolmannen toteutustavan mukaan esitetään matkaviestin joka käsittää esillä olevan keksinnön edellä mainitun toisen » toteutustavan mukaisen laitteen.
• 25 Esillä olevan keksinnön erään neljännen toteutustavan mukaan esitetään :* solukkopuhelinverkko, käsittäen tukiasemaohjainaseman jossa on esillä olevan keksinnön edellä mainitun toisen toteutustavan mukainen laite.
1 « » · · 7 113903
Esillä olevan keksinnön paremmin ymmärtämiseksi, ja sen esittämiseksi miten keksintö voidaan toteuttaa, viitataan nyt esimerkkien muodossa oheisiin kuviin, joista:
Kuva 1 esittää kaavion muodossa CELP puhekooderia; 5 Kuva 2 esittää kaavion muodossa CELP puhedekooderia;
Kuva 3 havainnollistaa koodattavan puhesignaalin kehystä, sekä maksimi- ja minimiarvoja joita käytetään määritettäessä autokorrelaatiofunktio kehykselle;
Kuva 4 on vuokaavio esillä olevan keksinnön erään toteutusmuodon ίο mukaisen puheenkoodausmenetelmän tärkeimmistä vaiheista;
Kuva 5 esittää kaavion muodossa järjestelmää Kuvan 4 mukaisen menetelmän toteuttamiseksi.
Seuraavassa kuvataan menetelmää ja laitetta näytteistetyn puhesignaalin kehyksien 15 ennustusviiveparametrien avoimen silmukan ennustamiseen. Menetelmän tärkeimmät vaiheet on esitetty Kuvan 4 vuokaaviossa. On itsestään selvää, että kuvattu menetelmä ja laite voidaan sisällyttää muuten tavanomaisiin puhekoodekkeihin, kuten jo aiemmin Kuvaan 1 viitaten kuvattu CELP koodekki.
•'.'••20 Koodattava, näytteistetty puhesignaali jaetaan kiinteän pituisiin kehyksiin. Kuten edellä kuvattiin, vastaanotettaessa kehys syötetään ensin LPC -ennustimeen 1.
: Tyypillisesti avoimen silmukan LTP-ennustetta sovelletaan sen jälkeen jäännössignaaliin, joka on se osa alkuperäistä puhesignaalia joka jää jäljelle, kun lpc -ennustus on suoritettu ja signaalin lyhyen aikavälin redundanssi on poistettu.
• · ·' '25 Tätä jäännössignaalia voi edustaa r(n), jossa n ilmaisee näytteen numeron. Autokorrelaatiofunktio määritetään kehykselle yhtälöllä: :T: Rw(d) = w(d)^\ir(n-d)r(n) d = dL,...,dH {1} . «=o : .· jossa w(d) painotusfunktio, joka saadaan kaavasta » · · ‘* w(d) = (\TM -d\ + dL)'°SlK'"A.dlog2K- {2} :: ; 30 « t 8 113903
Toid on viimeisimmälle vastaanotetulle ja käsitellylle soinnilliselle kehykselle määritetty ennustusviive, ja n, N, dL, dH, on selitetty jo aiemmin. Knw ja K ovat hienosäätöparametrejä, joiden arvo on tyypillisesti 0,85. Vielä erästä hienosäätöparametriä A käsitellään seuraavassa.
5
Kun avoimen silmukan LTP -parametrit on määritetty kehykselle, kehys luokitellaan soinnilliseksi tai soinnittomaksi (jotta voitaisiin takaisinkytkeä parametri T0id käytettäväksi yhtälössä {2}). Tämä luokittelu voidaan tehdä lukuisilla eri tavoilla.
Eräs soveltuva menetelmä on määrittää avoimen silmukan LTP -vahvistus b ja ίο verrata sitä johonkin ennalta asetettuun rajavahvistukseen, tai vielä edullisemmin adaptiiviseen rajavahvistukseen bthr joka saadaan yhtälöstä: blhr=(\-a)Khb + abthr__x {3} jossa a on vaimennuskerroin (0,995) ja Kb on skaalauskerroin (0,15). Termi bthM on välittömästi edeltävälle kehykselle määritetty rajavahvistus. Vaihtoehtoinen, tai 15 lisäkriteeri kehyksen luokittelemiselle soinnilliseksi tai soinnittomaksi on määrittää jäännössignaalin 'nollatason ohitusaste' kehyksen aikana. Suhteellisen korkea ohitusaste ilmaisee, että kehys on soinniton, kun taas alhainen ohitusaste ilmaisee, että kehys on soinnillinen. Eräs sopiva kynnys on % kehyksen pituudesta N.
• · · » · · .•••.20 Vielä eräs vaihtoehto tai lisäkriteeri kehyksen luokittelemiselle soinnilliseksi tai • · : soinnittomaksi on tarkastella nopeutta, jolla ennustusviive vaihtelee. Jos kehykselle määritetty ennustusviive poikkeaa huomattavasti äskettäiselle kehyssarjalle •« · määritetystä 'keskimääräisestä' ennustusviiveestä, kehys voidaan luokitella » · soinnittomaksi. Jos poikkeama on vain hyvin pieni, kehys voidaan luokitella 25 soinnilliseksi.
» · # • · · v · Yhtälöstä {2} saatu painotusfunktio wn(d) käsittää ensimmäisen termin '(\Tolil -dl + dh)'062*""* , joka saa aikaan painotetun autokorrelaatiofunktion R^id) * · · ·;·’ korostuksen vanhan ennustusviiveen T0id lähialueella. Toinen yhtälön {2}, * · j30 vasemman puolen termi d'082 *-, saa aikaan pienten ennustusviivearvojen i · * korostuksen. Näiden kahden termin yhdistelmä auttaa merkittävästi pienentämään 9 113903 sitä mahdollisuutta, että oikean ennustusviiveen moni- tai alikerrat aiheuttaisivat painotetun autokorrelaatiofunktion maksimin kasvamisen.
Jos, kun käsiteltävälle kehykselle i on määritetty ennustusviive, kyseinen kehys 5 määritetään soinnilliseksi, ja avoimen silmukan vahvistus kyseiselle kehykselle määritetään suuremmaksi kuin joku tietty kynnysarvo (esim. 0,4), asetetaan yhtälössä {2} seuraavan kehyksen (i+1) hienosäätökertoimen A arvoksi 1. Jos käsiteltävänä oleva kehys kuitenkin luokitellaan soinnittomaksi, tai avoimen silmukan vahvistus määritetään kynnysarvoa alemmaksi, hienosäätökerrointa muutetaan ίο seuraavasti: A+i = 1,014· {4}
Hienosäätökerrointa A voidaan muuttaa yhtälön {4} mukaisesti kutakin perättäisten soinnittomien kehysten sarjan kehystä varten (tai soinnillisille kehyksille, jos avoimen silmukan vahvistus on alempi kuin kynnys). Kuitenkin on edullista että yhtälöä {4} 15 sovelletaan vasta kun ennalta määrätty määrä perättäisiä soinnittomia kehyksiä on vastaanotettu, esimerkiksi jokaisen kolmen perättäisen soinnittoman kehyksen jälkeen. Lähiympäristön painotuskertoimen Knw arvoksi asetetaan tyypillisesti 0,85, jolloin yhdistetyn painotuksen KnwA yläraja on 1,0 , jolloin rajojen välillä painotus on .·. ; yhdenmukainen kaikille viiveille d = di.... dn-.---.20 : .·. Vaihtoehtoisesti voidaan käyttää vain ennalta määrättyä määrää painotus-funktioita .*·*. w(d), esimerkiksi kolmea. Kullekin funktiolle osoitetaan kynnystaso, ja valitaan näistä : V: funktioista eräs tietty, kun adaptiivinen termi, joka on määritelty yhtälössä {4}, ylittää tuon kynnystason. Rajallisen painotusfunktiomäärän määrittelemisen etuna on se, 25 että määritellyt funktiot voidaan tallentaa muistiin. Sen ansiosta painotusfunktiota ei v : tarvitse laskea uudelleen jokaista uutta kehystä varten.
»* · • · t
Yksinkertaistettu järjestelmä edellä kuvatun menetelmän toteuttamiseksi on • · havainnollistettu kaaviolla Kuvassa 5, jossa järjestelmän sisäänmeno 16 on LPC -: ! ·. 30 ennustusyksikön 1 antama jäännössignaali. Tämä jäännössignaali 16 syötetään : kehyskorrelaattoriin 17, joka muodostaa korrelaatiofunktion jokaista jäännössignaalin 10 113903 kehystä varten. Jokaisen kehyksen korrelaatiofunktio syötetään ensimmäiseen painotusyksikköön 18, joka painottaa korrelaatiofunktion yhtälön {2} toisen termin, eli d'°ilKv mukaisesti. Painotettu funktio syötetään tämän jälkeen toiseen painotusyksikköön 19, joka edelleen painottaa korrelaatiofunktion yhtälön {2} 5 ensimmäisen termin, (|^,w-<^ + <7A)log2^ mukaisesti. Parametri T0id säilytetään puskurissa 20, joka päivitetään käyttäen järjestelmän ulostuloa vain jos luokitteluyksikkö 21 luokittelee käsiteltävän kehyksen soinnilliseksi. Painotettu korrelaatiofunktio syötetään hakuyksikköön 22, joka tunnistaa painotetun funktion maksimin ja määrittää sen perusteella käsiteltävän kehyksen ennustusviiveen.
10
Alan ammattimiehelle on ilmeistä, että edellä esitettyihin toteutusmuotoihin voidaan tehdä erilaisia muutoksia poikkeamatta esillä olevan keksinnön tunnusmerkeistä. Erityisesti, sen estämiseksi että virheellinen, viimeisimmälle soinnilliselle kehykselle saatu ennustusviive-estimaatti vaikuttaisi liikaa käsiteltävään estimaattiin, Kuvan 5 15 puskuri 20 voidaan järjestää tallentamaan viimeisimmille n kehykselle estimoidut ennustusviiveet, jolloin n voi olla esimerkiksi 4. Painotusyksikön 19 käyttämää painotusfunktiota muutetaan korvaamalla Τοω parametrillä Tmed. joka on puskurissa olevien n ennustusviiveen mediaaniarvo.
» • · · : 20 Vielä eräässä muunnoksessa, yksikköön 19 syötetty painotus on kääntäen > * verrannollinen puskuriin 20 tallennettujen n ennustusviivearvon standardipoikkeamaan. Tämä vaikuttaa painotusta korostavasti mediaaniennustusviiveen lähialueella silloin kun puskuriin tallennetut n : .* ennustusviivettä vaihtelevat vain vähän, ja kääntäen, pienentää painotuksen 25 korostusta kun kyseiset n ennustusviivettä vaihtelevat suhteellisen paljon.
Esimerkiksi, kyseisiä kolmea painotusfunktiota voidaan käyttää seuraavasti » ;> fdr^-di+^y»8^», std<n, : ^ä{d) = W„,ä-d\ + dL)'^, ΓΛ, <std < Th2 {5} • ‘: 1, std > Th2 »♦ » • | » * * 11 113903 jossa Km1, Km2, Th-ι, ja Th2 ovat hienosäätöparametrejä, suuruudeltaan esimerkiksi, 0,75, 0,95, 2, ja 6 (samassa järjestyksessä). Suurempiin standardipoikkeaman vaihteluihin sopeutumiseksi, joita esiintyy suurempien ennustusviiveiden yhteydessä, yhtälön {5} kynnysarvot Thi ja Th2 voivat olla verrannollisia 5 mediaaniennustusviiveeseen Tmed-
Claims (14)
1. Menetelmä näytteistetyn signaalin puhekoodaamiseksi käyttäen ennustusviiveparametriä jokaiselle signaalin kehyssarjan kehykselle, joka menetelmä 5 käsittää jokaista kehystä kohti: autokorrelaatiofunktion määrittämisen signaaliin kuuluvalle kehykselle, ennalta määritettyjen maksimi- ja minimiviiveen välillä tunnettu siitä, että menetelmä käsittää jokaista kehystä kohti: autokorrelaatiofunktion painottamisen funktion korostamiseksi viiveille ίο aikaisemmalle kehykselle määritetyn ennustusviiveparametrin läheisyydessä ja painotetun autokorrelaatiofunktion maksimia vastaavan viiveen tunnistamisen kehyksen ennustusviiveparametriksi.
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että 15 painotusfunktio on muotoa: «Äd) = (K-d\ + dL)^K- jossa T0id on ennustusviive mainitulle edelliselle kehykselle, di. on mainittu minimiviive ja Knw on hienosäätöparametri joka määrittelee lähialueen painotuksen. • · · • · ·
3. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että • · * · autokorrelaatiofunktio on painotettu korostamaan funktiota viiveille useille vastaaville ,···.’ aikaisemmille kehyksille määritettyjen ennustusviiveiden mediaaniarvon läheisyydessä. < · • * · « ·
4. Patenttivaatimuksen 3 mukainen menetelmä, tunnettu siitä, että : ’ ·': painotusfunktio on muotoa: 0"= wAd) = (\TmeJ-d\ + dL),^,:·'· i jossa Tmed on useille vastaaville aikaisemmille kehyksille määritettyjen »* · ennustusviiveiden mediaaniarvo, dL on mainittu minimiviive, ja Knw on lähialueen ; ,· * ,*30 painotuksen määrittelevä hienosäätöparametri. • * · · • I » t * 13 113903
5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu siitä, että painotusfunktiota muutetaan sisällyttämällä siihen kerroin, joka on kääntäen verrannollinen mainittujen lukuisien ennustusviiveiden standardipoikkeamaan.
6. Minkä tahansa edellä esitetyn patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että mainittu painotus lisäksi korostaa lyhyempiä viiveitä pitempiin viiveisiin verrattuna.
7. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu siitä, että ίο mainitun korostuksen antaa kerroin: jl°g2 jossa Kw on vielä eräs painotusparametri.
8. Menetelmä joka on minkä tahansa edellä esitetyn patenttivaatimuksen is mukainen ja joka käsittää mainittujen kehysten luokittelun soinnillisiin ja soinnittomiin kehyksiin, tunnettu siitä, että mainittu aikaisempi kehys on viimeisin soinnillinen kehys/ mainitut aikaisemmat kehykset ovat viimeisimmät soinnilliset kehykset.
. 9. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, että jos •1\ 20 mainittu aikaisempi kehys, tai viimeisin aikaisempi kehys, ei ole viimeisin kehys, painotusta vähennetään.
10. Patenttivaatimuksen 8 tai 9 mukainen menetelmä, tunnettu siitä, että kun on vastaanotettu jakso perättäisiä soinnittomia kehyksiä, painotusta 25 vähennetään, oleellisesti suhteessa jaksossa olevien kehysten määrään.
11. Patenttivaatimuksen 8 mukainen menetelmä yhdistettynä patenttivaatimukseen 2 tai 4, tunnettu siitä, että hienosäätöparametri muutetaan muotoon: i i i : v. 30 log 2K„wA * h s » :' “: jossa A on vielä eräs hienosäätökerroin, jota kasvatetaan jokaisen vastaanotetun I I < kehyksen jälkeen, tai lukumäärältään ennalta määrättyjen useiden kehysten jälkeen, 14 113903 jotka ovat perättäisten soinnittomien kehysten jaksossa, ja joka palautetaan minimiarvoonsa seuraavaa soinnillista kehystä varten.
12. Laite näytteistetyn signaalin puhekoodaamiseksi käyttäen 5 ennustusviiveparametriä kullekin signaalin kehyssarjan kehykselle, joka laite käsittää: välineet (17) kehyksen autokorrelaatiofunktion määräämiseen kullekin signaalin kehykselle ennalta määrättyjen maksimi-ja minimiviiveen välillä, tunnettu siitä, että laite käsittää: ίο painotusvälineet (19) autokorrelaatiofunktion painottamiseen funktion korostamiseksi viiveille jollekin aikaisemmalle kehykselle määritetyn ennustusviiveparametrin lähialueella; ja välineet (22) painotetun autokorrelaatiofunktion maksimia vastaavan viiveen tunnistamiseksi kehyksen ennustusviiveparametriksi.
12 113903
13. Matkaviestin, tunnettu siitä, että se käsittää patenttivaatimuksen 12 mukaisen laitteen.
14. Solukkopuhelinverkko, joka käsittää tukiasemaohjaimen, tunnettu siitä, ► · 20 että ohjaimeen kuuluu patenttivaatimuksen 12 mukainen laite. a »t • » · • · • » I * a f t a t · * I • * I · > a a » · « a · * · * a • a · a aa a aa· • a a · 1 a · a · a · • a · 15 113903
Priority Applications (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI980502A FI113903B (fi) | 1997-05-07 | 1998-03-05 | Puheen koodaus |
KR1019997009481A KR100653932B1 (ko) | 1997-05-07 | 1998-03-13 | 음성부호화 방법, 음성부호화 장치와 그를 포함하는 이동통신기기 및 그를 포함하는 셀 방식 전화네트워크 |
KR1020047005340A KR100653926B1 (ko) | 1997-05-07 | 1998-03-13 | 음성부호화 방법, 음성부호화 장치와 그를 포함하는 이동통신기기 및 그를 포함하는 셀 방식 전화네트워크 |
PCT/FI1998/000229 WO1998050910A1 (en) | 1997-05-07 | 1998-03-13 | Speech coding |
AU64032/98A AU739238B2 (en) | 1997-05-07 | 1998-03-13 | Speech coding |
CN98804901A CN1120471C (zh) | 1997-05-07 | 1998-03-13 | 语音编码 |
DE69814517T DE69814517T2 (de) | 1997-05-07 | 1998-03-17 | Sprachkodierung |
ES98104785T ES2198615T3 (es) | 1997-05-07 | 1998-03-17 | Codificacion de señales de voz. |
EP98104785A EP0877355B1 (en) | 1997-05-07 | 1998-03-17 | Speech coding |
JP10113808A JPH1124699A (ja) | 1997-05-07 | 1998-04-23 | 音声符号化方法及び装置 |
US09/073,697 US6199035B1 (en) | 1997-05-07 | 1998-05-06 | Pitch-lag estimation in speech coding |
JP2003350824A JP2004038211A (ja) | 1997-05-07 | 2003-10-09 | 音声符号化方法及び装置 |
JP2009101116A JP4866438B2 (ja) | 1997-05-07 | 2009-04-17 | 音声符号化方法及び装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI971976A FI971976A (fi) | 1997-05-07 | 1997-05-07 | Puhekoodaus |
FI971976 | 1997-05-07 | ||
FI980502A FI113903B (fi) | 1997-05-07 | 1998-03-05 | Puheen koodaus |
FI980502 | 1998-03-05 |
Publications (3)
Publication Number | Publication Date |
---|---|
FI980502A0 FI980502A0 (fi) | 1998-03-05 |
FI980502A FI980502A (fi) | 1998-11-08 |
FI113903B true FI113903B (fi) | 2004-06-30 |
Family
ID=26160386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI980502A FI113903B (fi) | 1997-05-07 | 1998-03-05 | Puheen koodaus |
Country Status (10)
Country | Link |
---|---|
US (1) | US6199035B1 (fi) |
EP (1) | EP0877355B1 (fi) |
JP (3) | JPH1124699A (fi) |
KR (2) | KR100653932B1 (fi) |
CN (1) | CN1120471C (fi) |
AU (1) | AU739238B2 (fi) |
DE (1) | DE69814517T2 (fi) |
ES (1) | ES2198615T3 (fi) |
FI (1) | FI113903B (fi) |
WO (1) | WO1998050910A1 (fi) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6415252B1 (en) * | 1998-05-28 | 2002-07-02 | Motorola, Inc. | Method and apparatus for coding and decoding speech |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
JP3180786B2 (ja) * | 1998-11-27 | 2001-06-25 | 日本電気株式会社 | 音声符号化方法及び音声符号化装置 |
US7117149B1 (en) * | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US7124075B2 (en) * | 2001-10-26 | 2006-10-17 | Dmitry Edward Terez | Methods and apparatus for pitch determination |
KR100463417B1 (ko) * | 2002-10-10 | 2004-12-23 | 한국전자통신연구원 | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7725315B2 (en) * | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US7949522B2 (en) * | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US7885420B2 (en) * | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7895036B2 (en) * | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
TWI241557B (en) * | 2003-07-21 | 2005-10-11 | Ali Corp | Method for estimating a pitch estimation of the speech signals |
JP4490090B2 (ja) | 2003-12-25 | 2010-06-23 | 株式会社エヌ・ティ・ティ・ドコモ | 有音無音判定装置および有音無音判定方法 |
US7949520B2 (en) * | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US8543390B2 (en) * | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US8284947B2 (en) * | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US7933767B2 (en) * | 2004-12-27 | 2011-04-26 | Nokia Corporation | Systems and methods for determining pitch lag for a current frame of information |
US7386445B2 (en) * | 2005-01-18 | 2008-06-10 | Nokia Corporation | Compensation of transient effects in transform coding |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8311819B2 (en) | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US9058812B2 (en) * | 2005-07-27 | 2015-06-16 | Google Technology Holdings LLC | Method and system for coding an information signal using pitch delay contour adjustment |
DE602006015712D1 (de) * | 2006-03-20 | 2010-09-02 | Mindspeed Tech Inc | Tonhöhen-track-glättung in offener schleife |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8010350B2 (en) * | 2006-08-03 | 2011-08-30 | Broadcom Corporation | Decimated bisectional pitch refinement |
US7752038B2 (en) * | 2006-10-13 | 2010-07-06 | Nokia Corporation | Pitch lag estimation |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8335685B2 (en) * | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8386246B2 (en) * | 2007-06-27 | 2013-02-26 | Broadcom Corporation | Low-complexity frame erasure concealment |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8904400B2 (en) * | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US8209514B2 (en) * | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466670B (en) | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
WO2010091554A1 (zh) * | 2009-02-13 | 2010-08-19 | 华为技术有限公司 | 一种基音周期检测方法和装置 |
US8452606B2 (en) | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
US9437213B2 (en) | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
US9015044B2 (en) | 2012-03-05 | 2015-04-21 | Malaspina Labs (Barbados) Inc. | Formant based speech reconstruction from noisy signals |
US9384759B2 (en) | 2012-03-05 | 2016-07-05 | Malaspina Labs (Barbados) Inc. | Voice activity detection and pitch estimation |
US9123328B2 (en) * | 2012-09-26 | 2015-09-01 | Google Technology Holdings LLC | Apparatus and method for audio frame loss recovery |
KR101883789B1 (ko) * | 2013-07-18 | 2018-07-31 | 니폰 덴신 덴와 가부시끼가이샤 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
ES2941782T3 (es) | 2013-12-19 | 2023-05-25 | Ericsson Telefon Ab L M | Estimación de ruido de fondo en señales de audio |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4486900A (en) | 1982-03-30 | 1984-12-04 | At&T Bell Laboratories | Real time pitch detection by stream processing |
JP2585214B2 (ja) * | 1986-02-21 | 1997-02-26 | 株式会社日立製作所 | ピッチ抽出方法 |
US4969192A (en) | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
JPH04264600A (ja) * | 1991-02-20 | 1992-09-21 | Fujitsu Ltd | 音声符号化装置および音声復号装置 |
US5179594A (en) * | 1991-06-12 | 1993-01-12 | Motorola, Inc. | Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook |
US5339384A (en) * | 1992-02-18 | 1994-08-16 | At&T Bell Laboratories | Code-excited linear predictive coding with low delay for speech or audio signals |
FI95085C (fi) | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
FI91345C (fi) | 1992-06-24 | 1994-06-10 | Nokia Mobile Phones Ltd | Menetelmä kanavanvaihdon tehostamiseksi |
CA2102080C (en) * | 1992-12-14 | 1998-07-28 | Willem Bastiaan Kleijn | Time shifting for generalized analysis-by-synthesis coding |
IT1270438B (it) * | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
JP3321933B2 (ja) * | 1993-10-19 | 2002-09-09 | ソニー株式会社 | ピッチ検出方法 |
FI98163C (fi) | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Koodausjärjestelmä parametriseen puheenkoodaukseen |
US5517595A (en) * | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
JP3418005B2 (ja) * | 1994-08-04 | 2003-06-16 | 富士通株式会社 | 音声ピッチ検出装置 |
US5781880A (en) * | 1994-11-21 | 1998-07-14 | Rockwell International Corporation | Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual |
US5664053A (en) | 1995-04-03 | 1997-09-02 | Universite De Sherbrooke | Predictive split-matrix quantization of spectral parameters for efficient coding of speech |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
-
1998
- 1998-03-05 FI FI980502A patent/FI113903B/fi not_active IP Right Cessation
- 1998-03-13 KR KR1019997009481A patent/KR100653932B1/ko not_active IP Right Cessation
- 1998-03-13 KR KR1020047005340A patent/KR100653926B1/ko not_active IP Right Cessation
- 1998-03-13 CN CN98804901A patent/CN1120471C/zh not_active Expired - Lifetime
- 1998-03-13 AU AU64032/98A patent/AU739238B2/en not_active Expired
- 1998-03-13 WO PCT/FI1998/000229 patent/WO1998050910A1/en not_active Application Discontinuation
- 1998-03-17 ES ES98104785T patent/ES2198615T3/es not_active Expired - Lifetime
- 1998-03-17 EP EP98104785A patent/EP0877355B1/en not_active Expired - Lifetime
- 1998-03-17 DE DE69814517T patent/DE69814517T2/de not_active Expired - Lifetime
- 1998-04-23 JP JP10113808A patent/JPH1124699A/ja not_active Withdrawn
- 1998-05-06 US US09/073,697 patent/US6199035B1/en not_active Expired - Lifetime
-
2003
- 2003-10-09 JP JP2003350824A patent/JP2004038211A/ja active Pending
-
2009
- 2009-04-17 JP JP2009101116A patent/JP4866438B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
AU739238B2 (en) | 2001-10-04 |
DE69814517D1 (de) | 2003-06-18 |
JP2004038211A (ja) | 2004-02-05 |
CN1120471C (zh) | 2003-09-03 |
DE69814517T2 (de) | 2004-04-08 |
KR100653926B1 (ko) | 2006-12-05 |
WO1998050910A1 (en) | 1998-11-12 |
EP0877355B1 (en) | 2003-05-14 |
JPH1124699A (ja) | 1999-01-29 |
FI980502A (fi) | 1998-11-08 |
JP4866438B2 (ja) | 2012-02-01 |
EP0877355A2 (en) | 1998-11-11 |
US6199035B1 (en) | 2001-03-06 |
FI980502A0 (fi) | 1998-03-05 |
EP0877355A3 (en) | 1999-06-16 |
KR20010006394A (ko) | 2001-01-26 |
AU6403298A (en) | 1998-11-27 |
ES2198615T3 (es) | 2004-02-01 |
KR100653932B1 (ko) | 2006-12-04 |
CN1255226A (zh) | 2000-05-31 |
KR20040037265A (ko) | 2004-05-04 |
JP2009223326A (ja) | 2009-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI113903B (fi) | Puheen koodaus | |
US6202046B1 (en) | Background noise/speech classification method | |
US7613606B2 (en) | Speech codecs | |
US7321851B2 (en) | Method and arrangement in a communication system | |
EP1214705B1 (en) | Method and apparatus for maintaining a target bit rate in a speech coder | |
EP1147515A1 (en) | Wide band speech synthesis by means of a mapping matrix | |
US8090577B2 (en) | Bandwidth-adaptive quantization | |
US20050143984A1 (en) | Multirate speech codecs | |
MXPA02000737A (es) | Metodo y aparato para identificar bandas de frecuencia para calcular desviaciones de fase lineales entre prototipos de cuadro en un codificador de frecuencia vocal. | |
US10431226B2 (en) | Frame loss correction with voice information | |
US6470310B1 (en) | Method and system for speech encoding involving analyzing search range for current period according to length of preceding pitch period | |
CA2317969C (en) | Method and apparatus for decoding speech signal | |
KR20050078524A (ko) | 오디오 정보 제공 시스템 및 그 방법 | |
GB2350763A (en) | Voice signal coding apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC | Transfer of assignment of patent |
Owner name: NOKIA TECHNOLOGIES OY |
|
MA | Patent expired |