FI95085C - Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi - Google Patents

Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi Download PDF

Info

Publication number
FI95085C
FI95085C FI922128A FI922128A FI95085C FI 95085 C FI95085 C FI 95085C FI 922128 A FI922128 A FI 922128A FI 922128 A FI922128 A FI 922128A FI 95085 C FI95085 C FI 95085C
Authority
FI
Finland
Prior art keywords
signal
block
excitation
filter
speech
Prior art date
Application number
FI922128A
Other languages
English (en)
Swedish (sv)
Other versions
FI922128A (fi
FI95085B (fi
FI922128A0 (fi
Inventor
Kari Juhani Jaervinen
Original Assignee
Nokia Mobile Phones Ltd
Nokia Telecommunications Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd, Nokia Telecommunications Oy filed Critical Nokia Mobile Phones Ltd
Priority to FI922128A priority Critical patent/FI95085C/fi
Publication of FI922128A0 publication Critical patent/FI922128A0/fi
Priority to EP93303572A priority patent/EP0570171B1/en
Priority to US08/060,427 priority patent/US5579433A/en
Priority to DE69329569T priority patent/DE69329569T2/de
Priority to JP5109388A priority patent/JPH06161498A/ja
Publication of FI922128A publication Critical patent/FI922128A/fi
Application granted granted Critical
Publication of FI95085B publication Critical patent/FI95085B/fi
Publication of FI95085C publication Critical patent/FI95085C/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

, 95085
Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi - En metod for digital kodning av en talsignal samt talkoder för utförande av förfarandet 5
Keksinnön kohteena on menetelmä puhesignaalin digitaalista koodaamista varten alhaisilla siirtonopeuksilla.
10 Viime vuosina on "analyysi synteesin kautta" -menetelmällä saavutettu hyviä tuloksia puhesignaalin digitaalisessa koodaamisessa pienillä siirtonopeuksilla. Tällaisiin analyysi-synteesi -menetelmiin perustuvissa koodereissa simuloidaan dekooderin toiminta jo enkooderissa ja analysoidaan kunkin 15 parametrikombinaation tuottama synteesitulos sekä valitaan puhesignaalia esittävät parametrit sen mukaan, mitkä niistä tuottivat valittavana olevista kombinaatioista parhaan dekoodaus tuloksen alkuperäiseen puhesignaaliin verrattuna. Analyysi-synteesi-menetelmässä siis syntesoidun puhesignaa-20 Iin perusteella tehdään päätös siitä, millaisia syntesointi-parametreja käytetään. Tällaista menetelmää kutsutaan myös suljetun järjestelmän menetelmäksi, sillä siinä synteesitulos ohjaa suoraan synteesiparametrien valintaa.
25 Puheenkoodauksessa suljetun järjestelmän hakua voidaan sen ·. monimutkaisuuden vuoksi soveltaa vain kriittisimpiin para metreihin kuten lineaarista ennustusmallia käyttävien koo-dereitten herätesignaalin koodaamiseen. Tällaisiin alhaisten siirtonopeuksien puheenkoodausmenetelmiin kuuluu monipulssi-30 herätekoodaus (MPEC, Multi-Pulse Excitation Coding) ja koo-diherätteinen lineaarinen ennustuskoodaus (CELP, Code Exci-tation Linear Prediction). Sekä monipulssiherätteisen koodauksen että lineaarisen koodiherätteisen koodauksen toteuttaminen vaatii suuren laskennallisen työn ja aiheuttaa suu-35 ren tehonkulutuksen, mikä tekee niiden käytännön toteuttamisen ja hyödyntämisen vaikeaksi.
2 95085
Analyysi-synteesi-menetelmiä on erinäisten yksinkertaistusten avulla kyetty viime aikoina toteuttamaan reaaliajassa digitaalisilla signaaliprosessoreilla, mutta niiden laajan käytön hankaluutena ja esteenä useisiin sovelluksiin ovat 5 edellä mainitut laskennallisen kuormituksen sekä tehon- ja muistinkulutukseen liittyvät ongelmat. Analyysi-synteesi-menetelmiä on selvitetty mm. patenttijulkaisuissa US-4 472 832 ja US-4 817 157.
10 Herätteen tehokkaaksi koodaamiseksi on esitetty myös avoimeen järjestelmään perustuvia lineaarisen ennustavan koodauksen menetelmiä, joissa suoraan analyysisuodatetusta signaalista (erosignaali) valitaan osa sen näytteistä välitettäväksi dekooderilla. Menetelmä tuottaa tyypillisesti ta-15 kaisinkytkettyä menetelmää huonomman tuloksen, sillä siinä ei lainkaan tutkita synteesitulosta eikä suoriteta herätteen näytearvojen valintaa sen mukaan, millä näytesignaaliarvo-kombinaatioilla voidaan tuottaa paras syntesoitu signaali, kuten edellä kuvatuissa suljetun järjestelmän koodereissa 20 tehtiin. Alhaisen siirtonopeuden saavuttamiseen tarvittava näytteiden määrän pienentäminen eli valinta voidaan suorittaa esimerkiksi pudottamalla käänteissuodatetun signaalin näytteenottotaajuutta. Tällaista menetelmää on selvitetty esimerkiksi patenttijulkaisussa US-4 752 956.
25
Vaikeutena suoraan erosignaalin näytteistä herätteen valitsevien menetelmien käyttämisessä on saavuttaa hyvä puheen laatu. Kun herätteen valinta suoritetaan pelkästään erosignaalin perusteella eikä käytetä todellista synteesitulosta 30 ohjaamaan herätteen muodostamista, puhesignaali vääristyy helposti koodauksessa ja sen laatu heikkenee.
* * ·
Tunnettua tekniikkaa selostetaan seuraavassa viitaten oheiseen kuvaan 1, joka esittää esittää tunnetun tekniikan mu-35 kaisen ratkaisun toteutusta.
Kuvassa 1 on esitetty tunnetun tekniikan mukaisen CELP-tyy-pin analyysi-synteesi-koodausjärjestelmän lohkokaavio. Ky- il 3 95085 seessä on koodiherätteinen lineaarinen ennustuskoodaus. Koo-derissa herätteen haku synteesin avulla toteutetaan kokeilemalla kaikki ns. koodikirjassa 100 sijaitsevat mahdolliset herätevaihtoehdot läpi ja syntesoimalla synteesisuodattimes-5 sa 102 niitä vastaavat puhesignaalikehykset (noin 10-30 ms lohkoissa). Syntesoitua puhesignaalia verrataan koodattavana olevaan puhesignaaliin 103 erotuselimessä 104, joka muodostaa virhettä kuvaavan signaalin. Virhesignaalia voidaan edelleen muokata siten, että siihen otetaan huomioon joita-10 kin ihmisen kuuloaistin ominaisuuksia painotuslohkossa 105. Kunkin koodikirjan sisältämän mahdollisen herätevektorin käytön antama synteesitulos lasketaan virheenlaskentalohkos-sa 106. Näin saadaan tieto kunkin kokeillun herätteen käytön hyvyydestä. Se herätevektori, joka tuottaa minimivirheen, 15 valitaan ohjauslogiikan 101 kautta välitettäväksi dekoode-rille. Dekooderille välitetään sen muistipaikan osoite koodikirjassa, josta paras koodikirjassa sijaitseva herätesig-naali haussa löytyi.
20 Monipulssiherätekoodauksessa käytettävä herätesignaali hae taan vastaavalla kokeilumenettelyllä. Siinä kokeillaan läpi eri pulssipaikkoja ja amplitudeja ja syntesoidaan näitä vastaava puhesignaali, jota edelleen verrataan koodattavana olevaan puhesignaaliin. Toisin kuin edellä mainituissa CELP-25 kooderityypissä, MPEC-menetelmässä ei tutkita valmiiksi muodostettujen koodikirjaan tallennettujen vektoreiden hyvyyttä puhesignaalin syntesoimisessa, vaan herätevektori muodostetaan yksitellen eri pulssien paikkoja kokeillen. Dekooderille välitetään herätteeksi valittujen yksittäisten heräte-30 pulssien paikka ja amplitudi.
Esillä olevan keksinnön tarkoituksena on aikaansaada sellainen menetelmä puhesignaalin digitaaliseksi koodaamiseksi, jonka avulla edellä esitetyt puutteet ja ongelmat voitaisiin 35 ratkaista. Tämän saavuttamiseksi on keksinnölle tunnusomaista se, että herätesignaali muodostetaan usean koodauslohkon avulla, jossa kussakin lohkossa i analyysisuodattimelta saadusta signaalista valitaan näytteiden valintalohkossa osahe- 4 95085 rätteenä käytettäväksi K; näytearvoa, että kussakin koodaus -lohkossa muodostetaan valittua osaherätettä vastaava puhe-signaali synteesisuodattimen avulla, että koodauslohkojen toimintaa ohjataan vähentämällä edeltävässä koodauslohkossa 5 saavutettu osaherätteen synteesitulos koodattavana olevasta puhesignaalista ennen tämän viemistä käsiteltäväksi seuraa-valle koodauslohkolle, ja että kussakin koodauslohkossa saavutettua synteesitulosta käytetään ohjaamaan kokonaisherät-teen muodostamista.
10
Puhekooderin tunnusomaiset piirteet ilmenevät patenttivaatimuksesta 5.
Esillä oleva keksintö on lineaarista ennustusta soveltava 15 puhekooderi, jossa herätteenä käytettävän signaalin koodaus suoritetaan siten, että herätenäytteiden optimoinnin yhteydessä syntesoidaan muodostettua osaherätettä vastaava puhe-signaali, jolloin kokonaisherätteen optimointi suoritetaan osaherätteiden synteesituloksen ohjaamana. Keksinnön mukai-20 nen puhekooderi koostuu N:stä koodausta suorittavasta koo-* dauslohkosta. Kussakin koodauslohkossa valitaan myöhemmin selvitettävällä algoritmilla joukko erosignaalin näytteitä käytettäväksi osaherätteenä ja välitettäväksi dekooderille (analyysivaihe) ja syntesoidaan valittujen herätepulssien 25 avulla niitä vastaava puhesignaali käytettäväksi ohjaamaan kokonaisherätteen valintaa (synteesivaihe). Menetelmä poikkeaa analyysi-synteesi-menetelmistä siinä, että puhesignaalin syntesointia ei suoriteta kaikkia eri kokonaisheräte-vaihtoehtoja käyttäen vaan se suoritetaan osaherätteittäin.
30
Keksintöä selostetaan seuraavassa yksityiskohtaisesti viitaten oheisiin kuviin, joista: kuva 1 esittää tunnetun tekniikan mukaisen CELP-tyypin analyysi- synteesi -koodausj ärj estelmän lohkokaavio-35 ta, kuva 2 esittää keksinnön mukaisen kooderin koodauslohkoa, kuva 3 esittää keksinnön mukaista enkooderia, kuva 4 esittää keksinnön mukaista dekooderia, kuva 5 esittää keksinnön mukaisen enkooderin vaihtoehtois- 40 ta toteutusta.
5 95085
Kuva 1 on selostettu edellä. Keksinnön mukaista ratkaisua kuvataan seuraavassa viitaten kuviin 2-5, jotka esittävät keksinnön mukaisen ratkaisun toteutusta.
5 Kuvassa 2 on esitetty keksinnön mukaisen kooderin koodaus-lohko. Menetelmä perustuu puhesignaalin koodaamiseen koo-dauslohkojen 207 avulla siten, että kunkin koodauslohkon 207 sisällä suoritetaan puhesignaalille 200 analyysisuodatus 201, osaherätteen näytearvojen valinta 202 ja puhesignaalin 10 syntesointi synteesisuodattimessa 203. Sekä analyysisuodatus 201 että synteesisuodatus 203 perustuvat lineaariseen suoda-tusmalliin, jolle on laskettu puhesignaalista s(n) 200 optimaaliset kertoimet a(l), ..., a(M) 206.
15 Analyysiosuudessa puhesignaalille suoritetaan käänteissuo- datus, jolloin saadaan erosignaali eli optimaalinen dekoo-derin synteesisuodattimessa puhesignaalin syntesoimiseen tarvittava herätesignaali. Koska kaikkien erosignaalin näytearvojen välittäminen dekooderille vaatii suuren siirtoka-20 pasiteetin, menetelmässä vähennetään dekooderille lähetettä vien näytteiden määrää kunkin puhekoodauslohkon 207 sisällä näytteiden valintalohkossa 202 valitsemalla kussakin N:ssä puhekoodauslohkossa Kt (i = 1, 2, ..., N) kappaletta pulsseja dekooderille välitettäväksi ja käytettäväksi osaherätteenä 25 205. Kunkin koodauslohkon 207 sisällä valitun Ki.:n heräte- ·.’ pulssin 205 avulla muodostuva puhesignaali 204 syntesoidaan kussakin koodauslohkossa 207 synteesisuodattimella 203, jolloin saadaan selville kunkin osaherätteen 205 syntesoima osuus puhesignaalista.
30
Analyysisuodatin 201 A(z) on muotoa .'. M
A(z) = 1 - Σ a (j) z'j j=l 35 ja synteesisuodatin 203 S(z) on vastaavasti muotoa S(z) = 1 / A(z).
6 95085
Analyysi- ja synteesisuodattimet 201, 203 voivat sisältää myös lisäksi puhesignaalin soinnillisten äänteiden jaksollisuutta mallintavan pitkän aikavälin suodatuksen.
5 Keksinnön mukaisesti koodauslohkoista 207 muodostetaan puhe-kooderi siten, että kunkin koodauslohkon 207 synteesisuodat-timelta 203 saatava koodauslohkon 207 syntesoima puhesignaali 204 vähennetään sisääntulevasta puhesignaalista ennen sen viemistä seuraavalle koodauslohkoile 207. Suorittamalla pu-10 hesignaalin koodaus koodauslohkojen 207 avulla voidaan koo-dausprosessi jakaa kahteen osaan. Koodausprosessi käsittää ensinnäkin kunkin puhelohkon sisäisen erosignaalia suoraan käsittelevän algoritmin, joka siis operoi suoraan analyysi-suodattimelta saatua signaalia ja valitsee siitä kussakin 15 koodauslohkossa 207 i kaikkiaan Kt herätepulssia käytettäväksi osaherätteenä 205. Toisaalta koodaus käsittää osaherätet-tä 205 vastaavan puhesignaalin 204 syntesoimisen synteesi-suodattimella ja sen käyttämisen kokonaisherätteen optimoinnin ohjaamiseen.
20
Kuvassa 3 on esitetty keksinnön mukainen puhekooderi. Koodattavalle puhesignaalille 300 suoritetaan LPC-analyysi eli lasketaan lineaarinen malli LPC-analysaattorissa 301 erikseen kullekin I näytettä sisältävälle n. 10-30 ms pituiselle 25 puhekehykselle. Lineaaristen ennustuskertoimien laskenta • voidaan suorittaa millä tahansa alalla tunnetulla menetel mällä. Ennustuskertoimet kvantisoidaan kvantisointilohkossa 302 ja kvantisointitulos 317 viedään sopivasti lohkossa 303 enkoodattuna multiplekserille 318 välitettäväksi edelleen 30 dekooderille. Kvantisoidut kertoimet viedään kuhunkin koo-dauslohkoon 304, 311, 313, ..., 315 käytettäväksi niiden *; , analyysi- ja synteesisuodattimissa suodatinkertoimina.
Koodattava puhesignaali 300 viedään keksinnön mukaisesti 35 kullekin Nslle puhekoodauslohkolle 304, 311, 313, ..., 315 siten, että siitä vähennetään erotuselimissä 305, 312, 314, ..., 316 kunkin osaherätteen vaikutus. Kultakin koodausloh-kolta 304, 311, 313, ··., 315 saatavat osaherätteen määrit-
II
7 95085 telemät herätepulssien paikat ja amplitudit viedään kvan-tisoinnin ja enkoodauksen kanavaan suorittavalle lohkolle 306, joka muodostaa multiplekserille 318 vietävän kokonais-herätteen koodiesityksen pulssipaikoille b(l), b/L) 309 5 ja pulssien amplitudeille d(l), ..., d(L) 310.
Kunkin koodauslohkon synteesisuodattimissa 203 käytetään herätteenä luonnollisesti kvantisoituja pulssien paikkoja ja amplitudeja, jotta enkooderissa suoritettava osaherätteiden 10 synteesiprosessi vastaa dekooderin kvantisoitua herätettä käyttävää synteesiprosessia. Kuvioihin ei ole yksinkertaisuuden vuoksi piirretty erikseen näkyviin kvantisoitujen heräteparametrien vientiä koodauslohkoihin käytettäväksi muodostamaan kvantisoitu synteesisuodattimelle vietävä osa-15 heräte.
Vähentämällä viimeisen osaherätteen tuottavan koodauslohkon 315 ulostulo sille edellisestä lohkosta tulleesta signaalista, saadaan koko koodauksen mallinnusvirhe erotuselimessä 20 316. Mikäli halutaan, voidaan tämä signaali myös kvantisoida ja enkoodata vektorikvantisointilohkossa 307 ja välittää enkoodattu kvantisointitulos 308 edelleen multiplekserille 318.
25 Kuvassa 4 on esitetty keksinnön mukainen dekooderi. Dekoo- ’> derin demultiplekseriltä 409 saadaan koodausparametrit, jot- « ka viedään dekoodauslohkoilie 403, 404, 405. Dekoodauslohkolta 405 saatavien pulssipaikkojen ja amplitudien 402 mukaisesti muodostetaan herätesignaali, joka viedään synteesi-30 suodattimeen 407. Herätteeseen voidaan lisätä summauselimes-sä 406 vielä optionaalisesti vektoridekoodauslohkolta 404 saatu lisäheräte, mikäli enkooderin mallinnuksen kokonaisen-nustusvirhe 401 on järjestelmässä myös välitetty. Välitetyt ennustekertoimet 400 dekoodataan lohkossa 403 ja niitä käy-35 tetään synteesisuodattimessa 407. Syntesoitu puhesignaali 408 saadaan synteesisuodattimen 407 ulostulosta.
8 95085
Keksinnön mukaisessa kooderissa herätteen valintaan voidaan käyttää hakulohkossa 202 kunkin I näytettä sisältävän lohkon sisällä seuraavaa algoritmia, jossa osaherätteenä käytettäväksi valitaan kussakin koodauslohkossa i;i=l,2, ..., N 5 ne Ki kappaletta analyysisuodattimelta 201 saaduista näytteistä, joiden itseisarvojen summa on suurin kyseisen koodattavan sisääntulokehyksen aikana eli maksimoidaan termi |e(nx) | + |e(n2) | + |e(n3)| + ... + |e(nKi)| 10 siten, että pulssien etäisyydet toisistaan |ni-n2|, |nj-n3|, |n2-n3|, ... jne ovat kukin vähintään N (eli kooderissa käytettävien koodauslohkojen lukumäärä) näytettä. Maksimoitavassa termissä tekijä e(k) (k=l, 2, ..., I) on analyysisuo-15 dattimelta 201 saatava ulostulo eli lineaarisen mallinnuksen erosignaali. Tästä I näytettä sisältävästä sekvenssistä valitaan osaherätteenä käytettäväksi edellä mainitulla algoritmilla siis Ki pulssia. Kokonaisheräte saadaan osaherättei-den summana.
20
Herätepulssien valinta-algoritmia voidaan parantaa siten, että siihen liitetään mukaan alipäästötyypin suodatus, joka suoritetaan erosignaalille ennen maksimoitavan termin laskemista. Käytettävän alipäästösuodattimen taajuusvaste noudat-25 taa puhesignaalin keskimääräistä jakaumaa eri taajuuksille.
Kuvassa 5 on esitetty keksinnön mukaisen puhekooderin vaihtoehtoinen toteutus. Vaihtoehtoinen toteutus eroaa kuvassa 3 esitetystä toteutuksesta siten, että koodattavalle signaa-?0 lille on laskettu useampia suodatinkertoimia. Tässä toteutuksessa kukin osaheräte on yhdistetty eri taajuusvasteen • - toteuttavaan suodattimeen, jolloin kussakin koodauslohkossa 504, 508, 512, ... käytetään sellaisia analyysi- ja syntee-sisuodattimia, joissa käytettävät kertoimet on laskettu vas-35 taamaan kyseiselle koodauslohkoile 504, 508, 512, ... tulevaa signaalia.
li 9 95085
Kukin osaheräte siis syntesoi osuutensa puhesignaalista eri- * laisen synteesisuodattimen kautta. Dekooderissa käytetään vastaavasti N:ää rinnakkaista synteesisuodatinta, joille kullekin viedään sitä vastaava dekoodattu osaheräte ja syn-5 tesoitu puhesignaali saadaan osaherätteillä syntesoitujen signaalien summana.
Keksinnön käyttämisellä vältetään suljetun järjestelmän koodausmenetelmien vaatima suuri laskennallinen työ ja tehonku-10 lutus. Lisäksi menetelmän vaatima muistin kulutus on vähäinen. Keksinnön mukaisessa kooderissa voidaan käyttää edellä esitetyn kaltaisia suhteellisen yksinkertaisia herätteenva-linta-algoritmeja ja saada aikaan hyvä puheen laatu ilman, että tarvitaan monimutkaisia ja laskennallisesti raskaita 15 synteesivaiheen kaikille mahdollisille kokonaisherätteille suorittavia menetelmiä.
»t, m

Claims (9)

10 95085 i l. Digitaalinen puheenkoodausmenetelmä, jossa kehitetään lyhyen aikavälin analysaattorissa sisääntu-levaa signaalia vastaava joukko ennustusparametrejä a(i)f 5 jotka jokaisessa lohkossa ovat puhesignaalin lyhyen aikavälin spektrille tunnusomaisia, tuotetaan koodauslohkoihin perustuvassa kooderissa he-rätesignaali, jossa on vain vähäinen määrä välitettäviä näytteitä, ja joka syöttämällä ennustusparametrien mukaan 10 toimivalle synteesisuodattimelle saadaan syntesoitua alkuperäistä puhesignaalia vastaava koodattu puhesignaali, tunnettu siitä, että herätesignaali muodostetaan usean koodauslohkon (207) avulla, jossa kussakin lohkossa i (207) analyysisuodattimel-15 ta (201) saadusta signaalista valitaan näytteiden valinta-lohkossa (202) osaherätteenä (205) käytettäväksi K; näytear-voa, kussakin koodauslohkossa (207) muodostetaan valittua osaherätettä (205) vastaava puhesignaali (204) synteesisuo-20 dattimen (203) avulla, koodaus1ohkojen (207) toimintaa ohjataan vähentämällä edeltävässä koodauslohkossa saavutettu osaherätteen (205) synteesitulos (204) koodattavana olevasta puhesignaalista ennen tämän viemistä käsiteltäväksi seuraavalle koodausloh-25 kolle, ja ·: - kussakin koodauslohkossa (207) saavutettua synteesitu- losta (204) käytetään ohjaamaan kokonaisherätteen muodostamista.
2. Förfarande enligt patentkrav l, kännetecknat av att de som excitation utnyttjade pulserna (205) bildas i vart och ett kodningsblock (207) sälunda, att summan av deras absolu-ta värden är den största, dock sälunda, att samplen befinner 25 sig minst pä ett avständ N frän varandra, där N anger anta-• let kodningsblock (207) som utnyttjas i kodern.
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii tä, että herätteenä käytettävät pulssit (205) muodostetaan “ kussakin koodauslohkossa (207) siten, että niiden itseisar vojen summa on suurin, kuitenkin siten, että näytteet sijaitsevat vähintään etäisyydellä N toisistaan, jossa N on 35 kooderissa käytettyjen koodauslohkojen (207) lukumäärä.
3. Förfarande enligt patentkrav 2, kännetecknat av att före valet av excitationspulser de frän analystiltret (201) 30 erhällna samplen filtreras i ett filter, vars frekvenssvar motsvarar medelvärdet för talets frekvensfördelning.
3. Patenttivaatimuksen 2 mukainen menetelmä, tunnettu siitä, että ennen herätepulssien (205) valintaa analyysisuodat- 95085 timelta (201) saadut näytteet suodatetaan suodattimena, jonka taajuusvaste vastaa puheen keskimääräistä taajuusjakaumaa .
4. Förfarande enligt patentkrav 3, kännetecknat av att prediktivparametrarna a(i) räknas sä att de i stället för 35 den ursprungliga talsignalen motsvarar en separat tili vart och ett kodningsblock (207) förd signal, frän vilken subtra-herats den av delexcitationer (205) producerade syntetiserade talsignal (204), varvid i var och en delexcitation (205) li 95085 kombinerats beträffande sitt frekvensbeteende eventuellt olika syntesfilter.
4. Patenttivaatimuksen 3 mukainen menetelmä, tunnettu sii tä, että ennusteparametrit a(i) lasketaan alkuperäisen puhesignaalin sijaan vastaamaan erikseen kutakin eri koo-dauslohkolle (207) vietävää signaalia, josta on vähennetty osaherätteiden (205) tuottama syntesoitu puhesignaali (204), 10 jolloin kuhunkin osaherätteeseen (205) on yhdistetty taa- juuskäyttäytymiseltään mahdollisesti erilaiset synteesi-suodattimet.
5. En pd kodningsblock baserad digital talkoder, vilken 5 uppvisar en analysator för korttidsinterval, med vilken genere-ras ett mot den inkommande signalen svarande antal predik-tivparametrar a(i), vilka i vart och ett block är känneteck-nande för talsignalens spektrum inom ett kort tidsinterval, 10 - en koder, med vilken produceras en excitationssignal som innehdller en liten mängd sampel som skall förmedlas, och ett enligt prediktivparametrarna fungerande syntesfliter, till vilket mätäs nämnda excitationssignal och som ästadkommer en mot den syntetiserade ursprungliga talsignal-15 en svarande kodad talsignal, kannetecknad av att den innefattar ett flertal kodningsblock (207), med vilka excitationssigna-len genereras och av vilka i vart och ett block i (207) frdn den fran analysfiltret (201) erhällna signalen utväljs i ett 20 sampel utväljningsblock (202) för att användas säsom en del- « excitation (205) K; sampelvärden, varvid vart och ett kodningsblock (207) anpassats att bilda en mot den valda delexcitationen (205) svarande talsignal (204) med hjälp av syntesfiltret (203), och varvid 25 kodningsblockens (207) funktion styrs genom att subtrahera . det i det föregäende kodningsblocket erhällna syntesresulta- tet (204) för delexcitation (205) frän talsignalen som skall kodas, innan denna förs för behandling tili följande kodningsblock, och 30 det i vart och ett kodningsblock (207) erhällna syntesresul-tatet (204) utnyttjas för att styra genereringen av den to-• tala excitationen.
5 A (z) = 1 - Σ a (j ) z'j j=l synteesisuodatin (203) S(z) on muotoa S (z) = 1 / A(z) 10 ja ne (201, 203) voivat sisältää myös lisäksi puhesignaalin soinnillisten äänteiden jaksollisuutta mallintavan pitkän aikavälin suodatuksen.
9. Patenttivaatimuksen 5, 6, 7 tai 8 mukainen puhekooderi, tunnettu siitä, että koodattavalle signaalille on laskettu useampia ennusteparametrejä ja kukin osaheräte on yhdistetty eri taajuusvasteen toteuttavaan suodattimeen siten, että kussakin koodauslohkossa (504, 508, 512, ...) käytetään sel-20 laisia analyysi- ja synteesisuodattimia, joissa käytettävät kertoimet on laskettu vastaamaan kyseiselle koodauslohkolle (504, 508, 512, ...) tulevaa signaalia, ja että dekooderissa käytetään vastaavasti useaa rinnakkaista synteesisuodatinta, joille kullekin viedään sitä vastaava dekoodattu osaheräte 25 ja syntesoitu puhesignaali saadaan osaherätteillä syntesoi-. tujen signaalien summana. l. Ett digitalt talkodningsförfarande, vid vilket 30 - i en analysator med kort tidsintervall genereras ett mot den inkommande signalen svarande antal prediktivparamet-. rar a(i), vilka i vart och ett block är kännetecknande för talsignalens spektrum inom ett kort tidsintervall, i en pä kodningsblock baserad koder produceras en exci-35 tationssignal, vilken uppvisar endast en liten mängd sampel som skall förmedlas, och vilken genom att föras tili ett syntesfilter som fungerar i enlighet med prediktivparamet- 95085 rarna ästadkommer en mot den syntetiserade ursprungliga tal-signalen svarande kodad talsignal, kannetecknat av att excitationssignalen genereras med hjälp av ett flertal 5 kodningsblock (207), där i vart och ett block i (207) frän signalen som erhällits frän analystiltret (201) i ett sampel utväljningsblock (202) utväljs för att utnyttjas säsom del-excitation (205) K; sampelvärden, i vart och ett kodningsblock (207) bildas en mot den 10 utvalda delexcitationen (205) svarande talsignal (204) med hjälp av syntetiseringsfilter (203), kodningsblockens (207) funktion styrs genom att subtra-hera den i det föregäende kodningsblocket erhällna delexci-tationens (205) syntesresultat (204) frän talsignalen som 15 skall kodas innan denna förs tili behandling i följande kodningsblock, det i vart och ett kodningsblock (207) erhällna syntes-resultatet (204) utnyttjas för att styra bildandet av den totala excitationen. 20
5. Koodauslohkoihin perustuva digitaalinen puhekooderi, 15 jossa on lyhyen aikavälin analysaattori, jolla kehitetään si-sääntulevaa signaalia vastaava joukko ennustusparametrejä a(i), jotka jokaisessa lohkossa ovat puhesignaalin lyhyen aikavälin spektrille tunnusomaisia, 20. kooderi, jossa tuotetaan vähäinen määrä välitettäviä näytteitä sisältävä herätesignaali, ja ennustusparametrien mukaan toimiva synteesisuodatin, jolle syötetään mainittu herätesignaali ja saadaan syntesoitua alkuperäistä puhesignaalia vastaava koodattu puhesignaali, 25 tunnettu siitä, että se käsittää useat koodauslohkot (207), joiden avulla herätesignaali muo- • · dostetaan ja joissa kussakin lohkossa i (207) analyysisuo-dattimelta (201) saadusta signaalista valitaan näytteiden vaiintalohkossa (202) osaherätteenä (205) käytettäväksi Kj 30 näytearvoa, jolloin kukin koodauslohko (207) on sovitettu muodostamaan ]. valittua osaherätettä (205) vastaava puhesignaali (204) syn- teesisuodattimen (203) avulla, ja jolloin koodauslohkojen (207) toimintaa ohjataan vähentämällä edel-35 tävässä koodauslohkossa saavutettu osaherätteen (205) syn- teesitulos (204) koodattavana olevasta puhesignaalista ennen tämän viemistä käsiteltäväksi seuraavalle koodauslohkolle, ja 95085 kussakin koodauslohkossa (207) saavutettua synteesitulosta (204) käytetään ohjaamaan kokonaisherätteeen muodostamista.
6. Talkoder enligt patentkrav 5, kännetecknad av att den 35 innefattar LPC-analysator (301), kvantiseringsorgan (302, 306), ett enkodningsblock (303), 1C 95085 talkodningsblock (304, 311, 313, ..., 315), avskiljningsorgan (305, 312, 314, ..., 316), en vektorkvantiserare (307) samt multiplexer (318), 5 sälunda, att för talsignalen (300) som skall kodas utförs en LPC-analys i LPC-analysator (301), prediktivkoefficienterna kvantiseras i kvantiserings-blocket (302) och kvantiseringsresultat (317) förs till mul-10 tiplexer (318) för vidare förmedling till dekodern, i dekvantiseringsorganet (303) utförs en dekvantisering för prediktivkoefficienten och de kvantiserade koefficien-terna förs till vart och ett kodningsblock (304, 311, 313, ..., 315) för att användas säsom filtreringskoefficienter i 15 dessas analys och syntesfilter, talsignal (300) som skall kodas förs till vart och ett talkodningsblock (304, 311, 313, ..., 315) sälunda, att frän densamma i avskiljningsorganen (305, 312, 314, ..., 316) subtraheras inverkan av var och en delexcitation, 20. de frän vart och ett kodningsblock (304, 311, 313, ..., • > 315. erhällna, av delexcitationen definierade ställena och amplituderna för excitationspulserna förs till kvantise-ringsorganet (306), kvantiseringsorganet (306) genererar totalexcitationens 25 kodframställning för pulsplatserna (309) och pulsamplituder-na (310), vilken framställning skall föras till multiplexern (318).
6. Patenttivaatimuksen 5 mukainen puhekooderi, tunnettu 5 siitä, että se käsittää LPC-analysaattorin (301), kvantisoijat (302, 306), enkoodauslohkon (303), puhekoodauslohkot (304, 311, 313, ..., 315), 10. erotuselimet (305, 312, 314, ..., 316), vektorikvantisoijan (307) sekä multiplekserin (318), siten, että koodattavalle puhesignaalille (300) suoritetaan LPC-15 analyysi LPC-analysaattorissa (301), ennustuskertoimet kvantisoidaan kvantisointilohkossa (302) ja kvantisointitulos (317) viedään multiplekserille (318) välitettäväksi edelleen dekooderille, dekvantisoijassa (303) suoritetaan dekvantisointi en-20 nustekertoimille ja kvantisoidut kertoimet viedään kuhunkin koodauslohkoon (304, 311, 313, ..., 315) käytettäväksi niiden analyysi- ja synteesisuodattimissa suodatinkertoimina, koodattava puhesignaali (300) viedään kullekin puhekoo-dauslohkolle (304, 311, 313, ..., 315) siten, että siitä 25 vähennetään erotuselimissä (305, 312, 314, ..., 316) kunkin ; *: osaherätteen vaikutus, kultakin koodauslohkoita (304, 311, 313, ..., 315) saatavat osaherätteen määrittelemät herätepulssien paikat ja amplitudit viedään kvantisoijalle (306), 30. kvantisoija (306) muodostaa multiplekserille (318) vie tävän kokonaisherätteen koodiesityksen pulssipaikoille (309) " ja pulssien amplitudeille (310).
7. Talkoder enligt patentkrav 6, kännetecknad av att den 30 frän avskiljningsorganet (316) erhällna signalen kodas i vektorkvantiseringsblocket (307) samt förmedlas vidare till dekodern (308).
7. Patenttivaatimuksen 6 mukainen puhekooderi, tunnettu 35 siitä, että erotuselimestä (316) saatu signaali koodataan vektorikvantisointilohkossa (307) ja välitetään edelleen dekooderille (308) . Il 95085
8. Talkoder enligt patentkrav 7, kännetecknad av att ana-35 lysfiltret (201) A(z) är av formen M A (z) = 1 - Σ a (j ) z‘j j=l 95085 syntesfiltret (203) S(z) är av formen S (z) = 1 / A(z) 5 och dessa (201, 203) kan innefatta även en filtrering för ett längt tidsinterval som strävar att äterge periodisiteten hos talsignalens tonande ljud.
8. Patenttivaatimuksen 7 mukainen puhekooderi, tunnettu siitä, että analyysisuodatin (201) A(z) on muotoa M
9. Talkoder enligt patentkrav 5, 6, 7 eller 8, känneteck-10 nad av att för signalen som skall kodas beräknats ett fler-tal prediktivparametrar och var och en delexcitation är sam-manfogad i ett filter som realiserar ett separat frekvens-svar sälunda, att i vart och ett kodningsblock (504, 508, 512, ...) utnyttjas sädana analys- och syntesfilter, hos 15 vilka koefficienterna som utnyttjas har beräknats att mot-svara den till ifrägavarande kodningsblock (504, 508, 512, ...) kommande signalen, och att i dekodern pä motsvarande sätt utnyttjas ett flertal parallella syntesfilter, hos vilka tili vart och ett förs den motsvarande avkodade delexci-20 tationen och den syntetiserade talsignalen erhälls säsom en summa av de medelst delexcitationerna syntetiserade signa-lerna.
FI922128A 1992-05-11 1992-05-11 Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi FI95085C (fi)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FI922128A FI95085C (fi) 1992-05-11 1992-05-11 Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
EP93303572A EP0570171B1 (en) 1992-05-11 1993-05-07 Digital coding of speech signals
US08/060,427 US5579433A (en) 1992-05-11 1993-05-07 Digital coding of speech signals using analysis filtering and synthesis filtering
DE69329569T DE69329569T2 (de) 1992-05-11 1993-05-07 Digitale Kodierung von Sprachsignalen
JP5109388A JPH06161498A (ja) 1992-05-11 1993-05-11 音声信号のディジタルコード化方法およびこの方法を実現するためのエンコーダならびにデコーダ

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI922128A FI95085C (fi) 1992-05-11 1992-05-11 Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
FI922128 1992-05-11

Publications (4)

Publication Number Publication Date
FI922128A0 FI922128A0 (fi) 1992-05-11
FI922128A FI922128A (fi) 1993-11-12
FI95085B FI95085B (fi) 1995-08-31
FI95085C true FI95085C (fi) 1995-12-11

Family

ID=8535271

Family Applications (1)

Application Number Title Priority Date Filing Date
FI922128A FI95085C (fi) 1992-05-11 1992-05-11 Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi

Country Status (5)

Country Link
US (1) US5579433A (fi)
EP (1) EP0570171B1 (fi)
JP (1) JPH06161498A (fi)
DE (1) DE69329569T2 (fi)
FI (1) FI95085C (fi)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
FI98163C (fi) * 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Koodausjärjestelmä parametriseen puheenkoodaukseen
FI96650C (fi) * 1994-07-11 1996-07-25 Nokia Telecommunications Oy Menetelmä ja laitteisto puheen välittämiseksi tietoliikennejärjestelmässä
US5761633A (en) * 1994-08-30 1998-06-02 Samsung Electronics Co., Ltd. Method of encoding and decoding speech signals
FR2729244B1 (fr) * 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
TW317051B (fi) * 1996-02-15 1997-10-01 Philips Electronics Nv
JP3364825B2 (ja) * 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
ZA974703B (en) * 1996-05-30 1997-12-30 Bayer Ag Substituted sulfonylamino(thio)carbonyl compounds.
JP3878254B2 (ja) * 1996-06-21 2007-02-07 株式会社リコー 音声圧縮符号化方法および音声圧縮符号化装置
JP3255022B2 (ja) 1996-07-01 2002-02-12 日本電気株式会社 適応変換符号化方式および適応変換復号方式
CA2213909C (en) * 1996-08-26 2002-01-22 Nec Corporation High quality speech coder at low bit rates
DE19641619C1 (de) * 1996-10-09 1997-06-26 Nokia Mobile Phones Ltd Verfahren zur Synthese eines Rahmens eines Sprachsignals
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
KR100447152B1 (ko) * 1996-12-31 2004-11-03 엘지전자 주식회사 디코더필터의연산처리방법
FI114248B (fi) 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
FI113903B (fi) 1997-05-07 2004-06-30 Nokia Corp Puheen koodaus
FI973873A (fi) 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
FI980132A (fi) 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US7972783B2 (en) * 2003-11-24 2011-07-05 Branhaven LLC Method and markers for determining the genotype of horned/polled cattle
KR101696632B1 (ko) * 2010-07-02 2017-01-16 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
JP2586043B2 (ja) * 1987-05-14 1997-02-26 日本電気株式会社 マルチパルス符号化装置
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
WO1990013112A1 (en) * 1989-04-25 1990-11-01 Kabushiki Kaisha Toshiba Voice encoder
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
US5271089A (en) * 1990-11-02 1993-12-14 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi

Also Published As

Publication number Publication date
FI922128A (fi) 1993-11-12
DE69329569T2 (de) 2001-05-31
FI95085B (fi) 1995-08-31
EP0570171A1 (en) 1993-11-18
US5579433A (en) 1996-11-26
FI922128A0 (fi) 1992-05-11
JPH06161498A (ja) 1994-06-07
DE69329569D1 (de) 2000-11-23
EP0570171B1 (en) 2000-10-18

Similar Documents

Publication Publication Date Title
FI95085C (fi) Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
CA1181854A (en) Digital speech coder
US7191125B2 (en) Method and apparatus for high performance low bit-rate coding of unvoiced speech
US7433815B2 (en) Method and apparatus for voice transcoding between variable rate coders
EP0175752B1 (en) Multipulse lpc speech processing arrangement
US5018200A (en) Communication system capable of improving a speech quality by classifying speech signals
FI98163C (fi) Koodausjärjestelmä parametriseen puheenkoodaukseen
JPH11507739A (ja) スピーチコーダ
WO1998052187A1 (en) Audio coding systems and methods
US5027405A (en) Communication system capable of improving a speech quality by a pair of pulse producing units
JPH10207498A (ja) マルチモード符号励振線形予測により音声入力を符号化する方法及びその符号器
KR970078038A (ko) 음성 부호화 및 복호화방법과 그 장치
EP1597721B1 (en) 600 bps mixed excitation linear prediction transcoding
KR20010075491A (ko) 음성 코더 매개변수를 양자화하는 방법
US5963897A (en) Apparatus and method for hybrid excited linear prediction speech encoding
EP1204092B1 (en) Speech decoder capable of decoding background noise signal with high quality
US20070106505A1 (en) Audio coding
Shlomot et al. Hybrid coding of speech at 4 kbps
JP2853170B2 (ja) 音声符号化復号化方式
Hedelin Relp-vocoding with uniform and non-uniform down-sampling
Ni et al. Waveform interpolation at bit rates above 2.4 kb/s
JPH0411040B2 (fi)
EP0138954B1 (en) Speech pattern processing utilizing speech pattern compression
JP2639118B2 (ja) マルチパルス型音声符号復号化装置
Nakhai et al. Split band CELP (SB-CELP) speech coder

Legal Events

Date Code Title Description
HC Name/ company changed in application

Owner name: NOKIA MATKAPUHELIMET OY

BB Publication of examined application