NL8020114A - Residu geeexciteerd voor spellend spraakcodeerstelsel. - Google Patents

Residu geeexciteerd voor spellend spraakcodeerstelsel. Download PDF

Info

Publication number
NL8020114A
NL8020114A NL8020114A NL8020114A NL8020114A NL 8020114 A NL8020114 A NL 8020114A NL 8020114 A NL8020114 A NL 8020114A NL 8020114 A NL8020114 A NL 8020114A NL 8020114 A NL8020114 A NL 8020114A
Authority
NL
Netherlands
Prior art keywords
signal
speech
signals
excitation
prediction error
Prior art date
Application number
NL8020114A
Other languages
English (en)
Original Assignee
Western Electric Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Electric Co filed Critical Western Electric Co
Publication of NL8020114A publication Critical patent/NL8020114A/nl

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

0020114 Vü 1059
Residu geëxciteerd voorspellend spraaKcodeerstelsel.
De onderhavige uitvinding heeft betrekking op digitale spraakcommunicatie en meer in het bijzonder op inrichtingen voor het coderen en decoderen van digitale spraaksignalen.
Het efficiënte gebruik van transmissiekanalen is van overwe-5 gend belang bij digitale communicatiestelsels waarbij de kanaal- breedte groot is. In verband hiermede zijn ingewikkelde codeer-, decodeer-, en multiplexinrichtingen ontwikkeld teneinde de bitsnel-heid van elk signaal &at aan het kanaal wordt toegevoerd, tot een minimum terug te brengen. Door de signaalbitsnelheid te verlagen 10 ' is het mogelijk de kanaalbandbreedte te verkleinen of het aantal signalen die op het kanaal kunnen worden gemultiplext te vergroten.
In de situatie waarin spraaksignalen over een digitaal kanaal worden overgedragen kan het kanaalrendement worden verbeterd door het spraaksignaal voorafgaande aan transmissie te comprimeren en 15 na transmissie uit het gecomprimeerde spraaksignaal een replica van de spraak te construeren. Door spraakcompressie bij digitale kanalen worden redundanties in het spraaksignaal weggenomen, zodat de essentiële spraakinformatie bij een verlaagde bitsnelheid kan worden gecodeerd. De spraaktransmissiebitsnelheid kan worden geko-20 zen teneinde een gewenste graad van spraakkwaliteit aan te houden.
Een bekende uitvoering van een codeerinrichting voor digitale spraak is beschreven in het Amerikaanse octrooischrift 3.624,302 dat op 30 november 1971 werd verleend en waarbij ingangsspraaksig-naal wordt onderworpen aan een lineaire voorspellingsanalyse waar-25 bij de spraak wordt onderverdeeld in opeenvolgende intervallen en een stel van parametersignalen die representatief zijn voor de in-tervalspraak teweeg wordt gebracht. Deze parametersignalen omvatten een stel van lineaire voorspellingscoëfficiëntsignalen die corresponderen met de spectraal omhullende van de intervalspraak, en timbre 30 en spraaksignalen corresponderende met de spraakexcitatie. üe para- 8 0 2 0 1 1 4 - 2 - metersignalen worden gecodeerd met een bitsnelheid die aanzienlijk lager is dan die welke is vereist om het spraaksignaal in zijn geheel genomen te coderen. De gecodeerde parametersignalen worden over een digitaal kanaal overgedragen naar een bestemming waaruit 5 de parametersignalen>door synthese een replica van het ingangs- spraaksignaal wordt geconstrueerd. De synthese-inrichting omvat voorzieningen waardoor uitgaande van de gedecodeerde timbre- en spraaksignalen een excitatiesignaal teweeg wordt gebracht, en voor-het zieningen waardoor/excitatiesignaal door de door de omhullende re-10 presentatieve voorspellingscoëfficiënten wordt gewijzigd in een al-polig voorspellend filter.
Alhoewel de in het voorafgaande behandelde timbre-geëxci-teerde lineaire voorspellende codering wat bitsnelheidvermindering betreft bijzonder efficiënt is, hebben de spraakreplica zoals afge-15 leid van de synthese-inrichting een synthetische kwaliteit waardoor geen getrouwe weergave van de natuurlijke menselijke spraak bestaat. De synthetische kwaliteit is in het algemeen te wijten aan onnauwkeurigheden in de teweeggebrachte lineaire voorspellingscoëfficiirit·; · signalen waardoor de lineaire voorspelling spectraalomhullende af-20 wijkt van de werkelijke spectraalomhullende van het spraaksignaal^ alsook aan onnauwkeurigheden in de timbre- en spraaksignalen. Dergelijke onnauwkeurigheden blijken te ontstaan als gevolg van verschillen tussen de menselijke spreekorganen en het al-polig filter-model van de codeerinrichting, en verschillen tussen de menselijke 25 spraakexcitatieapparatuur en de timbreperiode en spraakinrichtin- gen van de codeerinrichting. Voor verbeteringen van de spraakkwali-teit zijn tot nu toe aanzienlijk meer gecompliceerde codeertech-nieken vereist waarbij wordt gewerkt met bitsnelheden die aanzienlijk groter zijn dan die welke bij het timbre geëxciteerde lineair 30 voorspellende codeerschema worden toegepast. Het is een doel van de uitvinding om natuurlijk klinkende spraak te kunnen produceren met behulp van een digitale spraakcodeerinrichting en bij relatief lage bitsnelheden.
Samenvatting van de uitvinding: 35 In het algemeen geldt, dat de excitatie van de synthese- 8020114 - 3 - inrichting zoals deze gedurende spraakgedeelten van het spraaksignaal werkzaam is, een reeks van door timbreperiödes gescheiden pulsen oplevert. Ingezien is dat variaties in de vorm van de excita-tiepulsen invloed hebben op de kwaliteit van de door synthese ver-5 kregen spraakreplica. Een gefixeerde excitatiepulsvorm resulteert echter niet in een natuurlijk klinkend spraakreplica. Bepaalde ex-citatiepuIsvormen betekenen echter een verbetering ten aanzien van gekozen eigenschappen. Ik heb ontdekt dat de onnauwkeurigheden in lineaire voorspellingscoëfficiëntsignalen zoals teweeggebracht in 10 de voorspellende analysator kunnen worden gecorrigeerd door het voorspellende synthese-inrichtingexcitatiesignaal in een zodanige vorm te brengen, dat de fouten in de voorspellende coëfficiëntsigna-len worden gecompenseerd. 0e resulterende codeerinrichting geeft natuurlijk klinkende spraaksignaalreplica’s bij bitsnelheden die 15 aanzienlijk lager zijn dan die van andere codeersystemen zoals PCM of adaptieve voorspellende coderingen.
De uitvinding heeft betrekking op een spraakverwerkende inrichting waarin een spraakanalysator werkzaam is om een spraaksignaal in intervallen te verdelen alsook om een stel van eerste sig-20 nalen die representatief zijn voor de voorspellingsparameters van het intervalspraaksignaal, en timbre- en spraakrepresentatieve signalen teweeg te brengen. Een signaal dat correspondeert met de voorspellingsfout van het interval wordt ook teweeggebracht. Een spraaksynthese-inrichting is werkzaam om in respons op de timbre-25 en spraakrepresentatieve signalen een excitatiesignaal teweeg te brengen, alsook om het excitatiesignaal te combineren met de eerste signalen, teneinde een replica van het spraaksignaal te construeren. Verder omvat de analysator apparatuur voor het teweegbrengen van een stel van tweede signalen die representatief zijn voor het 30 spectrum van het intervalvoorspellingsfoutsignaal. In responsie op de timbre- en spraakrepresentatieve signalen en de tweede signalen wordt in de synthese-inrichting een voorspellingsfoutcompense-rend excitatiesignaal gevormd waardoor een natuurlijk klinkend spraakreplica wordt geconstrueerd.
35 Volgens een aspect van de uitvinding wordt het voorspellings- foutcompenserend excitatiesignaal gevormd door in responsie op de 80 2 0 1 1 4 - 4 - timbre- en spraakrepresentatieve signalen een eerste excitatiesig-naal teweeg te brengen en door het eerste excitatiesignaal in responsie op de tweede signalen in vorm te brengen.
Volgens een ander aspect van de uitvinding omvat het eerste 5 excitatiesignaal een reeks van excitatiepulsen die gezamenlijk wor den geproduceerd in responsie op de timbre- en spraakrepresentatieve signalen. De excitatiepulsen worden gewijzigd in responsie op de tweede signalen teneinde een reeks van voorspellingsfoutcompen-serende excitatiepulsen te vormen.
10 Volgens nog een ander aspect van de uitvinding wordt in res ponsie op het voorspellingsfoutsignaal in de spraakanalysator een aantal voorspellingsfoutspectraalsignalen gevormd. Elk voorspel-lingsfoutspectraalsignaal correspondeert met een vooraf bepaalde frequentie. Van de voorspellingsfoutspectraalsignalen worden gedu-15 rende elk interval steekproeven genomen teneinde de tweede signa len te produceren.
Volgens nog een ander aspect van de uitvinding worden de gewijzigde excitatiepulsen in de spraaksynthese-inrichting gevormd doordat uitgaande van de timbre- en spraakrepresentatieve signalen 20 een aantal excitatiespectraalcomponentsignalen corresponderende met de vooraf bepaalde frequenties, en uitgaande van de timbre-representatieve signaal en de tweede signalen een aantal voorspel-lingsfoutspectraalcoëfficiëntsignalen corresponderende met de vooraf bepaalde frequenties, te genereren. De excitatiespectraalcompo-25 nentsignalen worden gecombineerd met de voorspellingsfoutspectraal- coëfficiëntsignalen teneinde de voorspellingsfoutcompenserende excitatiepulsen teweeg te brengen.
Fig.l geeft een blokschema van een spraaksignaalcodeerketen die illustratief is voor de uitvinding; 30 Fig.2 geeft een blokschema van een spraaksignaaldecodeerke- ten die illustratief is voor de uitvinding;
Fig.3 geeft een blokschema van een voorspellende foutsig-naalgenerator die kan worden gebruikt in de keten volgens fig.l;
Fig.4 geeft een blokschema van een spraakintervalparameter-35 computer die kan worden gebruikt in de keten volgens fig.l; 802 0 1 14 - 5 -
Fig.5 geeft een bloKschema van een voorspellingsfoutspec-traalsignaalcomputer die Kan worden gebruikt in de Keten volgens fig·1*
Fig.6 geeft een bloKschema van een spraaksignaalexcitatie-5 generator die Kan worden gebruikt in de Keten volgens fig.2j
Fig.7 geeft een gedetailleerd bloKschema van de voorspel-lingsfoutspectraalcoëfficiëntgenerator volgens fig.2; en
Fig.8 geeft golfvormen ter illustratie van de werking van de spraakintervalparametercomputer volgens fig.4.
10 Een spraaksignaalcodeerketen die illustratief is voor de uit vinding is weergegeven in fig.l. Blijkens fig.l jwordt een spraaksignaal gegenereerd in een spraaksignaalbron 101 die Kan bestaan uit een microfoon, een telefoonhoorn of andere elektro-acoustische Een transducent. vanai spraaksignaalbron 101 afkomstig spraaksig-15 naai s(t) wordt toegevoerd aan een filter- en steekproefnameketen 103 waarin het signaal s(t) wordt gefilterd en waarvan met een bepaalde snelheid steekproeven worden genomen. De keten 103 kan b.v. omvatten een laagdoorlaatfilter met een afsnij frequentie van 4 kHz en een steekproefnameketen met een steekproefnamesnelheid van ten-20 minste 8 kHz. De reeks van signaalsteekproeven Sn wordt toegevoerd aan de analoog-digitaalomzetter 105 waarin elke steekproef wordt omgezet in een digitale code sn dat voor gebruik in de codeerinrich-ting geschikt is. De A/D-omzetter 105 is tevens werkzaam om de gecodeerde signaalsteekproeven te verdelen in opeenvolgende tijds-25 intervallen of rasters met een duur van 10 ms.
De van de A/D-omzetter 105 afkomstige signaalsteekproeven worden via de vertragingsketen 120 toegevoerd aan de ingang van de voorspellingsfoutsignaalgenerator 122 en via lijn 107 toegevoerd aan de ingang van de intervalparametercomputer 130. De parameter-30 computer 130 is werkzaam om een stel signalen te vormen die de ingangsspraak karakteriseren maar die met een bitsnelheid die aanzienlijk lager is dan die van het spraaksignaal zelf worden overgedragen. Verlaging van de bitsnelheid wordt verkregen aangezien spraak over intervallen van 10 - 20 msec een kwasi-stationaire aard heeft. Voor elk interval in dit gebied kan een enkel stel van 35 signalen worden gegenereerd welke signalen representatief zijn voor 802 0 1 1 4 - 6 - de informatie-inhoud van de intervalspraak. Zoals uit de techniek algemeen bekend is kunnen de spraakrepresentatieve signalen omvatten een stel van voorspellingscoëfficiëntsignalen en timbre- en spraakrepresentatieve signalen. De voorspellingscoëfficiëntsignalen 5 karakteriseren de vocale organen gedurende het spraakinterval ter wijl de timbre- en spraaksignalen de glotale pulsexcitatie-voor de vocale organen karakteriseren.
De intervalparametercomputer 130 is nader gedetailleerd weergegeven in fig.4. In fig.4 weergegeven keten omvèt een besturings-10 gedeelte 401 en een processor 410. De processor 410 is ingericht voor het ontvangen van de spraaksteekproeven sn van elk van de opeenvolgende intervallen en voor het genereren van een stel lineaire voorspellingscoëfficiëntsignalen, een stel van reflectiecoëfficiënt-signalen, een timbre-representatief signaal en een spraakrepresen-15 tatief signaal in responsie op de intervalspraaksteekproeven. De teweeggebrachte signalen worden resp. opgeslagen in de geheugens 430, 432, 434 en 436. De processor 410 kan bestaan uit het CSP Incorporated Macro-Arithmetic Processor System 100, of andere processor- of microprocessorinrichtingen die in dit gebied van de tech-20 niek algemeen bekend zijn. De werking van de processor 410 staat onder het bestuur van de permanent opgeslagen programma-informatie afkomstig van de uitsluitend afleesbare geheugens 403, 405 en 407.
Het besturingsgedeelte 401 volgens fig.4 is ingericht om elk 10 msec spraakinterval te verdelen in een reeks van tenminste vier 25 vooraf bepaalde tijdsintervallen. Elk tijdsinterval is toegewezen aan een bepaalde bedrijfsmodus. De bedrijfsmodusreeks is geïllustreerd door de golfvormen volgens fig.0. De in fig.8 weergegeven golfvorm 801 is illustratief voor klokpulsen CL1 die verschijnen met de steekproefnamesnelheid. De golfvorm 803 van fig.8 is illu-30 stratief voor klokpulsen CL2 welke pulsen verschijnen aan het begin van elk spraakinterval. De CL2-klokpuls die op het tijdstip t^ verschijnt brengt het besturingsgedeelte 401 in zijn data-ingangsmodus zoals geïllustreerd door de golfvorm 805. Gedurende de data-ingangs-modus is het besturingsgedeelte 401 verbonden met de processor 410 35 en met het spraaksignaalgeheugen 409. In responsie op besturings- 8020114 - 7 - signalen afkomstig van het besturingsgedeelte 401 worden de 80 steekproefnamecodes die gedurende het voorafgaande spraakinterval van 10 msec werden ingevoerd in het spraaksignaalgeheugen 409, via de ingangs/uitgangskoppelketen 420 overgedragen naar het datageheu-5 gen 418. Terwijl de opgeslagen 80 steekproeven van het voorafgaande spraakinterval worden overgedragen naar het datageheugen 418, worden de huidige spraakintervalsteekproeven via de lijn 107 ingevoerd in het spraaksignaalgeheugen 409.
Wanneer de overdracht van de voorafgaande intervalsteekproe-10 ven naar het datageheugen 418 is voltooid, wordt het besturingsge deelte 401 in responsie op de CL1-klokpuls die op het tijdstip t3 verschijnt, omgeschakeld naar zijn voorspellingscoëfficiëntgenereer-modus. Tussen de tijdstippen t^ en t^ is het besturingsgedeelte 401 verbonden met het LPC-programmageheugen 403, en via de besturings-15 gedeeltekoppeleenheid 412 met de centrale processor 414 en de reken processor 416. Op deze wijze is het LPC-programmageheugen 403 verbonden met de processor 410. In responsie op de instructies die permanent zijn opgeslagen in het uitsluitend afleesbare geheugen 403, is de processor 410 werkzaam om partiële correlatiecoëfficiënt- 20 signalen R = r^, r^ ...... en lineaire voorspellingscoëfficiënt- signalen A = a^. a^....... a 2 teweeS te brengen. Zoals algemeen bekend is in de techniek is de partiële correlatiecoëfficiënt de negatieve vorm van de reflectiecoëfficiënt; De signalen R en A worden vanaf de processor 410 resp. overgedragen naar de geheugens 432 25 en 430 en wel via de ingangs/uitgangskoppeleenheid 420. De in het uitsluitend afleesbare geheugen 403 opgeslagen instructies voor het teweegbrengen van de reflectiecoëfficiëntsignalen en lineaire voor-spellingscoëfficiëntsignalen zijn in Appendix 1 in Fortran-taal overzichtelijk weergegeven.
30 Zoals algemeen bekend in de techniek worden de reflectie- coëfficiëntsignalen R gegenereerd door eerst de co-variantiematrix P te vormen waarvan de termen zijn gegeven door: 80 i = 1, 2, ..... 12 P. . = JT s .s . (1) ij _ — i n 1 n J · *i ^ 35 n-1 J j = 1, 2, ..... 12 en de spraakcorrelatiefactoren 8 0 2 0 1 1 4 - 8 - BO .
C. = Σ. s s . i = 1, 2, ..... 12 (2] l n n-i n=l
Factoren g^ t/m g^ worden vervólgens berekend volgens 'sii r°r 5 g2 c2 T . _ . (3) • · _ g12_ _ C12_ 10 waarin T de lagere driehoeksmatrix voorstelt die wordt verkregen door de driehoeksdecompositie van
Cp^J = T T _1 (4) waarna de partiële correlatiecoëfficiënten worden gegenereerd volgens 15 Sm ^m--80-“ -=1^2,.:....12 (5] co - £ g.Jl/2 0 n^l 1 80 c -Σ s 0 n=l n 20 cq correspondeert met de energie van het spraaksignaal in het 10 msec interval. De lineaire voorspellingscoëfficiëntsignalen A = a^, a2 ..... a^ worden uitgaande van de partiële correlatiecoëffici- entsignalen rm berekend volgens de recursieve formulering a.(m) = a.(m+l] + r a , (m-ΓΪ ' (6] ïi m m-1 25 a (o] = 1; i = 1, 2, .....rrrl o j = 1, 2......12
De partiële correlatiecoëfficiëntsignalen R en de lineaire voor-spellingscoëfficiëntsignalen A die gedurende de lineaire voorspel-lingscoëfficiëntgenereermodus in de processor 410 worden gegenereerd, 30 worden vanaf het datageheugen 418 voor verder gebruik overgedragen naar de geheugens 430 en 432.
Nadat de partiële correlatiecoëfficiëntsignalen R en de lineaire voorspellingscoëfficiëntsignalen A in de geheugens 430 en 432 (op het tijdstip t^] zijn ingevoerd, is de lineaire voorspel- 35 lingscoëfficiëntgenereermodus beëindigd en de timbreperiodesignaal- 802 0 1 14 - 9 - genereermodus wordt gestart. Op deze tijd wordt het besturingsge-deelte 401 overgeschakeld naar zijn timbremodus hetgeen is aangege-ven door de golfvorm 809. In deze modus is het timbreprogrammageheu-gen 405 verbonden met de besturingsgedeeltekoppeleenheid 412 van de 5 processor 410. De processor 410 staat dan onder het bestuur van de permanent in het uitsluitend afleesbare geheugen 405 opgeslagen instructies zodat een timbrerepresentatiefsignaal voor het voorafgaande spraakinterval wordt geproduceerd in responsie op de spraak-steekproeven in het datageheugen 418 corresponderende met het voor-10 afgaande spraakinterval. De permanent in het uitsluitend afleesbare geheugen 405 opgeslagen instructies zijn in Appendix 2 in Fortran-taal overzichtelijk weergegeven. De door de werkingen van de centrale processor 414 en de rekenprocessor 416 teweeggebrachte timbre-representatieve signalen worden vanaf het datageheugen 418 via de 15 ingangs/uitgangskoppeleenheid 420 overgedragen naar het timbresig- naalgeheugen 434. Op het tijdstip t^ wordt het timbrerepresentatie-ve signaal ingevoerd in het geheugen 434 en de timbreperiodemodus is beëindigd.
Op het tijdstip t^ wordt het besturingsgedeelte 401 van zijn 20 timbreperiodemodus overgeschakeld naar zijn spraakmodus, hetgeen is aangegeven door de golfvorm 811. Tussen de tijdstippen t^ en tg is het uitsluitend afleesbare geheugen 407 verbonden met de processor 410. Het uitsluitend afleesbare geheugen 407 bevat permanent opgeslagen signalen die corresponderen met een reeks van besturings-25 instructies dienende om uitgaande van een analyse van de spraak- steekproeven van dat interval het spraakkarakter van het voorafgaande spraakinterval te bepalen. Dit permanent in het uitsluitend afleesbare geheugen 407 opgeslagen programma is in Appendix 3 in Fortran-taal overzichtelijk weergegeven. In responsie op de in-30 structies van het uitsluitend afleesbare geheugen 407 is de proces sor 410 werkzaam om de spraaksteekproeven van het voorafgaande interval te analyseren volgens hetgeen is vermeld in het artikel "A Pattern-Recognition Approach to.:V<öiced-Unvoiced-Silence Classification With Applications to Speech Recognition" door 35 B.S.Atal en L.R.Rabiner, gepubliceerd in IEEE Transactions on 802 0 1 1 4 - 10 -
Acoustics, Speech, and Signal Processing, Vol. ASSP-24, No.3, juni 1976. In de rekenprocessor 416 wordt dan een signaal V gegenereerd dat het spraakinterval karakteriseert als een spraak bevattend interval of als een geen spraak bevattend interval. Het resulterende 5 spraaksignaal wordt ingevoerd in het datageheugen 413 en wordt van daaruit op het tijdstip tj. via de ingangs/uitgangskoppeleenheid 420 overgedragen naar het spraaksignaalgeheugen 436. Op het tijdstip t^ ontkoppelt het besturingsgedeelte 401 het uitsluitend afleesbare geheugen 407 van de processor 410 en de spraaksignaalgenereermodus 10 is beëindigd zoals is aangegeven door de golfvorm 811.
De reflectiecoëfficiëntsignalen R en de timbre- en spraakre-presentatieve signalen P en V afkomstig van de geheugens 432, 434 en 436 worden in responsie op de op het tijdstip tg verschijnende CL2-klokpuls, via de vertragingsketens 137, 138 en 139 toegevoerd 15 aan de parametersignaalcodeerinrichting 140 volgens fig.l. Alhoewel uitgaande van de reflectiecoëfficiëntsignalen, en de timbre- en spraaksignalen zoals verkregen vanuit de parametercomputer 130 door synthese een replica van de ingangsspraak kan worden gevormd, heeft de resulterende spraak niet de natuurlijke eigenschappen van mense-20 lijke spraak. Het kunstmatige karakter van de spraak zoals afgeleid van de reflectiecoëfficiëntsignalen en de timbre- en spraaksignalen van de computer 130 is primair het gevolg van fouten in de voorspel-lingsreflectiecoëfficiënten zoals gegenereerd in de parametercomputer 130. Volgens de uitvinding worden deze fouten in de voorspel-25 lingscoëfficiënten gedetecteerd in de voorspellingsfoutsignaalgene- rator 122. Signalen representatief voor het spectrum van de voorspel-lingsfout voor elk interval worden geproduceerd en gecodeerd resp. in de voorspellingsfoutspectraalsignaalgenerator 124 en de spectraal-signaalcodeerinrichting 126. De codeerspectraalsignalen worden samen 30 met de reflectiecoëfficiëntsignalen en de timbre-, en spraaksignalen zoals afkomstig van de parametercodeerinrichting 140, in de multiplexer ISO gemultiplext. Doordat in het gecodeerde uitgangssignaal van de spraakcodeerinrichting volgens fig.l voor elk spraakinterval de voorspellingsfoutspectraalsignalen zijn opgenomen is het moge-35 lijk om gedurende het decoderen in de spraakdecodeerinrichting vol- 80 2 0 1 1 4 - 11 - gens fig.2 de fouten in de lineaire voorspellingsparameters te compenseren. Het vanaf de decodeerinrichting volgens fig.2 verkregen spraakreplica klinkt natuurlijk.
Het voorspellingsfoutsignaal wordt geproduceerd in de genera-5 tor 122 die nader gedetailleerd is weergegeven in fig.3. Bij de ketenconfiguratie volgens fig.3 worden de signaalsteekproeven vanaf de A/D-omzetter 105 ontvangen op de lijn 312 nadat de signaalsteekproeven in: de ;keten 120 zijn vertraagd over een tijd over eenkomende met een spraakinterval. De vertraagde signaalsteekproe-10 ven worden toegevoerd aan het schuifregister 301 dat werkzaam is om de binnenkomende steekproeven met de CL1-klokfrequentie van 8 kHz te verschuiven. Elke trap van het schuifregister 301 geeft een uitgangssignaal af aan een van de vermenigvuldigers 303-1 t/m 303-12. De lineaire voorspellingscoëfficiëntsignalen voor het ihter- 15 val a^, a^ ..... a^ die corresponderen met de steekproevenndie worden aangelegd aan het schuifregister 301, worden vanaf het geheugen 430 en via de lijn 315 toegevoerd aan de vermenigvuldigers 303-1 t/m 303-12. De uitgangssignalen van de vermenigvuldigers 303-1 t/m 303-12 worden gesommeerd in de optellers 305-2 t/m J05-12 zodat 20 het uitgangssignaal van de opteller 305-12 het voorspelde spraak signaal is 12 s = Σ. a.s (7) n . . ï n-i i=l 25 De aftrekketen 320 ontvangt de opeenvolgende spraaksignaalsteek- proeven sn vanaf de lijn 312 en de voorspelde waarde voor de opeenvolgende spraaksteekproeven vanaf de uitgang van de' opteller 305-12, en brengt een verschilsignaal dn teweeg dat correspondeert met de voorspellingsfout.
De reeks van voorspellingsfoutsignalen voor elk spraakinter- O u * val wordt vanaf de aftrekketen 320 toegevoerd aan de voorspellings-foutspectraalsignaalgenerator 124. De spectraalsignaalgenerator 124 is meer gedetailleerd weergegeven in fig.5 en omvat een spectraal-analysator 504 en een spectraalsteekproefnameketen 513. In responsie op elke voorspellingsfoutsteekproef d die op de lijn 501 aan-35 π wezig is, geeft de spectraalanalysator 504 een stel van 10 signalen 8020114 -12- .....c(f^Q] a^‘ van deze signalen is representatief voor een spectraalcomponent van het voorspellingsfoutsignaal.
De spectraalcomponentfrequenties f^, ·· f^g z:Un vooraf be paald en gefixeerd. Deze vooraf bepaalde frequenties zijn zodanig 5 gekozen dat het frequentiegebied van het spraaksignaal daardoor ge lijkmatig wordt bestreken. Voor elke vooraf bepaalde frequentie f wordt de reeks van voorspellingsfoutsignaalsteekproeven dn van het spraakinterval toegevoerd aan de ingang van een cosinusfilter met een centerfrequentie f^ en een impulsresponsie h^. die is gegeven 10 door h. = hAr) (O-54 " °»46 cos 2^f kT] Cosf.kT (8) wanneer T = het steekproefname-interval = 125 ysec f - de frequentieafstand van de filtercenterfrequenties _ 300 Hz 15 k = 0, 1, .....26 alsook aan de ingang van een sinusfilter met dezelfde centerfrequentie en met een impulsresponsie h’ gegeven door h’ = (0,54 - 0,46 cos 2Tf kT] sin f.kT (9) k 0,54 o i
Het cosinusfilter 503-1 en het sinusfilter 505-1 hebben elk eenzelf-20 de centerfrequentie f^ die 300 Hz kan zijn. Het cosinusfilter 503-2 en het sinusfilter 505-2 hebben elk eenzelfde centerfrequentie f^ die 600 Hz kan zijn, en het cosinusfilter 503-10 en het sinusfilter 505-10 hebben elk een centerfrequentie f^ die 3000 Hz kan zijn.
Het uitgangssignaal van het cosinusfilter 503-1 wordt met 25 zichzelf vermenigvuldigd in een kwadrateerketen 507-1, terwijl het uitgangssignaal van het sinusfilter 505-1 eveneens met zichzelf wordt vermenigvuldigd in een kwadrateerketen 509-1. De som van de vanaf de ketens 507-1 en 509-1 afkomstige gekwadrateerde signalen wordt gevormd in de opteller 510-1 en de vierkantswortelketen 512-1 30 is werkzaam om het spectraalcomponentsignaal corresponderend met de frequentie f^ te produceren. Op dezelfde wijze zijn dé filters 503-2, 505-2, de kwadrateerketens 507-2 en 509-2, de optelketen 510-2 en de vierkantswortelketen 512-2 in combinatie werkzaam om het spectraalcomponentsignaal cCfjl corresponderende met de frequen-35 tie ·?2 te vormen. Op soortgelijke wijze wordt het spectraalcompo- 8 0 2 0 1 1 4 - 13 - nentsignaal van de vooraf bepaalde frequentie f verkregen vanaf de vierkantswortelketen 512-10. De voorspellingsfoutspectraalsigna-len die afkomstig zijn van de uitgangen van de vierkantswortelke-t ens 512-1 t/m 512-10 worden toegevoerd aan de steekproefnameketens 5 513-1 t/m 513-10. In elke steekproefnameketen worden van het voor- spellingsfoutspectraalsignaal aan het einde van elk spraakinterval door het kloksignaal CL2 steekproeven genomen en deze steekproeven worden daarin opgeslagen. Het stel van voorspellingsfoutspectraal-signalen zoals afkomstig van de steekproefnameketens 513-1 t/m 10 513-10, wordt in parallelvorm toegevoerd aan de spectraalsignaal- codeerinrichting 126, waarvan het uitgangssignaal wordt overgedragen naar de multiplexer 150. Op deze wijze ontvangt de multiplexer 150 voor elk spraakinterval gecodeerde reflectiecoëfficiëntsignalen R en timbre- en spraaksignalen P en V vanaf de parametersignaalco-15 deerinrichting 140, alsook over hetzelfde interval de gecodeerde voorspellingsfoutspectraalsignalen c(fn) vanaf de spectraalsignaal-codeerinrichting 126. De aan de multiplexer 150 toegevoerde signalen definiëren de spraak van elk interval in termen van een gemul-tiplexte combinatie van parametersignalen. De gemultiplexte parame-20 t ersignalen worden over het kanaal 1B0 overgedragen met een bitsnel- heid die aanzienlijk lager is dan die van de gecodeerde 8 kHz spraaksignaalsteekproeven waarvan de parametersignalen werden afgeleid.
De gemultiplexte gecodeerde parametersignalen zoals afkom-25 stig van het communicatiekanaal 180 worden aangelegd aan de spraak- decodeerketen van fig.2, waarin door synthese een replica vanhet spraaksignaal afkomstig van de spraakbron 101 wordt geconstrueerd. Het communicatiekanaal 180 is verbonden met de ingang van de demultiplexer 201 die werkzaam is om de gecodeerde parametersignalen van 30 elk spraakinterval te scheiden. De gecodeerde voorspellingsfoutspec- traalsignalen van het interval worden toegevoerd aan de decodeer-inrichting 203. Het gecodeerde voor timbre representatieve signaal wordt; toegevoerd aan de decodeerinrichting 205. Het gecodeerde spraaksignaal voor het interval wordt toegevoerd aan de decodeer-35 inrichting 207 en de gecodeerde reflectiecoëfficiëntsignalen van 8 0 2 0 1 14 - 14 - het interval worden toegevoerd aan de decodeerinrichting 209.
De vanaf de decodeerinrichting 203 afkomstige spectraalsig-nalen, het vanaf de decodeerinrichting 205 afkomstige voor timbre representatieve signaal, en het vanaf de decodeerinrichting 207 af-5 komstige voor spraak representatieve signaal worden opgeslagen in resp. de geheugens 213, 215 en 217. De uitgangssignalen van deze geheugens worden vervolgens gecombineerd in de excitatiesignaalgenera-tor 220 die een voorspellingsfoutcompenserend excitatiesignaal toevoert aan de ingang van de lineaire voorspellingscoëfficiëntsynthese-10 inrichting 230. De synthese-inrichting ontvangt vanaf de als coëf- ficiëntomzetter en geheugen werkzame keten 219 lineaire voorspel-lingscoëfficiëntsignalen a^, ..... a^, welke coëfficiënten wor den afgeleid van de reflectiecoëfficiëntsignalen van de decodeerinrichting 209. De excitatiesignaalgenerator 220 is nader gedetail-15 leerd weergegeven in fig.6. De ketenconfiguratie van fig.6 omvat een excitatiepulsgenerator 618 en een excitatiepulsvormketen 650.
De excitatiepulsgenerator ontvangt vanaf het geheugen 215 de voor timbre representatieve signalen die worden toegevoerd aan de pulsgenerator 620. De pulsgenerator 620 geeft in responsie op het voor 20 timbre representatieve signaal een reeks van uniforme pulsen af.
Deze uniforme pulsen worden gescheiden door de timbreperiodes zoals gedefinieerd door het voor timbre representatieve signaal dat afkomstig is van het geheugen 215. Het uitgangssignaal van de pulsgenerator 620 wordt toegevoerd aan de schakelaar 624 die tevens het 25 uitgangssignaal van de witte-ruisgenerator 622 ontvangt. De schake laar 624 kan reageren op het voor spraak representatieve signaal dat afkomstig is van het geheugen 217. In het geval dat het voor spraak representatieve signaal in een toestand verkeert corresponderende met een spraak bevattend interval, is de uitgang van de 30 pulsgenerator 620 verbonden met de ingang van de excitatievormketen 650. Wanneer het voor spraak representatieve signaal een·geenspraak bevattend interval aangeeft, verbindt de schakelaar 624 de uitgang van de witte-ruisgenerator 622 met de ingang van de exci-tatievormketen 650.
35 Het vanaf de schakelaar 624 afkomstige excitatiesignaal wordt aangelegd aan de spectraalcomponentgenerator 603 welke genera- 80 2 0 1 1 4 - 15 - tor voor elke vooraf bepaalde frequentie f ^· · een Paar van filters omvat. Het filterpaar omvat een cosinusfilter met een karakteristiek die voldoet aan de vergelijking (8] en een sinusfilter met een karakteristiek die voldoet aan de vergelijking (9).
5 De cosinusfilters 603-11 en 603-12 geven voor een vooraf bepaalde frequentie f^ spectraalcomponentsignalen. Op soortgelijke wijze geven het cosinusfilter 603-21 en het ;sinusfilter 603-22 de spectraalcomponentsignalen voor de frequentie en °P soortgelijke wijze geven het cosinusfilter 603-n1 en het sinusfilter 603-n2 de spec-10 traalcomponenten voor de vooraf bepaalde frequentie f10·
De vanaf de spraakcodeerketen van fig.l afkomstige voorspel-lingsfoutspectraalsignalen worden samen met het voor timbre representatieve signaal dat afkomstig is van de codeerinrichting toegevoerd aan de filteramplitudecoëfficiëntgenerator 601. De keten 601 15 die meer gedetailleerd is weergegeven in fig.7, is werkzaam om voor elk spraakinterval een stel van spectraalcoëfficiëntsignalen te produceren. Deze spectraalcoëfficiëntsignalen definiëren het spectrum van het voorspellingsfoutsignaal voor het spraakinterval. De keten 610 is werkzaam om de spectraalcomponentsignalen zoals afkomstig 20 van de spectraalcomponentgenerator 603 te combineren met de spec traalcoëfficiëntsignalen zoals afkomstig van de coëfficiëntgenera-tor 601. Het vanaf de keten 610 afkomstige gecombineerde signaal is een reeks van voorspellingsfoutcompenserende excitatiepulsen die worden toegevoerd aan de syntheseketen 230.
25 De coëfficiëntgeneratorketen van fig.7 omvat een groep-ver- tragingsgeheugen 701, een fasesignaalgenerator 703 en een spectraal-coëfficiëntgenerator 705. Het groepvertragingsgeheugen 701 is ingericht voor het opslaan van een stel van vooraf bepaalde vertragings- tijden ^ ..... 610' ^eze vertragingen zijn langsexperimente- 30 le weg uit een analyse van vocale geluiden gekozen. De vertragingen corresponderen met een mediaangroepvertragingseigenschap-van een representatief vocaal geluid waarvan tevens is gebleken, dat deze even goed werkt voor andere vocale geluiden.
De fasesignaalgenerator 703 is ingericht voor het teweeg-35 brengen van een groep van fasesignalen 0^, 0^ ..... volgens 8020114 - 16 -
Ti 0, = — i = 1, 2......10 (10) i p in responsie op het timbrerepresentatieve signaal afkomstig van de lijn 710 en de groepvertragingssignalen , T2 ..... ^ vanaf het' geheugen 701. Zoals blijkt uit vergelijking (10) zijn de fasen van 5 de spectraalcoëfficiëntsignalen een functie van de groepvertragings signalen en het timbreperiodesignaal afkomstig van de spraakcodeer- inrichting volgens fig.l. De fasesignalen 0 , 0^ ..... 0^ worden via de lijn 730 toegevoerd aan de spectraalcoëfficiëntgenerator 705. De coëfficiëntgenerator 705 ontvangt tevens de voorspellingsfout-10 spectraalsignalen vanaf het geheugen 213 en via de lijn 720. In de generator 705 wordt voor elke vooraf bepaalde frequentie een spec-traalcoëfficiëntsignaal gevormd volgens
Hi' 1 = cos i 1. 2, ..... 10 en . (11) 15 2 = Ctf^sin 0
Zoals blijkt uit de vergelijkingen (10) en (11) kunnen de fasesig-naalgenerator 703 en de spectraalcoëfficiëntgenerator 705 op zichzelf bekende rekenketens omvatten.
Uitgangssignalen van de spectraalcoëfficiëntgenerator 705 20 worden via de lijn 740 toegevoerd aan de combineerketen 610. In de keten 610 wordt het spectraalcomponentsignaal dat afkomstig is van het cosinusfilter 603-11 in de vermenigvuldiger 607-11 vermenigvuldigd met het spectraalcoëfficiëntsignaal H. . , terwijl het spec- » * l traalcomponentsignaal afkomstig van het sinusfilter 603-12 in de 25 vermenigvuldiger 607-12 wordt vermenigvuldigd met het spectraalco- efficiëntsignaal Η..-,. Op soortgelijke wijze is de vermenigvuldiger 607-21 werkzaam om het spectraalcomponentsignaal dat afkomstig is van het cosinusfilter 603-21 te combineren met het spectraalcoëffi-ciëntsignaal H„ . dat afkomstig is van de keten 601, terwijl de Z j 1 30 vermenigvuldiger 607-22 werkzaam is om het spectraalcomponentsig naal dat afkomstig is van het sinusfilter 603-22 te combineren met het spectraalcoëfficiëntsignaal H_ _. Dp soortgelijke wijze worden
Z 3 Z
de spectraalcomponent en spectraalcoëfficiëntsignalen van de vooraf bepaalde frequentie f gecombineerd in de vermenigvuldigers 607-35 n1 en 607-n2. De uitgangssignalen van de in de keten 610 aanwezige 80 2 0 1 1 4 - 17 - vermenigvuldigers worden toegevoerd aan de optelketens 609-11 t/m 609-n2, zodat de cumulatieve som van al de vermenigvuldigers wordt gevormd en beschikbaar wordt gesteld op de leiding 670. Het op de leiding 670 aanwezige signaal kan worden voorgesteld door 5 10 e (t) = Σ’ C(f.) cos (2/7f. t-0. ) (12) Π r\ K Is k-i waarin C(f^) de amplitude van elke vooraf bepaalde frequentiecompor nent voorstelt, de vooraf bepaalde frequentie van de cosinus-10 en sinusfilters voorstelt, en 0^ de fase is van de vooraf bepaalde frequentiecomponent volgens vergelijking (10). Het excitatiesignaal volgens vergelijking (12) is een functie van de voorspellingsfout van het spraakinterval waaruit dit is afgeleid, en dit signaal is werkzaam om fouten in de lineaire voorspellingscoëfficiënten zoals 15 aangelegd aan de synthese-inrichting 230 gedurende het corresponde rende spraakinterval te compenseren.
De LPC-synthese-inrichting 230 kan omvatten een op zichzelf bekende al-polige filterketeninrichting teneinde een LPOsynthese zoals beschreven in het artikel "Speech Analysis and Synthesis by 20 Linear Prediction of the Speech Wave” door B.S.Atal en S.L.Hanauer en gepubliceerd in Journal of the Acoustical Society of America, vol. 50, pt 2, biz.637 - 655, augustus 1971, uit te voeren. In responsie op de combinatie van de voorspellingsfoutcompenserende exci-tatiepulsen en de lineaire voorspellingscoëfficiënten voor de opeen-25 volgende spraakintervallen, produceert de synthese-inrichting 230 een reeks van gecodeerde spraaksignaalsteekproeven s , welke steekproeven worden toegevoerd aan de ingang van de D/A-omzetter 240.
rv
De D/A-omzetter 240 is werkzaam om. een bemonsterd signaal Sn te produceren dat een replica is van het spraaksignaal dat wordt aan-30 gelegd aan de spraakcodeerketen van fig.l. Het bemonsterde signaal dat afkomstig is van de omzetter 240 wordt in het filter -250 aan een laagdoorlaatfilterwerking onderworpen en het analoge replica-uit-gangssignaal *s(t) van het filter 250 is na te zijn versterkt in de versterker 2522beschikbaar vanaf de luidsprekerinrichting 254.
8 0 2 0 1 1 4 - 18 - APPENDIX 1
Genereer LPC-parameters - hoofdsubroutineprogramma behoeft INPROD. SUBROUTINE LPCPAR COMMON/BLKSIG/S (320), SP (80 ]
5 COmON/BLKPAR/LPBAK, RMS, VUV, R (10 ], A (10), PS, PE
COMMON/BLKSCR/P(10,10),T(10,10),C(10),Q(10),W(10) S(l) ..... S(320) zijn spraaksteekproeven S(151) .....S(360) zijn steekproeven vanaf het voorafgaande raster 10 S(161) ..... S(240) zijn steekproeven van het huidige raster
Bereken energie van spraaksteekproevenenergie = PS CALL INPROD (S(161),S(161),80,PS)
Genereer spraakcorrelatiecoëfficiënten C(l) ..... CC10) 15 DO 1 I = 1, 10 I CALL INPROD (S(161),S(161-1),80,CCI))
Genereer partiële correlatiecoëfficiënten en voorspellings-coëfficiënten
EE=PS
20 DO 100 I = 1, 10
Genereer covariantiematrixelementen PCIjJ)
DO 20 J = I, 10 XX = O.D
IF (I .EQ. 1 .AND. I .EQ. J) XX = PS 25 IF (I .EQ. 1 .AND. J .GT. 1) XX = CCJ-1) IF (I .GT. 1) XX = PCI-1, J-l) 20 P(I,J) = XX + S(161-I)*S(161-J) - S(241-I)*S(241-J)
Converteer in driehoeksmatrix T waar P = T T (transponeer) DO 40 J = 1, I 30 SM = PCJ,I) K = 1 3 IF (K .EQ. J) GO T0 4 SM SM - T(i,K)eT(J,K) K= K+ 1 35 GO T0 3 4 IF (I .EQ. J) W(J) = 1/SQRT(SM) 8020114 - 19 - if (i.ne.j) tci.j) = sm*mcj)
40 CONTINUE
Genereer partiële correlatie R(I) SM = C CI3 5 IF (I .EG). 1) GO TO 5 DO 50 J = 2,1 50 SM = SM - T(I,J-1)*0(J-1) 5 Q(I) = SM*W(I) IF (I ,EQ. 1) GO TO BO 10 EE = EE - Q(I-1)*Q(I-1) 80 RCI] = -G) (I)/SORT (EE)
Genereer voorspellingscoëfficiënten AC1) .....ACI) A(I) = RCI) IF (I .EO. 1) GO TO 100 15 K = 1 6 IF (K .GT. 1/2) GO TO 100 TI = ACK) TJ = A(I-K)
A(K) = TI + R(I)*TJ
20 ACI-K): J= TJ + R(I)*TI
K. = K. + 1 GO TO 6 100 CONTINUE
Bereken voorspellingsfout 25 PE=0 DO 1610 N = 161,240 DN = S (N) L = N - 1 30 DO 10 I = 1,10 DN = DN + A(I)*S(L) 10 L = L - 1
1610 PE=PE+DN*DN RETURN
35 END
8 0 2 0 1 1 4 - 20 -
Bereken inwendig produktsubroutine INPROD (S,Y,N,PS) DIMENSION Y(N), S(N]
PS = 0.0 DO 1 I = 1,N
5 1 PS = PS + S(I]*Y(I]
RETURN
END
APPENDIX 2
Pitch (timbre] analyse - hoofdprcgramma subroutine 10 Behoefte aan subroutines - LPFILT PITCHP
MOVE INPROD CPSTRM SELMAX INTRPL NORMEQ
SUBROUTINE PITCH
15 CDMMON/BLKSIG/S(320],SP(80]
COMMON/BLKPAR/LPEAK,RMS, VUV,RC(10]?AC(10] ,PS,PE
LOGICAL INIT DATA INIT/T/ 20 IF(.NOT.INIT]GO TO 100
Stel in 1-kHz laagdoorlaatfiltercoëfficiënten voor het filteren van spraak en cepstrum CALL LPFILT(HL,666,333] 25 CAL LPFILT(HT,0,1000]
INIT=.F
100 CONTINUE
Laagdoorlaatfilterspraak naar 1 kHz en sla op in SP 30 N =321 DQ3I=61,80 CALL INPROD(S(N~48],HL,48,SP(I]] 3 N=N+4
Berekend pitch-periode 35 CALL PITCHP
8020114 - 21 - , Bereken RMS-waarde SM=0 0041=161-LPEAK,1B1 4 SM=SM+S(I) 2 5 RMS=SQRT(SM/LPEAK.1
Verplaats spraaksteekpreeven voor verwerking in volgend interval CALL MOVE (S(81],S,240) CALL M0VE(SP(21),SP,60) 10
RETURN
END
Zoek pitchperiode door CEPSTRAL-piekopname SUBROUTINE PITCHP 15 COMMON/BLKSIG/S 1329),SP(80) COMMON/BLKP AR/LPEAK., RMS,VUV,RC(10], A(10]?PS ?PE COMMON/BLKLPF/H(48), HR(16) DIMENSION P[31),C[31) 20 COMMON/BLKSCR/R(32)
Bereken autocorrelatiefunctie van spraak 00111=1,32 11 CALL INPR0D(SP,SP(I),81-I,R(in D03I=2,32 25 3 R(I]=R(I]/R(1) R(l)=l
Bereken voorspellingscoëfficiënten CALL NORMEQ(R(2),P,31,C) C0N=0,97
30 FAC=CON
DO 125 K=2,32
XM1=XX
LM1=LX
150 IF(LM1,LT.LM) GO TO 200 35 IF(XM1.GE.(2.*SM2)) GO TO 200 8020114 - 22 -
Lm-LMl/2 IFCIABSCIM—LMHD.GT.2] GO TO 200 GO TO 250
Sla pitch op in LPEAK 200 CONTINUE LPEAK=LIM1
RETURN
END
Bereken voorspellingscoëfficiënten uit autocorrelaties SUBROUTINE NORMEQ(A,Χ,Ν,Τ] DIMENSION ACID,X(1),T(1)
M=N
D05I=1,M X(I+1)=0 5 T(I)=0 XC1D=1.
XC2D=-AC1D T(1]=-A(1) DO 3 I =2,N S1=A(I] S2=l DO 4 J=1,I-1 S1=S1+A(I-J)*X iJ + l) 4 S2=S2+A(J)*X(J+l)
IFCS2.LE.(l.OE-7)) RETURN M=I
P(K]=FAC*P[K]
125 FAC=FAC*CON
Bereken CEPSTRUM CALL CPSTRMfPj(32],C,(32}]
Lokaliseer twee grootste pieken van CEPSTRUM
8020114 - 23 - L=1 CALL SELMAX(C(L+1M31-L),SM1,LM] 20 IFCXMi.GT.O.) GO TO 10 LPEAK.=1 5
RETURN
10 LM1=LM1+L SM2=0 10 LM2=0 DO 1 I=L+1,32 IFCCtl).LE.O] GO TO 1 IFCI.EQ.LM1] GO TO 1 IF(CCI).GT.CCI-1).AND.C(I).GT.CCl+l)) GO TO 2 15 GO TO 1 ' 2 IFCCCI].LE.XM2? GO TO 1 XM2=C(I]
LM2=I
1 CONTINUE
20 Interpoleer werkelijke waarden van CEPSTRAL-pieken 300 CALL INTRPL (0,32,Η,16,4,3Μ1ΛΜ1] CALL INTRPL CC,32,H,16,4,SM2,LM] IF(LM1.LT.LM. AND.XM1.GE.SM2) GO TO 200 IFCSMl.GE.3ri2) GO TO 150 25 Selecteer de werkelijke piek 250 XX=XM2 LX=LM2 LM2=LM1 XM2=XM1 30 RC=-S1/S2 T(I)=RC XCI+1)=RC DO 1 J=l,I/2 TI=X(J+1) 35 TJ=X(I-J+1)
X(J+1)=TI+RC*TJ
802 0 1 1 4 -.24 -
1 X(I-J + l)=TI*ROTJ 3 CONTINUE
RETURN
5 END
Transformeer polynoomcoëfficiënten volgens formule van Newton SUBROUTINE CPSTRMP, LP,S·, LS) 10 DINENSION P(LP),S(LS) S(l)=l.
NP=LP-1
SN=1./NP
15 S(2)=-P(2)*XN
IF(LS.LE.2) RETURN
DO 1 N+3.LS SN=0
20 IF(N.LE.LP) SN=-(N-l)*P(N)*XN
JJÖ6AA=fiINOC CM-2] ,NP] DO 2 K=l,JJ86AA 2 SN=SN=P (K.+1)*S (N-K.) 1 s(n)=sn 25
RETURN
END
Selecteer maximumwaarde 30 SUBROUTINE SELNAXtX,LX,SM,LM) DINENSION X(LX)
B = -1.0E+37 DO 2 1=1,LX
35 IF(X(I].LT.B) GO TO 2 B=X(I] 8020114 - 25 - LL=1
2 CONTINUE 100 LM=LL XM=B
5 RETURN
END
Zoek piek na interpolatie SUBROUTINE INTRPL (C,LC,H,IH,IR,XM,LM) 10 DIMENSION G(LC),H(LH),T(30] L=LH/2
Kl=(LM-2.0)*IR+1 K2=(LM)*IR+1.5 15 K.2=MIN0(K2,tLC*IR-L]]
540 DO 100 K=K1,K2 KL=K+L
N=(KL-1)/IR*1 KK=KL-(N-1)*IR 20 CI=H(KlO*C(N) 2 N=N-1
KK=KK+IR
IF (KK.GT.LH) GO TO 100 CI=CI+H(KK)*C(N) 25 GO TO 2
100 T(K-K1+1)=CI
CALL SELMAX(T,(k2-Kl+l],XM,LM] 405 LM=LM+Kl-2
30 RETURN
END
G enereer coëfficiënten van een laagdoorlatend filter SUBROUTINE LPFILT(H,FO,DF) 35 DIMENSION H(l) ¢020114 - 26 - Pï=3.1415926539 m=16000/DF+0.5 T—1/DF M=1
5 TI=T
NSIN=FO/(O.5*DFi+0.5 100 HW=Q,54+0,46*003(PI*DF*T) Ά 10 HC=0.5
F=FO
F=F+DF*0.5 L=1 ..
11 IFCL.GT.NSINJ GO TO 12 15 HC=HC+C0S(2*PI*F*T1 L-L+-1 F=F+DF*0.5 GO TO 11
12 H(MJ=HW*HC
20 IFU4.GE.I4I4) GO TO 300 T=!4*0.000125+TI 14=14+11 GO TO 100 25 300 S14=0 PFM=PI*(FO] DO 31 1 = 1,14 SI4=SI4 + H(I]*C0SCPFP1*C(I-l)*0.00ai25+TI))
31 CONTINUE
30 DO 3 I =1,14 3 Η[I ] =H (I ]/SI4
RETURN
END
0020114 35 - 27 -
Verplaats een reeks SUBROUTINE MOVE (Χ,Υ,Ν) DIMENSION XCN),Y(N)
5 D01I=1,N
1 YCI3-XCID
RETURN
END
10 Bereken inwendig produkt SUBROUTINE INPROD (S,Y,N,PS) DIMENSION Y(N),S[N]
PS =0.0 DO 1 I * 1,N
15 1 PS = PS +SiI)*YtI)
RETURN
END
APPENDIX 3
Spraak-niet-spraak-analyse - hoofdsubroutineprogramma 20 heeft nodig de 3 subroutines - VUVDEC VUVPAR ZERCRS
SUBROUTINE VUVANL COMMON/BLKSIG/S(320],SP[80)
COMMON/BLKPAR/LPEAK,RMS,VUV.RdOTAdO] ,PS,PE
25 CALL VUVDEC
RMS=SQRT(PS/80)
RETURN
END
30
Spraak-niet-spraakbeslissing door lineaire voorspellings-subroutine VUVDEC COMMON/BLKSIG/S(320),SP[80)
COMMON/BLKPAR/LPEAK, RMS,VUV,R CIO),A(10),PS,PE 35 INTEGER VUV
COMMON/BLKWTS/W(5,5,2),U(5,2),SDC5,2) 8 Ö 2 01 14 - 28 - DIMENSION 0(5],C(5],T(6],DC5)
Bereken spraak-niet-spraakparameters 0 = parameters CALL VUVPAR(Q) 5
Spraak-niet-spraak-stiltebeslissing DQ 20 K=l,2 DO 21 1=1,5 C(I]=(0(I)-U(I,K]]/SD(I,K] 10 DCK)=0 DQ 22 1=1,5 DO 22 J-1,5 22 D(K]=D(K]+W(I,J,K]*C(I]*C(J] DCK]=-D(K]
15 20 CONTINUE
IF C D C1].GT.D C 2]] VUV=0 IF(DC 1].LE.DC2]] VUV=1
RETURN
20 END
Bereken parameters voor VUVDEC subroutine VUVPAR CQ] DIMENSION Q(5] COMMON/BLKSIG/S(320],SP(80]
25 COMMON/BLKPAR/LPEAK, RMS,VUV,R(10],A(10],PS,PE
Bereken parameters - 0(1] ..... 0(50] NZER = aantal van nuldoorgangen PS = spraakenergie - PE = voorspellingsfoutenergie A(l] = eerste voorspellingscoëfficiënt - RC1] = eerste corre-30 latie CALL ZERCRSCS,161,240,NZER]
0(1] = NZER
0(3] = 10.*ALDG10(1.0E-5+PS*0.0125] 0(2] = Q(3]-10.*ALOGlO(1.0E-6+0.0125*PE] 35 0(4] = A(1] 0(5] = R(1] 8020114 - 29 -
RETURN
END
Bereken nuldoorgangen voor niet-spraak/spraakbeslissing 5 SUBROUTINE ZERCRS (S,LP,NS,NZER) DIMENSION SCI) - NZER=0 SPREV=S(LP-1)
10 DO 1 K.=LP,NS
SPRES-SCK) IF(SPRES.LT.O..AND.SPREV.LT.0.) GO TO 1
IF(SPRES.GT.0..AND.SPREV.GT.0.) GO TO 1 NZER=NZER+1 15 1 SPREV=SPRES
RETURN
END
8020114

Claims (10)

1. Werkwijze voor het verwerken van een spraaksignaal omvattende de stappen: het analyseren van het spraaksignaal waarbij het spraaksignaal in opeenvolgende tijdsintervallen wordt verdeeld, alsook een stel van eerste signalen representatief voor de voor-5 spellingsparameters van het genoemde intervalspraaksignaal, een timbrerepresentatief signaal en een spraakrepresentatief signaal in responsie op het spraaksignaal van elk interval worden gegenereerd; het genereren van een signaal corresponderende met voorspel-lingsfout van het genoemde spraakinterval in responsie op de combi-10 natie van het intervalspraaksignaal en de eerste signalen van het interval; en het synthetiseren van een replica van het genoemde spraaksignaal inclusief het produceren van een excitatiesignaal, in responsie op genoemde timbre- en spraakrepresentatieve signalen·, en het construeren van een replica van het genoemde spraaksignaal 15 in responsie op de combinatie van het genoemde excitatiesignaal en genoemde eerste signalen, met het kenmerk, dat genoemde spraak-analysestap verder omvat het genereren van een stel van tweede signalen representatief voor het spectrum van het intervalvoorspelling-foutsignaal in responsie op het genoemde voorspellingsfoutsignaal; 20 en genoemde stap voor het produceren van het excitatiesignaal om vat het vormen van een voorspellingsfoutcompenserend excitatiesignaal in responsie op de combinatie van het genoemde timbrerepresen-tatieve signaal, het genoemde spraakrepresentatieve signaal en genoemde tweede signalen.
2. Werkwijze voor het verwerken van een spraaksignaal volgens conclusie 1, met het kenmerk, dat genoemde stap voor het vormen van een voorspellingsfoutcompenserend excitatiesignaal omvat het genereren van een eerste excitatiesignaal in responsie op genoemde timbrerepresentatieve en spraakrepresentatieve signalen; en het 30 vormen van het eerste excitatiesignaal in responsie op genoemde tweede signalen teneinde het genoemde voorspellingsfoutcompenserend excitatiesignaal teweeg te brengen. 802 0 1 1 4 . - 31 - V
3. Werkwijze voor het verwerken van een spraaksignaal volgens conclusie 2, met het kenmerk, dat het produceren van het genoemde eerste excitatiesïgnaal inhoudt het genereren van een reeks van ex-citatiepulsen in responsie op de combinatie van genoemde timbre- 5 en spraakrepresentatieve signalen; en het vormen van het genoemde eerste excitatiesignaal inhoudt het wijzigen van de excitatiepulsen in responsie op genoemde tweede signalen teneinde een reeks van voorspellingsfoutcompenserende excitatiepulsen teweeg te brengen.
4. Werkwijze voor het verwerken van een spraaksignaal volgens 10 conclusie 3, met het kenmerk, dat genoemde tweede signaalgenereren- de stap inhoudt het vormen van een aantal voorspellingsfoutspec-traalsignalen, elk voor een vooraf bepaalde frequentie, en in responsie op het intervalvoorspellingsfoutsignaal; en het nemen van steekproeven van genoemde intervalvoorspellingsfoutspectraalsigna-15 len gedurende het interval, teneinde genoemde tweede signalen te produceren.
4» . - 30 - CONCLUSIES :
5. Werkwijze voor het verwerken van een spraaksignaal volgens conclusie 4, met het kenmerk, dat het wijzigen van genoemde excitatiepulsen inhoudt het vormen van een aantal excitatiespectraalcompo- 20 nentsignalen corresponderende met genoemde vooraf bepaalde frequen ties en in responsie op genoemde eerste excitatiepulsen; en het genereren van een aantal van voorspellingsfoutspectraalcoëfficiënt-signalen corresponderende met genoemde vooraf bepaalde frequenties in responsie op de combinatie van het genoemde timbrerepresentatie-25 ve-signaal en genoemde tweede signalen, en het combineren van genoem de excitatiespectraalcomponentsignalen met genoemde voorspellings-foutspectraalcoëfficiëntsignalen teneinde genoemde voorspellingsfoutcompenserende excitatiepulsen teweeg te brengen.
6. Spraakcommunicatieketen voor het uitvoeren van de werkwijze 30 volgens conclusie 1, omvattende een spraakanalysator met middelen voor het in tijdsintervallen verdelen van een ingangsspraaksignaal; middelen die in responsie op het spraaksignaal van elk interval genereren, een stel van eerste signalen die representatief zijn voor de voorspellingsparameters van het genoemde intervalspraak-35 signaal, een timbrerepresentatief signaal en een spraakrepresenta- 8 0 2 0 1 1 4 * - 32 - * tief signaal; middelen die in responsie op de combinatie van het genoemde intervalspraaksignaal en genoemde interval eerste signalen een signaal genereren corresponderende met de voorspellingsfout van het interval; een spraaksynthese-inrichting met een excitatie-5 generator die in responsie op genoemde timbre- en spraakrepresenta- tieve signalen een excitatiesignaal produceert; en middelen die in responsie op de combinatie van het genoemde excitatiesignaal en genoemde eerste signalen een replica van het genoemde ingangs-spraaksignaal construeren, met het kenmerk, dat genoemde spraakana-10 lysator verder omvat middelen (124, 126] die in responsie op het genoemde voorspellingsfoutsignaal een stel van tweede signalen representatief voor het spectrum van het interval voorspellingsfout-signaal genereren; en genoemde van de synthese-inrichting deel uitmakende excitatiegenerator (2203 in responsie op de combinatie van 15 genoemde timbrerepresentatieve, spraakrepresentatieve en tweede signalen een voorspellingsfoutcompenserend excitatiesignaal produceert .
7. Spraakcommunicatieketen volgens conclusie 6, met het kenmerk, dat genoemde van de synthese-inrichting deel uitmakende exci- 20 tatiegenerator [220] omvat middelen (618) die in responsie op de combinatie van de timbre- en spraakrepresentatieve signalen een eerste excitatiesignaal genereert en middelen (650) die in responsie op genoemde tweede signalen het genoemde eerste excitatiesignaal vormen teneinde het genoemde voorspellingsfoutcompenserend 25 excitatiesignaal teweeg te brengen.
8. Spraakcommunicatieketen volgens conclusie 7, met het kenmerk, dat van genoemde eerste excitatiesignaalprodu cerende middelen (618) deel uitmaken middelen (620, 622, 624) die in responsie op de combinatie van het genoemde timbre- en spraakrepresentatieve 30 signaal een reeks van excitatiepulsen genereren, en van genoemde eerste excitatiesignaalvormende middelen (650) deel uitmaken middelen (601, 603, 610) die in responsie op genoemde tweede signalen genoemde excitatiepulsen wijzigen teneinde een reeks van voorspel-lingsfoutcompenserende excitatiepulsen teweeg te brengen.
9. Spraakcommunicatieketen volgens conclusie 8, met het kenmerk, 8020114 ‘ - 33 - * dat van genoemde tweede signaalgenererende middelen (124, 126) deel uitmaken middelen (504) die in responsie op het intervalvoorspel-lingsfoutsignaal een aantal voorspellingsfoutspectraalsignalen elk voor een vooraf bepaalde frequentie teweegbrengen; en middelen 5 (513) voor het nemen van steekproeven van genoemde intervalvoor- spellingsfoutspectraalsignalen gedurende het genoemde interval, teneinde genoemde tweede signalen te produceren.
10. Spraakcommunicatiestelsel volgens conclusie 9, met het kenmerk, dat van genoemde voor het wijzigen van excitatiepulsen dienen-10 de middelen (601, 603, 610) deel uitmaken middelen (603) die in responsie op genoemde eerste excitatiepulsen een aantal excitatie-spectraalcomponentsignalen corresponderende met genoemde vooraf bepaalde frequenties vormen; middelen (601) die in responsie op de combinatie van genoemd timbrerepresentatief signaal en genoemde 15 tweede signalen een aantal voorspellingsfoutspectraalcoëfficiënt- signalen corresponderende met genoemde vooraf bepaalde frequenties genereren; en middelen (610) voor het combineren van genoemde exci-tatiespectraalcomponentsignalen met genoemde voorspellingsfoutspec-traalcoëfficiëntsignalen, teneinde genoemde voorspellingsfoutcompen-20 serende excitatiepulsen te vormen. Θ 0 2 0 1 1 4
NL8020114A 1979-03-30 1980-03-24 Residu geeexciteerd voor spellend spraakcodeerstelsel. NL8020114A (nl)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US06/025,731 US4220819A (en) 1979-03-30 1979-03-30 Residual excited predictive speech coding system
US2573179 1979-03-30

Publications (1)

Publication Number Publication Date
NL8020114A true NL8020114A (nl) 1981-01-30

Family

ID=21827763

Family Applications (1)

Application Number Title Priority Date Filing Date
NL8020114A NL8020114A (nl) 1979-03-30 1980-03-24 Residu geeexciteerd voor spellend spraakcodeerstelsel.

Country Status (8)

Country Link
US (1) US4220819A (nl)
JP (1) JPS5936275B2 (nl)
DE (1) DE3041423C1 (nl)
FR (1) FR2452756B1 (nl)
GB (1) GB2058523B (nl)
NL (1) NL8020114A (nl)
SE (1) SE422377B (nl)
WO (1) WO1980002211A1 (nl)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL188189C (nl) * 1979-04-04 1992-04-16 Philips Nv Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting.
BR8108616A (pt) * 1980-05-19 1982-04-06 John S Reid Aperfeicoamentos em processamento de sinais
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
JPS59153346A (ja) * 1983-02-21 1984-09-01 Nec Corp 音声符号化・復号化装置
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4704730A (en) * 1984-03-12 1987-11-03 Allophonix, Inc. Multi-state speech encoder and decoder
JPS60239798A (ja) * 1984-05-14 1985-11-28 日本電気株式会社 音声信号符号化/復号化装置
CA1255802A (en) * 1984-07-05 1989-06-13 Kazunori Ozawa Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
US4675863A (en) * 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
US5067158A (en) * 1985-06-11 1991-11-19 Texas Instruments Incorporated Linear predictive residual representation via non-iterative spectral reconstruction
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US4860360A (en) * 1987-04-06 1989-08-22 Gte Laboratories Incorporated Method of evaluating speech
US5202953A (en) * 1987-04-08 1993-04-13 Nec Corporation Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US5048088A (en) * 1988-03-28 1991-09-10 Nec Corporation Linear predictive speech analysis-synthesis apparatus
JPH0782359B2 (ja) * 1989-04-21 1995-09-06 三菱電機株式会社 音声符号化装置、音声復号化装置及び音声符号化・復号化装置
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
US5263119A (en) * 1989-06-29 1993-11-16 Fujitsu Limited Gain-shape vector quantization method and apparatus
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
WO1991006091A1 (en) * 1989-10-17 1991-05-02 Motorola, Inc. Lpc based speech synthesis with adaptive pitch prefilter
US5195168A (en) * 1991-03-15 1993-03-16 Codex Corporation Speech coder and method having spectral interpolation and fast codebook search
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
US5255339A (en) * 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
US5357567A (en) * 1992-08-14 1994-10-18 Motorola, Inc. Method and apparatus for volume switched gain control
US5546383A (en) 1993-09-30 1996-08-13 Cooley; David M. Modularly clustered radiotelephone system
US5621852A (en) 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
US5761633A (en) * 1994-08-30 1998-06-02 Samsung Electronics Co., Ltd. Method of encoding and decoding speech signals
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
US5839098A (en) * 1996-12-19 1998-11-17 Lucent Technologies Inc. Speech coder methods and systems
US6973424B1 (en) * 1998-06-30 2005-12-06 Nec Corporation Voice coder
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US6751587B2 (en) 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US8473286B2 (en) * 2004-02-26 2013-06-25 Broadcom Corporation Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure
DK2309776T3 (da) * 2009-09-14 2014-10-27 Gn Resound As Høreapparat med midler til adaptiv feedbackkompensation

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2928902A (en) * 1957-05-14 1960-03-15 Vilbig Friedrich Signal transmission
US3979557A (en) * 1974-07-03 1976-09-07 International Telephone And Telegraph Corporation Speech processor system for pitch period extraction using prediction filters
US3975587A (en) * 1974-09-13 1976-08-17 International Telephone And Telegraph Corporation Digital vocoder
JPS6051720B2 (ja) * 1975-08-22 1985-11-15 日本電信電話株式会社 音声の基本周期抽出装置

Also Published As

Publication number Publication date
SE8008245L (sv) 1980-11-25
US4220819A (en) 1980-09-02
FR2452756B1 (fr) 1985-08-02
JPS5936275B2 (ja) 1984-09-03
WO1980002211A1 (en) 1980-10-16
DE3041423C1 (de) 1987-04-16
JPS56500314A (nl) 1981-03-12
SE422377B (sv) 1982-03-01
FR2452756A1 (fr) 1980-10-24
GB2058523A (en) 1981-04-08
GB2058523B (en) 1983-09-14

Similar Documents

Publication Publication Date Title
NL8020114A (nl) Residu geeexciteerd voor spellend spraakcodeerstelsel.
US4821324A (en) Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
CN102122511B (zh) 一种信号处理方法、处理装置以及语音解码器
JP5289320B2 (ja) ピッチ周期訂正を用いたデジタルオーディオ信号の損失ブロックの合成
JP2707564B2 (ja) 音声符号化方式
EP0232456A1 (en) Digital speech processor using arbitrary excitation coding
RU2296377C2 (ru) Способ анализа и синтеза речи
US4945565A (en) Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
US5027405A (en) Communication system capable of improving a speech quality by a pair of pulse producing units
JPH0738118B2 (ja) マルチパルス符号化装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
US4962536A (en) Multi-pulse voice encoder with pitch prediction in a cross-correlation domain
JPS6238500A (ja) 高能率音声符号化方式とその装置
AU617993B2 (en) Multi-pulse type coding system
JPS62102294A (ja) 音声符号化方式
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JPS6162100A (ja) マルチパルス型符号化復号化装置
JP2629762B2 (ja) ピッチ抽出装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JPH09258796A (ja) 音声合成方法
JP3263136B2 (ja) 信号のピッチ同期位置抽出方式及び信号合成方式
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置
Ma Multiband Excitation Based Vocoders and Their Real Time Implementation
KR950013373B1 (ko) 음성 메시지 공급 장치와 음성 메시지 생성 방법
EP0119033B1 (en) Speech encoder

Legal Events

Date Code Title Description
BA A request for search or an international-type search has been filed
BB A search report has been drawn up
A85 Still pending on 85-01-01
BC A request for examination has been filed
BV The patent application has lapsed