DE60201766T2

DE60201766T2 - Verbesserung der Periodizität der CELP-Anregung für die Sprachkodierung und -dekodierung

Info

Publication number: DE60201766T2
Application number: DE60201766T
Authority: DE
Inventors: Tadashi Yamaura; Hirohisa Tasaki
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2001-03-09
Filing date: 2002-02-28
Publication date: 2005-12-01
Anticipated expiration: 2022-03-01
Also published as: US20020128829A1; CN1375818A; TW550541B; IL148413A0; JP2002268690A; EP1239464A2; EP1239464B1; EP1239464A3; US7006966B2; DE60201766D1; CN1172294C; JP3566220B2

Description

HINTERGRUND DER ERFINDUNG
Gebiet der Erfindung
Die vorliegende Erfindung bezieht sich auf eine Sprachcodiervorrichtung und ein Sprachcodierverfahren zum Verdichten eines digitalen Sprachsignals, um seine Informationsmenge zu reduzieren. Die vorliegende Erfindung bezieht sich auch auf eine Sprachdecodiervorrichtung und ein Sprachdecodierverfahren zum Decodieren eines von der vorgenannten Sprachcodiervorrichtungen erzeugten Sprachcodes, um ein digitales Sprachsignal zu erzeugen.
Beschreibung des Standes der Technik
Viele der Sprachcodierverfahren und Sprachdecodierverfahren nach dem Stand der Technik teilen eine Eingangssprache in spektrale Umhüllungsinformationen und Erregungsinformationen und codieren jeden Informati onstyp in Einheiten vom Rahmen, die jeweils eine vorbestimmte Länge haben, um einen Sprachcode zu erzeugen. Der erzeugte Sprachcode wird in die spektralen Umhüllungsinformationen und die Erregungsinformationen decodiert, die dann durch Verwendung eines Synthesefilters kombiniert werden, um eine decodierte Sprache zu erhalten. Die repräsentativsten von Sprachcodier-/-decodiervorrichtungen bei denen die vorgenannten Sprachcodier-/-decodierverfahren angewendet werden, enthalten solche, die das codeerregte lineare Vorhersage(CELP)-System verwenden.
13 ist ein schematisches Diagramm, das die Ausbildung einer herkömmlichen Sprachcodiervorrichtung vom CELP-Typ zeigt. In der Figur bezeichnet die Bezugszahl 1 eine Linearvorhersage-Analyseeinheit zum Analysieren einer Eingangssprache und zum Herausziehen von Linearvorhersagekoeffizienten, die Spektralumhüllungsinformationen der Eingangssprache bezeichnen, während die Bezugszahl 2 eine Linearvorhersagekoeffizienten-Codiereinheit bezeichnet für die Codierung der von der Linearvorhersage-Analyseeinheit 1 herausgezogenen Linearvorhersagekoeffizienten und die Ausgabe des sich ergebenden Codes zu einer Multiplexeinheit 6 sowie die Ausgabe quantisierter Werte der Linearvorhersagekoeffizienten zu einer adaptiven Erregungscodiereinheit 3 einer festen Erregungscodiereinheit 4 und einer Verstärkungscodiereinheit 5.
Die Bezugszahl 3 bezeichnet die adaptive Erregungscodiereinheit zum Erzeugen einer versuchsweisen zusammengesetzten Sprache durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten sowie zum Auswählen eines adaptiven Erregungscodes, mit dem der Abstand zwischen der ver suchsweisen zusammengesetzten Sprache und der Eingangssprache minimiert wird, und zum Ausgeben des so ausgewählten adaptiven Erregungscodes zu der Multiplexeinheit 6. Die adaptive Erregungscodiereinheit 3 gibt auch ein adaptives Erregungssignal (ein Zeitserienvektor, der als ein Ergebnis der Wiederholung eines vergangenen Erregungssignals mit einer gegebenen Länge erhalten wurde) entsprechend dem adaptiven Erregungscode zu der Verstärkungscodiereinheit 5 aus. Die Bezugszahl 4 bezeichnet die feste Erregungscodiereinheit zum Erzeugen einer versuchsweisen zusammengesetzten Sprache durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten sowie zum Auswählen eines festen Erregungscodes, mit dem der Abstand zwischen der versuchsweisen zusammengesetzten Sprache und einem zu codierenden Signal (ein Signal, das als ein Ergebnis der Subtraktion der auf der Grundlage des adaptiven Erregungssignals erzeugten zusammengesetzten Sprache von der Eingangssprache erhalten wurde) minimiert wird, und zum Ausgeben des ausgewählten festen Erregungscodes zu der Multiplexeinheit 6. Die feste Erregungscodiereinheit 4 gibt auch ein festes Erregungssignal, das ein Zeitserienvektor entsprechend dem festen Erregungscode ist, zu der Verstärkungscodiereinheit 5 aus.
Die Bezugszahl 5 bezeichnet die Verstärkungscodiereinheit zum Multiplizieren sowohl des von der adaptiven Erregungscodiereinheit 3 ausgegebenen adaptiven Erregungssignals als auch des von der festen Erregungscodiereinheit 4 ausgegebenen festen Erregungssignals mit jedem Element eines Verstärkungsvektors und zum Addieren jedes jeweiligen Paares der Multiplikationsergebnisse, um ein Erregungssignal zu er zeugen. Die Verstärkungscodiereinheit 5 erzeugt auch eine versuchsweise zusammengesetzte Sprache aus dem vorgenannten Erregungssignal durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten, wählt den Verstärkungscode aus, mit dem der Abstand zwischen der versuchsweise zusammengesetzten Sprache und der Eingangssprache minimiert wird, und gibt den ausgewählten Verstärkungscode zu der Multiplexeinheit 6 aus. Die Bezugszahl 6 bezeichnet die Multiplexeinheit für die Multiplexverarbeitung des Codes der von der Linearvorhersagekoeffizienten-Codiereinheit 2 codierten Linearvorhersagekoeffizienten, des von der adaptiven Erregungscodiereinheit 3 ausgegebenen adaptiven Erregungscodes, des von der festen Erregungscodiereinheit 4 ausgegebenen festen Erregungscodes und des von der Verstärkungscodiereinheit 5 ausgegebenen Verstärkungscodes, um den Sprachcode zu erzeugen.
14 ist ein schematisches Diagramm, das die innere Konfiguration der festen Erregungscodiereinheit 4 zeigt. In der Figur bezeichnet die Bezugszahl 11 ein festes Erregungscodebuch; 12 ein Synthesefilter; 13 eine Verzerrungsberechnungseinheit; und 14 eine Verzerrungsauswertungseinheit.
15 ist ein schematisches Diagramm, das die Ausbildung einer herkömmlichen Sprachdecodiervorrichtung vom CELP-Typ zeigt. In der Figur bezeichnet die Bezugszahl 21 eine Trenneinheit zum Trennen des von der Sprachcodiervorrichtung ausgegebenen Sprachcodes in den Code der Linearvorhersagekoeffizienten, den adaptiven Erregungscode, den festen Erregungscode und den Verstärkungscode, die dann zu einer Linearvorhersagekoeffizienten-Decodiereinheit 22, einer adaptiven Er regungsdecodiereinheit 23, einer festen Erregungsdecodiereinheit 24 bzw. einer Verstärkungsdecodiereinheit 25 geliefert werden. Die Bezugszahl 22 bezeichnet die Linearvorhersagekoeffizienten-Decodiereinheit zum Decodieren des von der Trenneinheit 21 ausgegebenen Codes der Linearvorhersagekoeffizienten und zum Ausgeben der decodierten quantisierten Werte der Linearvorhersagekoeffizienten zu einem Synthesefilter 29.
Die Bezugszahl 23 bezeichnet die adaptive Erregungsdecodiereinheit zum Ausgeben eines adaptiven Erregungssignals (ein Zeitserienvektor, der als ein Ergebnis der Wiederholung eines vergangenen Erregungssignals erhalten wurde) entsprechend dem von der Trenneinheit 21 ausgegebenen adaptiven Erregungscode, während die Bezugszahl 24 die feste Erregungsdecodiereinheit zum Ausgeben eines festen Erregungssignals (ein Zeitserienvektor) entsprechend dem von der Trenneinheit 21 ausgegebenen festen Erregungscode bezeichnet. Die Bezugszahl 25 bezeichnet die Verstärkungsdecodiereinheit zum Ausgeben eines Verstärkungsvektors entsprechend dem von der Trenneinheit 21 ausgegebenen Verstärkungscode.
Die Bezugszahl 26 bezeichnet eine Multiplikationsvorrichtung zum Multiplizieren des von der adaptiven Erregungsdecodiereinheit 23 ausgegebenen adaptiven Erregungssignals mit einem Element des von der Verstärkungsdecodiereinheit 25 ausgegebenen Verstärkungsvektors, während die Bezugszahl 27 eine andere Multiplikationsvorrichtung zum Multiplizieren des von der festen Erregungsdecodiereinheit 24 ausgegebenen festen Erregungssignals mit einem anderen Element des von der Verstärkungsdecodiereinheit 25 ausgegebenen Verstärkungsvektors bezeichnet. Die Bezugszahl 28 be zeichnet einen Addierer zum Addieren des Multiplikationsergebnisses der Multiplikationsvorrichtung 26 und des Multiplikationsergebnisses der Multiplikationsvorrichtung 27, um ein Erregungssignal zu erzeugen. Die Bezugszahl 29 bezeichnet das Synthesefilter zum Durchführen einer Synthesefilterverarbeitung bei dem von dem Addierer 28 erzeugten Erregungssignal, um eine Ausgangssprache zu erzeugen.
16 ist ein schematisches Diagramm, das die innere Ausbildung der festen Erregungsdecodiereinheit 24 zeigt. In der Figur bezeichnet die Bezugszahl 31 ein festes Erregungscodebuch.
Die Arbeitsweise der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung wird nachfolgend beschrieben.
Die herkömmlichen Sprachcodier-/-decodiervorrichtungen führen eine Verarbeitung in Einheiten von Rahmen durch, die jeweils eine Zeitdauer von angenähert 5 bis 50 ms haben.
Bei Empfang einer Sprache analysiert die Linearvorhersage-Analyseeinheit 1 in der Sprachcodiervorrichtung die Eingangssprache und zieht die Linearvorhersagekoeffizienten heraus, die Spektralumhüllungsinformationen über die Sprache sind.
Nachdem die Linearvorhersage-Analyseeinheit 1 die Linearvorhersagekoeffizienten herausgezogen hat, codiert die Linearvorhersagekoeffizienten-Codiereinheit 2 die Linearvorhersagekoeffizienten und gibt den Code zu der Multiplexeinheit 6 aus. Die Linearvorhersagekoeffizienten-Codiereinheit 2 gibt auch quantisierte Werte der Linearvorhersagekoeffizienten zu der adap tiven Erregungscodiereinheit 3, der festen Erregungscodiereinheit 4 und der Verstärkungscodiereinheit 5 aus.
Die adaptive Erregungscodiereinheit 3 hat ein eingebautes adaptives Erregungscodebuch, das vergangene Erregungssignale mit einer vorbestimmten Länge speichert, und sie erzeugt einen Zeitserienvektor, der als ein Ergebnis der periodischen Wiederholung eines vergangenen Erregungssignals erhalten wird, auf der Grundlage von jedem intern erzeugten adaptiven Erregungscode (angezeigt durch eine Binärzahl mit wenigen Bits).
Die adaptive Erregungscodiereinheit 3 multipliziert dann jeden Zeitserienvektor mit jedem geeigneten Verstärkungswert und erzeugt eine versuchsweise zusammengesetzte Sprache durch Hindurchführen des Zeitserienvektors durch das Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten verwendet.
Weiterhin wertet die adaptive Erregungscodiereinheit 3 beispielsweise den Abstand zwischen der versuchsweisen zusammengesetzten Sprache und der Eingangssprache aus, um die Codierverzerrung zu erhalten, und sie wählt den adaptiven Erregungscode, mit dem der Abstand minimiert wird, aus und gibt ihn zu der Multiplexeinheit 6 aus, und sie gibt einen Zeitserienvektor entsprechend dem ausgewählten adaptiven Erregungscode als ein adaptives Erregungssignal zu der Verstärkungscodiereinheit 5 aus.
Die adaptive Erregungscodiereinheit 3 gibt auch ein Signal, das als ein Ergebnis der Subtraktion einer auf der Grundlage des adaptiven Erregungssignals erzeugten zusammengesetzten Sprache von der Eingangssprache erhaltenes Signal als ein zu codierendes Signal zu der festen Erregungscodiereinheit 4 aus.
Als Nächstes wird die Arbeitsweise der festen Erregungscodiereinheit 4 beschrieben.
Das in der festen Erregungscodiereinheit 4 enthaltene feste Erregungscodebuch 11 speichert feste Codevektoren, die rauschartige Zeitserienvektoren sind, und gibt aufeinander folgend einen Zeitserienvektor gemäß jedem festen Erregungscode (angezeigt durch eine Binärzahl mit wenigen Bits) der von der Verzerrungsbewertungseinheit 14 ausgegeben ist, aus. Jeder Zeitserienvektor wird dann mit jedem zweckmäßigen Verstärkungswert multipliziert und in das Synthesefilter 12 eingegeben.
Das Synthesefilter 12 verwendet die von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten, um eine versuchsweise zusammengesetzte Sprache für jeden mit der Verstärkung multiplizierten Zeitserienvektor zu erzeugen.
Die Verzerrungsberechnungseinheit 13 berechnet beispielsweise den Abstand zwischen der versuchsweise zusammengesetzten Sprache und dem von der adaptiven Erregungscodiereinheit 3 ausgegebenen, zu codierenden Signal, um die Codierverzerrung zu erhalten.
Die Verzerrungsbewertungseinheit 14 wählt den festen Erregungscode, mit dem der Abstand zwischen der versuchsweisen zusammengesetzten Sprache und dem von der Verzerrungsberechnungseinheit 13 berechneten, zu co dierenden Signal minimiert wird, aus und gibt ihn zu der Multiplexeinheit 6 aus, und sie richtet das feste Erregungscodebuch 11 für die Ausgabe eines Zeitserienvektors entsprechend dem ausgewählten festen Erregungscode als ein festes Erregungssignal zu der Verstärkungscodiereinheit 5.
Die Verstärkungscodiereinheit 5 hat ein eingebautes, Verstärkungsvektoren speicherndes Verstärkungscodebuch und liest aufeinander folgend einen Verstärkungsvektor aus dem Verstärkungscodebuch entsprechend jedem intern erzeugten Verstärkungscode (angezeigt durch eine Binärzahl mit wenigen Bits).
Die Verstärkungscodiereinheit 5 multipliziert sowohl das von der adaptiven Erregungscodiereinheit 3 ausgegebene adaptive Erregungssignal als auch das von der festen Erregungscodiereinheit 4 ausgegebene feste Erregungssignal mit jedem Element des Verstärkungsvektors und addiert jedes jeweilige Paar der Multiplikationsergebnisse zusammen, um ein Erregungssignal zu erzeugen.
Die Verstärkungscodiereinheit 5 erzeugt dann eine versuchsweise zusammengesetzte Sprache durch Hindurchführen des Erregungssignals durch ein Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten verwendet.
Weiterhin wertet die Verstärkungscodiereinheit 5 den Abstand zwischen der versuchsweisen zusammengesetzten Sprache und der Eingangssprache aus, um die Codierverzerrung zu erhalten, wählt den Verstärkungscode aus, mit dem der Abstand minimiert wird, und gibt ihn zu der Multiplexeinheit 6 aus, und gibt ein Erre gungssignal entsprechend dem Verstärkungscode zu der adaptiven Erregungscodiereinheit 3 aus. Die adaptive Erregungscodiereinheit 3 verwendet dann das Erregungssignal, das von der Verstärkungscodiereinheit 5 ausgewählt wurde und dem Verstärkungscode entspricht, um sein eingebautes adaptives Erregungscodebuch zu aktualisieren.
Die Multiplexeinheit 6 führt eine Multiplexverarbeitung des Codes der von der Linearvorhersagekoeffizienten-Codiereinheit 2 codierten Linearvorhersagekoeffizienten, des von der adaptiven Erregungscodiereinheit 3 ausgegebenen adaptiven Erregungscodes, des von der festen Erregungscodiereinheit 4 ausgegebenen festen Erregungscodes und des von der Verstärkungscodiereinheit 5 ausgegebenen Verstärkungscodes durch, um den Sprachcode als das Multiplexergebnis zu erzeugen.
Bei Empfang des von der Sprachcodiervorrichtung ausgegebenen Sprachcodes trennt die in der Sprachdecodiervorrichtung enthaltene Trenneinheit 21 diesen in dem Code der Linearvorhersagekoeffizienten, den adaptiven Erregungscode, den festen Erregungscode und den Verstärkungscode, die dann zu der Linearvorhersagekoeffizienten-Decodiereinheit 22, der adaptiven Erregungsdecodiereinheit 23, der festen Erregungsdecodiereinheit 24 bzw. der Verstärkungsdecodiereinheit 25 ausgegeben werden.
Bei Empfang des Codes der Linearvorhersagekoeffizienten von der Trenneinheit 21 decodiert die Linearvorhersagekoeffizienten-Decodiereinheit 21 den Code und gibt die quantisierten Werte der Linearvorhersagekoeffizienten zu dem Synthesefilter 29 als das Decodierergebnis aus.
Die adaptive Erregungsdecodiereinheit 23 at das eingebaute adaptive Erregungscodebuch, das vergangene Erregungssignale mit einer vorbestimmten Länge speichert, und sie gibt ein adaptives Erregungssignal (ein Zeitserienvektor, der als ein Ergebnis der Wiederholung eines vergangenen Erregungssignals erhalten wurde) aus entsprechend dem von der Trenneinheit 21 ausgegebenen adaptiven Erregungscode.
Andererseits speichert das in der festen Erregungsdecodiereinheit 24 enthaltene feste Erregungscodebuch 31 feste Codevektoren, die rauschartige Zeitserienvektoren sind, und gibt ein festes Erregungssignal entsprechend dem von der Trenneinheit 21 ausgegebenen festen Erregungscode aus.
Die Verstärkungsdecodiereinheit 25 hat ein eingebautes, Verstärkungsvektoren speicherndes Verstärkungscodebuch und gibt einen Verstärkungsvektor entsprechend dem von der Trenneinheit 21 ausgegebenen Verstärkungscode aus.
Die Multiplikationsvorrichtungen 26 und 27 multiplizieren das von der adaptiven Erregungsdecodiereinheit 23 ausgegebene adaptive Erregungssignal bzw. das von der festen Erregungsdecodiereinheit 24 ausgegebene feste Erregungssignal mit jedem Element des Verstärkungsvektors. Jedes jeweilige Paar der Multiplikationsergebnisse der Multiplikationsvorrichtungen 26 und 27 werden durch den Addierer 28 zusammenaddiert.
Das Synthesefilter 29 führt eine Synthesefilterverarbeitung bei dem als das Additionsergebnis des Addierers 28 erhaltenen Erregungssignal durch, um eine Ausgangssprache zu erzeugen. Es ist festzustellen, dass das Synthesefilter 29 die durch die Linearvorhersagekoeffizienten-Decodiereinheit 22 decodierten quantisierten Werte der Linearvorhersagekoeffizienten als seine Filterkoeffizienten verwendet.
Zuletzt aktualisiert die adaptive Erregungsdecodiereinheit 23 ihr eingebautes adaptives Erregungscodebuch durch Verwendung des vorgenannten Erregungssignals.
Als Nächstes erfolgt eine Beschreibung von herkömmlichen Techniken zum Verbessern der vorbeschriebenen Sprachcodier- und Sprachdecodiervorrichtungen vom CELP-Typ.
Die folgenden zwei Druckschriften schlagen Verfahren zum Betonen der Tonstärkeneigenschaft eines Erregungssignals für den Zweck des Erhaltens einer Sprache hoher Qualität vor, selbst wenn eine niedrige Bitrate verwendet wird.

Druckschrift 1: Wang et al., "Improved excitation for phonetically-segmented VXC speech coding below 4kb/s", Proc. GLOBECOM '90, Seiten 946 – 950
Druckschrift 2: JP-A- Nr. 8-44397 (1996) Weiterhin beschreibt die folgende Druckschrift ein Sprachcodiersystem, das ein ähnliches Verfahren anwendet.
Druckschrift 3: 3GPP Technical Specification 3G TS 26. 090

Die ITU-Empfehlung G. 729 beschreibt auch ein Sprachcodiersystem, das ein anderes ähnliches Verfahren an wendet. Ein weiterer bekannter Sprachcodierer vom CELP-Typ ist offenbart in EP-A-0 714 089.
17 ist ein schematisches Diagramm, das die innere Ausbildung einer festen Erregungscodiereinheit 4 zeigt, die die Tonstärkeeigenschaft eines Erregungssignals betont. Da die Komponenten in der Figur, die dieselben wie die in 14 sind oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung weggelassen. Es ist festzustellen, dass die Ausbildung des Codiersystems dieselbe wie die in 13 gezeigt ist, mit der Ausnahme der Ausbildung der festen Erregungscodiereinheit 4.
In 17 bezeichnet die Bezugszahl 15 eine Periodizitätsvorgabeeinheit, um einem festen Codevektor eine Tonstärkeneigenschaft zu geben.
18 ist ein schematisches Diagramm, das die innere Ausbildung einer festen Erregungsdecodiereinheit 24 zeigt, die die Tonstärkeneigenschaft eines Erregungssignals betont. Da die Komponente in der Figur, die dieselbe wie die in 16 ist oder dieser entspricht, durch eine gleiche Zahl bezeichnet ist, wird ihre Erläuterung weggelassen. Es ist festzustellen, dass die Ausbildung des Decodiersystem dieselbe wie die in 15 gezeigte ist, mit der Ausnahme der Ausbildung der festen Erregungsdecodiereinheit 24.
In 18 bezeichnet die Bezugszahl 32 eine Periodizitätsvorgabeeinheit, um einem festen Codevektor eine Tonstärkeneigenschaft zu geben.
Die Arbeitsweise der Sprachcodier- und der Sprachdecodiervorrichtung wird nachfolgend beschrieben.
Es ist festzustellen, dass, da die Vorrichtungen dieselben sind wie die vorbeschriebenen Sprachcodier- und Sprachdecodiervorrichtungen vom CELP-Typ, mit der Ausnahme, dass die feste Erregungscodiereinheit 4 und die feste Erregungsdecodiereinheit 24 die Periodizitätsvorgabeeinheit 15 bzw. die Periodizitätsvorgabeeinheit 32 enthalten, nur ihr Unterschied beschrieben wird. Die Periodizitätsvorgabeeinheit 15 betont die Tonstärkenperiodizität eines von dem festen Erregungscodebuch 11 ausgegebenen Zeitserienvektors vor der Ausgabe des Zeitserienvektors.
Die Periodizitätsvorgabeeinheit 32 betont die Tonstärkenperiodizität eines von dem festen Erregungscodebuch 31 ausgegebenen Zeitserienvektors vor der Ausgabe des Zeitserienvektors.
Die Periodizitätsvorgabeeinheiten 15 und 32 verwenden beispielsweise ein Kammfilter, um die Tonstärkenperiodizität eines Zeitserienvektors zu betonen.
Die Verstärkung (Periodizitätsbetonungskoeffizient) des Kammfilters wird in Druckschrift 1 auf einen konstanten Wert gesetzt, während das in Druckschrift 2 angewendete Verfahren eine langzeitige Vorhersageverstärkung des Sprachsignals in jedem zu codierenden Rahmen als einen Periodizitätsbetonungskoeffizienten verwendet. Das in Druckschrift 3 vorgeschlagene Verfahren verwendet eine Verstärkung entsprechend einem in jedem vergangenen Rahmen codierten adaptiven Erregungssignal.
Die herkömmlichen Sprachcodier- und Sprachdecodiervorrichtungen sind wie vorstehend beschrieben ausgebildet, so dass ihr Periodizitätsbetonungskoeffizient zum Betonen der Tonstärkenperiodizität über alle fes ten Codevektoren auf denselben Wert gesetzt ist. Daher werden, wenn dieser Periodizitätsbetonungskoeffizient auf einen ungeeigneten Wert gesetzt ist, alle festen Codevektoren nachteilig beeinflusst, wodurch es unmöglich ist, eine ausreichende Qualitätsverbesserung durch Periodizitätsbetonung zu erhalten, oder wodurch sogar eine Qualitätsverschlechterung bewirkt werden kann.
Es wird beispielsweise ein Fall betrachtet, bei dem, obgleich selbst ein zu codierendes Signal eine starke Periodizität mit einer Periode T anzeigt, der Periodizitätsbetonungskoeffizient so gesetzt ist, dass die Impulsantwort des Kammfilters, um festen Codevektoren Periodizität zu geben, eine schwache Periodizität anzeigt. In einem derartigen Fall wird die schwache Periodizitätsbetonung auf alle festen Codevektoren angewendet, wodurch eine große Codierverzerrung erzeugt und hierdurch eine Qualitätsverschlechterung bewirkt wird, wenn das zu codierende Signal eine starke Periodizität anzeigt.
Andererseits kann der Periodizitätsbetonungskoeffizient so gesetzt werden, dass er festen Codevektoren eine starke Periodizität gibt, wenn das zu codierende Signal eine schwache Periodizität anzeigt. Auch in diesem Fall wird eine große Codeverzerrung erzeugt, und hierdurch tritt eine Qualitätsverschlechterung auf.
Bei der Sprachcodierung ist die Vergrößerung der Rahmenmenge wirksam für die Erhöhung des Informationsverdichtungsverhältnisses. In einem derartigen Fall geschieht es, da der Rahmen lang ist, jedoch leicht, dass ein zu analysierender Rahmen ungünstige Faktoren enthält, wie eine Änderung der Tonstärke, was eine ordnungsgemäße Berechnung des Periodizitätsbetonungskoeffizienten mit der in Druckschrift 2 vorgeschlagenen Zusammensetzung beeinträchtigt. Weiterhin wird die Korrelation zwischen der Verstärkung eines vergangenen Rahmens und einem geeigneten Periodizitätsbetonungskoeffizienten für einen gegenwärtigen Rahmen mit der in Druckschrift 3 vorgeschlagenen Zusammensetzung herabgesetzt. Diese Ereignisse bewirken häufig, dass der Periodizitätsbetonungskoeffizient unzweckmäßig eingestellt wird, wodurch die vorbeschriebenen Probleme verschlechtert werden. Weiterhin ist die Verwendung mehrerer fester Erregungscodebücher, die jeweils feste Codevektoren unterschiedlicher Natur speichern, auch wirksam für die Erhöhung des Informationsverdichtungsverhältnisses bei der Sprachcodierung. In diesem Fall ist der geeignete Periodizitätsbetonungskoeffizient von einem festen Erregungscodebuch zu einem anderen unterschiedlich, wodurch die Qualitätsverschlechterung eintritt, die durch die Verwendung von nur einem einzelnen Periodizitätsbetonungskoeffizienten bewirkt wird.
Beispielsweise wird die Verwendung sowohl eines festen Erregungscodebuchs, das rauschartige feste Codevektoren speichert, als auch eines anderen festen Erregungscodebuchs, das nichtrauschartige (impulsartige) feste Codevektoren, die jeweils eine kleine Anzahl von Pulsen in ihren Rahmen speichern, speichert, betrachtet. In dem Fall von rauschartigen festen Codevektoren wird, wenn ihnen konstant eine starke Periodizität gegeben wird, die Sprachqualität der Ausgangssprache mit Bezug auf Rauschcharakteristiken verbessert. In dem Fall von nichtrauschartigen festen Codevektoren andererseits nimmt, wenn ihnen konstant eine starke Periodizität gegeben wird, die Ausgangssprache eine impulsartige Sprachqualität an, wenn ei ne wirklich unperiodische, rauschartige Eingangssprache angewendet wird, was zu einer subjektiven Qualitätsverschlechterung führt.
Weiterhin wird die Verwendung eines festen Erregungscodebuchs betrachtet, das feste Codevektoren speichert, deren Leistungsverteilung vorgespannt ist, beispielsweise enthält nur die erste Hälfte ihres Rahmens Signale und die zweite Hälfte enthält keine Signale (d.h., enthält nur ein Nullsignal). In einem derartigen Fall werden, wenn nicht diesen festen Codevektoren eine starke Periodizität gegeben wird, die Codiercharakteristiken der zweiten Hälfte ihres Rahmens beträchtlich verschlechtert, wodurch die subjektive Qualität in dem Bereich herabgesetzt wird, dessen verteilte Leistung klein ist.
ZUSAMMENFASSUNG DER ERFINDUNG
Um die vorgenannten Probleme zu lösen, ist es eine Aufgabe der vorliegenden Erfindung, eine Sprachcodiervorrichtung, ein Sprachcodierverfahren, eine Sprachdecodiervorrichtung und ein Sprachdecodierverfahren vorzusehen, die in der Lage sind, eine Ausgangssprache mit subjektiv hoher Qualität zu erhalten.
Eine Sprachcodiervorrichtung gemäß der vorliegenden Erfindung weist auf: eine erste Periodizitätsvorgabevorrichtung zum Betonen, wenn Codierverzerrung von festen Codevektoren ausgewertet werden, der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt ist; und eine zweite Periodizitätsvorgabe vorrichtung zum Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung weist auf: einen ersten Periodizitätsvorgabeschritt zum Betonen, wenn Codierverzerrung von festen Codevektoren ausgewertet werden, der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt ist; und einen zweiten Periodizitätsvorgabeschritt zum Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung analysiert eine Eingangssprache, um einen ersten Periodizitätsbetonungskoeffizienten zu bestimmen.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung bestimmt einen ersten Periodizitätsbetonungskoeffizienten aus dem Sprachcode.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Zustand einer Sprache und bestimmt einen ersten Periodizitätsbetonungskoeffizienten auf der Grundlage des Zustandsbestimmungsergebnisses.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung bestimmt einen einen Reibelaut enthaltenden Abschnitt in einer Sprache und verringert einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in dem den Reibelaut enthaltenden Abschnitt.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Abschnitt mit stetiger Stimme in einer Sprache und erhöht einen Betonungsgrad in einem ersten Periodizitätsbetonungskoeffizienten in dem Abschnitt mit stetiger Stimme.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt oder einen zweiten Periodizitätsvorgabeschritt bei einem festen Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken von in dem festen Erregungscodebuch gespeicherten festen Codevektoren.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt oder einen zweiten Periodizitätsvorgabeschritt bei einem festen Erregungscodebuch an auf der Grundlage der Leistungsverteilung von festen Codevektoren in Bezug auf in dem festen Erregungscodebuch gespeicherter Zeit.
Eine Sprachdecodiervorrichtung gemäß der vorliegenden Erfindung weist auf: eine erste Periodizitätsvorgabevorrichtung zum Betonen, wenn ein fester Codevektor entsprechend einem festen Erregungscode herausgezogen wird, der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen, festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt wurde; und eine zweite Periodizitätsvorgabevorrichtung zum Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen, festen Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung weist auf: einen ersten Periodizitätsvorgabeschritt zum Betonen, wenn ein fester Codevektor entsprechend einem festen Erregungscode herausgezogen ist, der Periodizität eines festen Codevektors, der von zumindest einem festen Erregungscodebuch ausgegeben ist, durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt ist; und einen zweiten Periodizitätsvorgabeschritt zum Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen, festen Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung decodiert einen ersten Periodizitätsbetonungskoeffizienten aus einem in dem Sprachcode enthaltenen Code eines Periodizitätsbetonungskoeffizienten.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung bestimmt einen ersten Periodizitätsbetonungskoeffizienten anhand des Sprachcodes.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Zustand einer Sprache und bestimmt einen ersten Periodizitätsbetonungskoeffizienten auf der Grundlage des Zustandsbestimmungsergebnisses.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Abschnitt mit einem Reibelaut in einer Sprache und setzt einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in dem Abschnitt mit Reibelaut herab.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Abschnitt mit stetiger Stimme in einer Sprache und erhöht einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in dem Abschnitt mit stetiger Stimme.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt oder einen zweiten Periodizitätsvorgabeschritt bei einem festen Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken von in dem festen Erregungscodebuch gespeicherten festen Codevektoren.
Ein Sprachdecodierverfahren nach der vorliegenden Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt oder einen zweiten Periodizitätsvorgabeschritt auf ein festes Erregungscodebuch an auf der Grundlage der Leistungsverteilung von festen Codevektoren in Bezug auf in dem festen Erregungscodebuch gespeicherte Zeit.
KURZBESCHREIBUNG DER ZEICHNUNGEN
1 ist ein schematisches Diagramm, das die Ausbildung einer Sprachcodiervorrichtung gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
2 ist ein schematisches Diagramm, das die in nere Ausbildung einer festen Erregungscodiereinheit zeigt;
3 ist ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
4 ist ein schematisches Diagramm, das die innere Ausbildung einer festen Erregungsdecodiereinheit zeigt;
5 ist ein schematisches Diagramm, das die Periodizitätsbetonung für feste Codevektoren illustriert;
6 ist ein schematisches Diagramm, das die Ausbildung einer Sprachcodiervorrichtung gemäß einem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
7 ist ein schematisches Diagramm, das die innere Ausbildung einer festen Erregungscodiereinheit zeigt;
8 ist ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung. gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
9 ist ein schematisches Diagramm, das die innere Ausbildung einer feste Erregungsdecodiereinheit zeigt;
10 ist ein schematisches Diagramm, das die innere Ausbildung einer festen Erregungsco diereinheit zeigt;
11 ist ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung gemäß einem dritten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
12 ist ein schematisches Diagramm, das die innere Ausbildung einer festen Erregungsdecodiereinheit zeigt;
13 ist ein schematisches Diagramm, das die Ausbildung einer herkömmlichen Sprachcodiervorrichtung vom CELP-Typ zeigt;
14 ist ein schematisches Diagramm, das die innere Ausbildung einer festen Erregungscodiereinheit zeigt;
15 ist ein schematisches Diagramm, das die Ausbildung einer herkömmlichen Sprachdecodiervorrichtung vom CELP-Typ zeigt;
16 ist ein schematisches Diagramm, das die innere Ausbildung einer feste Erregungsdecodiereinheit zeigt;
17 ist ein schematisches Diagramm, das die innere Ausbildung einer festen Erregungscodiereinheit zeigt, die eine Periodizitätsvorgabeeinheit enthält;
18 ist ein schematisches Diagramm, das die innere Ausbildung einer festen Erregungsdecodiereinheit zeigt, die eine Periodizitätsvorgabeeinheit enthält; und
19 ist ein schematisches Diagramm, das die Periodizitätsbetonung für feste Codevektoren illustriert.
DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜRHUNGSBEISPIELE
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend beschrieben.
(Erstes Ausführungsbeispiel)
1 ist ein schematisches Diagramm, das die Ausbildung einer Sprachcodiervorrichtung gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt. In der Figur bezeichnet die Bezugszahl 41 eine Linearvorhersage-Analyseeinheit zum Analysieren einer Eingangssprache und zum Herausziehen von Linearvorhersagekoeffizienten, die Spektralumhüllungsinformationen der Eingangssprache bezeichnen, während die Bezugszahl 42 eine Linearvorhersagekoeffizienten-Codiereinheit zum Codieren der durch die Linearvorhersage-Analyseeinheit 41 herausgezogenen Linearvorhersagekoeffizienten und zum Ausgeben des resultierenden Codes zu einer Multiplexeinheit 46 sowie zum Ausgeben quantisierter Werte der Linearvorhersagekoeffizienten zu einer adaptiven Erregungscodiereinheit 43, einer festen Erregungscodiereinheit 44 und einer Verstärkungscodiereinheit 45 bezeichnet.
Es ist festzustellen, dass die Linearvorhersagekoeffizienten-Analyseeinheit 41 und die Linearvorhersagekoeffizienten-Codiereinheit 42 zusammen eine Spektralumhüllungsinformations-Codiereinheit bilden.
Die Bezugszahl 43 bezeichnet die adaptive Erregungscodiereinheit zum: Erzeugen einer versuchsweisen zusammengesetzten Sprache durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten; Auswählen eines adaptiven Erregungscodes, mit dem der Abstand zwischen der versuchsweisen zusammengesetzten Sprache und der Eingangssprache minimiert wird, Ausgeben des so ausgewählten adaptiven Erregungscodes zu der Multiplexeinheit 46; und Ausgeben eines adaptiven Erregungssignals (ein Zeitserienvektor, der als ein Ergebnis der Wiederholung eines vergangenen Erregungssignal mit einer gegebenen Länge erhalten wurde) entsprechend dem adaptiven Erregungscode zu der Verstärkungscodiereinheit 45. Die Bezugszahl 44 bezeichnet die feste Erregungscodiereinheit zum: Analysieren der Eingangssprache, um einen Periodizitätsbetonungskoeffizienten zu erhalten; Codieren des Periodizitätsbetonungskoeffizienten und Ausgeben des resultierenden Codes zu der Multiplexeinheit 46; Erzeugen einer versuchsweisen zusammengesetzten Sprache durch Verwendung sowohl des quantisierten Wertes des Periodizitätsbetonungskoeffizienten und der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten; Auswählen eines festen Erregungscodes, mit dem der Abstand zwischen der versuchsweisen zusammengesetzten Sprache und einem zu codierenden Signal (ein Signal, das als ein Ergebnis der Subtraktion der auf der Grundlage des adaptiven Erregungssignals erzeugten zusammengesetzten Sprache von der Eingangssprache erhalten wurde) minimiert wird, und Ausgeben des so ausgewählten festen Erregungscodes zu der Multiplexeinheit 46; und Ausgeben eines festen Erregungssignals, das ein Zeitserienvektor entsprechend dem festen Erregungscode ist, zu der Verstär kungscodiereinheit 45.
Die Bezugszahl 45 bezeichnet die Verstärkungscodiereinheit zum: Multiplizieren sowohl des von der adaptiven Erregungscodiereinheit 43 ausgegebenen adaptiven Erregungssignals als auch des von der festen Erregungscodiereinheit 44 ausgegebenen festen Erregungssignals mit jedem Element eines Verstärkungsvektors; Addieren jedes jeweiligen Paares der Multiplikationsergebnisse zusammen, um ein Erregungssignal zu erzeugen; Erzeugen einer versuchsweisen zusammengesetzten Sprache aus dem erzeugten Erregungssignal durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten; und Auswählen eines Verstärkungscodes, mit dem der Abstand zwischen der versuchsweisen zusammengesetzten Sprache und der Eingangssprache minimiert wird, und Ausgeben des ausgewählten Verstärkungscodes zu der Multiplexeinheit 46.
Es ist festzustellen, dass die adaptive Erregungscodiereinheit 43, die feste Erregungscodiereinheit 44 und die Verstärkungscodiereinheit 45 zusammen eine Erregungsinformations-Codiereinheit bilden.
Die Bezugszahl 46 bezeichnet die Multiplexeinheit zur Multiplexverarbeitung des Codes der von der Linearvorhersagekoeffizienten-Codiereinheit 42 codierten Linearvorhersagekoeffizienten, des von der adaptiven Erregungscodiereinheit 43 ausgegebenen adaptiven Erregungscodes, des Codes des Periodizitätsbetonungskoeffizienten und des von der festen Erregungscodiereinheit 44 ausgegebenen festen Erregungscodes, und des von der Verstärkungscodiereinheit 45 ausgegebenen Verstärkungscodes, um den Sprachcode zu erzeugen.
2 ist ein schematisches Diagramm, das die interne Ausbildung der festen Erregungscodiereinheit 44 zeigt. In der Figur bezeichnet die Bezugszahl 51 eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit zum Analysieren der Eingangsprache für die Bestimmung eines Periodizitätsbetonungskoeffizienten (eines ersten Periodizitätsbetonungskoeffizienten); 52 eine Periodizitätsbetonungskoeffizienten-Codiereinheit zum Codieren des von der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 51 bestimmten Periodizitätsbetonungskoeffizienten und zum Ausgeben eines quantisierten Wertes des Periodizitätsbetonungskoeffizienten zu einer ersten Periodizitätsvorgabeeinheit 54; 53 ein erstes festes Erregungscodebuch zum Speichern mehrerer nichtrauschartigen (impulsartigen) Zeitserienvektoren (feste Codevektoren); 54 die erste Periodizitätsvorgabeeinheit zum Betonen der Periodizität jedes Zeitserienvektors durch Verwendung des von der Periodizitätsbetonungskoeffizienten-Codiereinheit 52 ausgegebenen quantisierten Wertes des Periodizitätsbetonungskoeffizienten; 55 ein erstes Synthesefilter zum Erzeugen einer versuchsweisen zusammengesetzten Sprache für jeden Zeitserienvektor durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten; und 56 eine erste Verzerrungsberechnungseinheit zum Berechnen des Abstands zwischen der versuchsweisen zusammengesetzten Sprache und des von der adaptiven Erregungscodiereinheit 43 ausgegebenen, zu codierten Signals.
Die Bezugszahl 57 bezeichnet ein zweites festes Erregungscodebuch zum Speichern mehrerer rauschartiger Zeitserienvektoren (feste Codevektoren); 58 eine zweite Periodizitätsvorgabeeinheit zum Betonen der Periodizität jedes Zeitserienvektors durch Verwendung eines vorbestimmten festen Periodizitätsbetonungskoeffizienten (eines zweiten Periodizitätsbetonungskoeffizienten); 59 ein zweites Synthesefilter zum Erzeugen einer versuchsweisen zusammengesetzten Sprache für jeden Zeitserienvektor durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten; 60 eine zweite Verzerrungsberechnungseinheit zum Berechnen des Abstands zwischen der versuchsweisen zusammengesetzten Sprache und dem von der adaptiven Erregungscodiereinheit 43 ausgegebenen, zu codierenden Signal; und 61 eine Verzerrungsauswertungseinheit zum Vergleichen und Auswerten des Berechnungsergebnisses der ersten Verzerrungsberechnungseinheit 56 und des Berechnungsergebnisses der zweiten Verzerrungsberechnungseinheit 60, um einen festen Erregungscode auszuwählen.
3 ist ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt. In der Figur bezeichnet die Bezugszahl 71 eine Trenneinheit zum Trennen des von der Sprachcodiervorrichtung ausgegebenen Sprachcodes in dem Code der Linearvorhersagekoeffizienten, den adaptiven Erregungscode, den Code des Periodizitätsbetonungskoeffizienten und den festen Erregungscode, sowie den Verstärkungscode, die dann zu einer Linearvorhersagekoeffizienten-Decodiereinheit 72, einer adaptiven Erregungsdecodiereinheit 73, einer festen Erregungsdecodiereinheit 74 bzw. einer Verstärkungsdecodiereinheit 75 geliefert werden. Die Bezugszahl 72 bezeichnet die Linearvorhersagekoeffizienten-Decodiereinheit zum Decodieren des von der Trenneinheit 71 ausgegebenen Co des der Linearvorhersagekoeffizienten und zum Ausgeben der decodierten quantisierten Werte der Linearvorhersagekoeffizienten zu einem Synthesefilter 79.
Die Bezugszahl 73 bezeichnet die adaptive Erregungsdecodiereinheit zum Ausgeben eines adaptiven Erregungssignals (ein Zeitserienvektor, der als ein Ergebnis des Wiederholens eines vergangenen Erregungssignals erhalten wurde) entsprechend dem von der Trenneinheit 71 ausgegebenen adaptiven Erregungscode, während die Bezugszahl 74 die feste Erregungsdecodiereinheit zum Ausgeben eines festen Erregungssignals (ein Zeitserienvektor) entsprechend sowohl dem Code des Periodizitätsbetonungskoeffizienten und dem von der Trenneinheit 71 ausgegebenen festen Erregungscode bezeichnet. Die Bezugszahl 75 bezeichnet die Verstärkungsdecodiereinheit zum Ausgeben eines Verstärkungsvektors entsprechend dem von der Trenneinheit 71 ausgegebenen Verstärkungscode.
Die Bezugszahl 76 bezeichnet eine Multiplikationsvorrichtung zum Multiplizieren des von der adaptiven Erregungsdecodiereinheit 73 ausgegebenen adaptiven Erregungssignals mit einem Element des von der Verstärkungsdecodiereinheit 75 ausgegebenen Verstärkungsvektors, während die Bezugszahl 77 eine andere Multiplikationsvorrichtung zum Multiplizieren des von der festen Erregungsdecodiereinheit 74 ausgegebenen festen Erregungssignals mit einem anderen Element des von der Verstärkungsdecodiereinheit 75 ausgegebenen Verstärkungsvektors bezeichnet. Die Bezugszahl 78 bezeichnet einen Addierer zum Addieren des Multiplikationsergebnisses der Multiplikationsvorrichtung 76 und des Multiplikationsergebnisses der Multiplikationsvorrichtung 77, um ein Erregungssignal zu erzeugen. Die Bezugszahl 79 bezeichnet das Synthesefilter zum Durchführen einer Synthesefilterverarbeitung bei dem von dem Addierer 78 erzeugten Erregungssignal, um eine Ausgangssprache zu erzeugen.
4 ist ein schematisches Diagramm, das die innere Ausbildung der festen Erregungsdecodiereinheit 74 zeigt. In der Figur bezeichnet die Bezugszahl 81 eine Periodizitätsbetonungskoeffizienten-Decodiereinheit zum Decodieren des von der Trenneinheit 71 ausgegebenen Codes des Periodizitätsbetonungskoeffizienten und zum Ausgeben des decodierten quantisierten Wertes des Periodizitätsbetonungskoeffizienten (des ersten Periodizitätsbetonungskoeffizienten) zu einer ersten Periodizitätsvorgabeeinheit 83; 82 ein erstes festes Erregungscodebuch zum Speichern mehrerer nicht-rauschartiger (impulsartiger) Zeitserienvektoren (feste Codevektoren); 83 die erste Periodizitätsvorgabeeinheit zum Betonen jedes Zeitserienvektors durch Verwendung des von der Periodizitätsbetonungskoeffizienten-Decodiereinheit 81 ausgegebenen Periodizitätsbetonungskoeffizienten; 84 ein zweites festes Erregungscodebuch zum Speichern mehrerer rauschartiger Zeitserienvektoren (feste Codevektoren); 85 eine zweite Periodizitätsvorgabeeinheit zum Betonen der Periodizität jedes Zeitserienvektors durch Verwendung des vorbestimmten festen Periodizitätsbetonungskoeffizienten (des zweiten Periodizitätsbetonungskoeffizienten).
Die Arbeitsweise der Sprachcodier- und der Sprachdecodiervorrichtung wird nachfolgend beschrieben.
Die Sprachcodiervorrichtung führt eine Verarbeitung in Einheiten von Rahmen durch, die jeweils eine Zeitdauer von angenähert 5 bis 50 ms haben.
Zuerst erfolgt die Beschreibung des Codierens von Spektralumhüllungsinformationen.
Bei Empfang einer Sprache analysiert die Linearvorhersage-Analyseeinheit 41 die Eingangssprache und zieht Linearvorhersagekoeffizienten heraus, die Spektralumhüllungsinformationen über die Sprache sind.
Nachdem die Linearvorhersageanalyseeinheit 41 die Linearvorhersagekoeffizienten herausgezogen hat, codiert die Linearvorhersagekoeffizienten-Codiereinheit 42 die Linearvorhersagekoeffizienten und gibt den Code zu der Multiplexeinheit 46 aus.
Die Linearvorhersagekoeffizienten-Codiereinheit 42 gibt auch quantisierte Werte der Linearvorhersagekoeffizienten zu der adaptiven Erregungscodiereinheit 43, der festen Erregungscodiereinheit 44 und der Verstärkungscodiereinheit 45 aus.
Als Nächstes erfolgt die Beschreibung des Codierens von Erregungsinformationen.
Die adaptive Erregungscodiereinheit 43 hat ein eingebautes adaptives Erregungscodebuch, das vergangene Erregungssignale mit einer vorbestimmten Länge speichert, und sie erzeugt einen Zeitserienvektor, der als ein Ergebnis des periodischen Wiederholens eines vergangenen Erregungssignals erhalten ist, auf der Grundlage jedes intern erzeugten adaptiven Erregungscodes (angezeigt durch eine Binärzahl mit wenigen Bits).
Die adaptive Erregungscodiereinheit 43 multipliziert dann jeden Zeitserienvektor mit jedem angemessenen Verstärkungswert und erzeugt eine versuchsweise zusammengesetzte Sprache durch Hindurchführen des Zeitserienvektors durch das Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten verwendet.
Weiterhin wertet die adaptive Erregungscodiereinheit 43 beispielsweise den Abstand zwischen der versuchsweisen zusammengesetzten Sprache und der Eingangssprache aus, um die Codierverzerrung zu erhalten, und wählt den adaptiven Erregungscode, mit dem der Abstand minimiert wird, aus und gibt ihn zu der Multiplexeinheit 46 aus. Die adaptive Erregungscodiereinheit 43 gibt auch einen Zeitserienvektor entsprechend dem ausgewählten adaptiven Erregungscode als ein adaptives Erregungssignal zu der Verstärkungscodiereinheit 45 aus und gibt sowohl eine Tonstärkenperiode entsprechend dem ausgewählten adaptiven Erregungscode als auch ein (zu codierendes) Signal, das als ein Ergebnis der Subtraktion einer auf der Grundlage des adaptiven Erregungssignals erzeugten, zusammengesetzten Sprache von der Eingangssprache erhalten wurde, zu der festen Erregungscodiereinheit 44 aus.
Als Nächstes wird die Arbeitsweise der festen Erregungscodiereinheit 44 beschrieben.
Die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 51 analysiert die Eingangssprache, um einen Periodizitätsbetonungskoeffizienten zu bestimmen.
Beispielsweise wird der Periodizitätsbetonungskoeffizient auf der Grundlage einer langzeitigen Vorhersageverstärkung der Eingangsprache wie folgt bestimmt.
Wenn bestimmt wird, dass die Spektralcharakteristiken eine Stimme enthalten, wird der Grad der Betonung erhöht. Wenn bestimmt wird, dass sie keine Stimme enthalten, wird andererseits der Grad der Betonung herabgesetzt. Wenn weiterhin die langzeitige Vorhersageverstärkung und die Tonstärkenperiode eine kleine Änderung in Bezug auf die Zeit zeigen, wird der Grad der Betonung erhöht. Wenn sie eine große Änderung in Bezug auf die Zeit zeigen, wird andererseits der Grad der Betonung herabgesetzt.
Nachdem die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 51 den Periodizitätsbetonungskoeffizienten bestimmt hat, codiert die Periodizitätsbetonungskoeffizienten-Codiereinheit 52 den Periodizitätsbetonungskoeffizienten und gibt den Code zu der Multiplexeinheit 46 aus und gibt einen quantisierten Wert des Periodizitätsbetonungskoeffizienten zu der ersten Periodizitätsvorgabeeinheit 54 aus.
Das erste feste Erregungscodebuch 53 speichert mehrere feste Codevektoren, die nichtrauschartige (impulsartige) Zeitserienvektoren sind, und gibt aufeinander folgend einen Zeitserienvektor entsprechend jedem von der Verzerrungsauswertungseinheit 61 ausgegebenen festen Erregungscode aus. Die erste Periodizitätsvorgabeeinheit 54 betont die Periodizität eines von dem ersten festen Erregungscodebuch 53 ausgegebenen Zeitserienvektors durch Verwendung des quantisierten Wertes des von der Periodizitätsbetonungskoeffizienten-Codiereinheit 52 ausgegebenen Periodizitätsbetonungskoeffizienten. Die erste Periodizitätsvorgabeeinheit 54 verwendet beispielsweise ein Kammfilter, um die Periodizität jedes Zeitserienvektors zu betonen.
Jeder Zeitserienvektor wird dann mit einem zweckmäßi gen Verstärkungswert multipliziert und in das erste Synthesefilter 55 eingegeben.
Das erste Synthesefilter 55 verwendet die von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten, um eine versuchsweise zusammengesetzte Sprache auf der Grundlage jedes mit der Verstärkung multiplizierten Zeitserienvektors zu erzeugen.
Die erste Verzerrungsberechnungseinheit 56 berechnet beispielsweise den Abstand zwischen der versuchsweisen zusammengesetzten Sprache und dem von der adaptiven Erregungscodiereinheit 43 als die Codierverzerrung ausgegebenen, zu codierenden Signal und gibt ihn zu der Verzerrungsauswertungseinheit 61 aus.
Andererseits speichert das zweite feste Erregungscodebuch 57 mehrere feste Codevektoren, die rauschartige Zeitserienvektoren sind, und gibt aufeinander folgend einen Zeitserienvektor entsprechend jedem von der Verzerrungsauswertungseinheit 61 ausgegebenen festen Erregungscode aus. Die zweite Periodizitätsvorgabeeinheit 58 betont die Periodizität des von dem zweiten festen Erregungscodebuch 57 ausgegebenen Zeitserienvektors vor der Ausgabe des Zeitserienvektors. Die zweite Periodizitätsvorgabeeinheit 58 verwendet beispielsweise ein Kammfilter, um die Periodizität jedes Zeitserienvektors zu betonen.
Der feste Periodizitätsbetonungskoeffizient, der von der zweiten Periodizitätsvorgabeeinheit 58 verwendet wird, wird vorbestimmt unter Verwendung beispielsweise eines Verfahren, das eine Lerneingangssprache anwendet und codiert. Bei dem Verfahren werden Rahmen herausgezogen, bei denen die Anwendung des von der ersten Periodizitätsvorgabeeinheit 54 verwendeten Periodizitätsbetonungskoeffizienten nicht zweckmäßig ist, und der von der zweiten Periodizitätsvorgabeeinheit 58 verwendete feste Periodizitätsbetonungskoeffizient wird so bestimmt, dass die durchschnittliche Codierqualität der herausgezogenen Rahmen hoch ist.
Jeder Zeitserienvektor mit betonter Periodizität wird dann mit einem angemessenen Verstärkungswert multipliziert und in das zweite Synthesefilter 59 eingegeben.
Das zweite Synthesefilter 59 verwendet die quantisierten Werte der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen Linearvorhersagekoeffizienten, um eine versuchsweise zusammengesetzte Sprache auf der Grundlage jedes. mit der Verstärkung multiplizierten Zeitserienvektors zu erzeugen.
Die zweite Verzerrungsberechnungseinheit 60 berechnet die Abstand zwischen der versuchsweisen zusammengesetzten Sprache und dem zu codierten Signal, das von der adaptiven Erregungscodiereinheit 43 eingegeben ist, und gibt den Abstand zu der Verzerrungsauswertungseinheit 61 aus.
Die Verzerrungsauswertungseinheit 61 wählt den festen Erregungscode, mit dem der Abstand zwischen der vorgenannten versuchsweisen zusammengesetzten Sprache und dem zu codierenden Signal minimiert wird aus und gibt ihn zu der Multiplexeinheit 46 aus. Weiterhin weist die Verzerrungsauswertungseinheit 61 das erste Erregungscodebuch 53 oder das zweite feste Erregungscodebuch 57 an, einen Zeitserienvektor entsprechend dem ausgewählten festen Erregungscode auszugeben. Die erste Periodizitätsvorgabeeinheit 54 oder die zweite Periodizitätsvorgabeeinheit 58 betont die Tonstärkeperiodizität des von dem ersten festen Erregungscodebuch 53 bzw. dem zweiten festen Erregungscodebuch 57 ausgegebenen Zeitserienvektors und gibt ihn als ein festes Erregungssignal zu der Verstärkungscodiereinheit 45 aus. Nachdem die feste Erregungscodiereinheit 44 wie vorbeschrieben das feste Erregungssignal ausgegeben hat, liest die Verstärkungscodiereinheit 45, die ein Verstärkungsvektoren speicherndes eingebautes Verstärkungscodebuch hat, aufeinander folgend einen Verstärkungsvektor aus dem Verstärkungscodebuch gemäß jedem intern erzeugten Verstärkungscode (angezeigt durch eine Binärzahl mit wenigen Bits).
Die Verstärkungscodiereinheit 45 multipliziert sowohl das von der adaptiven Erregungscodiereinheit 43 ausgegebene adaptive Erregungssignal als auch das von der festen Erregungscodiereinheit 44 ausgegebene feste Erregungssignal mit jedem Element des Verstärkungsvektors und addiert jedes jeweilige Paar der Multiplikationsergebnisse miteinander, um ein Erregungssignal zu erzeugen.
Die Verstärkungscodiereinheit 45 erzeugt dann eine versuchsweise zusammengesetzte Sprache durch Hindurchführen des Erregungssignals durch ein Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten verwendet.
Weiterhin wertet die Verstärkungscodiereinheit 45 beispielsweise den Abstand zwischen der versuchsweise zusammengesetzten Sprache und der Eingangssprache aus, um die Codierverzerrung zu erhalten, wählt den Verstärkungscode, mit dem der Abstand minimiert wird, aus und gibt ihn zu der Multiplexeinheit 46 aus, und gibt ein Erregungssignal entsprechend dem Verstärkungscode zu der adaptiven Erregungscodiereinheit 43 aus. Dann verwendet die adaptive Erregungscodiereinheit 43 das Erregungssignal, das von der Verstärkungscodiereinheit 45 ausgewählt ist und dem Verstärkungscode entspricht, um ihr eingebautes adaptives Erregungscodebuch zu aktualisieren.
Die Multiplexeinheit 46 führt eine Multiplexverarbeitung mit dem Code der von der Linearvorhersagekoeffizienten-Codiereinheit 42 codierten Linearvorhersagekoeffizienten, dem von der adaptiven Erregungscodiereinheit 43 ausgegebenen adaptiven Erregungscode, dem Code des Periodizitätsbetonungskoeffizienten und dem von der festen Erregungscodiereinheit 44 ausgegebenen festen Erregungscode und dem von der Verstärkungscodiereinheit 45 ausgegebenen Verstärkungscode durch, um einen Sprachcode als das Multiplexergebnis zu erzeugen.
Bei Empfang des von der Sprachcodiervorrichtung ausgegebenen Sprachcodes trennt die in der Sprachdecodiervorrichtung enthaltene Trenneinheit 71 diesen in den Code der Linearvorhersagekoeffizienten, den adaptiven Erregungscode, den Code des Periodizitätsbetonungskoeffizienten und den festen Erregungscode sowie den Verstärkungscode. Die Trenneinheit 71 gibt den Code der Linearvorhersagekoeffizienten, den adaptiven Erregungscode und den Verstärkungscode zu der Linearvorhersagekoeffizienten-Decodiereinheit 72, der adaptiven Erregungsdecodiereinheit 73 bzw. der Verstärkungsdecodiereinheit 75 aus, und sie gibt den Code des Periodizitätsbetonungskoeffizienten und dem festen Erregungscode zu der festen Erregungsdecodiereinheit 74 aus.
Bei Empfang des Codes der Linearvorhersagekoeffizienten von der Trenneinheit 71 decodiert die Linearvorhersagekoeffizienten-Decodiereinheit 72 den Code und gibt die decodierten quantisierten Werte der Linearvorhersagekoeffizienten zu dem Synthesefilter 79 aus.
Die adaptive Erregungsdecodiereinheit 73 hat das eingebaut adaptive Erregungscodebuch, das vergangene Erregungssignale mit einer vorbestimmten Länge speichert, und sie gibt das adaptive Erregungssignal (ein Zeitserienvektor, der als ein Ergebnis des Wiederholens eines vergangenen Erregungssignals erhalten wurde) entsprechend dem von der Trenneinheit 71 ausgegebenen adaptiven Erregungscode aus.
Als Nächstes wird die Arbeitsweise der festen Erregungsdecodiereinheit 74 beschrieben.
Bei Empfang des Codes des Periodizitätsbetonungskoeffizienten von der Trenneinheit 71 decodiert die Periodizitätsbetonungskoeffizienten-Decodiereinheit 81 den Code und gibt den decodierten quantisierten Wert. des Periodizitätsbetonungskoeffizienten zu der Periodizitätsvorgabeeinheit 83 aus.
Das erste feste Erregungscodebuch 82 speichert mehrere nichtrauschartige (impulsartige) Zeitserienvektoren, während das zweite feste Erregungscodebuch 84 mehrere rauschartige Zeitserienvektoren speichert. Das erste feste Erregungscodebuch 82 oder das zweite Erregungscodebuch 84 gibt einen Zeitserienvektor entsprechend dem von der Trenneinheit 71 ausgegebenen festen Erregungscode aus.
Wenn das erste feste Erregungscodebuch 82 den Zeitserienvektor entsprechend dem festen Erregungscode aus gegeben hat, betont die erste Periodizitätsvorgabeeinheit 83 die Periodizität des von dem ersten festen Erregungscodebuch 82 ausgegebenen Zeitserienvektors durch Verwendung des von der Periodizitätsbetonungskoeffizienten-Decodiereinheit 81 ausgegebenen quantisierten Wertes des Periodizitätsbetonungskoeffizienten und gibt den Zeitserienvektor als ein festes Erregungssignal aus.
Wenn das zweite feste Erregungscodebuch 84 den Zeitserienvektor entsprechend dem festen Erregungscode ausgegeben hat, betont andererseits die zweite Periodizitätsvorgabeeinheit 85 die Periodizität des von dem zweiten festen Erregungscodebuch 84 ausgegebenen Zeitserienvektors durch Verwendung des vorbestimmten festen Periodizitätsbetonungskoeffizienten und gibt den Zeitserienvektors als ein festes Erregungssignal aus.
Die Verstärkungsdecodiereinheit 75 hat ein Verstärkungsvektoren speicherndes eingebautes Verstärkungscodebuch und gibt einen Verstärkungsvektor entsprechend dem von der Trenneinheit 71 ausgegebenen Verstärkungscode aus.
Die Multiplikationsvorrichtung 76 und 77 multiplizieren das von der adaptiven Erregungsdecodiereinheit 73 ausgegebene adaptive Erregungssignal bzw. das von der festen Erregungsdecodiereinheit 74 ausgegebene feste Erregungssignal mit jedem Element des Verstärkungsvektors. Jedes jeweilige Paar der Multiplikationsergebnisse der Multiplikationsvorrichtungen 76 und 77 werden durch den Addierer 78 miteinander addiert.
Das Synthesefilter 79 führt eine Synthesefilterverarbeitung bei dem als das Additionsergebnis des Addie rers 78 erhaltenen Erregungssignal durch, um eine Ausgangssprache zu erzeugen. Es ist festzustellen, dass das Synthesefilter 79 die von der Linearvorhersagekoeffizienten-Decodiereinheit 72 decodierten quantisierten Werte der Linearvorhersagekoeffizienten als seine Filterkoeffizienten verwendet.
Zuletzt aktualisiert die adaptive Erregungsdecodiereinheit 73 sein eingebautes adaptives Erregungscodebuch durch Verwendung des vorgenannten Erregungssignals.
Wie aus der vorstehenden Beschreibung ersichtlich ist, weist das erste Ausführungsbeispiel auf: die erste Periodizitätsvorgabeeinheit zum Betonen, wenn Codierverzerrungen von festen Codevektoren ausgewertet werden, der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt ist; und die zweite Periodizitätsvorgabeeinheit zum Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten. Daher ist es möglich, wie in 5 gezeigt ist, wenn einer von dem ersten Periodizitätsbetonungskoeffizienten und dem zweiten Periodizitätsbetonungskoeffizienten auf einen unzweckmäßigen Wert gesetzt wurde, den nachteiligen Einfluss durch die unzweckmäßige Periodizitätsbetonung auf einen Teil der festen Codevektoren zu begrenzen, wodurch eine Ausgangssprache mit subjektiv hoher Qualität erhalten wird.
Weiterhin ist das erste Ausführungsbeispiel so ausge bildet, dass ein erster Periodizitätsbetonungskoeffizient auf der Grundlage eines Parameters, der durch Analysieren einer Eingangssprache erhältlich ist, bestimmt wird. Daher ist es möglich, einen Periodizitätsbetonungskoeffizienten auf der Grundlage einer feinen Regel, die eine große Anzahl von aus der Eingangssprache herausziehbaren Parametern verwendet, zu bestimmen. Mit dieser Anordnung ist es möglich, die Frequenz der Bestimmung eines unzweckmäßigen Periodizitätsbetonungskoeffizienten herabzusetzen, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
Weiterhin wendet das erste Ausführungsbeispiel entweder einen ersten Periodizitätsvorgabeschritt oder einen zweiten Periodizitätsvorgabeschritt bei einem festen Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken von in dem festen Erregungscodebuch gespeicherten festen Codevektoren. Daher ist es möglich, einem rauschartigen festen Codevektor konstant eine starke Periodizität zu geben, wodurch die Sprachqualität der Ausgangssprache mit Bezug auf Rauschcharakteristiken verbessert wird. Es ist auch möglich, eine konstante Anwendung von starker Periodizität auf einen nichtrauschartigen Vektor zu verhindern, um zu verhindern, dass die Ausgangssprache eine impulsartige Sprachqualität annimmt, wodurch eine codierte Sprache von subjektiv hoher Qualität erhalten wird.
(Zweites Ausführungsbeispiel)
6 ist ein schematisches Diagramm, das die Ausbildung einer Sprachcodiervorrichtung gemäß einem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt. Da die Komponenten in der Figur, die die selben wie in 1 sind oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung weggelassen.
Die Bezugszahl 47 bezeichnet eine feste Erregungscodiereinheit zum: Bestimmen eines Periodizitätsbetonungskoeffizienten anhand der Verstärkung eines adaptiven Erregungssignals; Erzeugen einer versuchsweisen zusammengesetzten Sprache durch Verwendung sowohl des Periodizitätsbetonungskoeffizienten als auch der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte von Linearvorhersagekoeffizienten; Auswählen eines festen Erregungscodes, mit dem der Abstand zwischen der versuchsweisen zusammengesetzten Sprache und einem zu codierenden Signal (ein als ein Ergebnis der Subtraktion einer auf der Grundlage des adaptiven Erregungssignals erzeugten zusammengesetzten Sprache von der Eingangssprache erhaltenes Signal) minimiert wird, und Ausgebendes ausgewählten festen Erregungscodes zu der Multiplexeinheit 49; und Ausgeben eines festen Erregungssignals, das ein Zeitserienvektor entsprechend dem festen Erregungscode ist, zu der Verstärkungscodiereinheit 48.
Die Bezugszahl 48 bezeichnet eine Verstärkungscodiereinheit zum: Multiplizieren sowohl des von der adaptiven Erregungscodiereinheit 43 ausgegebenen adaptiven Erregungssignals als auch des von der festen Erregungscodiereinheit 47 ausgegebenen festen Erregungssignals mit jedem Element eines Verstärkungsvektors; Addieren jedes jeweiligen Paares der Multiplikationsergebnisse miteinander, um ein Erregungssignal zu erzeugen; Erzeugen einer versuchsweisen zusammengesetzten Sprache aus dem erzeugten Erregungssignal durch Verwendung der von der Linearvorhersagekoeffi zienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten; und Auswählen des Verstärkungscodes, mit dem der Abstand zwischen der versuchsweisen zusammengesetzten Sprache und der Eingangssprache minimiert wird, und Ausgeben des ausgewählten Verstärkungscodes zu der Multiplexeinheit 49.
7 ist ein schematisches Diagramm, das die innere Ausbildung der festen Erregungscodiereinheit 47 zeigt. Da die Komponenten in der Figur, die dieselben wie die in 2 gezeigten sind oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung weggelassen.
Die Bezugszahl 62 bezeichnet eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit zum Bestimmen eines Periodizitätsbetonungskoeffizienten aus der Verstärkung eines adaptiven Erregungssignals.
8 ist ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt. Da die Komponenten in der Figur, die dieselben wie die in 3 sind oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung weggelassen.
Die Bezugszahl 80 bezeichnet eine feste Erregungsdecodiereinheit zum Bestimmen eines Periodizitätsbetonungskoeffizienten aus der Verstärkung eines adaptiven Erregungssignals und zum Ausgeben eines festen Erregungssignals, das ein Zeitserienvektor entsprechend dem Periodizitätsbetonungskoeffizienten und dem von der Trenneinheit 71 ausgegebenen festen Erregungscode ist.
9 ist ein schematisches Diagramm, das die innere Ausbildung der festen Erregungsdecodiereinheit 80 zeigt. Da die Komponenten in der Figur, die dieselben wie die in 4 sind oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung weggelassen.
Die Bezugszahl 86 bezeichnet eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit zum Bestimmen eines Periodizitätsbetonungskoeffizienten aus der Verstärkung eines adaptiven Erregungssignals.
Die Arbeitsweise der Sprachcodier- und der Sprachdecodiervorrichtung wird nachfolgend beschrieben.
Es ist festzustellen, dass, da das zweite Ausführungsbeispiel dasselbe wie das erste Ausführungsbeispiel ist, mit Ausnahme der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 62 in der festen Erregungscodiereinheit 47, der Verstärkungscodiereinheit 48 und der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 86 in der festen Erregungsdecodiereinheit 80, nur ihr Unterschied beschrieben wird.
Die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 62 verwendet die Verstärkung für ein von der Verstärkungscodiereinheit 48 ausgegebenes adaptives Erregungssignal, um einen Periodizitätsbetonungskoeffizienten (beispielsweise die Verstärkung für das adaptive Erregungssignal in einem vorhergehenden Rahmen) zu bestimmen, und sie gibt den so bestimmten Periodizitätsbetonungskoeffizienten zu der ersten Periodizitätsvorgabeeinheit 54 aus.
Die Verstärkungscodiereinheit 48, die ein eingebau tes, Verstärkungsvektoren speicherndes Codebuch hat, liest aufeinander folgend einen Verstärkungsvektor aus dem Verstärkungscodebuch gemäß jedem intern erzeugten Verstärkungscode (angezeigt durch eine Binärzahl mit wenigen Bits).
Die Verstärkungscodiereinheit 48 multipliziert sowohl das von der adaptiven Erregungscodiereinheit 43 ausgegebene adaptive Erregungssignal als auch das von der festen Erregungscodiereinheit 47 ausgegebene feste Erregungssignal mit jedem Element des Verstärkungsvektors und addiert jedes jeweilige Paar der Multiplikationsergebnisse miteinander, um ein Erregungssignal zu erzeugen.
Die Verstärkungscodiereinheit 48 erzeugt dann eine versuchsweise zusammengesetzte Sprache durch Hindurchführen des Erregungssignals durch ein Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten verwendet.
Weiterhin wertet die Verstärkungscodiereinheit 48 beispielsweise den Abstand zwischen der versuchsweise zusammengesetzten Sprache und der Eingangssprache aus, um die Codierverzerrung zu erhalten, wählt den Verstärkungscode, mit dem der Abstand minimiert wird, aus und gibt ihn zu der Multiplexeinheit 49 aus. Die Verstärkungscodiereinheit 48 gibt auch ein Erregungssignal entsprechend dem Verstärkungscode zu der adaptiven Erregungscodiereinheit 43 aus, und sie gibt die Verstärkung des adaptiven Erregungssignals entsprechend dem Verstärkungscode zu der festen Erregungscodiereinheit 47 aus.
Die Periodizitätsbetonungskoeffizienten- Berechnungseinheit 86 bestimmt einen Periodizitätsbetonungskoeffizienten, so wie es die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 62 in der festen Erregungscodiereinheit 47 tut, anhand der von der Verstärkungsdecodiereinheit 75 ausgegebenen Verstärkung des adaptiven Erregungssignals, und sie gibt den Periodizitätsbetonungskoeffizienten zu der ersten Periodizitätsvorgabeeinheit 83 aus.
Wie aus der vorstehenden Beschreibung ersichtlich ist, ist es nicht erforderlich, da das zweite Ausführungsbeispiel so ausgebildet ist, dass ein erster Periodizitätskoeffizient auf der Grundlage eines aus dem Sprachcode erhältlichen Parameters bestimmt wird, einen Periodizitätsbetonungskoeffizienten getrennt zu codieren. Demgemäß ist es möglich, selbst bei einer niedrigen Bitrate, die Periodizität für einen festen Codevektor zu betonen durch Verwendung des ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt ist, oder eines festen zweien Periodizitätsbetonungskoeffizienten, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
(Drittes Ausführungsbeispiel)
10 ist ein schematisches Diagramm, das die innere Ausbildung der festen Erregungscodiereinheit 47 zeigt, die in einer Codiervorrichtung gemäß einem dritten Ausführungsbeispiel enthalten ist. Da die Komponenten in der Figur, die dieselben wie die in 2 sind oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung weggelassen.
Die Bezugszahl 63 bezeichnet eine Sprachzustand- Bestimmungseinheit zum Bestimmen des Zustands einer Sprache anhand quantisierter Werte der Linearvorhersagekoeffizienten, der Tonstärkeperiode und der Verstärkung eines adaptiven Erregungssignals, während die Bezugszahl 64 eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit zum Bestimmen eines Periodizitätsbetonungskoeffizienten anhand des Sprachzustands-Bestimmungsergebnisses und der Verstärkung des adaptiven Erregungssignals bezeichnet.
11 ist ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung gemäß einem dritten Ausführungsbeispiel der vorliegenden Erfindung zeigt. Da die Komponenten in der Figur, die dieselben wie die. in 3 sind oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung weggelassen.
Die Bezugszahl 91 bezeichnet eine feste Erregungsdecodiereinheit zum: Bestimmen des Zustands einer Sprache anhand quantisierter Werte der Linearvorhersagekoeffizienten, der Tonstärkenperiode und der Verstärkung eines adaptiven Erregungssignals; Bestimmen eines Periodizitätsbetonungskoeffizienten aus dem Sprachzustands-Bestimmungsergebnis und der Verstärkung des adaptiven Erregungssignals; und Ausgeben eines festen Erregungssignals, das ein Zeitserienvektor entsprechend sowohl dem Periodizitätsbetonungskoeffizienten als auch dem von der Trenneinheit 71 ausgegebenen festen Erregungscode ist.
12 ist ein schematisches Diagramm, das die innere Ausbildung der festen Erregungsdecodiereinheit 91 zeigt. Da die Komponenten in der Figur, die dieselben wie die in 4 sind oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung weggelassen.
Die Bezugszahl 87 bezeichnet eine Sprachzustands-Bestimmungseinheit zum Bestimmen des Zustands einer Sprache anhand von quantisierten Werten der Linearvorhersagekoeffizienten, der Tonstärkeperiode, der Verstärkung eines adaptiven Erregungssignals, während die Bezugszahl 88 eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit zum Bestimmen eines Periodizitätsbetonungskoeffizienten anhand des Sprachzustands-Bestimmungsergebnisses und der Verstärkung des adaptiven Erregungssignals bezeichnet.
Die Arbeitsweise des dritten Ausführungsbeispiels wird nachfolgend beschrieben.
Es ist festzustellen, dass, da das dritte Ausführungsbeispiel dasselbe wie das zweite Ausführungsbeispiel ist, mit Ausnahme der Sprachzustands-Bestimmungseinheit 63 und der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 64 in der festen Erregungscodiereinheit 47, sowie der Sprachzustands-Bestimmungseinheit 87 und der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 88 in der festen Erregungsdecodiereinheit 91, nur ihr Unterschied beschrieben wird.
Die Sprachzustands-Bestimmungseinheit 63 bestimmt den Zustand einer Eingangssprache (beispielsweise durch Auswahl aus einer mit Reibelaut versehenen, einer stetigen Stimme und anderen) auf der Grundlage der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen quantisierten Werte der Linearvorhersagekoeffizienten, der von der adaptiven Erregungscodiereinheit 43 ausgegebenen Tonstärkeperiode und der von der Verstärkungscodiereinheit 48 ausgegebenen Verstärkung des adaptiven Erregungssignals, und gibt das Bestimmungsergebnis zu der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 64 aus.
Der Sprachzustand wird beispielsweise wie folgt bestimmt. Zuerst wird die Neigung des Spektrums erhalten auf der Grundlage der quantisierten Werte der Linearvorhersagekoeffizienten. Wenn die Neigung anzeigt, dass die Leistung der Sprache zunimmt, wenn die Frequenz höher wird, wird der Zustand der Sprache als einen Reiblaut enthaltend bestimmt. Dann werden die Änderungen in der Tonstärkeperiode und der Verstärkung in Bezug auf die Zeit ausgewertet. Wenn die Änderungen klein sind, wird die Sprache als eine stetige Stimme bestimmt. Andernfalls wird bestimmt, dass die Sprache zu "anderen" gehört.
Die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 64 verwendet das von der Sprachzustands-Bestimmungseinheit 63 ausgegebene Sprachzustands-Bestimmungsergebnis und die von der Verstärkungscodiereinheit 48 ausgegebene Verstärkung für das adaptive Erregungssignal, um einen Periodizitätsbetonungskoeffizienten (beispielsweise wird die Verstärkung für das adaptive Erregungssignal in einem vorhergehenden Rahmen für den Koeffizienten genommen) zu bestimmen, und sie gibt den bestimmten Periodizitätsbetonungskoeffizienten zu der ersten Periodizitätsvorgabeeinheit 54 aus.
Der vorgenannte Periodizitätsbetonungskoeffizient wird wie folgt bestimmt. Wenn der Sprachzustand einen Reiblaut enthält, wird der Grad der Betonung herabgesetzt. Wenn der Sprachzustand eine stetige Stimme ist, wird andererseits der Grad der Betonung erhöht.
Mit dieser Anordnung ist es möglich, das Setzten einer unangemessenen Periodizitätsbetonung zu eliminieren, wie das Setzen einer starken Periodizitätsbetonung auf einen festen Erregungsvektor in einem Abschnitt mit Reiblaut, in welchem die Eingangssprache tatsächlich keine Periodizität hat, oder das Setzen von nur wenig Periodizitätsbetonung auf einen festen Erregungsvektor in einem Abschnitt mit stetiger Stimme, in welchem die Eingangssprache tatsächlich eine starke Periodizität hat. Somit kann das dritte Ausführungsbeispiel eine codierte Sprache von subjektiv hoher Qualität liefern.
Die Sprachzustands-Bestimmungseinheit 87 bestimmt den Zustand einer Sprache, so wie es die Sprachzustands-Bestimmungseinheit 63 in der festen Erregungscodiereinheit 47 tut, aus den von der Linearvorhersagekoeffizienten-Decodiereinheit 72 ausgegebenen quantisierten Werten der Linearvorhersagekoeffizienten, der von der adaptiven Erregungsdecodiereinheit 73 ausgegebenen Tonstärkeperiode und der von der Verstärkungscodiereinheit 75 ausgegebenen Verstärkung des adaptiven Erregungssignals, und sie gibt das Bestimmungsergebnis zu der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 88 aus.
Die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 88 bestimmt einen Periodizitätsbetonungskoeffizienten, so wie es die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 64 in der festen Erregungscodiereinheit 47 tut, aus dem von der Sprachzustands-Bestimmungseinheit 87 ausgegebenen Sprachzustands-Bestimmungsergebnis und der von der Verstärkungsdecodiereinheit 75 ausgegebenen Verstärkung des adaptiven Erregungssignals, und sie gibt den bestimmten Periodizitätsbetonungskoeffizienten zu der ersten Periodizitätsvorgabeeinheit 83 aus.
Bei der vorstehenden Anordnung wird der Sprachzustand bestimmt auf der Grundlage eines aus dem Sprachcode erhältlichen Parameters, und ein Periodizitätsbetonungskoeffizient wird anhand dieses Bestimmungsergebnisses bestimmt. Daher ist es möglich, den Periodizitätsbetonungskoeffizienten feiner zu steuern, ohne die zu übertragenden Informationen zu vergrößern, wodurch eine codierte Sprache von subjektiv hoher Qualität erhalten wird.
Weiterhin wird, wenn das Sprachzustands-Bestimmungsergebnis einen Reiblaut anzeigt, der tatsächlich keine Periodizität hat, der Periodizitätsbetonungskoeffizient (der Grad der Betonung) herabgesetzt. Daher ist es möglich, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
Weiterhin wird der Periodizitätsbetonungskoeffizient (der Grad der Betonung) erhöht, wenn das Sprachzustands-Bestimmungsergebnis eine stetige Stimme anzeigt, die tatsächlich eine starke Periodizität hat, wodurch es möglich ist, auch eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
(Viertes Ausführungsbeispiel)
Bei den vorstehenden ersten bis dritten Ausführungsbeispielen wird entweder der erste oder der zweite Periodizitätsvorgabevorgang auf ein festes Erregungscodebuch auf der Grundlage der Rauschcharakteristiken von in dem festen Erregungscodebuch gespeicherten festen Codevektoren angewendet. Jedoch kann die vorliegende Erfindung so ausgebildet sein, dass die ersten festen Erregungscodebücher 53 und 82 mehrere Zeitserienvektoren (feste Codevektoren) speichern, deren Leistungsverteilung in Bezug auf die Zeit flach ist, während die zweiten festen Erregungscodebücher 57 und 84 mehrere Zeitserienvektoren (feste Codevektoren) speichern, deren Leistungsverteilung auf die erste Hälfte des Rahmens vorgespannt ist.
In dieser Anordnung ist es möglich, festen Codevektoren konstant eine starke Periodizität zu geben, deren Leistungsverteilung so vorgespannt ist, dass die Vorspannung der Leistungsverteilung der festen Codevektoren reduziert ist, nachdem ihnen die Periodizität gegeben ist, wodurch eine codierte Sprache von subjektiv hoher Qualität erhalten wird.
(Fünftes Ausführungsbeispiel)
Die vorstehenden ersten bis vierten Ausführungsbeispiele verwenden jeweils zwei feste Erregungscodebücher. Jedoch können drei oder mehr feste Erregungscodebücher verwendet werden, und die feste Erregungscodiereinheit 44 und 47 und die feste Erregungsdecodiereinheit 74, 80 und 91 können entsprechend ausgebildet sein.
Weiterhin zeigen die vorstehenden ersten bis vierten Ausführungsbeispiele jeweils explizit mehrere feste. Erregungscodebücher. Jedoch können in einem einzelnen festen Erregungscodebuch gespeicherte Zeitserienvektoren in mehrere Subsätze geteilt sein, und jeder Subsatz kann als ein individuelles festes Erregungscodebuch angesehen werden.
Weiterhin sind bei den vorstehenden ersten bis vierten Ausführungsbeispielen die in den ersten festen Erregungscodebüchern 53 und 82 gespeicherten festen Codevektoren unterschiedlich gegenüber den in den zweiten festen Erregungscodebüchern 57 und 84 gespeicherten. Jedoch können sämtliche der vorgenannten ersten und zweiten festen Erregungscodebücher dieselben festen Codevektoren speichern. Dies bedeutet, dass sowohl die erste als auch die zweite Periodizitätsvorgabeeinheit auf dasselbe einzelne feste Erregungscodebuch angewendet werden.
Weiterhin sind die obigen ersten bis vierten Ausführungsbeispiele so ausgebildet, dass sie zwei Synthesefilter haben, nämlich das erste Synthesefilter 55 und das zweite Synthesefilter 59. Da jedoch beide Filter dieselbe Operation durchführen, kann die vorliegende Erfindung so ausgebildet sein, dass ein einzelnes Synthesefilter gemeinsam verwendet wird. In gleicher Weise kann eine einzelne Verzerrungsberechnungseinheit gemeinsam als die erste Verzerrungsberechnungseinheit 56 und die zweite Verzerrungsberechnungseinheit 60 verwendet werden.
Wie vorstehend beschrieben ist, weist eine Sprachcodiervorrichtung gemäß der vorliegenden Erfindung auf: eine erste Periodizitätsvorgabeeinheit zum, wenn Codierverzerrung von festen Codevektoren ausgewertet werden, Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt ist; und eine zweite Periodizitätsvorgabeeinheit zum Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten. Daher ist es möglich, wenn einer von dem ersten Periodizitätsbetonungskoeffi zient und dem zweiten Periodizitätsbetonungskoeffizient auf einen unangemessenen Wert gesetzt würde, den nachteiligen Einfluss durch den unangemessenen Periodizitätsbetonungskoeffizienten auf einen Teil der festen Codevektoren zu begrenzen, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung weist auf: einen ersten Periodizitätsvorgabeschritt zum, wenn Codierverzerrungen von festen Codevektoren ausgewertet werden, Betonen der Periodizität eines festen Codevektors, der von zumindest einem festen Erregungscodebuch ausgegeben wurde, durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt wurde; und einen zweiten Periodizitätsvorgabeschritt zum Betonen der Periodizität eines festen Codevektors, der von zumindest einem festen Erregungscodebuch ausgegeben wurde, durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten. Daher ist es möglich, wenn einer von dem ersten Periodizitätsbetonungskoeffizient. und dem zweiten Periodizitätsbetonungskoeffizient auf einen unangemessenen Wert gesetzt wurde, den nachteiligen Einfluss durch den unangemessenen Periodizitätsbetonungskoeffizienten auf einen Teil der festen Codevektoren zu begrenzen, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung analysiert eine Eingangssprache, um einen ersten Periodizitätsbetonungskoeffizienten zu bestimmen. Daher ist es möglich, die Frequenz der Bestimmung eines unangemessenen Periodizitätsbetonungskoeffizienten herabzusetzen, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung bestimmt einen ersten Periodizitätsbetonungskoeffizienten anhand des Sprachcodes. Daher ist es möglich, die Periodizität eines festen Codevektors zu bestimmen, ohne einen Periodizitätsbetonungskoeffizienten separat zu codieren, d.h., ohne die zu übertragenden Informationen zu vergrößern, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Zustand einer Sprache und bestimmt einen ersten Periodizitätsbetonungskoeffizienten auf der Grundlage des Zustandsbestimmungsergebnisses. Daher ist es möglich, einen Periodizitätsbetonungskoeffizienten feiner zu steuern, wodurch eine codierte Sprache von subjektiv höherer Qualität erhalten wird.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Abschnitt mit Reiblaut in einer Sprache und verringert einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in dem Abschnitt mit Reiblaut. Daher ist es möglich, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Abschnitt mit stetiger Stimme in einer Sprache und erhöht einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in dem Abschnitt mit stetiger Sprache. Daher ist es möglich, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt oder einen zweiten Periodizitätsvorgabeschritt auf ein festes Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken von in dem festen Erregungscodebuch gespeicherten festen Codevektoren. Daher wird die Sprachqualität der Ausgangssprache mit Bezug auf Rauschcharakteristiken verbessert, und weiterhin wird verhindert, dass die Ausgangssprache eine impulsartige Sprachqualität annimmt, wodurch es möglich wird, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
Ein Sprachcodierverfahren gemäß der vorliegenden Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt oder einen zweiten Periodizitätsvorgabeschritt auf ein festes Erregungscodebuch an auf der Grundlage der Leistungsverteilung von festen Codevektoren in Bezug auf die Zeit, die in dem festen Erregungscodebuch gespeichert sind. Daher wird die Vorspannung der Leistungsverteilung der festen Codevektoren reduziert, nachdem ihnen Periodizität gegeben wurde, wodurch es möglich ist, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
Eine Sprachdecodiervorrichtung gemäß der vorliegenden Erfindung weist auf: eine erste Periodizitätsvorgabeeinheit zum, wenn ein fester Codevektor entsprechend dem festen Erregungscode herausgezogen ist, Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt wurde; und eine zweite Periodizitätsvorgabeeinheit zum Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten. Daher ist es möglich, wenn einer von dem ersten Periodizitätsbetonungskoeffizienten und dem zweiten Periodizitätsbetonungskoeffizienten auf einen unangemessenen Wert gesetzt wurde, den nachteiligen Einfluss durch den unangemessenen Periodizitätsbetonungskoeffizienten auf einen Teil der festen Codevektoren zu begrenzen, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung weist auf: einen ersten Periodizitätsvorgabeschritt zum, wenn ein fester Codevektor entsprechend dem festen Erregungscode herausgezogen ist, Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt ist; und einen zweiten Periodizitätsvorgabeschritt zum Betonen der Periodizität eines von zumindest einem festen Erregungscodebuch ausgegebenen festen Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten. Daher ist es möglich, wenn einer von dem ersten Periodizitätsbetonungskoeffizienten und dem zweiten Periodizitätsbetonungskoeffizienten auf einen unangemessenen Wert gesetzt wurde, den nachteiligen Einfluss durch den unangemessenen Periodizitätsbetonungskoeffizienten auf einen Teil der festen Codevektoren zu begrenzen, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung decodiert einen ersten Periodizitätsbeto nungskoeffizienten anhand des in dem Sprachcode enthaltenen Codes eines Periodizitätsbetonungskoeffizienten. Dadurch ist es möglich, eine Ausgangssprache von subjektiv hoher Qualität zu erhalten.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung bestimmt einen ersten Periodizitätsbetonungskoeffizienten aus dem Sprachcode. Daher ist es möglich, die Periodizität eines festen Codevektors ohne getrennte Codierung eines Periodizitätsbetonungskoeffizienten zu betonen, d.h., ohne Vergrößerung der zu übertragenden Informationen, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Zustand einer Sprache und bestimmt einen ersten Periodizitätsbetonungskoeffizient auf der Grundlage des Zustandsbestimmungsergebnisses. Daher ist es möglich, einen Periodizitätsbetonungskoeffizienten feiner zu steuern, wodurch eine codierte Sprache von subjektiv hoher Qualität erhalten wird.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Abschnitt mit Reiblaut in einer Sprache und verringert einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in dem Abschnitt mit Reiblaut. Daher ist es möglich, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung bestimmt einen Abschnitt mit stetiger Stimme in einer Sprache und erhöht einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in dem Abschnitt mit stetiger Stimme. Daher ist es möglich, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt oder einen zweiten Periodizitätsvorgabeschritt auf ein festes Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken von in dem festen Erregungscodebuch gespeicherten festen Codevektoren. Daher wird die Sprachqualität der Ausgangssprache mit Bezug auf Rauschcharakteristiken verbessert, und weiterhin wird verhindert, dass die Ausgangssprache eine impulsartige Sprachqualität annimmt, wodurch es möglich wird, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
Ein Sprachdecodierverfahren gemäß der vorliegenden Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt oder einen zweiten Periodizitätsvorgabeschritt auf ein festes Erregungscodebuch an auf der Grundlage der Leistungsverteilung von festen Codevektoren in Bezug auf die Zeit, die in dem festen Erregungscodebuch gespeichert sind. Daher wird die Vorspannung der Leistungsverteilung der festen Codevektoren reduziert, nachdem ihnen Periodizität gegeben wurde, wodurch es möglich wird, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.

Claims

Sprachcodiervorrichtung, welche aufweist: Spektralumhüllungsinformations-Codiermittel (42) zum Herausziehen von Spektralumhüllungsinformationen bei einer Eingangssprache und zum Codieren der Spektralumhüllungsinformationen; Erregungsinformations-Codiermittel (43, 44, 45; 43, 47, 48) für die Bestimmung eines adaptiven Erregungscodes, eines festen Erregungscodes und eines Verstärkungscodes, durch den eine Codierverzerrung einer zu erzeugenden synthetisierten Sprache minimiert wird, durch Verwendung der von den Spektralumhüllungsinformations-Codiermitteln (42) herausgezogenen Spektralumhüllungsinformationen; und Multiplexmittel (46, 49) für die Multiplexverarbeitung der durch die Spektralumhüllungsinformations-Codiermittel (42) codierten Spektralumhüllungsinformationen und des adaptiven Erregungscodes, des festen Erregungscodes und des Verstärkungscodes, die jeweils durch die Erregungsinformations-Codiermittel (43, 44, 45; 43, 47, 48) bestimmt wurden, um einen Sprachcode auszugeben; worin die Erregungsinformations-Codiermittel (43, 44, 45; 43, 47, 48) enthalten: Codiermittel (44; 47) für feste Erregung zum Bewerten von Codierverzerrungen von festen Codevektoren, die in mehreren Codebüchern für feste Erregung gespeichert sind, um den festen Erre gungscode zu bestimmen; erste Periodizitätsvorsehungsmittel (54) für die Betonung der Periodizität eines festen Codevektors, der von zumindest einem Codebuch für feste Erregung ausgegeben ist, durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der auf der Grundlage einer vorbestimmten Regel adaptiv bestimmt ist, wenn die Codierverzerrungen der festen Codevektoren bewertet werden; und zweite Periodizitätsvorsehungsmittel (58) zum Betonen der Periodizität eines festen Codevektors, der von zumindest einem Codebuch für feste Erregung ausgegeben ist, durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Sprachcodierverfahren, welches aufweist: einen Spektralumhüllungsinformations-Codierschritt zum Herausziehen von Spektralumhüllungsinformationen bei einer Eingangssprache und zum Codieren der Spektralumhüllungsinformationen; einen Erregungsinformations-Codierschritt zum Bestimmen eines adaptiven Erregungscodes, eines festen Erregungscodes und eines Verstärkungscodes, durch den eine Codierverzerrung einer zu erzeugenden synthetisierten Sprache minimiert wird, durch Verwendung der von dem Spektralumhüllungsinformations-Codierschritt herausgezogenen Spektralumhüllungsinformationen; und einen Multiplexschritt zur Multiplexverarbeitung der durch den Spektralumhüllungsinformations-Codierschritt codierten Spektralumhüllungsinformationen und des adaptiven Erregungscodes, des festen Erregungscodes und des Verstärkungscodes, die jeweils durch den Erregungsinformations- Codierschritt bestimmt sind, um einen Sprachcode auszugeben; worin der Erregungsinformations-Codierschritt enthält: einen Codierschritt für feste Erregung zum Bewerten von Codierverzerrungen von festen Codevektoren, die in mehreren Codebüchern für feste Erregung gespeichert sind, um den festen Erregungscode zu bestimmen; einen ersten Periodizitätsvorsehungsschritt zum Betonen der Periodizität eines festen Codevektors, der von zumindest einem Codebuch für feste Erregung ausgegeben ist, durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der auf der Grundlage einer vorbestimmten Regel adaptiv bestimmt ist, wenn die Codeverzerrungen der festen Codevektoren bewertet werden; und einen zweiten Periodizitätsvorsehungsschritt zum Betonen der Periodizität eines festen Codevektors, der von zumindest einem Codebuch für feste Erregung ausgegeben ist, durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Sprachcodierverfahren nach Anspruch 2, bei dem das Sprachcodierverfahren die Eingangssprache analysiert, um den ersten Periodizitätsbetonungskoeffizienten zu bestimmen.
Sprachcodierverfahren nach Anspruch 2, bei dem das Sprachcodierverfahren den ersten Periodizitätsbetonungskoeffizienten aus dem Sprachcode bestimmt.
Sprachcodierverfahren nach Anspruch 3 oder 4, bei dem das Sprachcodierverfahren einen Zustand einer Sprache entscheidet und den ersten Perio dizitätsbetonungskoeffizienten auf der Grundlage des Ergebnisses der Zustandsentscheidung bestimmt.
Sprachcodierverfahren nach Anspruch 5, bei dem das Sprachcodierverfahren einen Reibelautabschnitt in einer Sprache bestimmt und einen Betonungsgrad des ersten Periodizitätsbetonungskoeffizienten in dem Reibelautabschnitt verringert.
Sprachcodierverfahren nach Anspruch 5, bei dem das Sprachcodierverfahren einen ständigen Stimmenabschnitt in einer Sprache bestimmt und einen Betonungsgrad des ersten Periodizitätsbetonungskoeffizienten in dem ständigen Stimmenabschnitt erhöht.
Sprachcodierverfahren nach Anspruch 2, bei dem auf der Grundlage von Rauschcharakteristiken von in dem Codebuch für feste Erregung gespeicherten festen Codevektoren das Sprachcodierverfahren entweder den ersten Periodizitätsvorsehungsschritt oder den zweiten Periodizitätsvorsehungsschritt bei dem Codebuch für feste Erregung anwendet.
Sprachcodierverfahren nach Anspruch 2, bei dem auf der Grundlage einer Leistungsverteilung von festen Codevektoren in Beziehung zur Zeit, die in dem Codebuch für feste Erregung gespeichert sind, das Sprachcodierverfahren entweder den ersten Periodizitätsvorsehungsschritt oder den zweiten Periodizitätsvorsehungsschritt bei dem Codebuch für feste Erregung anwendet.
Sprachdecodiervorrichtung, welche aufweist: Trennmittel (71) zum Trennen eines Sprachcodes in Spektralumhüllungsinformationen und Erregungsinformationen enthaltend einen adaptiven Erregungscode, einen festen Erregungscode und einen Verstärkungscode; Spektralumhüllungsinformations-Decodiermittel (72) zum Decodieren der durch die Trennmittel getrennten Spektralumhüllungsinformationen; und Erregungsinformations-Decodiermittel (73, 74, 75; 73, 80, 75) zum Decodieren eines Erregungssignals von dem adaptiven Erregungscode, dem festen Erregungscode und dem Verstärkungscode, die durch die Trennmittel getrennt sind; worin die Erregungsinformations-Decodiermittel (73, 74, 75; 73, 80, 75) enthalten: Decodiermittel (74; 80) für feste Erregung zum Herausziehen eines festen Codevektors entsprechend dem festen Erregungscode aus in mehreren Codebüchern für feste Erregung gespeicherten festen Codevektoren; erste Periodizitätsvorsehungsmittel (81) zum Betonen der Periodizität eines festen Codevektors, der von zumindest einem Codebuch für feste Erregung ausgegeben ist, durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der auf der Grundlage einer vorbestimmten Regel adaptiv bestimmt ist, wenn der feste Codevektor entsprechend dem festen Erregungscode herausgezogen ist; und zweite Periodizitätsvorsehungsmittel (85) zum Betonen der Periodizität eines festen Codevektors, der von zumindest einem Codebuch für feste Erregung ausgegeben ist, durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Sprachdecodierverfahren, welches aufweist: einen Trennschritt zum Trennen von Sprachcode in Spektralumhüllungsinformationen und Erregungsinformationen enthaltend einen adaptiven Erregungscode, einen festen Erregungscode und einen Verstärkungscode; einen Spektralumhüllungsinformations-Decodierschritt zum Decodieren der durch den Trennschritt getrennten Spektralumhüllungsinformationen; und einen Erregungsinformations-Decodierschritt zum Decodieren eines Erregungssignals von dem adaptiven Erregungscode, dem festen Erregungscode und dem Verstärkungscode, die durch den Trennschritt getrennt sind; worin der Erregungsinformations-Decodierschritt enthält: einen Decodierschritt für feste Erregung zum Herausziehen eines festen Codevektors entsprechend dem festen Erregungscode aus in mehreren Codebüchern für feste Erregung gespeicherten festen Codevektoren; einen ersten Periodizitätsvorsehungsschritt zum Betonen der Periodizität eines festen Codevektors, der von zumindest einem Codebuch für feste Erregung ausgegeben ist, durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der auf der Grundlage einer vorbestimmten Regel adaptiv bestimmt ist, wenn der feste Codevektor entsprechend dem festen Erregungscode herausgezogen ist; und einen zweiten Periodizitätsvorsehungsschritt zum Betonen der Periodizität eines festen Codevektors, der von zumindest einem Codebuch für feste Erregung ausgegeben ist, durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Sprachdecodierverfahren nach Anspruch 11, bei dem das Sprachdecodierverfahren den ersten Periodizitätsbetonungskoeffizienten aus dem Code eines in einem Sprachcode enthaltenen Periodizitätsbetonungskoeffizienten decodiert.
Sprachdecodierverfahren nach Anspruch 11, bei dem das Sprachdecodierverfahren den ersten Periodizitätsbetonungskoeffizienten aus dem Sprachcode bestimmt.
Sprachdecodierverfahren nach Anspruch 13, bei dem das Sprachdecodierverfahren einen Zustand einer Sprache entscheidet und den ersten Periodizitätsbetonungskoeffizienten auf der Grundlage des Ergebnisses der Zustandsentscheidung bestimmt.
Sprachdecodierverfahren nach Anspruch 14, bei dem das Sprachdecodierverfahren einen Reibelautabschnitt in einer Sprache bestimmt und einen Betonungsgrad des ersten Periodizitätsbetonungskoeffizienten in dem Reibelautabschnitt verringert.
Sprachdecodierverfahren nach Anspruch 14, bei dem das Sprachdecodierverfahren einen ständigen Stimmenabschnitt in einer Sprache bestimmt und einen Betonungsgrad des ersten Periodizitätsbetonungskoeffizienten in dem ständigen Stimmenabschnitt erhöht.
Sprachdecodierverfahren nach Anspruch 11, bei dem auf der Grundlage von Rauschcharakteristiken von in dem Codebuch für feste Erregung gespei cherten festen Codevektoren das Sprachdecodierverfahren entweder den ersten Periodizitätsvorsehungsschritt oder den zweiten Periodizitätsvorsehungsschritt bei dem Codebuch für feste Erregung anwendet.
Sprachdecodierverfahren nach Anspruch 11, bei dem auf der Grundlage der Leistungsverteilung von festen Codevektoren in Bezug auf die Zeit, die in dem Codebuch für feste Erregung gespeichert sind, das Sprachdecodierverfahren entweder den ersten Periodizitätsvorsehungsschritt oder den zweiten Periodizitätsvorsehungsschritt bei dem Codebuch für feste Erregung anwendet.