DE69519896T2

DE69519896T2 - Verfahren und Vorrichtung zur Kodierung eines Anregungssignals

Info

Publication number: DE69519896T2
Application number: DE69519896T
Authority: DE
Inventors: Kazunori Ozawa; Masahiro Serizawa
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1994-06-21
Filing date: 1995-06-20
Publication date: 2001-08-30
Anticipated expiration: 2015-06-21
Also published as: JPH086597A; JP2970407B2; CA2152513A1; EP0689195A2; EP0689195B1; DE69519896D1; US5687284A; EP0689195A3; CA2152513C

Description

Diese Erfindung betrifft ein Anregungssignal-Codierungsverfahren und eine Vorrichtung zur Codierung eines Anregungssignals mit hoher Qualität bei einer niedrigen Bitrate, wie z. B. unter 4 kb/s.
Zur Verwendung bei der Codierung eines Sprachsignals bei einer niedrigen Bitrate ist schon eine codeangeregte LP (lineare Prädiktionscodierung) als ein CELP-Verfahren bekannt. Ein Beispiel des CELP-Verfahrens wird in einem Artikel offenbart, der durch M. R. Schroeder und B. S. Atal zu den IEEE Proceedings of ICASSP, 1985, Seiten 937 bis 940, unter dem Titel "Code-excited Linear Prediction" beigetragen wurde (Verweis 1).
Gemäß dem CELP Verfahren wird ein Sprachsignal in mehrere Rahmensignale unterteilt, von denen jedes eine Rahmenlänge aufweist. Jedes der mehreren Rahmensignale wird weiter in mehrere Teilrahmensignale unterteilt, von denen jedes eine Teilrahmenlänge aufweist. LP-Koeffizienten (lineare Prädiktionskoeffizienten) für einen LP-Synthesefilter werden aus jedem der mehrerenRahmensignale berechnet. Ein Anregungssignal für den LP- Synthesefilter wird durch die Verwendung der LP-Koeffizienten und der Teilrahmensignale berechnet. Das Anregungssignal wird als eine Restkomponente der linearen Prädiktion der linearen Prädiktionsfilter verstanden. Das Anregungssignal wird durch ein Tonhöhencodierungsverfahren codiert, in dem eine Vektorguantisierung durch die Verwendung eines adaptiven Codebuchs ausgeführt wird, das die Anregungssignale aufweist, die in der Vergangenheit decodiert worden sind. Andererseits wird eine Tonhöhenrestkomponente der Tonhöhencodierung in der Weise der Vektorquantisierung durch die Verwendung eines Tonquellencodebuchs codiert, das vorbereitend durch die Verwendung von Zufallszahlen oder dergleichen hergestellt wird.
In einem solchen CELP-Verfahren gibt es einen Fall, daß eine Tonhöhenperiode kürzer als die Teilrahmenlänge ist, wie später beschrieben wird. In diesem Fall wird ein adaptiver Codevektor aus einer Näherungsrechnung dadurch berechnet, daß das in der Vergangenheit decodierte Anregungssignal um die Tonhöhenperiode wiederholt wird. Ein solches Codierungsverfahren weist eine verschlechterte Genauigkeit der Tonhöhencodierung durch die Tonhöhenprädiktion auf. Wenn nebenbei bemerkt das Codierungsverfahren mit einer niedrigen Bitrate ausgeführt wird, wie z. B. unter 4 kb/s, ist es erforderlich, eine für das Anregungssignal zu verteilende Bitzahl zu reduzieren. Überdies ist es erforderlich, eine Vektorlänge der Vektorquantisierung zu vergrößern, um eine Quantisierungseffizienz zu verbessern. Zum Beispiel ist die Vektorlänge 10 Millisekunden lang und wird durch 80 Abtastwerte gegeben. Als Ergebnis ist es unvermeidlich, die Zahl eines Tonhöhenintervalls zu erhöhen, das in einem einzelnen Vektor dargestellt wird. Dies bedeutet, daß die Genauigkeit der Tonhöhencodierung durch die Tonhöhenprädiktion in dem Fall, daß die vorher erwähnte Näherungsrechnung verwendet wird, weiter verschlechtert wird.
Es ist daher eine Aufgabe dieser Erfindung, ein Anregungssignal-Codierungsverfahren bereitzustellen, das die Genauigkeit einer Tonhöhencodierung verbessern kann, selbst wenn eine Tonhöhenperiode kürzer als eine Teilrahmenlänge ist.
Es ist eine weitere Aufgabe dieser Erfindung, das Anregungssignal-Codierungsverfahren bereitzustellen, das bei einer niedrigen Bitrate, wie z. B unter 4 kb/s arbeitet.
Es ist eine weitere Aufgabe dieser Erfindung, eine Anregungssignal-Codierungsvorrichtung bereitzustellen, die für das oben beschriebene Verfahren geeignet ist.
Andere Aufgaben dieser Erfindung werden deutlich, wenn die Beschreibung fortfährt.
Erfindungsgemäß werden ein Verfahren gemäß Anspruch 1 und Vorrichtungen gemäß den Ansprüchen 3 und 5 bereitgestellt.
Bei der Beschreibung des Wesentlichen dieser Erfindung ist es möglich zu verstehen, daß eine Anregungssignal-Codierungsvorrichtung aufweist: eine Rahmenteilungsschaltung zum Aufteilen eines Sprachsignals in mehrere Rahmen, einen Analysator zum Ausführen einer linearen prädiktiven Analyse an jedem der mehreren Rahmen, um ein Parametersignal zu erzeugen, das für Spektrumparameter repräsentativ ist, eine Teilrahmenteilungsschaltung zum Aufteilen jedes der mehreren Rahmen in mehrere Teilrahmen und eine Gewichtungsschaltung zur Berechnung eines gewichteten Sprachvektors durch die Verwendung der Spektrumparameter und der mehreren Teilrahmen.
Gemäß einem Aspekt dieser Erfindung weist die Anregungssignal-Codierungsvorrichtung ein adaptive Codebuchschaltung auf, die mehrere adaptive Codevektoren speichert, zum Auswählen von einem der mehreren adaptiven Codevektoren als einen ausgewählten adaptiven Codevektor als Antwort auf ein Indexsignal. Jeder der mehreren adaptiven Codevektoren wird durch die Verwendung eines Anregungssignals berechnet, das in der Vergangenheit berechnet wurde. Eine Tonquellen-Codebuchschaltung speichert mehrere Tonquellen-Codevektoren und dient zum Auswählen von einem der mehreren Tonquellen-Codevektoren als einen ausgewählten Tonquellen-Codevektor als Antwort auf das Indexsignal. Die Anregungssignal-Codierungsvorrichtung weist ferner eine Berechnungsschaltung auf zum Ausführen einer vorbestimmten Berechnung in vorbestimmten Perioden durch die Verwendung von mehreren Tonhöhenverstärkungen, mehreren Tonquellenverstärkungen, dem gewichteten Sprachvektor, dem ausgewählten adaptiven Codevektor, der durch Verwendung des Anregungssignals berechnet wird, das in der vergangenen Periode erzeugt wird, und dem ausgewählten Tonquellen-Codevektor der gegenwärtigen Periode. Die Berechnungsschaltung erzeugt ein Berechnungsergebnis als einen Anregungsvektor. Eine gewichtende Syntheseschaltung wird mit den Spektrumparametern und dem Anregungsvektor versorgt und führt eine Berechnung für den Anregungsvektor entsprechend den Spektrumparametern aus, um einen gewichteten synthetischen Vektor zu erzeugen. Eine Differentialschaltung wird mit dem gewichteten Sprachvektor und dem gewichteten synthetischen Vektor versorgt und berechnet eine Differenz zwischen dem gewichteten Sprachvektor und dem gewichteten synthetischen Vektor, um ein Differenzsignal zu erzeugen, das repräsentativ für die Differenz ist. Eine Auswertungsschaltung wird mit dem Differenzsignal versorgt und führt eine Auswertung der Differenz aus, um ein Auswertungsergebnis als das Indexsignal an die adaptive Codebuchschaltung und die Tonquellen-Codebuchschaltung zu liefern. Die Auswertungsschaltung wiederholt die Auswertung, bis sie ein vorbestimmtes Auswertungsergebnis erhält. Die Auswertungsschaltung erzeugt das Indexsignal, das für einen Index des Tonquellen-Codevektors repräsentativ ist, und ein endgültiges Auswertungsergebnis beim Erhalten des vorbestimmten Auswertungsergebnisses.
Fig. 1 zeigt ein Blockschaltbild einer herkömmlichen Anregungssignal-Codierungsvorrichtung;
Fig. 2 zeigt Signalwellenformen zum Beschreiben der Operation der in Fig. 1 dargestellten Anregungssignal-Codierungsvorrichtung;
Fig. 3 zeigt ein Blockschaltbild einer in Fig. 1 dargestellten Wiederholungsschaltung;
Fig. 4 zeigt ein Blockschaltbild einer in Fig. 1 dargestellten Berechnungsschaltung;
Fig. 5 zeigt ein Blockschaltbild einer anderen herkömmlichen Anregungssignal-Codierungsvorrichtung;
Fig. 6 zeigt ein Blockschaltbild einer Anregungssignal-Codierungsvorrichtung gemäß einer ersten Ausführungsform dieser Erfindung;
Fig. 7 zeigt Signalwellenformen zum Beschreiben der Operation der in Fig. 6 dargestellten Anregungssignal-Codierungsvorrichtung;
Fig. 8 zeigt ein Blockschaltbild einer in Fig. 7 dargestellten Berechnungsschaltung;
Fig. 9 zeigt ein Blockschaltbild einer Anregungssignal-Codierungsvorrichtung gemäß einer zweiten Ausführungsform dieser Erfindung; und
Fig. 10 zeigt ein Blockschaltbild einer ersten Berechnungsschaltung, die in Fig. 9 dargestellt wird.
Bezugnehmend auf die Fig. 1 bis 5, wird zuerst eine Beschreibung hinsichtlich eines herkömmlichen Anregungssignal- Codierungsverfahrens und einer Vorrichtung dafür vorgenommen, um das Verständnis dieser Erfindung zu erleichtern. In Fig. 1 dient die Anregungssignal-Codierungsvorrichtung zum Ausführen des CELP-Verfahrens und weist eine Rahmenteilungsschaltung 12, die mit einem Sprachsignal durch einen Eingangsanschluß 11 versorgt wird, eine LP- (lineare Prädiktions-) Analysatorschaltung 13, eine Teilrahmenteilungsschaltung 14 und eine Gewichtungsschaltung 15 auf.
Wie in der Technik wohlbekannt ist, teilt die Rahmenteilungsschaltung 12 das Sprachsignal in mehrere Rahmen, von denen jeder eine Rahmenperiode von zum Beispiel 20 Millisekunden aufweist. Die LP-Analysatorschaltung 13 führt eine lineare prädiktive Analyseoperation an jedem der Rahmen aus und erzeugt ein Parametersignal, das repräsentativ für einen LP-Koeffizienten α(i) ist. Die Teilrahmenteilungsschaltung 14 teilt jeden der Rahmen in mehrere Teilrahmen auf, von denen jeder eine Teilrahmenperiode oder Länge von zum Beispiel 10 Millisekunden aufweist. Die Gewichtungsschaltung 15 berechnet einen gewichteten Sprachvektor Ws an jedem der Teilrahmen durch die Verwendung des LP-Koeffizienten α(i). Die Gewichtungsschaltung 15 erzeugt ein gewichtetes Sprachvektorsignal, das repräsentativ für den gewichteten Sprachvektor Ws ist.
Im Sprachcodierungsverfahren des CELP-Verfahrens wird eine Ausgangsantwort H(z) der linearen Prädiktionscodierung durch eine Gleichung (1) durch die Verwendung einer z-Transformationsdarstellung repräsentiert.
wobei p einen Grad der linearen Prädiktionscodierung repräsentiert. Eine Ausgangsantwort einer Tonhöhenprädiktion wird durch eine Gleichung repräsentiert, die gegeben ist durch:
wobei L eine Verzögerung repräsentiert, die nahe einem oder mehrfachen oder einem Mehrfachen einer Tonhöhenperiode des Sprachsignals ist, und β eine Tonhöhenverstärkung repräsentiert.
Es wird angenommen, daß ein Tonquellensignal, das von einem Tonquellencodebuch erzeugt wird, durch c(t) repräsentiert wird.
Das Tonquellensignal ist ein Ausgangssignal eines Filters, der die Ausgangsantwort H(z) aufweist und der mit einem Anregungssignal y(t) versorgt wird, das gegeben ist durch:
y(t) = βy(t - L) + γc(t) (3)
wobei t die Zeit repräsentiert und γ eine Tonquellenverstärkung repräsentiert.
Im allgemeinen ist ein adaptiver Codevektor, der in einer Vektorquantisierung für die Tonhöhencodierung verwendet wird, ein partieller Vektor, der aus dem Anregungssignal ausgeschnitten wird, das L Abtastwerte in die Vergangenheit zurückgeht. Das vor L Abtastwerten decodierte Anregungssignal wird in mehrere geteilte Anregungssignale unterteilt, um einen Vektor P(L) zu berechnen, der eine Teilrahmenlänge N aufweist. In diesem Fall ist der adaptive Codevektor a gegeben durch:
a = P(L) (4)
Der Anregungsvektor y, der einen i-ten Teilrahmen umfaßt, ist gegeben durch:
Der Tonquellen-Codevektor c einer Indexzahl m ist gegeben durch:
In der folgenden Beschreibung werden die Rahmenzahl und die Indexzahl zur Kürze der Beschreibung weggelassen. Dementsprechend wird die Gleichung (3) durch die folgende Gleichung ersetzt, die gegeben ist durch:
y = βP(L) + γc (7)
Bei der Quantisierung des Anregungsvektors y im CELP-Verfahren werden der Index, der für die Verzögerung L kennzeichnend ist, und der Tonquellen-Codevektor auf die folgende Weise entschieden. Namentlich wird ein decodiertes Sprachsignal erzeugt, indem der Anregungsvektor y dem Synthesefilter zugeführt wird, der die Ausgangsantwort H(z) der Gleichung (1) aufweist. Danach wird eine Auswertungsoperation durch die Verwendung eines Differenzsignals zwischen dem decodierten Sprachsignal und dem Eingangssprachsignal ausgeführt. In diesem Fall werden der Index der Verzögerung L und der Tonquellen-Codevektor in der Auswertungsoperation so entschieden, daß ein gewichtetes Fehlersignal, das durch einen wahrnehmungsgewichtenden Filter gegangen ist, der die folgenden Antwort W(Z) aufweist, einen minimalen quadratischen Abstand aufweist.
Wenn eine Impulsantwortmatrix zum Ausführen der synthetischen Operation der Gleichung (1) durch H gegeben ist und eine Impulsantwortmatrix zum Ausführen einer wahrnehmungsgewichtenden Operation durch W gegeben ist, wird ein gewichteter quadratischer Abstand D durch die Verwendung eines wahrnehmungsgewichteten synthetischen Signalvektors WHy und eines gewichteten Sprachvektors Ws, der durch den wahrnehmungsgewichtenden Filter abgeleitet wird, der mit dem Eingangssprachvektor versorgt wird, durch die folgende Gleichung repräsentiert.
D = (Ws - WHy)T(Ws - WHy), (9)
wobei T eine Transposition der Vektoren und der Matrizen repräsentiert. Die Tonhöhenverstärkung β und die Tonquellenverstärkung γ, die den gewichteten quadratischen Abstand D der Gleichung (9) minimieren, können erhalten werden, indem die folgenden Gleichungen erfüllt werden, die gegeben sind durch:
dD/dβ = 0, dD/dγ = 0.
Mit anderen Worten kann eine optimale Tonhöhenverstärkung β und eine optimale Tonquellenverstärkung γ durch die folgende Gleichung berechnet werden, die gegeben ist durch:
Wenn die Verzögerung L kürzer als die Vektorlänge der Vektorquantisierung ist, wird das vergangene Anregungssignal noch nicht im gegenwärtigen Teilrahmen decodiert. Alternativ wird der Vektor durch die Wiederholung eines Teils erzeugt, das die Länge aufweist, die gleich der Tonhöhenperiode des decodierten Anregungssignals ist, und wird als der adaptive Codevektor verwendet.
Bezugnehmend auf Fig. 2, wird die Beschreibung fortfahren mit einem Erzeugungsprozeß des adaptiven Codevektors des gegenwärtigen Teilrahmens im Fall, daß die Verzögerung L gleich einem Drittel der Teilrahmenlänge N des Sprachsignals ist (Fig. 2 (a)). In einem ersten Tonhöhenintervall, das bei A in Fig. 2 (c) dargestellt wird, ist es möglich, das in der Vergangenheit decodierte Anregungssignal P(L) zu verwenden. Jedoch ist das vor L Abtastwerten decodierte Anregungssignal in Fig. 2b durch E dargestellt) an und nach einem zweiten Tonhöhenintervall B nicht vorhanden. Aus diesem Grund wird der Tonquellenvektor des gegenwärtigen zu quantisierenden Teilrahmens (in Fig. 2(d) durch D dargestellt) ganz zu Null angenähert. Dann wird der adaptive Codevektor für das zweite und ein drittes Tonhöhenintervall B und C durch die Wiederholung des ersten Tonhöhenintervalls A erzeugt. Als Ergebnis wird der adaptive Codevektor gegeben durch:
Ein solches Anregungssignal-Codierungsverfahren wird in der japanischen Patentveröffentlichung Nr. 502675/1992 (Tokko Hei 4-502675) offenbart (Verweis 2).
Zurückkehrend zu Fig. 1, weist die Anregungssignal-Codierungsvorrichtung, um die vorher erwähnte Prozeßoperation auszuführen, ferner eine adaptive Codebuchschaltung 16, eine Wiederholungsschaltung 17, eine Tonquellen-Codebuchschaltung 18, eine Berechnungsschaltung 19, eine gewichtende Syntheseschaltung 20, eine Differentialschaltung 21 und eine Auswertungsschaltung 22 auf.
Die adaptive Codebuchschaltung 16 wird durch einen RAM (Direktzugriffsspeicher) implementiert und dient zum Speichern mehrerer adaptiver Codevektoren. Wie später klar werden wird, wird die adaptive Codebuchschaltung 16 aus der Auswertungsschaltung 22 mit einem Indexsignal versorgt, das repräsentativ für den Index ist, der einen Fehler minimiert. Die adaptive Codebuchschaltung 16 wählt einen der mehreren adaptiven Codevektoren als einen ausgewählten adaptiven Codevektor P(L) gemäß dem Index aus.
Wie in Fig. 3 gezeigt, weist die Wiederholungsschaltung 17 eine Verbindungsschaltung 17-1 auf, die zum Ausführen der Berechnungen der Gleichungen (4) und (11) dient. Mit anderen Worten wird die Verbindungsschaltung 17-1 mit mehreren ausgewählten adaptiven Codevektoren versorgt und verbindet die mehreren ausgewählten adaptiven Codevektoren nacheinander seriell. Als Ergebnis liefert die Wiederholungsschaltung 17 den adaptiven Codevektor a an die Berechnungsschaltung 19.
Die Tonquellen-Codebuchschaltung 18 wird durch einen ROM (Festwertspeicher) implementiert und dient zum Speichern mehrerer Tonquellen-Codevektoren. Die Tonquellen-Codebuchschaltung 18 wird von der Auswertungsschaltung 22 mit dem Indexsignal versorgt, das repräsentativ für den Index ist, der den Fehler minimiert, und wählt einen der mehreren Tonquellen-Codevektoren als einen ausgewählten Tonquellen-Codevektor c gemäß dem Index aus.
Wie in Fig. 4 dargestellt, weist die Berechnungsschaltung 19 eine Verstärkungsberechnungsschaltung 19-0, erste und zweite Multiplizierer 19-1 und 19-2 und eine Addiererschaltung 19-3 auf. Die Verstärkungsberechnungsschaltung 19-0 wird mit dem adaptiven Codevektor a, dem ausgewählten Tonquellen-Codevektor c und dem gewichteten Tonquellenvektor Ws versorgt und berechnet die optimale Tonhöhenverstärkung β und die optimale Tonquellenverstärkung γ durch die Verwendung der Gleichung (10). Die optimale Tonhöhenverstärkung β und die optimalen Tonquellenverstärkung γ werden dem ersten und dem zweiten Multiplizierer 19-1 bzw. 19-2 zugeführt.
Der erste Multiplizierer 19-1 multipliziert den adaptiven Codevektor a mit der optimalen Tonhöhenverstärkung β und liefert ein erstes multipliziertes Ergebnis βa an die Addiererschaltung 19-3. Entsprechend multipliziert der zweite Multiplizierer 19-2 den ausgewählten Tonquellen-Codevektor c mit der optimalen Tonquellenverstärkung γ und liefert ein zweites multipliziertes Ergebnis γc an die Addiererschaltung 19-3. Die Addiererschaltung 19-3 addiert das erste und das zweite multiplizierte Ergebnis und erzeugt ein addiertes Ergebnis als den Anregungsvektor y.
Zurückkehrend zu Fig. 1, wird die gewichtende Syntheseschaltung 20 mit dem LP-Koeffizienten und dem Anregungsvektor y versorgt. Die gewichtende Syntheseschaltung 20 berechnet einen gewichteten synthetischen Vektor WHy, indem gewichtende Synthesefilter verwendet werden, von denen jeder die Ausgangsantworten W(z) und H(z) aufweist, die durch die Gleichungen (1) und (8) repräsentiert werden. Die Differentialschaltung 21 wird mit dem gewichteten synthetischen Vektor WHy und dem gewichteten Sprachvektor Ws versorgt. Die Differentialschaltung 21 berechnet eine Differenz zwischen dem gewichteten synthetischen Vektor WHy und dem gewichteten Sprachvektor Ws und liefert ein Differenzsignal, das repräsentativ für die Differenz ist, an die Auswertungsschaltung 22. Unter Verwendung des Differenzsignals berechnet die Auswertungsschaltung 22 den gewichteten quadratischen Abstand D, der durch die Gleichung (9) gegeben ist, und liefert das Indexsignal, das für eine nächste Kombination der Verzögerung L und des Tonquellen-Codevektors kennzeichnend ist, an die adaptive Codebuchschaltung 16 und die Tonquellen-Codebuchschaltung 18. Die Auswertungsschaltung 22 wiederholt die Berechnung des gewichteten quadratischen Abstandes D um die Verzögerung L eines vorbestimmten Bereiches und der mehreren Tonquellen-Codevektoren, die in der Tonquellen- Codebuchschaltung 18 gespeichert sind. Auf die Vollendung der oben erwähnten Berechnung hin liefert die Auswertungsschaltung 22 den Index der Verzögerung L, der den gewichteten quadratischen Abstand D minimiert, an einen ersten Ausgangsanschluß 23- 1 und liefert den Index des Tonquellen-Codevektors an einen zweiten Ausgangsanschluß 23-2.
Bezugnehmend auf Fig. 5, wird eine Beschreibung hinsichtlich einer anderen herkömmlichen Anregungssignal-Codierungsvorrichtung durch das CELP-Verfahren vorgenommen. Die Anregungssignal-Codierungsvorrichtung ist von der Art, die den Tonquellenvektor auswählt, nachdem ein Kandidat für den adaptiven Codevektor vorbereitend ausgewählt wurde. Die Anregungssignal- Codierungsvorrichtung weist ähnliche Teile auf, die durch gleiche Bezugsziffern bezeichnet werden, mit der Ausnahme erster und zweiter gewichtender Syntheseschaltungen 25-1 und 25- 2, erster und zweiter Differentialschaltungen 26-1 und 26-2 und erster und zweiter Auswertungsschaltungen 27-1 und 27-2.
Wie vorher beschrieben, wird das Sprachsignal durch die Rahmenteilungsschaltung 12 in mehrere Rahmen aufgeteilt, von denen jeder die Rahmenperiode aufweist. Die LP-Analysatorschaltung 13 erzeugt das Parametersignal, das für den LP-Koeffizienten α(1) repräsentativ ist. Jeder der Rahmen wird durch die Teilrahmenteilungsschaltung 14 in mehrere Teilrahmen aufgeteilt, von denen jeder die Teilrahmenperiode aufweist. Die Gewichtungsschaltung 15 erzeugt das gewichtete Sprachvektorsignal, das für den gewichteten Sprachvektor Ws repräsentativ ist.
Die adaptive Codebuchschaltung 16 wird von der ersten Auswertungsschaltung 27-1 mit dem Indexsignal versorgt, das repräsentativ für den Index ist, der einen Fehler minimiert. Die adaptive Codebuchschaltung 16 wählt einen der mehreren adaptiven Codevektoren als den ausgewählten adaptiven Codevektor P(L) gemäß dem Index aus. Die Wiederholungsschaltung 17 führt die Berechnungen der Gleichungen (4) und (11) aus. Die Wiederholungsschaltung 17 liefert das adaptive Codevektorsignal, das für den adaptiven Codevektor a repräsentativ ist, an die erste gewichtende Syntheseschaltung 25-1.
Die erste gewichtende Syntheseschaltung 25-1 wird mit dem LP-Koeffizienten α(i) und dem adaptiven Codevektor a versorgt. Die erste gewichtende Syntheseschaltung 25-1 berechnet einen gewichteten synthetischen Vektor WHa, indem gewichtende Synthesefilter verwendet werden, die die Ausgangsantworten H(z) und W(z) aufweisen, die durch die Gleichungen (1) und (8) repräsentiert werden. Die erste Differentialschaltung 26-1 wird mit dem gewichteten synthetischen Vektor WHa und dem gewichteten Sprachvektor Ws versorgt. Die erste Differentialschaltung 26-1 berechnet eine erste Differenz zwischen dem gewichteten synthetischen Vektor WHa und dem gewichteten Sprachvektor Ws und liefert ein erstes Differenzsignal, das für die erste Differenz repräsentativ ist, an die erste Auswertungsschaltung 27-1. Unter Verwendung des ersten Differenzsignals berechnet die erste Auswertungsschaltung 27-1 den gewichteten quadratischen Abstand D', der durch die folgende Gleichung repräsentiert wird, die gegeben ist durch:
D' = (Ws - βWHa)T(Ws - βWHa) (12)
Die erste Auswertungsschaltung 27-1 wiederholt die Berechnung des gewichteten quadratischen Abstandes D' um die Verzögerung L des vorbestimmten Bereiches. Auf die Vollendung der oben erwähnten Berechnung hin, entscheidet die Auswertungsschaltung 27-1 den Index einer Verzögerung L', die den quadratischen Abstand D' minimiert, die optimale Tonhöhenverstärkung β und einen adaptiven Codevektor a'. Die optimale Tonhöhenverstärkung wird durch die Gleichung (10) unter der Voraussetzung berechnet, daß der Tonquellen-Codevektor auf einen Nullvektor gesetzt ist, weil der Tonquellen-Codevektor in diesem Stadium noch nicht bestimmt worden ist. Der quadratische Abstand D', die optimale Tonhöhenverstärkung β und der adaptive Codevektor a' werden durch einen ersten Ausgangsanschluß 28-1 abgegeben.
Die Tonquellen-Codebuchschaltung 18 wird von der Auswertungsschaltung 27-2 mit dem Indexsignal versorgt, das repräsentativ für den Index ist, der einen Fehler minimiert. Die Tonquellen-Codebuchschaltung 18 wählt einen der mehreren Tonquellen-Codevektoren als einen ausgewählten Tonquellen-Codevektor c gemäß dem Index aus.
Die zweite gewichtende Syntheseschaltung 25-2 wird mit dem LP-Koeffizienten α(i) und dem ausgewählten Tonquellen-Codevektor c versorgt. Die zweite gewichtende Syntheseschaltung 25-2 berechnet einen gewichteten synthetischen Vektor WHc, indem gewichtende Synthesefilter verwendet werden, die die Ausgangsantworten H(z) und W(z) aufweisen. Die zweite Differentialschaltung 26-2 wird mit dem gewichteten synthetischen Vektor WHc und dem ersten Differenzsignal versorgt.
Die zweite Differentialschaltung 26-2 berechnet eine zweite Differenz zwischen dem gewichteten synthetischen Vektor WHc und die erste Differenz und liefert ein zweites Differenzsignal, das für die zweite Differenz repräsentativ ist, an die zweite Auswertungsschaltung 27-2. Unter Verwendung des zweiten Differenzsignals berechnet die zweite Auswertungsschaltung 27-2 einen gewichteten quadratischen Abstand D", der durch die folgende Gleichung repräsentiert wird, die gegeben ist durch:
D" = (Ws - βWHa' - γWHc)T(Ws - βWHa' - γWHc) (13)
Die zweite Auswertungsschaltung 27-2 wiederholt die Berechnung des gewichteten quadratischen Abstandes D" um die mehreren Tonquellen-Codevektoren, die in der Tonquellen-Codebuchschaltung 18 gespeichert sind. Auf die Vollendung der oben erwähnten Berechnung hin, entscheidet die zweite Auswertungsschaltung 27-2 den Index der Verzögerung L', die den gewichteten quadratischen Abstand D" minimiert, die optimale Tonquellenverstärkung γ und den Tonquellen-Codevektor. Die optimale Tonquellenverstärkung wird durch die Gleichung (10) berechnet. Der quadratische Abstand D', die optimale Tonguellenverstärkung γ und der Tonquellen-Codevektor werden durch einen zweiten Ausgangsanschluß 28- 2 abgegeben.
Bezugnehmend auf die Fig. 6 bis 8, wird die Beschreibung hinsichtlich eines Anregungssignal-Codierungsverfahrens und einer Vorrichtung gemäß einer ersten Ausführungsform dieser Erfindung vorgenommen. Die Anregungssignal-Codierungsvorrichtung weist ähnliche Teile auf, die ähnlich zu jenen sind, die in Fig. 1 dargestellt werden, mit der Ausnahme einer Berechnungsschaltung 30 und einer Auswertungsschaltung 39. Die Anregungssignal-Codierungsvorrichtung ist insbesondere für den Fall geeignet, daß die Verzögerung L kürzer als die Teilrahmenlänge N ist. Die Verzögerung L kann als eine vorbestimmten Periode bezeichnet werden. In der folgenden Beschreibung wird angenommen, daß die Verzögerung L gleich einem Drittel von N ist (L = N/3).
Wie in Fig. 7 dargestellt, weist jeder Teilrahmen (Fig. 7(a)) die Teilrahmenlänge N auf. Eine erste Tonhöhenperiode oder ein Intervall A des adaptiven Codevektors (Fig. 7(c)) wird durch die Verwendung eines Teils des Anregungssignals (Fig. 7(b)) berechnet, das im vorhergehenden oder vergangenen Tonhöhenintervall decodiert wird. Danach wird ein zweites Tonhöhenintervall B des adaptiven Codevektors (Fig. 7(c)) durch die Verwendung eines Teils (A + D) des Anregungssignals berechnet (Fig. 7(b)), das im vorhergehenden Tonhöhenintervall decodiert wird. Entsprechend wird ein drittes Tonhöhenintervall C des adaptiven Codevektors durch die Verwendung eines Teils (B + E) des Anregungssignals berechnet, das im vorhergehenden Tonhöhenintervall B decodiert wird. Ein solcher Prozeß wird wiederholt. Zusätzlich zeigt Fig. 7(d) den Tonquellen-Codevektor.
Unter Umständen wird der Anregungsvektor durch die Gleichung y = β · a + γ · c repräsentiert (siehe Gleichungen (4), (7)), wobei der adaptive Codevektor a in dieser Erfindung durch die folgende Gleichung repräsentiert wird, die gegeben ist durch:
wobei β(1) und γ(1) die Tonhöhenverstärkung und die Tonquellenverstärkung im Tonhöhenintervall i repräsentierten. Es wird vorausgesetzt, daß die Vektoren c(1) und c(2) als der Vektor des Grades L betrachtet werden, und durch die folgende Gleichung definiert werden, die gegeben ist durch:
Der adaptive Codevektor a in dieser Erfindung wird im Fall L < N durch die Gleichung (14) repräsentiert. Im Fall L ≥ N wird der adaptive Codevektor a durch die Gleichung (4) für das herkömmliche Verfahren repräsentiert. Es ist möglich, die Genauigkeit der Codierung in der Weise zu verbessern, daß die Tonquellenverstärkungen des Tonquellencodebuchs sich in jedem der Tonhöhenintervalle unterscheiden. In diesem Fall wird, wenn jede der Verstärkungen jeder Tonhöhenintervalle durch γ(i) gegeben ist, der Tonquellen-Codevektor c' durch die folgende Gleichung repräsentiert, die gegeben ist durch:
Entsprechend wird der Anregungsvektor y durch die folgende Gleichung repräsentiert, die gegeben ist durch:
In der Gleichung (16) repräsentiert I(L) eine Einheitsmatrix des Grades L, während 0(L) eine quadratische Matrix des Grades L repräsentiert, in der alle Elemente Null sind. Dementsprechend wird ein decodierter Anregungsvektor durch die Verzögerung L, den Tonquellen-Codevektor c, die Tonhöhenverstärkungen β und β(i) und die Tonquellenverstärkungen γ und γ(i) bestimmt.
In der ersten Ausführungsform ist es durch Verwendung der Gleichung (14) möglich, die Tonhöhenprädiktion der Gleichung (2) durchzuführen, ohne die Näherung der Gleichung (11) zu verwenden, die im herkömmlichen Verfahren verwendet wird, selbst wenn die Verzögerung L kürzer als die Teilrahmenlänge L der Teilrahmen ist. Dies bedeutet, daß es möglich ist, die Genauigkeit der Tonhöhencodierung zu verbessern.
Die Quantisierung des Anregungsvektors y in der Gleichung (16) wird ausgeführt, indem der Index des Tonquellen-Codevektors c und die Verzögerung L gesucht werden, die den gewichteten quadratischen Abstand D der Gleichung (9) minimiert. In diesem Fall können die optimalen Tonhöhenverstärkungen β und β(i) und die optimale Tonquellenverstärkung γ(i) wie die Gleichung (10) durch die Verwendung der folgenden Gleichung in jedem der Tonhöhenintervalle berechnet werden. Um die Verstärkung korrekt zu berechnen, ist es bei der Berechnung von Ws notwendig, ein Einflußsignal in der Vergangenheit zu löschen. Dies bedeutet, daß die Genauigkeit der Tonhöhencodierung weiter ansteigt.
In den obigen Gleichungen wird jeder der Vektoren s(1), s(2) und s(3) als der Vektor des Grades L betrachtet und wird durch die folgende Gleichung definiert, die gegeben ist durch:
Zurückkehrend zu Fig. 6, teilt die Rahmenteilungsschaltung 12 das Sprachsignal in mehrere Rahmen auf, von denen jeder eine Rahmenperiode von zum Beispiel 20 Millisekunden aufweist. Die LP-Analysatorschaltung 13 führt eine lineare prädiktive Analyseoperation an jedem der Rahmen aus und erzeugt ein Parametersignal, das repräsentativ für den LP-Koeffizienten α(i) ist. Die Teilrahmenteilungsschaltung 14 teilt jeden der Rahmen in mehrere Teilrahmen auf, von denen jeder eine Teilrahmenperiode oder Länge von zum Beispiel 10 Millisekunden aufweist. Die Gewichtungsschaltung 15 weist einen gewichtenden Filter auf, der durch die Ausgangsantwort W(z) definiert ist, die durch die Gleichung (8) gegeben ist, und berechnet einen gewichteten Sprachvektor an jedem der Teilrahmen durch die Verwendung des LP-Koeffizienten α(i). Die Gewichtungsschaltung 15 erzeugt ein gewichtetes Sprachvektorsignal, das repräsentativ für den gewichteten Sprachvektor ist.
Die adaptive Codebuchschaltung 16 wird durch einen RAM (Direktzugriffsspeicher) implementiert und dient zu Speichern mehrerer adaptiver Codevektoren. Wie später deutlich werden wird, wird die adaptive Codebuchschaltung 16 von der Auswertungsschaltung 39 mit einem Indexsignal versorgt, das für einen Index repräsentativ ist, der einen Fehler minimiert. Die adaptive Codebuchschaltung 16 wählt einen der mehreren adaptiven Codevektoren als einen ausgewählten adaptiven Codevektor P(L) gemäß dem Index aus. Der ausgewählte adaptive Codevektor P(L) wird an die Berechnungsschaltung 30 geliefert.
Die Tonquellen-Codebuchschaltung 18 wird durch einen ROM (Festwertspeicher) implementiert und dient zum Speichern mehrerer Tonquellen-Codevektoren. Die Tonquellen-Codebuchschaltung 18 wird von der Auswertungsschaltung 39 mit einem Indexsignal versorgt, das repräsentativ für einen Index ist, der einen Fehler minimiert. Die Tonquellen-Codebuchschaltung 18 wählt gemäß der Indexinformation einen der mehreren Tonquellen- Codevektoren als einen ausgewählten Tonquellen-Codevektor c aus. Der ausgewählte Tonquellen-Codevektor c wird an die Berechnungsschaltung 30 geliefert.
Wie in Fig. 8 dargestellt, weist die Berechnungsschaltung 30 eine Verstärkungsberechnungsschaltung 31, eine Teilungsschaltung 32, eine Verbindungsschaltung 33, erste bis n-te Tonhöhenverstärkung-Multiplizierer 34-1 bis 34-n, erste bis n-te Tonquellenverstärkung-Multiplizierer 35-1 bis 35-n und erste bis n-te Addiererschaltungen 36-1 bis 36-n auf. Die Verstärkungsberechnungsschaltung 31 wird mit dem adaptiven Codevektor P(L), dem ausgewählten Tonquellen-Codevektor c und dem gewichteten Tonquellenvektor Ws versorgt und berechnet erste bis nte Tonhöhenverstärkungen β(1) bis β(n) und erste bis n-te Tonquellenverstärkungen γ(1) bis γ(n) durch die Verwendung der Gleichungen (17) bis (22). Die ersten bis n-ten Tonhöhenverstärkungen β(1) bis β(n) werden jeweils an die ersten bis n-ten Tonhöhenverstärkung-Multiplizierer 34-1 bis 34-n geliefert. Die erste bis n-ten Tonquellenverstärkungen γ(1) bis γ(n) werden jeweils an die ersten bis n-ten Tonquellenverstärkung-Multiplizierer 35-1 bis 35-n geliefert.
Die Teilungsschaltung 32 dient zum Teilen des Tonquellen- Codevektors c in erste bis n-te partielle Tonquellen-Codevektoren abhängig von der Verzögerung L, wie durch die Gleichung (15) gezeigt. Die ersten bis n-ten partiellen Tonquellen-Codevektoren werden jeweils an die ersten bis n-ten Tonquellenverstärkung-Multiplizierer 35-1 bis 35-n geliefert. Zum Beispiel multipliziert der erste Tonhöhenverstärkung-Multiplizierer 34- 1 den adaptiven Codevektor P(L) mit der ersten Tonhöhenverstärkung 13(1) zu einem ersten multiplizierten adaptiven Codevektor.
Der erste Tonquellenverstärkung-Multiplizierer 35-1 multipliziert den ersten partiellen Tonquellen-Codevektor mit der ersten Tonquellenverstärkung γ(1) zu einem ersten multiplizierten Tonquellen-Codevektor. Die erste Addiererschaltung 36-1 addiert den ersten multiplizierten adaptiven Codevektor und den ersten multiplizierten Tonquellen-Codevektor zu einem ersten partiellen Anregungsvektor. Der zweite Tonhöhenverstärkung- Multiplizierer 34-2 multipliziert den ersten partiellen Anregungsvektor mit der zweiten Tonhöhenverstärkung 6 (2) zu einem zweiten multiplizierten adaptiven Codevektor. Der zweite Tonquellenverstärkung-Multiplizierer 35-2 multipliziert einen zweiten partiellen Tonquellen-Codevektor mit der zweiten Tonquellenverstärkung γ(2) zu einen zweiten multiplizierten Tonquellen-Codevektor. Die zweite Addiererschaltung 36-2 addiert den zweiten multiplizierten adaptiven Codevektor und den zweiten multiplizierten Tonquellen-Codevektor zu einem zweiten partiellen Anregungsvektor. Entsprechend multipliziert der n-te Tonhöhenverstärkung-Multiplizierer 34-n einen (n-1)-ten partiellen Anregungsvektor mit der n-ten Tonhöhenverstärkung β(n) zu einem n-ten multiplizierten adaptiven Codevektor. Der n-te Tonquellenverstärkung-Multiplizierer 35-n multipliziert den n-ten partiellen Tonquellen-Codevektor mit der n-ten Tonquellenverstärkung γ(n) zu einem n-ten multiplizierten Tonquellen-Codevektor. Die n-te Addiererschaltung 36-n addiert den n-ten multiplizierten adaptiven Codevektor und den n-ten multiplizierten Tonquellen-Codevektor zu einem n-ten partiellen Anregungsvektor.
Die Verbindungsschaltung 33 verbindet die ersten bis n-ten partiellen Anregungsvektoren und erzeugt den Anregungsvektor y. Schließlich dienen die ersten bis n-ten Tonhöhenverstärkung- Multiplizierer 34-1 bis 34-n, die ersten bis n-ten Tonquellenverstärkung-Multiplizierer 35-1 bis 35-n, die ersten bis n-ten Addiererschaltungen 36-1 bis 36-n und die Verbindungsschaltung 33 zusammen als eine Berechnungsschaltung, die zur Berechnung des Anregungsvektors y durch die Verwendung der Gleichung (16) dient. Unter Umständen kann die Berechnungsschaltung 30 als einen Tonhöhensynchronisation-Addiererschaltung bezeichnet werden. Der Anregungsvektor y wird an die gewichtende Syntheseschaltung 20 geliefert.
Zurückkehrend zu Fig. 6, wird die gewichtende Syntheseschaltung 20 mit dem LP-Koeffizienten α(i) und dem Anregungsvektor y versorgt. Die gewichtende Syntheseschaltung 20 berechnet einen gewichteten synthetischen Vektor WHy, indem sie gewichtende Synthesefilter verwendet, von denen jeder die Ausgangsantworten H(z) und W(z) aufweist, die durch die Gleichungen (1) und (8) repräsentiert werden. Die Differentialschaltung 21 wird mit dem gewichteten synthetischen Vektor WHy und dem gewichteten Sprachvektor Ws versorgt. Die Differentialschaltung 21 berechnet eine Differenz zwischen dem gewichteten synthetischen Vektor WHy und dem gewichteten Sprachvektor Ws und liefert ein Differenzsignal, das repräsentativ für die Differenz zur Auswertungsschaltung 39 ist.
Unter Verwendung des Differenzsignals berechnet die Auswertungsschaltung 39 einen gewichteten quadratischen Abstand D, der durch die Gleichung (9) gegeben ist, und liefert das Indexsignal, das kennzeichnend für eine nächste Kombination der Verzögerung L und des Tonquellen-Codevektors ist, an die adaptive Codebuchschaltung 16 und die Tonquellen-Codebuchschaltung 18. Die Auswertungsschaltung 39 wiederholt die Berechnung des gewichteten quadratischen Abstandes D um die Verzögerung L eines vorbestimmten Bereiches und die mehreren Tonquellen-Codevektoren, die in der Tonquellen-Codebuchschaltung 18 gespeichert sind. Auf die Vollendung der oben erwähnten Berechnungen hin, liefert die Auswertungsschaltung 39 den Index der Verzögerung L, die den gewichteten quadratischen Abstand D minimiert, an den ersten Ausgangsanschluß 23-1 und liefert den Index des Tonquellen-Codevektors an den zweiten Ausgangsanschluß 23-2.
Bezugnehmend auf Fig. 9 und 10, wird die Beschreibung mit einem Anregungssignal-Codierungsverfahren und einer Vorrichtung dafür gemäß einer zweiten Ausführungsform dieser Erfindung fortfahren. Die Anregungssignal-Codierungsvorrichtung weist zu jener ähnliche Teile auf, die in Fig. 5 dargestellt wird, mit der Ausnahme erster und zweiter Berechnungsschaltungen 40 und 50. Wie die erste Ausführungsform ist die Anregungssignal-Codierungsvorrichtung insbesondere für den Fall geeignet, daß die Verzögerung L kürzer als die Teilrahmenlänge N des Teilrahmens ist.
Kurz gesagt wird zuerst mindestens einer der adaptiven Codevektoren als ein ausgewählter adaptive Codevektor ausgewählt. Dann wird ein Anregungsvektor, der durch die Gleichung (16) definiert wird, durch die Verwendung des ausgewählten adaptiven Codevektors und eines der Tonquellen-Vektoren synthetisiert, die vorbereitend in der Tonquellen-Codebuchschaltung 18 gespeichert werden. Schließlich entscheidet die zweite Auswertungsschaltung 27-2 durch die Verwendung des Anregungsvektors y einen Index der Verzögerung L und den Tonquellen-Codevektor, der den gewichteten quadratischen Abstand D minimiert, der durch die Gleichung (9) definiert wird. In einer solchen zweiten Ausführungsform wird die Quantität der Berechnung relativ zur ersten Ausführungsform extrem vermindert.
Als Verfahren zum Auswählen eines Kandidaten für den adaptiven Codevektor wird der Index der Verzögerung L auf die folgende Weise gesucht. Namentlich wird der adaptive Codevektor, der durch die Gleichung (14) gegeben ist, durch die Gleichung angenähert, die gegeben ist durch:
Dann wird die optimale Tonhöhenverstärkung β in jedem der Tonhöhenintervalle berechnet. Der Anregungsvektor y wird durch die Gleichung erhalten, die gegeben ist durch:
y = βa. (24)
Der gewichtete quadratische Abstand D der Gleichung (12) wird berechnet. Unter Bezugnahme auf mindestens einen gewichteten quadratischen Abstand D eines Minimalwertes wird der Index der Verzögerung L gesucht. Zusätzlich können mehrere Werte des gewichteten quadratischen Abstandes D in Reihenfolge des Wertes ausgewählt werden. In diesem Fall ist es möglich, obwohl sich der Rechenaufwand erhöht, die Genauigkeit der Tonhöhencodierung zu steigern.
Wie in Verbindung mit Fig. 5 beschrieben, wird das Sprachsignal durch die Rahmenteilungsschaltung 12 in mehrere Rahmen aufgeteilt, von denen jeder die Rahmenperiode aufweist. Die LP- Analysatorschaltung 13 erzeugt das Parametersignal, das repräsentativ für den LP-Koeffizienten α(i) ist. Jeder der Rahmen wird durch die Teilrahmenteilungsschaltung 14 in mehrere Teilrahmen aufgeteilt, von denen jeder die Teilrahmenperiode aufweist. Die Gewichtungsschaltung 15 erzeugt das gewichtete Sprachvektorsignal, das für den gewichteten Sprachvektor Ws repräsentativ ist.
Die adaptive Codebuchschaltung 16 wird von der ersten Auswertungsschaltung 27-1 mit dem Indexsignal versorgt, das repräsentativ für den Index ist, der einen Fehler minimiert, und wählt einen der mehreren adaptiven Codevektoren als den ausgewählten adaptiven Codevektor P(L) gemäß dem Index aus. Der ausgewählte adaptive Codevektor P(L) wird an die erste Berechnungsschaltung 40 geliefert.
In Fig. 10 weist die erste Berechnungsschaltung 40 eine Verstärkungsberechnungsschaltung 41, erste bis n-te Multiplizierer 42-1 bis 42-n und eine Verbindungsschaltung 43 auf. Versorgt mit dem ausgewählten adaptiven Codevektor P(L) und dem gewichteten Sprachvektor Ws, berechnet die Verstärkungsberechnungsschaltung 41 erste bis n-te Tonhöhenverstärkungen β(1) bis β(n). Eine solche Berechnung wird durch die Verwendung der Gleichungen (17) bis (21) unter der Voraussetzung ausgeführt, daß der Tonquellen-Codevektor gleich dem Nullvektor ist. Der erste Multiplizierer 42-1 multipliziert den ausgewählten adaptiven Codevektor P(L) mit der ersten Tonhöhenverstärkung β(1) und liefert ein erstes multiplizierten Ergebnis an einen zweiten Multiplizierer 42-2 und die Verbindungsschaltung 43. Der zweite Multiplizierer 42-2 multipliziert das erste multiplizierte Ergebnis mit einer zweiten Tonhöhenverstärkung β(2) und erzeugt ein zweites multipliziertes Ergebnis. Entsprechend multipliziert der n-te Multiplizierer 42-n ein (n-1)-tes multipliziertes Ergebnis mit der n-ten Tonhöhenverstärkung β(n) und liefert ein n-tes multipliziertes Ergebnis an die Verbindungsschaltung 43. Die ersten bis n-ten Multiplizierer 42-1 bis 42- n können als ein Rechner betrachtet werden, der die Berechnung ausführt, die durch die Gleichung (23) gegeben ist. Die Verbindungsschaltung 43 verbindet die ersten bis n-ten multiplizierten Ergebnisse und liefert einen adaptiven Codevektor a als einen berechneten adaptiven Codevektor an die erste gewichtende Syntheseschaltung 25-1. Berücksichtigt man das Obige, kann die erste Berechnungsschaltung 40 als einen verstärkungseinstellbare Wiederholungsschaltung bezeichnet werden.
Die erste gewichtende Syntheseschaltung 25-1 wird mit dem LP-Koeffizienten a(i) und dem adaptiven Codevektor a versorgt. Die erste gewichtende Syntheseschaltung 25-1 berechnet einen gewichteten synthetischen Vektor WHa, indem sie gewichtende Synthesefilter verwendet, die die Ausgangsantworten H(z) und W(z) aufweisen, die durch die Gleichungen (1) und (8) repräsentiert werden, durch die Verwendung des LP-Koeffizienten α(i). Die erste Differentialschaltung 26-1 wird mit dem gewichteten synthetischen Vektor WHa und dem gewichteten Sprachvektor Ws versorgt. Die Differentialschaltung 26-1 berechnet eine erste Differenz zwischen dem gewichteten synthetischen Vektor WHa und dem gewichteten Sprachvektor Ws und liefert ein Differenzsignal, das für die erste Differenz repräsentativ ist, an die erste Auswertungsschaltung 27-1. Unter Verwendung des ersten Differenzsignals berechnet die erste Auswertungsschaltung 27-1 einen gewichteten quadratischen Abstand D, der durch die folgende Gleichung repräsentiert wird, die gegeben ist durch:
D' = (Ws - WHa)T(Ws - WHa) (25)
Die erste Auswertungsschaltung 27-1 wiederholt die Berechnung des gewichteten quadratischen Abstandes D' um die Verzögerung L des vorbestimmten Bereiches. Auf die Vollendung der oben erwähnten Berechnung hin, entscheidet die Auswertungsschaltung 27-1 den Index eines adaptiven Codevektors P(L)' und den Index einer Verzögerung L', die den gewichteten quadratischen Abstand D' minimiert. Der Index des adaptiven Codevektors P(L)' wird an die adaptive Codebuchschaltung 16 und den ersten Ausgangsanschluß 28-1 geliefert. Die erste Auswertungsschaltung 27-1 liefert ferner die Verzögerung L' und den adaptiven Codevektor P(L)' an die zweite Berechnungsschaltung 50.
Die Tonquellen-Codebuchschaltung 18 wird von der zweiten Auswertungsschaltung 27-2 mit dem Indexsignal versorgt, das repräsentativ für den Index ist, der einen Fehler minimiert. Die Tonquellen-Codebuchschaltung 18 wählt einen der mehreren Tonquellen-Codevektoren als einen ausgewählten Tonquellen- Codevektor c gemäß dem Index aus. Die zweite Berechnungsschaltung 50 ist ähnlich zur Berechnungsschaltung 30 (Fig. 6), außer daß sie mit dem adaptiven Codevektor P(L)' aus der ersten Auswertungsschaltung 27-1 statt mit dem adaptiven Codevektor P(L) versorgt wird. Die zweite Berechnungsschaltung 50 wird mit dem adaptiven Codevektor P(L)', der Verzögerung L', dem ausgewählten Tonquellen-Codevektor c und dem gewichteten Sprachvektor Ws versorgt und führt die Berechnung aus, die ähnlich zu jener ist, die in Verbindung mit der Berechnungsschaltung 30 beschrieben wird, die in Fig. 6 dargestellt wird. Als Ergebnis liefert die zweite Berechnungsschaltung 50 einen Anregungsvektor y an die zweite gewichtende Syntheseschaltung 25-2.
Die zweite gewichtende Syntheseschaltung 25-2 wird mit dem LP-Koeffizienten α(i) und dem Anregungsvektor y versorgt. Die zweite gewichtende Syntheseschaltung 25-2 berechnet einen gewichteten synthetischen Vektor WHy, indem sie gewichtende Synthesefilter verwendet, die die Ausgangsantworten H(z) und W(z) aufweisen, die durch die Gleichungen (1) und (8) repräsentiert werden, durch die Verwendung des LP-Koeffizienten a(i). Die zweite Differentialschaltung 26-2 wird mit dem gewichteten synthetischen Vektor WHy und dem gewichteten Sprachvektor versorgt. Die zweite Differentialschaltung 26-2 berechnet eine zweite Differenz zwischen dem gewichteten synthetischen Vektor WHy und dem gewichteten Sprachvektor Ws und liefert ein zweites Differenzsignal, das für die zweite Differenz repräsentativ ist, an die zweite Auswertungsschaltung 27-2. Unter Verwendung des zweiten Differenzsignals berechnet die zweite Auswertungsschaltung 27-2 einen gewichteten quadratischen Abstand D", der durch die folgende Gleichung repräsentiert wird, die gegeben ist durch:
D" = (Ws - WHa' - WHc)T(Ws - WHa' - WHc) (26)
Die zweite Auswertungsschaltung 27-2 wiederholt die Berechnung des gewichteten quadratischen Abstandes D" für die mehreren Tonquellen-Codevektoren, die in der Tonquellen-Codebuchschaltung 18 gespeichert sind. Auf die Vollendung der oben erwähnten Berechnung hin, entscheidet die zweite Auswertungsschaltung 27- 2 den Index der Verzögerung L', die den gewichteten quadratischen Abstand D" minimiert, die optimale Tonquellenverstärkung γ und den Tonquellen-Codevektor. Der gewichtete quadratische Abstand D", die optimale Tonquellenverstärkung γ und der Tonquellen-Codevektor c werden durch den zweiten Ausgangsanschluß 28-2 abgegeben.
Während diese Erfindung soweit in Verbindung mit einigen Ausführungsformen derselben beschrieben worden ist, wird es für Fachleute ohne weiteres möglich sein, diese Erfindung auf verschiedene andere Arten in die Praxis umzusetzten, die im folgenden erwähnt werden.
In der ersten und der zweiten Ausführungsform können, wie aus der Gleichung (3) zu entnehmen ist, die mehreren Tonhöhenverstärkungen im Vektor durch einen konstanten Wert angenähert werden, wie er durch die folgende Gleichung gegeben ist.
β(2) = β(3) = 1 (27)
Wenn die Gleichung (27) in die Gleichung (16) eingesetzt wird, kann der Anregungsvektor y, der durch die Gleichung (28) gegeben ist, erhalten werden. Dies bedeutet, daß die Berechnung in der ersten und der zweiten Ausführungsform durch die Verwendung der Gleichung (28) angenähert werden kann. Wie aus der Gleichung (28) deutlich wird, werden die Tonhöhenverstärkung β, die Tonquel lenverstärkungen γ, γ(2), γ(3) für die Berechnung verwendet.
Entsprechend können die mehreren Tonquellenverstärkungen im Vektor durch einen konstanten Wert angenähert werden, wie er durch die folgende Gleichung gegeben ist.
y(2) = 7(3) = 1 (29)
Wenn die Gleichung (29) in die Gleichung (16) eingesetzt wird, kann der Anregungsvektor y, der durch die Gleichung (29) gegeben ist, erhalten werden. Als Ergebnis kann die Berechnung in der ersten und der zweiten Ausführungsform durch die Verwendung der Gleichung (29) angenähert werden. Wie aus der Gleichung (29) deutlich wird, werden die Tonquellenverstärkung 7, die Tonhöhenverstärkungen β, β(2), β(3) für die Berechnung verwendet.
Ferner können die mehreren Tonhöhenverstärkungen und die mehreren Tonquellenverstärkungen im Vektor durch einen konstanten Wert angenähert werden, wie er durch die folgende Gleichung gegeben ist.
β(2) = β(3) = 1 (31)
γ(2) = γ(3) = 1 (32)
Der Anregungsvektor y ist durch die folgende Gleichung (33) gegeben.
In diesem Fall wird das Berechnungsverfahren für die Tonhöhenverstärkungen in einem Artikel offenbart, der zu IEEE Transaction Ausg. ASSP-34, Nr. 5, Oktober 1986 beigetragen wurde.
In der zweiten Ausführungsform kann der Tonquellen-Codevektor aus der Tonhöhenverstärkung β(i) ausgewählt werden, die durch die vorbereitende Auswahl des adaptiven Codebuchs ausgewählt wird. In diesem Fall ist es möglich, die Quantität der Berechnung für die Tonhöhenverstärkung β(i) bei der Auswahl des Tonquellen-Codevektors zu reduzieren.
In der ersten und der zweiten Ausführungsform kann der Tonquellen-Codevektor zum adaptiven Codevektor orthogonalisiert werden. Als Ergebnis ist es möglich, redundante Komponenten zu entfernen, die gemeinsam im adaptiven Codevektor und dem Tonquellen-Codevektor enthalten sind.
In der ersten und der zweiten Ausführungsform kann eine Nicht-Ganzzahl als die Verzögerung L anstelle der Ganzzahl in der Weise verwendet werden, die im vorher erwähnten Verweis 1 beschrieben wird. In diesem Fall ist es möglich, die Tonqualität eines Sprachsignals von einer Frau zu verbessern, das eine kurze Tonhöhenperiode aufweist.

Claims

1. Anregungssignal-Codierungsverfahren, das die Schritte aufweist: Aufteilen des Sprachsignals in mehrere Rahmen (12), Ausführen einer linearen prädiktiven Analyse (13) an jedem der mehreren Rahmen, um Spektrumparameter zu erzeugen, Aufteilen jedes der mehreren Rahmen in mehrere Teilrahmen (14), von denen jeder eine Teilrahmenlänge aufweist, Berechnen (15) eines gewichteten Sprachvektors durch die Verwendung der Spektrumparameter und der mehreren Teilrahmen, und Erzeugen eines neuen Anregungssignals (30) durch die Verwendung eines adaptiven Codebuchs (16), das mehrere adaptive Codevektoren aufweist, und eines Tonquellencodebuchs (18), das mehrere Tonquellen-Codevektoren aufweist, wobei das Verfahren dadurch gekennzeichnet ist, daß:

der Erzeugungsschritt in vorbestimmten Perioden, wobei die vorbestimmte Periode kürzer als die Teilrahmenlänge ist, durch die Verwendung des adaptiven Codevektors ausgeführt wird, der durch Verwendung des Anregungssignals, das in der vergangenen vorbestimmten Periode erzeugt wird, und der Verwendung des Tonquellen-Codevektors der gegenwärtigen vorbestimmten Periode berechnet wird.

2. Anregungssignal-Codierungsverfahren nach Anspruch 1, wobei der Erzeugungsschritt die Teilschritte aufweist:

Auswählen von mindestens einem der adaptiven Codevektoren aus mehreren berechneten adaptiven Codevektoren, die durch Verwendung des Anregungssignals berechnet werden, das in der vergangenen Periode erzeugt wird, und

Erzeugen eines neuen Anregungssignals durch die Verwendung des mindestens einen der adaptiven Codevektoren und des Tonquellen-Codevektors der gegenwärtigen Periode.

3. Anregungssignal-Codierungsvorrichtung mit einer Rahmenteilungsschaltung (12) zum Aufteilen eines Sprachsignals in mehrere Rahmen, einem Analysator (13) zum Ausführen einer linearen prädiktiven Analyse an jedem der mehreren Rahmen, um ein Parametersignal zu erzeugen, das repräsentativ für Spektrumparameter ist, einer Teilrahmenteilungsschaltung (14) zum Aufteilen jedes der mehreren Rahmen in mehrere Teilrahmen und einer Gewichtungsschaltung (15) zur Berechnung eines gewichteten Sprachvektors durch die Verwendung der Spektrumparameter und der mehreren Teilrahmen, wobei die Anregungssignal-Codierungsvorrichtung aufweist:

eine adaptive Codebuchschaltung (16), die mehrere adaptive Codevektoren speichert, zum Auswählen von einem der mehreren adaptiven Codevektoren als einen ausgewählten adaptiven Codevektor als Antwort auf ein Indexsignal, wobei jeder der mehreren adaptiven Codevektoren durch die Verwendung eines Anregungssignals berechnet wird, das in der Vergangenheit berechnet wird;

eine Tonquellen-Codebuchschaltung (18), die mehrere Tonquellen-Codevektoren speichert, zum Auswählen von einem der mehreren Tonquellen-Codevektoren als einen ausgewählten Tonquellen-Codevektor als Antwort auf das Indexsignal;

einer Berechnungsschaltung zum Ausführen einer vorbestimmten Berechnung in einer vorbestimmten Periode, die kürzer als die Teilrahmenlänge ist, durch die Verwendung mehrerer Tonhöhenverstärkungen, mehrerer Tonquellenverstärkungen, des gewichteten Sprachvektors, des ausgewählten adaptiven Codevektors, der durch Verwendung des Anregungssignals berechnet wird, das in der vergangenen vorbestimmten Periode erzeugt wird, und des ausgewählten Tonquellen-Codevektors der gegenwärtigen vorbestimmten Periode, wobei die Berechnungsschaltung als Berechnungsergebnis einen Anregungsvektor erzeugt;

eine gewichtende Syntheseschaltung (20), die mit den Spektrumparametern und dem Anregungsvektor versorgt wird, zum Ausführen eine Berechnung für den Anregungsvektor gemäß den Spektrumparametern, um einen gewichteten synthetischen Vektor zu erzeugen;

eine Differentialschaltung (21), die mit dem gewichteten Sprachvektor und dem gewichteten synthetischen Vektor versorgt wird, zur Berechnung einer Differenz zwischen dem gewichteten Sprachvektor und dem gewichteten synthetischen Vektor, um ein Differenzsignal zu erzeugen, das repräsentativ für die Differenz ist; und

eine Auswertungsschaltung (39), die mit dem Differenzsignal versorgt wird, zum Ausführen einer Auswertung der Differenz, um ein Auswertungsergebnis als das Indexsignal an die adaptive Codebuchschaltung (16) und die Tonquellen-Codebuchschaltung (18) zu liefern, wobei die Auswertungsschaltung die Auswertung wiederholt, bis sie ein vorbestimmtes Auswertungsergebnis erhält, wobei die Auswertungsschaltung das Indexsignal, das für einen Index des Tonquellen-Codevektors repräsentativ ist, und ein endgültiges Auswertungsergebnis beim Erhalten des vorbestimmten Auswertungsergebnisses erzeugt.

4. Anregungssignal-Codierungsvorrichtung nach Anspruch 3, wobei die Berechnungsschaltung (30) aufweist:

eine Verstärkungsberechnungsschaltung (31), die mit dem gewichteten Sprachvektor, dem ausgewählten adaptiven Codevektor und dem ausgewählten Tonquellen-Codevektor versorgt wird, zur Berechnung erster bis n-ter Tonhöhenverstärkungen als die mehreren Tonhöhenverstärkungen und erster bis n-ter Tonquellenverstärkungen als die mehreren Tonquellenverstärkungen;

eine Teilungsschaltung (32) zum Aufteilen des Tonquellen- Codevektors in erste bis n-te partielle Tonquellen-Codevektoren;

Schaltungseinrichtungen (34-1, 34-2, 34-n, 35-1, 35-2, 35- n, 36-1, 36-2, 36-n), die mit dem ausgewählten adaptiven Codevektor und den ersten bis n-ten partiellen Tonquellen- Codevektoren versorgt werden, zum Ausführen der vorbestimmten Berechnung, um erste bis n-te partielle Anregungsvektoren zu erzeugen; und

eine Verbindungsschaltung (33) zum seriellen Verbinden der ersten bis n-ten partiellen Anregungsvektoren, um den Anregungsvektor zu erzeugen.

5. Anregungssignal-Codierungsvorrichtung mit einer Rahmenteilungsschaltung (12) zum Teilen eines Sprachsignals in mehrere Rahmen, einem Analysator (13) zum Ausführen einer linearen prädiktiven Analyse an jedem der mehreren Rahmen, um ein Parametersignal zu erzeugen, das repräsentativ für Spektrumparameter ist, eine Teilrahmenteilungsschaltung (14) zum Teilen von jedem der mehreren Rahmen in mehrere Teilrahmen und eine Gewichtungsschaltung (15) zur Berechnung eines gewichteten Sprachvektors durch die Verwendung der Spektrumparameter und der mehreren Teilrahmen, wobei die Anregungssignal-Codierungsvorrichtung aufweist:

eine adaptive Codebuchschaltung (16), die mehrere adaptive Codevektoren speichert, zum Auswählen von einem der mehreren adaptiven Codevektoren als einen ausgewählten adaptiven Codevektor als Antwort auf ein erstes Indexsignal, wobei jeder der mehreren adaptiven Codevektoren durch die Verwendung eines Anregungssignals berechnet wird, das in der Vergangenheit berechnet wird;

eine erste Berechnungsschaltung (40), die mit dem gewichteten Sprachvektor und dem ausgewählten adaptiven Codevektor versorgt wird, zum Ausführen einer ersten vorbestimmten Berechnung in einer vorbestimmten Periode, die kürzer als die Teilrahmenlänge ist, durch die Verwendung von mehreren Tonhöhenverstärkungen, dem gewichteten Sprachvektor und dem ausgewählten adaptiven Codevektor, der durch Verwendung des Anregungssignal ausgewählt wird, das in der vergangenen vorbestimmten Periode erzeugt wird, wobei die erste Berechnungsschaltung ein erstes Berechnungsergebnis als einen berechneten adaptiven Codevektor erzeugt;

eine erste gewichtende Syntheseschaltung (25-1), die mit dem Spektrumparameter und dem berechneten adaptiven Codevektor versorgt wird, zum Ausführen einer Berechnung für den berechneten adaptiven Codevektor gemäß den Spektrumparametern, um einen ersten gewichteten synthetischen Vektor zu erzeugen;

eine erste Differentialschaltung (26-1), die mit dem gewichteten Sprachvektor und dem ersten gewichteten synthetischen Vektor versorgt wird, zur Berechnung einer ersten Differenz zwischen dem gewichteten Sprachvektor und dem ersten gewichtet synthetischen Vektor, um ein erstes Differenzsignal zu erzeugen, das repräsentativ für die erste Differenz ist;

eine erste Auswertungsschaltung (27-1), die mit dem ersten Differenzsignal versorgt wird, zum Ausführen einer Auswertung der ersten Differenz, um ein erstes Auswertungsergebnis als das erste Indexsignal an die adaptive Codebuchschaltung zu liefern, wobei die erste Auswertungsschaltung die Auswertung wiederholt, bis sie ein erstes vorbestimmtes Auswertungsergebnis erhält, wobei die erste Auswertungsschaltung das erste Indexsignal für einen optimalen adaptiven Codevektor und den optimalen adaptiven Codevektor beim Erhalten des ersten vorbestimmten Auswertungsergebnisses erzeugt;

eine Tonquellen-Codebuchschaltung (18), die mehrere Tonquellen-Codevektoren speichert, zum Auswählen von einem der mehreren Tonquellen-Codevektoren als einen ausgewählten Tonquellen-Codevektor gemäß einem zweiten Indexsignal;

eine zweite Berechnungsschaltung (50) zum Ausführen einer zweiten vorbestimmten Berechnung durch die Verwendung mehrerer Tonquellenverstärkungen, des gewichteten Sprachvektors, des ausgewählten Tonquellen-Codevektors der gegenwärtigen Periode und dem optimalen adaptiven Codevektor, wobei die zweite Berechnungsschaltung ein zweites Berechnungsergebnis als einen Anregungsvektor erzeugt;

eine zweite gewichtende Syntheseschaltung (25-2), die mit den Spektrumparametern und dem Anregungsvektor versorgt wird, zum Ausführen einer Berechnung für den Anregungsvektor gemäß dem Spektrumparameter, um einen zweiten gewichteten synthetischen Vektor zu erzeugen;

eine zweite Differentialschaltung (26-2), die mit dem gewichteten Sprachvektor und dem zweiten gewichteten synthetischen Vektor versorgt wird, zur Berechnung einer zweiten Differenz zwischen dem gewichteten Sprachvektor und dem zweiten gewichteten synthetischen Vektor, um ein zweites Differenzsignal zu erzeugen, das repräsentativ für die zweite Differenz ist;

eine zweite Auswertungsschaltung (27-2), die mit dem zweiten Differenzsignal versorgt wird, zum Ausführen einer Auswertung der zweiten Differenz, um ein zweites Auswertungsergebnis als das zweite Indexsignal an die Tonquellen-Codebuchschaltung zu liefern, wobei die zweite Auswertungsschaltung die Auswertung wiederholt, bis sie ein zweites vorbestimmtes Auswertungsergebnis erhält, wobei die zweite Auswertungsschaltung das zweite Indexsignal für einen optimalen Tonquellen-Codevektor und ein endgültiges Auswertungsergebnis erzeugt, das schließlich beim Erhalten des zweiten vorbestimmten Auswertungsergebnisses erhalten wird.

6. Anregungssignal-Codierungsvorrichtung nach Anspruch 5, wobei die erste Berechnungsschaltung aufweist:

eine Verstärkungsberechnungsschaltung (41) zur Berechnung erster bis n-ter Tonhöhenverstärkungen als die mehreren Tonhöhenverstärkungen durch die Verwendung des gewichteten Sprachvektors und des ausgewählten adaptiven Codevektors;

Schaltungseinrichtungen (42-1, 42-2, 42-n) zum Ausführen der ersten vorbestimmten Berechnung durch die Verwendung des ausgewählten adaptiven Codevektors und der ersten bis n-ten Tonhöhenverstärkungen, um erste bis n-te partielle adaptive Codevektoren zu erzeugen; und

eine Verbindungsschaltung (43), die mit den ersten bis nten partiellen adaptiven Codevektoren versorgt wird, zum seriellen Verbinden der ersten bis n-ten partiellen adaptiven Codevektoren, um den berechneten adaptiven Codevektor zu erzeugen.