-
HINTERGRUND
DER ERFINDUNG
-
Gebiet der
Erfindung
-
Die
vorliegende Erfindung bezieht sich auf eine Sprachcodiervorrichtung
und ein Sprachcodierverfahren zum Verdichten eines digitalen Sprachsignals,
um seine Informationsmenge zu reduzieren. Die vorliegende Erfindung
bezieht sich auch auf eine Sprachdecodiervorrichtung und ein Sprachdecodierverfahren
zum Decodieren eines von der vorgenannten Sprachcodiervorrichtungen
erzeugten Sprachcodes, um ein digitales Sprachsignal zu erzeugen.
-
Beschreibung
des Standes der Technik
-
Viele
der Sprachcodierverfahren und Sprachdecodierverfahren nach dem Stand
der Technik teilen eine Eingangssprache in spektrale Umhüllungsinformationen
und Erregungsinformationen und codieren jeden Informati onstyp in
Einheiten vom Rahmen, die jeweils eine vorbestimmte Länge haben,
um einen Sprachcode zu erzeugen. Der erzeugte Sprachcode wird in
die spektralen Umhüllungsinformationen
und die Erregungsinformationen decodiert, die dann durch Verwendung
eines Synthesefilters kombiniert werden, um eine decodierte Sprache zu
erhalten. Die repräsentativsten
von Sprachcodier-/-decodiervorrichtungen bei denen die vorgenannten
Sprachcodier-/-decodierverfahren angewendet werden, enthalten solche,
die das codeerregte lineare Vorhersage(CELP)-System verwenden.
-
13 ist
ein schematisches Diagramm, das die Ausbildung einer herkömmlichen
Sprachcodiervorrichtung vom CELP-Typ zeigt. In der Figur bezeichnet
die Bezugszahl 1 eine Linearvorhersage-Analyseeinheit zum
Analysieren einer Eingangssprache und zum Herausziehen von Linearvorhersagekoeffizienten,
die Spektralumhüllungsinformationen
der Eingangssprache bezeichnen, während die Bezugszahl 2 eine
Linearvorhersagekoeffizienten-Codiereinheit bezeichnet für die Codierung
der von der Linearvorhersage-Analyseeinheit 1 herausgezogenen
Linearvorhersagekoeffizienten und die Ausgabe des sich ergebenden
Codes zu einer Multiplexeinheit 6 sowie die Ausgabe quantisierter
Werte der Linearvorhersagekoeffizienten zu einer adaptiven Erregungscodiereinheit 3 einer
festen Erregungscodiereinheit 4 und einer Verstärkungscodiereinheit 5.
-
Die
Bezugszahl 3 bezeichnet die adaptive Erregungscodiereinheit
zum Erzeugen einer versuchsweisen zusammengesetzten Sprache durch Verwendung
der von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten sowie zum Auswählen eines
adaptiven Erregungscodes, mit dem der Abstand zwischen der ver suchsweisen
zusammengesetzten Sprache und der Eingangssprache minimiert wird,
und zum Ausgeben des so ausgewählten
adaptiven Erregungscodes zu der Multiplexeinheit 6. Die
adaptive Erregungscodiereinheit 3 gibt auch ein adaptives
Erregungssignal (ein Zeitserienvektor, der als ein Ergebnis der
Wiederholung eines vergangenen Erregungssignals mit einer gegebenen
Länge erhalten
wurde) entsprechend dem adaptiven Erregungscode zu der Verstärkungscodiereinheit 5 aus.
Die Bezugszahl 4 bezeichnet die feste Erregungscodiereinheit
zum Erzeugen einer versuchsweisen zusammengesetzten Sprache durch Verwendung
der von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten sowie zum Auswählen eines
festen Erregungscodes, mit dem der Abstand zwischen der versuchsweisen
zusammengesetzten Sprache und einem zu codierenden Signal (ein Signal,
das als ein Ergebnis der Subtraktion der auf der Grundlage des adaptiven
Erregungssignals erzeugten zusammengesetzten Sprache von der Eingangssprache
erhalten wurde) minimiert wird, und zum Ausgeben des ausgewählten festen
Erregungscodes zu der Multiplexeinheit 6. Die feste Erregungscodiereinheit 4 gibt
auch ein festes Erregungssignal, das ein Zeitserienvektor entsprechend
dem festen Erregungscode ist, zu der Verstärkungscodiereinheit 5 aus.
-
Die
Bezugszahl 5 bezeichnet die Verstärkungscodiereinheit zum Multiplizieren
sowohl des von der adaptiven Erregungscodiereinheit 3 ausgegebenen
adaptiven Erregungssignals als auch des von der festen Erregungscodiereinheit 4 ausgegebenen
festen Erregungssignals mit jedem Element eines Verstärkungsvektors
und zum Addieren jedes jeweiligen Paares der Multiplikationsergebnisse,
um ein Erregungssignal zu er zeugen. Die Verstärkungscodiereinheit 5 erzeugt
auch eine versuchsweise zusammengesetzte Sprache aus dem vorgenannten Erregungssignal
durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten, wählt den
Verstärkungscode
aus, mit dem der Abstand zwischen der versuchsweise zusammengesetzten
Sprache und der Eingangssprache minimiert wird, und gibt den ausgewählten Verstärkungscode
zu der Multiplexeinheit 6 aus. Die Bezugszahl 6 bezeichnet
die Multiplexeinheit für
die Multiplexverarbeitung des Codes der von der Linearvorhersagekoeffizienten-Codiereinheit 2 codierten
Linearvorhersagekoeffizienten, des von der adaptiven Erregungscodiereinheit 3 ausgegebenen
adaptiven Erregungscodes, des von der festen Erregungscodiereinheit 4 ausgegebenen
festen Erregungscodes und des von der Verstärkungscodiereinheit 5 ausgegebenen
Verstärkungscodes,
um den Sprachcode zu erzeugen.
-
14 ist
ein schematisches Diagramm, das die innere Konfiguration der festen
Erregungscodiereinheit 4 zeigt. In der Figur bezeichnet
die Bezugszahl 11 ein festes Erregungscodebuch; 12 ein Synthesefilter; 13 eine
Verzerrungsberechnungseinheit; und 14 eine Verzerrungsauswertungseinheit.
-
15 ist
ein schematisches Diagramm, das die Ausbildung einer herkömmlichen
Sprachdecodiervorrichtung vom CELP-Typ zeigt. In der Figur bezeichnet
die Bezugszahl 21 eine Trenneinheit zum Trennen des von
der Sprachcodiervorrichtung ausgegebenen Sprachcodes in den Code
der Linearvorhersagekoeffizienten, den adaptiven Erregungscode, den
festen Erregungscode und den Verstärkungscode, die dann zu einer
Linearvorhersagekoeffizienten-Decodiereinheit 22, einer
adaptiven Er regungsdecodiereinheit 23, einer festen Erregungsdecodiereinheit 24 bzw.
einer Verstärkungsdecodiereinheit 25 geliefert
werden. Die Bezugszahl 22 bezeichnet die Linearvorhersagekoeffizienten-Decodiereinheit
zum Decodieren des von der Trenneinheit 21 ausgegebenen
Codes der Linearvorhersagekoeffizienten und zum Ausgeben der decodierten
quantisierten Werte der Linearvorhersagekoeffizienten zu einem Synthesefilter 29.
-
Die
Bezugszahl 23 bezeichnet die adaptive Erregungsdecodiereinheit
zum Ausgeben eines adaptiven Erregungssignals (ein Zeitserienvektor,
der als ein Ergebnis der Wiederholung eines vergangenen Erregungssignals
erhalten wurde) entsprechend dem von der Trenneinheit 21 ausgegebenen
adaptiven Erregungscode, während
die Bezugszahl 24 die feste Erregungsdecodiereinheit zum
Ausgeben eines festen Erregungssignals (ein Zeitserienvektor) entsprechend
dem von der Trenneinheit 21 ausgegebenen festen Erregungscode
bezeichnet. Die Bezugszahl 25 bezeichnet die Verstärkungsdecodiereinheit zum
Ausgeben eines Verstärkungsvektors
entsprechend dem von der Trenneinheit 21 ausgegebenen Verstärkungscode.
-
Die
Bezugszahl 26 bezeichnet eine Multiplikationsvorrichtung
zum Multiplizieren des von der adaptiven Erregungsdecodiereinheit 23 ausgegebenen adaptiven
Erregungssignals mit einem Element des von der Verstärkungsdecodiereinheit 25 ausgegebenen
Verstärkungsvektors,
während
die Bezugszahl 27 eine andere Multiplikationsvorrichtung
zum Multiplizieren des von der festen Erregungsdecodiereinheit 24 ausgegebenen
festen Erregungssignals mit einem anderen Element des von der Verstärkungsdecodiereinheit 25 ausgegebenen
Verstärkungsvektors
bezeichnet. Die Bezugszahl 28 be zeichnet einen Addierer
zum Addieren des Multiplikationsergebnisses der Multiplikationsvorrichtung 26 und
des Multiplikationsergebnisses der Multiplikationsvorrichtung 27,
um ein Erregungssignal zu erzeugen. Die Bezugszahl 29 bezeichnet
das Synthesefilter zum Durchführen
einer Synthesefilterverarbeitung bei dem von dem Addierer 28 erzeugten
Erregungssignal, um eine Ausgangssprache zu erzeugen.
-
16 ist
ein schematisches Diagramm, das die innere Ausbildung der festen
Erregungsdecodiereinheit 24 zeigt. In der Figur bezeichnet
die Bezugszahl 31 ein festes Erregungscodebuch.
-
Die
Arbeitsweise der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung
wird nachfolgend beschrieben.
-
Die
herkömmlichen
Sprachcodier-/-decodiervorrichtungen führen eine Verarbeitung in Einheiten
von Rahmen durch, die jeweils eine Zeitdauer von angenähert 5 bis
50 ms haben.
-
Bei
Empfang einer Sprache analysiert die Linearvorhersage-Analyseeinheit 1 in
der Sprachcodiervorrichtung die Eingangssprache und zieht die Linearvorhersagekoeffizienten
heraus, die Spektralumhüllungsinformationen über die
Sprache sind.
-
Nachdem
die Linearvorhersage-Analyseeinheit 1 die Linearvorhersagekoeffizienten
herausgezogen hat, codiert die Linearvorhersagekoeffizienten-Codiereinheit 2 die
Linearvorhersagekoeffizienten und gibt den Code zu der Multiplexeinheit 6 aus. Die
Linearvorhersagekoeffizienten-Codiereinheit 2 gibt auch
quantisierte Werte der Linearvorhersagekoeffizienten zu der adap tiven
Erregungscodiereinheit 3, der festen Erregungscodiereinheit 4 und
der Verstärkungscodiereinheit 5 aus.
-
Die
adaptive Erregungscodiereinheit 3 hat ein eingebautes adaptives
Erregungscodebuch, das vergangene Erregungssignale mit einer vorbestimmten
Länge speichert,
und sie erzeugt einen Zeitserienvektor, der als ein Ergebnis der
periodischen Wiederholung eines vergangenen Erregungssignals erhalten
wird, auf der Grundlage von jedem intern erzeugten adaptiven Erregungscode
(angezeigt durch eine Binärzahl
mit wenigen Bits).
-
Die
adaptive Erregungscodiereinheit 3 multipliziert dann jeden
Zeitserienvektor mit jedem geeigneten Verstärkungswert und erzeugt eine
versuchsweise zusammengesetzte Sprache durch Hindurchführen des
Zeitserienvektors durch das Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten verwendet.
-
Weiterhin
wertet die adaptive Erregungscodiereinheit 3 beispielsweise
den Abstand zwischen der versuchsweisen zusammengesetzten Sprache und
der Eingangssprache aus, um die Codierverzerrung zu erhalten, und
sie wählt
den adaptiven Erregungscode, mit dem der Abstand minimiert wird,
aus und gibt ihn zu der Multiplexeinheit 6 aus, und sie
gibt einen Zeitserienvektor entsprechend dem ausgewählten adaptiven
Erregungscode als ein adaptives Erregungssignal zu der Verstärkungscodiereinheit 5 aus.
-
Die
adaptive Erregungscodiereinheit 3 gibt auch ein Signal,
das als ein Ergebnis der Subtraktion einer auf der Grundlage des
adaptiven Erregungssignals erzeugten zusammengesetzten Sprache von der
Eingangssprache erhaltenes Signal als ein zu codierendes Signal
zu der festen Erregungscodiereinheit 4 aus.
-
Als
Nächstes
wird die Arbeitsweise der festen Erregungscodiereinheit 4 beschrieben.
-
Das
in der festen Erregungscodiereinheit 4 enthaltene feste
Erregungscodebuch 11 speichert feste Codevektoren, die
rauschartige Zeitserienvektoren sind, und gibt aufeinander folgend
einen Zeitserienvektor gemäß jedem
festen Erregungscode (angezeigt durch eine Binärzahl mit wenigen Bits) der von
der Verzerrungsbewertungseinheit 14 ausgegeben ist, aus.
Jeder Zeitserienvektor wird dann mit jedem zweckmäßigen Verstärkungswert
multipliziert und in das Synthesefilter 12 eingegeben.
-
Das
Synthesefilter 12 verwendet die von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten, um eine versuchsweise
zusammengesetzte Sprache für
jeden mit der Verstärkung
multiplizierten Zeitserienvektor zu erzeugen.
-
Die
Verzerrungsberechnungseinheit 13 berechnet beispielsweise
den Abstand zwischen der versuchsweise zusammengesetzten Sprache
und dem von der adaptiven Erregungscodiereinheit 3 ausgegebenen,
zu codierenden Signal, um die Codierverzerrung zu erhalten.
-
Die
Verzerrungsbewertungseinheit 14 wählt den festen Erregungscode,
mit dem der Abstand zwischen der versuchsweisen zusammengesetzten Sprache
und dem von der Verzerrungsberechnungseinheit 13 berechneten,
zu co dierenden Signal minimiert wird, aus und gibt ihn zu der Multiplexeinheit 6 aus,
und sie richtet das feste Erregungscodebuch 11 für die Ausgabe
eines Zeitserienvektors entsprechend dem ausgewählten festen Erregungscode
als ein festes Erregungssignal zu der Verstärkungscodiereinheit 5.
-
Die
Verstärkungscodiereinheit 5 hat
ein eingebautes, Verstärkungsvektoren
speicherndes Verstärkungscodebuch
und liest aufeinander folgend einen Verstärkungsvektor aus dem Verstärkungscodebuch
entsprechend jedem intern erzeugten Verstärkungscode (angezeigt durch
eine Binärzahl
mit wenigen Bits).
-
Die
Verstärkungscodiereinheit 5 multipliziert sowohl
das von der adaptiven Erregungscodiereinheit 3 ausgegebene
adaptive Erregungssignal als auch das von der festen Erregungscodiereinheit 4 ausgegebene
feste Erregungssignal mit jedem Element des Verstärkungsvektors
und addiert jedes jeweilige Paar der Multiplikationsergebnisse zusammen,
um ein Erregungssignal zu erzeugen.
-
Die
Verstärkungscodiereinheit 5 erzeugt dann
eine versuchsweise zusammengesetzte Sprache durch Hindurchführen des
Erregungssignals durch ein Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 2 ausgegebenen quantisierten
Werte der Linearvorhersagekoeffizienten verwendet.
-
Weiterhin
wertet die Verstärkungscodiereinheit 5 den
Abstand zwischen der versuchsweisen zusammengesetzten Sprache und
der Eingangssprache aus, um die Codierverzerrung zu erhalten, wählt den
Verstärkungscode
aus, mit dem der Abstand minimiert wird, und gibt ihn zu der Multiplexeinheit 6 aus,
und gibt ein Erre gungssignal entsprechend dem Verstärkungscode
zu der adaptiven Erregungscodiereinheit 3 aus. Die adaptive
Erregungscodiereinheit 3 verwendet dann das Erregungssignal,
das von der Verstärkungscodiereinheit 5 ausgewählt wurde und
dem Verstärkungscode
entspricht, um sein eingebautes adaptives Erregungscodebuch zu aktualisieren.
-
Die
Multiplexeinheit 6 führt
eine Multiplexverarbeitung des Codes der von der Linearvorhersagekoeffizienten-Codiereinheit 2 codierten
Linearvorhersagekoeffizienten, des von der adaptiven Erregungscodiereinheit 3 ausgegebenen
adaptiven Erregungscodes, des von der festen Erregungscodiereinheit 4 ausgegebenen
festen Erregungscodes und des von der Verstärkungscodiereinheit 5 ausgegebenen
Verstärkungscodes
durch, um den Sprachcode als das Multiplexergebnis zu erzeugen.
-
Bei
Empfang des von der Sprachcodiervorrichtung ausgegebenen Sprachcodes
trennt die in der Sprachdecodiervorrichtung enthaltene Trenneinheit 21 diesen
in dem Code der Linearvorhersagekoeffizienten, den adaptiven Erregungscode,
den festen Erregungscode und den Verstärkungscode, die dann zu der
Linearvorhersagekoeffizienten-Decodiereinheit 22, der adaptiven
Erregungsdecodiereinheit 23, der festen Erregungsdecodiereinheit 24 bzw. der
Verstärkungsdecodiereinheit 25 ausgegeben werden.
-
Bei
Empfang des Codes der Linearvorhersagekoeffizienten von der Trenneinheit 21 decodiert
die Linearvorhersagekoeffizienten-Decodiereinheit 21 den
Code und gibt die quantisierten Werte der Linearvorhersagekoeffizienten
zu dem Synthesefilter 29 als das Decodierergebnis aus.
-
Die
adaptive Erregungsdecodiereinheit 23 at das eingebaute
adaptive Erregungscodebuch, das vergangene Erregungssignale mit
einer vorbestimmten Länge
speichert, und sie gibt ein adaptives Erregungssignal (ein Zeitserienvektor,
der als ein Ergebnis der Wiederholung eines vergangenen Erregungssignals
erhalten wurde) aus entsprechend dem von der Trenneinheit 21 ausgegebenen
adaptiven Erregungscode.
-
Andererseits
speichert das in der festen Erregungsdecodiereinheit 24 enthaltene
feste Erregungscodebuch 31 feste Codevektoren, die rauschartige
Zeitserienvektoren sind, und gibt ein festes Erregungssignal entsprechend
dem von der Trenneinheit 21 ausgegebenen festen Erregungscode aus.
-
Die
Verstärkungsdecodiereinheit 25 hat
ein eingebautes, Verstärkungsvektoren
speicherndes Verstärkungscodebuch
und gibt einen Verstärkungsvektor
entsprechend dem von der Trenneinheit 21 ausgegebenen Verstärkungscode
aus.
-
Die
Multiplikationsvorrichtungen 26 und 27 multiplizieren
das von der adaptiven Erregungsdecodiereinheit 23 ausgegebene
adaptive Erregungssignal bzw. das von der festen Erregungsdecodiereinheit 24 ausgegebene
feste Erregungssignal mit jedem Element des Verstärkungsvektors.
Jedes jeweilige Paar der Multiplikationsergebnisse der Multiplikationsvorrichtungen 26 und 27 werden
durch den Addierer 28 zusammenaddiert.
-
Das
Synthesefilter 29 führt
eine Synthesefilterverarbeitung bei dem als das Additionsergebnis des
Addierers 28 erhaltenen Erregungssignal durch, um eine
Ausgangssprache zu erzeugen. Es ist festzustellen, dass das Synthesefilter 29 die
durch die Linearvorhersagekoeffizienten-Decodiereinheit 22 decodierten
quantisierten Werte der Linearvorhersagekoeffizienten als seine
Filterkoeffizienten verwendet.
-
Zuletzt
aktualisiert die adaptive Erregungsdecodiereinheit 23 ihr
eingebautes adaptives Erregungscodebuch durch Verwendung des vorgenannten
Erregungssignals.
-
Als
Nächstes
erfolgt eine Beschreibung von herkömmlichen Techniken zum Verbessern
der vorbeschriebenen Sprachcodier- und Sprachdecodiervorrichtungen
vom CELP-Typ.
-
Die
folgenden zwei Druckschriften schlagen Verfahren zum Betonen der
Tonstärkeneigenschaft eines
Erregungssignals für
den Zweck des Erhaltens einer Sprache hoher Qualität vor, selbst
wenn eine niedrige Bitrate verwendet wird.
- Druckschrift
1: Wang et al., "Improved
excitation for phonetically-segmented VXC speech coding below 4kb/s", Proc. GLOBECOM '90, Seiten 946 – 950
- Druckschrift 2: JP-A- Nr. 8-44397 (1996) Weiterhin beschreibt
die folgende Druckschrift ein Sprachcodiersystem, das ein ähnliches
Verfahren anwendet.
- Druckschrift 3: 3GPP Technical Specification 3G TS 26. 090
-
Die
ITU-Empfehlung G. 729 beschreibt auch ein Sprachcodiersystem, das
ein anderes ähnliches Verfahren
an wendet. Ein weiterer bekannter Sprachcodierer vom CELP-Typ ist
offenbart in EP-A-0 714 089.
-
17 ist
ein schematisches Diagramm, das die innere Ausbildung einer festen
Erregungscodiereinheit 4 zeigt, die die Tonstärkeeigenschaft
eines Erregungssignals betont. Da die Komponenten in der Figur,
die dieselben wie die in 14 sind
oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird
ihre Erläuterung
weggelassen. Es ist festzustellen, dass die Ausbildung des Codiersystems
dieselbe wie die in 13 gezeigt ist, mit der Ausnahme
der Ausbildung der festen Erregungscodiereinheit 4.
-
In 17 bezeichnet
die Bezugszahl 15 eine Periodizitätsvorgabeeinheit, um einem
festen Codevektor eine Tonstärkeneigenschaft
zu geben.
-
18 ist
ein schematisches Diagramm, das die innere Ausbildung einer festen
Erregungsdecodiereinheit 24 zeigt, die die Tonstärkeneigenschaft eines
Erregungssignals betont. Da die Komponente in der Figur, die dieselbe
wie die in 16 ist oder dieser entspricht,
durch eine gleiche Zahl bezeichnet ist, wird ihre Erläuterung
weggelassen. Es ist festzustellen, dass die Ausbildung des Decodiersystem dieselbe
wie die in 15 gezeigte ist, mit der Ausnahme
der Ausbildung der festen Erregungsdecodiereinheit 24.
-
In 18 bezeichnet
die Bezugszahl 32 eine Periodizitätsvorgabeeinheit, um einem
festen Codevektor eine Tonstärkeneigenschaft
zu geben.
-
Die
Arbeitsweise der Sprachcodier- und der Sprachdecodiervorrichtung
wird nachfolgend beschrieben.
-
Es
ist festzustellen, dass, da die Vorrichtungen dieselben sind wie
die vorbeschriebenen Sprachcodier- und Sprachdecodiervorrichtungen vom
CELP-Typ, mit der Ausnahme, dass die feste Erregungscodiereinheit 4 und
die feste Erregungsdecodiereinheit 24 die Periodizitätsvorgabeeinheit 15 bzw. die
Periodizitätsvorgabeeinheit 32 enthalten,
nur ihr Unterschied beschrieben wird. Die Periodizitätsvorgabeeinheit 15 betont
die Tonstärkenperiodizität eines
von dem festen Erregungscodebuch 11 ausgegebenen Zeitserienvektors
vor der Ausgabe des Zeitserienvektors.
-
Die
Periodizitätsvorgabeeinheit 32 betont
die Tonstärkenperiodizität eines
von dem festen Erregungscodebuch 31 ausgegebenen Zeitserienvektors vor
der Ausgabe des Zeitserienvektors.
-
Die
Periodizitätsvorgabeeinheiten 15 und 32 verwenden
beispielsweise ein Kammfilter, um die Tonstärkenperiodizität eines
Zeitserienvektors zu betonen.
-
Die
Verstärkung
(Periodizitätsbetonungskoeffizient)
des Kammfilters wird in Druckschrift 1 auf einen konstanten
Wert gesetzt, während
das in Druckschrift 2 angewendete Verfahren eine langzeitige
Vorhersageverstärkung
des Sprachsignals in jedem zu codierenden Rahmen als einen Periodizitätsbetonungskoeffizienten
verwendet. Das in Druckschrift 3 vorgeschlagene Verfahren
verwendet eine Verstärkung
entsprechend einem in jedem vergangenen Rahmen codierten adaptiven
Erregungssignal.
-
Die
herkömmlichen
Sprachcodier- und Sprachdecodiervorrichtungen sind wie vorstehend beschrieben
ausgebildet, so dass ihr Periodizitätsbetonungskoeffizient zum
Betonen der Tonstärkenperiodizität über alle
fes ten Codevektoren auf denselben Wert gesetzt ist. Daher werden,
wenn dieser Periodizitätsbetonungskoeffizient
auf einen ungeeigneten Wert gesetzt ist, alle festen Codevektoren
nachteilig beeinflusst, wodurch es unmöglich ist, eine ausreichende
Qualitätsverbesserung
durch Periodizitätsbetonung
zu erhalten, oder wodurch sogar eine Qualitätsverschlechterung bewirkt
werden kann.
-
Es
wird beispielsweise ein Fall betrachtet, bei dem, obgleich selbst
ein zu codierendes Signal eine starke Periodizität mit einer Periode T anzeigt, der
Periodizitätsbetonungskoeffizient
so gesetzt ist, dass die Impulsantwort des Kammfilters, um festen Codevektoren
Periodizität
zu geben, eine schwache Periodizität anzeigt. In einem derartigen
Fall wird die schwache Periodizitätsbetonung auf alle festen
Codevektoren angewendet, wodurch eine große Codierverzerrung erzeugt
und hierdurch eine Qualitätsverschlechterung
bewirkt wird, wenn das zu codierende Signal eine starke Periodizität anzeigt.
-
Andererseits
kann der Periodizitätsbetonungskoeffizient
so gesetzt werden, dass er festen Codevektoren eine starke Periodizität gibt,
wenn das zu codierende Signal eine schwache Periodizität anzeigt.
Auch in diesem Fall wird eine große Codeverzerrung erzeugt,
und hierdurch tritt eine Qualitätsverschlechterung
auf.
-
Bei
der Sprachcodierung ist die Vergrößerung der Rahmenmenge wirksam
für die
Erhöhung des
Informationsverdichtungsverhältnisses.
In einem derartigen Fall geschieht es, da der Rahmen lang ist, jedoch
leicht, dass ein zu analysierender Rahmen ungünstige Faktoren enthält, wie
eine Änderung
der Tonstärke,
was eine ordnungsgemäße Berechnung des
Periodizitätsbetonungskoeffizienten
mit der in Druckschrift 2 vorgeschlagenen Zusammensetzung beeinträchtigt.
Weiterhin wird die Korrelation zwischen der Verstärkung eines
vergangenen Rahmens und einem geeigneten Periodizitätsbetonungskoeffizienten
für einen
gegenwärtigen
Rahmen mit der in Druckschrift 3 vorgeschlagenen Zusammensetzung herabgesetzt.
Diese Ereignisse bewirken häufig, dass
der Periodizitätsbetonungskoeffizient
unzweckmäßig eingestellt
wird, wodurch die vorbeschriebenen Probleme verschlechtert werden.
Weiterhin ist die Verwendung mehrerer fester Erregungscodebücher, die
jeweils feste Codevektoren unterschiedlicher Natur speichern, auch
wirksam für
die Erhöhung des
Informationsverdichtungsverhältnisses
bei der Sprachcodierung. In diesem Fall ist der geeignete Periodizitätsbetonungskoeffizient
von einem festen Erregungscodebuch zu einem anderen unterschiedlich,
wodurch die Qualitätsverschlechterung
eintritt, die durch die Verwendung von nur einem einzelnen Periodizitätsbetonungskoeffizienten
bewirkt wird.
-
Beispielsweise
wird die Verwendung sowohl eines festen Erregungscodebuchs, das
rauschartige feste Codevektoren speichert, als auch eines anderen
festen Erregungscodebuchs, das nichtrauschartige (impulsartige)
feste Codevektoren, die jeweils eine kleine Anzahl von Pulsen in
ihren Rahmen speichern, speichert, betrachtet. In dem Fall von rauschartigen
festen Codevektoren wird, wenn ihnen konstant eine starke Periodizität gegeben
wird, die Sprachqualität
der Ausgangssprache mit Bezug auf Rauschcharakteristiken verbessert.
In dem Fall von nichtrauschartigen festen Codevektoren andererseits nimmt,
wenn ihnen konstant eine starke Periodizität gegeben wird, die Ausgangssprache
eine impulsartige Sprachqualität
an, wenn ei ne wirklich unperiodische, rauschartige Eingangssprache
angewendet wird, was zu einer subjektiven Qualitätsverschlechterung führt.
-
Weiterhin
wird die Verwendung eines festen Erregungscodebuchs betrachtet,
das feste Codevektoren speichert, deren Leistungsverteilung vorgespannt
ist, beispielsweise enthält
nur die erste Hälfte ihres
Rahmens Signale und die zweite Hälfte
enthält keine
Signale (d.h., enthält
nur ein Nullsignal). In einem derartigen Fall werden, wenn nicht
diesen festen Codevektoren eine starke Periodizität gegeben
wird, die Codiercharakteristiken der zweiten Hälfte ihres Rahmens beträchtlich
verschlechtert, wodurch die subjektive Qualität in dem Bereich herabgesetzt
wird, dessen verteilte Leistung klein ist.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Um
die vorgenannten Probleme zu lösen,
ist es eine Aufgabe der vorliegenden Erfindung, eine Sprachcodiervorrichtung,
ein Sprachcodierverfahren, eine Sprachdecodiervorrichtung und ein
Sprachdecodierverfahren vorzusehen, die in der Lage sind, eine Ausgangssprache
mit subjektiv hoher Qualität zu
erhalten.
-
Eine
Sprachcodiervorrichtung gemäß der vorliegenden
Erfindung weist auf: eine erste Periodizitätsvorgabevorrichtung zum Betonen,
wenn Codierverzerrung von festen Codevektoren ausgewertet werden,
der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten,
der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt ist;
und eine zweite Periodizitätsvorgabe vorrichtung zum
Betonen der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines vorbestimmten zweiten
Periodizitätsbetonungskoeffizienten.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung weist auf: einen ersten Periodizitätsvorgabeschritt zum Betonen,
wenn Codierverzerrung von festen Codevektoren ausgewertet werden,
der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten,
der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt
ist; und einen zweiten Periodizitätsvorgabeschritt zum Betonen
der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines vorbestimmten zweiten
Periodizitätsbetonungskoeffizienten.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung analysiert eine Eingangssprache, um einen ersten Periodizitätsbetonungskoeffizienten
zu bestimmen.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen ersten Periodizitätsbetonungskoeffizienten aus
dem Sprachcode.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Zustand einer Sprache und bestimmt einen
ersten Periodizitätsbetonungskoeffizienten
auf der Grundlage des Zustandsbestimmungsergebnisses.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen einen Reibelaut enthaltenden Abschnitt
in einer Sprache und verringert einen Betonungsgrad eines ersten
Periodizitätsbetonungskoeffizienten
in dem den Reibelaut enthaltenden Abschnitt.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Abschnitt mit stetiger Stimme in einer
Sprache und erhöht
einen Betonungsgrad in einem ersten Periodizitätsbetonungskoeffizienten in
dem Abschnitt mit stetiger Stimme.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt
oder einen zweiten Periodizitätsvorgabeschritt
bei einem festen Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken
von in dem festen Erregungscodebuch gespeicherten festen Codevektoren.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt
oder einen zweiten Periodizitätsvorgabeschritt
bei einem festen Erregungscodebuch an auf der Grundlage der Leistungsverteilung von
festen Codevektoren in Bezug auf in dem festen Erregungscodebuch
gespeicherter Zeit.
-
Eine
Sprachdecodiervorrichtung gemäß der vorliegenden
Erfindung weist auf: eine erste Periodizitätsvorgabevorrichtung zum Betonen,
wenn ein fester Codevektor entsprechend einem festen Erregungscode
herausgezogen wird, der Periodizität eines von zumindest einem
festen Erregungscodebuch ausgegebenen, festen Codevektors durch
Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der
adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt wurde;
und eine zweite Periodizitätsvorgabevorrichtung
zum Betonen der Periodizität eines
von zumindest einem festen Erregungscodebuch ausgegebenen, festen
Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung weist auf: einen ersten Periodizitätsvorgabeschritt zum Betonen,
wenn ein fester Codevektor entsprechend einem festen Erregungscode
herausgezogen ist, der Periodizität eines festen Codevektors,
der von zumindest einem festen Erregungscodebuch ausgegeben ist,
durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der adaptiv
auf der Grundlage einer vorbestimmten Regel bestimmt ist; und einen
zweiten Periodizitätsvorgabeschritt
zum Betonen der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen,
festen Codevektors durch Verwendung eines vorbestimmten zweiten
Periodizitätsbetonungskoeffizienten.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung decodiert einen ersten Periodizitätsbetonungskoeffizienten aus
einem in dem Sprachcode enthaltenen Code eines Periodizitätsbetonungskoeffizienten.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen ersten Periodizitätsbetonungskoeffizienten anhand
des Sprachcodes.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Zustand einer Sprache und bestimmt einen
ersten Periodizitätsbetonungskoeffizienten
auf der Grundlage des Zustandsbestimmungsergebnisses.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Abschnitt mit einem Reibelaut in einer
Sprache und setzt einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten
in dem Abschnitt mit Reibelaut herab.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Abschnitt mit stetiger Stimme in einer
Sprache und erhöht
einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in
dem Abschnitt mit stetiger Stimme.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt
oder einen zweiten Periodizitätsvorgabeschritt
bei einem festen Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken
von in dem festen Erregungscodebuch gespeicherten festen Codevektoren.
-
Ein
Sprachdecodierverfahren nach der vorliegenden Erfindung wendet entweder
einen ersten Periodizitätsvorgabeschritt
oder einen zweiten Periodizitätsvorgabeschritt
auf ein festes Erregungscodebuch an auf der Grundlage der Leistungsverteilung von
festen Codevektoren in Bezug auf in dem festen Erregungscodebuch
gespeicherte Zeit.
-
KURZBESCHREIBUNG
DER ZEICHNUNGEN
-
1 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachcodiervorrichtung
gemäß einem
ersten Ausführungsbeispiel
der vorliegenden Erfindung zeigt;
-
2 ist
ein schematisches Diagramm, das die in nere Ausbildung einer festen
Erregungscodiereinheit zeigt;
-
3 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung
gemäß dem ersten
Ausführungsbeispiel
der vorliegenden Erfindung zeigt;
-
4 ist
ein schematisches Diagramm, das die innere Ausbildung einer festen
Erregungsdecodiereinheit zeigt;
-
5 ist
ein schematisches Diagramm, das die Periodizitätsbetonung für feste
Codevektoren illustriert;
-
6 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachcodiervorrichtung
gemäß einem
zweiten Ausführungsbeispiel
der vorliegenden Erfindung zeigt;
-
7 ist
ein schematisches Diagramm, das die innere Ausbildung einer festen
Erregungscodiereinheit zeigt;
-
8 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung.
gemäß dem zweiten
Ausführungsbeispiel
der vorliegenden Erfindung zeigt;
-
9 ist
ein schematisches Diagramm, das die innere Ausbildung einer feste
Erregungsdecodiereinheit zeigt;
-
10 ist
ein schematisches Diagramm, das die innere Ausbildung einer festen
Erregungsco diereinheit zeigt;
-
11 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung
gemäß einem
dritten Ausführungsbeispiel
der vorliegenden Erfindung zeigt;
-
12 ist
ein schematisches Diagramm, das die innere Ausbildung einer festen
Erregungsdecodiereinheit zeigt;
-
13 ist
ein schematisches Diagramm, das die Ausbildung einer herkömmlichen
Sprachcodiervorrichtung vom CELP-Typ zeigt;
-
14 ist
ein schematisches Diagramm, das die innere Ausbildung einer festen
Erregungscodiereinheit zeigt;
-
15 ist
ein schematisches Diagramm, das die Ausbildung einer herkömmlichen
Sprachdecodiervorrichtung vom CELP-Typ zeigt;
-
16 ist
ein schematisches Diagramm, das die innere Ausbildung einer feste
Erregungsdecodiereinheit zeigt;
-
17 ist
ein schematisches Diagramm, das die innere Ausbildung einer festen
Erregungscodiereinheit zeigt, die eine Periodizitätsvorgabeeinheit enthält;
-
18 ist
ein schematisches Diagramm, das die innere Ausbildung einer festen
Erregungsdecodiereinheit zeigt, die eine Periodizitätsvorgabeeinheit
enthält;
und
-
19 ist
ein schematisches Diagramm, das die Periodizitätsbetonung für feste
Codevektoren illustriert.
-
DETAILLIERTE
BESCHREIBUNG DER BEVORZUGTEN AUSFÜRHUNGSBEISPIELE
-
Bevorzugte
Ausführungsbeispiele
der vorliegenden Erfindung werden nachfolgend beschrieben.
-
(Erstes Ausführungsbeispiel)
-
1 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachcodiervorrichtung
gemäß einem
ersten Ausführungsbeispiel
der vorliegenden Erfindung zeigt. In der Figur bezeichnet die Bezugszahl 41 eine
Linearvorhersage-Analyseeinheit zum Analysieren einer Eingangssprache
und zum Herausziehen von Linearvorhersagekoeffizienten, die Spektralumhüllungsinformationen
der Eingangssprache bezeichnen, während die Bezugszahl 42 eine
Linearvorhersagekoeffizienten-Codiereinheit zum
Codieren der durch die Linearvorhersage-Analyseeinheit 41 herausgezogenen
Linearvorhersagekoeffizienten und zum Ausgeben des resultierenden Codes
zu einer Multiplexeinheit 46 sowie zum Ausgeben quantisierter
Werte der Linearvorhersagekoeffizienten zu einer adaptiven Erregungscodiereinheit 43,
einer festen Erregungscodiereinheit 44 und einer Verstärkungscodiereinheit 45 bezeichnet.
-
Es
ist festzustellen, dass die Linearvorhersagekoeffizienten-Analyseeinheit 41 und
die Linearvorhersagekoeffizienten-Codiereinheit 42 zusammen eine
Spektralumhüllungsinformations-Codiereinheit bilden.
-
Die
Bezugszahl 43 bezeichnet die adaptive Erregungscodiereinheit
zum: Erzeugen einer versuchsweisen zusammengesetzten Sprache durch Verwendung
der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten; Auswählen eines
adaptiven Erregungscodes, mit dem der Abstand zwischen der versuchsweisen
zusammengesetzten Sprache und der Eingangssprache minimiert wird,
Ausgeben des so ausgewählten
adaptiven Erregungscodes zu der Multiplexeinheit 46; und Ausgeben
eines adaptiven Erregungssignals (ein Zeitserienvektor, der als
ein Ergebnis der Wiederholung eines vergangenen Erregungssignal
mit einer gegebenen Länge
erhalten wurde) entsprechend dem adaptiven Erregungscode zu der
Verstärkungscodiereinheit 45.
Die Bezugszahl 44 bezeichnet die feste Erregungscodiereinheit
zum: Analysieren der Eingangssprache, um einen Periodizitätsbetonungskoeffizienten
zu erhalten; Codieren des Periodizitätsbetonungskoeffizienten und
Ausgeben des resultierenden Codes zu der Multiplexeinheit 46;
Erzeugen einer versuchsweisen zusammengesetzten Sprache durch Verwendung
sowohl des quantisierten Wertes des Periodizitätsbetonungskoeffizienten und
der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten; Auswählen eines
festen Erregungscodes, mit dem der Abstand zwischen der versuchsweisen
zusammengesetzten Sprache und einem zu codierenden Signal (ein Signal,
das als ein Ergebnis der Subtraktion der auf der Grundlage des adaptiven
Erregungssignals erzeugten zusammengesetzten Sprache von der Eingangssprache
erhalten wurde) minimiert wird, und Ausgeben des so ausgewählten festen
Erregungscodes zu der Multiplexeinheit 46; und Ausgeben
eines festen Erregungssignals, das ein Zeitserienvektor entsprechend
dem festen Erregungscode ist, zu der Verstär kungscodiereinheit 45.
-
Die
Bezugszahl 45 bezeichnet die Verstärkungscodiereinheit zum: Multiplizieren
sowohl des von der adaptiven Erregungscodiereinheit 43 ausgegebenen
adaptiven Erregungssignals als auch des von der festen Erregungscodiereinheit 44 ausgegebenen
festen Erregungssignals mit jedem Element eines Verstärkungsvektors;
Addieren jedes jeweiligen Paares der Multiplikationsergebnisse zusammen,
um ein Erregungssignal zu erzeugen; Erzeugen einer versuchsweisen
zusammengesetzten Sprache aus dem erzeugten Erregungssignal durch
Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten; und Auswählen eines Verstärkungscodes,
mit dem der Abstand zwischen der versuchsweisen zusammengesetzten
Sprache und der Eingangssprache minimiert wird, und Ausgeben des
ausgewählten
Verstärkungscodes
zu der Multiplexeinheit 46.
-
Es
ist festzustellen, dass die adaptive Erregungscodiereinheit 43,
die feste Erregungscodiereinheit 44 und die Verstärkungscodiereinheit 45 zusammen
eine Erregungsinformations-Codiereinheit bilden.
-
Die
Bezugszahl 46 bezeichnet die Multiplexeinheit zur Multiplexverarbeitung
des Codes der von der Linearvorhersagekoeffizienten-Codiereinheit 42 codierten
Linearvorhersagekoeffizienten, des von der adaptiven Erregungscodiereinheit 43 ausgegebenen
adaptiven Erregungscodes, des Codes des Periodizitätsbetonungskoeffizienten
und des von der festen Erregungscodiereinheit 44 ausgegebenen
festen Erregungscodes, und des von der Verstärkungscodiereinheit 45 ausgegebenen
Verstärkungscodes, um
den Sprachcode zu erzeugen.
-
2 ist
ein schematisches Diagramm, das die interne Ausbildung der festen
Erregungscodiereinheit 44 zeigt. In der Figur bezeichnet
die Bezugszahl 51 eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit
zum Analysieren der Eingangsprache für die Bestimmung eines Periodizitätsbetonungskoeffizienten
(eines ersten Periodizitätsbetonungskoeffizienten); 52 eine
Periodizitätsbetonungskoeffizienten-Codiereinheit
zum Codieren des von der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 51 bestimmten
Periodizitätsbetonungskoeffizienten
und zum Ausgeben eines quantisierten Wertes des Periodizitätsbetonungskoeffizienten
zu einer ersten Periodizitätsvorgabeeinheit 54; 53 ein erstes
festes Erregungscodebuch zum Speichern mehrerer nichtrauschartigen
(impulsartigen) Zeitserienvektoren (feste Codevektoren); 54 die
erste Periodizitätsvorgabeeinheit
zum Betonen der Periodizität jedes
Zeitserienvektors durch Verwendung des von der Periodizitätsbetonungskoeffizienten-Codiereinheit 52 ausgegebenen
quantisierten Wertes des Periodizitätsbetonungskoeffizienten; 55 ein
erstes Synthesefilter zum Erzeugen einer versuchsweisen zusammengesetzten
Sprache für
jeden Zeitserienvektor durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten; und 56 eine
erste Verzerrungsberechnungseinheit zum Berechnen des Abstands zwischen
der versuchsweisen zusammengesetzten Sprache und des von der adaptiven
Erregungscodiereinheit 43 ausgegebenen, zu codierten Signals.
-
Die
Bezugszahl 57 bezeichnet ein zweites festes Erregungscodebuch
zum Speichern mehrerer rauschartiger Zeitserienvektoren (feste Codevektoren); 58 eine zweite
Periodizitätsvorgabeeinheit
zum Betonen der Periodizität
jedes Zeitserienvektors durch Verwendung eines vorbestimmten festen
Periodizitätsbetonungskoeffizienten
(eines zweiten Periodizitätsbetonungskoeffizienten); 59 ein
zweites Synthesefilter zum Erzeugen einer versuchsweisen zusammengesetzten
Sprache für
jeden Zeitserienvektor durch Verwendung der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten; 60 eine
zweite Verzerrungsberechnungseinheit zum Berechnen des Abstands
zwischen der versuchsweisen zusammengesetzten Sprache und dem von
der adaptiven Erregungscodiereinheit 43 ausgegebenen, zu
codierenden Signal; und 61 eine Verzerrungsauswertungseinheit
zum Vergleichen und Auswerten des Berechnungsergebnisses der ersten
Verzerrungsberechnungseinheit 56 und des Berechnungsergebnisses
der zweiten Verzerrungsberechnungseinheit 60, um einen
festen Erregungscode auszuwählen.
-
3 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung
gemäß dem ersten
Ausführungsbeispiel
der vorliegenden Erfindung zeigt. In der Figur bezeichnet die Bezugszahl 71 eine
Trenneinheit zum Trennen des von der Sprachcodiervorrichtung ausgegebenen
Sprachcodes in dem Code der Linearvorhersagekoeffizienten, den adaptiven
Erregungscode, den Code des Periodizitätsbetonungskoeffizienten und
den festen Erregungscode, sowie den Verstärkungscode, die dann zu einer
Linearvorhersagekoeffizienten-Decodiereinheit 72, einer
adaptiven Erregungsdecodiereinheit 73, einer festen Erregungsdecodiereinheit 74 bzw.
einer Verstärkungsdecodiereinheit 75 geliefert werden.
Die Bezugszahl 72 bezeichnet die Linearvorhersagekoeffizienten-Decodiereinheit
zum Decodieren des von der Trenneinheit 71 ausgegebenen Co des
der Linearvorhersagekoeffizienten und zum Ausgeben der decodierten
quantisierten Werte der Linearvorhersagekoeffizienten zu einem Synthesefilter 79.
-
Die
Bezugszahl 73 bezeichnet die adaptive Erregungsdecodiereinheit
zum Ausgeben eines adaptiven Erregungssignals (ein Zeitserienvektor,
der als ein Ergebnis des Wiederholens eines vergangenen Erregungssignals
erhalten wurde) entsprechend dem von der Trenneinheit 71 ausgegebenen
adaptiven Erregungscode, während
die Bezugszahl 74 die feste Erregungsdecodiereinheit zum
Ausgeben eines festen Erregungssignals (ein Zeitserienvektor) entsprechend
sowohl dem Code des Periodizitätsbetonungskoeffizienten
und dem von der Trenneinheit 71 ausgegebenen festen Erregungscode
bezeichnet. Die Bezugszahl 75 bezeichnet die Verstärkungsdecodiereinheit
zum Ausgeben eines Verstärkungsvektors
entsprechend dem von der Trenneinheit 71 ausgegebenen Verstärkungscode.
-
Die
Bezugszahl 76 bezeichnet eine Multiplikationsvorrichtung
zum Multiplizieren des von der adaptiven Erregungsdecodiereinheit 73 ausgegebenen adaptiven
Erregungssignals mit einem Element des von der Verstärkungsdecodiereinheit 75 ausgegebenen
Verstärkungsvektors,
während
die Bezugszahl 77 eine andere Multiplikationsvorrichtung
zum Multiplizieren des von der festen Erregungsdecodiereinheit 74 ausgegebenen
festen Erregungssignals mit einem anderen Element des von der Verstärkungsdecodiereinheit 75 ausgegebenen
Verstärkungsvektors
bezeichnet. Die Bezugszahl 78 bezeichnet einen Addierer
zum Addieren des Multiplikationsergebnisses der Multiplikationsvorrichtung 76 und
des Multiplikationsergebnisses der Multiplikationsvorrichtung 77,
um ein Erregungssignal zu erzeugen. Die Bezugszahl 79 bezeichnet
das Synthesefilter zum Durchführen
einer Synthesefilterverarbeitung bei dem von dem Addierer 78 erzeugten
Erregungssignal, um eine Ausgangssprache zu erzeugen.
-
4 ist
ein schematisches Diagramm, das die innere Ausbildung der festen
Erregungsdecodiereinheit 74 zeigt. In der Figur bezeichnet
die Bezugszahl 81 eine Periodizitätsbetonungskoeffizienten-Decodiereinheit
zum Decodieren des von der Trenneinheit 71 ausgegebenen
Codes des Periodizitätsbetonungskoeffizienten
und zum Ausgeben des decodierten quantisierten Wertes des Periodizitätsbetonungskoeffizienten
(des ersten Periodizitätsbetonungskoeffizienten)
zu einer ersten Periodizitätsvorgabeeinheit 83; 82 ein
erstes festes Erregungscodebuch zum Speichern mehrerer nicht-rauschartiger (impulsartiger)
Zeitserienvektoren (feste Codevektoren); 83 die erste Periodizitätsvorgabeeinheit
zum Betonen jedes Zeitserienvektors durch Verwendung des von der Periodizitätsbetonungskoeffizienten-Decodiereinheit 81 ausgegebenen
Periodizitätsbetonungskoeffizienten; 84 ein
zweites festes Erregungscodebuch zum Speichern mehrerer rauschartiger
Zeitserienvektoren (feste Codevektoren); 85 eine zweite
Periodizitätsvorgabeeinheit
zum Betonen der Periodizität
jedes Zeitserienvektors durch Verwendung des vorbestimmten festen
Periodizitätsbetonungskoeffizienten (des
zweiten Periodizitätsbetonungskoeffizienten).
-
Die
Arbeitsweise der Sprachcodier- und der Sprachdecodiervorrichtung
wird nachfolgend beschrieben.
-
Die
Sprachcodiervorrichtung führt
eine Verarbeitung in Einheiten von Rahmen durch, die jeweils eine
Zeitdauer von angenähert
5 bis 50 ms haben.
-
Zuerst
erfolgt die Beschreibung des Codierens von Spektralumhüllungsinformationen.
-
Bei
Empfang einer Sprache analysiert die Linearvorhersage-Analyseeinheit 41 die
Eingangssprache und zieht Linearvorhersagekoeffizienten heraus,
die Spektralumhüllungsinformationen über die
Sprache sind.
-
Nachdem
die Linearvorhersageanalyseeinheit 41 die Linearvorhersagekoeffizienten
herausgezogen hat, codiert die Linearvorhersagekoeffizienten-Codiereinheit 42 die
Linearvorhersagekoeffizienten und gibt den Code zu der Multiplexeinheit 46 aus.
-
Die
Linearvorhersagekoeffizienten-Codiereinheit 42 gibt auch
quantisierte Werte der Linearvorhersagekoeffizienten zu der adaptiven
Erregungscodiereinheit 43, der festen Erregungscodiereinheit 44 und
der Verstärkungscodiereinheit 45 aus.
-
Als
Nächstes
erfolgt die Beschreibung des Codierens von Erregungsinformationen.
-
Die
adaptive Erregungscodiereinheit 43 hat ein eingebautes
adaptives Erregungscodebuch, das vergangene Erregungssignale mit
einer vorbestimmten Länge
speichert, und sie erzeugt einen Zeitserienvektor, der als ein Ergebnis
des periodischen Wiederholens eines vergangenen Erregungssignals
erhalten ist, auf der Grundlage jedes intern erzeugten adaptiven
Erregungscodes (angezeigt durch eine Binärzahl mit wenigen Bits).
-
Die
adaptive Erregungscodiereinheit 43 multipliziert dann jeden
Zeitserienvektor mit jedem angemessenen Verstärkungswert und erzeugt eine
versuchsweise zusammengesetzte Sprache durch Hindurchführen des
Zeitserienvektors durch das Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten verwendet.
-
Weiterhin
wertet die adaptive Erregungscodiereinheit 43 beispielsweise
den Abstand zwischen der versuchsweisen zusammengesetzten Sprache und
der Eingangssprache aus, um die Codierverzerrung zu erhalten, und
wählt den
adaptiven Erregungscode, mit dem der Abstand minimiert wird, aus und
gibt ihn zu der Multiplexeinheit 46 aus. Die adaptive Erregungscodiereinheit 43 gibt
auch einen Zeitserienvektor entsprechend dem ausgewählten adaptiven
Erregungscode als ein adaptives Erregungssignal zu der Verstärkungscodiereinheit 45 aus
und gibt sowohl eine Tonstärkenperiode
entsprechend dem ausgewählten
adaptiven Erregungscode als auch ein (zu codierendes) Signal, das
als ein Ergebnis der Subtraktion einer auf der Grundlage des adaptiven Erregungssignals
erzeugten, zusammengesetzten Sprache von der Eingangssprache erhalten
wurde, zu der festen Erregungscodiereinheit 44 aus.
-
Als
Nächstes
wird die Arbeitsweise der festen Erregungscodiereinheit 44 beschrieben.
-
Die
Periodizitätsbetonungskoeffizienten-Berechnungseinheit 51 analysiert
die Eingangssprache, um einen Periodizitätsbetonungskoeffizienten zu
bestimmen.
-
Beispielsweise
wird der Periodizitätsbetonungskoeffizient
auf der Grundlage einer langzeitigen Vorhersageverstärkung der
Eingangsprache wie folgt bestimmt.
-
Wenn
bestimmt wird, dass die Spektralcharakteristiken eine Stimme enthalten,
wird der Grad der Betonung erhöht.
Wenn bestimmt wird, dass sie keine Stimme enthalten, wird andererseits
der Grad der Betonung herabgesetzt. Wenn weiterhin die langzeitige
Vorhersageverstärkung
und die Tonstärkenperiode
eine kleine Änderung
in Bezug auf die Zeit zeigen, wird der Grad der Betonung erhöht. Wenn
sie eine große Änderung
in Bezug auf die Zeit zeigen, wird andererseits der Grad der Betonung
herabgesetzt.
-
Nachdem
die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 51 den
Periodizitätsbetonungskoeffizienten
bestimmt hat, codiert die Periodizitätsbetonungskoeffizienten-Codiereinheit 52 den Periodizitätsbetonungskoeffizienten
und gibt den Code zu der Multiplexeinheit 46 aus und gibt
einen quantisierten Wert des Periodizitätsbetonungskoeffizienten zu
der ersten Periodizitätsvorgabeeinheit 54 aus.
-
Das
erste feste Erregungscodebuch 53 speichert mehrere feste
Codevektoren, die nichtrauschartige (impulsartige) Zeitserienvektoren
sind, und gibt aufeinander folgend einen Zeitserienvektor entsprechend
jedem von der Verzerrungsauswertungseinheit 61 ausgegebenen
festen Erregungscode aus. Die erste Periodizitätsvorgabeeinheit 54 betont
die Periodizität
eines von dem ersten festen Erregungscodebuch 53 ausgegebenen
Zeitserienvektors durch Verwendung des quantisierten Wertes des
von der Periodizitätsbetonungskoeffizienten-Codiereinheit 52 ausgegebenen
Periodizitätsbetonungskoeffizienten. Die
erste Periodizitätsvorgabeeinheit 54 verwendet beispielsweise
ein Kammfilter, um die Periodizität jedes Zeitserienvektors zu
betonen.
-
Jeder
Zeitserienvektor wird dann mit einem zweckmäßi gen Verstärkungswert multipliziert und
in das erste Synthesefilter 55 eingegeben.
-
Das
erste Synthesefilter 55 verwendet die von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten, um eine versuchsweise
zusammengesetzte Sprache auf der Grundlage jedes mit der Verstärkung multiplizierten
Zeitserienvektors zu erzeugen.
-
Die
erste Verzerrungsberechnungseinheit 56 berechnet beispielsweise
den Abstand zwischen der versuchsweisen zusammengesetzten Sprache
und dem von der adaptiven Erregungscodiereinheit 43 als
die Codierverzerrung ausgegebenen, zu codierenden Signal und gibt
ihn zu der Verzerrungsauswertungseinheit 61 aus.
-
Andererseits
speichert das zweite feste Erregungscodebuch 57 mehrere
feste Codevektoren, die rauschartige Zeitserienvektoren sind, und
gibt aufeinander folgend einen Zeitserienvektor entsprechend jedem
von der Verzerrungsauswertungseinheit 61 ausgegebenen festen
Erregungscode aus. Die zweite Periodizitätsvorgabeeinheit 58 betont
die Periodizität
des von dem zweiten festen Erregungscodebuch 57 ausgegebenen
Zeitserienvektors vor der Ausgabe des Zeitserienvektors. Die zweite
Periodizitätsvorgabeeinheit 58 verwendet
beispielsweise ein Kammfilter, um die Periodizität jedes Zeitserienvektors zu
betonen.
-
Der
feste Periodizitätsbetonungskoeffizient, der
von der zweiten Periodizitätsvorgabeeinheit 58 verwendet
wird, wird vorbestimmt unter Verwendung beispielsweise eines Verfahren,
das eine Lerneingangssprache anwendet und codiert. Bei dem Verfahren
werden Rahmen herausgezogen, bei denen die Anwendung des von der ersten
Periodizitätsvorgabeeinheit 54 verwendeten
Periodizitätsbetonungskoeffizienten
nicht zweckmäßig ist,
und der von der zweiten Periodizitätsvorgabeeinheit 58 verwendete feste
Periodizitätsbetonungskoeffizient
wird so bestimmt, dass die durchschnittliche Codierqualität der herausgezogenen
Rahmen hoch ist.
-
Jeder
Zeitserienvektor mit betonter Periodizität wird dann mit einem angemessenen
Verstärkungswert
multipliziert und in das zweite Synthesefilter 59 eingegeben.
-
Das
zweite Synthesefilter 59 verwendet die quantisierten Werte
der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
Linearvorhersagekoeffizienten, um eine versuchsweise zusammengesetzte
Sprache auf der Grundlage jedes. mit der Verstärkung multiplizierten Zeitserienvektors zu
erzeugen.
-
Die
zweite Verzerrungsberechnungseinheit 60 berechnet die Abstand
zwischen der versuchsweisen zusammengesetzten Sprache und dem zu
codierten Signal, das von der adaptiven Erregungscodiereinheit 43 eingegeben
ist, und gibt den Abstand zu der Verzerrungsauswertungseinheit 61 aus.
-
Die
Verzerrungsauswertungseinheit 61 wählt den festen Erregungscode,
mit dem der Abstand zwischen der vorgenannten versuchsweisen zusammengesetzten
Sprache und dem zu codierenden Signal minimiert wird aus und gibt
ihn zu der Multiplexeinheit 46 aus. Weiterhin weist die
Verzerrungsauswertungseinheit 61 das erste Erregungscodebuch 53 oder
das zweite feste Erregungscodebuch 57 an, einen Zeitserienvektor
entsprechend dem ausgewählten
festen Erregungscode auszugeben. Die erste Periodizitätsvorgabeeinheit 54 oder
die zweite Periodizitätsvorgabeeinheit 58 betont
die Tonstärkeperiodizität des von
dem ersten festen Erregungscodebuch 53 bzw. dem zweiten
festen Erregungscodebuch 57 ausgegebenen Zeitserienvektors
und gibt ihn als ein festes Erregungssignal zu der Verstärkungscodiereinheit 45 aus.
Nachdem die feste Erregungscodiereinheit 44 wie vorbeschrieben
das feste Erregungssignal ausgegeben hat, liest die Verstärkungscodiereinheit 45,
die ein Verstärkungsvektoren
speicherndes eingebautes Verstärkungscodebuch
hat, aufeinander folgend einen Verstärkungsvektor aus dem Verstärkungscodebuch
gemäß jedem
intern erzeugten Verstärkungscode
(angezeigt durch eine Binärzahl
mit wenigen Bits).
-
Die
Verstärkungscodiereinheit 45 multipliziert
sowohl das von der adaptiven Erregungscodiereinheit 43 ausgegebene
adaptive Erregungssignal als auch das von der festen Erregungscodiereinheit 44 ausgegebene
feste Erregungssignal mit jedem Element des Verstärkungsvektors
und addiert jedes jeweilige Paar der Multiplikationsergebnisse miteinander,
um ein Erregungssignal zu erzeugen.
-
Die
Verstärkungscodiereinheit 45 erzeugt dann
eine versuchsweise zusammengesetzte Sprache durch Hindurchführen des
Erregungssignals durch ein Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten verwendet.
-
Weiterhin
wertet die Verstärkungscodiereinheit 45 beispielsweise
den Abstand zwischen der versuchsweise zusammengesetzten Sprache
und der Eingangssprache aus, um die Codierverzerrung zu erhalten,
wählt den
Verstärkungscode,
mit dem der Abstand minimiert wird, aus und gibt ihn zu der Multiplexeinheit 46 aus,
und gibt ein Erregungssignal entsprechend dem Verstärkungscode
zu der adaptiven Erregungscodiereinheit 43 aus. Dann verwendet die
adaptive Erregungscodiereinheit 43 das Erregungssignal,
das von der Verstärkungscodiereinheit 45 ausgewählt ist
und dem Verstärkungscode
entspricht, um ihr eingebautes adaptives Erregungscodebuch zu aktualisieren.
-
Die
Multiplexeinheit 46 führt
eine Multiplexverarbeitung mit dem Code der von der Linearvorhersagekoeffizienten-Codiereinheit 42 codierten
Linearvorhersagekoeffizienten, dem von der adaptiven Erregungscodiereinheit 43 ausgegebenen
adaptiven Erregungscode, dem Code des Periodizitätsbetonungskoeffizienten und
dem von der festen Erregungscodiereinheit 44 ausgegebenen
festen Erregungscode und dem von der Verstärkungscodiereinheit 45 ausgegebenen
Verstärkungscode
durch, um einen Sprachcode als das Multiplexergebnis zu erzeugen.
-
Bei
Empfang des von der Sprachcodiervorrichtung ausgegebenen Sprachcodes
trennt die in der Sprachdecodiervorrichtung enthaltene Trenneinheit 71 diesen
in den Code der Linearvorhersagekoeffizienten, den adaptiven Erregungscode,
den Code des Periodizitätsbetonungskoeffizienten
und den festen Erregungscode sowie den Verstärkungscode. Die Trenneinheit 71 gibt
den Code der Linearvorhersagekoeffizienten, den adaptiven Erregungscode
und den Verstärkungscode
zu der Linearvorhersagekoeffizienten-Decodiereinheit 72,
der adaptiven Erregungsdecodiereinheit 73 bzw. der Verstärkungsdecodiereinheit 75 aus,
und sie gibt den Code des Periodizitätsbetonungskoeffizienten und
dem festen Erregungscode zu der festen Erregungsdecodiereinheit 74 aus.
-
Bei
Empfang des Codes der Linearvorhersagekoeffizienten von der Trenneinheit 71 decodiert
die Linearvorhersagekoeffizienten-Decodiereinheit 72 den
Code und gibt die decodierten quantisierten Werte der Linearvorhersagekoeffizienten
zu dem Synthesefilter 79 aus.
-
Die
adaptive Erregungsdecodiereinheit 73 hat das eingebaut
adaptive Erregungscodebuch, das vergangene Erregungssignale mit
einer vorbestimmten Länge
speichert, und sie gibt das adaptive Erregungssignal (ein Zeitserienvektor,
der als ein Ergebnis des Wiederholens eines vergangenen Erregungssignals
erhalten wurde) entsprechend dem von der Trenneinheit 71 ausgegebenen
adaptiven Erregungscode aus.
-
Als
Nächstes
wird die Arbeitsweise der festen Erregungsdecodiereinheit 74 beschrieben.
-
Bei
Empfang des Codes des Periodizitätsbetonungskoeffizienten
von der Trenneinheit 71 decodiert die Periodizitätsbetonungskoeffizienten-Decodiereinheit 81 den
Code und gibt den decodierten quantisierten Wert. des Periodizitätsbetonungskoeffizienten
zu der Periodizitätsvorgabeeinheit 83 aus.
-
Das
erste feste Erregungscodebuch 82 speichert mehrere nichtrauschartige
(impulsartige) Zeitserienvektoren, während das zweite feste Erregungscodebuch 84 mehrere
rauschartige Zeitserienvektoren speichert. Das erste feste Erregungscodebuch 82 oder
das zweite Erregungscodebuch 84 gibt einen Zeitserienvektor
entsprechend dem von der Trenneinheit 71 ausgegebenen festen
Erregungscode aus.
-
Wenn
das erste feste Erregungscodebuch 82 den Zeitserienvektor
entsprechend dem festen Erregungscode aus gegeben hat, betont die
erste Periodizitätsvorgabeeinheit 83 die
Periodizität
des von dem ersten festen Erregungscodebuch 82 ausgegebenen
Zeitserienvektors durch Verwendung des von der Periodizitätsbetonungskoeffizienten-Decodiereinheit 81 ausgegebenen
quantisierten Wertes des Periodizitätsbetonungskoeffizienten und
gibt den Zeitserienvektor als ein festes Erregungssignal aus.
-
Wenn
das zweite feste Erregungscodebuch 84 den Zeitserienvektor
entsprechend dem festen Erregungscode ausgegeben hat, betont andererseits die
zweite Periodizitätsvorgabeeinheit 85 die
Periodizität
des von dem zweiten festen Erregungscodebuch 84 ausgegebenen
Zeitserienvektors durch Verwendung des vorbestimmten festen Periodizitätsbetonungskoeffizienten
und gibt den Zeitserienvektors als ein festes Erregungssignal aus.
-
Die
Verstärkungsdecodiereinheit 75 hat
ein Verstärkungsvektoren
speicherndes eingebautes Verstärkungscodebuch
und gibt einen Verstärkungsvektor
entsprechend dem von der Trenneinheit 71 ausgegebenen Verstärkungscode
aus.
-
Die
Multiplikationsvorrichtung 76 und 77 multiplizieren
das von der adaptiven Erregungsdecodiereinheit 73 ausgegebene
adaptive Erregungssignal bzw. das von der festen Erregungsdecodiereinheit 74 ausgegebene
feste Erregungssignal mit jedem Element des Verstärkungsvektors.
Jedes jeweilige Paar der Multiplikationsergebnisse der Multiplikationsvorrichtungen 76 und 77 werden
durch den Addierer 78 miteinander addiert.
-
Das
Synthesefilter 79 führt
eine Synthesefilterverarbeitung bei dem als das Additionsergebnis des
Addie rers 78 erhaltenen Erregungssignal durch, um eine
Ausgangssprache zu erzeugen. Es ist festzustellen, dass das Synthesefilter 79 die
von der Linearvorhersagekoeffizienten-Decodiereinheit 72 decodierten
quantisierten Werte der Linearvorhersagekoeffizienten als seine
Filterkoeffizienten verwendet.
-
Zuletzt
aktualisiert die adaptive Erregungsdecodiereinheit 73 sein
eingebautes adaptives Erregungscodebuch durch Verwendung des vorgenannten
Erregungssignals.
-
Wie
aus der vorstehenden Beschreibung ersichtlich ist, weist das erste
Ausführungsbeispiel
auf: die erste Periodizitätsvorgabeeinheit
zum Betonen, wenn Codierverzerrungen von festen Codevektoren ausgewertet
werden, der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten,
der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt
ist; und die zweite Periodizitätsvorgabeeinheit
zum Betonen der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines vorbestimmten zweiten
Periodizitätsbetonungskoeffizienten.
Daher ist es möglich,
wie in 5 gezeigt ist, wenn einer von dem ersten Periodizitätsbetonungskoeffizienten
und dem zweiten Periodizitätsbetonungskoeffizienten
auf einen unzweckmäßigen Wert
gesetzt wurde, den nachteiligen Einfluss durch die unzweckmäßige Periodizitätsbetonung
auf einen Teil der festen Codevektoren zu begrenzen, wodurch eine
Ausgangssprache mit subjektiv hoher Qualität erhalten wird.
-
Weiterhin
ist das erste Ausführungsbeispiel so
ausge bildet, dass ein erster Periodizitätsbetonungskoeffizient auf
der Grundlage eines Parameters, der durch Analysieren einer Eingangssprache erhältlich ist,
bestimmt wird. Daher ist es möglich,
einen Periodizitätsbetonungskoeffizienten
auf der Grundlage einer feinen Regel, die eine große Anzahl von
aus der Eingangssprache herausziehbaren Parametern verwendet, zu
bestimmen. Mit dieser Anordnung ist es möglich, die Frequenz der Bestimmung
eines unzweckmäßigen Periodizitätsbetonungskoeffizienten
herabzusetzen, wodurch eine Ausgangssprache von subjektiv hoher
Qualität
erhalten wird.
-
Weiterhin
wendet das erste Ausführungsbeispiel
entweder einen ersten Periodizitätsvorgabeschritt
oder einen zweiten Periodizitätsvorgabeschritt bei
einem festen Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken
von in dem festen Erregungscodebuch gespeicherten festen Codevektoren.
Daher ist es möglich,
einem rauschartigen festen Codevektor konstant eine starke Periodizität zu geben,
wodurch die Sprachqualität
der Ausgangssprache mit Bezug auf Rauschcharakteristiken verbessert
wird. Es ist auch möglich,
eine konstante Anwendung von starker Periodizität auf einen nichtrauschartigen
Vektor zu verhindern, um zu verhindern, dass die Ausgangssprache
eine impulsartige Sprachqualität
annimmt, wodurch eine codierte Sprache von subjektiv hoher Qualität erhalten
wird.
-
(Zweites Ausführungsbeispiel)
-
6 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachcodiervorrichtung
gemäß einem
zweiten Ausführungsbeispiel
der vorliegenden Erfindung zeigt. Da die Komponenten in der Figur,
die die selben wie in 1 sind oder diesen entsprechen,
durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung
weggelassen.
-
Die
Bezugszahl 47 bezeichnet eine feste Erregungscodiereinheit
zum: Bestimmen eines Periodizitätsbetonungskoeffizienten
anhand der Verstärkung
eines adaptiven Erregungssignals; Erzeugen einer versuchsweisen
zusammengesetzten Sprache durch Verwendung sowohl des Periodizitätsbetonungskoeffizienten
als auch der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte von Linearvorhersagekoeffizienten; Auswählen eines
festen Erregungscodes, mit dem der Abstand zwischen der versuchsweisen zusammengesetzten
Sprache und einem zu codierenden Signal (ein als ein Ergebnis der
Subtraktion einer auf der Grundlage des adaptiven Erregungssignals
erzeugten zusammengesetzten Sprache von der Eingangssprache erhaltenes
Signal) minimiert wird, und Ausgebendes ausgewählten festen Erregungscodes
zu der Multiplexeinheit 49; und Ausgeben eines festen Erregungssignals,
das ein Zeitserienvektor entsprechend dem festen Erregungscode ist,
zu der Verstärkungscodiereinheit 48.
-
Die
Bezugszahl 48 bezeichnet eine Verstärkungscodiereinheit zum: Multiplizieren
sowohl des von der adaptiven Erregungscodiereinheit 43 ausgegebenen
adaptiven Erregungssignals als auch des von der festen Erregungscodiereinheit 47 ausgegebenen
festen Erregungssignals mit jedem Element eines Verstärkungsvektors;
Addieren jedes jeweiligen Paares der Multiplikationsergebnisse miteinander,
um ein Erregungssignal zu erzeugen; Erzeugen einer versuchsweisen
zusammengesetzten Sprache aus dem erzeugten Erregungssignal durch
Verwendung der von der Linearvorhersagekoeffi zienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten; und Auswählen des Verstärkungscodes,
mit dem der Abstand zwischen der versuchsweisen zusammengesetzten
Sprache und der Eingangssprache minimiert wird, und Ausgeben des
ausgewählten
Verstärkungscodes
zu der Multiplexeinheit 49.
-
7 ist
ein schematisches Diagramm, das die innere Ausbildung der festen
Erregungscodiereinheit 47 zeigt. Da die Komponenten in
der Figur, die dieselben wie die in 2 gezeigten
sind oder diesen entsprechen, durch gleiche Zahlen bezeichnet sind,
wird ihre Erläuterung
weggelassen.
-
Die
Bezugszahl 62 bezeichnet eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit zum
Bestimmen eines Periodizitätsbetonungskoeffizienten
aus der Verstärkung
eines adaptiven Erregungssignals.
-
8 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung
gemäß dem zweiten
Ausführungsbeispiel
der vorliegenden Erfindung zeigt. Da die Komponenten in der Figur,
die dieselben wie die in 3 sind oder diesen entsprechen,
durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung
weggelassen.
-
Die
Bezugszahl 80 bezeichnet eine feste Erregungsdecodiereinheit
zum Bestimmen eines Periodizitätsbetonungskoeffizienten
aus der Verstärkung eines
adaptiven Erregungssignals und zum Ausgeben eines festen Erregungssignals,
das ein Zeitserienvektor entsprechend dem Periodizitätsbetonungskoeffizienten
und dem von der Trenneinheit 71 ausgegebenen festen Erregungscode
ist.
-
9 ist
ein schematisches Diagramm, das die innere Ausbildung der festen
Erregungsdecodiereinheit 80 zeigt. Da die Komponenten in
der Figur, die dieselben wie die in 4 sind oder
diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre Erläuterung
weggelassen.
-
Die
Bezugszahl 86 bezeichnet eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit zum
Bestimmen eines Periodizitätsbetonungskoeffizienten
aus der Verstärkung
eines adaptiven Erregungssignals.
-
Die
Arbeitsweise der Sprachcodier- und der Sprachdecodiervorrichtung
wird nachfolgend beschrieben.
-
Es
ist festzustellen, dass, da das zweite Ausführungsbeispiel dasselbe wie
das erste Ausführungsbeispiel
ist, mit Ausnahme der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 62 in
der festen Erregungscodiereinheit 47, der Verstärkungscodiereinheit 48 und
der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 86 in
der festen Erregungsdecodiereinheit 80, nur ihr Unterschied
beschrieben wird.
-
Die
Periodizitätsbetonungskoeffizienten-Berechnungseinheit 62 verwendet
die Verstärkung
für ein
von der Verstärkungscodiereinheit 48 ausgegebenes
adaptives Erregungssignal, um einen Periodizitätsbetonungskoeffizienten (beispielsweise
die Verstärkung
für das
adaptive Erregungssignal in einem vorhergehenden Rahmen) zu bestimmen,
und sie gibt den so bestimmten Periodizitätsbetonungskoeffizienten zu
der ersten Periodizitätsvorgabeeinheit 54 aus.
-
Die
Verstärkungscodiereinheit 48,
die ein eingebau tes, Verstärkungsvektoren
speicherndes Codebuch hat, liest aufeinander folgend einen Verstärkungsvektor
aus dem Verstärkungscodebuch
gemäß jedem
intern erzeugten Verstärkungscode
(angezeigt durch eine Binärzahl
mit wenigen Bits).
-
Die
Verstärkungscodiereinheit 48 multipliziert
sowohl das von der adaptiven Erregungscodiereinheit 43 ausgegebene
adaptive Erregungssignal als auch das von der festen Erregungscodiereinheit 47 ausgegebene
feste Erregungssignal mit jedem Element des Verstärkungsvektors
und addiert jedes jeweilige Paar der Multiplikationsergebnisse miteinander,
um ein Erregungssignal zu erzeugen.
-
Die
Verstärkungscodiereinheit 48 erzeugt dann
eine versuchsweise zusammengesetzte Sprache durch Hindurchführen des
Erregungssignals durch ein Synthesefilter, das die von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten verwendet.
-
Weiterhin
wertet die Verstärkungscodiereinheit 48 beispielsweise
den Abstand zwischen der versuchsweise zusammengesetzten Sprache
und der Eingangssprache aus, um die Codierverzerrung zu erhalten,
wählt den
Verstärkungscode,
mit dem der Abstand minimiert wird, aus und gibt ihn zu der Multiplexeinheit 49 aus.
Die Verstärkungscodiereinheit 48 gibt
auch ein Erregungssignal entsprechend dem Verstärkungscode zu der adaptiven
Erregungscodiereinheit 43 aus, und sie gibt die Verstärkung des adaptiven
Erregungssignals entsprechend dem Verstärkungscode zu der festen Erregungscodiereinheit 47 aus.
-
Die
Periodizitätsbetonungskoeffizienten- Berechnungseinheit 86 bestimmt
einen Periodizitätsbetonungskoeffizienten,
so wie es die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 62 in
der festen Erregungscodiereinheit 47 tut, anhand der von der
Verstärkungsdecodiereinheit 75 ausgegebenen Verstärkung des
adaptiven Erregungssignals, und sie gibt den Periodizitätsbetonungskoeffizienten
zu der ersten Periodizitätsvorgabeeinheit 83 aus.
-
Wie
aus der vorstehenden Beschreibung ersichtlich ist, ist es nicht
erforderlich, da das zweite Ausführungsbeispiel
so ausgebildet ist, dass ein erster Periodizitätskoeffizient auf der Grundlage
eines aus dem Sprachcode erhältlichen
Parameters bestimmt wird, einen Periodizitätsbetonungskoeffizienten getrennt
zu codieren. Demgemäß ist es
möglich, selbst
bei einer niedrigen Bitrate, die Periodizität für einen festen Codevektor zu
betonen durch Verwendung des ersten Periodizitätsbetonungskoeffizienten, der
adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt ist,
oder eines festen zweien Periodizitätsbetonungskoeffizienten, wodurch
eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
-
(Drittes Ausführungsbeispiel)
-
10 ist
ein schematisches Diagramm, das die innere Ausbildung der festen
Erregungscodiereinheit 47 zeigt, die in einer Codiervorrichtung
gemäß einem
dritten Ausführungsbeispiel
enthalten ist. Da die Komponenten in der Figur, die dieselben wie die
in 2 sind oder diesen entsprechen, durch gleiche
Zahlen bezeichnet sind, wird ihre Erläuterung weggelassen.
-
Die
Bezugszahl 63 bezeichnet eine Sprachzustand- Bestimmungseinheit
zum Bestimmen des Zustands einer Sprache anhand quantisierter Werte der
Linearvorhersagekoeffizienten, der Tonstärkeperiode und der Verstärkung eines
adaptiven Erregungssignals, während
die Bezugszahl 64 eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit
zum Bestimmen eines Periodizitätsbetonungskoeffizienten
anhand des Sprachzustands-Bestimmungsergebnisses und der Verstärkung des
adaptiven Erregungssignals bezeichnet.
-
11 ist
ein schematisches Diagramm, das die Ausbildung einer Sprachdecodiervorrichtung
gemäß einem
dritten Ausführungsbeispiel
der vorliegenden Erfindung zeigt. Da die Komponenten in der Figur,
die dieselben wie die. in 3 sind oder
diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre
Erläuterung
weggelassen.
-
Die
Bezugszahl 91 bezeichnet eine feste Erregungsdecodiereinheit
zum: Bestimmen des Zustands einer Sprache anhand quantisierter Werte
der Linearvorhersagekoeffizienten, der Tonstärkenperiode und der Verstärkung eines
adaptiven Erregungssignals; Bestimmen eines Periodizitätsbetonungskoeffizienten
aus dem Sprachzustands-Bestimmungsergebnis und der Verstärkung des
adaptiven Erregungssignals; und Ausgeben eines festen Erregungssignals,
das ein Zeitserienvektor entsprechend sowohl dem Periodizitätsbetonungskoeffizienten
als auch dem von der Trenneinheit 71 ausgegebenen festen
Erregungscode ist.
-
12 ist
ein schematisches Diagramm, das die innere Ausbildung der festen
Erregungsdecodiereinheit 91 zeigt. Da die Komponenten in
der Figur, die dieselben wie die in 4 sind oder
diesen entsprechen, durch gleiche Zahlen bezeichnet sind, wird ihre
Erläuterung weggelassen.
-
Die
Bezugszahl 87 bezeichnet eine Sprachzustands-Bestimmungseinheit
zum Bestimmen des Zustands einer Sprache anhand von quantisierten Werten
der Linearvorhersagekoeffizienten, der Tonstärkeperiode, der Verstärkung eines
adaptiven Erregungssignals, während
die Bezugszahl 88 eine Periodizitätsbetonungskoeffizienten-Berechnungseinheit
zum Bestimmen eines Periodizitätsbetonungskoeffizienten
anhand des Sprachzustands-Bestimmungsergebnisses und der Verstärkung des
adaptiven Erregungssignals bezeichnet.
-
Die
Arbeitsweise des dritten Ausführungsbeispiels
wird nachfolgend beschrieben.
-
Es
ist festzustellen, dass, da das dritte Ausführungsbeispiel dasselbe wie
das zweite Ausführungsbeispiel
ist, mit Ausnahme der Sprachzustands-Bestimmungseinheit 63 und der
Periodizitätsbetonungskoeffizienten-Berechnungseinheit 64 in der
festen Erregungscodiereinheit 47, sowie der Sprachzustands-Bestimmungseinheit 87 und
der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 88 in
der festen Erregungsdecodiereinheit 91, nur ihr Unterschied
beschrieben wird.
-
Die
Sprachzustands-Bestimmungseinheit 63 bestimmt den Zustand
einer Eingangssprache (beispielsweise durch Auswahl aus einer mit
Reibelaut versehenen, einer stetigen Stimme und anderen) auf der
Grundlage der von der Linearvorhersagekoeffizienten-Codiereinheit 42 ausgegebenen
quantisierten Werte der Linearvorhersagekoeffizienten, der von der
adaptiven Erregungscodiereinheit 43 ausgegebenen Tonstärkeperiode
und der von der Verstärkungscodiereinheit 48 ausgegebenen Verstärkung des
adaptiven Erregungssignals, und gibt das Bestimmungsergebnis zu
der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 64 aus.
-
Der
Sprachzustand wird beispielsweise wie folgt bestimmt. Zuerst wird
die Neigung des Spektrums erhalten auf der Grundlage der quantisierten Werte
der Linearvorhersagekoeffizienten. Wenn die Neigung anzeigt, dass
die Leistung der Sprache zunimmt, wenn die Frequenz höher wird,
wird der Zustand der Sprache als einen Reiblaut enthaltend bestimmt.
Dann werden die Änderungen
in der Tonstärkeperiode
und der Verstärkung
in Bezug auf die Zeit ausgewertet. Wenn die Änderungen klein sind, wird die
Sprache als eine stetige Stimme bestimmt. Andernfalls wird bestimmt,
dass die Sprache zu "anderen" gehört.
-
Die
Periodizitätsbetonungskoeffizienten-Berechnungseinheit 64 verwendet
das von der Sprachzustands-Bestimmungseinheit 63 ausgegebene Sprachzustands-Bestimmungsergebnis
und die von der Verstärkungscodiereinheit 48 ausgegebene
Verstärkung
für das
adaptive Erregungssignal, um einen Periodizitätsbetonungskoeffizienten (beispielsweise wird
die Verstärkung
für das
adaptive Erregungssignal in einem vorhergehenden Rahmen für den Koeffizienten
genommen) zu bestimmen, und sie gibt den bestimmten Periodizitätsbetonungskoeffizienten
zu der ersten Periodizitätsvorgabeeinheit 54 aus.
-
Der
vorgenannte Periodizitätsbetonungskoeffizient
wird wie folgt bestimmt. Wenn der Sprachzustand einen Reiblaut enthält, wird
der Grad der Betonung herabgesetzt. Wenn der Sprachzustand eine stetige
Stimme ist, wird andererseits der Grad der Betonung erhöht.
-
Mit
dieser Anordnung ist es möglich,
das Setzten einer unangemessenen Periodizitätsbetonung zu eliminieren,
wie das Setzen einer starken Periodizitätsbetonung auf einen festen
Erregungsvektor in einem Abschnitt mit Reiblaut, in welchem die
Eingangssprache tatsächlich
keine Periodizität hat,
oder das Setzen von nur wenig Periodizitätsbetonung auf einen festen
Erregungsvektor in einem Abschnitt mit stetiger Stimme, in welchem
die Eingangssprache tatsächlich
eine starke Periodizität hat.
Somit kann das dritte Ausführungsbeispiel
eine codierte Sprache von subjektiv hoher Qualität liefern.
-
Die
Sprachzustands-Bestimmungseinheit 87 bestimmt den Zustand
einer Sprache, so wie es die Sprachzustands-Bestimmungseinheit 63 in der
festen Erregungscodiereinheit 47 tut, aus den von der Linearvorhersagekoeffizienten-Decodiereinheit 72 ausgegebenen
quantisierten Werten der Linearvorhersagekoeffizienten, der von
der adaptiven Erregungsdecodiereinheit 73 ausgegebenen
Tonstärkeperiode
und der von der Verstärkungscodiereinheit 75 ausgegebenen
Verstärkung
des adaptiven Erregungssignals, und sie gibt das Bestimmungsergebnis zu
der Periodizitätsbetonungskoeffizienten-Berechnungseinheit 88 aus.
-
Die
Periodizitätsbetonungskoeffizienten-Berechnungseinheit 88 bestimmt
einen Periodizitätsbetonungskoeffizienten,
so wie es die Periodizitätsbetonungskoeffizienten-Berechnungseinheit 64 in
der festen Erregungscodiereinheit 47 tut, aus dem von der
Sprachzustands-Bestimmungseinheit 87 ausgegebenen Sprachzustands-Bestimmungsergebnis und
der von der Verstärkungsdecodiereinheit 75 ausgegebenen
Verstärkung
des adaptiven Erregungssignals, und sie gibt den bestimmten Periodizitätsbetonungskoeffizienten
zu der ersten Periodizitätsvorgabeeinheit 83 aus.
-
Bei
der vorstehenden Anordnung wird der Sprachzustand bestimmt auf der
Grundlage eines aus dem Sprachcode erhältlichen Parameters, und ein
Periodizitätsbetonungskoeffizient
wird anhand dieses Bestimmungsergebnisses bestimmt. Daher ist es
möglich,
den Periodizitätsbetonungskoeffizienten feiner
zu steuern, ohne die zu übertragenden
Informationen zu vergrößern, wodurch
eine codierte Sprache von subjektiv hoher Qualität erhalten wird.
-
Weiterhin
wird, wenn das Sprachzustands-Bestimmungsergebnis
einen Reiblaut anzeigt, der tatsächlich
keine Periodizität
hat, der Periodizitätsbetonungskoeffizient
(der Grad der Betonung) herabgesetzt. Daher ist es möglich, eine
codierte Sprache von subjektiv hoher Qualität zu erhalten.
-
Weiterhin
wird der Periodizitätsbetonungskoeffizient
(der Grad der Betonung) erhöht,
wenn das Sprachzustands-Bestimmungsergebnis eine stetige Stimme
anzeigt, die tatsächlich
eine starke Periodizität
hat, wodurch es möglich
ist, auch eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
-
(Viertes Ausführungsbeispiel)
-
Bei
den vorstehenden ersten bis dritten Ausführungsbeispielen wird entweder
der erste oder der zweite Periodizitätsvorgabevorgang auf ein festes Erregungscodebuch
auf der Grundlage der Rauschcharakteristiken von in dem festen Erregungscodebuch
gespeicherten festen Codevektoren angewendet. Jedoch kann die vorliegende
Erfindung so ausgebildet sein, dass die ersten festen Erregungscodebücher 53 und 82 mehrere Zeitserienvektoren
(feste Codevektoren) speichern, deren Leistungsverteilung in Bezug
auf die Zeit flach ist, während
die zweiten festen Erregungscodebücher 57 und 84 mehrere Zeitserienvektoren
(feste Codevektoren) speichern, deren Leistungsverteilung auf die
erste Hälfte
des Rahmens vorgespannt ist.
-
In
dieser Anordnung ist es möglich,
festen Codevektoren konstant eine starke Periodizität zu geben,
deren Leistungsverteilung so vorgespannt ist, dass die Vorspannung
der Leistungsverteilung der festen Codevektoren reduziert ist, nachdem
ihnen die Periodizität
gegeben ist, wodurch eine codierte Sprache von subjektiv hoher Qualität erhalten
wird.
-
(Fünftes Ausführungsbeispiel)
-
Die
vorstehenden ersten bis vierten Ausführungsbeispiele verwenden jeweils
zwei feste Erregungscodebücher.
Jedoch können
drei oder mehr feste Erregungscodebücher verwendet werden, und die
feste Erregungscodiereinheit 44 und 47 und die feste
Erregungsdecodiereinheit 74, 80 und 91 können entsprechend
ausgebildet sein.
-
Weiterhin
zeigen die vorstehenden ersten bis vierten Ausführungsbeispiele jeweils explizit
mehrere feste. Erregungscodebücher.
Jedoch können
in einem einzelnen festen Erregungscodebuch gespeicherte Zeitserienvektoren
in mehrere Subsätze
geteilt sein, und jeder Subsatz kann als ein individuelles festes
Erregungscodebuch angesehen werden.
-
Weiterhin
sind bei den vorstehenden ersten bis vierten Ausführungsbeispielen
die in den ersten festen Erregungscodebüchern 53 und 82 gespeicherten
festen Codevektoren unterschiedlich gegenüber den in den zweiten festen
Erregungscodebüchern 57 und 84 gespeicherten.
Jedoch können sämtliche
der vorgenannten ersten und zweiten festen Erregungscodebücher dieselben
festen Codevektoren speichern. Dies bedeutet, dass sowohl die erste
als auch die zweite Periodizitätsvorgabeeinheit auf
dasselbe einzelne feste Erregungscodebuch angewendet werden.
-
Weiterhin
sind die obigen ersten bis vierten Ausführungsbeispiele so ausgebildet,
dass sie zwei Synthesefilter haben, nämlich das erste Synthesefilter 55 und
das zweite Synthesefilter 59. Da jedoch beide Filter dieselbe
Operation durchführen,
kann die vorliegende Erfindung so ausgebildet sein, dass ein einzelnes
Synthesefilter gemeinsam verwendet wird. In gleicher Weise kann
eine einzelne Verzerrungsberechnungseinheit gemeinsam als die erste
Verzerrungsberechnungseinheit 56 und die zweite Verzerrungsberechnungseinheit 60 verwendet
werden.
-
Wie
vorstehend beschrieben ist, weist eine Sprachcodiervorrichtung gemäß der vorliegenden Erfindung
auf: eine erste Periodizitätsvorgabeeinheit zum,
wenn Codierverzerrung von festen Codevektoren ausgewertet werden,
Betonen der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten,
der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt
ist; und eine zweite Periodizitätsvorgabeeinheit
zum Betonen der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines vorbestimmten zweiten
Periodizitätsbetonungskoeffizienten.
Daher ist es möglich,
wenn einer von dem ersten Periodizitätsbetonungskoeffi zient und
dem zweiten Periodizitätsbetonungskoeffizient auf
einen unangemessenen Wert gesetzt würde, den nachteiligen Einfluss
durch den unangemessenen Periodizitätsbetonungskoeffizienten auf
einen Teil der festen Codevektoren zu begrenzen, wodurch eine Ausgangssprache
von subjektiv hoher Qualität erhalten
wird.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung weist auf: einen ersten Periodizitätsvorgabeschritt zum, wenn
Codierverzerrungen von festen Codevektoren ausgewertet werden, Betonen
der Periodizität
eines festen Codevektors, der von zumindest einem festen Erregungscodebuch ausgegeben
wurde, durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten, der
adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt wurde;
und einen zweiten Periodizitätsvorgabeschritt zum
Betonen der Periodizität
eines festen Codevektors, der von zumindest einem festen Erregungscodebuch
ausgegeben wurde, durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Daher ist es möglich,
wenn einer von dem ersten Periodizitätsbetonungskoeffizient. und dem
zweiten Periodizitätsbetonungskoeffizient
auf einen unangemessenen Wert gesetzt wurde, den nachteiligen Einfluss
durch den unangemessenen Periodizitätsbetonungskoeffizienten auf
einen Teil der festen Codevektoren zu begrenzen, wodurch eine Ausgangssprache
von subjektiv hoher Qualität erhalten
wird.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung analysiert eine Eingangssprache, um einen ersten Periodizitätsbetonungskoeffizienten
zu bestimmen. Daher ist es möglich,
die Frequenz der Bestimmung eines unangemessenen Periodizitätsbetonungskoeffizienten
herabzusetzen, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten
wird.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen ersten Periodizitätsbetonungskoeffizienten anhand
des Sprachcodes. Daher ist es möglich,
die Periodizität
eines festen Codevektors zu bestimmen, ohne einen Periodizitätsbetonungskoeffizienten
separat zu codieren, d.h., ohne die zu übertragenden Informationen
zu vergrößern, wodurch
eine Ausgangssprache von subjektiv hoher Qualität erhalten wird.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Zustand einer Sprache und bestimmt einen
ersten Periodizitätsbetonungskoeffizienten
auf der Grundlage des Zustandsbestimmungsergebnisses. Daher ist
es möglich,
einen Periodizitätsbetonungskoeffizienten
feiner zu steuern, wodurch eine codierte Sprache von subjektiv höherer Qualität erhalten
wird.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Abschnitt mit Reiblaut in einer Sprache
und verringert einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten
in dem Abschnitt mit Reiblaut. Daher ist es möglich, eine codierte Sprache
von subjektiv hoher Qualität
zu erhalten.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Abschnitt mit stetiger Stimme in einer
Sprache und erhöht
einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in
dem Abschnitt mit stetiger Sprache. Daher ist es möglich, eine
codierte Sprache von subjektiv hoher Qualität zu erhalten.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt
oder einen zweiten Periodizitätsvorgabeschritt
auf ein festes Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken
von in dem festen Erregungscodebuch gespeicherten festen Codevektoren.
Daher wird die Sprachqualität
der Ausgangssprache mit Bezug auf Rauschcharakteristiken verbessert,
und weiterhin wird verhindert, dass die Ausgangssprache eine impulsartige Sprachqualität annimmt,
wodurch es möglich
wird, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
-
Ein
Sprachcodierverfahren gemäß der vorliegenden
Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt
oder einen zweiten Periodizitätsvorgabeschritt
auf ein festes Erregungscodebuch an auf der Grundlage der Leistungsverteilung von
festen Codevektoren in Bezug auf die Zeit, die in dem festen Erregungscodebuch
gespeichert sind. Daher wird die Vorspannung der Leistungsverteilung der
festen Codevektoren reduziert, nachdem ihnen Periodizität gegeben
wurde, wodurch es möglich
ist, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
-
Eine
Sprachdecodiervorrichtung gemäß der vorliegenden
Erfindung weist auf: eine erste Periodizitätsvorgabeeinheit zum, wenn
ein fester Codevektor entsprechend dem festen Erregungscode herausgezogen
ist, Betonen der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten,
der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt
wurde; und eine zweite Periodizitätsvorgabeeinheit zum Betonen
der Periodizität eines
von zumindest einem festen Erregungscodebuch ausgegebenen festen
Codevektors durch Verwendung eines vorbestimmten zweiten Periodizitätsbetonungskoeffizienten.
Daher ist es möglich,
wenn einer von dem ersten Periodizitätsbetonungskoeffizienten und
dem zweiten Periodizitätsbetonungskoeffizienten
auf einen unangemessenen Wert gesetzt wurde, den nachteiligen Einfluss
durch den unangemessenen Periodizitätsbetonungskoeffizienten auf
einen Teil der festen Codevektoren zu begrenzen, wodurch eine Ausgangssprache
von subjektiv hoher Qualität erhalten
wird.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung weist auf: einen ersten Periodizitätsvorgabeschritt zum, wenn
ein fester Codevektor entsprechend dem festen Erregungscode herausgezogen
ist, Betonen der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines ersten Periodizitätsbetonungskoeffizienten,
der adaptiv auf der Grundlage einer vorbestimmten Regel bestimmt
ist; und einen zweiten Periodizitätsvorgabeschritt zum Betonen
der Periodizität
eines von zumindest einem festen Erregungscodebuch ausgegebenen
festen Codevektors durch Verwendung eines vorbestimmten zweiten
Periodizitätsbetonungskoeffizienten.
Daher ist es möglich,
wenn einer von dem ersten Periodizitätsbetonungskoeffizienten und
dem zweiten Periodizitätsbetonungskoeffizienten
auf einen unangemessenen Wert gesetzt wurde, den nachteiligen Einfluss
durch den unangemessenen Periodizitätsbetonungskoeffizienten auf
einen Teil der festen Codevektoren zu begrenzen, wodurch eine Ausgangssprache
von subjektiv hoher Qualität erhalten
wird.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung decodiert einen ersten Periodizitätsbeto nungskoeffizienten anhand
des in dem Sprachcode enthaltenen Codes eines Periodizitätsbetonungskoeffizienten.
Dadurch ist es möglich,
eine Ausgangssprache von subjektiv hoher Qualität zu erhalten.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen ersten Periodizitätsbetonungskoeffizienten aus
dem Sprachcode. Daher ist es möglich,
die Periodizität
eines festen Codevektors ohne getrennte Codierung eines Periodizitätsbetonungskoeffizienten
zu betonen, d.h., ohne Vergrößerung der
zu übertragenden
Informationen, wodurch eine Ausgangssprache von subjektiv hoher Qualität erhalten
wird.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Zustand einer Sprache und bestimmt einen
ersten Periodizitätsbetonungskoeffizient
auf der Grundlage des Zustandsbestimmungsergebnisses. Daher ist
es möglich,
einen Periodizitätsbetonungskoeffizienten
feiner zu steuern, wodurch eine codierte Sprache von subjektiv hoher
Qualität
erhalten wird.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Abschnitt mit Reiblaut in einer Sprache
und verringert einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten
in dem Abschnitt mit Reiblaut. Daher ist es möglich, eine codierte Sprache
von subjektiv hoher Qualität
zu erhalten.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung bestimmt einen Abschnitt mit stetiger Stimme in einer
Sprache und erhöht
einen Betonungsgrad eines ersten Periodizitätsbetonungskoeffizienten in dem
Abschnitt mit stetiger Stimme. Daher ist es möglich, eine codierte Sprache
von subjektiv hoher Qualität
zu erhalten.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt
oder einen zweiten Periodizitätsvorgabeschritt
auf ein festes Erregungscodebuch an auf der Grundlage von Rauschcharakteristiken
von in dem festen Erregungscodebuch gespeicherten festen Codevektoren.
Daher wird die Sprachqualität
der Ausgangssprache mit Bezug auf Rauschcharakteristiken verbessert,
und weiterhin wird verhindert, dass die Ausgangssprache eine impulsartige
Sprachqualität
annimmt, wodurch es möglich
wird, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.
-
Ein
Sprachdecodierverfahren gemäß der vorliegenden
Erfindung wendet entweder einen ersten Periodizitätsvorgabeschritt
oder einen zweiten Periodizitätsvorgabeschritt
auf ein festes Erregungscodebuch an auf der Grundlage der Leistungsverteilung
von festen Codevektoren in Bezug auf die Zeit, die in dem festen
Erregungscodebuch gespeichert sind. Daher wird die Vorspannung der
Leistungsverteilung der festen Codevektoren reduziert, nachdem ihnen
Periodizität
gegeben wurde, wodurch es möglich
wird, eine codierte Sprache von subjektiv hoher Qualität zu erhalten.