DE602004004950T2 - Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren - Google Patents

Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren Download PDF

Info

Publication number
DE602004004950T2
DE602004004950T2 DE602004004950T DE602004004950T DE602004004950T2 DE 602004004950 T2 DE602004004950 T2 DE 602004004950T2 DE 602004004950 T DE602004004950 T DE 602004004950T DE 602004004950 T DE602004004950 T DE 602004004950T DE 602004004950 T2 DE602004004950 T2 DE 602004004950T2
Authority
DE
Germany
Prior art keywords
fixed codebook
speech
signal
base layer
quality enhancement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE602004004950T
Other languages
English (en)
Other versions
DE602004004950D1 (de
Inventor
Chang-Yong Son
Kang-Eun Lee
Sang-Won Kang
Sang-Hyun Chi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020040040478A external-priority patent/KR100668300B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of DE602004004950D1 publication Critical patent/DE602004004950D1/de
Application granted granted Critical
Publication of DE602004004950T2 publication Critical patent/DE602004004950T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die vorliegende Erfindung betrifft einen Sprachcodec, der einen Code-Excited-Linear-Prediction(CELP)-Algorithmus einsetzt, und insbesondere eine Vorrichtung und ein Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren im Signalrauschverhältnis (SNR, Signal-to-Noise Ratio).
  • Sprachcodecs unter Einsatz eines CELP-Algorithmus werden derzeit am häufigsten in Mobilkommunikationssystemen verwendet. CELP-Sprachcodecs beruhen auf der linearen Vorhersagekodierung (LPC, Linear Prediction Coding). Übertragungsraten und Bandbreiten der Sprachcodecs sind entsprechend der Art des Dienstes, bei dem sie angewendet werden, veränderlich.
  • Die Übertragungsraten und Bandbreiten der allgemeinen Sprachcodecs sind jedoch durch die Kodiergeräte festgelegt, nicht von den Dekodiergeräten. Wenn ferner eine Sammelsendung (Multicasting) erfolgt, bei der ein Paket von einem Sender zu einer Mehrzahl von Empfängern über ein Netzwerk gesendet wird, kann sich die Qualität des zur Mehrzahl von Empfängern übermittelten Pakets, die eine Vielfalt von Bitraten erfordern, verschlechtern, wenn der auf einer Seite des Senders verwendete Sprachcodec eine feste Bitrate aufweist.
  • Um dieses Problem zu lösen, wurden Sprachcodecs entwickelt, die ein bitraten-skalierbares Sprachkodierverfahren einsetzen. Solche Sprachcodecs konfigurieren einen Bitstrom, der Basiscodec-Information und zusätzliche Information enthält, was eine korrektere Wiederherstellung eines Signals ermöglichen kann.
  • Herkömmliche bitraten-skalierbare Sprachkodierverfahren werden in ein Signalrauschverhältnis(SNR)-bitraten-skalierbares Sprachkodierverfahren und ein bandbreiten-skalierbares Verfahren klassifiziert.
  • Das SNR bitraten-skalierbare Sprachkodierverfahren kodiert und dekodiert ein Sprachsignal unter Verwendung hierarchischer Kodierung. Das heißt, das SNR bitraten-skalierbare Sprachkodierverfahren kodiert ein Sprachsignal entsprechend in einer Basisschicht und einer Sprachqualitätsverbesserungsschicht. Die Basisschicht überträgt nur Information zum Wiederherstellen der geringsten Sprachqualität, und die Sprachqualitätsverbesserungsschicht überträgt zusätzliche Information zum Verbessern der Sprachqualität.
  • Die herkömmlichen SNR bitraten-skalierbaren Kodiervorrichtungen sind jedoch so konstruiert, dass die Sprachqualitätsverbesserungsschicht von der Basisschicht unabhängig ist. Da Berechnungen der Energie und einer Korrelation zwischen einer Impulsantwort und einem Zielsignal (oder Zielvektor), die für Suche im festen Codebuch notwendig sind, jeweils in der Basisschicht und der Sprachqualitätsverbesserungsschicht durchgeführt werden, sind deshalb eine große Anzahl von Berechnungen erforderlich, um Parameter für die Suche im festen Codebuch zu ermitteln.
  • Da außerdem die herkömmlichen SNR bitraten-skalierbaren Kodiervorrichtungen die Strukturen von vorhandenen CELP-Standardsprachcodecs verändern, um zusätzlich die Sprachqualitätsverbesserungsschicht zu betreiben, sind die herkömmlichen Vorrichtungen nicht mit vorhandenen CELP-Standardsprachcodecs kompatibel.
  • Koishida K. et al.: "A 16-Kbit/s Bandwidth Scalable Audio Coder Based an the G.729 Standard" 2000 IEEE ICASSP-2000. Istanbul, Türkei, 5.-9. Juni 2000, Band 2 von 6, 5. Juni 2000 (2000-06-05), Seiten 1149-1152, beschreiben ein bandbreiten-skalierbares Kodierschema. Ein Verstärkungskodierer kodiert Breitbandsprache, wobei die Basisschichtinformation genutzt wird. Es werden eine Reihe unterschiedlicher Verstärkungskodiererstrukturen beschrieben.
  • Die vorliegende Erfindung stellt eine Vorrichtung zum bitraten-skalierbaren Sprachkodieren und -dekodieren im Signalrauschverhältnis (SNR, Signal-to-Noise Ratio) zur Verfügung, die ein festes Codebuch eines vorhandenen Standardsprachcodecs beinhaltet und ein mehrschichtiges festes Codebuch, und dadurch mit dem vorhandenen Standardsprachcodecs kompatibel ist, und ein Verfahren zur Verwendung der SNR-bitraten-skalierbaren Vorrichtung zum Sprachkodieren- und -dekodieren.
  • Die vorliegende Erfindung stellt auch eine Vorrichtung zum SNR-bitraten-skalierbaren Sprachkodieren und -dekodieren zur Verfügung, die die Anzahl an Berechnungen zum Ermitteln von Parametern für Suche im festen Codebuch reduziert, und ein Verfahren zur Verwendung der SNR-bitraten-skalierbaren Vorrichtung zum Sprachkodieren- und -dekodieren.
  • Die vorliegende Erfindung stellt ferner eine Vorrichtung zum SNR-bitraten-skalierbaren Sprachkodieren und -dekodieren zur Verfügung, die ein festes Codebuch einer Sprachqualitätsverbesserungsschicht durchsucht, wobei ein Beitrag eines festen Codebuchs verwendet wird, das in einer Basisschicht durchsucht ist, und ein Zielsignal, aus dem ein synthetisiertes Anregungssignal der Sprachqualitätsverbesserungsschicht eliminiert ist, und ein Verfahren zur Verwendung der SNR-bitraten-skalierbaren Vorrichtung zum Sprachkodieren- und -dekodieren.
  • Die vorliegende Erfindung stellt ferner eine Vorrichtung zum SNR-bitraten-skalierbaren Sprachkodieren und -dekodieren zur Verfügung, die es ermöglicht, dass eine Impulsposition, die in einer Basisschicht gesucht wird, und eine Impulsposition, die in einer Sprachqualitätsverbesserungsschicht gesucht wird, gleich sind, wodurch die Beschränkungen eines algebraischen Codebuches überwunden werden, und ein Verfahren zur Verwendung der SNR-bitraten-skalierbaren Vorrichtung zum Sprachkodieren- und -dekodieren.
  • Die vorliegende Erfindung stellt auch eine Vorrichtung zum SNR-bitraten-skalierbaren Sprachkodieren und -dekodieren zur Verfügung, die die Anzahl an quantisierten Bits, die einem Verstärkungswert eines festen Codebuchs in einer Sprachqualitätsverbesserungsschicht entsprechen, reduziert.
  • Gemäß einem Aspekt der vorliegenden Erfindung wird eine Vorrichtung zur Sprachsignalkodierung nach Anspruch 1 zur Verfügung gestellt.
  • Die zweite Dekodiereinheit kann umfassen: Verstärkungsdifferenzdekodiereinheit, die eine Differenz zwischen logarithmischen festen Codebuchverstärkungswerten in der Kodierinformation in der Sprachqualitätsverbesserungsschicht dekodiert; und eine Dekodiereinheit für ein festes Codebuch zum Dekodieren eines festen Codebuchindex, der in der Kodierinformation der Sprachqualitätsverbesserungsschicht enthalten ist.
  • Gemäß einem anderen Aspekt der vorliegenden Erfindung wird ein Verfahren zur Sprachsignalkodierung nach Anspruch 21 zur Verfügung gestellt.
  • Die Funktion der Sprachqualitätsverbesserungsschicht kann in mehreren Schichten durchgeführt werden.
  • Gemäß einem anderen Aspekt der vorliegenden Erfindung wird ein Verfahren zur Sprachsignaldekodierung nach Anspruch 26 zur Verfügung gestellt.
  • Der Beitrag des festen Codebuchs y2(n) der Basisschicht der Kodiervorrichtung kann durch die folgende Gleichung unter Verwendung eines festen Codebuchs cG, wobei ein quantisierter Verstärkungswert des festen Codebuchs der Basisschicht multipliziert wird, und einer Impulsantwort h(n) eines Synthesefilters berechnet werden
  • Figure 00050001
  • Die Sprachqualitätsverbesserungsschicht kann ferner ein Signal aus dem Zielsignal der Basisschicht eliminieren, das durch Synthetisieren eines festen Codebuchsignals erhalten ist, das in der Sprachqualitätsverbesserungsschicht unter Verwendung des Linearvorhersagekodierkoeffizienten erzeugt ist.
  • Die Sprachqualitätsverbesserungsschicht kann ferner eine Funktion zum Multiplizieren eines festen Codebuchvektors, der durch die Suche im festen Codebuch der Sprachqualitätsverbesserungsschicht erhalten ist, mit einem quantisierten Verstärkungswert der Sprachqualitätsverbesserungsschicht, der durch Quantisieren einer Differenz zwischen einem logarithmischen Wert eines ersten Verstärkungswerts erhalten durch Suche im festen Codebuch der Basisschicht und einem logarithmischen Wert eines zweiten Verstärkungswerts erhalten durch Suche im festen Codebuch der Sprachqualitätsverbesserungsschicht erhalten ist, umfassen.
  • Die Sprachqualitätsverbesserungsschicht kann das Zielsignal mit einem Wahrnehmungsgewichtungsfilter filtern, und dann die Suche im festen Codebuch durchführen.
  • Die obigen und weitere Merkmale und Vorteile der vorliegenden Erfindung werden besser ersichtlich aus einer ausführlichen Beschreibung beispielhafter Ausführungsformen mit Bezug zu den begleitenden Zeichnungen, in denen:
  • 1 ein Blockdiagramm einer bitraten-skalierbaren Sprachkodiervorrichtung gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung ist;
  • 2 ein Diagramm zur Erläuterung einer Impulsposition ist, die von einer Durchsuchungseinheit für ein festes Codebuch in einer Basisschicht gesucht wird, und einer Impulsposition, die von einer Durchsuchungseinheit für ein festes Codebuch in einer Sprachqualitätsverbesserungsschicht in der bitraten-skalierbaren Sprachkodiervorrichtung von 1 gesucht wird;
  • 3 ein Blockdiagramm einer bitraten-skalierbaren Sprachdekodiervorrichtung gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung ist;
  • 4 ein Fließbild eines bitraten-skalierbaren Sprachkodierverfahrens gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung ist;
  • 5 ein Fließbild eines bitraten-skalierbaren Sprachdekodierverfahrens gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung ist;
  • 6 ein Blockdiagramm einer bitraten-skalierbaren Sprachkodiervorrichtung gemäß einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung ist;
  • 7 ein Blockdiagramm einer Verstärkungsdifferenzquantisierungseinrichtung einer Sprachqualitätsverbesserungsschicht in der bitraten-skalierbaren Sprachkodiervorrichtung von 6 gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung ist;
  • 8 ein Blockdiagramm einer bitraten-skalierbaren Sprachdekodiervorrichtung gemäß einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung ist;
  • 9 ein Diagramm zur Erläuterung einer Impulsposition ist, die von einer Durchsuchungseinheit für ein festes Codebuch in einer Basisschicht gesucht wird, und einer Impulsposition, die von einer Durchsuchungseinheit für ein festes Codebuch in einer Sprachqualitätsverbesserungsschicht in der bitraten-skalierbaren Sprachdekodiervorrichtung von 8 gesucht wird;
  • 10 ein Fließbild eines bitraten-skalierbaren Sprachkodierverfahrens gemäß einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung ist; und
  • 11 ein Fließbild eines bitraten-skalierbaren Sprachdekodierverfahrens gemäß einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung ist.
  • 1 ist ein Blockdiagramm einer bitraten-skalierbaren Sprachkodiervorrichtung gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung. Mit Bezug zu 1 weist die Vorrichtung zur bitraten-skalierbaren mit einer Basisschicht 100 und einer Sprachqualitätsverbesserungsschicht 130 Sprachkodierung eine mehrschichtige feste Codebuchstruktur auf. Die Basisschicht 100 erzeugt Kodierinformation zum Wiederherstellen der geringsten Sprachqualität. Die Basisschicht 100 ist in der Konfiguration ähnlich einem vorhandenen Code-Excited-Linear-Prediction(CELP)-Standardsprachcodecs. Deshalb filtert die Basisschicht 100 ein Eingangssprachsignal unter Verwendung von Linearvorhersage (LPC, Linear Prediction Coding) und erzeugt ein Anregungssignal entsprechend dem eingegebenen Sprachsignal.
  • Die Basisschicht 100 beinhaltet eine Vorverarbeitungseinheit 102, einen (LPC)-Koeffizientenextraktor und eine Vektorquantisierungseinrichtung 104, einen Synthesefilter 106, einen Subtraktor 108, einen Wahrneh mungsgewichtungsfilter 110, eine Tonanalyseeinheit 112, eine Tonbeitragseliminierungseinheit 115, eine Durchsuchungseinheit 117 für ein festes Codebuch, ein festes Codebuch 119, einen ersten Multiplizierer 121, einen Addierer 123, ein adaptives Codebuch 124, einen zweiten Multiplizierer 126 und eine Verstärkungswertquantisierungseinrichtung 129.
  • Die Vorverarbeitungseinheit 102 eliminiert eine Gleichstrom(DC)-Komponente aus einem über eine Leitung 101 eingegebenen Sprachsignal. Das heißt, die Vorverarbeitungseinheit 102 filtert das Eingangssprachsignal unter Verwendung eines Hochpassfilters, so dass eine Rauschkomponente eines Niederfrequenzbands des Eingangssprachsignals eliminiert wird. Der verwendete Hochpassfilter Hh1(n) weist eine Transferfunktion wie in Gleichung (1) gezeigt auf:
  • Figure 00080001
  • Ein von der Vorverarbeitungseinheit 102 ausgegebenes Signal wird über eine Leitung 103 zum LPC-Koeffizientenextraktor und die Vektorquantisierungseinrichtung 104 übertragen.
  • Der LPC-Koeffizientenextraktor und die Vektorquantisierungseinrichtung 104 extrahieren einen LPC-Koeffizienten des aus der Vorverarbeitungseinheit 102 ausgegebenen Signals. Der extrahierte LPC-Koeffizient wird vom LPC-Koeffizientenextraktor und der Vektorquantisierungseinrichtung 104 quantisiert. Vektorquantisierungsinformation des LPC-Koeffizienten wird über eine Leitung 105 zum Synthesefilter 106 und einem Multiplizierer 140 übertragen.
  • Der Synthesefilter 106 gibt ein synthetisiertes Signal entsprechend einem über eine Leitung 128 eingegebenen Anregungssignal aus, wobei die Vektorquantisierungsinformation des LPC-Koeffizienten verwendet wird. Das synthetisierte Signal wird über eine Leitung 107 zum Subtraktor 108 gegeben.
  • Der Subtraktor 108 subtrahiert das über die Leitung 128 eingegebene synthetisierte Signal von dem Signal, das über die Leitung 103 von der Vorverarbeitungseinheit 102 eingegeben ist, wodurch ein Differenzsignal erzeugt wird. Das Differenzsignal wird über eine Leitung 109 zum Wahrnehmungsgewichtungsfilter 110 übertragen.
  • Der Wahrnehmungsgewichtungsfilter 110 hält ein Quantisierungsrauschen unter einem Maskierungsschwellenwert, so dass ein Maskierungseffekt des menschlichen Hörorgans genutzt wird. Daher gibt der Wahrnehmungsgewichtungsfilter 110 ein Signal, das ein Gewicht zum Minimieren eines Quantisierungsrauschens des Differenzsignals enthält, an die Tonanalyseeinheit 112 aus.
  • Die Tonanalyseeinheit 112 sucht einen Open-Loop-Pitch und einen Closed-Loop-Pitch des vom Wahrnehmungsgewichtungsfilter 110 ausgegebenen Signals. Das heißt, die Tonanalyseeinheit 112 unterteilt das vom Wahrnehmungsgewichtungsfilter 110 ausgegebene Signal in einem Mehrzahl von Unterrahmen, analysiert eine Tonhöhe jedes Unterrahmens und gibt einen Index und einen Verstärkungswert des adaptiven Codebuchs aus. Der Index des adaptiven Codebuchs wird über eine Leitung 113 zur Tonbeitragseliminierungseinheit 115 und dem adaptiven Codebuch 124 und über eine Leitung 114 zum Multiplizierer 140 übertragen. Der Verstärkungswert des adaptiven Codebuchs wird der Verstärkungswertquantisierungseinrichtung 129 zugeführt.
  • Die Tonbeitragseliminierungseinheit 115 erfasst ein Zielsignal (oder einen Zielvektor), das für Durchsuchung eines festen Codebuchs notwendig ist, aus dem vom Wahrnehmungsgewichtungsfilter 110 ausgegebe nen Signal unter Verwendung des Index des adaptiven Codebuchs 124. Die Tonbeitragseliminierungseinheit 115 subtrahiert einen Tonbeitrag y1(n) in einer Leitung 111 und gibt das für die Durchsuchung des festen Codebuchs notwendige Zielsignal über eine Leitung 116 zur Durchsuchungseinheit 117 für ein festes Codebuch der Basisschicht 100 und eine Durchsuchungseinheit 131 für ein festes Codebuch der Sprachqualitätsverbesserungsschicht 130. Der Tonbeitrag y1(n) wird durch Gleichung (2) ermittelt
    Figure 00100001
    wobei ACG(n) einen Wert darstellt, mit dem der Verstärkungswert des adaptiven Codebuchs 124 multipliziert wird.
  • Die Durchsuchungseinheit 117 für ein festes Codebuch ermittelt eine Korrelation d(n) zwischen dem Zielsignal und einer Impulsantwort h(n) utner Verwendung des über die Leitung 111 eingegebenen Zielsignals x'(n).
  • Wenn zum Beispiel der Umfang des Unterrahmens 40 Abtastungen umfasst und die Anzahl an Impulsen jeder Schicht 4 beträgt, ist die Korrelation d(n) definiert als
    Figure 00100002
    wobei h(i – n) die Impulsantwort darstellt und x'(n) das Zielsignal darstellt.
  • Die Impulsantwort h(n) und die Korrelation d(n) werden der Durchsuchungseinheit 131 für ein festes Codebuch der Sprachqualitätsverbesserungsschicht 130 über eine Leitung 118' zugeführt.
  • Die Durchsuchungseinheit 117 für ein festes Codebuch durchsucht ein festes Codebuch mit einer Struktur wie in Tabelle 1 gezeigt unter Verwendung der Impulsantwort h(n) und der Korrelation d(n).
  • Figure 00110001
  • Mit Bezug zu Tabelle 1 ist der Betrag eines Impulses eines festen Codebuchvektors in der Durchsuchungseinheit 117 für ein festes Codebuch in nur vier Positionen ungleich null. Dementsprechend kann eine Korrelation C durch Gleichung (4) unter Verwendung eines Vorzeichens s für jeden Impuls und der Korrelation d(n) definiert werden. Die Durchsuchungseinheit 117 für ein festes Codebuch erfasst die Korrelation C unter Verwendung von Gleichung (4)
    Figure 00110002
    wobei mi eine i-te Impulsposition darstellt und si ein Vorzeichen eines i-ten Impulses darstellt.
  • Die Durchsuchungseinheit 117 für ein festes Codebuch erfasst Energie E der Impulsantwort h(n) des Synthesefilters 106 unter Verwendung der Gleichung (5)
    Figure 00120001
    wobei Φ(mi, mj) eine Korrelation zwischen Impulsantworten h(n) in Bezug auf i-te und j-te Impulspositionen darstellt, si ein Vorzeichen eines i-ten Impulses ist und sj ein Vorzeichen eines j-ten Impulses ist.
  • Die Durchsuchungseinheit 117 für ein festes Codebuch speichert die Korrelation C und die Energie E der Impulsantwort h(n). Die Durchsuchungseinheit 117 für ein festes Codebuch teilt die Korrelation C in ein Vorzeichen sign[d(i)] und seinen Absolutwert und speichert sie. Das sign[d(i)] ist ein Vorzeichen von d(i). Die Energie E wird gespeichert als Φ'(i, j) = sign [d(i)]sign [d(j)] Φ(i, j) i = 0, ..., 39 j = i + 1, ..., 39 wenn i = j, dann Φ'(i, j) = 0,5 Φ'(i, j) i = 0, ..., 39 (6)
  • Die Gleichung 5 für die Energie E kann umgeformt werden zu E/2 = Φ'(m0, m0) + Φ'(m1, m1) + Φ'(m0, m1) + Φ'(m2, m2) + Φ'(m0, m2) + Φ'(m1, m2) + Φ'(m3, m3) + Φ'(m0, m3) + Φ'(m1, m3) + Φ'(m2, m3) (7).
  • Die Durchsuchungseinheit 117 für ein festes Codebuch gibt die erfasste Korrelation C und die Energie E über eine Leitung 118'' an die Durchsuchungseinheit 131 für ein festes Codebuch der Sprachqualitätsverbesserungsschicht 130 und durchsucht das feste Codebuch unter Verwendung der erfassten Korrelation C und der Energie E. Wenn ein Index und ein Verstärkungswert des festen Codebuchs durch die Durchsuchung des festen Codebuchs ermittelt ist, überträgt die Durchsuchungseinheit 117 für ein festes Codebuch den Index des festen Codebuchs an das feste Codebuch 119 und den Multiplizierer 140 und überträgt den Verstärkungswert an die Verstärkungswertquantisierungseinrichtung 129.
  • Das feste Codebuch 119 gibt einen festen Codebuchvektor der Basisschicht 100 unter Verwendung des übertragenen Index über eine Leitung 118 aus. Der vom festen Codebuch 119 ausgegebene feste Codebuchvektor wird über eine Leitung 120 dem ersten Multiplizierer 121 zugeführt.
  • Der erste Multiplizierer 121 multipliziert einen quantisierten Verstärkungswert Gc entsprechend dem Verstärkungswert des festen Codebuchs, der von der Verstärkungswertquantisierungseinrichtung 139 zugeführt ist, mit dem festen Codebuchvektor und gibt das Ergebnis über eine Leitung 122 aus. Der quantisierte Verstärkungswert Gc wird von der Verstärkungswertquantisierungseinrichtung 129 zugeführt.
  • Wenn der Index des adaptiven Codebuchs über die Leitung 113 eingegeben wird, gibt das adaptive Codebuch 124 Impulspositionsinformation und Vorzeicheninformation entsprechend dem Index des adaptiven Codebuchs aus. Der über eine Leitung 125 ausgegebene adaptive Codebuchvektor wird dem zweiten Multiplizierer 126 zugeführt.
  • Der zweite Multiplizierer 126 multipliziert einen quantisierten Verstärkungswert Gp entsprechend dem Verstärkungswert des adaptiven Codebuchs mit dem über die Leitung 125 übertragenen adaptiven Codebuchvektor und gibt das Ergebnis über eine Leitung 127 aus. Das über die Leitung 127 ausgegebene Signal ist ein durch Multiplizieren des adaptiven Codebuchvektors mit dem quantisierten Verstärkungswert Gp erhaltenes Signal. Der quantisierte Verstärkungswert Gp wird von der Verstärkungswertquantisierungseinrichtung 129 zugeführt.
  • Der Addierer 123 addiert das durch Multiplizieren des festen Codebuchvektors mit dem über die Leitung 122 eingegebenen quantisierten Verstärkungswert Gc erhaltene Signal zum durch Multiplizieren des adaptiven Codebuchvektors mit dem über die Leitung 127 eingegebenen quantisierten Verstärkungswert Gp erhaltenen Signal, so dass das Anregungssignal erhalten wird. Das Anregungssignal wird über die Leitung 128 zum Synthesefilter 106 ausgegeben.
  • Die Verstärkungswertquantisierungseinrichtung 129 quantisiert den Verstärkungswert des festen Codebuchs, der von der Durchsuchungseinheit 117 für ein festes Codebuch ausgegeben ist, und den Verstärkungswert des adaptiven Codebuchs, der von der Tonanalyseeinheit 112 ausgegeben ist. Der quantisierte Verstärkungswert Gc des festen Codebuchs wird an den ersten Multiplizierer 121 gegeben und der quantisierte Verstärkungswert Gp des adaptiven Codebuchs wird an den zweiten Multiplizierer 126 gegeben. Der quantisierte Verstärkungswert Gc wird auch an eine Verstärkungsdifferenzquantisierungseinrichtung 134 in der Sprachqualitätsverbesserungsschicht 130 gegeben.
  • Die Sprachqualitätsverbesserungsschicht 130 stellt zusätzliche Bits zu den von der Basisschicht 100 bereitgestellten Bits bereit, um die Qualität der wiederhergestellten Sprache zu verbessern. Wenn zum Beispiel die Basisschicht 100 eine Bitrate von 8 kbps ergibt, kann die Sprachqualitätsverbesserungsschicht 130 eine zusätzliche Bitrate von 4 kbps bereitstellen. Obwohl mit Bezug zu 1 zum Zwecke der bequemeren Beschreibung nur eine Sprachqualitätsverbesserungsschicht 130 mit der Basisschicht 100 verbunden ist, kann eine Mehrzahl von Sprachqualitätsverbesserungsschichten mit der Basisschicht 100 verbunden sein.
  • Die Sprachqualitätsverbesserungsschicht 130 weist die Durchsuchungseinheit 131 für ein festes Codebuch und die Verstärkungsdifferenzquantisierungseinrichtung 134 auf.
  • Die Durchsuchungseinheit 131 für ein festes Codebuch durchsucht ein festes Codebuch unter Verwendung der über die Leitung 118' zugeführten Impulsantwort h(n), der Korrelation d(n) zwischen dem Zielsignal und der Impulsantwort h(n), wobei die Korrelation C der Betragsinformation von d(n) entspricht, die unter Verwendung des Vorzeichens jedes Impulses erfasst ist und der Korrelation d(n) und der Energie E der Impulsantwort h(n).
  • Auf diese Weise führt die Durchsuchungseinheit 131 für ein festes Codebuch die Durchsuchung des festen Codebuchs für das selbe Zielsignal durch wie das von der Durchsuchungseinheit 117 für ein festes Codebuch gesuchte Zielsignal. Die Durchsuchungseinheit 131 für ein festes Codebuch verwendet ein algebraisches Codebuch. Die Durchsuchungseinheit 131 für ein festes Codebuch sucht einen Vektor ck, der ein mittleres Fehlerquadrat (MSE, Mean Square Error) des Zielsignals (oder Zielvektors) minimiert und einen in Gleichung 8 ausgedrückten Wert maximiert. Der gesuchte Vektor ck wird der feste Codebuchvektor.
    Figure 00150001
    wobei Φ eine Korrelation zwischen Impulsantworten h(n) darstellt. Die Werte von d(n) und Φ werden von der Basisschicht 100 bereitgestellt. Speziell wird der Wert Φ von der Durchsuchungseinheit 117 für ein festes Codebuch zugeführt. Dementsprechend reduziert die Durchsuchungseinheit 131 für ein festes Codebuch der Sprachqualitätsverbesserungsschicht die Anzahl an erforderlichen Berechnungen für die Durchsuchung des festen Codebuchs.
  • Wenn angenommen wird, dass ein Grad des festen Codebuchvektors der Basisschicht 100 40 beträgt und die Basisschicht 100 und die Sprachqualitätsverbesserungsschicht 130 jeweils vier Impulse ungleich null suchen, sucht die Durchsuchungseinheit 117 für ein festes Codebuch der Basisschicht 100 vier Impulse und dann sucht die Durchsuchungseinheit 131 für ein festes Codebuch der Sprachqualitätsverbesserungsschicht 130 vier Impulse. Dementsprechend berücksichtigt die Durchsuchungseinheit 131 für ein festes Codebuch den Einfluss der in der Basisschicht 100 gesuchten vier Impulse. Daher ist eine Korrelation C', die von der Durchsuchungseinheit 131 für ein festes Codebuch ermittelt ist, definiert als
    Figure 00160001
    und Energie E' ist definiert als
  • Figure 00160002
  • Unter Verwendung der in Gleichung 4 definierten Korrelation C kann Gleichung 9 umgeformt werden zu C' = C + |d(m4)| + |d(m5)| + |d(m6)| + |d(m7)| (11)
  • Zur Verringerung der Komplexität der Durchsuchung mit der Durchsuchungseinheit 131 für ein festes Codebuch kann die Durchsuchungseinheit 131 für ein festes Codebuch die Energie E' durch neu definierte Berechnung erfassen E'/2 = Φ'(m0, m0) + Φ'(m1, m1) + Φ'(m0, m1) + Φ'(m2, m2) + Φ'(m0, m2) + Φ'(m1, m2) + Φ'(m3, m3) + Φ'(m0, m3) + Φ'(m1, m3) + Φ'(m2, m3) + Φ'(m4, m4) + Φ'(m0, m4) + Φ'(m1, m4) + Φ'(m2, m4) + Φ'(m3, m4) + Φ'(m5, m5) + Φ'(m0, m5) + Φ'(m1, m5) + Φ'(m2, m5) + Φ'(m3, m5) + Φ'(m4, m5) + Φ'(m6, m6) + Φ'(m0, m6) + Φ'(m1, m6) + Φ'(m2, m6) + Φ'(m3, m6) + Φ'(m4, m6) + Φ'(m5, m6) + Φ'(m7, m7) + Φ'(m0, m7) + Φ'(m1, m7) + Φ'(m2, m7) + Φ'(m3, m7) + Φ'(m4, m7) + Φ'(m5, m7) + Φ'(m6, m7) (12)
  • Gleichung 12 kann unter Verwendung der wie in Gleichung 7 definieren Energie E als Gleichung (13) neu definiert werden. E'/2 = E/2 + Φ'(m4, m4) + Φ'(m0, m4) + Φ'(m1, m4) + Φ'(m2, m4) + Φ'(m3, m4) + Φ'(m5, m5) + Φ'(m0, m5) + Φ'(m1, m5) + Φ'(m2, m5) + Φ'(m3, m5) + Φ'(m4, m5) + Φ'(m6, m6) + Φ'(m0, m6) + Φ'(m1, m6) + Φ'(m2, m6) + Φ'(m3, m6) + Φ'(m4, m6) + Φ'(m5, m6) + Φ'(m7, m7) + Φ'(m0, m7) + Φ'(m1, m7) + Φ'(m2, m7) + Φ'(m3, m7) + Φ'(m4, m7) + Φ'(m5, m7) + Φ'(m6, m7) (13)
  • Die Korrelation C' und die Energie E' werden vor der Durchsuchung des festen Codebuchs von der Sprachqualitätsverbesserungsschicht 130 gespeichert und vereinfachen die Suche im festen Codebuch.
  • Ein von der Durchsuchungseinheit 131 für ein festes Codebuch durchgeführter Prozess, um Impulsvorzeicheninformation und Positionsinfor mation der Sprachqualitätsverbesserungsschicht 130 unter Verwendung der Korrelation C' und der Energie E' zu ermitteln, wird auf die selbe Weise ausgeführt wie sie von der Durchsuchungseinheit 117 für ein festes Codebuch für die Basisschicht 100 durchgeführt wird. Hier können die von der Basisschicht 100 gesuchte Impulspositionsinformation und die von der Sprachqualitätsverbesserungsschicht 130 gesuchte Impulspositionsinformation gleich sein.
  • 2 ist ein Diagramm zur Erläuterung einer Impulsposition, die von der Durchsuchungseinheit 117 für ein festes Codebuch gesucht wird, und einer Impulsposition, die von einer Durchsuchungseinheit 131 für ein festes Codebuch in der bitraten-skalierbaren Sprachkodiervorrichtung von 1 gesucht wird.
  • Mit Bezug zu 2 kann eine durch eine Durchsuchung 201 eines festen Codebuchs gesuchte Impulsposition der Basisschicht gleich einer Impulsposition sein, die durch die Durchsuchung 202 eines festen Codebuchs der Sprachqualitätsverbesserungsschicht gesucht wird. Dementsprechend weist ein endgültiger fester Codebuchimpuls einen mehrfachen Betrag auf, mit dem Umfang der festen Codebuchimpulse der Basisschicht 100 und der Sprachqualitätsverbesserungsschicht 130. Daher weist ein Impuls im algebraischen Codebuch nicht nur +1 oder –1 auf.
  • Die Durchsuchungseinheit 131 für ein festes Codebuch gibt den durch die Durchsuchung ermittelten Codebuchvektor an den Multiplizierer 140 und gibt einen Verstärkungswert des festen Codebuchs an die Verstärkungsdifferenzquantisierungseinrichtung 134. Der Index des festen Codebuchs in der Sprachqualitätsverbesserungsschicht 130 kann Impulsvorzeicheninformation und Impulspositionsinformation beinhalten.
  • Da der von der Sprachqualitätsverbesserungsschicht 130 gesuchte Index des festen Codebuchs nicht für einen nächsten Rahmen gespeichert wird, beeinflusst er die Funktion der Basisschicht 100 nicht.
  • Die Verstärkungsdifferenzquantisierungseinrichtung 134 bestimmt eine Differenz zwischen dem Verstärkungswert 132 des festen Codebuchs, der durch die Durchsuchungseinheit 131 für ein festes Codebuch ermittelt ist, und dem quantisierten Verstärkungswert Gc des festen Codebuchs, der in der Basisschicht 100 ermittelt ist, und quantisiert die Differenz. Dementsprechend kann, da über eine Leitung 135 Verstärkungsdifferenzquantisierungsinformation Gdiff von der Verstärkungsdifferenzquantisierungseinrichtung 134 zum Multiplizierer 140 übertragen wird, die Sprachqualitätsverbesserungsschicht 130 dem Verstärkungswert des festen Codebuchs zugewiesene Quantisierungsbits reduzieren.
  • Der Multiplizierer 140 multipliziert die LPC-Koeffizientenquantisierungsinformation, den Index des festen Codebuchs, den Index des adaptiven Codebuchs und die Verstärkungswertquantisierungsinformation, die von der Basisschicht zugeführt werden, und den Index des festen Codebuchs und die Verstärkungsdifferenzquantisierungsinformation, die von der Sprachqualitätsverbesserungsschicht zugeführt werden, um Bitströme zu erhalten.
  • Die Bitströme der Basisschicht 100 und der Sprachqualitätsverbesserungsschicht 130 werden getrennt übertragen. Das heißt, der Bitstrom der Sprachqualitätsverbesserungsschicht 130 wird nachfolgend zum Bitstrom der Basisschicht 100 übertragen, wie in 1 gezeigt. Dementsprechend können die Bitströme bei einer für eine Dekodiervorrichtung notwendigen Bitrate gemäß den Netzwerkverkehrsbedingungen leicht getrennt werden. Zum Beispiel kann im Fall, wo Kanalcharakteristiken der Dekodiervorrichtung so schlecht sind, dass sie nur den Bitstrom der Basisschicht empfangen kann, die Dekodiervorrichtung nur den Bitstrom der Basisschicht von den durch die bitraten-skalierbare Sprachkodiervorrichtung übertragenen Bitströmen empfangen, wie in 1 gezeigt.
  • 3 ist ein Blockdiagramm einer bitraten-skalierbaren Sprachdekodiervorrichtung gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung.
  • Mit Bezug zu 3 weist die Dekodiervorrichtung einen Demultiplexer 301, eine LPC-Koeffizientendekodiereinheit 302, eine Verstärkungswertdekodiereinheit 303, eine erste Dekodiereinheit 304 für ein festes Codebuch, eine Dekodiereinheit 305 für ein adaptives Codebuch, eine Verstärkungsdifferenzdekodiereinheit 306, eine zweite Dekodiereinheit 307 für ein festes Codebuch, einen ersten Addierer 308, einen zweiten Addierer 309, einen ersten Selektorschalter 310, einen zweiten Selektorschalter 311, einen ersten Multiplizierer 312, einen zweiten Multiplizierer 313, einen dritten Addierer 314, einen Synthesefilter 315 und eine Nachbearbeitungseinheit 316 auf.
  • Die bitraten-skalierbare Sprachdekodiervorrichtung kann selektiv einen Bitstrom empfangen, der von der bitraten-skalierbare Sprachkodiervorrichtung übertragen wird. Das heißt, wenn die bitraten-skalierbare Sprachdekodiervorrichtung nur den Bitstrom der Basisschicht empfängt, kann sie Sprachqualität der Basisschicht wiederherstellen. Wenn die bitraten-skalierbaren Sprachdekodiervorrichtung sowohl den Bitstrom der Basisschicht wie den der Sprachqualitätsverbesserungsschicht empfängt, kann sie verbesserte Sprachqualität bereitstellen.
  • Der Demultiplexer 301 demultiplext den empfangenen Bitstrom in Information für jeden Modul und gibt den demultiplexten Bitstrom aus. Das heißt, der Demultiplexer 301 gibt LPC-Koeffizientenquantisierungsinformation an die LPC-Koeffizientendekodiereinheit 302, Verstärkungswert quantisierungsinformation an die Verstärkungswertdekodiereinheit 303, Verstärkungsdifferenzquantisierungsinformation an die Verstärkungsdifferenzdekodiereinheit 306, einen Index des festen Codebuchs der Sprachqualitätsverbesserungsschicht an die zweite Dekodiereinheit 307 für ein festes Codebuch, einen Index des festen Codebuchs an die erste Dekodiereinheit 304 für ein festes Codebuch und einen Index des adaptiven Codebuchs der Basisschicht an die Dekodiereinheit 305 für ein adaptives Codebuch.
  • Die Struktur der LPC-Koeffizientendekodiereinheit 302 wird durch den LPC-Koeffizientenextraktor und die Vektorquantisierungseinrichtung 104 der Kodiervorrichtung bestimmt. Die LPC-Koeffizientendekodiereinheit 302 stellt einen LPC-Koefizienten aus der eingegebenen LPC-Koeffizientenquantisierungsinformation wieder her und gibt den wiederhergestellten LPC-Koeffizienten an den Synthesefilter 315 und die Nachbearbeitungseinheit 316.
  • Die Struktur der Verstärkungswertdekodiereinheit 303 wird durch die Verstärkungswertquantisierungseinrichtung 129 der Kodiervorrichtung bestimmt. Die Verstärkungswertdekodiereinheit 303 dekodiert die eingegebene Verstärkungswertquantisierungsinformation, die einen Verstärkungswert des adaptiven Codebuchs und einen Verstärkungswert des festen Codebuchs beinhaltet. Dementsprechend werden ein Verstärkungswert gp des adaptiven Codebuchs und ein Verstärkungswert gc des festen Codebuchs in der Basisschicht 100 von der Verstärkungswertdekodiereinheit 303 ausgegeben.
  • Die erste Dekodiereinheit 304 für ein festes Codebuch dekodiert den eingegebenen Index des festen Codebuchs der Basisschicht 100 und gibt das feste Codebuch der Basisschicht 100 aus. Das Dekodierverfahren des festen Codebuchs wird durch das Durchsuchungsverfahren der Durchsuchungseinheit 117 für ein festes Codebuch der Kodiervorrich tung bestimmt. Die Dekodiereinheit 305 für ein adaptives Codebuch dekodiert den eingegebenen Index für ein adaptives Codebuch und gibt ein adaptives Codebuch der Basisschicht 100 aus.
  • Die LPC-Koeffizientendekodiereinheit 302, die Verstärkungswertdekodiereinheit 303, die erste Dekodiereinheit 304 für ein festes Codebuch und die Dekodiereinheit 305 für ein adaptives Codebuch können als erste Dekodiereinheiten definiert sein, die Kodierinformation der Basisschicht 100 kodieren, die vom Demultiplexer 301 übertragen ist.
  • Die Funktionen der Verstärkungsdifferenzdekodiereinheit 306 und der zweiten Dekodiereinheit 307 für ein festes Codebuch hängen von den Netzwerkverkehrsbedingungen oder der Verarbeitungskapazität eines Empfangsterminals ab.
  • Wenn bestimmt ist, dass die Verstärkungsdifferenzdekodiereinheit 306 und die zweite Dekodiereinheit 307 für ein festes Codebuch in Aktion treten sollen, dekodiert die Verstärkungsdifferenzdekodiereinheit 306 die eingegebene Verstärkungsdifferenzquantisierungsinformation und die zweite Dekodiereinheit 307 für ein festes Codebuch dekodiert den eingegebenen Index des festen Codebuchs der Sprachqualitätsverbesserungsschicht. Das Verstärkungsdifferenzdekodierverfahren ist durch die Verstärkungsdifferenzquantisierungseinrichtung 134 der Kodiervorrichtung bestimmt und ein in der zweiten Dekodiereinheit 307 für ein festes Codebuch durchgeführtes Dekodierverfahren ist durch die zweite Durchsuchungseinheit 131 für ein festes Codebuch der Kodiervorrichtung bestimmt.
  • Die Verstärkungsdifferenzdekodiereinheit 306 und die zweite Dekodiereinheit 307 für ein festes Codebuch können als zweite Dekodiereinheiten betrachtet werden, die Kodierinformation der Sprachqualitätsverbes serungsschicht 130 dekodieren, die vom Demultiplexer 301 übertragen ist.
  • Der erste Addierer 308 addiert den von der Verstärkungswertdekodiereinheit 303 ausgegebenen dekodierten Verstärkungswert gc des festen Codebuchs zu einer von der Verstärkungsdifferenzdekodiereinheit 306 ausgegebenen dekodierten Verstärkungsdifferenz gdiff. Die Ausgabe des ersten Addierers 308 ist ein Verstärkungswert der Sprachqualitätsverbesserungsschicht, der durch den Dekodierprozess ermittelt ist.
  • Der zweite Addierer 309 addiert das dekodierte feste Codebuch der Sprachqualitätsverbesserungsschicht, das in der zweiten Dekodiereinheit 307 für ein festes Codebuch dekodiert ist, zum dekodierten festen Codebuch der Basisschicht, die in der ersten Dekodiereinheit 304 für ein festes Codebuch dekodiert ist. Dementsprechend kann ein vom zweiten Addierer 309 ausgegebenes Signal definiert sein als c''(n) = c(n) + c'(n) (14)wobei c(n) das feste Codebuch in der Basisschicht darstellt und c'(n) ein festes Codebuch in der Sprachqualitätsverbesserungsschicht darstellt.
  • Daher ein fester Codebuchimpuls der Dekodiervorrichtung, aufgrund einer Akkumulation der algebraischen Codebücher der Basisschicht und der Sprachqualitätsverbesserungsschicht eine mehrfache algebraische Codebuchimpulsstruktur auf. Akkumulieren der algebraischen Codebücher dient der Korrektur von Defekten, die auftreten, wenn alle Impulse denselben Umfang aufweisen. Daher weisen Impulse der akkumulierten algebraischen Codebücher Vorzeichen auf, die für Zielsignale geeignet sind.
  • Der erste Selektorschalter 310 überträgt selektiv den Verstärkungswert gc des festen Codebuchs, der in der Verstärkungswertdekodiereinheit 303 dekodiert ist, oder das Signal, das vom ersten Addierer 308 ausgegeben ist. Das heißt, wenn die Dekodiervorrichtung in der Basisschicht arbeitet, überträgt der erste Selektorschalter 310 den Verstärkungswert gc des festen Codebuchs, der von der Verstärkungswertdekodiereinheit 303 ausgegeben ist, und wenn die Dekodiervorrichtung in der Sprachqualitätsverbesserungsschicht arbeitet, überträgt der erste Selektorschalter 310 den Verstärkungswert, der vom ersten Addierer 308 ausgegeben ist.
  • Der zweite Selektorschalter 311 überträgt selektiv das vom zweiten Addierer 309 ausgegebene Signal oder das feste Codebuch der Basisschicht, das von der ersten Dekodiereinheit 304 für ein festes Codebuch ausgegeben ist. Das heißt, wenn die Dekodiervorrichtung nicht in der Sprachqualitätsverbesserungsschicht arbeitet, überträgt der zweite Selektorschalter 311 das von der ersten Dekodiereinheit 304 für ein festes Codebuch ausgegebene Signal. Wenn die Dekodiervorrichtung in der Sprachqualitätsverbesserungsschicht arbeitet, überträgt der zweite Selektorschalter 311 das vom zweiten Addierer 309 ausgegebene Signal.
  • Der erste Multiplizierer 312 multipliziert das feste Codebuch, das vom zweiten Selektorschalter 311 ausgegeben ist, mit dem Verstärkungswert, der vom ersten Selektorschalter 310 ausgegeben ist, und gibt das Ergebnis aus.
  • Der zweite Multiplizierer 313 multipliziert das dekodierte adaptive Codebuch, das von der Dekodiereinheit 305 für ein adaptives Codebuch ausgegeben ist, mit dem Verstärkungswert gp für ein adaptives Codebuch, der von der Verstärkungswertdekodiereinheit 303 ausgegeben ist, und gibt das Ergebnis aus.
  • Der dritte Addierer 314 addiert die feste Codebuchinformation, die vom ersten Multiplizierer 312 ausgegeben ist, zur adaptiven Codebuchinformation, die vom zweiten Multiplizierer 313 ausgegeben ist, und erzeugt ein wiederhergestelltes Anregungssignal.
  • Der erste bis dritte Addierer 308, 309 und 314, der erste und zweite Multiplizierer 312 und 313 und der erste und zweite Selektorschalter 310 und 311 können als Berechnungseinheiten definiert sein, die Signale berechnen, die entsprechend den Betriebsbedingungen der Dekodiervorrichtung jeweils in den ersten Dekodiereinheiten und den zweiten Dekodiereinheiten dekodiert sind.
  • Der Synthesefilter 315 synthetisiert das vom dritten Addierer 314 ausgegebene Anregungssignal unter Verwendung des von der LPC-Koeffizientendekodiereinheit 302 ausgegebenen dekodierten LPC-Koeffizienten, und stellt das Sprachsignal wieder her.
  • Die Nachbearbeitungseinheit 316 verbessert die Qualität des vom Synthesefilter 315 übertragenen Sprachsignals. Das heißt, zur Verbesserung der Qualität des Sprachsignals verwendet die Nachbearbeitungseinheit 316 einen Hochpassfilter, um das Signal zu filtern, das vom Synthesefilter 315 unter Verwendung des von der LPC-Koeffizientendekodiereinheit 302 ausgegebenen LPC-Koeffizienten ausgegeben ist.
  • Der Synthesefilter 315 und die Nachbearbeitungseinheit 316 können als Wiederherstellungseinheiten definiert sein, die durch Synthetisieren von Signalen, die von Berechnungseinheiten ausgegeben sind, mit dem von der LPC-Koeffizientendekodiereinheit 302 ausgegebenen LPC-Koeffizienten ein Sprachsignal wiederherstellen.
  • 4 ist ein Fließbild eines bitraten-skalierbaren Sprachkodierverfahrens gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung.
  • Beim Vorgang 401 vorverarbeitet die Vorrichtung zur Sprachsignalkodierung ein eingegebenes Sprachsignal wie in der in 1 gezeigten Vorverarbeitungseinheit 102. Beim Vorgang 402 extrahiert die Vorrichtung zur Sprachsignalkodierung den LPC-Koeffizienten aus dem vorverarbeiteten Sprachsignal und erzeugt Quantisierungsinformation des extrahierten LPC-Koeffizienten.
  • Beim Vorgang 403 synthetisiert die Vorrichtung zur Sprachsignalkodierung ein Anregungssignal unter Verwendung der erzeugten LPC-Koeffizientenquantisierungsinformation wie im Synthesefilter 106. Beim Vorgang 404 subtrahiert die Vorrichtung zur Sprachsignalkodierung das synthetisierte Signal aus dem vorverarbeiteten Signal, so dass ein LPC-Restsignal erfasst wird. Beim Vorgang 405 filtert die Vorrichtung zur Sprachsignalkodierung das erfasste LPC-Restsignal wie im Wahrnehmungsgewichtungsfilter 110 und gibt das wahrnehmungsgewichtete Signal aus.
  • Beim Vorgang 406 analysiert die Vorrichtung zur Sprachsignalkodierung eine Tonhöhe des wahrnehmungsgewichteten Signals wie in der Tonanalyseeinheit 112 von 1, so dass ein Index und ein Verstärkungswert des adaptiven Codebuchs erhalten werden. Die Vorrichtung zur Sprachsignalkodierung eliminiert einen Tonbeitrag aus dem wahrnehmungsgewichteten Signal unter Verwendung des Index des adaptiven Codebuchs wie in der Tonbeitragseliminierungseinheit 115 von 1, so dass ein Zielsignal erfasst wird, das für Durchsuchung des festen Codebuchs notwendig ist.
  • Beim Vorgang 407 durchsucht die Vorrichtung zur Sprachsignalkodierung das feste Codebuch der Basisschicht, so dass ein Verstärkungswert des festen Codebuchs und ein Index des festen Codebuchs erhalten werden, wie in der ersten Durchsuchungseinheit 117 für ein festes Codebuch. Beim Vorgang 408 quantisiert die Vorrichtung zur Sprachsignalkodierung den erfassten Verstärkungswert des festen Codebuchs und den erfassten Verstärkungswert des adaptiven Codebuchs wie in der Verstärkungswertquantisierungseinrichtung 129.
  • Beim Vorgang 409 durchsucht die Vorrichtung zur Sprachsignalkodierung das feste Codebuch der Sprachqualitätsverbesserungsschicht unter Verwendung von Parametern, d. h. Korrelationen C und d(n) und Energie E der Basisschicht. Ein Verstärkungswert und ein Index des festen Codebuchs der Sprachqualitätsverbesserungsschicht werden jeweils bei Durchsuchung des festen Codebuchs der Sprachqualitätsverbesserungsschicht erzeugt.
  • Beim Vorgang 410 quantisiert die Vorrichtung zur Sprachsignalkodierung eine Differenz zwischen dem Verstärkungswert des festen Codebuchs in der Basisschicht und dem Verstärkungswert des festen Codebuchs in der Sprachqualitätsverbesserungsschicht. Die Durchsuchung des festen Codebuchs und die Verstärkungswertquantisierung in der Sprachqualitätsverbesserungsschicht können in mehreren Schichten durchgeführt werden, wie es mit Bezug zu 1 beschrieben ist. Wenn die Durchsuchung des festen Codebuchs und die Verstärkungswertquantisierung in der Sprachqualitätsverbesserungsschicht mehrschichtig durchgeführt werden, kann die Qualität der wiederhergestellten Sprachsignale weiter verbessert werden.
  • Beim Vorgang 411 multipliziert die Vorrichtung zur Sprachsignalkodierung die LPC-Koeffizientenquantisierungsinformation, den Index des festen Codebuchs in der Basisschicht, den Index des adaptiven Code buchs in der Basisschicht, den Verstärkungswert des festen Codebuchs in der Basisschicht, Verstärkungswert des adaptiven Codebuchs in der Basisschicht, den Index des festen Codebuchs in der Sprachqualitätsverbesserungsschicht und die Verstärkungsdifferenzquantisierungsinformation in Bitströme und sendet die Bitströme zur Vorrichtung zur Sprachsignaldekodierung.
  • 5 ist ein Fließbild eines bitraten-skalierbaren Sprachdekodierverfahrens gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung.
  • Beim Vorgang 501 demultiplext die Vorrichtung zur Sprachsignaldekodierung den Bitstrom in Komponenteninformation wie der in 3 gezeigte Demultiplexer 301.
  • Beim Vorgang 502 dekodiert die Vorrichtung zur Sprachsignaldekodierung das demultiplexte Signal. Das heißt, die Vorrichtung zur Sprachsignaldekodierung dekodiert das demultiplexte Signal wie in der LPC-Koeffizientendekodiereinheit 302, der Verstärkungswertdekodiereinheit 303, der ersten Dekodiereinheit 304 für ein festes Codebuch, der Dekodiereinheit 305 für ein adaptives Codebuch, der Verstärkungsdifferenzdekodiereinheit 306 und der zweiten Dekodiereinheit 307 für ein festes Codebuch der Sprachqualitätsverbesserungsschicht.
  • Beim Vorgang 503 stellt die Vorrichtung zur Sprachsignaldekodierung den Verstärkungswert des festen Codebuchs in der Sprachqualitätsverbesserungsschicht wieder her, indem eine bestimmte Berechnung durchgeführt wird. Die Vorrichtung zur Sprachsignaldekodierung addiert den dekodierten Verstärkungswert des festen Codebuchs zum Verstärkungsdifferenzwert, der als Quantisierungsinformation des Verstärkungswerts des festen Codebuchs in der Sprachqualitätsverbesserungsschicht empfangen ist, so dass der Verstärkungswert des festen Codebuchs der Sprachqualitätsverbesserungsschicht wiederhergestellt wird.
  • Beim Vorgang 504 überträgt die Vorrichtung zur Sprachsignaldekodierung selektiv das feste Codebuch der Sprachqualitätsverbesserungsschicht oder das feste Codebuch der Basisschicht und überträgt auch selektiv den Verstärkungswert, entsprechend den Betriebsbedingungen der Vorrichtung zur Sprachsignaldekodierung. Das heißt, wenn die Vorrichtung zur Sprachsignaldekodierung in der Sprachqualitätsverbesserungsschicht arbeitet, überträgt die Vorrichtung zur Sprachsignaldekodierung das feste Codebuch der Sprachqualitätsverbesserungsschicht, das mit dem wiederhergestellten Verstärkungswert des festen Codebuchs in der Sprachqualitätsverbesserungsschicht multipliziert ist. Wenn die Vorrichtung zur Sprachsignaldekodierung nicht in der Sprachqualitätsverbesserungsschicht arbeitet, überträgt die Vorrichtung zur Sprachsignaldekodierung das feste Codebuch, das aus einer Multiplikation des dekodierten festen Codebuchs der Basisschicht mit dem Verstärkungswert des festen Codebuchs in der Basisschicht resultiert.
  • Beim Vorgang 505 synthetisiert die Vorrichtung zur Sprachsignaldekodierung das in Vorgang 504 selektiv übertragene Codebuch unter Verwendung des in Vorgang 502 dekodierten LPC-Koeffizienten.
  • Beim Vorgang 506 führt die Vorrichtung zur Sprachsignaldekodierung Nachbearbeitung durch, so dass ein wiederhergestelltes Sprachsignal wie in der Nachbearbeitungseinheit 316 erzeugt wird.
  • 6 ist ein Blockdiagramm einer bitraten-skalierbaren Sprachkodiervorrichtung gemäß einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung. Mit Bezug zu 6 weist die bitraten-skalierbare Sprachkodiervorrichtung eine mehrschichtige feste Codebuch struktur mit einer Basisschicht 600 und einer Sprachqualitätsverbesserungsschicht 630 auf.
  • Die Basisschicht 600 erzeugt Kodierinformation zum Wiederherstellen der geringsten Sprachqualität. Die Basisschicht 600 ist in der Konfiguration ähnlich wie der vorhandene CELP-Standardsprachcodec. Dementsprechend filtert die Basisschicht 600 ein Eingangssprachsignal unter Verwendung von Linearvorhersagekodierung und erzeugt ein Anregungssignal entsprechend dem eingegebenen Sprachsignal. Das Anregungssignal wird bei Durchsuchung des festen Codebuchs und Durchsuchung des adaptiven Codebuchs erzeugt.
  • Die Basisschicht 600 beinhaltet eine Vorverarbeitungseinheit 602, einen LPC-Koeffizientenextraktor und eine Vektorquantisierungseinrichtung 604, einen Synthesefilter 606, einen Subtraktor 608, einen Wahrnehmungsgewichtungsfilter 610, eine Tonanalyseeinheit 612, eine Tonbeitragseliminierungseinheit 615, eine Durchsuchungseinheit 617 für ein festes Codebuch, ein festes Codebuch 619, einen ersten Multiplizierer 621, einen Addierer 623, ein adaptives Codebuch 624, einen zweiten Multiplizierer 626 und eine Verstärkungswertquantisierungseinrichtung 629.
  • Die Vorverarbeitungseinheit 602 eliminiert eine DC-Komponente aus dem über eine Leitung 601 eingegebenen Sprachsignal. Das heißt, die Vorverarbeitungseinheit 602 filtert das eingegebene Sprachsignal unter Verwendung eines Hochpassfilters, so dass eine Rauschkomponente eines Niederfrequenzbands des Eingangssprachsignals eliminiert wird. Der verwendete Hochpassfilter ist der selbe wie der Hochpassfilter, der von der Vorverarbeitungseinheit 102 der Basisschicht 100 verwendet ist, wie in 1 dargestellt. Ein von der Vorverarbeitungseinheit 602 ausgegebenes Signal wird zum LPC-Koeffizientenextraktor und der Vektorquantisierungseinrichtung 604 über eine Leitung 603 übertragen.
  • Der LPC-Koeffizientenextraktor und die Vektorquantisierungseinrichtung 604 extrahieren einen LPC-Koeffizienten aus dem von der Vorverarbeitungseinheit 602 ausgegebenen Signal. Der extrahierte LPC-Koeffizient wird im LPC-Koeffizientenextraktor und der Vektorquantisierungseinrichtung 604 vektorquantisiert. Vektorquantisierungsinformation des LPC-Koeffizienten wird über eine Leitung 605 zum Synthesefilter 606 und einem Multiplizierer 650 übertragen.
  • Der Synthesefilter 606 gibt ein synthetisiertes Signal aus, das einem über eine Leitung 628 eingegebenen Anregungssignal entspricht, unter Verwendung von Vektorquantisierungsinformation des LPC-Koeffizienten. Das synthetisierte Signal wird über eine Leitung 607 zum Subtraktor 608 gegeben.
  • Der Subtraktor 608 subtrahiert das über die Leitung 607 eingegebene synthetisierte Signal von dem über die Leitung 603 eingegebenen Signal, das von der Vorverarbeitungseinheit 602 ausgegeben ist, so dass ein LPC-Restsignal erzeugt wird. Das LPC-Restsignal wird über eine Leitung 609 zum Wahrnehmungsgewichtungsfilter 610 übertragen.
  • Der Wahrnehmungsgewichtungsfilter 610 hält ein Quantisierungsrauschen unter einem Maskierungsschwellenwert, so dass ein Maskierungseffekt des menschlichen Hörorgans genutzt wird. Daher gibt der Wahrnehmungsgewichtungsfilter 610 ein Signal, das ein Gewicht zum Minimieren eines Quantisierungsrauschens des LPC-Restsignals enthält, an die Tonanalyseeinheit 612 aus.
  • Die Tonanalyseeinheit 612 sucht einen Open-Loop-Pitch und einen Closed-Loop-Pitch des vom Wahrnehmungsgewichtungsfilter 610 ausgegebenen Signals. Das heißt, die Tonanalyseeinheit 612 unterteilt das vom Wahrnehmungsgewichtungsfilter 610 ausgegebene Signal in eine Mehr zahl von Unterrahmen, analysiert eine Tonhöhe jedes Unterrahmens in der selben Weise wie in der Sprachkodiervorrichtung nach dem CELP-Standard, und gibt einen Index und einen Verstärkungswert des adaptiven Codebuchs aus.
  • Der Index des adaptiven Codebuchs wird über eine Leitung 613 zur Tonbeitragseliminierungseinheit 615 und dem adaptiven Codebuch 624 übertragen, und über eine Leitung 614 zum Multiplizierer 650 übertragen. Ferner wird der Verstärkungswert des adaptiven Codebuchs der Verstärkungswertquantisierungseinrichtung 629 zugeführt.
  • Die Tonbeitragseliminierungseinheit 615 erfasst ein Zielsignal, das für Durchsuchung eines festen Codebuchs notwendig ist, aus dem vom Wahrnehmungsgewichtungsfilter 610 ausgegebenen Signal unter Verwendung des Index des adaptiven Codebuchs. Die Tonbeitragseliminierungseinheit 615 subtrahiert einen Tonbeitrag y1(n) von dem Signal, das vom Wahrnehmungsgewichtungsfilter 610 ausgegeben ist, und gibt das für die Durchsuchung des festen Codebuchs notwendige Zielsignal über eine Leitung 616 zur Durchsuchungseinheit 617 für ein festes Codebuch der Basisschicht 600. Der Tonbeitrag y1(n) wird durch Gleichung (2) ermittelt.
  • Die Durchsuchungseinheit 617 für ein festes Codebuch ermittelt eine Korrelation d(n) zwischen dem Zielsignal und einer Impulsantwort h(n) unter Verwendung des über die Leitung 611 eingegebenen Zielsignals x'(n).
  • Wenn zum Beispiel angenommen ist, dass der Umfang eines Unterrahmens 40 Abtastungen umfasst, und die Anzahl an Impulsen jeder Schicht 4 beträgt, kann die Korrelation d(n) wie in Gleichung 1 definiert werden.
  • Die Durchsuchungseinheit 617 für ein festes Codebuch durchsucht ein festes Codebuch mit einer algebriaschen Codebuchstruktur wie in Tabelle 1 gezeigt, unter Verwendung der Impulsantwort h(n) und der Korrelation d(n). Mit Bezug zu Tabelle 1 ist der Betrag eines Impulses eines festen Codebuchvektors in der Durchsuchungseinheit 617 für ein festes Codebuch in nur vier Positionen ungleich null. Dementsprechend kann eine Korrelation C, die dem Umfang der Korrelation d(n) entspricht, durch Gleichung (2) unter Verwendung eines Vorzeichens s für jeden Impuls und der Korrelation d(n) definiert werden. Die Durchsuchungseinheit 617 für ein festes Codebuch erfasst die Korrelation C unter Verwendung von Gleichung (2). Die Durchsuchungseinheit 617 für ein festes Codebuch erfasst die Energie E der Impulsantwort unter Verwendung von Gleichung (3).
  • Die Durchsuchungseinheit 617 für ein festes Codebuch speichert die Korrelation C und die Energie E. Insbesondere teilt die Durchsuchungseinheit 617 für ein festes Codebuch die Korrelation C in ein Vorzeichen sign [d(i)] und ihren Absolutwert und speichert sie. Das sign[d(i)] ist ein Vorzeichen von d(i). Die Energie E wird wie in Gleichung (4) gespeichert. Gleichung (3) für die Energie E kann in Gleichung (5) umgeformt werden.
  • Wenn ein Index und ein Verstärkungswert des festen Codebuchs bei der Durchsuchung ermittelt werden, überträgt die Durchsuchungseinheit 617 für ein festes Codebuch den Index des festen Codebuchs zum festen Codebuch 619 und dem Multiplizierer 650, und überträgt den Verstärkungswert an die Verstärkungswertquantisierungseinrichtung 629.
  • Das feste Codebuch 619 gibt einen festen Codebuchvektor der Basisschicht 600 inter Verwendung des über eine Leitung 618 eingegebenen Index aus. Der feste Codebuchvektor beinhaltet im Grund Impulspositionsinformation m und Vorzeicheninformation s. Der vom festen Code buch 619 ausgegebene feste Codebuchvektor wird über eine Leitung 620 dem ersten Multiplizierer 621 zugeführt.
  • Der erste Multiplizierer 621 multipliziert einen quantisierten Verstärkungswert Gc entsprechend dem Verstärkungswert des festen Codebuchs, der von der Verstärkungswertquantisierungseinrichtung 629 zugeführt ist, mit dem festen Codebuchvektor und gibt das Ergebnis über eine Leitung 622 aus. Das über die Leitung 622 ausgegebene Signal kann als festes Codebuch cG(n) definiert sein, das durch Multiplizieren des quantisierten Verstärkungswerts Gc mit dem festen Codebuchvektor der Basisschicht 600 erhalten ist. Der quantisierte Verstärkungswert Gc wird von der Verstärkungswertquantisierungseinrichtung 629 zugeführt.
  • Wenn der Index des adaptiven Codebuchs über die Leitung 613 aufgegeben wird, gibt das adaptive Codebuch 624 einen adaptiven Codebuchvektor aus, der dem Index des adaptiven Codebuchs entspricht. Der adaptive Codebuchvektor wird über eine Leitung 625 dem zweiten Multiplizierer 626 zugeführt.
  • Der zweite Multiplizierer 626 multipliziert einen quantisierten Verstärkungswert Gp entsprechend dem Verstärkungswert des adaptiven Codebuchs mit dem über die Leitung 625 zugeführten adaptiven Codebuchvektor und gibt das Ergebnis über eine Leitung 627 aus. Der quantisierte Verstärkungswert Gp wird von der Verstärkungswertquantisierungseinrichtung 629 zugeführt.
  • Der Addierer 623 addiert den über die Leitung 622 eingegebenen festen Codebuchvektor zum über die Leitung 627 eingegebenen adaptiven Codebuchvektor und erhält ein Anregungssignal. Das Anregungssignal wird über die Leitung 628 zum Synthesefilter 606 gegeben.
  • Die Verstärkungswertquantisierungseinrichtung 629 quantisiert den Verstärkungswert des festen Codebuchs, der von der Durchsuchungseinheit 617 für ein festes Codebuch ausgegeben ist, und den Verstärkungswert des adaptiven Codebuchs, der von der Tonanalyseeinheit 612 ausgegeben ist. Der quantisierte Verstärkungswert Gc entsprechend dem Verstärkungswert des festen Codebuchs wird an den ersten Multiplizierer 621 gegeben, und der quantisierte Verstärkungswert Gp entsprechend dem Verstärkungswert des adaptiven Codebuchs wird an den zweiten Multiplizierer 626 gegeben. Der quantisierte Verstärkungswert Gc wird auch an eine Verstärkungsdifferenzquantisierungseinrichtung 643 in der Sprachqualitätsverbesserungsschicht 630 gegeben.
  • Die Sprachqualitätsverbesserungsschicht 630 stellt zusätzliche Bits zu den von der Basisschicht 600 bereitgestellten Bits bereit, um die Qualität der wiederhergestellten Sprache zu verbessern, wie die in 1 gezeigte Sprachqualitätsverbesserungsschicht 130. Obwohl zur Bequemlichkeit der Beschreibung 6 zeigt, dass eine Sprachqualitätsverbesserungsschicht 630 mit der Basisschicht 600 verbunden ist, können eine Mehrzahl von Sprachqualitätsverbesserungsschichten mit der Basisschicht 600 verbunden sein.
  • Die Sprachqualitätsverbesserungsschicht 630 weist eine Beitragsberechnungseinheit 631 für ein festes Codebuch, einen dritten Addierer 633, einen Synthesefilter 634, einen Wahrnehmungsgewichtungsfilter 637, eine Durchsuchungseinheit 639 für ein festes Codebuch, ein festes Codebuch 641, eine Verstärkungsdifferenzquantisierungseinrichtung 643 und einen dritten Multiplizierer 644 auf.
  • Wenn die Beitragsberechnungseinheit 631 für ein festes Codebuch das feste Codebuch cG(n) empfängt, das durch Multiplizieren des quantisierten Verstärkungswerts Gc mit dem festen Codebuchvektor, der vom ersten Multiplizierer 621 der Basisschicht 600 ausgegeben ist, ermittelt ist, berechnet die Beitragsberechnungseinheit 631 für ein festes Codebuch einen Beitrag y2(n)des festen Codebuchs unter Verwendung der Gleichung (15)
    Figure 00360001
    wobei N in Abhängigkeit von der Anzahl an Abtastungen bestimmt ist, die jeden Unterrahmen bilden. Dementsprechend ist N gleich 40, wenn der Umfang des Unterrahmens 40 Abtastungen umfasst, wie es bei der Tonbeitragseliminierungseinheit 615 beschrieben ist. In Gleichung 15 stellt h(n) eine Impulsantwort des Synthesefilters dar. Der von der Beitragsberechnungseinheit 631 für ein festes Codebuch berechnete Beitrag des festen Codebuchs wird über eine Leitung 632 dem dritten Addierer 633 zugeführt.
  • Der dritte Addierer 633 gibt ein Signal aus, das durch Eliminieren des über die Leitung 632 zugeführten Beitrags des festen Codebuchs und eines synthetisierten Signals, das über eine Leitung 635 vom Synthesefilter 634 zugeführt ist, aus dem Zielsignal erhalten ist, das für die Durchsuchung des festen Codebuchs der Basisschicht 600 notwendig und über die Leitung 616 zugeführt ist.
  • Wenn der Synthesefilter 634 über eine Leitung 647 das feste Codebuch empfängt, das durch Multiplizieren eines festen Codebuchvektors mit einem quantisierten Verstärkungswert ĜCE der Sprachqualitätsverbesserungsschicht 630 erhalten ist, gibt der Synthesefilter 634 ein Signal aus, das durch Synthetisieren des eingegebenen festen Codebuchsignals unter Verwendung des vom LPC-Koeffizientenextraktor und der Vektorquantisierungseinrichtung 604 extrahierten und quantisierten LPC-Koeffizienten erhalten ist.
  • Der Wahrnehmungsgewichtungsfilter 637 filtert ein über eine Leitung 636 eingegebenes Signal und gibt ein Zielsignal aus, das für die Durchsuchung des festen Codebuchs in der Sprachqualitätsverbesserungsschicht 630 notwendig ist, wie der Wahrnehmungsgewichtungsfilter 610. Das Zielsignal wird über eine Leitung 638 der Durchsuchungseinheit 639 für ein festes Codebuch zugeführt.
  • Die Durchsuchungseinheit 639 für ein festes Codebuch durchsucht das feste Codebuch unter Verwendung des eingegebenen Zielsignals und erhält einen Index und einen Verstärkungswert des festen Codebuchs, wie die Durchsuchungseinheit 617 für ein festes Codebuch der Basisschicht 600. Der erhaltene Index des festen Codebuchs wird über eine Leitung 640 zum Multiplizierer 640 und zum festen Codebuch 641 übertragen. Der Verstärkungswert GCE des festen Codebuchs wird über eine Leitung 642 zur Verstärkungsdifferenzquantisierungseinrichtung 643 übertragen.
  • Das feste Codebuch 641 gibt unter Verwendung des eingegebenen Index des festen Codebuchs einen festen Codebuchvektor der Sprachqualitätsverbesserungsschicht 630 aus. Der feste Codebuchvektor kann Impulspositionsinformation m und Vorzeicheninformation s beinhalten. Der vom festen Codebuch 641 ausgegebene feste Codebuchvektor wird dem dritten Multiplizierer 644 zugeführt. Eine Impulsposition des vom festen Codebuch 619 ausgegebenen festen Codebuchvektors der Basisschicht 600 kann gleich einer Impulsposition des vom festen Codebuch 641 der Sprachqualitätsverbesserungsschicht 630 ausgegebenen festen Codebuchvektors sein.
  • Die Verstärkungsdifferenzquantisierungseinrichtung 643 quantisiert den Verstärkungswert GCE des festen Codebuchs der Sprachqualitätsverbesserungsschicht 630 unter Verwendung einer logarithmischen Diffe renz zwischen dem quantisierten Verstärkungswert GC, der dem Verstärkungswert des von der Verstärkungswertquantisierungseinrichtung 629 der Basisschicht 600 ausgegebenen festen Codebuchs entspricht, und den unquantisierten Verstärkungswert GCE des festen Codebuchs, der vom der Durchsuchungseinheit 639 für ein festes Codebuch der Sprachqualitätsverbesserungsschicht 630 ausgegeben ist, so dass ein quantisierter Verstärkungswert ĜCE erhalten wird, und gibt den quantisierten Verstärkungswert ĜCE aus.
  • 7 ist ein Blockdiagramm einer Ausführungsform der Verstärkungsdifferenzquantisierungseinrichtung 643. Die Verstärkungsdifferenzquantisierungseinrichtung 643 weist einen ersten logarithmischen Konverter 702, einen zweiten logarithmischen Konverter 706, vierte und fünfte Multiplizierer 708 und 711 und einen vierten Addierer 704 auf.
  • Wenn der von der Verstärkungswertquantisierungseinrichtung 629 der Basisschicht 600 ausgegebene Verstärkungswert GC des festen Codebuchs über eine Leitung 701 eingegeben ist, gibt der erste logarithmische Konverter 702 über eine Leitung 703 einen logarithmisch konvertierten Verstärkungswert des festen Codebuchs aus, der dem Verstärkungswert GC des festen Codebuchs entspricht.
  • Der unquantisierte Verstärkungswert GCE des festen Codebuchs, der von der Durchsuchungseinheit 639 für ein festes Codebuch der Sprachqualitätsverbesserungsschicht 630 ausgegeben ist, wird über eine Leitung 705 eingegeben, der zweite logarithmische Konverter 706 gibt einen logarithmisch konvertierten Verstärkungswert des festen Codebuchs über eine Leitung 707 aus.
  • Der vierte Multiplizierer 708 multipliziert den über die Leitung 707 eingegebenen logarithmisch konvertierten Verstärkungswert des festen Co debuchs mit einem Verstärkungsdifferenzeinstellwert ζ und gibt das Ergebnis über eine Leitung 708 aus.
  • Der vierte Addierer 704 gibt über eine Leitung 710 eine Differenz zwischen dem über die Leitung 703 eingegebenen Verstärkungswert des festen Codebuchs und dem über die Leitung 708 eingegebenen Verstärkungswert des festen Codebuchs aus.
  • Der fünfte Multiplizierer 711 multipliziert die eingegebene Verstärkungsdifferenz mit einem Skalenfaktor 10, so dass eine logarithmische Verstärkungsdifferenz GDIFF 712 erzeugt wird.
  • Die Funktion der Verstärkungsdifferenzquantisierungseinrichtung 643 kann definiert werden als
    Figure 00390001
    wobei GC den in der Verstärkungswertquantisierungseinrichtung 629 quantisierten Verstärkungswert des festen Codebuchs darstellt und GCE den von der Durchsuchungseinheit 639 für ein festes Codebuch ausgegebenen unquantisierten Verstärkungswert darstellt. Ferner ist der Verstärkungsdifferenzeinstellwert ζ ein Einstellwert zur Minimierung eines dynamischen Bereichs der Differenz zwischen den logarithmischen Verstärkungswerten. Der Verstärkungsdifferenzeinstellwert ζ kann irgendein Wert entsprechend der Art des Sprachcodecs sein, und zum Beispiel 0,987 betragen.
  • Da die durch die Berechnung in Gleichung 16 ermittelte Verstärkungsdifferenz 712 ein analoges Signal ist, wird es durch eine skalare Quantisierungseinrichtung mit 3 Bit quantisiert. Der quantisierte Verstärkungswert ĜCE der Sprachqualitätsverbesserungsschicht 630 wird unter Verwendung des Quantisierungsergebnisses der skalaren 3-Bit-Quanti sierungseinrichtung ausgegeben. Der quantisierte Verstärkungswert ĜCE wird über eine Leitung 645 zum dritten Multiplizierer 644 ausgegeben und über eine Leitung 646 zum Multiplizierer 650 ausgegeben.
  • Der dritte Multiplizierer 644 multipliziert den vom festen Codebuch 641 zugeführten festen Codebuchvektor mit dem quantisierten Verstärkungswert ĜCE der Sprachqualitätsverbesserungsschicht 630, der von der Verstärkungsdifferenzquantisierungseinrichtung 643 zugeführt ist, und gibt das Ergebnis über eine Leitung 647 zum Synthesefilter 634.
  • Der Multiplizierer 650 multipliziert die LPC-Koeffizientenquantisierungsinformation, den Index des festen Codebuchs, den Index des adaptiven Codebuchs und die Verstärkungswertquantisierungsinformation, die von der Basisschicht 600 zugeführt werden, und den Index des festen Codebuchs und die Verstärkungsdifferenzquantisierungsinformation, die von der Sprachqualitätsverbesserungsschicht 630 zugeführt werden, und gibt das Ergebnis als Bitströme aus.
  • Die Bitströme der Basisschicht 600 und der Sprachqualitätsverbesserungsschicht 630 werden getrennt übertragen. Das heißt, wie in 6 gezeigt, wird der Bitstrom der Sprachqualitätsverbesserungsschicht 630 nachfolgend zum Bitstrom der Basisschicht 600 übertragen. Dementsprechend können die Bitströme bei einer für die Dekodiervorrichtung notwendigen Bitrate gemäß den Netzwerkverkehrsbedingungen leicht getrennt werden. Zum Beispiel kann im Fall, wo Kanalcharakteristiken eines Kanals der Dekodiervorrichtung so schlecht sind, dass sie nur den Bitstrom der Basisschicht empfangen kann, die Dekodiervorrichtung nur den Bitstrom der Basisschicht von den durch die skalierbare Sprachkodiervorrichtung von 6 übertragenen Bitströmen empfangen.
  • 8 ist ein Blockdiagramm einer bitraten-skalierbaren Sprachdekodiervorrichtung gemäß einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung. Mit Bezug zu 8 weist die bitraten-skalierbare Sprachdekodiervorrichtung einen Demultiplexer 802, eine LPC-Koeffizientendekodiereinheit 803, eine Verstärkungswertdekodiereinheit 804, eine erste Dekodiereinheit 805 für ein festes Codebuch, eine Dekodiereinheit 806 für ein adaptives Codebuch, eine Verstärkungsdifferenzdekodiereinheit 807, eine zweite Dekodiereinheit 808 für ein festes Codebuch, Multiplizierer 809, 810 und 813, Addierer 811 und 814, einen Selektorschalter 812, einen Synthesefilter 815 und eine Nachbearbeitungseinheit 816 auf.
  • Die bitraten-skalierbare Sprachdekodiervorrichtung kann selektiv den von der bitraten-skalierbaren Sprachkodiervorrichtung übertragenen Bitstrom empfangen. Das heißt, wenn die bitraten-skalierbare Sprachdekodiervorrichtung nur den Bitstrom der Basisschicht von den Bitströmen empfängt, kann die Dekodiervorrichtung die Sprachqualität der Basisschicht wiederherstellen. Wenn die bitraten-skalierbare Sprachdekodiervorrichtung sowohl die Bitströme der Basisschicht wie der Sprachqualitätsverbesserungsschicht empfängt, kann die Dekodiervorrichtung weiter verbesserte Sprachqualität erreichen.
  • Der Demultiplexer 802 demultiplext den empfangenen Bitstrom 801 in Information zu jedem Element und gibt das Ergebnis aus. Das heißt, der Demultiplexer 802 gibt LPC-Koeffizientenquantisierungsinformation an die LPC-Koeffizientendekodiereinheit 803, Verstärkungswertquantisierungsinformation an die Verstärkungswertdekodiereinheit 804, Verstärkungsdifferenzquantisierungsinformation an die Verstärkungsdifferenzdekodiereinheit 807, einen Index des festen Codebuchs der Sprachqualitätsverbesserungsschicht 630 an die zweite Dekodiereinheit 808 für ein festes Codebuch, einen Index des festen Codebuchs der Basisschicht 600 an die erste Dekodiereinheit 805 für ein festes Codebuch und einen Index des adaptiven Codebuchs an die Dekodiereinheit 806 für ein adaptives Codebuch.
  • Die Struktur der LPC-Koeffizientendekodiereinheit 803 wird durch den LPC-Koeffizientenextraktor und die Vektorquantisierungseinrichtung 604 der Kodiervorrichtung bestimmt, und stellt den LPC-Koefizienten aus der eingegebenen LPC-Koeffizientenquantisierungsinformation wieder her. Der wiederhergestellte LPC-Koeffizient wird dem Synthesefilter 815 und der Nachbearbeitungseinheit 816 zugeführt.
  • Die Struktur der Verstärkungswertdekodiereinheit 804 wird durch die Verstärkungswertquantisierungseinrichtung 629 der Kodiervorrichtung bestimmt. Die Verstärkungswertdekodiereinheit 804 dekodiert die eingegebene Verstärkungswertquantisierungsinformation. Die Verstärkungswertquantisierungsinformation enthält den Indexwert des adaptiven Codebuchs und den Indexwert des festen Codebuchs. Dementsprechend werden der Verstärkungswert Gc des festen Codebuchs und der Verstärkungswert Gp des adaptiven Codebuchs der Basisschicht 600 entsprechend von der Verstärkungswertdekodiereinheit 804 ausgegeben.
  • Die erste Dekodiereinheit 805 für ein festes Codebuch dekodiert den eingegebenen ersten Index des festen Codebuchs und gibt das erste feste Codebuch aus. Das Dekodierverfahren für ein festes Codebuch wird durch das Durchsuchungsverfahren der Durchsuchungseinheit 617 für ein festes Codebuch der Kodiervorrichtung bestimmt.
  • Die Dekodiereinheit 806 für ein adpatives Codebuch dekodiert den eingegebenen Index des adpativen Codebuchs und gibt ein adpatives Codebuch aus.
  • Die LPC-Koeffizientendekodiereinheit 803, die Verstärkungswertdekodiereinheit 804, die erste Dekodiereinheit 805 für ein festes Codebuch und die Dekodiereinheit 806 für ein adaptives Codebuch können als De kodiereinheiten zum Dekodieren von Kodierinformation in der Basisschicht 600, die vom Demultiplexer 802 übertragen ist, definiert sein.
  • Die Funktionen der Verstärkungsdifferenzdekodiereinheit 807 und der zweiten Dekodiereinheit 808 für ein festes Codebuch hängen von den Netzwerkverkehrsbedingungen oder der Verarbeitungskapazität eines Empfangsterminals ab.
  • Wenn bestimmt ist, dass die Verstärkungsdifferenzdekodiereinheit 807 und die zweite Dekodiereinheit 808 für ein festes Codebuch in Aktion treten, dekodiert die Verstärkungsdifferenzdekodiereinheit 807 die eingegebene Verstärkungsdifferenzquantisierungsinformation. Die zweite Dekodiereinheit 808 für ein festes Codebuch dekodiert den zweiten eingegebenen Index des festen Codebuchs. Das Verstärkungsdifferenzdekodierverfahren ist durch die Verstärkungsdifferenzquantisierungseinrichtung der Kodiervorrichtung bestimmt.
  • Das in der zweiten Dekodiereinheit 808 für ein festes Codebuch durchgeführte Dekodierverfahren ist durch die zweite Durchsuchungseinheit 631 für ein festes Codebuch der Kodiervorrichtung bestimmt. Die Verstärkungsdifferenzdekodiereinheit 807 und die zweite Dekodiereinheit 808 für ein festes Codebuch können als Dekodiereinheiten zum Dekodieren von Information in der Sprachqualitätsverbesserungsschicht 630, die vom Demultiplexer 802 übertragen ist, definiert sein.
  • Der Multiplizierer 809 multipliziert den Verstärkungswert Gc des festen Codebuchs der Basisschicht 600, der von der Verstärkungswertdekodiereinheit 804 wiederhergestellt ist, mit dem festen Codebuch der Basisschicht, das von der ersten Dekodiereinheit 805 für ein festes Codebuch ausgegeben ist, und gibt einen festen Codebuchvektor der Basisschicht aus.
  • Der Multiplizierer 810 multipliziert den Verstärkungswert ĜCE der Sprachqualitätsverbesserungsschicht 630, der von der Verstärkungsdifferenzdekodiereinheit 807 wiederhergestellt ist, mit dem festen Codebuch der Sprachqualitätsverbesserungsschicht, das von der zweiten Dekodiereinheit 808 für ein festes Codebuch ausgegeben ist, und gibt den festen Codebuchvektor der Sprachqualitätsverbesserungsschicht aus.
  • Der Addierer 811 addiert den festen Codebuchvektor der Basisschicht, der vom Multiplizierer 809 ausgegeben ist, zum festen Codebuchvektor der Sprachqualitätsverbesserungsschicht, der vom Multiplizierer 810 ausgegeben ist. Dementsprechend kann ein Impuls des festen Codebuchs der Dekodiervorrichtung eine mehrschichtige algebraische Codebuchimpulsstruktur aufweisen, indem die algebraischen Codebücher der Basisschicht und der Sprachqualitätsverbesserungsschicht akkumuliert werden. Akkumulieren der algebraischen Codebücher dient der Korrektur von Defekten, die in einer herkömmlichen festen Codebuchstruktur auftreten, wenn alle Impulse der festen Codebücher denselben Umfang aufweisen.
  • Der Selektorschalter 812 überträgt selektiv das vom Addierer 811 ausgegebene Signal oder den festen Codebuchvektor der Basisschicht, der vom Multiplizierer 809 ausgegeben ist. Das heißt, wenn die Dekodiervorrichtung nicht in der Sprachqualitätsverbesserungsschicht arbeitet, wählt und überträgt der Selektorschalter 812 den festen Codebuchvektor der Basisschicht, der vom Multiplizierer 809 ausgegeben ist. Wenn die Dekodiervorrichtung in der Sprachqualitätsverbesserungsschicht arbeitet, wählt und überträgt der Selektorschalter 812 das vom Addierer 811 ausgegebene Signal.
  • Der Multiplizierer 813 multipliziert das von der Dekodiereinheit 806 für ein adaptives Codebuch dekodierte adaptive Codebuch mit dem Verstärkungswert Gp des adaptiven Codebuchs, der von der Verstärkungs wertdekodiereinheit 804 ausgegeben ist, und gibt einen adaptiven Codebuchvektor aus.
  • Der Addierer 814 addiert den vom Selektorschalter 812 ausgewählten festen Codebuchvektor zum vom Multiplizierer 813 ausgegebenen adaptiven Codebuchvektor, so dass ein wiederhergestelltes Anregungssignal erzeugt wird.
  • Der Multiplizierer 810, der Addierer 811 und der Selektorschalter 812 können als Berechnungseinheiten definiert sein, die Signale berechnen, die entsprechend den Betriebsbedingungen der Dekodiervorrichtung jeweils in den Dekodiereinheiten zum Dekodieren von Kodierinformation der Basisschicht und der Sprachqualitätsverbesserungsschicht dekodiert sind.
  • Der Synthesefilter 815 stellt das Sprachsignal wieder her, indem das vom Addierer 814 zugeführte Anregungssignal synthetisiert wird, wobei der von der LPC-Koeffizientendekodiereinheit 803 zugeführte wiederhergestellte LPC-Koeffizient verwendet wird.
  • Die Nachbearbeitungseinheit 816 stellt das vom Synthesefilter 815 übertragene Sprachsignal wieder her. Das heißt, zum Wiederherstellen des Sprachsignals verwendet die Nachbearbeitungseinheit 816 einen Hochpassfilter zum Filtern von Signalen, die vom Synthesefilter 815 ausgegeben sind, unter Verwendung des von der LPC-Koeffizientendekodiereinheit 803 zugeführten LPC-Koeffizienten.
  • Der Synthesefilter 815 und die Nachbearbeitungseinheit 816 können als Wiederherstellungseinheiten zum Wiederherstellen des Sprachsignals definiert sein, indem die von den Berechnungseinheiten ausgegebenen Signale mit dem von der LPC-Koeffizientendekodiereinheit 803 ausgegebenen LPC-Koeffizienten synthetisiert werden.
  • 9 ist ein Diagramm zur Erläuterung des Umfangs eines Impulses, der in der Sprachsignaldekodiervorrichtung von 8 wiederhergestellt ist, unter Verwendung eines festen Codebuchvektors, der auf einer Impulsposition basiert, die von einer festen Codebuchsuche 901 in einer Basisschicht gesucht wird, und einer Impulsposition, die von einer festen Codebuchsuche 905 in der Sprachqualitätsverbesserungsschicht in der Sprachsignalkodiervorrichtung von 6 gesucht wird.
  • Mit Bezug zu 9 multipliziert der Multiplizierer 809 einen festen Codebuchvektor 902, der von der ersten Dekodiereinheit 805 für ein festes Codebuch zugeführt ist, mit einem Verstärkungswert Gc des festen Codebuchs, der von der Verstärkungswertdekodiereinheit 804 zugeführt ist, so dass ein fester Codebuchvektor 904 der Basisschicht erzeugt wird.
  • Der Multiplizierer 810 multipliziert einen festen Codebuchvektor 906, der von der zweiten Dekodiereinheit 808 für ein festes Codebuch zugeführt ist, mit einem Verstärkungswert GCE, der von der Verstärkungsdifferenzdekodiereinheit 807 zugeführt ist, so dass ein fester Codebuchvektor 908 der Sprachqualitätsverbesserungsschicht erzeugt wird. Der Addierer 811 erzeugt einen festen Codebuchvektor 910 durch Addieren des festen Codebuchvektors 908 der Sprachqualitätsverbesserungsschicht zum festen Codebuchvektor 904 der Basisschicht.
  • Der feste Codebuchvektor 904 der Basisschicht und der feste Codebuchvektor 908 der Sprachqualitätsverbesserungsschicht werden wie in der Impulsstruktur von 9 gezeigt in den Addierer 811 eingegeben, so dass ein endgültiges festes Codebuch 910 der Sprachqualitätsverbesserungsschicht erzeugt wird. Da das endgültige feste Codebuch 910 der Sprachqualitätsverbesserungsschicht durch Addieren zweier fester Codebuchvektoren mit unterschiedlichen Verstärkungswerten erhalten ist, kann ein mehrfaches festes Codebuch ausgebildet werden, wodurch weiter verbesserte Sprachqualität ereicht wird.
  • 10 ist ein Fließbild eines bitraten-skalierbaren Sprachkodierverfahrens gemäß einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung.
  • Beim Vorgang 1001 führt die Sprachsignalkodiervorrichtung Vorverarbeitung eines eingegebenen Sprachsignals in der Vorverarbeitungseinheit 602 von 6 durch. Beim Vorgang 1002 extrahiert die Sprachsignalkodiervorrichtung einen LPC-Koeffizienten aus dem vorverarbeiteten Sprachsignal und erzeugt Quantisierungsinformation des extrahierten LPC-Koeffizienten.
  • Beim Vorgang 1003 erfasst die Sprachsignalkodiervorrichtung ein Restsignal des LPC-Koeffizienten aus dem vorverarbeiteten Signal durch den Synthesefilter 606. Beim Vorgang 1004 filtert die Sprachsignalkodiervorrichtung das erfasste Restsignal und gibt ein wahrnehmungsgedichtetes Signal aus, wie beim Wahrnehmungsgewichtsfilter 610 von 6.
  • Beim Vorgang 1005 analysiert die Sprachsignalkodiervorrichtung eine Tonhöhe des wahrnehmungsgedichteten Signals wie in der Tonanalyseeinheit 612 von 6, eliminiert einen Tonbeitrag aus dem wahrnehmungsgedichteten Signal unter Verwendung des Analyseergebnisses wie in der Tonbeitragseliminierungseinheit 615 von 6 und erzeugt einen Verstärkungswert und einen Index des adaptiven Codebuchs.
  • Beim Vorgang 1006 durchsucht die Sprachkodiervorrichtung das feste Codebuch der Basisschicht, so dass ein Verstärkungswert und einen Index des festen Codebuchs, wie in der Durchsuchungseinheit 617 für ein festes Codebuch der Basisschicht 600 von 6 erzeugt werden.
  • Beim Vorgang 1007 quantisiert die Sprachsignalkodiervorrichtung den erfassten Verstärkungswert des festen Codebuchs und den erfassten Verstärkungswert des adaptiven Codebuchs wie in der Verstärkungswertquantisierungseinrichtung 629 von 6.
  • Beim Vorgang 1008 synthetisiert die Sprachsignalkodiervorrichtung einen in der Basisschicht 600 erzeugten festen Codebuchvektor mit einem Anregungssignal eines adaptiven Codebuchvektors unter Verwendung des vektorquantisierten LPC-Koeffizienten wie im Synthesefilter 606 von 6.
  • Beim Vorgang 1009 erzeugt die Sprachsignalkodiervorrichtung ein Zielsignal für Durchsuchung eines festen Codebuchs, wie in der Durchsuchungseinheit 639 für ein festes Codebuch von 6, indem der Beitrag eines Zielsignals für die Durchsuchung eines festen Codebuchs in der Basisschicht 600 und eines vorhergehenden LPC-synthetisierten Signals der Sprachqualitätsverbesserungsschicht 630 aus dem Zielsignal der Basisschicht 600 eliminiert werden. Das heißt, das Zielsignal in der Sprachqualitätsverbesserungsschicht wird durch Eliminieren des Beitrags des festen Codebuchs der Basisschicht und des in der Sprachqualitätsverbesserungsschicht 630 erfassten vorhergehenden LPC-synthetisierten Signals aus dem in der Basisschicht 600 erfassten Zielsignal erhalten.
  • Beim Vorgang 1010 führt die Sprachsignalkodiervorrichtung Durchsuchung eines festen Codebuchs in der Sprachqualitätsverbesserungsschicht 630 durch, wobei das in Vorgang 1009 erfasste Zielsignal verwendet wird, so dass ein Verstärkungswert des festen Codebuchs der Sprachqualitätsverbesserungsschicht und ein Indes des festen Codebuchs der Sprachqualitätsverbesserungsschicht erhalten werden.
  • Beim Vorgang 1011 quantisiert die Sprachsignalkodiervorrichtung eine logarithmische Differenz zwischen einem quantisierten Verstärkungswert des festen Codebuchs und dem unquantisierten Verstärkungswert des festen Codebuchs der Basisschicht. Die Durchsuchung des festen Codebuchs und die Verstärkungswertquantisierung in der Sprachqualitätsverbesserungsschicht können mehrschichtig durchgeführt werden, da eine Mehrzahl von Sprachqualitätsverbesserungsschichten vorgesehen sind. Wenn die Funktion der Sprachqualitätsverbesserungsschichten in mehreren Schichten durchgeführt wird, kann die Qualität wiederhergestellter Sprachsignale weiter verbessert werden.
  • Beim Vorgang 1012 führt die Sprachsignalkodiervorrichtung einen festen Codebuchvektor (oder ein Anregungssignal), der in der Sprachqualitätsverbesserungsschicht erzeugt ist, durch den Synthesefilter 634 von 6 und gibt ein synthetisiertes Signal aus.
  • Beim Vorgang 1013 multipliziert die Sprachsignalkodiervorrichtung die LPC-Koeffizientenquantisierungsinformation, den Index des festen Codebuchs der Basisschicht, den Index des adaptiven Codebuchs der Basisschicht, den Verstärkungswert des festen Codebuchs der Basisschicht, den Verstärkungswert des adaptiven Codebuchs der Basisschicht, den Index des festen Codebuchs der Sprachqualitätsverbesserungsschicht und die Verstärkungsdifferenzquantisierungsinformation, so dass Bitströme erhalten werden und gibt die Bitströme an die Sprachsignaldekodiervorrichtung.
  • 11 ist ein Fließbild eines bitraten-skalierbaren Sprachdekodierverfahrens gemäß einer anderen beispielhaften Ausführungsform der vorliegenden Erfindung.
  • Beim Vorgang 1101 demultiplext die Vorrichtung zur Sprachsignaldekodierung den empfangenen Bitstrom in Information zu jedem Element wie der Multiplexer 802 von 8.
  • Beim Vorgang 1102 dekodiert die Sprachsignaldekodiervorrichtung das demultiplexte Signal. Das heißt, die Sprachsignaldekodiervorrichtung dekodiert das demultiplexte Signal wie in der LPC-Koeffizientendekodiereinheit 803, der Verstärkungswertdekodiereinheit 804, der ersten Dekodiereinheit 805 für ein festes Codebuch, der Dekodiereinheit 806 für ein adaptives Codebuch, der Verstärkungsdifferenzdekodiereinheit 807 und der zweiten Dekodiereinheit 808 für ein festes Codebuch von 8.
  • Beim Vorgang 1103 überträgt die Sprachsignaldekodiervorrichtung selektiv das feste Codebuch der Sprachqualitätsverbesserungsschicht oder das feste Codebuch der Basisschicht, entsprechend den Betriebsbedingungen der Sprachsignaldekodiervorrichtung, und überträgt auch selektiv den Verstärkungswert. Das heißt, wenn die Sprachsignaldekodiervorrichtung in der Sprachqualitätsverbesserungsschicht arbeitet, addiert die Sprachsignaldekodiervorrichtung das feste Codebuch, das durch Multiplizieren des wiederhergestellten festen Codebuchs der Sprachqualitätsverbesserungsschicht erhalten ist, mit dem wiederhergestellten Verstärkungswert des festen Codebuchs der Sprachqualitätsverbesserungsschicht, zum Signal, das durch Multiplizieren des festen Codebuchs der Basisschicht mit dem Verstärkungswert des festen Codebuchs der Basisschicht erhalten ist, und überträgt das Ergebnis. Wenn indessen die Sprachsignalkodiervorrichtung nicht in der Sprachqualitätsverbesserungsschicht arbeitet, überträgt die Sprachsignaldekodiervorrichtung das feste Codebuch, das durch Multiplizieren des dekodierten festen Codebuchs der Basisschicht mit dem Verstärkungswert des festen Codebuchs der Basisschicht erhalten ist.
  • Beim Vorgang 1104 synthetisiert die Sprachsignaldekodiervorrichtung das feste Codebuch, das in Vorgang 1103 selektiv übertragen ist, unter Verwendung des in Vorgang 1102 dekodierten LPC-Koeffizienten.
  • Beim Vorgang 1105 erzeugt die Sprachsignaldekodiervorrichtung ein wiederhergestelltes Sprachsignal, indem Nachbearbeitung durchgeführt wird, wie in der Nachbearbeitungseinheit 816.
  • Wie oben beschrieben, da die vorliegende Erfindung eine bitraten-skalierbare Struktur zur Verfügung stellt, ohne dass der vorhandene CELP-Standardsprachcodec verändert wird, ist die vorliegende Erfindung mit einem System kompatibel, das den vorhandenen CELP-Standardsprachcodec verwendet.
  • Da ferner gemäß einer Ausführungsform der vorliegenden Erfindung das Zielsignal für die Durchsuchung des festen Codebuchs der Basisschicht gleich ist wie das Zielsignal für die Durchsuchung des festen Codebuchs der Sprachqualitätsverbesserungsschicht, wird das in der Sprachqualitätsverbesserungsschicht durchsuchte Codebuch nicht für einen nächsten Rahmen gespeichert, und dementsprechend wird die Funktion der Basisschicht nicht beeinflusst.
  • Ebenso ist, da die Durchsuchung des festen Codebuchs in der Sprachqualitätsverbesserungsschicht Parameter verwendet, die bei der Durchsuchung des festen Codebuchs der Basisschicht ermittelt sind, die Anzahl der erforderlichen Berechnungen für die Durchsuchung des festen Codebuchs in der Sprachqualitätsverbesserungsschicht reduziert.
  • Darüber hinaus kann, da gemäß einer anderen Ausführungsform der vorliegenden Erfindung das für die Durchsuchung des festen Codebuchs der Sprachqualitätsverbesserungsschicht notwendige Zielsignal durch Eliminieren des Beitrags des festen Codebuchs der Basisschicht und des synthetisierten Signals des festen Codebuchs der vorhergehenden Sprachqualitätsverbesserungsschicht, das durch den Synthesefilter der Sprachqualitätsverbesserungsschicht zugeführt ist, vom Zielsignal des festen Codebuchs der Basisschicht ermittelt wird, die Durchsuchung des festen Codebuchs unter Verwendung des Zielsignals für nur die Sprachqualitätsverbesserungsschicht durchgeführt werden, wodurch exaktere Durchsuchung des festen Codebuchs erreicht wird.
  • Da außerdem die von der Sprachqualitätsverbesserungsschicht gesuchte Impulsposition und die von der Basisschicht gesuchte Impulsposition gleich sein können, müssen die Impulse des algebraischen Codebuchs nicht die gleiche Größe aufweisen, und die Impulse des endgültigen festen Codebuchs können einen vielfachen Umfang aufweisen, wodurch die Qualität des wiederhergestellten Signals verbessert wird.
  • Da ferner der quantisierte Wert der Differenz, die einen relativ engeren dynamischen Bereich aufweist, zwischen dem Verstärkungswert der Basisschicht und dem Verstärkungswert der Sprachqualitätsverbesserungsschicht als der Verstärkungswert der Sprachqualitätsverbesserungsschicht verwendet wird, kann die Anzahl an Bits, die zum Quantisieren des Verstärkungswerts der Sprachqualitätsverbesserungsschicht notwendig ist, reduziert werden.
  • Während die vorliegende Erfindung insbesondere mit Bezug zu beispielhaften Ausführungsformen gezeigt und beschrieben wurde, versteht es sich für die Fachleute, dass verschiedene Änderungen in Form und Details hierzu vorgenommen werden können, ohne den Rahmen der vorliegenden Erfindung zu verlassen, wie er in den folgenden Ansprüchen definiert ist.

Claims (26)

  1. Vorrichtung zur Sprachsignalkodierung umfassend: eine Basisschicht (100, 600) geeignet zum Filtern eines Eingangssprachsignals unter Verwendung von Linearvorhersagekodierung und Erzeugen eines Anregungssignals entsprechend dem gefilterten Sprachsignal durch Suche im festen Codebuch und Suche im adaptiven Codebuch; eine oder mehrere Sprachqualitätsverbesserungsschichten (130, 630) geeignet zum Durchsuchen eines festen Codebuchs unter Verwendung von Parametern, die durch die Suche im festen Codebuch erhalten sind, die von der Basisschicht durchgeführt ist, oder unter Verwendung eines Zielsignals, das durch Eliminieren eines Tonbeitrags der Basisschicht für die Suche im festen Codebuch der Basisschicht erhalten ist; und einen Multiplexer (140, 160) geeignet zum Multiplexen von Signalen, die von der Basisschicht und der Sprachqualitätsverbesserungsschicht erzeugt sind und Ausgeben des Multiplexsignals; wobei die eine oder die mehreren Sprachqualitätsverbesserungsschichten geeignet sind, ein festes Codebuch unter Verwendung von Parametern zu durchsuchen, die durch Suche im festen Codebuch durchgeführt von der Basisschicht erhalten sind, dadurch gekennzeichnet, dass die Sprachqualitätsverbesserungsschicht ferner eine Verstärkungsdifferenzquantisierungseinrichtung (134, 643) umfasst, die so angeordnet ist, dass sie eine Differenz zwischen einem ersten Verstärkungswert, erhalten durch Suche im festen Codebuch durchgeführt von der Basisschicht, und einem zweiten Verstärkungswert, erhalten durch Suche im festen Codebuch durchgeführt von der Sprachqualitätsverbesserungsschicht, quantisiert.
  2. Vorrichtung zur Sprachsignalkodierung nach Anspruch 1, wobei die Suche im festen Codebuch in der Basisschicht (100, 600) und die Suche im festen Codebuch in der Sprachqualitätsverbesserungsschicht (130, 630) unter Verwendung eines algebraischen Codebuchs durchgeführt werden.
  3. Vorrichtung zur Sprachsignalkodierung nach einem der vorhergehenden Ansprüche, wobei die Parameter eine Korrelation d(n) zwischen einer Impulsantwort und einem Zielsignal erfasst in der Basisschicht, eine Korrelation C entsprechend dem Umfang der Korrelation d(n) und Energie E der Impulsantwort beinhalten.
  4. Vorrichtung zur Sprachsignalkodierung nach einem der vorhergehenden Ansprüche, wobei der Multiplexer (140) so angeordnet ist, dass er Linearvorhersagekodierkoeffizientenquantisierungsinformation, einen festen Codebuchindex in der Basisschicht, einen adaptiven Codebuchindex in der Basisschicht, Quantisierungsinformation für einen festen Codebuchverstärkungswert in der Basisschicht, Quantisierungsinformation für einen adaptiven Codebuchverstärkungswert in der Basisschicht und einen festen Codebuchindex in der Sprachqualitätsverbesserungsschicht und Quantisierungsinformation bezüglich der Differenz zwischen dem festen Codebuchverstärkungswert und einem festen Codebuchverstärkungswert in der Sprachqualitätsverbesserungsschicht multiplext.
  5. Vorrichtung zur Sprachsignalkodierung nach Anspruch 4, wobei, wenn eine Mehrzahl von Sprachqualitätsverbesserungsschichten (130, 160) verwendet werden, der Multiplexer (140, 160) Quantisierungsinformation bezüglich der Differenz zwischen den festen Codebuchverstärkungswerten und festen Codebuchindices, die von der Mehrzahl von Sprachqualitätsverbesserungsschichten ausgegeben sind, multiplext.
  6. Vorrichtung zur Sprachsignalkodierung nach einem der Ansprüche 1 bis 4, umfassend: eine Mehrzahl von Sprachqualitätsverbesserungsschichten, deren jede eine Durchsuchungseinheit (131, 631) für ein festes Codebuch aufweist, so angeordnet, dass sie ein festes Codebuch unter Verwendung von Parametern durchsucht, die durch die Suche im festen Codebuch in der Basisschicht ermittelt sind, und eine Verstärkungswertquantisierungseinheit zum Erfassen einer Differenz zwischen einem ersten festen Codebuchverstärkungswert erzeugt durch Suche im festen Codebuch in der Basisschicht und einem zweiten festen Codebuchverstärkungswert ausgegeben von der festen Codebuchdurchsuchungseinheit und Quantisieren der erfassten Differenz.
  7. Vorrichtung zur Sprachsignalkodierung nach Anspruch 1, wobei die eine oder mehreren Sprachqualitätsverbesserungsschichten (130, 160) so angeordnet sind, dass sie ein festes Codebuch unter Verwendung eines Zielsignals durchsuchen, das durch Eliminieren eines Beitrags eines festen Codebuchs der Basisschicht von einem Zielsignal für die Suche im festen Codebuch der Basisschicht erhalten ist.
  8. Vorrichtung zur Sprachsignalkodierung nach Anspruch 7, wobei der Beitrag des festen Codebuchs y2(n) der Basisschicht durch die folgende Gleichung unter Verwendung eines festen Codebuchs cG, mit dem ein quantisierter Verstärkungswert des festen Codebuchs der Basisschicht multipliziert wird, und einer Impulsantwort h(n) eines Synthesefilters berechnet wird
    Figure 00550001
  9. Vorrichtung zur Sprachsignalkodierung nach Anspruch 7 oder 8, wobei die Sprachqualitätsverbesserungsschicht (130, 160) ferner so angeordnet ist, dass sie ein Signal aus dem Zielsignal der Basisschicht eliminiert, das durch Synthetisieren eines festen Codebuchsignals erhalten ist, das in der Sprachqualitätsverbesserungsschicht unter Verwendung des Linearvorhersagekodierkoeffizienten erzeugt ist.
  10. Vorrichtung zur Sprachsignalkodierung nach Anspruch 7, 8 oder 9, wobei die Sprachqualitätsverbesserungsschicht (130, 160) ferner so angeordnet ist, dass sie einen festen Codebuchvektor, der durch die Suche im festen Codebuch der Sprachqualitätsverbesserungsschicht erhalten ist, mit einem quantisierten Verstärkungswert der Sprachqualitätsverbesserungsschicht multiplext, der durch Quantisieren einer Differenz zwischen einem logarithmischen Wert eines ersten Verstärkungswerts erhalten durch Suche im festen Codebuch der Basisschicht und einem logarithmischen Wert eines zweiten Verstärkungswerts erhalten durch Suche im festen Codebuch der Sprachqualitätsverbesserungsschicht erhalten ist.
  11. Vorrichtung zur Sprachsignalkodierung nach Anspruch 7, 8, 9 oder 10, wobei eine Mehrzahl von Sprachqualitätsverbesserungsschichten vorgesehen sind und der Multiplexer Quantisierungsinformation bezüglich der Differenz zwischen logarithmischen Verstärkungswerten des festen Codebuchs und festen Codebuchindices multiplext, die von der Mehrzahl von Sprachqualitätsverbesserungsschichten ausgegeben sind.
  12. Vorrichtung zur Sprachsignalkodierung nach einem der Ansprüche 7 bis 11, wobei die Sprachqualitätsverbesserungsschicht (130, 160) so angeordnet ist, dass sie das Zielsignal mit einem Wahrnehmungsgewichtungsfilter filtert und dann die Suche im festen Codebuch durchführt.
  13. Vorrichtung zur Sprachsignalkodierung nach Anspruch 1 umfassend: eine Mehrzahl von Sprachqualitätsverbesserungsschichten (630), deren jede beinhaltet: eine Durchsuchungseinheit (639) für ein festes Codebuch so angeordnet, dass sie ein festes Codebuch unter Verwendung eines Zielsignals durchsucht, das durch Eliminieren eines Beitrags eines festen Codebuchs der Basisschicht von einem Zielsignal für die Suche im festen Codebuch der Basisschicht erhalten ist; und eine logarithmische Verstärkungsdifferenzquantisierungseinrichtung (643) zum Erfassen und Quantisieren einer Differenz zwischen einem logarithmischen Verstärkungswert eines festen Codebuchs erzeugt durch die Suche im festen Codebuch der Basisschicht und einem logarithmischen Verstärkungswert eines zweiten festen Codebuchs ausgegeben von der Durchsuchungseinheit für das feste Codebuch; und einen Demultiplexer zum Demultiplexen von Signalen, die in der Basisschicht und der Sprachqualitätsverbesserungsschicht erzeugt sind, wobei die Sprachqualitätsverbesserungsschicht ferner so angeordnet ist, dass sie ein Signal, das durch Synthetisieren eines festen Codebuchs unter Verwendung eines Linearvorhersagekodierkoeffizienten in der Sprachqualitätsverbesserungsschicht erhalten ist, aus dem Zielsignal für die Suche im festen Codebuch der Sprachqualitätsverbesserungsschicht eliminiert.
  14. Vorrichtung zur Sprachsignaldekodierung zum Dekodieren eines Sprachsignals, das von einer Basisschicht und mindestens einer Sprachqualitätsverbesserungsschicht separat kodiert ist, wobei die Vorrichtung zur Sprachsignaldekodierung umfasst: eine erste Dekodiereinheit (304) so angeordnet, dass sie Kodierinformation der Basisschicht aus dem kodierten Sprachsignal dekodiert; eine zweite Dekodiereinheit (307) so angeordnet, dass sie Kodierinformation der Sprachqualitätsverbesserungsschicht aus dem kodierten Sprachsignal gemäß einer Betriebsumgebung der Vorrichtung zur Sprachsignaldekodierung dekodiert; eine Berechnungseinheit (311) so angeordnet, dass sie ein von der ersten Dekodiereinheit ausgegebenes Signal und ein von der zweiten Dekodiereinheit ausgegebenes Signal gemäß der Betriebsumgebung der Vorrichtung zur Sprachsignaldekodierung berechnet; und eine Sprachsignalwiederherstellungseinheit (315, 316) zum Synthetisieren eines Signals, das von der Berechnungseinheit ausgegeben ist, unter Verwendung eines Linearvorhersagekodierkoeffizienten, der von der ersten Dekodiereinheit ausgegeben ist, und Wiederherstellen des Sprachsignals; wobei die erste Dekodiereinheit umfasst: eine Dekodiereinheit (302) für Linearvorhersagekodierkoeffizienten so angeordnet, dass sie Linearvorhersagekodierkoeffizientenquantisierungsinformation dekodiert, die in der Kodierinformation der Basisschicht enthalten ist; eine erste Dekodiereinheit (304) für ein festes Codebuch so angeordnet, dass sie einen festen Codebuchindex dekodiert, der in der Kodierinformation der Basisschicht enthalten ist; eine Dekodiereinheit (305) für ein adaptives Codebuch so angeordnet, dass sie einen adaptiven Codebuchindex dekodiert, der in der Kodierinformation der Basisschicht enthalten ist; und eine Verstärkungswertdekodiereinheit (303) so angeordnet, dass sie einen festen Codebuchverstärkungswert und einen adaptiven Codebuchverstärkungswert dekodiert, die in der Kodierinformation der Basisschicht enthalten sind; wobei die zweite Dekodiereinheit umfasst: eine Verstärkungsdifferenzdekodiereinheit (306) so angeordnet, dass sie Quantisierungsinformation bezüglich einer Differenz zwischen einem festen Codebuchverstärkungswert der Basisschicht und einem festen Codebuchverstärkungswert der Sprachqualitätsverbesserungsschicht dekodiert, die in der Kodierinformation der Sprachqualitätsverbesserungsschicht enthalten sind; und eine zweite Dekodiereinheit (307) für ein festes Codebuch so angeordnet, dass sie einen festen Codebuchindex dekodiert, der in der Kodierinformation der Sprachqualitätsverbesserungsschicht enthalten ist.
  15. Vorrichtung zur Sprachsignaldekodierung nach Anspruch 14, wobei die Berechnungseinheit umfasst: einen ersten Addierer (308) so angeordnet, dass er den dekodierten festen Codebuchverstärkungswert, der von der Verstärkungswertdekodiereinheit ausgegeben ist, zu der dekodierten Verstärkungsdifferenz addiert, die von der Verstärkungsdifferenzdekodiereinheit ausgeben ist; einen ersten Selektor (310) so angeordnet, dass er den dekodierten festen Codebuchverstärkungswert, der von der Verstärkungswertdekodiereinheit ausgegeben ist oder einen Verstärkungswert, der vom ersten Addierer ausgegeben ist, gemäß der Betriebsbedingungen der Sprachsignaldekodiervorrichtung überträgt; einen zweiten Addierer (309) so angeordnet, dass er ein dekodiertes festes Codebuch der Sprachqualitätsverbesserungsschicht, das von der zweiten festen Codebuchdekodiereinheit ausgegeben ist, zu einem dekodierten festen Codebuch der Basisschicht addiert, das von der ersten festen Codebuchdekodiereinheit ausgegeben ist; einen zweiten Selektorschalter (311) so angeordnet, dass er ein Signal, das vom zweiten Addierer ausgegeben ist oder das dekodierte feste Codebuch, das von der ersten festen Codebuchdekodiereinheit ausgegeben ist, gemäß der Betriebsbedingungen der Sprachsignaldekodiervorrichtung überträgt; einen ersten Multiplizierer (313) so angeordnet, dass er ein dekodiertes adaptives Codebuch, das von der adaptiven Codebuchdekodiereinheit ausgegeben ist, mit einem dekodierten adaptiven Codebuchverstärkungswert multipliziert, der von der Verstärkungswertdekodiereinheit ausgegeben ist; einen zweiten Multiplizierer (312) so angeordnet, dass er ein Signal, das vom ersten Selektorschalter ausgegeben ist, mit einem Signal multipliziert, das vom zweiten Selektorschalter ausgegeben ist; und einen dritten Addierer (314) so angeordnet, dass er ein Signal, das vom ersten Multiplizierer ausgegeben ist, zu einem Signal addiert, das vom zweiten Multiplizierer ausgegeben ist.
  16. Vorrichtung zur Sprachsignaldekodierung nach Anspruch 15, wobei die Sprachsignalwiederherstellungseinheit umfasst: einen Synthesefilter (315) so angeordnet, dass er ein Signal, das vom dritten Addierer ausgegeben ist, unter Verwendung eines Linearvorhersagekodierkoeffizienten synthetisiert; und eine Nachbearbeitungseinheit (316) so angeordnet, dass sie das wiederhergestellte Sprachsignal unter Verwendung eines vom Synthesefilter ausgegebenen Signals und des Linearvorhersagekodierkoeffizienten ermittelt.
  17. Vorrichtung zur Sprachsignaldekodierung nach Anspruch 14, 15 oder 16, wobei die festen Codebuchverstärkungswerte die Werte der Verstärkung sind.
  18. Vorrichtung zur Sprachsignaldekodierung nach Anspruch 14, 15 oder 16, wobei die festen Codebuchverstärkungswerte der Logarithmus der Werte der Verstärkung sind.
  19. Vorrichtung zur Sprachsignaldekodierung nach Anspruch 18, wobei die Berechnungseinheit umfasst: einen ersten Addierer (309) so angeordnet, dass er ein dekodiertes festes Codebuch der Sprachqualitätsverbesserungsschicht, das von der zweiten festen Codebuchdekodiereinheit ausgegeben ist, zu einem dekodierten festen Codebuch der Basisschicht addiert, das von der ersten festen Codebuchdekodiereinheit ausgegeben ist; einen Selektorschalter (311) so angeordnet, dass er ein Signal, das vom ersten Addierer ausgegeben ist oder ein dekodiertes festes Codebuch der Basisschicht, das von der ersten festen Codebuchdekodiereinheit ausgegeben ist, gemäß der Betriebsbedingungen der Sprachsignaldekodiervorrichtung selektiv überträgt; und einen zweiten Addierer (314) so angeordnet, dass er ein Signal, das vom Selektorschalter ausgegeben ist, zu einem dekodierten adaptiven Codebuch der Basisschicht addiert, das von der adaptiven Codebuchdekodiereinheit ausgegeben ist.
  20. Vorrichtung zur Sprachsignaldekodierung nach Anspruch 19, wobei die Sprachsignalwiederherstellungseinheit umfasst: einen Synthesefilter (315) so angeordnet, dass er ein Signal, das vom zweiten Addierer ausgegeben ist, unter Verwendung eines Linearvorhersagekodierkoeffizienten synthetisiert; und eine Nachbearbeitungseinheit so angeordnet, dass sie ein wiederhergestelltes Sprachsignal unter Verwendung des Linearvorhersagekodierkoeffizienten und eines vom Synthesefilter ausgegebenen Signals ermittelt.
  21. Verfahren zur Sprachsignalkodierung umfassend die Vorgänge: Extrahieren (402) eines Linearvorhersagekodierkoeffizienten aus einem Eingangssprachsignal und Erzeugen eines Anregungssignals entsprechend dem Eingangssprachsignal durch Suche in einem festen Codebuch und Suche in einem adaptiven Codebuch durch eine Basisschicht; Durchsuchen (407) eines festen Codebuchs unter Verwendung von Parametern, die durch die Suche der Basisschicht im festen Codebuch erhalten sind, in mindestens einer Sprachqualitätsverbesserungsschicht; und Multiplexen (411) von Signalen, die durch die Basisschicht und die Sprachqualitätsverbesserungsschicht erzeugt sind; wobei die Funktion der Sprachqualitätsverbesserungsschicht in mehreren Schichten durchgeführt wird; dadurch gekennzeichnet, dass die Funktion der Sprachqualitätsverbesserungsschicht beinhaltet: Quantisieren einer Differenz zwischen einem Codebuchverstärkungswert, der durch die Suche der Basisschicht im festen Codebuch erhalten ist, und einem Verstärkungswert, der durch die Suche der Sprachqualitätsverbesserungsschicht im festen Codebuch erhalten ist.
  22. Verfahren nach Anspruch 21, wobei die Parameter eine erste Korrelation zwischen einer Impulsantwort und einem Zielsignal erzeugt in der Basisschicht, eine zweite Korrelation entsprechend dem Umfang der ersten Korrelation und Energie der Impulsantwort beinhalten.
  23. Verfahren zum Kodieren eines Sprachsignals nach Anspruch 21 oder 22 umfassend den Vorgang: Durchsuchen eines festen Codebuchs unter Verwendung eines Zielsignals, das durch Eliminieren eines festen Codebuchbeitrags der Basisschicht von einem Zielsignal für die Suche der Basisschicht im festen Codebuch erhalten ist, in einer Sprachqualitätsverbesserungsschicht.
  24. Verfahren nach Anspruch 23, wobei das Zielsignal für die Suche im festen Codebuch der Sprachqualitätsverbesserungsschicht ferner durch Eliminieren eines Signals, das durch Synthetisieren eines festen Codebuch unter Verwendung des Linearvorhersagekodierkoeffizienten in der Sprachqualitätsverbesserungsschicht erhalten ist, aus dem Zielsignal für die Suche im festen Codebuch der Basisschicht erhalten wird.
  25. Verfahren nach Anspruch 23 oder 24, wobei die Sprachqualitätsverbesserungsschicht ferner umfasst: Quantisieren einer Differenz zwischen einem logarithmischen Verstärkungswert eines festen Codebuchs, der durch Suche im festen Codebuch in der Basisschicht erhalten ist, und einem logarithmischen Verstärkungswert eines Verstärkungswerts, der durch die Suche im festen Codebuch in der Sprachqualitätsverbesserungsschicht erhalten ist.
  26. Verfahren zum Dekodieren eines Sprachsignals, das von einer Basisschicht und mindestens einer Sprachqualitätsverbesserungsschicht separat kodiert ist, wobei das Verfahren die Vorgänge umfasst: Dekodieren eines kodierten Sprachsignals; selektives Übertragen eines Codebuchs der Basisschicht oder eines Codebuchs der Sprachqualitätsverbesserungsschicht, die im Dekodiervorgang des kodierten Sprachsignals dekodiert sind, gemäß den Betriebsbedingungen; und Erzeugen eines wiederhergestellten Sprachsignals durch Synthetisieren des selektiv übertragenen Codebuchs mit einem Linearvorhersagekodierkoeffizienten, der im Dekodiervorgang des kodierten Sprachsignals dekodiert ist; wobei der Dekodiervorgang des kodierten Sprachsignals ferner Demultiplexen des kodierten Sprachsignals in Kodierinformation bezüglich der Basisschicht und Kodierinformation bezüglich der Sprachqualitätsverbesserungsschicht und Dekodieren der demultiplexten Kodierinformation umfasst; dadurch gekennzeichnet, dass es ferner ein Wiederherstellen eines Verstärkungswerts des festen Codebuchs der Sprachqualitätsverbesserungsschicht durch Addieren einer Differenz zwischen einem dekodierten festen Codebuchverstärkungswert der Basisschicht und einem dekodierten festen Codebuchverstärkungswert in der Sprachqualitätsverbesserungsschicht umfasst.
DE602004004950T 2003-07-09 2004-07-02 Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren Expired - Lifetime DE602004004950T2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR2003046324 2003-07-09
KR20030046324 2003-07-09
KR2004040478 2004-06-03
KR1020040040478A KR100668300B1 (ko) 2003-07-09 2004-06-03 비트율 확장 음성 부호화 및 복호화 장치와 그 방법

Publications (2)

Publication Number Publication Date
DE602004004950D1 DE602004004950D1 (de) 2007-04-12
DE602004004950T2 true DE602004004950T2 (de) 2007-10-31

Family

ID=33455701

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602004004950T Expired - Lifetime DE602004004950T2 (de) 2003-07-09 2004-07-02 Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren

Country Status (4)

Country Link
US (1) US7702504B2 (de)
EP (1) EP1496500B1 (de)
JP (1) JP4583093B2 (de)
DE (1) DE602004004950T2 (de)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
BRPI0515551A (pt) * 2004-09-17 2008-07-29 Matsushita Electric Ind Co Ltd aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de comunicação e método de codificação de áudio
RU2007115914A (ru) * 2004-10-27 2008-11-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Кодер звука и способ кодирования звука
CN101107650B (zh) * 2005-01-14 2012-03-28 松下电器产业株式会社 语音切换装置及语音切换方法
US20070160154A1 (en) * 2005-03-28 2007-07-12 Sukkar Rafid A Method and apparatus for injecting comfort noise in a communications signal
US20060217972A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
WO2007102782A2 (en) * 2006-03-07 2007-09-13 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for audio coding and decoding
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
KR101542069B1 (ko) * 2006-05-25 2015-08-06 삼성전자주식회사 고정 코드북 검색 방법 및 장치와 그를 이용한 음성 신호의부호화/복호화 방법 및 장치
US8060363B2 (en) * 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
US8553757B2 (en) * 2007-02-14 2013-10-08 Microsoft Corporation Forward error correction for media transmission
KR101365597B1 (ko) * 2007-10-24 2014-02-20 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
EP2224432B1 (de) * 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder und kodierungsverfahren
EP2077551B1 (de) * 2008-01-04 2011-03-02 Dolby Sweden AB Audiokodierer und -dekodierer
KR101418023B1 (ko) * 2008-03-14 2014-07-09 삼성전자주식회사 위상정보를 이용한 자동 이득 조절 장치 및 방법
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
EP2490217A4 (de) * 2009-10-14 2016-08-24 Panasonic Ip Corp America Kodiervorrichtung, dekodiervorrichtung und verfahren dafür
US8520495B2 (en) * 2010-02-10 2013-08-27 Electronics And Telecommunications Research Institute Device and method for transmitting and receiving broadcasting signal
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9564147B2 (en) * 2013-04-30 2017-02-07 Rakuten, Inc. Audio communication system, audio communication method, audio communication purpose program, audio transmission terminal, and audio transmission terminal purpose program
US10431240B2 (en) 2015-01-23 2019-10-01 Samsung Electronics Co., Ltd Speech enhancement method and system

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JP4005154B2 (ja) 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6397175B1 (en) * 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
FI109393B (fi) * 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
WO2003038812A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
JP2004101588A (ja) * 2002-09-05 2004-04-02 Hitachi Kokusai Electric Inc 音声符号化方法及び音声符号化装置
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
WO2004097796A1 (ja) * 2003-04-30 2004-11-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置及びこれらの方法
KR100732659B1 (ko) * 2003-05-01 2007-06-27 노키아 코포레이션 가변 비트 레이트 광대역 스피치 음성 코딩시의 이득양자화를 위한 방법 및 장치

Also Published As

Publication number Publication date
DE602004004950D1 (de) 2007-04-12
EP1496500B1 (de) 2007-02-28
JP2005031683A (ja) 2005-02-03
US20050010404A1 (en) 2005-01-13
JP4583093B2 (ja) 2010-11-17
EP1496500A1 (de) 2005-01-12
US7702504B2 (en) 2010-04-20

Similar Documents

Publication Publication Date Title
DE602004004950T2 (de) Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
DE60011051T2 (de) Celp-transkodierung
DE69828725T2 (de) Sprachcodier- und -decodiersystem
DE69910239T2 (de) Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69023402T2 (de) Verfahren zur Sprachkodierung und -dekodierung.
DE69735097T2 (de) Verfahren und vorrichtung zur verbesserung der sprachqualität in tandem-sprachkodierern
DE69531471T2 (de) Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE19647298C2 (de) Kodiersystem
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE60124274T2 (de) Codebuchstruktur und suchverfahren für die sprachkodierung
DE60012860T2 (de) Verfahren zur Verarbeitung mehrerer digitaler Audiodatenströme
DE69923079T2 (de) Kodierung von stimmlosen sprachsegmenten mit niedriger datenrate
DE602004003610T2 (de) Halbrätiger Vocoder
DE60133757T2 (de) Verfahren und vorrichtung zur kodierung von stimmloser sprache
DE69832358T2 (de) Verfahren zur Sprachkodierung und -dekodierung
DE69932460T2 (de) Sprachkodierer/dekodierer
DE60128711T2 (de) Mehrkanal-signalcodierung und -decodierung
DE60038279T2 (de) Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils
DE602005003358T2 (de) Audiokodierung
EP1016319B1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
DE69121411T2 (de) Methode und gerät zur codierung von analogen signalen
DE69820362T2 (de) Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen
DE68917584T2 (de) Zur Sprachqualitätsverbesserung geeignetes Kodiergerät unter Anwendung einer Doppelanlage zur Pulserzeugung.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition