DE69023963T2 - Gerät zur Verstärkungs/Form-Vektorquantifizierung. - Google Patents

Gerät zur Verstärkungs/Form-Vektorquantifizierung.

Info

Publication number
DE69023963T2
DE69023963T2 DE69023963T DE69023963T DE69023963T2 DE 69023963 T2 DE69023963 T2 DE 69023963T2 DE 69023963 T DE69023963 T DE 69023963T DE 69023963 T DE69023963 T DE 69023963T DE 69023963 T2 DE69023963 T2 DE 69023963T2
Authority
DE
Germany
Prior art keywords
section
shape
gain
vectors
codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69023963T
Other languages
English (en)
Other versions
DE69023963D1 (de
Inventor
Fumio Amano
Yasuji Ohta
Yoshinori Tanaka
Tomohiko Taniguchi
Shigeyuki Unagami
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of DE69023963D1 publication Critical patent/DE69023963D1/de
Application granted granted Critical
Publication of DE69023963T2 publication Critical patent/DE69023963T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Die vorliegende Erfindung betrifft eine Verstärkungsgestalt- Vektorquantisierungsvorrichtung und insbesondere eine Verstärkungsgestalt-Vektoquanitisierungsvorrichtung zum Komprimieren der Daten von Sprachsignalen.
  • In den letzten Jahren wurde ein Vektorquantisierungssystem zum Komprimieren der Daten von Sprachsignalen bereits unter Aufrechterhaltung der Qualität davon verwendet für Kommunikationssysteme innerhalb von Firmen und für digitale mobile drahtlose Systeme oder dergleichen. Wie wohlbekannt ist, umfaßt das Vektorquantisierungssystem Durchtretenlassen von Signalvektoren eines Codebuches durch einen Synthesefilter zum Reproduzieren von Signalen und Entwickeln von elektrischer Fehlerleistungen zwischen den reproduzierten Signalen und den Eignabesprachsignalen zum Bestimmen des Index eines Signalvektors mit dem kleinsten Fehler. Unter einer Vielzahl solcher Vektorquantisierungssysteme wurde nun Aufmerksamkeit insbesondere einem Verstärkungsgestalt (Amplituden-Phasen)- Vektorquansitisierungssystem gewidmet, das benutzt wird als ein Hochqualitätssprechcodierverfahren.
  • Figur 1 illustriert die Konstellation einer herkömmlichen Verstärkungsgestalt-Vektorquantisierungsvorrichtung, gemäß welcher ein Gestaltvektor (Phase) ausgewählt wird aus Gestaltvektoren, und zwar erhalten durch Normalisieren elektrischer Leistung einer Vielzahl von Vektoren, welche ein Codebuch 11 mit einer Größe 5 und einer Dimension (oder Ordnung) L darstellen, und wird multipliziert mit der Verstärkung (Amplitude) über eine variable Verstärkungsschaltung 12 zum Separieren einer Amplitudenkomponente von einer Phasenkomponente. Dann wird ein Signal X reproduziert über einen Synthesefilter 13, der einen Abstandssynthesefilter 13a und einen LPC- (Linearvorhersagungscodierungs)-Synthesefilter 13b beinhaltet, und der eine Transferfunktion H(Z) hat, und ein Fehler E zwischen dem reproduzierten Signal X und dem Eignabesignal A wird entwickelt durch eine Entwicklungseinheit 14, wodurch ein Gestaltvektor Ck im Codebuch 11 neu ausgewählt wird, so daß der Fehler E der kleinste wird gemäß den folgenden Gleichungen (1) und (2):
  • Ek ² = (A - Xk)² (1)
  • Xk = H x (g x Ck) (2)
  • (k = 1, 2, 3..., 5)
  • Weiterhin wird die Verstärkung g für einen Gestaltvektor bestimmt basierend auf der elektrischen Fehlerleistung von E, wobei die Verstärkung für jeden Gestaltvektor berechnet wird.
  • Dann werden der Index des Gestaltvektors des Codebuchs 11, die Verstärkung der variablen Verstärkungsschaltung 12, die Abstandsverzögerung und die Abstandsvorhersagekoeffizienten des Abstandssynthesefilters 13a und der LPC-Koeffizient von der Zeit, wenn die Eingabestimme analysiert wird über einen LPC-Analysator 15, welche wie oben beschrieben erhalten werden, übertragen zum Kompromieren der Sprachdaten. Gemäß einem solch herkömmlichen Verstärkungsgestalt- Vektorquantisierungsystem gibt es jedoch nur ein Codebuch, und nur einen Gestaltsvektor wird ausgewählt aus dem Codebuch durch die Entwicklungseinheit, was in einem Anstieg in der Quantisierungsverzerrung (Quantisierungsfehler) resultiert und es schwierig macht, eine Qualität der reproduzierten Sprache aufrecht zu erhalten.
  • Solch eine Quantisierungsverzerrüng kann abgesenkt werden durch Erhöhen der Anzahl von Codevektoren (Gestaltvektoren), die in das Codebuch eingeschlossen sind, und durch Erhöhen der Dimension des Codebuchs. Jedoch steigt ebenfalls der Arbeitsbetrag zum Finden eines optimalen Gestaltvektors mit dem Anstieg in der Größe des Codebuchs, und erhöhter Speicher ist erforderlich zum Speichern der Gestaltvektoren, was ein ernsthaftes Hindernis zum Realisieren der Hardware auferlegt und verursacht, daß die Menge von Gestaltsvektor- Indexübertragung ansteigt.
  • Wenn die Größe des Codebuches abgesenkt wird, um die Operationsgeschwindigkeit zu erhöhen, verliert andererseits die reproduzierte Sprache Qualität aufgrund des Quantisierungsfehlers.
  • Die EP-A-0 314 018 offenbart ein Verfahren einer Vorrichtung zur gemultiplexten Vektorquantisierung. Die betreffende Vorrichtung dieses Dokuments umfaßt einen Codebuchabschnitt, bestehend aus einer Anzahl von Codebüchern, von denen jedes eine Vielzahl von Gestaltvektoren speichert und einen Gestaltvektor bei Empfang eines Indexsignals erzeugt; einen Addiererabschnitt, welcher Signale aufaddiert, die die Gestaltsvektoren und das Eingabesprachsignal reproduzieren; und eine Entwicklungseinheit, welche einen Index bestimmt, hergestellt von zwei Teilen, der eine Vielzahl von Gestaltsvektoren auswählt, die in den Codebüchern gespeichert sind, um den Euklidischen Abstand zwischen den ausgewählten Vektoren und dem Eingabesprachsignal zu minimalisieren und ihn an den Codebuchabstand anlegt.
  • Weiterhin kann diese bekannte Vorrichtung einen Verstärkungsschaltungsabschnitt umfassen, der eine variable Verstärkung der Vielzahl von Gestaltsvektoren auferlegt, welche erzeugt werden aus dem Codebuchabschnitt, so daß der Fehler am kleinsten wird; und einen Abschnitt mit einer Transferfunktion, der Signale reproduziert aus der Ausgabe des Verstärkungsschaltungsabschnitts.
  • Die Aufgabe der vorliegenden Erfindung ist es, eine Verstärkungsgestalt-Vektorquantisierungsvorrichtung zu schaffen, die in der Lage ist, die Quantisierungsverzerrung abzusenken zur Zeit des Rproduzierens der Sprache, ohne die Größe des Codebuches zu erhöhen.
  • Diese Aufgabe wird gelöst gemäß Anspruch 1 der vorliegenden Erfindung.
  • Bevorzugte Ausführungsformen sind in den abhängigen Ansprüchen aufgeführt.
  • Die obige Aufgabe und Merkmale der vorliegenden Erfindung werden klarer erscheinen aus der folgenden Beschreibung der bevorzugten Ausführungsformen mit Bezug auf die begleitende Zeichnung.
  • Die Figuren zeigen im einzelnen:
  • Figur 1 ein Blockdiagramm zum Illustrieren der Konstruktion einer herkömmlichen Verstärkungsgestalt- Vektorquantisierungsvorrichtung;
  • Figur 2 ein Blockdiagramm zum Illustrieren des Prinzips und der Konstruktion einer Verstärkungsgestalt- Vektorquantisierungsvorrichtung nach der vorliegenden Erfindung;
  • Figur 3 ein Diagramm zum Illustrieren des Prinzips einer Vektorquantisierung unter Benutzung eines synthetisierten Vektors einer Vielzahl von Gestaltvektoren;
  • Figuren 4 und 5A Blockdiagramme zum Illustrieren von Verstärkungsgestalt-Vektorquantisierungsvorrichtungen gemäß Ausführungsformen der vorliegenden Erfindung; und
  • Figuren 5B und 6 Blockdiagramme zum Illustrieren der Konstruktion auf der Empfangsseite.
  • Zum Realisieren der oben erwähnten Aufgabe besteht die grundlegende technische Struktur der Verstärkungsgestalt- Vektorquantisierungsvorrichtung der vorliegenden Erfindung aus Komprimieren des Betrages an Daten und Benutzen einer reduzierten Anzahl von Indices oder vorzugsweise Benutzen eines einzelnen Index-Datenwerts zum Absenken der Anzahl von Bits, dabei Aufrechterhalten von Vektordaten in hinreichender Menge zum Aufrechterhalten der gleichen Qualität wie der der herkömmlichen Vorrichtung während des Betriebs. Genau gesagt wird der Betrieb ausgeführt unter Zulassen, daß eine Vielzahl von Gestaltvektordaten erzeugt wird ansprechend auf einen einzelnen Index-Datenwert.
  • Die grundlegende technische Idee der vorliegenden Erfindung wird jetzt beschrieben werden mit Bezug auf Figur 2, wobei zunächst mit dem Prinzip davon gestartet wird. Mit Bezug auf Figur 2, welche den Aufbau im Prinzip zeigt, umfaßt die Vorrichtung einen Codebuchabschnitt 1, welcher aufgebaut ist durch eine Vielzahl von Gestaltvektoren 11i (i = 1 - N) und erzeugt eine Vielzahl ausgewählter Gestaltvektoren, eine Vielzahl von variablen Verstärkungsschaltungen 2, die Verstärkungen den Gestaltvektoren auferlegen, die aus dem Codebuchabschnitt 1 erzeugt werden, eine Vielzahl von Synthesefiltern 3, die ihre Signale reproduzieren aus den Ausgaben der variablen Verstärkungsschaltungen 2, einen ersten Addierer 4, der die Signale aufaddiert, die durch die Synthesefilter 2 reproduziert werden, einen zweiten Addierer 12, der die Ausgabe des ersten Addierers und die Eingabesprache aufaddiert; und eine Entwicklungseinheit 5, die eine Vielzahl von Gestaltvektoren auswählt in dem Codebuchabschnitt 1 ansprechend auf einen Index, so daß der Fehler zwischen der Ausgabe des ersten Addierers 4 und der Eignabesprache am kleinsten wird.
  • Gemäß der vorliegenden Erfindung kann in diesem Fall der Codebuchabschnitt 1 aufgebaut sein durch Codebücher C einer Anzahl M, wobei jedes Codebuch C aufgebaut ist durch Gestaltvektoren einer Anzahl N (N > 1).
  • Bei der Verstärkungsgestalt-Vektorquantisierungsvorrichtung nach der vorliegenden Erfindung beinhaltet der Codebuchabschnitt 1 zumindest ein Codebuch C, welches ein herkömmlicher Weise bekanntes sein kann. Jedes Codebuch C im Codebuchabschnitt 1 enthält eine Vielzahl (N) von Gestaltvektoren 11i (i = 1 - N), wobei jeder der Gestaltvektoren 11i eine Vektorstruktur hat, die ausgedrückt wird durch jegliche Zufallszahlen und dort drinnen gespeichert ist in der Form digitaler Werte.
  • Obwohl es keine besondere Beschränkung gibt auf die Länge der Gestaltsvektoren, d.h. in der Dimension, ist weiterhin ein bevorzugtes Beispiel ein vierzigdimensionaler. Der Codebuchabschnitt 1, der bei der vorliegenden Erfindung benutzt wird, empfängt einen Indexdatenwert von der Entwicklungseinheit 5, welche später beschrieben werden wird, und erzeugt eine Vielzahl von Gestaltvektoren 13i (i = 1 - M) in simultaner Art und Weise. D.h. gemäß der vorliegenden Erfindung wird ein Haufen von Daten erhalten aus kleinen Datenmengen.
  • Wie oben beschrieben treten die Gestaltsvektoren, die simultan erzeugt werden von dem Codebuchabschnitt 1 ansprechend auf einen Indexdatenwert, durch Paare der variablen Verstärkungsschaltungen 2i (i = 1 - M) in dem Verstärkungsschaltungsabschnitt 2, der eingerichtet ist für jeden der Gestaltvektoren 13i (i= 1 - M) und die Synthesefilterschaltung 3i (i = 1 - M) im Vorhersagefilterabschnitt 3, um somit in die ursprünglichen Signale reproduziert zu werden, und werden dann eingegeben an den ersten Addierer 4, welcher einen synthetisierten Vektor der reproduzierten Sprache bildet. Als nächstes wird der reproduzierte synthetisierte Vektor addiert zu einem Vektor einer praktischen Spracheingabe von einer externen Einheit am zweiten Addierer 12, um somit einen Fehler zwischen den zweien zu finden, und das Resultat wird eingegeben an die Entwicklungseinheit 5, welche aufgebaut sein kann als eine einheitliche Struktur zusammen mit dem zweiten Addierer.
  • Die Entwicklungseinheit 5 führt den Betrieb durch für alle Gestaltsvektoren 11i (i = 1 - N), die in dem Codebuch C im Codebuchabschnitt 1 gespeichert sind, so daß der Fehler, der durch den zweiten Addierer 12 berechnet wird, am kleinsten werden wird, wählt mehrere Kombinationen optimaler Gestaltvektoren und sendet als Index-Datenwert an den Codebuchabschnitt 1. Obwohl in diesem Fall die Anzahl von Indexdaten nur 1 ist, wird die Anweisung so gegeben, daß eine Vielzahl von Gestaltvektoren simultan erzeugt werden aus dem Codebuchabschnitt 1. Zu diesem Zweck wird eine Tabelle im voraus bereitet zum Auferlegen von Indexdaten für mehrere Kombinationen aller Gestaltvektoren, ein Betrieb wird ausgeführt durch die Entwicklungseinheit 5 für alle dieser Kombinationen zum Finden einer Kombination, die den Fehler am kleinsten macht, und ein Index der Kombination von Gestaltsvektoren, der den Fehler am kleinsten macht, wird erzeugt. Dieselbe Tabelle wird ebenfalls besessen im Codebuchabschnitt 1, und eine erforderliche Kombination einer Vielzahl von Gestaltsvektoren wird erzeugt basierend auf dem Indexdatenwert von der Entwicklungseinheit 5.
  • Bei der vorliegenden Erfindung gibt es keine besondere Begrenzung in der Gestalt der Gestaltvektoren, welche Kombinationen der Gestaltvektoren darstellen.
  • Als nächstes ist die Entwicklungseinheit 5 so aufgebaut, daß sie Verstärkungseinstellsignale zuführt zum Andern der Verstärkungen der Vielzahl variabler Verstärkungsschaltungen 2i (i = 1 - M), welche den Verstärkungsschaltungsabschnitt 2 darstellen. Die Verstärkungseinstellsignale sind somit zum Andern der Verstärkungen der variablen Verstärkungsschaltungen, so daß der Fehler in dem zweiten Addierer 12 am kleinsten werden wird.
  • D.h. bei der vorliegenden Erfindung wird der Fehler des synthetisierten Sprachsignals vom Eingabesprachsignal minimalisiert durch selektives Einstellen der Gestaltvektoren 11, welche die Daten bezogen auf die Phase sind, so daß ein synthetisierter Vektor mit einer kleinen Phasendifferenz erhalten wird, und Einstellen der Verstärkungen, welche sich auf die Amplitude beziehen. Das dient zum Reproduzieren synthetischer Sprache, die so nah wie möglich an der ursprünglichen Sprache hängt.
  • D.h. die vorliegende Erfindung reproduziert den Vektor, der synthetisiert wird von einer Vielzahl von Gestaltvektoren, und zwar nicht wie beim Stand der Technik, wobei ein einzelner Gestaltsvektor in einem einzelnen Codebuch benutzt wird.
  • Figur 3 zeigt das Prinzip der Vektorquantisierung gemäß der vorliegenden Erfindung für eine zweidimensionalen Fall.
  • Zunächst wird im Fall der herkömmlichen Vektorquantisierung unter Benutzung eines einzelnen Vektors, gezeigt in Figur 3(a), ein Gestaltvektor C&sub4; ausgewählt aus finiten Gestaltvektoren C&sub1; bis CN zum Minimalisieren der Quantisierungsverzerrung bezüglich der Spracheingabe A, die zu Quantisieren ist, wenn die Gestaltvektoren multipliziert werden mit einer skalaren Größe g bezogen auf eine variable Vestärkung.
  • In diesem Fall ist die Anzahl von Gestaltvektoren, die in dem Codebuch gespeichert sind finit. Zum Reduzieren der Quantisierungsfehlers ist es erforderlich, die Codebuchgröße zu erhöhen, was im Erhöhen der Komplexität des Computer resultiert.
  • Andererseits zeigt Figur 3(b) ein Beispiel der Quantisierung, wenn die Vorrichtung gemäß der vorliegenden Erfindung benutzt wird, wobei zwei Gestaltsvektoren benutzt werden zum Quantisieren des zweidimensionalen Vektors A.
  • D.h., wie in Figur 3(b) gezeigt, werden die zwei unabhängigen zweidimensionalen Gestaltvektoren C&sub1;, C&sub2; multipliziert mit Verstärkungen g&sub1; und g&sub2;, um sie zu gewichten, und das Eingabesprachsignal A wird quantisiert durch den synthetisierten Vektor. In diesem Fall werden die Verstärkungen g&sub1;, g&sub2; so eingestellt, daß sie in korrekter Weise jegliche Vektoren realisieren. D.h. der Fehler kann auf Null gebracht werden.
  • Hier ist, was ohne Verzerrung quantisiert werden kann, der Fall, wo die Anzahl unabhängiger Gestaltsvektoren zur Synthese benutzt werden, größer als die Anzahl der Dimensionen der Gestaltvektoren ist. Sogar wenn diese Bedingung nicht erfüllt ist, kann jedoch die Quantisierungsverzerrung stärker abgesenkt werden bei der Vektorquantisierung basierend auf einer Vielzahl von Gestaltsvektoren als bei der Vektorquantisierung basierend auf einem einzelnen Gestaltvektor.
  • Wenn die zweidimensionalen Vektoren zu quantisieren sind, ist es, wie aus der vorhergehenden Beschreibung klar erscheinen wird, erwünschenswert, daß die zwei Gestaltvektoren, welche ausgewählt werden, unter rechten Winkeln zueinander stehen. D.h bei der vorliegenden Erfindung werden, wenn ein Index gegeben wird an den Codebuchabschnitt 1 von der Entwicklungseinheit 5 basierend auf einem Fehler zwischen der reproduzierten Sprache und der Eingabesprache, eine Vielzahl von Gestaltsvektoren 11&sub1;, 11&sub2; ausgewählt und verarbeitet von dem Codebuchabschnitt 1. Die Gestaltvektoren werden dann gewichtet über die variable Verstärkungsschaltung 2&sub1;, 2&sub2; und dann werden Signale reproduziert von dem Vorhersagefiltern 3&sub1;, 3&sub2;, um eine Quantisierung mit wenig Verzerrung zu bewirken.
  • Figur 4 illustriert eine konkrete Ausführungsform des Codebuchabschnitts 1, welche eine Vielzahl von Gestaltvektoren basierend auf einem Index-Datenwert, gemäß der vorliegenden Erfindung erzeugt.
  • Bei der konkreten Ausführungsform von Figur 4 ist der Codebuchabschnitt 1 geteilt in M Codebücher (C&sub1;, C&sub2; ... CM), wobei jedes Codebuch aufgebaut ist aus N (N > 1) Gestaltvektoren.
  • Das in Figur 4 gezeigt System wird im weiteren Detail beschrieben werden. Bezug wird genommen in unabhäniger Weise auf M Codebücher C&sub1;, C&sub2; ..., CM, jeweils bestehend aus N Gestaltvektoren, ansprechend auf ein Index, der erzeugt wird von dem Entwicklungsabschnitt 5, wodurch N Codegestaltvektoren (Ck,1, Ck,2, ..., Ck,M ) erzeugt werden von dem Codebuchabschnitt 1.
  • D.h. wenn die Entwicklungseinheit 5 einen Index k erzeugt, der somit instruiert, daß ein k-ter Gestaltvektor ausgewählt wird von jedem der Codebücher C, werden k-te Gestaltvektoren erzeugt (Ck,1, Ck,2,... Ck,M), welche gespeichert werden in den M Codebüchern C&sub1;, C&sub2;, ..., CM. In diesem Fall sind die Gestaltvektoren, die in den Codebüchern gespeichert sind, verschieden voneinander, und daher werden M Gestaltvektoren ausgewählt zum Bilden von Vektoren, die alle verschieden voneinander sind. Bei dieser Ausführungsform wird die Anzahl von Codebüchern C bestimmt abhängig von der reproduzierten Sprachqualität, welche erforderlich sind. Die Vielzahl der Gestaltvektoren, die somit ausgewählt ist, wird multipliziert mit einem Gewichtungskoeffizienten gk, wird verarbeitet durch den Synthesefilter 3, und wird zusammenaddiert über den ersten Addierer 4 zum Erhalten eiens synthetisierten Gestaltvektors Yk,
  • Yk = g&sub1; x H x Ck,1 + g&sub2; x H x Ck,2 +.... + gM x H x Ck,M (3)
  • Ein Fehler wird gefunden zwischen diesem synthetisierten Vektor Yk und der Eingabesprache A, die zu quantisieren ist, und ein Index, der den Quadratfehler minimalisiert in der Entwicklungseinheit 5 und ein Verstärkungsvektor G in diesem Moment
  • G = (g&sub1;&sub1; g&sub2; ...gM) (4)
  • werden übertragen.
  • Dann repräsentiert, sogar wenn die Codebücher eine kleine Größe haben, der Vektor Yk, ausgedrückt durch eine Linearkombination der Gestaltvektoren Ck,1, Ck,2, ... Ck,M jeglichen Vektor im partiellen Raum einschließlich Gestaltvektoren Ck,1, Ck,2, ..., Ck,M, wie gezeigt in Figur 3(b), was im wesentlichen gleich dem Codebuch einer erhöhten Größe ist.
  • Deshalb können, wenn die Quantisierungsverzerrung gleich der des herkömmlichen großen Codebuchsystems akzeptierbar ist, die Codebücher eine Größe haben, die kleiner ist als die des herkömmlichen Systems.
  • Obwohl Figur 4 eine Schaltung zeigt auf der Empfangsseite nur im Kommunikationssystem, ist die Schaltung in der Praxis ebenfalls auf die gleiche Art und Weise auf der Empfangsseite errichtet. Wenn nämlich ein Verstärkungsdatenwert und ein Index-Datenwert, die durch die Entwicklungseinheit 5 bestimmt werden, übertragen werden, stellt die Empfangsseite in selektiver Weise den Codebuchabschnitt 1 und den Verstärkungsschaltungsabschnitt 2, welcher die variablen Verstärkungsschaltung beinhaltet, ein ansprechend auf diese Daten und reproduziert eine synthetisierte Sprache.
  • Bei der vorherigen Ausführungsform ist der Codebuchabschnitt ausgerüstet mit einer Vielzahl von Codebüchern (C&sub1; bis CM) zum Erzeugen einer Vielzahl von Gestaltvektoren ansprechend auf Index-Daten.
  • Figuren 5A und 5B zeigen eines Verstärkungsgestalt- Vektorquantisierungsvorrichtung basierend auf einem System, das verschieden ist von dem oben erwähnten. D.h. Figur 5A zeigt die Verstärkungsgestalt-Vektorquantisierungsvorrichtung gemäß einer weiteren Ausführungsform der vorliegenden Erfindung, wohingegen Figur 5B eine entsprechende Dekodiervorrichtung zeigt.
  • Bei der Ausführungsform von Figur 5A besteht der Codebuchabschnitt 1 aus einem Codebuch, das aus 5 Gestaltvektoren besteht, sowie einer Reihentabelle T, welche simultan M (M > 1) verschiedene Gestaltvektoren auswählt ansprechend auf einen Index, der erzeugt wird von der Entwicklungseinheit 5, nämlich in Figur 5 ist M = 2.
  • Wie klar erscheinen wird aus Figuren 5A und SB, besteht entweder auf der Kodiervorrichtungsseite oder der Dekodiervorrichtungsseite der Codebuchabschnitt 1 aus einem einzelnen Codebuch 11 mit einer L-Dimension und einer Größe 5 und einer Reihentabelle T, welcher einen Index j eines Codevektors erzeugt entsprechend einem Codevektor eines Indexes k (k = 1, 2, ..., S) (S' ≤ 5), wobei der Codevektor des Index j verschieden ist von einem vom Coedvektor des Index k.
  • j = T(k) (5)
  • D.h. ansprechend auf den Index k von der Entwicklungseinheit 5 erzeugt die Reihentabelle T einen neuen Index T(k) mit k als Funktion, und eine Vielzahl von verschiedenen Gestaltvektoren CT(k) wird ausgewählt ansprechend auf den Index T(k).
  • Bei dieser Ausführungsform halten k und T(k) eine geeignete Funktionsbeziehung aufrecht. Z.B. kann eine Gestaltvektor, welcher 2 ist, im voraus ausgewählt werden zu allen Zeiten ansprechend auf den Wert k. In diesem Fall ist T(k) k+2 bezüglich k.
  • Bei dieser Ausführungsform braucht weiterhin die Reihentabelle T nicht begrenzt sein auf eine, die einen neuen Index T(k) für den Index k erzeugt, sondern kann eine sein, die Vielzahl von Indices T (K&sub1;&sub1;), T(K&sub1;&sub2;) erzeugt.
  • Bei der Ausführungsform von Figur 5 wird Bezug genommen auf die Reihentabelle T zum Finden eines Index j = T(k) für einen Index k, der übertragen wird von der Entwicklungseinheit 5 auf der Kodiervorrichtungsseite oder der übertragen wird von der Entwicklungseinheit 5 auf der Kodiervorrichtungsseite, oder der übertragen wird von der Kodiervorrichtungsseite auf der Dekodiervorrichtungsseite, und zwei Gestaltvektoren Ck, CT(k) werden erhalten, welche dem Index k entsprechen.
  • Die Gestaltsvektoren Ck und CT(k) werden multipliziert mit den Verstärkungen gk, gT(k), und werden eingegeben an den Synthesefilter 3 zum Wiedererzeugen von Signalvektoren Dk, XT(k) von einer L-Dimension.
  • Dabei werden die Verstärkungen gk und gT(k) entsprechend den zwei Gestaltvektoren Ck, CT(k) entwickelt durch die Entwicklungseinheit 5 auf der Kodiervorrichtungsseite, die in Figur 5A gezeigt ist, um somit die Verzerrungsskala Dk des synthetisierten Vektors Yk
  • Yk = gk x H x Ck + gT(k x H x CT(k) (6)
  • und des Vektor A, der zu quantisieren ist, zu minimalisieren.
  • D.h. die Entwicklungseinheit 5 benutzt einen Euklidischen Abstand als eine Verzerrungsskala zum Finden einer Verzerrung Dk, d.h
  • Dk = A ≠ Yk ² (7)
  • Die Verzerrung Dk wird dann teilweise differenziert mit gk und gT(k) und wird auf Null gesetzt zum Finden von Verstärkungsvektoren gk und gT(k), welche die Verzerrung Dk minimalisieren.
  • Somit wird die Verzerrung Dk gefunden füf jeden der Indices k (k = 1 bis 5), und Indices k entsprechend Kombinationen der Gestaltvektoren Ck, CT(k, welche die kleinste Verzerrung ergeben, werden übertragen zusammen mit den Verstärkungsvektoren (gk, gT(k))
  • Auf der Dekodiervorrichtungsseite, die in Figur 5D gezeigt ist, wird andererseits auf die Reihentabelle T, welche dieselbe ist wie die der Kodiervorrichtungsseite, bezuggenommen durch den Index k zum Finden eines Index j = T(k). Dann wird auf das Codebuch 11 bezugsgenommen durch die Indices k und j zum Erhalten von Gestaltvektoren Ck und CT(k).
  • Dann werden die Gestaltvektoren multipliziert mit den Verstärkungen gk und gT(k), treten durch den Synthesefilter 3 und werden aufaddiert durch den Addierer 4 zum Wiedererzeugen eines Stimmvektors A', d.h.
  • A' = gk x H x Ck + gT(k) x H x CT(k) (8)
  • Bei der in Figur 5 A gezeigten Ausführungsform wird der Index k, der erzeugt wird von der Entwicklungseinheit 5, direkt eingegeben an den Codebuchabschnitt 11 und wird weiterhin eingegeben an die Reihentabelle T zum Erzeugen eines neuen Index T(k), wie oben beschrieben jedoch kann der Index k eingegeben werden an eine Vielzahl von Reihentabellen T&sub1;, T&sub2;, ..., TM nur zum Erzeugen einer Vielzahl von Indices T(k), T(k'), T(k") von jeder Reihentabelle.
  • Die Ausführungsform von Figur 5A hat zu tun gehabt mit dem Fall, in dem Indices aus einem Index gebildet wurden. Es muß jedoch nicht aufgezeigt werden, daß zwei oder mehr Indices gebildet werden können durch Schaffen einer Vielzahl von Reihentabellen T zum Realisieren einer Quantisierung mit weniger Verzerrung.
  • Bei den vorher erwähnten Ausführungsformen können die Synthesefilter 3&sub1; bis 3M im Synthesefilterabschnitt 3 aufgebaut sein durch einen Abstandsvorhersagefilter 13a für eine Langzeitkorrelation und einen LPC-Filter 13b zum Addieren einer Kurzzeitkorrelation, wie in Figur 1 gezeigt.
  • Der Synthesefilterabschnitt 3 war vorgesehen nach dem Verstärkungsabschnitt 2 bei den vorher erwähnten zwei Ausführungsformen. Es ist jedoch ebenfalls erlaubbar, den Verstärkungsschaltungsabschnitt 2 auf der Seite des ersten Addierers 4 vorzusehen und den Synthesefilterabschnitt 3 auf der Seite des Codebuchabschnitts 1 vorzusehen.
  • Wie in Figur 6 weiterhin gezeigt, können die Ausgaben des Verstärkungsschaltungsabschnitts 2 durchtreten gelassen werden durch den Synthesefilterabschnitt 2, welcher aus einem Synthesefilter 3 besteht, nachdem sie zusammenaddiert worden sind über den Addierer 4 auf der Empfangsseite, d.h. auf der Seite der Kodiervorrichtunge in der Ausführungsform von Figur 5B.
  • Gemäß der Verstärkungsgestalt- Verktorquantisierungsvorrichtung nach der vorliegenden Erfindung, wie oben beschrieben, werden eine Vielzahl von Gestaltvektoren definiert für einen Index, und Vektoren werden quantisiert unter Benutzung gewichteter und synthetisierter Vektoren, was es möglich macht, die Quantisierungsverzerrung abzusenken.
  • Weiterhin wird es durch Benutzung dieser Vielfachvektorsynthesetechnik möglich, die Größe des Codebuchs abzusenken, wobei die Quantisierungsverzerrung unterdrückt wird. Es ist deshalb erlaubt, die Speichermenge und die Arbeitsmenge zu reduzieren, was einen großen Vorteil zum Realisieren der Hardware bietet.

Claims (3)

1. Verstärkungsgestalt-Vektorquantisierungsvorrichtung, welche umfaßt:
einen Codebuchabschnitt (1), der Gestaltvektoren enthält, und der eine Vielzahl von Gestaltvektoren beim Empfang eines Indexsignals erzeugt;
einen Verstärkungsschaltungsabschnitt (2), aufgebaut aus einer Vielzahl von variablen Verstärkungsschaltungen, die spezielle Verstärkungen der Vielzahl der Gestaltvektoren auferlegen, welche von dem Codebuchabschnitt (1) erzeugt werden;
einen Synthesefilterabschnitt (3), aufgebaut aus einer Vielzahl von Synthesefiltern, die Signale reproduzieren von den Ausgaben der variablen Verstärkungsschaltungen in dem Verstärkungsschaltungsabschnitt (2);
einen ersten Addiererabschnitt (4), welcher die Signale aufaddiert, die reproduziert werden durch die Synthesefilter in dem Synthesefilterabschnitt (3);
einen zweiten Addiererabschnitt (12), welcher die invertierte Ausgabe des ersten Addiererabschnitts (4) und ein Eingabesprachsignal aufaddiert; und
eine Entwicklungseinheit (5), welche das Indexsignal bestimmt, das die Vielzahl der Gestaltvektoren auswählt, die gespeichert sind in dem Codebuchabschnitt und eine spezielle Verstärkung (g&sub1; ... gM) jeder der variablen Verstärkungsschaltung in den Verstärkungsschaltungsabschnitt (2) zuführt, um den Fehler zwischen der Ausgabe des ersten Addiererabschnitts (4) und dem Eingabesprachsignal, das in dem zweiten Addiererabschnitt (12) verarbeitet wird, zu minimalisieren.
2. Verstärkungsgestalt-Vektorquantisierungsvorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß der Codebuchabschnitt (1) aufgebaut ist aus einer Vielzahl (M) von Codebüchern, von denen jedes eine Vielzahl (N) von Gestaltvektoren hat.
3. Verstärkungsgestalt-Vektorquantisierungsvorrichtung nach Anspruch 1, dadurch gekennezeichnet, daß der Codebuchabschnitt (1) ein Codebuch hat mit einer Vielzahl von Gestaltvektoren, und eine Reihentabelle (T), welche simultan eine Vielzahl unähnlicher aus dem Codebuch ansprechend auf das Indexsignal, das von der Entwicklungseinheit (5) erzeugt wird, auswählt und erzeugt.
DE69023963T 1989-06-29 1990-06-29 Gerät zur Verstärkungs/Form-Vektorquantifizierung. Expired - Fee Related DE69023963T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1167397A JPH0332228A (ja) 1989-06-29 1989-06-29 ゲイン―シェイプ・ベクトル量子化方式

Publications (2)

Publication Number Publication Date
DE69023963D1 DE69023963D1 (de) 1996-01-18
DE69023963T2 true DE69023963T2 (de) 1996-05-23

Family

ID=15848944

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69023963T Expired - Fee Related DE69023963T2 (de) 1989-06-29 1990-06-29 Gerät zur Verstärkungs/Form-Vektorquantifizierung.

Country Status (5)

Country Link
US (1) US5086471A (de)
EP (1) EP0405584B1 (de)
JP (1) JPH0332228A (de)
CA (1) CA2019804C (de)
DE (1) DE69023963T2 (de)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384891A (en) * 1988-09-28 1995-01-24 Hitachi, Ltd. Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
JPH02287399A (ja) * 1989-04-28 1990-11-27 Fujitsu Ltd ベクトル量子化制御方式
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
JP2598159B2 (ja) * 1990-08-28 1997-04-09 三菱電機株式会社 音声信号処理装置
JP3077944B2 (ja) * 1990-11-28 2000-08-21 シャープ株式会社 信号再生装置
SE467806B (sv) * 1991-01-14 1992-09-14 Ericsson Telefon Ab L M Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare
US5182773A (en) * 1991-03-22 1993-01-26 International Business Machines Corporation Speaker-independent label coding apparatus
JP2690031B2 (ja) * 1991-07-08 1997-12-10 日本電信電話株式会社 利得形状ベクトル量子化方法
US5487086A (en) * 1991-09-13 1996-01-23 Comsat Corporation Transform vector quantization for adaptive predictive coding
US5280562A (en) * 1991-10-03 1994-01-18 International Business Machines Corporation Speech coding apparatus with single-dimension acoustic prototypes for a speech recognizer
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
US5754589A (en) * 1993-01-08 1998-05-19 Multi-Tech Systems, Inc. Noncompressed voice and data communication over modem for a computer-based multifunction personal communications system
US5453986A (en) 1993-01-08 1995-09-26 Multi-Tech Systems, Inc. Dual port interface for a computer-based multifunction personal communication system
US6009082A (en) * 1993-01-08 1999-12-28 Multi-Tech Systems, Inc. Computer-based multifunction personal communication system with caller ID
US7082106B2 (en) * 1993-01-08 2006-07-25 Multi-Tech Systems, Inc. Computer-based multi-media communications system and method
US5535204A (en) * 1993-01-08 1996-07-09 Multi-Tech Systems, Inc. Ringdown and ringback signalling for a computer-based multifunction personal communications system
US5452289A (en) * 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5617423A (en) * 1993-01-08 1997-04-01 Multi-Tech Systems, Inc. Voice over data modem with selectable voice compression
US5812534A (en) * 1993-01-08 1998-09-22 Multi-Tech Systems, Inc. Voice over data conferencing for a computer-based personal communications system
US5864560A (en) * 1993-01-08 1999-01-26 Multi-Tech Systems, Inc. Method and apparatus for mode switching in a voice over data computer-based personal communications system
US5546395A (en) * 1993-01-08 1996-08-13 Multi-Tech Systems, Inc. Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem
AU7960994A (en) * 1993-10-08 1995-05-04 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
US5757801A (en) * 1994-04-19 1998-05-26 Multi-Tech Systems, Inc. Advanced priority statistical multiplexer
US5682386A (en) 1994-04-19 1997-10-28 Multi-Tech Systems, Inc. Data/voice/fax compression multiplexer
US5592227A (en) * 1994-09-15 1997-01-07 Vcom, Inc. Method and apparatus for compressing a digital signal using vector quantization
JP3273455B2 (ja) * 1994-10-07 2002-04-08 日本電信電話株式会社 ベクトル量子化方法及びその復号化器
WO1997007436A1 (en) * 1995-08-11 1997-02-27 Randy Miles Widen Tidal watch
US5974387A (en) * 1996-06-19 1999-10-26 Yamaha Corporation Audio recompression from higher rates for karaoke, video games, and other applications
DE69737012T2 (de) * 1996-08-02 2007-06-06 Matsushita Electric Industrial Co., Ltd., Kadoma Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür
TW326070B (en) * 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
CN1371512A (zh) * 1998-12-01 2002-09-25 加利福尼亚大学董事会 增强型波形内插编码器
US6397175B1 (en) * 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
US6510407B1 (en) 1999-10-19 2003-01-21 Atmel Corporation Method and apparatus for variable rate coding of speech
JP2001166782A (ja) * 1999-12-07 2001-06-22 Nec Corp 報知信号発生方法及び装置
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3631520A (en) * 1968-08-19 1971-12-28 Bell Telephone Labor Inc Predictive coding of speech signals
US4133976A (en) * 1978-04-07 1979-01-09 Bell Telephone Laboratories, Incorporated Predictive speech signal coding with reduced noise effects
US4220819A (en) * 1979-03-30 1980-09-02 Bell Telephone Laboratories, Incorporated Residual excited predictive speech coding system
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
JPS6331222A (ja) * 1986-07-25 1988-02-09 Hitachi Ltd Pll回路
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
JPS6387034A (ja) * 1986-09-30 1988-04-18 Matsushita Electric Ind Co Ltd 符号化装置
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
EP0314018B1 (de) * 1987-10-30 1993-09-01 Nippon Telegraph And Telephone Corporation Verfahren und Vorrichtung für multiplexierte Vektorquantifizierung
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
JPH01191510A (ja) * 1988-01-27 1989-08-01 Nec Corp 聴感的重み付けフィルタ
JPH01243098A (ja) * 1988-03-25 1989-09-27 Hitachi Ltd 音声認識方法
DE68922134T2 (de) * 1988-05-20 1995-11-30 Nippon Electric Co Überträgungssystem für codierte Sprache mit Codebüchern zur Synthetisierung von Komponenten mit niedriger Amplitude.
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands

Also Published As

Publication number Publication date
CA2019804A1 (en) 1990-12-29
US5086471A (en) 1992-02-04
JPH0332228A (ja) 1991-02-12
EP0405584A2 (de) 1991-01-02
DE69023963D1 (de) 1996-01-18
EP0405584B1 (de) 1995-12-06
EP0405584A3 (en) 1991-04-24
CA2019804C (en) 1994-05-31

Similar Documents

Publication Publication Date Title
DE69023963T2 (de) Gerät zur Verstärkungs/Form-Vektorquantifizierung.
DE3750221T2 (de) Amplituden-adaptiver vektor-quantisierer.
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69125775T2 (de) Sprachkodierungs- und Dekodierungssystem
DE69015695T2 (de) Einrichtung zur Transformationskodierung.
DE69915400T2 (de) Vorrichtung zur Kodierung und Dekodierung von Audiosignalen
DE69030485T2 (de) Binärreflexivkodierer zur Vektorquantifizierung
DE69029120T2 (de) Stimmenkodierer
DE3784942T2 (de) Duplex-datenuebertragung.
DE69227570T2 (de) Verfahren und Anordnung zur Audiodatenkompression
DE69420431T2 (de) Sprachkodierungssystem
DE69227401T2 (de) Verfahren zum Kodieren und Dekodieren von Sprachsignalen
DE69317958T2 (de) Kodierer von Audiosignalen mit niedriger Verzögerung, unter Verwendung von Analyse-durch-Synthese-Techniken
DE69023411T2 (de) Vektorquantizierungskodierer und Dekodierer.
DE69032697T2 (de) Codierverfahren und Codiervorrichtung
DE69533577T2 (de) Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals
DE69724126T2 (de) Audiosignalkodier- und dekodierverfahren und audiosignalkodierer und -dekodierer
DE69932460T2 (de) Sprachkodierer/dekodierer
DE69014440T2 (de) Sprachcodierungs-/-decodierungssystem.
DE69029232T2 (de) System und Methode zur Sprachkodierung
DE60021083T2 (de) Verfahren zur verbesserung der kodierungseffizienz eines audiosignals
DE69013738T2 (de) Einrichtung zur Sprachcodierung.
DE4241131B4 (de) Einrichtung zum Kodieren und Dekodieren von Übertragungssignalen mittels Transformationen
DE3736193C2 (de)
DE69124210T2 (de) Einrichtung zur Signalcodierung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee