DE69910239T2 - Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale - Google Patents

Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale Download PDF

Info

Publication number
DE69910239T2
DE69910239T2 DE69910239T DE69910239T DE69910239T2 DE 69910239 T2 DE69910239 T2 DE 69910239T2 DE 69910239 T DE69910239 T DE 69910239T DE 69910239 T DE69910239 T DE 69910239T DE 69910239 T2 DE69910239 T2 DE 69910239T2
Authority
DE
Germany
Prior art keywords
pitch
code vector
filter
prediction error
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69910239T
Other languages
English (en)
Other versions
DE69910239D1 (de
Inventor
Bruno Bessette
Redwan Salami
Roch Lefebvre
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VoiceAge Corp
Original Assignee
VoiceAge Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4162966&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69910239(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by VoiceAge Corp filed Critical VoiceAge Corp
Publication of DE69910239D1 publication Critical patent/DE69910239D1/de
Application granted granted Critical
Publication of DE69910239T2 publication Critical patent/DE69910239T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Dc Digital Transmission (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Error Detection And Correction (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Package Frames And Binding Bands (AREA)
  • Installation Of Indoor Wiring (AREA)
  • Optical Communication System (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Preliminary Treatment Of Fibers (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Image Processing (AREA)
  • Coils Or Transformers For Communication (AREA)
  • Inorganic Insulating Materials (AREA)
  • Parts Printed On Printed Circuit Boards (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Television Systems (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Networks Using Active Elements (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung:
  • Die vorliegende Erfindung bezieht sich auf eine effiziente Technik zum digitalen Codieren eines Breitbandsignals, insbesondere aber nicht ausschließlich eines Sprachsignals, im Hinblick auf das Übertragen oder das Speichern und das Synthetisieren dieses Breitband-Tonsignals. Spezifischer beschäftigt sich die Erfindung mit einer verbesserten Tonhöhensuchvorrichtung und einem verbesserten Tonhöhensuchverfahren.
  • 2. Kurzbeschreibung des Standes der Technik:
  • Der Bedarf an effizienten digitalen Breitband-Sprach/Audio-Codierungstechniken mit einem guten Kompromiss bezüglich subjektiver Qualität/Bitrate nimmt für zahlreiche Anwendungen zu, wie z. B. sowohl Audio/Video-Telekonferenzen, Multimedia und drahtlose Anwendungen als auch Internet- und Paketnetz-Anwendungen. Bis vor kurzem wurden in Sprachcodierungsanwendungen hauptsächlich Telephonbandbreiten, die im Bereich von 200–3400 Hz gefiltert wurden, verwendet. Es gibt jedoch einen zunehmenden Bedarf an Breitbandsprachanwendungen, um die Verständlichkeit und Natürlichkeit der Sprachsignale zu vergrößern. Es wurde festgestellt, dass eine Bandbreite im Bereich von 50–7000 Hz für die Lieferung einer persönlichen Sprachqualität ausreichend ist. Für Audiosignale ergibt dieser Bereich eine annehmbare Audioqualität, aber immer noch niedriger als die CD-Qualität, die im Bereich 20–20000 Hz arbeitet.
  • Ein Sprachcodierer setzt ein Sprachsignal in einen digitalen Bitstrom um, der über einen Kommunikationskanal übertragen wird (oder in einem Speichermedium gespeichert wird). Das Sprachsignal wird digitalisiert (abgetastet und normalerweise mit 16 Bits pro Abtastwert quantisiert), wobei der Sprachcodierer die Aufgabe hat, diese digitalen Abtastwerte mit einer kleineren Anzahl von Bits darzustellen, während er eine gute subjektive Sprachqualität aufrechterhält. Der Sprachdecodierer oder Synthetisieren wirkt auf den übertragenen oder gespeicherten Bitstrom und setzt ihn wieder in ein Tonsignal um.
  • Eine der besten Techniken des Standes der Technik, die einen guten Qualität/Bitrate-Kompromiss erreichen kann, ist die so genannte codeerregte lineare Vorhersagetechnik (CELP-Technik). Als ein Beispiel offenbart EP-A-0 421 444 einen CELP-gestützten Codieren. Entsprechend dieser Technik wird das abgetastete Sprachsignal in aufeinander folgenden Blöcken aus L Abtastwerten verarbeitet, die normalerweise als Rahmen bezeichnet werden, wobei L irgendeine vorgegebene Zahl ist (die 10–30 ms der Sprache entspricht). In der CELP wird ein lineares Vorhersagesynthesefilter (LP-Synthesefilter) für jeden Rahmen berechnet und übertragen. Der Rahmen aus L Abtastwerten wird dann in kleinere Blöcke unterteilt, die als Unterrahmen mit der Größe von N Abtastwerten bezeichnet werden, wobei L = kN gilt, wobei k die Anzahl der Unterrahmen in einem Rahmen ist (N entspricht normalerweise 4–10 ms der Sprache). Ein Erregungssignal wird in jedem Unterrahmen bestimmt, das normalerweise aus zwei Komponenten besteht: eine aus der früheren Erregung (die außerdem als Tonhöhenbeitrag oder adaptives Codebuch oder Tonhöhen-Codebuch bezeichnet wird) und die andere von einem innovativen Codebuch (das außerdem als festes Codebuch bezeichnet wird). Dieses Erregungssignal wird übertragen und am Decodieren als die Eingabe des LP-Synthesefilters verwendet, um die synthetisierten Sprache zu erhalten.
  • Ein innovatives Codebuch im CELP-Kontext ist eine indexierte Menge aus Sequenzen, die N Abtastwerte lang sind, die als N-dimensionale Codevektoren bezeichnet werden. Jede Codebuch-Sequenz wird durch eine ganze Zahl k indexiert, die von 1 bis M variiert, wobei M die Größe des Codebuchs darstellt, die oft als eine Anzahl von Bits b dargestellt wird, wobei M = 2b gilt.
  • Um die Sprache entsprechend der CELP-Technik zu synthetisieren, wird jeder Block aus N Abtastwerten synthetisiert, indem ein geeigneter Codevektor aus dem Codebuch durch zeitveränderliche Filter gefiltert wird, die die spektralen Eigenschaften des Sprachsignals modellieren. Auf der Codiererseite wird die Syntheseausgabe für alle Codevektoren aus dem Codebuch oder eine Teilmenge der Codevektoren aus dem Codebuch berechnet (Codebuch-Suche). Der gehaltene Codevektor ist der eine, der die Syntheseausgabe erzeugt, die am genauesten am ursprünglichen Sprachsignal entsprechend einem wahrnehmungsmäßig gewichteten Verzerrungsmaß liegt. Diese wahrnehmungsmäßige Gewichtung wird unter Verwendung eines so genannten Wahrnehmungsgewichtungsfilters ausgeführt, das normalerweise aus dem LP-Synthesefilter abgeleitet wird.
  • Das CELP-Modell ist beim Codierern von Telephonband-Tonsignalen sehr erfolgreich gewesen, wobei mehrere CELP-gestützte Standards in einem weiten Bereich von Anwendungen, insbesondere in digitalen Zellenanwendungen, vorhanden sind. Im Telephonband wird das Tonsignal auf 200–3400 Hz bandbegrenzt und mit 8000 Abtastwerten/s abgetastet. In Breitband-Sprach/Audio-Anwendungen wird das Tonsignal auf 50–7000 Hz bandbegrenzt und mit 16000 Abtastwerten/s abgetastet.
  • Es ergeben sich einige Schwierigkeiten, wenn das für das Telephonband optimierte CELP-Modell auf Breitbandsignale angewendet wird, wobei zusätzliche Merkmale zu dem Modell hinzugefügt werden müssen, um Breitbandsignale in hoher Qualität zu erhalten. Breitbandsignale zeigen im Vergleich zu Telephonbandsignalen einen viel breiteren Dynamikbereich, der zu Genauigkeitsproblemen führt, wenn eine Festkomma-Implementierung des Algorithmus erforderlich ist (die in drahtlosen Anwendungen wesentlich ist). Ferner verbraucht das CELP-Modell oft die meisten seiner Codierungsbits im Niederfrequenzbereich, der normalerweise höhere Energieinhalte besitzt, dies führt zu einem Tiefpass-Ausgangssignal. Um dieses Problem zu überwinden, ist das Wahrnehmungsgewichtungsfilter zu modifizieren, damit es sich für Breitbandsignale eignet, wobei Vorverzerrungstechniken, die die Hochfrequenzbereiche verstärken, wichtig werden, um den Dynamikbereich zu verringern, dies ergibt eine einfachere Festkomma-Implementierung, und um eine bessere Codierung der Inhalte mit höheren Frequenzen des Signals zu sichern. Ferner erstrecken sich die Tonhöheninhalte im Spektrum stimmhafter Segmente in den Breitbandsignalen nicht über den ganzen Bereich des Spektrums, wobei der Betrag der Stimmhaftigkeit im Vergleich zum Schmalbandsignalen mehr Abweichung zeigt. Deshalb sind im Fall von Breitbandsignalen die vorhandenen Tonhöhensuchstrukturen nicht sehr effizient. Folglich ist es wichtig, die Tonhöhenanalyse mit geschlossener Schleife zu verbessern, um die Abweichungen im Stimmpegel besser unterzubringen.
  • DIE AUFGABEN DER ERFINDUNG
  • Es ist deshalb eine Aufgabe der vorliegenden Erfindung, ein Verfahren und eine Vorrichtung zum effizienten Codieren von Breitbandtonsignalen (7000 Hz) unter Verwendung von CELP-Codierungstechniken zu schaffen, die eine verbesserte Tonhöheninhalte verwenden, um rekonstruierte Tonsignale in hoher Qualität zu erhalten.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Spezifischer wird gemäß der vorliegenden Erfindung, wie sie in den Ansprüchen 1–63 beansprucht ist, ein Verfahren zum Auswählen einer optimalen Menge von Tonhöhencodebuch-Parametern, die einem Signalpfad, der den niedrigsten berechneten Tonhöhenvorhersagefehler besitzt, zugeordnet sind, aus wenigstens zwei Signalpfaden geschaffen. Der Tonhöhenvorhersagefehler wird in Reaktion auf einen Tonhöhencodevektor von einer Tonhöhencodebuch-Suchvorrichtung berechnet. In wenigstens einem der zwei Signalpfade wird der Tonhöhenvorhersagefehler gefiltert, bevor der Tonhöhencodevektor für die Berechnung des Tonhöhenvorhersagefehlers des einen Pfades geliefert wird. Schließlich werden die in den wenigstens zwei Signalpfaden berechneten Tonhöhenvorhersagefehler verglichen, der Signalpfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehler wird gewählt und die Menge der Codebuchparameter, die dem gewählten Signalpfad zugeordnet ist, wird ausgewählt.
  • Die Tonhöhenanalysevorrichtung der Erfindung zum Erzeugen einer optimalen Menge von Tonhöhencodebuch-Parametern umfasst:
    • a) wenigstens zwei Signalpfade, die jeweiligen Mengen von Tonhöhencodebuch-Parametern zugeordnet sind, wobei:
    • i) jeder Signalpfad eine Tönhöhenvorhersagefehler-Berechnungsvorrichtung zum Berechnen eines Tonhöhenvorhersagefehlers eines Tonhöhencodevektors von einer Tonhöhencodebuch-Suchvorrichtung umfasst; und
    • ii) wenigstens einer der beiden Pfade ein Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung des Pfades umfasst; und
    • b) eine Auswahleinrichtung zum Vergleichen der in den Signalpfaden berechneten Tonhöhenvorhersagefehler, um den Signalpfad auszuwählen, der den niedrigsten berechneten Tonhöhenvorhersagefehler hat, und um die Menge von Tonhöhencodebuch-Parametern, die dem ausgewählten Signalpfad zugeordnet sind, zu wählen.
  • Das neue Verfahren und die neue Vorrichtung, die die effiziente Modellierung der harmonischen Struktur des Sprachspektrums ausführen, verwenden mehrere Formen von Tiefpassfiltern, die auf die frühere Erregung angewendet werden, wobei diejenige, die die höhere Vorhersageverstärkung liefert, ausgewählt wird. Wenn die Unterabtast-Tonhöhenauflösung verwendet wird, können die Tiefpassfilter in die Interpolationsfilter aufgenommen sein, die verwendet werden, um die höhere Tonhöhenauflösung zu erhalten.
  • In einer bevorzugten Ausführungsform der Erfindung umfasst jede Tonhöhenvorhersagefehler-Berechnungsvorrichtung der obenbeschriebenen Tonhöhenanalysevorrichtung:
    • a) eine Faltungseinheit zum Falten des Tonhöhencodevektors mit einem gewichteten Synthetisierungsfilter-Impulsantwortsignal und daher zum Berechnen eines gefalteten Tonhöhencodevektors;
    • b) eine Tönhöhenverstärkungs-Berechnungseinrichtung zum Berechnen einer Tonhöhenverstärkung in Reaktion auf den gefalteten Tonhöhencodevektor und einen Tonhöhen-Suchzielvektor;
    • c) einen Verstärker zum Multiplizieren des gefalteten Tonhöhencodevektors mit der Tonhöhenverstärkung, um dadurch einen verstärkten gefalteten Tonhöhencodevektor zu erzeugen; und
    • d) eine Kombinationsschaltung zum Kombinieren des verstärkten gefalteten Tonhöhencodevektors mit dem Tonhöhen-Suchzielvektor, um dadurch den Tonhöhenvorhersagefehler zu erzeugen.
  • In einer weiteren bevorzugten Ausführungsform der Erfindung umfasst die Tonhöhenverstärkungs-Berechnungseinrichtung eine Einrichtung zum Berechnen der Tonhöhenverstärkung b(j) unter Verwendung der folgenden Beziehung: b(j) = xty(j)/||y(j)||2 wobei 0, 1, 2,..., K und wobei K einer Anzahl von Signalpfaden entspricht, und wobei x der Tonhöhen-Suchzielvektor ist und y(j) der gefaltete Tonhöhencodevektor ist.
  • Die vorliegende Erfindung bezieht sich ferner auf einen Codieren, der die obenbeschriebene Tonhöhenanalysevorrichtung besitzt, um ein Breitband-Eingangssignal zu codieren, wobei der Codieren umfasst:
    • a) eine Berechnungseinrichtung für ein lineares Vorhersagesynthetisierungs filter, das auf das Breitbandsignal anspricht, um Koeffizienten für ein lineares Vorhersagesynthetisierungsfilter zu erzeugen;
    • b) ein Wahrnehmungsgewichtungsfilter, das auf das Breitbandsignal und auf die Koeffizienten des linearen Vorhersagesynthetisierungsfilters anspricht, um ein durch Wahrnehmung gewichtetes Signal zu erzeugen;
    • c) einen Impulsantwortgenerator, der auf die Koeffizienten für das lineare Vorhersagesynthetisierungsfilter anspricht, um ein gewichtetes Synthetisierungsfilter-Impulsantwortsignal zu erzeugen;
    • d) eine Tonhöhen-Sucheinheit zum Erzeugen von Tonhöhencodebuch-Parametern, wobei die Tonhöhen-Sucheinheit umfasst:
    • i) die Tönhöhencodebuch-Suchvorrichtung, die auf das durch Wahrnehmung gewichtete Signal und auf die Koeffizienten für das lineare Vorhersagesynthetisierungsfilter anspricht, um den Tonhöhencodevektor und einen innovativen Suchzielvektor zu erzeugen; und
    • ii) die Tönhöhenanalysevorrichtung, die auf den Tönhöhencodevektor anspricht, um aus den Mengen von Tonhöhencodebuch-Parametern diejenige Menge von Tonhöhencodebuch-Parametern auszuwählen, die dem Pfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehler zugeordnet ist;
    • d) eine Vorrichtung zum Suchen eines innovativen Codebuchs, die auf das gewichtete Synthetisierungsfilter-Impulsantwortsignal und auf den innovativen Suchzielvektor anspricht, um innovative Codebuchparameter zu erzeugen, und
    • e) eine Signalformungsvorrichtung zum Erzeugen eines codierten Breitbandsignals, das die Menge von Tonhöhencodebuch-Parametern, die dem Pfad mit dem niedrigsten Tonhöhenvorhersagefehler zugeordnet sind, die innovativen Codebuchparameter und die Koeffizienten für das lineare Vorhersagesynthetisierungsfilterumfasst.
  • Die vorliegende Erfindung bezieht sich noch weiter auf ein Zellenkommunikationssystem, eine mobile Zellen-Sender/Empfänger-Einheit, ein Zellennetzelement und ein bidirektionales drahtloses Kommunikationsuntersystem, das den obenbeschriebenen Decodieren umfasst.
  • Die Aufgaben, Vorteile und anderen Merkmale der vorliegenden Erfindung werden durch das Lesen der folgenden nicht einschränkenden Beschreibung einer ihrer bevorzugten Ausführungsformen offensichtlicher, die lediglich beispielhaft unter Bezugnahme auf die beigefügte Zeichnung gegeben wird.
  • KURZBESCHREIBUNG DER ZEICHNUNG
  • In der beigefügten Zeichnung ist:
  • 1 ein schematischer Blockschaltplan einer bevorzugten Ausführungsform der Breitband-Codierungsvorrichtung;
  • 2 ein schematischer Blockschaltplan einer bevorzugten Ausführungsform der Breitband-Decodierungsvorrichtung;
  • 3 ein schematischer Blockschaltplan einer bevorzugten Ausführungsform der Tonhöhenanalysevorrichtung; und
  • 4 ein vereinfachter schematischer Blockschaltplan eines Zellenkommunikationssystems, in dem die Breitband-Codierungsvorrichtung nach 1 und die Breitband-Decodierungsvorrichtung nach 2 verwendet werden können.
  • AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORM
  • Wie den Durchschnittsfachleuten auf dem Gebiet wohl bekannt ist, schafft ein Zellenkommunikationssystem, wie z. B. 401 (siehe 4), einen Telekommunikationsdienst über einen großen geographischen Bereich, indem dieser große geographische Bereich in eine Anzahl C von kleineren Zellen unterteilt wird. Diese C kleineren Zellen können durch entsprechende Zellenbasisstationen 4021 , 4022 , ..., 402C bedient werden, um jede Zelle mit den Funkzeichengabe-, Audio- und Datenkanälen zu versehen.
  • Die Funkzeichengabe-Kanäle werden verwendet, um mobile Funktelephone (mobile Sender/Empfänger-Einheiten), wie z. B. 403, innerhalb der Grenzen des Versorgungsbereichs (der Zelle) der Zellenbasisstationen 402 zu rufen und um Anrufe zu anderen Funktelephonen 403, die sich entweder innerhalb oder außerhalb der Zelle der Basisstation befinden, oder zu einem anderen Netz, wie z. B. dem öffentlichen Fernsprechnetz (PSTN) 404, einzuleiten.
  • Sobald ein Funktelephon 403 einen Anruf erfolgreich eingeleitet oder empfangen hat, wird ein Audio- oder Datenkanal zwischen diesen Funktelephon 403 und der Zellenbasisstationen 402, die der Zelle entspricht, in der sich das Funktelephon 403 befindet, hergestellt, wobei die Kommunikation zwischen der Basisstation 402 und dem Funktelephon 403 über diesen Audio- oder Datenkanal geleitet wird. Das Funktelephon 403 kann außerdem Steuer- oder Synchronisierungsinformationen über einen Zeichengabekanal empfangen, während ein Anruf im Gange ist.
  • Falls ein Funktelephon 403 eine Zelle verlässt und in eine weitere benachbarte Zelle eintritt, während ein Anruf im Gange ist, reicht das Funktelephon 403 den Anruf an einen verfügbaren Audio- oder Datenkanal der neuen Zellenbasisstationen 402 weiter. Falls ein Funktelephon 403 eine Zelle verlässt und in eine weitere benachbarte Zelle eintritt, während kein Anruf im Gange ist, sendet das Funktelephon 403 eine Steuernachricht über den Zeichengabekanal, um sich in der Basisstation 402 der neuen Zelle einzubuchen. In dieser Weise ist eine Mobilkommunikation über einen weiten geographischen Bereich möglich.
  • Das Zellenkommunikationssystem 401 umfasst ferner ein Steuerendgerät 405, um die Kommunikation zwischen den Zellenbasisstationen 402 und dem PSTN 404 zu steuern, z. B. während einer Kommunikation zwischen einem Funktelephon 403 und dem PSTN 404 oder zwischen einem Funktelephon 403, das sich in einer ersten Zelle befindet, und einem Funktelephon 403, das sich in einer zweiten Zelle befindet.
  • Selbstverständlich ist ein bidirektionales drahtloses Funkkommunikations-Untersystem erforderlich, um einen Audio- oder Datenkanal zwischen einer Basisstation 402 einer Zelle und einem Funktelephon 403, das sich in dieser Zelle befindet, herzustellen. Wie in 4 in sehr vereinfachter Form veranschaulicht ist, umfasst ein derartiges bidirektionales drahtloses Funkkommunikations-Untersystem im Funktelephon 403 typischerweise:
    • – einen Sender 406, der enthält:
    • – einen Codieren 407, der das Sprachsignal codiert; und
    • – eine Sendeschaltung 408, die das codierte Sprachsignal vom Codieren 407 durch eine Antenne, wie z. B. 409, sendet; und
    • – einen Empfänger 410, der enthält:
    • – eine Empfangsschaltung 411, die ein gesendetes codiertes Sprachsignal normalerweise durch die gleiche Antenne 409 empfängt; und
    • – einen Decodieren 412, der das empfangene codierte Sprachsignal von der Empfangsschaltung 411 decodiert.
  • Das Funktelephon umfasst ferner andere herkömmliche Funktelephonschaltungen 413, mit denen der Codieren 407 und der Decodieren 412 verbunden sind und die die Signale von diesen verarbeiten, wobei diese Schaltungen 413 den Durchschnittsfachleuten auf dem Gebiet wohl bekannt sind, wobei sie demzufolge in der vorliegenden Beschreibung nicht weiter beschrieben sind.
  • Außerdem umfasst ein derartiges bidirektionales drahtloses Funkkommunikations-Untersystem in der Basisstation 402 typischerweise:
    • – einen Sender 414, der enthält:
    • – einen Codieren 415, der das Sprachsignal codiert; und
    • – eine Sendeschaltung 416, die das codierte Sprachsignal vom Codieren 415 durch eine Antenne, wie z. B. 417, sendet; und
    • – einen Empfänger 418, der enthält:
    • – eine Empfangsschaltung 419, die ein gesendetes codiertes Sprachsignal durch die gleiche Antenne 417 oder durch eine weitere (nicht gezeigte) Antenne empfängt; und
    • – einen Decodieren 420, der das empfangene codierte Sprachsignal von der Empfangsschaltung 419 decodiert.
  • Die Basisstation 402 umfasst ferner typischerweise eine Basisstations-Steuereinrichtung 421 zusammen mit ihrer zugeordneten Datenbank 422, die die Kommunikation zwischen dem Steuerendgerät 405 und dem Sender 414 und dem Empfänger 418 steuert.
  • Wie den Durchschnittsfachleuten auf dem Gebiet wohl bekannt ist, ist die Sprachcodierung erforderlich, um die Bandbreite zu reduzieren, die notwendig ist, um das Tonsignal, z. B. das Sprachsignal, wie z. B. die Sprache, über das bidirektionale drahtlose Funkkommunikations-Untersystem, d. h. zwischen einem Funktelephon 403 und einer Basisstation 402, zu übertragen.
  • Die LP-Sprachcodierer (wie z. B. 415 und 407) arbeiten typischerweise mit 13 kbit/s und darunter, wobei z. B. codeerregte lineare Vorhersagecodierer (CELP-Codieren) typischerweise ein LP-Synthesefilter verwenden, um die kurzfristige spektrale Enveloppe des Sprachsignals zu modellieren. Die LP-Informationen werden typischerweise alle 10 oder 20 ms zum Decodieren (wie z. B. 420 und 412) gesendet, wobei sie auf der Decodiererseite extrahiert werden.
  • Die in der vorliegenden Beschreibung offenbarten neuartigen Techniken können für verschiedene LP-gestützte Codierungssysteme gelten. In der bevorzugten Ausführungsform wird jedoch ein CELP-Codierungssystem für den Zweck verwendet, eine nichteinschränkende Veranschaulichung dieser Techniken darzustellen. In der gleichen Weise können derartige Techniken sowohl mit Tonsignalen, die anders als Stimme und Sprache sind, als auch mit anderen Typen von Breitbandsignalen verwendet werden.
  • 1 zeigt einen allgemeinen Blockschaltplan einer CELP-Sprachcodierungsvorrichtung 100, die modifiziert worden ist, um sie besser an Breitbandsignale anzupassen.
  • Das abgetastete Eingangssprachsignal 114 wird in aufeinander folgende Blöcke aus L Abtastwerten, die als "Rahmen" bezeichnet werden, unterteilt. In jedem Rahmen werden verschiedene Parameter, die das Sprachsignal in dem Rahmen darstellen, berechnet, codiert und übertragen. Die LP-Parameter, die das LP-Synthesefilter darstellen, werden normalerweise einmal für jeden Rahmen berechnet. Der Rahmen wird weiterhin kleinere Blöcke aus N Abtastwerten unterteilt (Blöcke der Länge N), in denen die Erregungsparameter (den Tonhöhe und die Innovation) bestimmt werden. In der CELP-Literatur werden diese Blöcke der Länge N als "Unterrahmen" bezeichnet, wobei die Signale aus N Abtastwerten in den Unterrahmen als N-dimensionale Vektoren bezeichnet werden. In dieser bevorzugten Ausführungsform entspricht die Länge N 5 ms, während die Länge L 20 ms entspricht, was bedeutet, dass ein Rahmen vier Unterrahmen enthält (N = 80 bei der Abtastrate von 16 kHz und 64 nach der Unterabtastung auf 12,8 kHz). In der Codierungsprozedur treten mehrere N-dimensionale Vektoren auf. Sowohl eine Liste der Vektoren, die in den 1 und 2 auftreten, als auch eine Liste der übertragenen Parameter sind im Folgenden angegeben:
  • Liste der wichtigsten N-dimensionalen Vektoren
    • s Breitbandsignal-Eingangssprachvektor (nach der Unterabtastung, Vorverarbeitung und Vorverzerrung);
    • sw gewichteter Sprachvektor;
    • s0 Nulleingangsverhalten des gewichteten Synthesefilters;
    • sp unterabgetastetes vorverarbeitetes Signal; überabgetastetes synthetisiertes Sprachsignal;
    • s' Synthesesignal vor der Rückentzerrung;
    • sd rückentzerrtes Synthesesignal;
    • sh Synthesesignal nach der Rückentzerrung und der Nachverarbeitung;
    • x Zielvektor für die Tonhöhensuche;
    • x' Zielvektor für die Innovationssuche;
    • h gewichtete Synthesefilter-Impulsantwort;
    • vT adaptiver Codebuchvektor (Tonhöhen-Codebuchvektor) bei der Verzögerung T
    • yT gefilterter Tonhöhen-Codebuchvektor (vT, gefaltet mit h);
    • ck innovativer Codevektor beim Index k (k-ter Eintrag vom Innovations-Codebuch);
    • cf verbesserter skalierter Innovations-Codevektor;
    • u Erregungssignal (skalierte Innovations- und Tonhöhen-Codevektoren);
    • u' verbesserte Erregung;
    • z Bandpass-Rauschsequenz;
    • w' weiße Rauschsequenz; und
    • w skalierte Rauschsequenz.
  • Liste der übertragenen Parameter
    • STP kurzfristige Vorhersageparameter (definieren A(z));
    • T Tonhöhennacheilung (oder Tonhöhen-Codebuchindex);
    • b Tonhöhenverstärkung (oder Tonhöhen-Codebuchverstärkung);
    • j Index des mit dem Tonhöhen-Codevektor verwendeten Tiefpassfilters;
    • k Codevektor-Index (Eintrag im Innovations-Codebuch); und
    • g Innovations-Codebuchverstärkung.
  • In dieser bevorzugten Ausführungsform werden die STP-Parameter einmal pro Rahmen übertragen, während der Rest der Parameter viermal pro Rahmen (jeden Unterrahmen) übertragen wird.
  • DIE CODIERERSEITE
  • Das abgetastete Sprachsignal wird durch die Codierungsvorrichtung 100 nach 1, die in elf von 101 bis 111 nummerierte Module aufgespalten ist, blockweise codiert.
  • Die Eingangssprache wird in den oben erwähnten Blöcken aus L Abtastwerten, die als Rahmen bezeichnet werden, verarbeitet.
  • In 1 wird das abgetastete Eingangssprachsignal 114 in einem Unterabtastmodul 101 unterabgetastet. Das Signal wird z. B. von 16 kHz auf 12,8 kHz unter Verwendung von den Durchschnittsfachleuten auf dem Gebiet wohl bekannten Techniken unterabgetastet. Die Unterabtastung herab zu einer anderen Frequenz ist selbstverständlich vorstellbar. Die Unterabtastung vergrößert den Codierungswirkungsgrad, weil eine kleinere Frequenzbandbreite codiert wird. Dies reduziert außerdem die algorithmische Komplexität, weil die Anzahl der Abtastwerte in einem Rahmen verringert wird. Die Verwendung der Unterabtastung wird signifikant, wenn die Bitrate unter 16 kbit/s reduziert wird, obwohl die Unterabtastung nicht wesentlich über 16 kbit/s liegt.
  • Nach der Unterabtastung wird der Rahmen aus 320 Abtastwerten von 20 ms auf einen Rahmen aus 256 Abtastwerten reduziert (Unterabtastverhältnis von 4/5).
  • Der Eingangsrahmen wird dann zum optionalen Vorverarbeitungsblock 102 gelie fert. Der Vorverarbeitungsblock 102 kann aus einem Hochpassfilter mit einer Grenzfrequenz von 50 Hz bestehen. Das Hochpassfilter 102 beseitigt unerwünschte Tonkomponenten unter 50 Hz.
  • Das unterabgetastete vorverarbeitete Signal wird durch sp(n), n = 0, 1, 2,..., L – 1, bezeichnet, wobei L die Länge des Rahmens ist (256 bei einer Abtastfrequenz von 12,8 kHz). In einer bevorzugten Ausführungsform des Vorverzerrungsfilters 103 wird das Signal sp(n) unter Verwendung eines Filters vorverzerrt, das die folgende Übertragungsfunktion besitzt: P(z) = 1 – μZ–1,wobei μ ein Vorverzerrungsfaktor mit einem Wert ist, der sich zwischen 0 und 1 befindet (ein typischer Wert ist μ = 0,7). Es könnte außerdem ein Filter höherer Ordnung verwendet werden. Es sollte darauf hingewiesen werden, dass das Hochpassfilter 102 und das Vorverzerrungsfilter 103 vertauscht werden können, um effizientere Festkomma-Implementierungen zu erhalten.
  • Die Funktion des Vorverzerrungfilters 103 ist, die Hochfrequenzinhalte des Eingangssignals zu verbessern. Es reduziert außerdem den Dynamikbereich des Eingangssprachsignals, das es für die Festkomma-Implementierung geeigneter wiedergibt. Ohne die Vorverzerrung ist die Festkomma-LP-Analyse unter Verwendung einfachgenauer Arithmetik schwierig zu implementieren.
  • Die Vorverzerrung spielt außerdem eine wichtige Rolle beim Erreichen einer passenden wahrnehmungsmäßigen Gesamtgewichtung des Quantisierungsfehlers, was zu einer verbesserten Tonqualität beiträgt. Dies ist im Folgenden ausführlicher erklärt.
  • Das Ausgangssignal des Vorverzerrungfilters 103 wird als s(n) bezeichnet. Dieses Signal wird für die Ausführung der LP-Analyse im Rechnermodul 104 verwendet. Die LP-Analyse ist eine den Durchschnittsfachleuten auf dem Gebiet wohl bekannte Technik. In dieser bevorzugten Ausführungsform wird der Autorkorrelationszugang verwendet. Im Autorkorrelationszugang wird das Signal s(n) zuerst unter Verwendung eines Hamming-Fensters (das normalerweise eine Länge in der Größenordnung von 30–40 ms besitzt) mit Fenstern versehen. Die Autokorrelationen werden aus dem mit Fenstern versehenen Signal berechnet, wobei die Levinson-Durbin-Rekursion verwendet wird, um die LP-Filterkoeffizienten ai zu berechnen, wobei i = 1,..., p gilt, und wobei p die LP-Ordnung ist, die in der Breitbandcodierung typischerweise 16 beträgt. Die Parameter ai sind die Koeffizienten der Übertragungsfunktion des LP-Filters, die durch die folgende Beziehung gegeben ist:
    Figure 00140001
  • Die LP-Analyse wird im Rechnermodul 104 ausgeführt, das außerdem die Quantisierung und die Interpolation der LP-Filterkoeffizienten ausführt. Die LP-Filterkoeftizienten werden zuerst in einen weiteren äquivalenten Bereich transformiert, der für die Zwecke der Quantisierung und Interpolation geeigneter ist. Der Linienspektralpaar-Bereich (LSP-Bereich) und der Immittanzspektralpaar-Bereich (ISP-Bereich) sind zwei Bereiche, in denen die Quantisierung und die Interpolation effizient ausgeführt werden können. Die 16 LP-Filterkoeffizienten ai können in der Größenordnung von 30 bis 50 Bits unter Verwendung der Spalt- oder Mehrstufen-Quantisierung oder einer Kombination daraus quantisiert werden. Der Zweck der Interpolation ist, die Aktualisierung der LP-Filterkoeffizienten für jeden Unterrahmen zu ermöglichen, während sie jedem Rahmen einmal übertragen werden, dies verbessert die Leistung des Codierers, ohne die Bitrate zu vergrößern. Es wird angenommen, dass die Quantisierung und die Interpolation der LP-Filterkoeffizienten den Durchschnittsfachleuten auf dem Gebiet anderweitig wohl bekannt sind, wobei sie demzufolge in der vorliegenden Beschreibung nicht weiter beschrieben sind.
  • Die folgenden Abschnitte beschreiben den Rest der auf einer Unterrahmen-Grundlage ausgeführten Codierungsoperationen. In der folgenden Beschreibung bezeichnet das Filter A(z) das nicht quantisierte interpolierte LP-Filter des Unterrahmens, während das Filter Â(z) das quantisierte interpolierte LP-Filter des Unterrahmens bezeichnet.
  • Die wahrnehmungsmäßige Gewichtung:
  • In den Analyse-während-der-Synthese-Codierern werden die optimalen Tonhöhen- und Innovationsparameter gesucht, indem der mittlere quadratische Fehler zwischen der Eingangssprache und der synthetisierten Sprache in einem wahrnehmungsmäßig gewichteten Bereich minimiert wird. Dies ist zum Minimieren des Fehlers zwischen der gewichteten Eingangssprache und der gewichteten Synthesesprache äquivalent.
  • Das gewichtete Signal sw(n) wird in einem Wahrnehmungsgewichtungsfilter 105 berechnet. Traditionell wird das gewichtete Signal sw(n) durch ein Gewichtungsfilter berechnet, das eine Übertragungsfunktion W(z) in der Form besitzt: W(z) = A(z/γ1)/A(z/γ2), wobei 0 < γ2 < γ1 ≤ 1 gilt.
  • Wie den Durchschnittsfachleuten auf dem Gebiet wohl bekannt ist, zeigt in den Analyse-während-der-Synthese-Codierern (AbS-Codierern) die Analyse, dass der Quantisierungsfehler durch eine Übertragungsfunktion W–1(z) gewichtet ist, die das Inverse der Übertragungsfunktion des Wahrnehmungsgewichtungsfilters 105 ist. Dieses Ergebnis ist von B. S. Atal und M. R. Schnöder in "Predictive coding of speech and subjective error criteria", IEEE Transaction ASSP, Bd. 27, Nr. 3, S. 247–254, Juni 1979, gut beschrieben. Die Übertragungsfunktion W–1(z) zeigt einiges der Formantenstruktur des Eingangssprachsignals. Folglich wird die Maskierungseigenschaft des menschlichen Ohrs ausgenutzt, indem der Quatisierungsfehler so geformt wird, dass er mehr Energie in den Formantenbereichen besitzt, in denen er durch die in diesen Bereichen vorhandene starke Signalenergie maskiert wird. Der Betrag der Gewichtung wird durch die Faktoren γ2 und γ1 gesteuert.
  • Das obige herkömmliche Wahrnehmungsgewichtungsfilter 105 arbeitet gut mit Telephonbandsignalen. Es ist jedoch festgestellt worden, dass dieses herkömmliche Wahrnehmungsgewichtungsfilter 105 für die effiziente wahrnehmungsmäßige Gewichtung von Breitbandsignalen nicht geeignet ist. Es ist außerdem festgestellt worden, dass das herkömmliche Wahrnehmungsgewichtungsfilter 105 inhärente Einschränkungen beim gleichzeitigen Modellieren der Formantenstruktur und der erforderlichen spektralen Neigung besitzt. Die spektrale Neigung ist in Breitbandsignalen, zurückzuführen auf den breiten Dynamikbereich zwischen den niedrigen und den hohen Frequenzen, ausgeprägter. Der Stand der Technik hat vorgeschlagen, ein Neigungsfilter in W(z) hinzuzufügen, um die Neigung und die Formantengewichtung des Breitband-Eingangssignals separat zu steuern.
  • Eine neuartige Lösung für dieses Problem ist, gemäß der vorliegenden Erfindung ein Vorverzerrungsfilter 103 am Eingang einzufügen, basierend auf der vorverzerrten Sprache s(n) das LP-Filter A(z) zu berechnen und ein modifiziertes Filter W(z) durch die Fixierung seines Nenners zu verwenden.
  • Die LP-Analyse wird im Modul 104 am vorverzerrten Signal s(n) ausgeführt, um das LP-Filter A(z) zu erhalten. Außerdem wird ein neues Wahrnehmungsgewichtungsfilter 105 mit festem Nenner verwendet. Ein Beispiel der Übertragungsfunktion für das Wahrnehmungsgewichtungsfilter 104 ist durch die folgende Beziehung gegeben: W(z) = A(z/γ1)/(1 – γ2z–1), wobei 0 < γ2 < γ1 ≤ 1 gilt.
  • Im Nenner kann eine höhere Ordnung verwendet werden. Diese Struktur entkoppelt im Wesentlichen die Formantengewichtung von der Neigung.
  • Es wird angemerkt, dass, weil A(z) basierend auf dem vorverzerrten Sprachsignal s(n) berechnet wird, die Neigung des Filters 1/A(z/γ1) im Vergleich zu dem Fall, in dem A(z) basierend auf der ursprünglichen Sprache berechnet wird, weniger ausgeprägt ist. Weil die Rückentzerrung auf der Decodiererseite unter Verwendung eines Filters ausgeführt wird, das die Übertragungsfunktion P–1(z) = 1(1 – μz–1)besitzt, wird das Spektrum des Quantisierungsfehlers durch ein Filter geformt, das eine Übertragungsfunktion W = (z)P–1 (z) besitzt. Wenn γ2 gleich μ gesetzt wird, was typischerweise der Fall ist, wird das Spektrum des Quantisierungsfehlers durch ein Filter geformt, dessen Übertragungsfunktion 1/A(z/γ1) ist, wobei A(z) basierend auf dem vorverzerrten Sprachsignal berechnet wird. Das subjektive Hören zeigte, dass diese Struktur, um die Fehlerformung einer Kombination der Vorverzerrung und der modifizierten Gewichtungsfilterung auszuführen, außer den Vorteilen der Leichtigkeit der algorithmischen Festkomma-Implementierung für die Codierung von Breitbandsignalen sehr effizient ist.
  • Die Tonhöhenanalyse:
  • Um die Tonhöhenanalyse zu vereinfachen, wird zuerst die Tonhöhennacheilung TOL mit offener Schleife im Tonhöhensuchmodul 106 mit offener Schleife unter Verwendung des gewichteten Sprachsignals sw(n) geschätzt. Dann wird die Tonhöhenanalyse mit geschlossener Schleife, die im Tonhöhensuchmodul 107 mit geschlossener Schleife auf einer Unterrahmen-Grundlage ausgeführt wird, um die Tonhöhennacheilung TOL mit offener Schleife eingeschränkt, was die Suchkom plexität der LTP-Parameter T und b (Tonhöhennacheilung und Tonhöhenverstärkung) signifikant reduziert. Die Tonhöhenanalyse mit offener Schleife wird im Modul 106 normalerweise einmal jede 10 ms (zwei Unterrahmen) unter Verwendung von Techniken ausgeführt, die den Durchschnittsfachleuten auf dem Gebiet wohl bekannt sind.
  • Der Zielvektor x für die LTP-Analyse (langfristige Vorhersage-Analyse) wird zuerst berechnet. Dies wird normalerweise ausgeführt, indem das Nulleingangsverhalten s0 des gewichteten Synthesefilters W(z)/Â(z) vom gewichteten Sprachsignal sw(n) subtrahiert wird. Dieses Nulleingangsverhalten s0 wird durch eine Nulleingangsverhalten-Berechnungseinrichtung 108 berechnet. Spezifischer wird der Zielvektor x unter Verwendung der folgenden Beziehung berechnet: x = sw – s0,wobei x der N-dimensionale Zielvektor ist, sw der gewichtete Sprachvektor im Unterrahmen ist und s0 das Nulleingangsverhalten des Filters W(z)/Â(z) ist, das die Ausgabe des kombinierten Filters W(z)/Â(z), zurückzuführen auf seine Anfangszustände, ist. Die Nulleingangsverhalten-Berechnungseinrichtung 108 berechnet in Reaktion auf das quantisierte interpolierte LP-Filter Â(z) aus der LP-Analyse-, Quantisierungs- und Interpolations-Berechnungseinrichtung 104 und die Anfangszustände des gewichteten Synthesefilters W(z)/Â(z), die im Speichermodul 111 gespeichert sind, das Nulleingangsverhalten s0 (den Teil des Verhaltens, der auf die Anfangszustände zurückzuführen ist, wie sie durch das Einstellen der Eingänge gleich null bestimmt sind) des Filters W(z)/Â(z). Diese Operation ist den Durchschnittsfachleuten auf dem Gebiet wohl bekannt, wobei sie demzufolge nicht weiter beschrieben ist.
  • Selbstverständlich können alternative aber mathematisch äquivalente Zugänge verwendet werden, um den Zielvektor x zu berechnen.
  • Ein N-dimensionaler Impulsantwort-Vektor h des gewichteten Synthesefilters W(z)/Â(z) wird im Impulsantwort-Generator 109 unter Verwendung der LP-Filterkoeffizienten A(z) und Â(z) vom Modul 104 berechnet. Abermals ist diese Operation den Durchschnittsfachleuten auf dem Gebiet wohl bekannt, wobei sie demzufolge in der vorliegenden Beschreibung nicht weiter beschrieben ist.
  • Die Tonhöhenparameter mit geschlossener Schleife (oder die Tonhöhencode buch-Parameter) b, T und j werden im Tonhöhensuchmodul 107 mit geschlossener Schleife berechnet, das den Zielvektor x, den Impulsantwort-Vektor h und die Tonhöhennacheilung TOL mit offener Schleife als Eingaben verwendet. Traditionell ist die Tonhöhenvorhersage durch ein Tonhöhenfilter dargestellt worden, das die folgende Übertragungsfunktion besitzt: 1/(1 – bz–T),wobei b die Tonhöhenverstärkung ist, während T die Tonhöhenverzögerung oder -nacheilung ist. In diesem Fall ist der Tonhöhenbeitrag zum Erregungssignal u(n) durch bu(n – T) gegeben, wobei die Gesamterregung durch u(n) = bu(n – T) + gck(n)gegeben ist, wobei g die innovative Codebuch-Verstärkung ist, während ck(n) der innovative Codevektor beim Index k ist.
  • Diese Darstellung besitzt Einschränkungen, falls die Tonhöhennacheilung T kürzer als die Unterrahmen-Länge N ist. In einer anderen Darstellung kann der Tonhöhenbeitrag als ein Tonhöhen-Codebuch gesehen werden, das das frühere Erregungssignal enthält. Im Allgemeinen ist jeder Vektor im Tonhöhen-Codebuch eine um eins verschobene Version des vorausgehenden Vektors (Verwerfen eines Abtastwertes und Hinzufügen eines neuen Abtastwertes). Für Tonhöhennacheilungen T > N ist das Tonhöhen-Codebuch zur Filterstruktur 1/(1 – bz–T) äquivalent, wobei ein Tonhöhen-Codebuchvektor vT(n) bei der Tonhöhennacheilung T durch vT(n) = u(n – T), n = 0,..., N – 1,gegeben ist. Für Tonhöhennacheilungen T, die kürzer als N sind, wird ein Vektor vT(n) aufgebaut, indem die verfügbaren Abtastwerte von der früheren Erregung wiederholt werden, bis der Vektor vollständig ist (dies ist zur Filterstruktur nicht äquivalent).
  • In neueren Codierern wird eine höhere Tonhöhenauflösung verwendet, die die Qualität der stimmhaften Tonsegmente signifikant verbessert. Dies wird erreicht, indem das frühere Erregungssignal unter Verwendung von mehrphasigen Interpolationsfiltern überabgetastet wird. In diesem Fall entspricht der Vektor vT(n) normalerweise einer interpolierten Version der früheren Erregung, wobei die Tonhöhennacheilung T eine nicht ganzzahlige Verzögerung ist (z. B. 50,25).
  • Die Tonhöhensuche umfasst das Feststellen der besten Tonhöhennacheilung T und der besten Tonhöhenverstärkung b, die den mittleren quadratischen gewichteten Fehler E zwischen dem Zielvektor x und der skalierten gefilterten früheren Erregung minimieren. Der Fehler E wird als: E = ||x – byT||2 ausgedrückt, wobei yT der gefilterte Tonhöhen-Codebuchvektor bei der Tonhöhennacheilung T ist:
    Figure 00190001
  • Es kann gezeigt werden, dass der Fehler E minimiert wird, indem das Suchkriterium maximiert wird
    Figure 00190002
    wobei t die Vektor-Transponierung bezeichnet.
  • In der bevorzugten Ausführungsform der vorliegenden Erfindung wird eine 1/3-Unterabtast-Tonhöhenauflösung verwendet, wobei die Tonhöhensuche (Tonhöhen-Codebuchsuche) aus drei Stufen aufgebaut ist.
  • In der ersten Stufe wird die Tonhöhennacheilung TOL mit offener Schleife in einem Tonhöhensuchmodul 106 mit offener Schleife in Reaktion auf das gewichtete Sprachsignal sW(n) geschätzt. Wie in der vorausgehenden Beschreibung angegeben worden ist, wird diese Tonhöhenanalyse mit offener Schleife normalerweise einmal jede 10 ms (zwei Unterrahmen) unter Verwendung von Techniken ausgeführt, die den Durchschnittsfachleuten auf dem Gebiet wohl bekannt sind.
  • In der zweiten Stufe wird das Suchkriterium C im Tonhöhensuchmodul 107 mit geschlossener Schleife für ganzzahlige Tonhöhennacheilungen um die geschätzte Tonhöhennacheilung TOL mit offener Schleife (normalerweise ±5) gesucht, was die Suchprozedur signifikant vereinfacht. Es wird eine einfache Prozedur verwendet, um den gefilterten Codevektor yT ohne die Notwendigkeit, die Faltung für jede Tonhöhennacheilung zu berechnen, zu aktualisieren.
  • Sobald eine optimale ganzzahlige Tonhöhennacheilung in der zweiten Stufe gefunden worden ist, prüft eine dritte Stufe der Suche (das Modul 107) die Bruchteile um diese optimale ganzzahlige Tonhöhennacheilung.
  • Wende der Tonhöhen-Prädiktor durch ein Filter der Form 1/(1 – bz–T) dargestellt wird, was eine gültige Annahme für. Tonhöhennacheilungen T > N ist, zeigt das Spektrum des Tonhöhenfilters eine harmonische Struktur über den ganzen Frequenzbereich mit einer harmonischen Frequenz, die mit 1/T in Beziehung steht. Im Fall von Breitbandsignalen ist diese Struktur nicht sehr effizient, weil die harmonische Struktur in Breitbandsignalen nicht das ganze ausgedehnte Spektrum abdeckt. Die harmonische Struktur ist nur bis zu einer bestimmten Frequenz vorhanden, abhängig vom Sprachsegment. Folglich muss, um eine effiziente Darstellung des Tonhöhenbeitrags in den stimmhaften Segmenten von Breitband-Sprache zu erreichen, das Tonhöhen-Vorhersagefilter die Flexibilität besitzen, den Betrag der Periodizität über das Breitbandspektrum zu variieren.
  • Ein neues Verfahren, das die effiziente Modellierung der harmonische Struktur des Sprachspektrums von Breitbandsignalen ausführt, ist in der vorliegenden Beschreibung offenbart, wodurch mehrere Formen von Tiefpassfiltern auf die frühere Erregung angewendet werden, wobei das Tiefpassfilter mit der höheren Vorhersageverstärkung ausgewählt wird.
  • Wenn die Unterabtast-Tonhöhenauflösung verwendet wird, können die Tiefpassfilter in die Interpolationsfilter aufgenommen werden, die verwendet werden, um die höhere Tonhöhenauflösung zu erhalten. In diesem Fall wird die dritte Stufe der Tonhöhensuche, in der die Bruchteile um die gewählte ganzzahlige Tonhöhennacheilung geprüft werden, für einige Interpolationsfilter wiederholt, die verschiedene Tiefpasskennlinien besitzen, wobei der Bruchteil und der Filterindex, die das Suchkriterium C maximieren, ausgewählt werden.
  • Ein einfacherer Zugang besteht darin, die Suche in den drei obenbeschriebenen Stufen abzuschließen, um die optimale gebrochene Tonhöhennacheilung unter Verwendung nur eines Interpolationsfilters mit einem bestimmten Frequenzgang zu bestimmen, und die optimale Tiefpass-Filterform am Ende auszuwählen, indem die verschiedenen vorgegebenen Tiefpassfilter auf den gewählten Tonhöhen-Codebuchvektor vT angewendet werden, und das Tiefpassfilter auszuwählen, das den Tonhöhen-Vorhersagefehler minimiert. Dieser Zugang ist im Folgenden ausführlich erörtert.
  • 3 veranschaulicht einen schematischen Blockschaltplan einer bevorzugten Ausführungsform des vorgeschlagenen Zugangs.
  • Im Speichermodul 303 ist das frühere Erregungssignal u(n), n < 0, gespeichert. Das Tonhöhen-Codebuch-Suchmodul 301 führt in Reaktion auf den Zielvektor x, die Tonhöhennacheilung TOL mit offener Schleife und das frühere Erregungssignal u(n), n < 0, vom Speichermodul 303 eine Tonhöhen-Codebuchsuche (Tonhöhen-Codebuchsuche) aus, die das oben definierte Suchkriterium C minimiert. Aus dem Ergebnis der im Modul 301 ausgeführten Suche erzeugt das Modul 302 den optimalen Tonhöhen-Codebuchvektor vT. Es wird angemerkt, dass, weil eine Unterabtast-Tonhöhenauflösung verwendet wird (gebrochene Tonhöhe), das frühere Erregungssignal u(n), n < 0, interpoliert wird, wobei der Tonhöhen-Codebuchvektor vT dem interpolierten früheren Erregungssignal entspricht. In dieser bevorzugten Ausführungsform besitzt das Interpolationsfilter (im Modul 301, aber nicht gezeigt) eine Tiefpassfilter-Kennlinie, die die Frequenzinhalte über 7000 Hz beseitigt.
  • In einer bevorzugten Ausführungsform werden K Filterkennlinien verwendet; diese Filterkennlinien könnten Tiefpassfilter- oder Bandpassfilter-Kennlinien sein. Sobald der optimale Codevektor vT bestimmt und durch den Tonhöhen-Codevektorgenerator 302 geliefert worden ist, werden K gefilterte Versionen von vT jeweils unter Verwendung K verschiedener Frequenzformungsfilter, wie z. B. 305(j) , berechnet, wobei j = 1, 2,..., K gilt. Diese gefilterten Versionen werden als v f (j) / f bezeichnet, wobei j = 1, 2,..., K gilt. Die verschiedenen Vektoren v (j) / f werden in entsprechenden Modulen 304(j) , wobei j = 1, 2,..., K gilt, mit der Impulsantwort h gefaltet, um die Vektoren y(j) zu erhalten, wobei j = 1, 2,..., K gilt. Um den mittleren quadratischen Tonhöhen-Vorhersagefehler für jeden Vektor y(j) zu berechnen, wird der Wert y(j) mittels eines entsprechenden Verstärkers 307(j) mit der Verstärkung b multipliziert, wobei der Wert by(j) vom Zielvektor x mittels eines entsprechenden Subtrahierers 308(j) subtrahiert wird. Die Wähleinrichtung 309 wählt das Frequenzformungsfilter 305(j), das den mittleren quadratischen Tonhöhen-Vorhersagefehler minimiert, e(j) = ||x – b(j)y(j)||2, j = 1, 2,...,K.
  • Um den mittleren quadratischen Tonhöhen-Vorhersagefehler e(j) für jeden Wert von y(j) zu berechnen, wird der Wert y(j) mittels eines entsprechenden Verstärkers 307(j) mit der Verstärkung b multipliziert, wobei der Wert b(j)y(j) mittels der Subtrahieren 308(j) vom Zielvektor x subtrahiert wird. Jede Verstärkung b(j) wird in einer entsprechenden Verstärkungsberechnungseinrichtung 306(j) in Verbindung mit dem Frequenzformungsfilter beim Index j unter Verwendung der folgenden Beziehung berechnet: b(j) = xty(j)/||y(j)||2.
  • In der Wähleinrichtung 309 werden die Parameter b, T und j basierend auf vT oder v (j) / f gewählt, was den mittleren quadratischen Vorhersagefehler e minimiert.
  • In 1 wird der Tonhöhen-Codebuchindex T codiert und zum Multiplexer 112 gesendet. Die Tonhöhenverstärkung b wird quantisiert und zum Multiplexer 112 gesendet. Bei diesem neuen Zugang sind zusätzliche Informationen notwendig, um den Index j des gewählten Frequenzformungsfilters im Multiplexer 112 zu codieren. Wenn z. B. drei Filter verwendet werden (j = 0, 1, 2, 3), dann sind zwei Bits notwendig, um diese Informationen darzustellen. Die Filterindexinformationen j können außerdem gemeinsam mit der Tonhöhenverstärkung b codiert werden.
  • Die innovative Codebuch-Suche:
  • Sobald die Tonhöhen- oder LTP-Parameter (die langfristigen Vorhersageparameter) b, T und j bestimmt worden sind, ist der nächste Schritt, mittels des Suchmoduls 110 nach 1 nach der optimalen innovativen Erregung zu suchen. Zuerst wird der Zielvektor x aktualisiert, indem der LTP-Beitrag subtrahiert wird: x' = x – byT,wobei b die Tonhöhenverstärkung ist, während yT der gefilterte Tonhöhen-Codebuchvektor ist (die frühere Erregung mit der Verzögerung T, gefiltert mit dem ausgewählten Tiefpassfilter und mit der Impulsantwort h gefaltet, wie unter Bezugnahme auf 3 beschrieben worden ist).
  • Die Suchprozedur in der CELP wird ausgeführt, indem der optimale Erregungs-Codevektor ck und die optimale Verstärkung g, die den mittleren quadratischen Fehler zwischen dem Zielvektor und dem skalierten gefilterten Codevektor minimieren, festgestellt werden, E = ||x' – gHck||2,wobei H eine aus dem Impulsantwort-Vektor h abgeleitete untere Dreiecks-Faltungsmatrix ist.
  • In der bevorzugten Ausführungsform der vorliegenden Erfindung wird die innovative Codebuch-Suche im Modul 110 mittels eines algebraischen Codebuchs ausgeführt, wie es in den US-Patenten Nr. 5.444.816 (Adoul u. a.), erteilt am 22. August 1995; 5.699.482, erteilt am 17. Dezember 1997 an Adoul u. a.; 5.754.976, erteilt am 19. Mai 1998 an Adoul u. a.; und 5.701.392 (Adoul u. a.), datiert vom 23. Dezember 1997, beschrieben ist.
  • Sobald der optimale Erregungs-Codevektor ck und seine Verstärkung g durch das Modul 110 gewählt worden sind, werden der Codebuch-Index k und die Verstärkung g codiert und zum Multiplexer 112 gesendet.
  • In 1 werden die Parameter b, T, j, Â(z), k und g durch den Multiplexer 112 multiplexiert, bevor sie durch einen Kommunikationskanal übertragen werden.
  • Die Speicheraktualisierung:
  • Im Speichermodul 111 (1) werden die Zustände des gewichteten Synthesefilters W(z)/Â(z) durch Filterung des Erregungssignals u = gck + bvT durch das gewichtete Synthesefilter aktualisiert. Nach dieser Filterung werden die Zustände des Filters gespeichert und im nächsten Unterrahmen als Anfangszustände für die Berechnung des Nulleingangsverhaltens im Rechnermodul 108 verwendet.
  • Wie im Fall des Zielvektors x können alternative aber mathematische äquivalente Zugänge, die den Durchschnittsfachleuten auf dem Gebiet wohl bekannt sind, verwendet werden, um die Filterzustände zu aktualisieren.
  • DIE DECODIERERSEITE
  • Die Sprachdecodierungsvorrichtung 200 nach 2 veranschaulicht die verschiedenen Schritte, die zwischen dem digitalen Eingang 222 (dem Eingangstrom zum Demultiplexer 217) und der abgetasteten Ausgangsprache 223 (die Ausgabe des Addierers 221) ausgeführt werden.
  • Der Demultiplexer 217 extrahiert die Synthesemodellparameter aus den vom digitalen Eingangskanal empfangenen binären Informationen. Aus jedem empfangenen binären Rahmen sind die extrahierten Parameter:
    • – die kurzfristigen Vorhersageparameter (STP-Parameter) Â(z) (einmal pro Rahmen);
    • – die langfristigen Vorhersageparameter (LTP-Parameter) T, b und j (für jeden Unterrahmen); und
    • – der Innovations-Codebuchindex k und die Verstärkung g (für jeden Unterrahmen).
  • Das aktuelle Sprachsignal wird basierend auf diesen Parametern synthetisiert, wie im Folgenden erklärt ist.
  • Das innovative Codebuch 218 erzeugt in Reaktion auf den Index k den Innovations-Codevektor ck, der durch einen Verstärker 224 durch den decodierten Verstärkungsfaktor g skaliert wird. In der bevorzugten Ausführungsform wird ein innovatives Codebuch 218, wie es in den oben erwähnten US-Patenten Nr. 5.444.816; 5.699.482; 5.754.976; und 5.701.392 beschrieben ist, verwendet, um den innovativen Codevektor ck darzustellen.
  • Der erzeugte skalierte Codevektor gck am Ausgang des Verstärkers 224 wird durch ein Innovationsfilter 205 verarbeitet.
  • Die Periodizitätsverbesserung:
  • Der erzeugte skalierte Codevektor am Ausgang des Verstärkers 224 wird durch eine frequenzabhängige Tonhöhen-Verbesserungseinrichtung 205 verarbeitet.
  • Die Verbesserung der Periodizität des Erregungssignals u verbessert die Qualität im Fall stimmhafter Segmente. Dies wurde in der Vergangenheit durch die Filterung des Innovationsvektors vom innovativen Codebuch (festen Codebuch) 218 durch ein Filter in der Form 1/(1 – εbz–1) ausgeführt, wobei e ein Faktor unter 0,5 ist, der den Betrag der eingeführten Periodizität steuert. Dieser Zugang ist in dem Fall von Breitbandsignalen weniger effizient, weil er die Periodizität über das ganze Spektrum einführt. Ein neuer alternativer Zugang, der Teil der vorliegenden Erfindung ist, ist offenbart, wodurch die Periodizitätsverbesserung durch Filterung des innovativen Codevektors ck vom innovativen (festen) Codebuch durch ein Innovationsfilter 205 (F(z)) ausgeführt wird, dessen Frequenzgang die höheren Frequenzen mehr als die niedrigeren Frequenzen hervorhebt. Die Koeffizienten von F(z) stehen mit dem Betrag der Periodizität im Erregungssignal u in Beziehung.
  • Es sind viele den Fachleuten auf dem Gebiet bekannte Verfahren verfügbar, um gültige Periodizitätskoeftizienten zu erhalten. Der Wert der Verstärkung b schafft z. B. eine Anzeige der Periodizität. Das heißt, falls die Verstärkung b nah bei 1 liegt, ist die Periodizität des Erregungssignals u hoch, während, falls die Verstärkung b kleiner als 0,5 ist, die Periodizität niedrig ist.
  • Einer weitere effiziente Art, die Koeffizienten des Filters F(z) abzuleiten, die in einer bevorzugten Ausführungsform verwendet wird, ist, sie mit dem Betrag des Tonhöhenbeitrags im Gesamterregungssignal u in Beziehung zu setzen. Dies führt zu einem Frequenzgang, der von der Unterrahmen-Periodizität abhängig ist, wobei für höhere Tonhöhenverstärkungen höhere Frequenzen stärker hervorgehoben werden (stärkere Gesamtneigung). Das Innovationsfilter 205 besitzt die Wirkung der Verringerung der Energie des innovativen Codevektors ck bei niedrigen Frequenzen, wenn das Erregungssignal u periodischer ist, was die Periodizität des Erregungssignals u bei niedrigeren Frequenzen mehr als bei höheren Frequenzen verbessert. Die vorgeschlagenen Formen des Innovationsfilters 205 sind (1) F(z) = 1 – σz–1 oder(2) F(z) = –αz + 1 – αz–1,wobei σ oder α Periodizitätsfaktoren sind, die vom Periodizitätsniveau des Erregungssignals u abgeleitet sind.
  • Die zweite Form von F(z) mit drei Termen wird in einer bevorzugten Ausführungsform verwendet. Der Periodizitätsfaktor α wird im Stimmfaktorgenerator 204 berechnet. Es können mehrere Verfahren verwendet werden, um den Periodizi tätsfaktor α basierend auf der Periodizität des Erregungssignals u abzuleiten. Zwei Verfahren sind im Folgenden dargestellt.
  • Das Verfahren 1:
  • Das Verhältnis des Tonhöhenbeitrags zum Gesamterregungssignal u wird zuerst im Stimmfaktorgenerator 204 durch
    Figure 00260001
    berechnet, wobei vT der Tonhöhen-Codebuchvektor ist, b die Tonhöhenverstärkung ist und u das Erregungssignal u ist, das am Ausgang des Addierers 219 durch u = gck + bvT gegeben ist.
  • Es wird angemerkt, dass der Term bvT seine Quelle im Tonhöhen-Codebuch (Tonhöhen-Codebuch) 201 in Reaktion auf die Tonhöhennacheilung T und den früheren Wert von u, der im Speicher 203 gespeichert ist, besitzt. Der Tonhöhen-Codevektor vT aus den Tonhöhen-Codebuch 201 wird dann durch ein Tiefpassfilter 202 verarbeitet, dessen Grenzfrequenz mittels des Index j vom Demultiplexer 217 eingestellt wird. Der resultierende Codevektor vT wird dann durch einen Verstärker 226 mit der Verstärkung b vom Demultiplexer 217 multipliziert, um das Signal bvT zu erhalten.
  • Der Faktor α wird durch den Stimmfaktorgenerator 204 durch
    α = qRp, beschränkt durch α < p
    berechnet, wobei q ein Faktor ist, der den Betrag der Verbesserung steuert (q ist in dieser bevorzugten Ausführungsform auf 0,25 gesetzt).
  • Das Verfahren 2:
  • Ein weiteres in einer bevorzugten Ausführungsform der Erfindung verwendetes Verfahren für die Berechnung des Periodizitätsfaktors α ist im Folgenden erörtert.
  • Zuerst wird im Stimmfaktorgenerator 204 ein Stimmfaktor rv durch rv = (Ev – Ec)/(Ev + Ec)berechnet, wobei Ev die Energie des skalierten Tonhöhen-Codevektors bvT ist und Ec die Energie des skalierten innovativen Codevektors gck ist. Das heißt,
    Figure 00270001
  • Es wird angemerkt, dass der Wert von rv zwischen –1 und 1 liegt (1 entspricht rein stimmhaften Signalen, während –1 rein stimmlosen Signalen entspricht).
  • In dieser bevorzugten Ausführungsform wird der Faktor α dann im Stimmfaktorgenerator 204 durch α = 0,125(1 + rv)berechnet, der einem Wert von 0 für rein stimmlose Signale und 0,25 für rein stimmhafte Signale entspricht.
  • In der ersten Form von F(z) mit zwei Termen kann der Periodizitätsfaktor σ unter Verwendung von σ = 2α in den obigen Verfahren 1 und 2 approximiert werden. In einem derartigen Fall wird der Periodizitätsfaktor σ im obigen Verfahren 1 wie folgt berechnet:
    σ = 2qRp, beschränkt durch σ < 2q.
  • Im Verfahren 2 wird der Periodizitätsfaktor σ wie folgt berechnet: σ = 0,25(1 + rv).
  • Das verbesserte Signal cf wird deshalb durch Filterung des skalierten innovativen Codevektors gck durch das Innovationsfilter 205 (F(z)) berechnet.
  • Das verbesserte Erregungssignal u' wird durch den Addieren 220 als: u' = cf + bvT berechnet.
  • Es wird angemerkt, dass dieser Prozess nicht im Codierer 100 ausgeführt wird. Folglich ist es wesentlich, die Inhalte des Tonhöhen-Codebuchs 201 unter Verwendung des Erregungssignals u ohne Verbesserung zu aktualisieren, um die Synchronisation zwischen dem Codierer 100 und den Decodieren 200 zu erhalten. Deshalb wird das Erregungssignal u verwendet, um den Speicher 203 des Tonhöhen-Codebuchs 201 zu aktualisieren, während das verbesserte Erregungssignal u' am Eingang des LP-Synthesefilters 206 verwendet wird.
  • Die Synthese und die Rückentzerrung
  • Das synthetisierte Signal s' wird durch Filterung des verbesserten Erregungssignals u' durch das LP-Synthesefilter 206 berechnet, das die Form 1/Â(z) besitzt, wobei A(z) das interpolierte LP-Filter im aktuellen Unterrahmen ist. Wie in 2 ersichtlich ist, werden die quantisierten LP-Koeffizienten Â(z) auf der Leitung 225 vom Demultiplexer 217 zum LP-Synthesefilter 206 geliefert, um die Parameter des LP-Synthesefilters 206 dementsprechend einzustellen. Das Rückentzerrungsfilter 207 ist das Inverse des Vorverzerrungsfilters 103 nach 1. Die Übertragungsfunktion des Rückentzerrungsfilters 207 ist durch D(z) = 1/(1 – μz–1)gegeben, wobei μ ein Vorverzerrungsfaktor mit einem Wert ist, der sich zwischen 0 und 1 befindet (ein typischer Wert ist μ = 0,7). Es könnte außerdem ein Filter höherer Ordnung verwendet werden.
  • Der Vektor s' wird durch das Rückentzerrungsfilter D(z) (das Modul 207) gefiltert, um den Vektor sd zu erhalten, der durch das Hochpassfilter 208 geleitet wird, um die unerwünschten Frequenzen unter 50 Hz zu entfernen und ferner sh zu erhalten.
  • Die Überabtastung und die Hochfrequenz-Regenerierung
  • Das Überabtastmodul 209 führt den inversen Prozess des Unterabtastmoduls 101 nach 1 aus. In dieser bevorzugten Ausführungsform setzt die Überabtastung von der 12,8-kHz-Abtastrate zur ursprünglichen 16-kHz-Abtastrate unter Verwendung von Techniken um, die den Durchschnittsfachleuten auf dem Gebiet wohl bekannt sind. Das überabgetastete Synthesesignal wird als ŝ bezeichnet. Das Signal ŝ wird außerdem als das synthetisierte Breitband-Zwischensignal bezeichnet.
  • Das überabgetastete Synthesesignal ŝ enthält nicht die höheren Frequenzkomponenten, die durch den Unterabtastprozess (das Modul 101 nach 1) im Codieren 100 verloren wurden. Dies ergibt eine Tiefpass-Wahrnehmung des synthetisierten Sprachsignals. Um das volle Band des ursprünglichen Signals wiederherzustellen, wird eine Hochfrequenz-Erzeugungsprozedur offenbart. Diese Prozedur wird in den Modulen 210 bis 216 und dem Addieren 221 ausgeführt, wobei sie die Eingabe vom Stimmfaktorgenerator 204 (2) erfordert.
  • In diesem neuen Zugang werden die Hochfrequenzinhalte erzeugt, indem der obere Teil des Spektrums mit einem weißen Rauschen gefüllt wird, das im Erregungsbereich passend skaliert und dann in den Sprachbereich umgesetzt wird, vorzugsweise, indem es mit dem gleichen LP-Synthesefilter geformt wird, das für das Synthetisieren des unterabgetasteten Signals ŝ verwendet wird.
  • Die Hochfrequenz-Erzeugungsprozedur gemäß der vorliegenden Erfindung im Folgenden beschrieben.
  • Der Zufallsrauschgenerator 213 erzeugt unter Verwendung von Techniken, die den Durchschnittsfachleuten auf dem Gebiet wohl bekannt sind, eine weiße Rauschsequenz w' mit einem ebenen Spektrum über die ganze Frequenzbandbreite. Die erzeugte Sequenz besitzt die Länge M, die die Unterrahmen-Länge im ursprünglichen Bereich ist. Es wird angemerkt, dass N die Unterrahmen-Länge im unterabgetasteten Bereich ist. In dieser bevorzugten Ausführungsform gilt N = 64 und N' = 80, was 5 ms entspricht.
  • Die weiße Rauschsequenz wird im Verstärkungseinstellmodul 214 passend skaliert. Die Verstärkungseinstellung umfasst die folgenden Schritte. Zuerst wird die Energie der erzeugten weißen Rauschsequenz w' gleich Energie des verbesserten Regungssignals u' gesetzt, die durch ein Energieberechnungsmodul 210 berechnet wird, wobei die resultierende skalierte Rauschsequenz durch
    Figure 00300001
    n = 0,..., M – 1, gegeben ist.
  • Der zweite Schritt bei der Verstärkungsskalierung ist, die Hochfrequenzeninhalte das synthetisierten Signals am Ausgang des Stimmfaktorgenerators 204 zu berücksichtigen, um die Energie des erzeugten Rauschens im Fall von stimmhaften Segmenten (wo im Vergleich zu stimmlosen Segmenten wenige Energie bei hohen Frequenzen vorhanden ist) zu reduzieren. In dieser bevorzugten Ausführungsform ist das Messen der Hochfrequenzinhalte durch das Messen der Neigung des Synthesesignals durch eine Spektralneigungs-Berechnungseinrichtung 212 und die Reduzierung der Energie dementsprechend implementiert. Andere Messungen, wie z. B. Nulldurchgangsmessungen, können ebenso verwendet werden. Wenn die Neigung sehr stark ist, was stimmhaften Segmenten entspricht, wird die Rauschenergie weiter reduziert. Der Neigungsfaktor wird im Modul 212 als der erste Korrelationskoeffizient des Synthesesignals sh berechnet, wobei er durch
    Figure 00300002
    abhängig von Neigung ≥ 0 und Neigung ≥ rv, gegeben ist, wobei der Stimmfaktor rv durch rv = (Ev – Ec)/(Ev + Ec)gegeben ist, wobei Ev die Energie des skalierten Tonhöhen-Codevektors bvT ist und Ec die Energie des skalierten innovativen Codevektors gck ist, wie vorausgehend beschrieben worden ist. Der Stimmfaktor rv ist am häufigsten kleiner als die Neigung, aber diese Bedingung wurde als eine Vorsichtsmaßnahme fegen Hochfrequenztöne eingeführt, bei denen der Neigungswert negativ und der Wert von rv hoch ist. Deshalb reduziert diese Bedingung die Rauschenergie für derartige Klangsignale.
  • Der Neigungswert ist im Fall eines ebenen Spektrums 0 und im Fall stark stimmhafter Signale 1, während er im Fall stimmloser Signale negativ ist, in denen bei hohen Frequenzen mehr Energie vorhanden ist.
  • Es können verschiedene Verfahren verwendet werden, um den Skalierungsfaktor gf aus der Menge der Hochfrequenzinhalte abzuleiten. In dieser Erfindung werden zwei Verfahren basierend auf der obenbeschriebenen Neigung des Signals angegeben.
  • Das Verfahren 1:
  • Der Skalierungsfaktor gt wird aus der Neigung durch
    gt = 1 – Neigung, beschränkt durch 0,2 ≤ gt ≤ 1,0
    abgeleitet. Für stark stimmhafte Signale, bei denen sich die Neigung 1 nähert, ist gt 0,2, während für stark stimmlose Signale gt 1,0 wird.
  • Das Verfahren 2:
  • Der Neigungsfaktor gt wird zuerst eingeschränkt, damit er größer oder gleich null ist, wobei dann der Skalierungsfaktoren aus der Neigung durch gt = 10–0,6Neigung abgeleitet wird.
  • Die im Verstärkungseinstellmodul 214 erzeugte skalierte Rauschsequenz wg ist deshalb durch wg = gtwgegeben.
  • Wenn sich die Neigung nahe bei null befindet, ist der Skalierungsfaktor gt nahe bei 1, was nicht zu einer Energiereduzierung führt. Wenn der Neigungswert 1 ist, führt der Skalierungsfaktor gt zu einer Reduzierung von 12 dB in der Energie des erzeugten Rauschens.
  • Sobald das Rauschen (wg) passend skaliert ist, wird es unter Verwendung der spektralen Formungseinrichtung 215 in den Sprachbereich gebracht. In der bevorzugten Ausführungsform wird dies durch Filterung des Rauschens wg durch eine bandbreitenerweiterte Version des gleichen LP-Synthesefilters ausgeführt, das im unterabgetastetem Bereich verwendet wird (1/Â(z/0,8)). Die entsprechenden bandbreitenerweiterten LP-Filterkoeffizienten werden in der spektralen Formungseinrichtung 215 berechnet.
  • Die gefilterte skalierte Rauschsequenz wf wird dann in den erforderlichen Frequenzbereich bandpassgefiltert, um unter Verwendung des Bandpassfilters 216 wiederhergestellt zu werden. In der bevorzugten Ausführungsform schränkt das Bandpassfilter 216 die Rauschsequenz auf den Frequenzbereich 5,6–7,2 kHz ein. Die resultierende bandpassgefilterte Rauschsequenz r wird im Addieren 221 zum überabgetasteten synthetisierten Sprachsignal ŝ addiert, um das endgültige rekonstruierte Tonsignal sout am Ausgang 223 zu erhalten.
  • Obwohl die vorliegende Erfindung vorausgehend mittels einer ihrer bevorzugten Ausführungsformen beschrieben worden ist, kann diese Ausführungsform nach Wunsch innerhalb des Umfangs der beigefügten Ansprüche modifiziert werden. Auch wenn die bevorzugte Ausführungsform die Verwendung von Breitband-Sprachsignalen erörtert, wird es für die Fachleute auf dem Gebiet offensichtlich sein, dass der Erfindungsgegenstand außerdem auf andere Ausführungsformen unter Verwendung von Breitbandsignalen im Allgemeinen gerichtet ist, und dass er nicht notwendigerweise auf Sprachanwendungen eingeschränkt ist.

Claims (63)

  1. Tonhöhenanalysevorrichtung zum Erzeugen einer optimalen Menge von Tonhöhencodebuch-Parametern in Reaktion auf ein Breitbandsignal, die umfaßt: a) wenigstens zwei Signalpfade, die jeweiligen Mengen von Tonhöhencodebuch-Parametern zugeordnet sind, wobei: i) jeder Signalpfad eine Tonhöhenvorhersagefehler-Berechnungsvorrichtung (307, 308) zum Berechnen eines Tonhöhenvorhersagefehlers eines Tonhöhencodevektors von einer Tonhöhencodebuch-Suchvorrichtung (301) umfaßt; und ii) wenigstens einer der beiden Pfade ein Filter (305) zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung des einen Pfades umfaßt; und b) eine Auswahleinrichtung (309) zum Vergleichen der in den wenigstens zwei Signalpfaden berechneten Tonhöhenvorhersagefehler, um den Signalpfad auszuwählen, der den niedrigsten berechneten Tonhöhenvorhersagefehler hat, und um die Menge von Tonhöhencodebuch-Parametern, die dem ausgewählten Signalpfad zugeordnet sind, zu wählen.
  2. Tonhöhenanalysevorrichtung nach Anspruch 1, bei der einer der wenigstens zwei Pfade kein Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt.
  3. Tonhöhenanalysevorrichtung nach Anspruch 1, bei der die Signalpfade mehrere Signalpfade umfassen, wovon jeder mit einem Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung desselben Pfades versehen ist.
  4. Tonhöhenanalysevorrichtung nach Anspruch 3, bei der die Filter der mehreren Pfade aus der Gruppe ausgewählt sind, die aus Tiefpaß- und Bandpaßfiltern besteht, und bei der die Filter unterschiedliche Frequenzgänge besitzen.
  5. Tonhöhenanalysevorrichtung nach Anspruch 1, bei der jede Tonhöhenvor hersagefehler-Berechnungsvorrichtung umfaßt: a) eine Faltungseinheit zum Falten des Tonhöhencodevektors mit einem gewichteten Synthetisierungsfilter-Impulsantwortsignal und daher zum Berechnen eines gefalteten Tonhöhencodevektors; b) eine Tonhöhenverstärkungs-Berechnungseinrichtung zum Berechnen einer Tonhöhenverstärkung in Reaktion auf den gefalteten Tonhöhencodevektor und einen Tonhöhen-Suchzielvektor; c) einen Verstärker zum Multiplizieren des gefalteten Tonhöhencodevektors mit der Tonhöhenverstärkung, um dadurch einen verstärkten gefalteten Tonhöhencodevektor zu erzeugen; und d) eine Kombinationsschaltung zum Kombinieren des verstärkten gefalteten Tonhöhencodevektors mit dem Tonhöhen-Suchzielvektor, um dadurch den Tonhöhenvorhersagefehler zu erzeugen.
  6. Tonhöhenanalysevorrichtung nach Anspruch 5, bei der die Tonhöhenverstärkungs-Berechnungseinrichtung eine Einrichtung zum Berechnen der Tonhöhenverstärkung b(j) unter Verwendung der folgenden Beziehung umfaßt: b(j) = xty(j)/||y(j)||2 wobei j = 0, 1, 2,..., K und wobei K einer Anzahl von Signalpfaden entspricht, und wobei x der Tonhöhen-Suchzielvektor ist und y(j) der gefaltete Tonhöhencodevektor ist.
  7. Tonhöhenanalysevorrichtung nach Anspruch 1, bei der die Tonhöhenvorhersagefehler-Berechnungsvorrichtung jedes Signalpfades eine Einrichtung zum Berechnen einer Energie des entsprechenden Tonhöhenvorhersagefehlers umfaßt und bei der die Auswahleinrichtung eine Einrichtung zum Vergleichen der Energien der Tonhöhenvorhersagefehler der verschiedenen Signalpfade und zum Wählen des Signalpfades mit der niedrigsten berechneten Energie des Tonhöhenvorhersagefehlers als den Signalpfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehlerumfaßt.
  8. Tonhöhenanalysevorrichtung nach Anspruch 5, bei der: a) jedes der Filter der mehreren Signalpfade durch einen Filterindex identifiziert wird; b) der Tonhöhencodevektor durch einen Tonhöhencodebuch-Index identifiziert wird; und c) die Tonhöhencodebuch-Parameter den Filterindex, den Tonhöhencodebuch-Index und die Tonhöhenverstärkung umfassen.
  9. Tonhöhenanalysevorrichtung nach Anspruch 1, bei der das Filter in ein Interpolationsfilter der Tonhöhencodebuch-Suchvorrichtung integriert ist, wobei das Interpolationsfilter verwendet wird, um eine Unterabtast-Version des Tonhöhencodevektors zu erzeugen.
  10. Tonhöhenanalyseverfahren zum Erzeugen einer optimalen Menge von Tonhöhencodebuch-Parametern in Reaktion auf ein Breitbandsignal, das umfaßt: a) in wenigstens zwei Signalpfaden, die jeweiligen Mengen von Tonhöhencodebuch-Parametern zugeordnet sind, Berechnen eines Tonhöhenvorhersagefehlers eines Tonhöhencodevektors von einer Tonhöhencodebuch-Suchvorrichtung für jeden Signalpfad; b) in wenigstens einem der zwei Signalpfade Filtern des Tonhöhencodevektors, bevor der Tonhöhencodevektor geliefert wird, um den Tonhöhenvorhersagefehler des einen Pfades zu berechnen; und c) Vergleichen der Tonhöhenvorhersagefehler, die in den wenigstens zwei Signalpfaden berechnet werden, Wählen des Signalpfades mit dem niedrigsten berechneten Tonhöhenvorhersagefehler und Auswählen der Menge von Tonhöhencodebuch-Parametern, die dem gewählten Signalpfad zugeordnet sind.
  11. Tonhöhenanalyseverfahren nach Anspruch 10, bei dem in einem der wenigstens zwei Pfade keine Filterung des Tonhöhencodevektors ausgeführt wird, bevor der Tonhöhencodevektor zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung geliefert wird.
  12. Tonhöhenanalyseverfahren nach Anspruch 10, bei dem die Signalpfade mehrere Signalpfade umfassen und bei dem das Filtern des Tonhöhencodevektors in jedem der mehreren Signalpfade ausgeführt wird, bevor der Tonhöhencodevektor zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung desselben Pfades geliefert wird.
  13. Tonhöhenanalyseverfahren nach Anspruch 12, das ferner das Auswählen der Filter der mehreren Pfade aus der Gruppe, die aus Tiefpaß- und Bandpaßfiltern besteht, umfaßt und bei dem die Filter unterschiedliche Frequenzgänge besitzen.
  14. Tonhöhenanalyseverfahren nach Anspruch 10, bei dem das Berechnen eines Tonhöhenvorhersagefehlers in jedem Signalpfad umfaßt: a) Falten des Tonhöhencodevektors mit einem gewichteten Synthetisierungsfilter-Impulsantwortsignal und daher Berechnen eines gefalteten Tonhöhencodevektors; b) Berechnen einer Tonhöhenverstärkung in Reaktion auf den gefalteten Tonhöhencodevektor und einen Tonhöhen-Suchzielvektor; c) Multiplizieren des gefalteten Tonhöhencodevektors mit der Tonhöhenverstärkung, um dadurch einen verstärkten gefalteten Tonhöhencodevektor zu erzeugen; und d) Kombinieren des verstärkten gefalteten Tonhöhencodevektors mit dem Tonhöhen-Suchzielvektor, um dadurch den Tonhöhenvorhersagefehler zu erzeugen.
  15. Tonhöhenanalyseverfahren nach Anspruch 14, bei dem die Tonhöhenverstärkungs-Berechnung das Berechnen der Tonhöhenverstärkung b(j) unter Verwendung der folgenden Beziehung umfaßt: b(j) = xty(j)/||y(j)||2 wobei j = 0, 1, 2,..., K und wobei K einer Anzahl von Signalpfaden entspricht, und wobei x der Tonhöhen-Suchzielvektor ist und y(j) der gefaltete Tonhöhencodevektor ist.
  16. Tonhöhenanalyseverfahren nach Anspruch 10, bei dem das Berechnen des Tonhöhenvorhersagefehlers in jedem Signalpfad das Berechnen einer Energie des entsprechenden Tonhöhenvorhersagefehlers umfaßt und bei dem das Vergleichen des Tonhöhenvorhersagefehlers das Vergleichen der Energien der Tonhöhenvorhersagefehler der verschiedenen Signalpfade und das Wählen des Signalpfades mit der niedrigsten berechneten Energie des Tonhöhenvorhersagefehlers als den Signalpfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehlerumfaßt.
  17. Tonhöhenanalyseverfahren nach Anspruch 14, bei dem: a) jedes der Filter der mehreren Signalpfade durch einen Filterindex identifiziert wird; b) der Tonhöhencodevektor durch einen Tonhöhencodebuch-Index identifiziert wird; und c) die Tonhöhencodebuch-Parameter den Filterindex, den Tonhöhencodebuch-Index und die Tonhöhenverstärkung umfassen.
  18. Tonhöhenanalyseverfahren nach Anspruch 10, bei dem das Filtern des Tonhöhencodevektors in ein Interpolationsfilter der Tonhöhencodebuch-Suchvorrichtung integriert ist, wobei das Interpolationsfilter verwendet wird, um eine Unterabtast-Version des Tonhöhencodevektors zu erzeugen.
  19. Codieren, der eine Tonhöhenanalysevorrichtung nach Anspruch 1 besitzt, um ein Breitband-Eingangssignal zu codieren, wobei der Codieren umfaßt: a) eine Berechnungseinrichtung für ein lineares Vorhersagesynthetisierungsfilter, das auf das Breitbandsignal anspricht, um Koeffizienten für ein lineares Vorhersagesynthetisierungsfilter zu erzeugen; b) ein Wahrnehmungsgewichtungsfilter, das auf das Breitbandsignal und auf die Koeffizienten des linearen Vorhersagesynthetisierungsfilters anspricht, um ein durch Wahrnehmung gewichtetes Signal zu erzeugen; c) einen Impulsantwortgenerator, der auf die Koeffizienten für das lineare Vorhersagesynthetisierungsfilter anspricht, um ein gewichtetes Synthetisierungsfilter-Impulsantwortsignal zu erzeugen; d) eine Tonhöhen-Sucheinheit zum Erzeugen von Tonhöhencodebuch-Parametern, wobei die Tonhöhen-Sucheinheit umfaßt: i) die Tonhöhencodebuch-Suchvorrichtung, die auf das durch Wahrnehmung gewichtete Signal und auf die Koeffizienten für das lineare Vorhersagesynthetisierungsfilter anspricht, um den Tonhöhencodevektor und eine innovativen Suchzielvektor zu erzeugen; und ii) die Tonhöhenanalysevorrichtung, die auf den Tonhöhencodevektor anspricht, und aus den Mengen von Tonhöhencodebuch-Parametern diejenige Menge von Tonhöhencodebuch-Parametern auszuwählen, die dem Pfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehler zugeordnet ist; d) eine Vorrichtung zum Suchen eines innovativen Codebuchs, die auf das gewichtete Synthetisierungsfilter-Impulsantwortsignal und auf den innovativen Suchzielvektor anspricht, um innovative Codebuchparameter zu erzeugen, und e) eine Signalformungsvorrichtung zum Erzeugen eines codierten Breitbandsignals, das die Menge von Tonhöhencodebuch-Parametern, die dem Pfad mit dem niedrigsten Tonhöhenvorhersagefehler zugeordnet sind, die innovativen Codebuchparametern und die Koeffizienten für das lineare Vorhersagesynthetisierungsfilterumfaßt.
  20. Codieren nach Anspruch 19, bei dem einer der wenigstens zwei Pfade kein Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt.
  21. Codieren nach Anspruch 19, bei dem die Signalpfade mehrere Signalpfade umfassen, wovon jeder mit einem Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung desselben Pfades versehen ist.
  22. Codieren nach Anspruch 21, bei dem die Filter der mehreren Pfade aus der Gruppe gewählt sind, die aus Tiefpaß- und Bandpaßfiltern besteht und bei dem die Filter unterschiedliche Frequenzgänge besitzen.
  23. Codieren nach Anspruch 19, bei dem jede Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt: a) eine Faltungseinheit zum Falten des Tonhöhencodevektors mit dem gewichteten Synthetisierungsfilter-Impulsantwortsignal und daher zum Berechnen eines gefalteten Tonhöhencodevektors; b) eine Tonhöhenverstärkungs-Berechnungseinrichtung zum Berechnen einer Tonhöhenverstärkung in Reaktion auf den gefalteten Tonhöhencodevektor und den Tonhöhen-Suchzielvektor; c) einen Verstärker zum Multiplizieren des gefalteten Tonhöhencodevektors mit der Tonhöhenverstärkung, um dadurch einen verstärkten gefalteten Tonhöhencodevektor zu erzeugen; und d) eine Kombinationsschaltung zum Kombinieren des verstärkten gefalteten Tonhöhencodevektors mit dem Tonhöhen-Suchzielvektor, um dadurch den Tonhöhenvorhersagefehler zu erzeugen.
  24. Codieren nach Anspruch 23, bei dem die Tonhöhenverstärkungs-Berechnungseinrichtung eine Einrichtung zum Berechnen der Tonhöhenverstärkung b(j) unter Verwendung der folgenden Beziehung umfaßt: b(j) = xty(j)/||y(j)||2 wobei j = 0, 1, 2,..., K und wobei K einer Anzahl von Signalpfaden entspricht, und wobei x der Tonhöhen-Suchzielvektor ist und y(j) der gefaltete Tonhöhencodevektor ist.
  25. Codieren nach Anspruch 19, bei dem die Tonhöhenvorhersagefehler-Berechnungsvorrichtung jedes Signalpfades eine Einrichtung zum Berechnen einer Energie des entsprechenden Tonhöhenvorhersagefehlers umfaßt und bei dem die Auswahleinrichtung eine Einrichtung zum Vergleichen der Energien der Tonhöhenvorhersagefehler der verschiedenen Signalpfade und zum Wählen des Signalpfades mit der niedrigsten berechneten Energie des Tonhöhenvorhersagefehlers als den Signalpfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehlerumfaßt.
  26. Codieren nach Anspruch 23, bei dem: a) jedes der Filter der mehreren Signalpfade durch einen Filterindex identifiziert wird; b) der Tonhöhencodevektor durch einen Tonhöhencodebuch-Index identifiziert wird; und c) die Tonhöhencodebuch-Parameter den Filterindex, den Tonhöhencodebuch-Index und die Tonhöhenverstärkung umfassen.
  27. Codieren nach Anspruch 19, bei dem das Filter in ein Interpolationsfilter der Tonhöhencodebuch-Suchvorrichtung integriert ist, wobei das Interpolationsfilter zum Erzeugen einer Unterabtast-Version des Tonhöhencodevektors verwendet wird.
  28. Zellenkommunikationssystem zum Bedienen eines großen geographischen Gebiets, das in mehrere Zellen unterteilt ist, wobei das System umfaßt: a) mobile Sender/Empfänger-Einheiten; b) Zellenbasisstationen, die sich jeweils in den Zellen befinden; c) ein Steuerendgerät zum Steuern der Kommunikation zwischen den Zellenbasisstationen; d) ein bidirektionales drahtloses Kommunikationsuntersystem zwischen jeder Mobileinheit, die sich in einer Zelle befindet, und der Zellenbasisstation der einen Zelle, wobei das bidirektionale drahtlose Kommunikationsuntersystem sowohl in der Mobileinheit als auch in der Zellenbasisstation umfaßt: i) einen Sender, der einen Codierer zum Codieren eines Breitbandsignals nach Anspruch 19 und eine Sendeschaltung zum Senden des codierten Breitbandsignals enthält; und ii) einen Empfänger, der eine Empfängerschaltung zum Empfangen eines gesendeten codierten Breitbandsignals und einen Decodieren zum Decodieren des empfangenen codierten Breitbandsignals enthält.
  29. Zellenkommunikationssystem nach Anspruch 28, bei dem einer der wenigstens zwei Pfade kein Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt.
  30. Zellenkommunikationssystem nach Anspruch 28, bei dem die Signalpfade mehrere Signalpfade umfassen, wovon jeder mit einem Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung desselben Pfades versehen ist.
  31. Zellenkommunikationssystem nach Anspruch 30, bei der die Filter der mehreren Pfade aus der Gruppe gewählt sind, die aus Tiefpaß- und Bandpaßfiltern besteht, und bei dem die Filter unterschiedliche Frequenzgänge besitzen.
  32. Zellenkommunikationssystem nach Anspruch 28, bei dem die Tonhöhenvorhersagefehler-Berechnungsvorrichtung jedes Signalpfades eine Einrichtung zum Berechnen einer Energie des entsprechenden Tonhöhenvorhersagefehlers umfaßt und bei dem die Auswahleinrichtung eine Einrichtung zum Vergleichen der Energien der Tonhöhenvorhersagefehler der verschiedenen Signalpfade und zum Wählen des Signalpfades mit der niedrigsten berechneten Energie des Tonhöhenvorhersagefehlers als den Signalpfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehlerumfaßt.
  33. Zellenkommunikationssystem nach Anspruch 32, bei dem die Tonhöhenverstärkungs-Berechnungseinrichtung eine Einrichtung zum Berechnen der Tonhöhenverstärkung b(j) unter Verwendung der folgenden Beziehung umfaßt: b(j) = xty(j)/||y(j)||2 wobei j = 0, 1, 2,..., K und wobei K einer Anzahl von Signalpfaden entspricht, und wobei x der Tonhöhen-Suchzielvektor ist und y(j) der gefaltete Tonhöhencodevektor ist.
  34. Zellenkommunikationssystem nach Anspruch 28, bei dem die Tonhöhenvorhersagefehler-Berechnungsvorrichtung jedes Signalpfades eine Einrichtung zum Berechnen einer Energie des entsprechenden Tonhöhenvorhersagefehlers umfaßt und bei dem die Auswahleinrichtung eine Einrichtung zum Vergleichen der Energien der Tonhöhenvorhersagefehler der verschiedenen Signalpfade und zum Wählen des Signalpfades mit der niedrigsten berechneten Energie des Tonhöhenvorhersagefehlers als den Signalpfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehlerumfaßt.
  35. Zellenkommunikationssystem nach Anspruch 32, bei dem: a) jedes der Filter der mehreren Signalpfade durch einen Filterindex identifiziert wird; b) der Tonhöhencodevektor durch einen Tonhöhencodebuch-Index identifiziert wird; und c) die Tonhöhencodebuch-Parameter den Filterindex, den Tonhöhencodebuch-Index und die Tonhöhenverstärkung umfassen.
  36. Zellenkommunikationssystem nach Anspruch 28, bei dem das Filter in ein Interpolationsfilter der Tonhöhencodebuch-Suchvorrichtung integriert ist, wobei das Interpolationsfilter zum Erzeugen einer Unterabtast-Version des Tonhöhencodevektors verwendet wird.
  37. Mobile Zellen-Sender/Empfänger-Einheit, die umfaßt: a) einen Sender, der einen Codieren zum Codieren eines Breitbandsignals und eine Sendeschaltung zum Senden des codierten Breitbandsignals enthält; und b) einen Empfänger, der eine Empfängerschaltung zum Empfangen eines gesendeten codierten Breitbandsignals nach Anspruch 19 und einen Decodieren zum Decodieren des empfangenen decodierten Breitbandsignals enthält.
  38. Mobile Zellen-Sender/Empfänger-Einheit nach Anspruch 37, bei der einer der wenigstens zwei Pfade kein Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt.
  39. Mobile Zellen-Sender/Empfänger-Einheit nach Anspruch 37, bei der die Signalpfade mehrere Signalpfade umfassen, wovon jeder mit einem Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung desselben Pfades versehen ist.
  40. Mobile Zellen-Sender/Empfänger-Einheit nach Anspruch 39, bei der die Filter der mehreren Pfade aus der Gruppe gewählt sind, die aus Tiefpaß- und Bandpaßfiltern besteht und bei dem die Filter unterschiedliche Frequenzgänge besitzen.
  41. Mobile Zellen-Sender/Empfänger-Einheit nach Anspruch 37, bei der jede Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt: jede Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt: a) eine Faltungseinheit zum Falten des Tonhöhencodevektors mit dem gewichteten Synthetisierungsfilter-Impulsantwortsignal und daher zum Berechnen eines gefalteten Tonhöhencodevektors; b) eine Tonhöhenverstärkungs-Berechnungseinrichtung zum Berechnen einer Tonhöhenverstärkung in Reaktion auf den gefalteten Tonhöhencodevektor und den Tonhöhen-Suchzielvektor; c) einen Verstärker zum Multiplizieren des gefalteten Tonhöhencodevektors mit der Tonhöhenverstärkung, um dadurch einen verstärkten gefalteten Tonhöhencodevektor zu erzeugen; und d) eine Kombinationsschaltung zum Kombinieren des verstärkten gefalteten Tonhöhencodevektors mit dem Tonhöhen-Suchzielvektor, um dadurch den Tonhöhenvorhersagefehler zu erzeugen.
  42. Mobile Zellen-Sender/Empfänger-Einheit nach Anspruch 41, bei der die Tonhöhenverstärkungs-Berechnungseinrichtung eine Einrichtung zum Berechnen der Tonhöhenverstärkung b(j) unter Verwendung der folgenden Beziehung umfaßt: b(j) = xty(j)/||y(j)||2 wobei j = 0, 1, 2,..., K und wobei K einer Anzahl von Signalpfaden entspricht, und wobei x der Tonhöhen-Suchzielvektor ist und y(j) der gefaltete Tonhöhencodevektor ist.
  43. Mobile Zellen-Sender/Empfänger-Einheit nach Anspruch 37, bei der die Tonhöhenvorhersagefehler-Berechnungsvorrichtung jedes Signalpfades eine Einrichtung zum Berechnen einer Energie des entsprechenden Tonhöhenvorhersagefehlers umfaßt und bei dem die Auswahleinrichtung eine Einrichtung zum Vergleichen der Energien der Tonhöhenvorhersagefehler der verschiedenen Signalpfade und zum Wählen des Signalpfades mit der niedrigsten berechneten Energie des Tonhöhenvorhersagefehlers als den Signalpfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehler umfaßt.
  44. Mobile Zellen-Sender/Empfänger-Einheit nach Anspruch 41, bei der a) jedes der Filter der mehreren Signalpfade durch einen Filterindex identifiziert wird; b) der Tonhöhencodevektor durch einen Tonhöhencodebuch-Index identifiziert wird; und c) die Tonhöhencodebuch-Parameter den Filterindex, den Tonhöhencodebuch-Index und die Tonhöhenverstärkung umfassen.
  45. Mobile Zellen-Sender/Empfänger-Einheit nach Anspruch 37, bei der das Filter in ein Interpolationsfilter der Tonhöhencodebuch-Suchvorrichtung integriert ist, wobei das Interpolationsfilter zum Erzeugen einer Unterabtast-Version des Tonhöhencodevektors verwendet wird.
  46. Zellennetzelement, das umfaßt: a) einen Sender, der einen Codieren zum Codieren eines Breitbandsignals nach Anspruch 19 und eine Sendeschaltung zum Senden des codierten Breitbandsignals enthält; und b) einen Empfänger, der eine Empfängerschaltung zum Empfangen eines gesendeten codierten Breitbandsignals und einen Decodieren zum Decodieren des empfangenen decodierten Breitbandsignals enthält.
  47. Zellennetzelement nach Anspruch 46, bei dem einer der wenigstens zwei Pfade kein Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt.
  48. Zellennetzelement nach Anspruch 46, bei dem die Signalpfade mehrere Signalpfade umfassen, wovon jeder mit einem Filter zum Filtern des Tonhöhen codevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung desselben Pfades versehen ist.
  49. Zellennetzelement nach Anspruch 48, bei dem die Filter der mehreren Pfade aus der Gruppe gewählt sind, die aus Tiefpaß- und Bandpaßfiltern besteht und bei dem die Filter unterschiedliche Frequenzgänge besitzen.
  50. Zellennetzelement nach Anspruch 46, bei dem jede Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt: a) eine Faltungseinheit zum Falten des Tonhöhencodevektors mit dem gewichteten Synthetisierungsfilter-Impulsantwortsignal und daher zum Berechnen eines gefalteten Tonhöhencodevektors; b) eine Tonhöhenverstärkungs-Berechnungseinrichtung zum Berechnen einer Tonhöhenverstärkung in Reaktion auf den gefalteten Tonhöhencodevektor und den Tonhöhen-Suchzielvektor; c) einen Verstärker zum Multiplizieren des gefalteten Tonhöhencodevektors mit der Tonhöhenverstärkung, um dadurch einen verstärkten gefalteten Tonhöhencodevektor zu erzeugen; und d) eine Kombinationsschaltung zum Kombinieren des verstärkten gefalteten Tonhöhencodevektors mit dem Tonhöhen-Suchzielvektor, um dadurch den Tonhöhenvorhersagefehler zu erzeugen.
  51. Zellennetzelement nach Anspruch 50, bei dem die Tonhöhenverstärkungs-Berechnungseinrichtung eine Einrichtung zum Berechnen der Tonhöhenverstärkung b(j) unter Verwendung der folgenden Beziehung umfaßt: b(j) = xty(j)/||y(j)||2 wobei j = 0, 1, 2,..., K und wobei K einer Anzahl von Signalpfaden entspricht, und wobei x der Tonhöhen-Suchzielvektor ist und y(j) der gefaltete Tonhöhencodevektor ist.
  52. Zellennetzelement nach Anspruch 46, bei dem die Tonhöhenvorhersagefehler-Berechnungsvorrichtung jedes Signalpfades eine Einrichtung zum Berechnen einer Energie des entsprechenden Tonhöhenvorhersagefehlers umfaßt und bei dem die Auswahleinrichtung eine Einrichtung zum Vergleichen der Energien der Tonhöhenvorhersagefehler der verschiedenen Signalpfade und zum Wählen des Signalpfades mit der niedrigsten berechneten Energie des Tonhöhenvorhersagefehlers als den Signalpfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehler umfaßt.
  53. Zellennetzelement nach Anspruch 50, bei dem: a) jedes der Filter der mehreren Signalpfade durch einen Filterindex identifiziert wird; b) der Tonhöhencodevektor durch einen Tonhöhencodebuch-Index identifiziert wird; und c) die Tonhöhencodebuch-Parameter den Filterindex, den Tonhöhencodebuch-Index und die Tonhöhenverstärkung umfassen.
  54. Zellennetzelement nach Anspruch 46, bei dem das Filter in ein Interpolationsfilter der Tonhöhencodebuch-Suchvorrichtung integriert ist, wobei das Interpolationsfilter zum Erzeugen einer Unterabtast-Version des Tonhöhencodevektors verwendet wird.
  55. Bidirektionales drahtloses Kommunikationsuntersystem mit einem Zellenkommunikationssystem für die Bedienung eines großen geographischen Gebiets, das in mehrere Zellen unterteilt ist, wobei das Untersystem umfaßt: mobile Sender/Empfänger-Einheiten; Zellenbasisstationen, die sich in den jeweiligen Zellen befinden; und ein Steuerendgerät zum Steuern der Kommunikation zwischen den Zellenbasisstationen; wobei sich das bidirektionale drahtlose Kommunikationsuntersystem zwischen jeder Mobileinheit, die sich in einer Zelle befindet, und der Zellenbasisstation der einen Zelle befindet, wobei das bidirektionale drahtlose Kommunikationsuntersystem sowohl in der Mobileinheit als auch in der Zellenbasisstation umfaßt: a) einen Sender, der einen Codierer zum Codieren eines Breitbandsignals nach Anspruch 19 und eine Sendeschaltung zum Senden des codierten Breitbandsignals enthält; und b) einen Empfänger, der eine Empfängerschaltung zum Empfangen eines gesendeten codierten Breitbandsignals und einen Decodieren zum Decodieren des empfangen codierten Breitbandsignals enthält.
  56. Bidirektionales drahtloses Kommunikationsuntersystem nach Anspruch 55, bei dem einer der wenigstens zwei Pfade kein Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorher sagefehler-Berechnungsvorrichtung umfaßt.
  57. Bidirektionales drahtloses Kommunikationsuntersystem nach Anspruch 55, bei dem die Signalpfade mehrere Signalpfade umfassen, wovon jeder mit einem Filter zum Filtern des Tonhöhencodevektors vor der Lieferung des Tonhöhencodevektors zu der Tonhöhenvorhersagefehler-Berechnungsvorrichtung desselben Pfades versehen ist.
  58. Bidirektionales drahtloses Kommunikationsuntersystem nach Anspruch 57, bei dem die Filter der mehreren Pfade aus der Gruppe gewählt sind, die aus Tiefpaß- und Bandpaßfiltern besteht und bei dem die Filter unterschiedliche Frequenzgänge besitzen.
  59. Bidirektionales drahtloses Kommunikationsuntersystem nach Anspruch 55, bei dem jede Tonhöhenvorhersagefehler-Berechnungsvorrichtung umfaßt: a) eine Faltungseinheit zum Falten des Tonhöhencodevektors mit dem gewichteten Synthetisierungsfilter-Impulsantwortsignal und daher zum Berechnen eines gefalteten Tonhöhencodevektors; b) eine Tonhöhenverstärkungs-Berechnungseinrichtung zum Berechnen einer Tonhöhenverstärkung in Reaktion auf den gefalteten Tonhöhencodevektor und den Tonhöhen-Suchzielvektor; c) einen Verstärker zum Multiplizieren des gefalteten Tonhöhencodevektors mit der Tonhöhenverstärkung, um dadurch einen verstärkten gefalteten Tonhöhencodevektor zu erzeugen; und d) eine Kombinationsschaltung zum Kombinieren des verstärkten gefalteten Tonhöhencodevektors mit dem Tonhöhen-Suchzielvektor, um dadurch den Tonhöhenvorhersagefehler zu erzeugen.
  60. Bidirektionales drahtloses Kommunikationsuntersystem nach Anspruch 59, bei dem die Tonhöhenverstärkungs-Berechnungseinrichtung eine Einrichtung zum Berechnen der Tonhöhenverstärkung b(j) unter Verwendung der folgenden Beziehung umfaßt: b(j) = xty(j)/||y(j)||2 wobei j = 0, 1, 2,..., K und wobei K einer Anzahl von Signalpfaden entspricht, und wobei x der Tonhöhen-Suchzielvektor ist und y(j) der gefaltete Tonhöhen- Codevektor ist.
  61. Bidirektionales drahtloses Kommunikationsuntersystem nach Anspruch 55, bei dem die Tonhöhenvorhersagefehler-Berechnungsvorrichtung jedes Signalpfades eine Einrichtung zum Berechnen einer Energie des entsprechenden Tonhöhenvorhersagefehlers umfaßt und bei dem die Auswahleinrichtung eine Einrichtung zum Vergleichen der Energien der Tonhöhenvorhersagefehler der verschiedenen Signalpfade und zum Wählen des Signalpfades mit der niedrigsten berechneten Energie des Tonhöhenvorhersagefehlers als den Signalpfad mit dem niedrigsten berechneten Tonhöhenvorhersagefehler umfaßt.
  62. Bidirektionales drahtloses Kommunikationsuntersystem nach Anspruch 59, bei dem: a) jedes der Filter der mehreren Signalpfade durch einen Filterindex identifiziert wird; b) der Tonhöhencodevektor durch einen Tonhöhencodebuch-Index identifiziert wird; und c) die Tonhöhencodebuch-Parameter den Filterindex, den Tonhöhencodebuch-Index und die Tonhöhenverstärkung umfassen.
  63. Bidirektionales drahtloses Kommunikationsuntersystem nach Anspruch 55, bei dem das Filter in ein Interpolationsfilter der Tonhöhencodebuch-Suchvorrichtung integriert ist, wobei das Interpolationsfilter zum Erzeugen einer Unterabtast-Version des Tonhöhencodevektors verwendet wird.
DE69910239T 1998-10-27 1999-10-27 Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale Expired - Lifetime DE69910239T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA2252170 1998-10-27
CA002252170A CA2252170A1 (en) 1998-10-27 1998-10-27 A method and device for high quality coding of wideband speech and audio signals
PCT/CA1999/001008 WO2000025298A1 (en) 1998-10-27 1999-10-27 A method and device for adaptive bandwidth pitch search in coding wideband signals

Publications (2)

Publication Number Publication Date
DE69910239D1 DE69910239D1 (de) 2003-09-11
DE69910239T2 true DE69910239T2 (de) 2004-06-24

Family

ID=4162966

Family Applications (4)

Application Number Title Priority Date Filing Date
DE69910239T Expired - Lifetime DE69910239T2 (de) 1998-10-27 1999-10-27 Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale
DE69913724T Expired - Lifetime DE69913724T2 (de) 1998-10-27 1999-10-27 Vorrichtung zur rauschmaskierung und verfahren zur effizienten kodierung von breitbandsignalen
DE69910240T Expired - Lifetime DE69910240T2 (de) 1998-10-27 1999-10-27 Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE69910058T Expired - Lifetime DE69910058T2 (de) 1998-10-27 1999-10-27 Verbesserung der periodizität eines breitbandsignals

Family Applications After (3)

Application Number Title Priority Date Filing Date
DE69913724T Expired - Lifetime DE69913724T2 (de) 1998-10-27 1999-10-27 Vorrichtung zur rauschmaskierung und verfahren zur effizienten kodierung von breitbandsignalen
DE69910240T Expired - Lifetime DE69910240T2 (de) 1998-10-27 1999-10-27 Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE69910058T Expired - Lifetime DE69910058T2 (de) 1998-10-27 1999-10-27 Verbesserung der periodizität eines breitbandsignals

Country Status (20)

Country Link
US (8) US7260521B1 (de)
EP (4) EP1125285B1 (de)
JP (4) JP3566652B2 (de)
KR (3) KR100417836B1 (de)
CN (4) CN1165892C (de)
AT (4) ATE246836T1 (de)
AU (4) AU752229B2 (de)
BR (2) BR9914890B1 (de)
CA (5) CA2252170A1 (de)
DE (4) DE69910239T2 (de)
DK (4) DK1125286T3 (de)
ES (4) ES2212642T3 (de)
HK (1) HK1043234B (de)
MX (2) MXPA01004137A (de)
NO (4) NO319181B1 (de)
NZ (1) NZ511163A (de)
PT (4) PT1125285E (de)
RU (2) RU2217718C2 (de)
WO (4) WO2000025304A1 (de)
ZA (2) ZA200103366B (de)

Families Citing this family (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6704701B1 (en) * 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
DE60128677T2 (de) * 2000-04-24 2008-03-06 Qualcomm, Inc., San Diego Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
JP3582589B2 (ja) * 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
KR100393899B1 (ko) * 2001-07-27 2003-08-09 어뮤즈텍(주) 2-단계 피치 판단 방법 및 장치
JP4012506B2 (ja) * 2001-08-24 2007-11-21 株式会社ケンウッド 信号の周波数成分を適応的に補間するための装置および方法
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
US8463334B2 (en) * 2002-03-13 2013-06-11 Qualcomm Incorporated Apparatus and system for providing wideband voice quality in a wireless telephone
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2392640A1 (en) 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CN100531259C (zh) * 2002-12-27 2009-08-19 冲电气工业株式会社 语音通信设备
US7039222B2 (en) * 2003-02-28 2006-05-02 Eastman Kodak Company Method and system for enhancing portrait images that are processed in a batch mode
US6947449B2 (en) * 2003-06-20 2005-09-20 Nokia Corporation Apparatus, and associated method, for communication system exhibiting time-varying communication conditions
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
EP2264700A1 (de) * 2003-09-16 2010-12-22 Panasonic Corporation Codierungsvorrichtung und Decodierungsvorrichtung
US7792670B2 (en) * 2003-12-19 2010-09-07 Motorola, Inc. Method and apparatus for speech coding
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US8417515B2 (en) * 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
CN102280109B (zh) * 2004-05-19 2016-04-27 松下电器(美国)知识产权公司 编码装置、解码装置及它们的方法
CN101023472B (zh) * 2004-09-06 2010-06-23 松下电器产业株式会社 可扩展编码装置和可扩展编码方法
DE102005000828A1 (de) * 2005-01-05 2006-07-13 Siemens Ag Verfahren zum Codieren eines analogen Signals
CN101107650B (zh) * 2005-01-14 2012-03-28 松下电器产业株式会社 语音切换装置及语音切换方法
CN100592389C (zh) * 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
EP1895516B1 (de) 2005-06-08 2011-01-19 Panasonic Corporation Vorrichtung und verfahren zur verbreiterung eines audiosignalbands
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
FR2889017A1 (fr) * 2005-07-19 2007-01-26 France Telecom Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants
US8417185B2 (en) 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7885419B2 (en) 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
DK1869669T3 (da) * 2006-04-24 2008-12-01 Nero Ag Avanceret audiokodningsapparat
CN101479790B (zh) * 2006-06-29 2012-05-23 Nxp股份有限公司 噪声合成
US8358987B2 (en) * 2006-09-28 2013-01-22 Mediatek Inc. Re-quantization in downlink receiver bit rate processor
US7966175B2 (en) * 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
CN101192410B (zh) * 2006-12-01 2010-05-19 华为技术有限公司 一种在编解码中调整量化质量的方法和装置
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
WO2008114075A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation An encoder
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP5388849B2 (ja) * 2007-07-27 2014-01-15 パナソニック株式会社 音声符号化装置および音声符号化方法
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
JP5326311B2 (ja) * 2008-03-19 2013-10-30 沖電気工業株式会社 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
CA2699316C (en) * 2008-07-11 2014-03-18 Max Neuendorf Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
KR20100057307A (ko) * 2008-11-21 2010-05-31 삼성전자주식회사 노래점수 평가방법 및 이를 이용한 가라오케 장치
CN101770778B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 一种预加重滤波器、感知加权滤波方法及***
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
JP5511785B2 (ja) * 2009-02-26 2014-06-04 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
RU2011135735A (ru) * 2009-02-27 2013-05-10 Панасоник Корпорэйшн Устройство определения тона и способ определения тона
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
WO2011048810A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 ベクトル量子化装置及びベクトル量子化方法
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
CN105374362B (zh) * 2010-01-08 2019-05-10 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及记录介质
CN101854236B (zh) 2010-04-05 2015-04-01 中兴通讯股份有限公司 一种信道信息反馈方法和***
AU2011241424B2 (en) * 2010-04-14 2016-05-05 Voiceage Evs Llc Flexible and scalable combined innovation codebook for use in CELP coder and decoder
JP5749136B2 (ja) 2011-10-21 2015-07-15 矢崎総業株式会社 端子圧着電線
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
CN103295578B (zh) 2012-03-01 2016-05-18 华为技术有限公司 一种语音频信号处理方法和装置
CN105761724B (zh) * 2012-03-01 2021-02-09 华为技术有限公司 一种语音频信号处理方法和装置
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) * 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
ES2626977T3 (es) 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
MX355091B (es) * 2013-10-18 2018-04-04 Fraunhofer Ges Forschung Concepto para codificar una señal de audio y decodificar una señal de audio usando información de conformación espectral relacionada con la voz.
KR20160070147A (ko) 2013-10-18 2016-06-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 결정론적 및 잡음 유사 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념
JP6425097B2 (ja) * 2013-11-29 2018-11-21 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
CN105047201A (zh) * 2015-06-15 2015-11-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于分段扩展的宽带激励信号合成方法
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
CN106601267B (zh) * 2016-11-30 2019-12-06 武汉船舶通信研究所 一种基于超短波fm调制的语音增强方法
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN113324546B (zh) * 2021-05-24 2022-12-13 哈尔滨工程大学 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法
US20230318881A1 (en) * 2022-04-05 2023-10-05 Qualcomm Incorporated Beam selection using oversampled beamforming codebooks and channel estimates

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8500843A (nl) 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
JPH0738118B2 (ja) * 1987-02-04 1995-04-26 日本電気株式会社 マルチパルス符号化装置
EP0331858B1 (de) * 1988-03-08 1993-08-25 International Business Machines Corporation Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten
US5359696A (en) * 1988-06-28 1994-10-25 Motorola Inc. Digital speech coder having improved sub-sample resolution long-term predictor
JP2621376B2 (ja) 1988-06-30 1997-06-18 日本電気株式会社 マルチパルス符号化装置
JP2900431B2 (ja) 1989-09-29 1999-06-02 日本電気株式会社 音声信号符号化装置
JPH03123113A (ja) * 1989-10-05 1991-05-24 Fujitsu Ltd ピッチ周期探索方式
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5113262A (en) * 1990-08-17 1992-05-12 Samsung Electronics Co., Ltd. Video signal recording system enabling limited bandwidth recording and playback
US6134373A (en) * 1990-08-17 2000-10-17 Samsung Electronics Co., Ltd. System for recording and reproducing a wide bandwidth video signal via a narrow bandwidth medium
US5235669A (en) 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
US5392284A (en) * 1990-09-20 1995-02-21 Canon Kabushiki Kaisha Multi-media communication device
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
US5235670A (en) * 1990-10-03 1993-08-10 Interdigital Patents Corporation Multiple impulse excitation speech encoder and decoder
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
JP3089769B2 (ja) 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
GB9218864D0 (en) * 1992-09-05 1992-10-21 Philips Electronics Uk Ltd A method of,and system for,transmitting data over a communications channel
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
IT1257431B (it) 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
DE4343366C2 (de) * 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US5956624A (en) * 1994-07-12 1999-09-21 Usa Digital Radio Partners Lp Method and system for simultaneously broadcasting and receiving digital and analog signals
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
FR2729247A1 (fr) 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
DE69619284T3 (de) 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US6064962A (en) * 1995-09-14 2000-05-16 Kabushiki Kaisha Toshiba Formant emphasis method and formant emphasis filter device
EP0788091A3 (de) * 1996-01-31 1999-02-24 Kabushiki Kaisha Toshiba Verfahren und Vorrichtung zur Sprachkodierung und -dekodierung
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
JP3063668B2 (ja) 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals

Also Published As

Publication number Publication date
DE69910240D1 (de) 2003-09-11
NO20012067L (no) 2001-06-27
ES2207968T3 (es) 2004-06-01
US20060277036A1 (en) 2006-12-07
US6807524B1 (en) 2004-10-19
EP1125286A1 (de) 2001-08-22
EP1125284A1 (de) 2001-08-22
AU6455599A (en) 2000-05-15
US7151802B1 (en) 2006-12-19
ES2212642T3 (es) 2004-07-16
NZ511163A (en) 2003-07-25
EP1125285A1 (de) 2001-08-22
NO20045257L (no) 2001-06-27
PT1125276E (pt) 2003-12-31
CN1127055C (zh) 2003-11-05
JP3936139B2 (ja) 2007-06-27
KR20010099764A (ko) 2001-11-09
ZA200103367B (en) 2002-05-27
ATE246836T1 (de) 2003-08-15
CA2347743A1 (en) 2000-05-04
JP3490685B2 (ja) 2004-01-26
US7260521B1 (en) 2007-08-21
ES2205892T3 (es) 2004-05-01
CA2347668C (en) 2006-02-14
CA2347735A1 (en) 2000-05-04
AU6457099A (en) 2000-05-15
JP2002528775A (ja) 2002-09-03
CA2347668A1 (en) 2000-05-04
DE69910239D1 (de) 2003-09-11
AU6456999A (en) 2000-05-15
KR100417635B1 (ko) 2004-02-05
EP1125276A1 (de) 2001-08-22
AU6457199A (en) 2000-05-15
EP1125286B1 (de) 2003-12-17
JP2002528777A (ja) 2002-09-03
RU2219507C2 (ru) 2003-12-20
HK1043234B (zh) 2004-07-16
EP1125285B1 (de) 2003-07-30
DE69913724D1 (de) 2004-01-29
DE69913724T2 (de) 2004-10-07
DK1125276T3 (da) 2003-11-17
ATE256910T1 (de) 2004-01-15
AU752229B2 (en) 2002-09-12
CA2347667A1 (en) 2000-05-04
BR9914889A (pt) 2001-07-17
WO2000025298A1 (en) 2000-05-04
HK1043234A1 (en) 2002-09-06
WO2000025304A1 (en) 2000-05-04
CA2347743C (en) 2005-09-27
NO20012067D0 (no) 2001-04-26
CN1165892C (zh) 2004-09-08
KR20010099763A (ko) 2001-11-09
RU2217718C2 (ru) 2003-11-27
ES2205891T3 (es) 2004-05-01
AU763471B2 (en) 2003-07-24
JP2002528776A (ja) 2002-09-03
EP1125276B1 (de) 2003-08-06
KR100417836B1 (ko) 2004-02-05
NO20012068D0 (no) 2001-04-26
US7672837B2 (en) 2010-03-02
CA2347667C (en) 2006-02-14
MXPA01004137A (es) 2002-06-04
JP2002528983A (ja) 2002-09-03
ATE246389T1 (de) 2003-08-15
NO317603B1 (no) 2004-11-22
US6795805B1 (en) 2004-09-21
US20050108005A1 (en) 2005-05-19
JP3869211B2 (ja) 2007-01-17
CN1328682A (zh) 2001-12-26
US20050108007A1 (en) 2005-05-19
DE69910240T2 (de) 2004-06-24
WO2000025303A1 (en) 2000-05-04
DK1125285T3 (da) 2003-11-10
BR9914889B1 (pt) 2013-07-30
CA2347735C (en) 2008-01-08
EP1125284B1 (de) 2003-08-06
DE69910058T2 (de) 2004-05-19
CN1328683A (zh) 2001-12-26
KR100417634B1 (ko) 2004-02-05
JP3566652B2 (ja) 2004-09-15
CN1165891C (zh) 2004-09-08
DK1125284T3 (da) 2003-12-01
ZA200103366B (en) 2002-05-27
ATE246834T1 (de) 2003-08-15
BR9914890A (pt) 2001-07-17
MXPA01004181A (es) 2003-06-06
DE69910058D1 (de) 2003-09-04
CN1328681A (zh) 2001-12-26
PT1125284E (pt) 2003-12-31
BR9914890B1 (pt) 2013-09-24
NO20012068L (no) 2001-06-27
NO318627B1 (no) 2005-04-18
DK1125286T3 (da) 2004-04-19
CA2252170A1 (en) 2000-04-27
KR20010090803A (ko) 2001-10-19
CN1172292C (zh) 2004-10-20
US8036885B2 (en) 2011-10-11
NO20012066D0 (no) 2001-04-26
WO2000025305A1 (en) 2000-05-04
PT1125286E (pt) 2004-05-31
PT1125285E (pt) 2003-12-31
NO20012066L (no) 2001-06-27
CN1328684A (zh) 2001-12-26
US20100174536A1 (en) 2010-07-08
NO319181B1 (no) 2005-06-27

Similar Documents

Publication Publication Date Title
DE69910239T2 (de) Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale
DE60029990T2 (de) Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer
DE60120766T2 (de) Indizieren von impulspositionen und vorzeichen in algebraischen codebüchern zur codierung von breitbandsignalen
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE69735097T2 (de) Verfahren und vorrichtung zur verbesserung der sprachqualität in tandem-sprachkodierern
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE60011051T2 (de) Celp-transkodierung
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE69531642T2 (de) Synthese eines Anregungssignals bei Ausfall von Datenrahmen oder Verlust von Datenpaketen
DE69814517T2 (de) Sprachkodierung
DE69727895T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE3856211T2 (de) Verfahren zur adaptiven Filterung von Sprach- und Audiosignalen
DE60219351T2 (de) Signaländerungsverfahren zur effizienten kodierung von sprachsignalen
DE69934608T3 (de) Adaptive kompensation der spektralen verzerrung eines synthetisierten sprachresiduums
DE60120734T2 (de) Vorrichtung zur erweiterung der bandbreite eines audiosignals
DE69023402T2 (de) Verfahren zur Sprachkodierung und -dekodierung.
DE60128677T2 (de) Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
DE19647298C2 (de) Kodiersystem
DE60128121T2 (de) Wahrnehmungsbezogen verbesserte aufbesserung kodierter akustischer signale
DE60012760T2 (de) Multimodaler sprachkodierer
DE69633944T2 (de) Verfahren und gerät zum kodieren von digitalen daten
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
DE60128479T2 (de) Verfahren und vorrichtung zur bestimmung eines synthetischen höheren bandsignals in einem sprachkodierer

Legal Events

Date Code Title Description
8364 No opposition during term of opposition