EP1433166A1 - Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals - Google Patents

Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals

Info

Publication number
EP1433166A1
EP1433166A1 EP01978183A EP01978183A EP1433166A1 EP 1433166 A1 EP1433166 A1 EP 1433166A1 EP 01978183 A EP01978183 A EP 01978183A EP 01978183 A EP01978183 A EP 01978183A EP 1433166 A1 EP1433166 A1 EP 1433166A1
Authority
EP
European Patent Office
Prior art keywords
speech
broadband
extender
voice
narrowband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP01978183A
Other languages
English (en)
French (fr)
Other versions
EP1433166B8 (de
EP1433166B1 (de
Inventor
Stefano Ambrosius Klinke
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Solutions and Networks GmbH and Co KG
Original Assignee
Siemens AG
Nokia Solutions and Networks SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG, Nokia Solutions and Networks SpA filed Critical Siemens AG
Publication of EP1433166A1 publication Critical patent/EP1433166A1/de
Application granted granted Critical
Publication of EP1433166B1 publication Critical patent/EP1433166B1/de
Publication of EP1433166B8 publication Critical patent/EP1433166B8/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Definitions

  • the invention relates to a speech extender according to the preamble of claim 1 and a method for estimating a broadband speech signal based on a narrowband speech signal according to the preamble of claim 8.
  • speech codecs To compress the data transmission rate for speech signals are speech, also called 'the voice codecs used. They are mainly used in mobile radio systems. In GSM mobile radio systems (Global System for Mobile Communication), speech coders are used that work according to the linear predictive coding (LPC) method. In contrast to a waveform coding, it is not the speech signal itself that is reproduced, but rather its process of creation in the human speech tract. With a sampling rate of the speech signal of 8 kHz, a data rate of 104 kbit / s results with a resolution of 13 bits. With GSM, this data rate is reduced to a constant 13 Kbit / s (so-called code rate) using LPC.
  • LPC linear predictive coding
  • full rate fill rate codec
  • improved full rate codecs enhanced fill rate codec
  • UMTS Universal Mobile Telecommunications System
  • voice encoders will be used that can encode voice signals with a variable bit rate.
  • a speech coder is, for example, the adaptive multirate (AMR) speech coder, which enables coding with different bit rates. It was designed for GSM mobile radio systems, but is also said to be in UMTS mobile radio systems are used as standard speech coders.
  • AMR adaptive multirate
  • the bit rate can be adapted to the bandwidth available for the transmission of the coded speech signal. If sufficient bandwidth is available for transmission, the voice signal is encoded with a high bit rate. This is also known as broadband coding. Otherwise, ie with a low bandwidth, coding is carried out with a low bit rate (narrow-band coding).
  • the bit rate can be adjusted during the transmission of a speech signal.
  • the bandwidth of a transmission channel is continuously measured in the form of the available bit rate. If the available bit rate falls below a predetermined threshold during a transmission of the speech signal, the coding is switched so that the speech signal is coded in a narrow band.
  • two different encodings with correspondingly different bit rates can be provided.
  • Broadband coding takes place, for example, at a sampling frequency of approximately 16 kHz, while narrowband coding takes place at a sampling frequency of 8 kHz.
  • narrowband coding takes place at a sampling frequency of 8 kHz.
  • a speech frequency range up to 8 kHz is covered, in the second case up to 4 kHz.
  • the fluctuation in the signal quality caused by the switching of the bit rate and the associated quality fluctuation of a communication link are problematic. Due to the predefined threshold, switching takes place relatively abruptly, so that the quality of the connection can suddenly drop during a call.
  • broadband speech extender or wideband speech extender
  • short speech extender By using a so-called broadband speech extender (or wideband speech extender) or short speech extender, a clearly better speech quality even with narrowband coding and the quality-reducing effect of the abrupt switching can be reduced somewhat.
  • the broadband speech extender uses the narrowband signal to estimate the broadband speech signal by synthesizing the speech frequency components above 4 kHz. This avoids an excessive loss of quality when switching the bit rate for coding.
  • the method provided by the broadband voice extender for adapting the bit rate of a voice signal works quite well for almost all speakers, in particular it offers a perfectly acceptable voice quality.
  • the present invention is intended to further improve the voice quality of a voice extender, in particular a broadband voice extender. Furthermore, a method for estimating a broadband speech signal on the basis of a narrowband speech signal is to be specified that enables improved speech quality.
  • the core of the invention is to make an adaptation to a communication terminal and / or to a speaker during a voice signal transmission.
  • the voice quality can be further improved compared to known methods and voice extenders.
  • the invention specifically relates to a speech extender which is designed such that it estimates a broadband speech signal using a narrowband speech signal. Further is it so adaptive that it adapts to a communication terminal and / or a speaker during coding. The adaptation is preferably carried out during a voice transmission. This enables the voice extender to continuously adapt to the remote party.
  • the speech extender can analyze and save at least one speech parameter and use it for adaptation.
  • the at least one speech parameter can in particular be a broadband speech parameter that occurs during a speech transmission.
  • the at least one speech parameter speaker and / or communication terminal-specific can be '.
  • the voice extender can be used in various mobile phones and adapt to their acoustic properties.
  • he can address different users, ie their acoustic properties such as different speech frequency spectra.
  • Characteristic acoustic properties of the communication terminal and / or the speaker are therefore preferably used as speech parameters, for example frequency profiles, attenuations of specific frequencies or frequency ranges, and the frequency spectrum of the speaker's voice.
  • Such speech parameters can be determined in particular by measurements during a speech transmission.
  • the speech extender preferably makes estimates by evaluating at least one stored speech parameter.
  • different language parameters can be used for adaptation. These are saved after their determination and are therefore available for adaptation at any time. It would also be conceivable to continuously update the stored speech parameters in order to always be optimally adapted to the current acoustic conditions.
  • the voice extender can be used in a voice encoder of a mobile and / or base station which is or is designed for a third-generation mobile radio system.
  • the third generation mobile radio system can in particular be UMTS.
  • the voice extender is preferably implemented in hardware, in particular in an integrated circuit, and / or in software.
  • An implementation in hardware offers the advantage that the voice extender can be integrated on a chip together with other essential circuit elements of the mobile radio terminal. For example, a chip manufacturer can offer such voice extenders for producers of mobile radio terminals.
  • an implementation in software offers the advantage that the language extender can be changed more easily, and above all that it can be changed later, especially if the language extender's software is stored in an erasable and rewritable memory such as an EEPROM.
  • the invention further relates to a method for estimating a broadband speech signal on the basis of a narrowband speech signal. According to the method, an adaptation to a communication terminal and / or to a speaker is carried out during the estimation.
  • At least one speech parameter is analyzed, stored and used for adaptation.
  • the at least one speech parameter is preferably a broadband speech parameter that occurs during a speech transmission.
  • the at least one language parameter can be specific to the speaker and / or communication terminal.
  • the method can advantageously be used in a speech coder of a mobile and / or base station are or are designed for a third generation mobile radio system, in particular UMTS.
  • the mobile station is a mobile radio terminal and the method is implemented in hardware, in particular in an integrated circuit, and / or at least partially in software.
  • a broadband excitation signal and broadband filter coefficients are required for the synthesis filter in the speech coder. Since generally only the narrowband excitation signal and the narrowband filter coefficients are known, it is necessary to carry out a "narrowband" to "broadband” transformation. This is done using a broadband voice extender.
  • the excitation signal can be expanded, for example, by non-linear signal processing. Another possibility is to overlay the excitation signal with white noise.
  • the filter coefficients can be estimated using two code books.
  • the entries in the code books represent possible sets of filter coefficients.
  • a narrowband and a broadband code book are trained. Since they are trained simultaneously with the same excitation signal (once narrowband and once broadband), the relationship between the entries in both code books is known. For example, entry 1 of the narrowband code book corresponds to entry 2 of the broadband code book.
  • both code books are used as follows:
  • the narrow-band filter coefficients are calculated from the narrow-band speech signal.
  • Speech signal sections are synthesized on the basis of the broadband filter coefficients found and the extended excitation signal.
  • the narrowband filter coefficients are calculated from the narrowband language. These coefficients are compared with the entries in the codebook with narrowband coefficients and the most suitable entry is selected. Since - as already mentioned above - the relationship between the code books is known, the optimal filter coefficients for the speech synthesis filter of the broadband speech extender are estimated in this way.
  • the method can also be implemented adaptively, for example in the following steps:
  • the narrowband speech signal is calculated from the broadband speech signal and the narrowband filter coefficients are determined.
  • CB-Vector (new) c * FK + (1 - c) * CB-Vector (old) 6.
  • the broadband filter coefficients are estimated using the modified code book.
  • a further improvement in the speech quality is achieved by the speech extender according to the invention. It can be used particularly advantageously in all communication systems in which speech coders with variable bit rate are used, which can encode both narrowband and broadband, for example in UMTS.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

Die Erfindung betrifft einen Sprachextender, der derart ausgebildet ist, dass er anhand eines schmalbandigen Sprachsignals ein breitbandiges Sprachsignal schätzt. Er ist ferner derart adaptiv, dass er sich bei der Kodierung an ein Kommunikationsendgerät und/oder an einen Sprecher anpasst.

Description

Beschreibung
Sprachextender und Verfahren zum Schätzen eines breitbandigen Sprachsignals anhand eines schmalbandigen Sprachsignals
Die Erfindung betrifft einen Sprachextender nach dem Oberbegriff von Anspruch 1 und ein Verfahren zum Schätzen eines breitbandigen Sprachsignals anhand eines schmalbandigen Sprachsignals nach dem Oberbegriff von Anspruch 8.
Zur Komprimierung der Datenübertragungsrate bei Sprachsignalen werden Sprachkodierer, auch 'als Sprach-Codecs bezeichnet, eingesetzt. Sie werden vor allem in Mobilfunksystemen eingesetzt. In GSM-Mobilfunksystemen (Global System for Mobile Communication) werden Sprachkodierer verwendet, die nach der Methode des Linear Predictive Coding (LPC) arbeiten. Hierbei wird im Gegensatz zu einer Signalformkodierung nicht das Sprachsignal selber, sondern sein Entstehungsprozess im menschlichen Sprechtrakt nachgebildet. Bei einer Abtastrate des Sprachsignals von 8 kHz ergibt sich bei einer Auflösung von 13 Bit eine Datenrate von 104 KBit/s. Bei GSM wird mittels LPC diese Datenrate auf konstante 13 KBit/s (sogenannte Coderate) reduziert. Hierzu werden beispielsweise bei GSM Vollraten- (Füll rate Codec) oder verbesserte Vollraten- Codecs (Enhanced Füll rate Codec) eingesetzt. Mit einem Halbraten-Codec (Half rate Codec) lässt sich die Bitrate bei entsprechend verminderter Sprachqualität stark reduzieren, nämlich auf 5,6 KBit/s.
In zukünftigen Kommunikationssystemen wie beispielsweise UMTS (Universale Mobile Telecommunications System) werden Sprachkodierer eingesetzt, die mit einer variablen Bitrate Sprachsignale kodieren können. Ein derartiger Sprachkodierer ist beispielsweise der Adaptive Multirate (AMR) Sprachkodierer, der eine Kodierung mit verschiedenen Bitraten ermöglicht. Er wurde für GSM-Mobilfunksysteme entworfen, soll jedoch auch in UMTS-Mobilfunksystemen als Standard-Sprachkodierer zur Anwendung kommen.
Bei derartigen Sprachkodierern kann die Bitrate an die zur Übertragung des kodierten Sprachsignals zur Verfügung stehende Bandbreite angepasst werden. Steht ausreichend Bandbreite für die Übertragung zur Verfügung, so wird das Sprachsignal mit einer hohen Bitrate kodiert. Dies wird auch als breitban- dige Kodierung bezeichnet. Andernfalls, also bei einer gerin- gen Bandbreite, wird mit einer niedrigen Bitrate kodiert (schmalbandige Kodierung) .
Die Anpassung der Bitrate kann während der Übertragung eines Sprachsignals erfolgen. Hierzu wird laufend die Bandbreite eines Übertragungskanals in Form der verfügbaren Bitrate gemessen. Sinkt die verfügbare Bitrate während einer Übertragung des Sprachsignals unter eine vorgegebene Schwelle, wird die Kodierung umgeschaltet, so dass das Sprachsignal schmal- bandig kodiert wird.
Es können beispielsweise zwei unterschiedliche Kodierungen mit entsprechend verschiedenen Bitraten vorgesehen sein. Eine breitbandige Kodierung erfolgt beispielsweise bei einer Abtastfrequenz von etwa 16 kHz, während eine schmalbandige Ko- dierung bei einer Abtastfrequenz von 8 kHz stattfindet. Im ersten Fall wird ein Sprach-Frequenzbereich bis 8 kHz, im zweiten Fall bis 4 kHz abgedeckt. Problematisch ist jedoch die durch das Umschalten der Bitrate verursachte Schwankung der Signalqualität und der damit einhergehenden Qualitäts- Schwankung einer Kommunikationsverbindung. Durch die vorgegebene Schwelle erfolgt das Umschalten relativ abrupt, so dass während eines Gesprächs plötzlich die Qualität der Verbindung absinken kann.
Durch den Einsatz eines sogenannten Breitband-Sprachextenders (Wideband Speech Extender) oder kurz Sprachextenders kann ohne Änderung eines Kommunikationsprotokolls eine deutlich bes- sere Sprachqualität auch bei schmalbandiger Kodierung und der qualitätsmindernde Effekt des abrupten Umschaltens etwas verringert werden. Der Breitband-Sprachextender schätzt hierzu anhand des schmalbandigen Signals das breitbandige Sprachsig- nal durch Synthese der Sprachfrequenzanteile oberhalb von 4 kHz. Dadurch wird ein zu starker Qualitätsverlust beim Umschalten der Bitrate zur Kodierung vermieden. Das durch den Breitband-Sprachextender zur Verfügung gestellte Verfahren zur Adaption der Bitrate eines Sprachsignals funktioniert für nahezu alle Sprecher recht gut, insbesondere bietet es eine durchaus akzeptable Sprachqualität.
Mit der vorliegenden Erfindung soll die Sprachqualität eines Sprachextenders, insbesondere eines Breitband-Sprachextenders weiter verbessert werden. Ferner soll ein Verfahren zum Schätzen eines breitbandigen Sprachsignals anhand eines schmalbandigen Sprachsignals angegeben .werden, dass eine verbesserte Sprachqualität ermöglicht.
Diese Verbesserung wird durch einen Sprachextender mit den Merkmalen nach Anspruch 1 erreicht. Ferner wird mit dem Verfahren mit den Merkmalen von Anspruch 8 eine deutliche Verbesserung bei der Schätzung von breitbandigen Sprachsignalen erzielt. Bevorzugte Ausgestaltungen des Sprachextenders und des Verfahrens zum Schätzen eines breitbandigen Sprachsignals anhand eines schmalbandigen Sprachsignals sind Gegenstand der jeweiligen abhängigen Ansprüche.
Kern der Erfindung ist es, eine Adaption an ein Kom unikati- onsendgerät und/oder an einen Sprecher während einer Sprachsignalübertragung vorzunehmen. Hierdurch kann die Sprachqualität nochmals gegenüber bekannten Verfahren und Sprachexten- dern verbessert werden.
Die Erfindung betrifft konkret einen Sprachextender, der derart ausgebildet ist, dass er anhand eines schmalbandigen Sprachsignals ein breitbandiges Sprachsignal schätzt. Ferner ist er derart adaptiv, dass er sich bei der Kodierung .an ein Kommunikationsendgerät und/oder an einen Sprecher anpasst. Vorzugsweise erfolgt die Anpassung während einer Sprachübertragung. Dadurch kann sich der Sprachextender laufend an den Fernteilnehmer anpassen.
Der Sprachextender kann mindestens einen Sprachparameter analysieren und speichern und zur Anpassung verwenden. Bei dem mindestens einen Sprachparameter kann es sich vor allem um einen breitbandigen Sprachparameter handeln, der während einer Sprachübertragung auftritt. Insbesondere kann der mindestens eine Sprachparameter Sprecher- und/oder Kommunikationsendgerät-spezifisch sein'. Beispielsweise kann der Sprachextender in verschiedenen Mobiltelefonen eingesetzt werden und sich an deren akustische Eigenschaften anpassen. Ferner kann er sich an verschiedene Benutzer, d.h. an deren akustische Eigenschaften wie unterschiedliche Sprach-Frequenzspektren . adaptieren. Als Sprachparameter werden also vorzugsweise charakteristische akustische Eigenschaften des Kommunikations- endgerätes und/oder des Sprechers herangezogen, beispielsweise Frequenzverläufe, Dämpfungen bestimmter Frequenzen oder Frequenzbereiche sowie das Frequenzspektrum der Stimme des Sprechers. Derartige Sprachparameter können insbesondere durch Messungen während einer Sprachübertragung ermittelt werden.
Vorzugsweise nimmt der Sprachextender Schätzungen vor, indem er mindestens einen gespeicherten Sprachparameter auswertet. Wie bereits oben erläutert, können verschiedene Sprachparame- ter zur Adaption herangezogen werden. Diese werden nach ihrer Ermittlung gespeichert und stehen dadurch für die Adaption jederzeit zur Verfügung. Denkbar wäre es auch, die gespeicherten Sprachparameter laufend zu aktualisieren, um immer optimale an die aktuellen akustischen Bedingungen angepasst zu sein. Schließlich kann der Sprachextender in einem Sprachkodierer einer Mobil- und/oder Basisstation eingesetzt werden, die für ein Mobilfunksystem der dritten Generation ausgebildet sind bzw. ist. Bei dem Mobilfunksystem der dritten Generation kann es sich insbesondere um UMTS handeln.
Ist die Mobilstation ein Mobilfunkendgerät, vorzugsweise ein Mobiltelefon, ist der Sprachextender vorzugsweise in Hardware, insbesondere in einer integrierten Schaltung, und/oder in Software implementiert. Eine Implementierung in Hardware bietet den Vorteil, dass der Sprachextender zusammen mit anderen wesentlichen Schaltungselementen des Mobilfunkendgerä- tes auf einem Chip integriert sein kann. Beispielsweise kann ein Chiphersteller derartige Sprachextender für Produzenten von Mobilfunkendgeräten anbieten. Dagegen bietet eine Implementierung in Software den Vorteil der leichteren Änderbarkeit des Sprachextenders, und vor allem der nachträglichen Änderung, insbesondere wenn die Software des Sprachextenders in einem lösch- und wiederbeschreibbaren Speicher wie bei- spielsweise einem EEPROM abgelegt ist.
Ferner betrifft die Erfindung ein Verfahren zum Schätzen eines breitbandigen Sprachsignals anhand eines schmalbandigen Sprachsignals. Verfahrensgemäß wird beim Schätzen eine Anpas- sung an ein Kommunikationsendgerät und/oder an einen Sprecher durchgeführt.
In einer bevorzugten Ausführungsform des Verfahrens wird mindestens ein Sprachparameter analysiert, gespeichert und zur Anpassung verwendet. Vorzugsweise ist der mindestens eine Sprachparameter ein breitbandiger Sprachparameter, der während einer Sprachübertragung auftritt. Insbesondere kann der mindestens eine Sprachparameter Sprecher- und/oder Kommunikationsendgerät-spezifisch sein.
Das Verfahren kann vorteilhaft in einem Sprachkodierer einer Mobil- und/oder Basisstation eingesetzt werden, die bzw. das für ein Mobilfunksystem der dritten Generation, insbesondere UMTS, ausgebildet sind bzw. ist. In einer bevorzugten Ausführungsform ist die Mobilstation ein Mobilfunkendgerät und das Verfahren in Hardware, insbesondere in einer integrierten Schaltung, und/oder zumindest teilweise in Software implementiert.
Nachfolgend wird die Erfindung anhand von Ausführungsbeispielen erläutert.
Zuerst soll die Funktionsweise eines Breitband-Sprachextenders beispielhaft erläutert werden, um den Einsatz der Erfindung besser verstehen zu können.
Um Sprachfrequenzanteile oberhalb einer bestimmten Frequenz zu generieren, benötigt man ein breitbandiges Anregungssignal und breitbandige Filterkoeffizienten für den Synthesefilter im Sprachkodierer. Da in der Regel nur das schmalbandige, Anregungssignal und die schmalbandigen Filterkoeffizienten be- kannt sind, ist es notwendig, eine Transformation "Schmalband" zu "Breitband" durchzuführen. Dies erfolgt mittels eines Breitband-Sprachextenders. Das Anregungssignal kann zum Beispiel durch eine nicht lineare Signalverarbeitung erweitert werden. Eine andere Möglichkeit liegt im Überlagern des Anregungssignals mit weißem Rauschen.
Die Filterkoeffizienten können durch den Einsatz von zwei Codebüchern geschätzt werden. Die Einträge der Codebücher stellen mögliche Sätze von Filterkoeffizienten dar. In einer Trainingsphase werden ein schmalbandiges und ein breitbandiges Codebuch trainiert. Da sie gleichzeitig mit dem gleichen Anregungssignal (einmal schmalbandig und einmal breitbandig) trainiert werden, ist der Zusammenhang zwischen den Einträgen beider Codebücher bekannt. Beispielsweise korrespondiert Ein- trag 1 des schmalbandigen Codebuches mit dem Eintrag 2 des breitbandigen Codebuches. In der Einsatzphase des Breitband-Sprachextenders werden beide Codebücher folgendermaßen benutzt:
1. Vom schmalbandigen Sprachsignal werden die schmalbandi- gen Filterkoeffizienten berechnet.
2. Diese Filterkoeffizienten werden mit den Einträgen des schmalbandigen Codebuchs verglichen.
3. Der am besten passende Eintrag wird ausgewählt. Da der Zusammenhang zwischen den Codebüchern bekannt ist, wer- den die optimalen breitbandigen Filterkoeffizienten gleichzeitig gefunden.
Anhand der gefundenen breitbandigen Filterkoeffizienten und des erweiterten Anregungssignals werden Sprachsignalabschnit- te synthetisiert.
Während der Spracherweiterung werden also die schmalbandigen Filterkoeffizienten von der schmalbandigen Sprache berechnet. Diese Koeffizienten werden mit den Einträgen des Codebuches mit schmalbandigen Koeffizienten verglichen und der am besten passende Eintrag wird gewählt. Da - wie oben bereits erwähnt - der Zusammenhang zwischen den Codebüchern bekannt ist, werden auf diese Weise die optimalen Filterkoeffizienten für den Sprachsynthesefilter des Breitband-Sprachextenders geschätzt.
Das Verfahren kann auch adaptiv beispielsweise in folgenden Schritten realisiert werden:
1. Während der breitbandigen Sprachübertragung werden die "echten" Filterkoeffizienten (FK) berechnet und der am besten passende Eintrag des Codebuches mit breitbandigen Sprachkoeffizienten wird gesucht.
2. Der Codebucheintrag wird neu berechnet. CB-Vector (new) = c* FK + (1 - c) * CB-Vector (old) 3. Während der schmalbandigen Sprachübertragung werden die breitbandigen Filterkoeffizienten anhand des modifizierten Codebuches geschätzt. Eine Alternative wird in folgenden Schritten realisiert:
1. Während der breitbandigen Sprachübertragung werden die "echten" Filterkoeffizienten (FK) berechnet .
2. Vom breitbandigen Sprachsignal wird das schmalbandige Sprachsignal berechnet und die schmalbandigen Filterkoeffizienten werden ermittelt.
3. Der am besten passenden Eintrag des Codebuches mit schmalbandigen Koeffizienten für die schmalbandigen Filterkoeffizienten wird gesucht.
4. Mittels des bekannten Zusammenhanges zwischen den Codebüchern wird der optimale Eintrag des Codebuches mit breitbandigen Koeffizienten gesucht. 5. Dieser Codebucheintrag wird neu berechnet.
CB-Vector (new) = c* FK + (1 - c) * CB-Vector (old) 6. Während der schmalbandigen Sprachübertragung werden die breitbandigen Filterkoeffizienten anhand des modifizierten Codebuches geschätzt.
Durch den erfindungsgemäßen Sprachextender wird eine weitere Verbesserung der Sprachqualität erzielt. Er kann besonders vorteilhaft in allen Kommunikationssystemen eingesetzt werden, in denen Sprachkodierer mit variabler Bitrate angewendet werden, die sowohl schmalbandig als auch breitbandig kodieren können, beispielsweise bei UMTS.

Claims

Patentansprüche
1. Sprachextender , der derart ausgebildet ist, daß er anhand eines schmalbandigen Sprachsignals ein breitbandiges Sprachsignal schätzt, dadurch gekennzeichnet, dass er sich adaptiv an ein Kommunikationsendgerät und/oder an einen Sprecher anpasst.
2. Sprachextender nach Anspruch 1, dadurch gekenn- zeichnet, dass er Mittel aufweist, mit denen er mindestens einen Sprachparameter analysiert und speichert und zur Anpassung verwendet.
3. Sprachextender nach Anspruch 2, dadurch gekenn- zeichnet, dass der mindestens eine Sprachparameter ein breitbandiger Sprachparameter ist, der während einer Sprachübertragung auftritt.
4. Sprachextender nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass der mindestens eine Sprachparameter Sprecher- und/oder Kommunikationsendgerät-spezifisch ist.
5. Sprachextender nach Anspruch 4, dadurch gekenn- zeichnet, dass er unter Auswertung mindestens eines gespeicherten Sprachparameters schätzt.
6. Sprachextender nach einem der vorhergehenden Ansprüche dadurch gekennzeichnet, dass er in einem Sprach- kodierer einer Mobil- und/oder Basisstation eingesetzt wird, die bzw. das für ein Mobilfunksystem der dritten Generation, insbesondere UMTS, ausgebildet sind bzw. ist.
7. Sprachextender nach Anspruch 6, dadurch gekenn- zeichnet, dass die Mobilstation ein Mobilfunkendgerät ist und der Sprachextender in Hardware, insbesondere in einer integrierten Schaltung, und/oder zumindest teilweise in Software implementiert ist.
8. Verfahren zum Schätzen eines breitbandigen Sprachsignals anhand eines schmalbandigen Sprachsignals, dadurch gekennzeichnet, dass beim Schätzen eine Anpassung an ein Kommunikationsendgerät und/oder an einen Sprecher durchgeführt wird.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass mindestens ein Sprachparameter analysiert, gespeichert und zur Anpassung verwendet wird.
10. Verfahren nach Anspruch 9, dadurch gekenn- zeichnet, dass der mindestens eine Sprachparameter ein breitbandiger Sprachparameter ist, der während einer Sprachübertragung_arf-tritt .
11. Verfahren nach Anspruch 9 oder 10, dadurch g e - kennzeichnet, dass der mindestens eine Sprachparameter Sprecher- und/oder Kommunikationsendgerät-spezifisch ist.
12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, dass unter Auswertung mindestens eines gespei- cherten Sprachparameters geschätzt wird.
13. Verfahren nach einem der Ansprüche 8-12, dadurch gekennzeichnet , dass es in einem Sprachkodierer einer Mobil- und/oder Basisstation eingesetzt wird, die bzw. das für ein Mobilfunksystem der dritten Generation, insbesondere UMTS, ausgebildet sind bzw. ist.
14. Verfahren nach Anspruch 13, dadurch gekennzeichnet , dass die Mobilstation ein Mobilfunkendgerät ist und das Verfahren in Hardware, insbesondere in einer integrierten Schaltung, und/oder zumindest teilweise in Software implementiert ist.
EP01978183A 2001-09-28 2001-09-28 Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals Expired - Lifetime EP1433166B8 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/DE2001/003729 WO2003036623A1 (de) 2001-09-28 2001-09-28 Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals

Publications (3)

Publication Number Publication Date
EP1433166A1 true EP1433166A1 (de) 2004-06-30
EP1433166B1 EP1433166B1 (de) 2007-11-14
EP1433166B8 EP1433166B8 (de) 2008-01-02

Family

ID=5648296

Family Applications (1)

Application Number Title Priority Date Filing Date
EP01978183A Expired - Lifetime EP1433166B8 (de) 2001-09-28 2001-09-28 Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals

Country Status (5)

Country Link
US (1) US20040243400A1 (de)
EP (1) EP1433166B8 (de)
CN (1) CN100403401C (de)
DE (1) DE50113277D1 (de)
WO (1) WO2003036623A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US8818797B2 (en) 2010-12-23 2014-08-26 Microsoft Corporation Dual-band speech encoding
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4311877A (en) * 1979-12-19 1982-01-19 Kahn Leonard R Method and means for improving the reliability of systems that transmit relatively wideband signals over two or more relatively narrowband transmission circuits
US4330689A (en) * 1980-01-28 1982-05-18 The United States Of America As Represented By The Secretary Of The Navy Multirate digital voice communication processor
DK0474812T3 (da) * 1990-03-08 1995-11-06 Ericsson Telefon Ab L M System og fremgangsmåde til dynamisk allokering af søgedirigeringsnumre
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
WO1995002288A1 (en) * 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
US5668837A (en) * 1993-10-14 1997-09-16 Ericsson Inc. Dual-mode radio receiver for receiving narrowband and wideband signals
EP0732687B2 (de) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Vorrichtung zur Erweiterung der Sprachbandbreite
US5706335A (en) * 1995-04-10 1998-01-06 Corporate Computer Systems Method and appartus for transmitting coded audio signals through a transmission channel with limited bandwidth
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
US5901145A (en) * 1997-02-28 1999-05-04 Telefonaktiebolaget L M Ericsson (Publ) Mobile station handoff between a spread spectrum communications system and a frequency division communications system
DE19804581C2 (de) * 1998-02-05 2000-08-17 Siemens Ag Verfahren und Funk-Kommunikationssystem zur Übertragung von Sprachinformation
EP0945852A1 (de) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Sprachsynthese
GB2357682B (en) * 1999-12-23 2004-09-08 Motorola Ltd Audio circuit and method for wideband to narrowband transition in a communication device
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
WO2003003350A1 (en) * 2001-06-28 2003-01-09 Koninklijke Philips Electronics N.V. Wideband signal transmission system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO03036623A1 *

Also Published As

Publication number Publication date
WO2003036623A1 (de) 2003-05-01
CN1630896A (zh) 2005-06-22
DE50113277D1 (de) 2007-12-27
US20040243400A1 (en) 2004-12-02
EP1433166B8 (de) 2008-01-02
EP1433166B1 (de) 2007-11-14
CN100403401C (zh) 2008-07-16

Similar Documents

Publication Publication Date Title
EP1388147B1 (de) Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
DE69518174T2 (de) Rauschkorrektur durch Feststellung der Anwesenheit von Sprachsignalen
DE69226500T2 (de) Verfahren und Gerät zur Sprachsignalübertragung
DE69631318T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem
DE3639753C2 (de)
DE102008016502B4 (de) Verfahren zur Datenübermittlung über einen Sprachkanal eines drahtlosen Kommunikationsnetzes unter Verwendung einer kontinuierlichen Signalmodulation
DE19921122C1 (de) Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
DE69132885T2 (de) CELP-Kodierung niedriger Verzögerung und 32 kbit/s für ein Breitband-Sprachsignal
DE60319590T2 (de) Verfahren zur codierung und decodierung von audio mit variabler rate
DE69524890T2 (de) Parametrische Sprachkodierung
EP2245621B1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
EP1953739A2 (de) Verfahren und Vorrichtung zur Geräuschunterdrückung
DE60124079T2 (de) Sprachverarbeitung
EP1023777A1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE4211945C1 (de)
DE4343366C2 (de) Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
EP1433166B1 (de) Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals
DE10252070B4 (de) Kommunikationsendgerät mit parametrierter Bandbreitenerweiterung und Verfahren zur Bandbreitenerweiterung dafür
DE60210597T2 (de) Vorrichtung zur adpcdm sprachkodierung mit spezifischer anpassung der schrittwerte
EP2245622B1 (de) Verfahren und mittel zur dekodierung von hintergrundrauschinformationen
EP1561205A1 (de) Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals
WO2002058055A1 (de) Verfahren und anordnung zum umsetzen von parametrisch codierten sprachsignalen verschiedener bandbreite in sprachsignale
EP1390947B1 (de) Verfahren zum signalempfang in einem digitalen kommunikationssystem
WO2006072526A1 (de) Verfahren zur bandbreitenerweiterung
DE102005032079A1 (de) Verfahren und Vorrichtung zur Geräuschunterdrückung

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20040212

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

RIN1 Information on inventor provided before grant (corrected)

Inventor name: KLINKE, STEFANO, AMBROSIUS

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: NOKIA SIEMENS NETWORKS GMBH & CO. KG

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE FR GB

RAP3 Party data changed (applicant data changed or rights of an application transferred)

Owner name: NOKIA SIEMENS NETWORKS S.P.A.

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

RAP4 Party data changed (patent owner data changed or rights of a patent transferred)

Owner name: NOKIA SIEMENS NETWORKS GMBH & CO. KG

REF Corresponds to:

Ref document number: 50113277

Country of ref document: DE

Date of ref document: 20071227

Kind code of ref document: P

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20080131

ET Fr: translation filed
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20080815

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20080912

Year of fee payment: 8

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20080918

Year of fee payment: 8

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20080919

Year of fee payment: 8

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20090928

REG Reference to a national code

Ref country code: FR

Ref legal event code: ST

Effective date: 20100531

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FR

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20090930

Ref country code: DE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20100401

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20090928