EP1834322A1 - Verfahren zum codieren eines analogen signals - Google Patents

Verfahren zum codieren eines analogen signals

Info

Publication number
EP1834322A1
EP1834322A1 EP05815885A EP05815885A EP1834322A1 EP 1834322 A1 EP1834322 A1 EP 1834322A1 EP 05815885 A EP05815885 A EP 05815885A EP 05815885 A EP05815885 A EP 05815885A EP 1834322 A1 EP1834322 A1 EP 1834322A1
Authority
EP
European Patent Office
Prior art keywords
signal
excitation signal
values
exe
intermediate values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP05815885A
Other languages
English (en)
French (fr)
Other versions
EP1834322B1 (de
Inventor
Wolfgang Bauer
Stefan Schandl
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unify GmbH and Co KG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP1834322A1 publication Critical patent/EP1834322A1/de
Application granted granted Critical
Publication of EP1834322B1 publication Critical patent/EP1834322B1/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Definitions

  • the invention relates to a method for coding an analog signal by means of an analysis by synthesis methods.
  • bandwidth is a limited resource.
  • D. H that the predetermined, limited bandwidth must be distributed to a large number of users. If the bandwidth for a user is now increased, a reduction of the bandwidth available to the remaining users must inevitably occur given a constant number of users.
  • Bandwidth for example 8 kHz bandwidth from 0 to 8 kHz.
  • An analog signal is decomposed into frames for coding and a synthesized signal is timed to match the analog signal.
  • the synthetic signal is generated as an output signal of a synthesis filter, which is excited by an excitation signal as an input signal.
  • At least one adaptive codebook is used in which the excitation signal is present for earlier time frames.
  • the earlier excitation signal is shown here as a plurality of samples.
  • a segment corresponding to the length of the current time frame is output of the plurality of samples present in the adaptive codebook.
  • the selection is made by means of a reference parameter dependent on a basic speech frequency, which can also assume non-integer values, ie. H . refers to spaces for intermediate values lying between the actually present samples.
  • the speech fundamental frequency parameter now assumes a non-integer value, corresponding intermediate values are selected for the sampled values in the selected segment.
  • the segment corresponds in length to the current time frame and its position in the adaptive codebook is determined by the speech fundamental frequency parameter.
  • This formation of intermediate values takes place, for example, by interpolation.
  • an interpolation can take place with a (sin x) / x function.
  • the core of the invention is now that the entirety of samples and interpolation values is used to form the excitation signal.
  • the speech fundamental frequency parameter determines the beginning of the selected segment and refers to the value 5 1/3
  • the corresponding intermediate values 5 1/3, 6 1/3, 7 1/3 etc are formed and only these for generation of the excitation signal and maintained in the adaptive codebook.
  • the values 5 1/3, 5 2/3, 6, 6 1/3, 6 2/3 etc would be used, which can be done without additional transmission of information.
  • a quality improvement is generated.
  • the distance between a sample and an intermediate value is reduced to H or. 1.3.
  • N is greater than or equal to 3
  • the distance between two intermediate values is reduced to the same value.
  • the excitation signal can also be generated in particular by means of a fixed codebook. For example, fixed excitation signals are present in a fixed codebook.
  • the fixed codebook in its originally predetermined bandwidth or. maintain the original samples and achieve higher bandwidth only with the adaptive codebook. This has the advantage of a particularly simple implementation.
  • a shift of a fixed codebook entry can take place while maintaining the time intervals between the signal components. For example, has a fixed codebook entry of length 4 a signal component at times 1 and 3, and no or. a zero value of the signal component at times 0, 2 and 4, then a shift to the times 1/3 to 4 1/3 would take place.
  • a white, d. H . essentially frequency-independent noise signal can be used to generate the excitation signal.
  • the fixed codebook can be saved. It has been found that, in particular with speech signals, a very satisfactory quality of the signal generated on the receiver side can be ensured.
  • the noise signal is picked up from the environment or generated by means of a noise generator.
  • filtering of the formed excitation signal can be provided, in particular before it is used as input signal for the synthesis filter becomes.
  • a Wiener FIR finite impulse response
  • the proposed methods can be used in a communication terminal with an encoding unit, such as a mobile telephone, a personal digital assistant (PDA), a computer or a landline telephone, etc. occur .
  • an encoding unit such as a mobile telephone, a personal digital assistant (PDA), a computer or a landline telephone, etc. occur .
  • a corresponding receiver for example transition elements between different communication systems, a TRAU (transmission and rate adaptation unit) has a corresponding decoding unit.
  • TRAU transmission and rate adaptation unit
  • a suitable communication system has at least one communication terminal and one receiver.
  • FIG. 1 a the representation of the generation of a synthesized signal
  • FIG. 1b The representation of the generation of an excitation signal for a broadband solution
  • FIG. 3 shows an exemplary bandwidth extension in the adaptive codebook.
  • FIG. 1 a shows the use of an excitation signal exe to excite a synthesis filter A (z).
  • the synthesis filter A (z) simulates in the case of speech signals in the human vocal tract, so that in this case a synthetic acoustic signal AS syn is generated by means of a suitable excitation signal exe. This is compared by means of a comparator C with the actual acoustic signal as. Successively, the excitation signal exe is adjusted so that the synthetic acoustic signal AS_syn resembles the actual acoustic signal as as well as possible.
  • FIG. 1b shows the generation of an excitation signal exe in the case of a broadband solution.
  • broadband solution is understood to mean that the bandwidth of the signal reconstructed on the receiver side is greater than originally - for example.
  • B. provided by the design of codebooks.
  • an extension of the G.729 is spoken by a 4kHz bandwidth signal as a narrowband signal, and a broadband signal is added to 8kHz bandwidth.
  • an adaptive codebook ACB is provided, with which harmonic components of the acoustic signal are displayed.
  • the adaptive codebook includes earlier excitation signals old_exc, d. H . those from previous time frames resp. Time periods.
  • the selection of an entry from the adaptive codebook ACB takes place via a non-integer speech frequency parameter p, which is represented by its integer part N * (int p), where N represents an integer, and the fraction p frac.
  • FIG. 2 sample values of the excitation signal exe for different sampling rates are shown. Depending on the sampling rate results in a 4 kHz bandwidth (case A), an 8 kHz bandwidth (case B) or a 12 kHz bandwidth (case C). The individual sample values are shown as dots, the different sample rates are made clear by different time intervals between the sample values on the time axis. In the following, Fig. Ib directed.
  • a fixed codebook SCB is also provided, which is often referred to as an innovative codebook.
  • a reference idx s to the fixed codebook SCB By means of a reference idx s to the fixed codebook SCB, a specific entry is selected from the fixed codebook SCB. This is amplified by a suitable amplification factor g_s. The resulting signal forms the fixed excitation signal exe s.
  • values are optionally set in the fixed codebook between the existing values.
  • the number of values inserted depends on the desired bandwidth expansion. This intermediate is to be clarified by the entry int N.
  • FIG. 3 shows the history (history ACB) recorded in the adaptive codebook ACB, as well as a current time frame (actual frame).
  • the current current frame is shown on the right hand side of the dashed line, whereby the continuous time on a time axis (t) is to be expressed to the right.
  • the frame is shown above the samples and intermediate values present in the adaptive codebook.
  • a sample is the value sampled at an original first sampling frequency.
  • Intermediate values are the initially artificially interposed values, which first assume the value 0 and then values ⁇ 0 as a function of the respective new time frames of the signal.
  • the intermediate values are intermediate values.
  • the adaptive codebook ACB is empty, i. H . there are only zero values at the times which correspond to a desired sampling rate. At the same time, zeroes are already inserted as intermediate values, so that in the adaptive codebook, zero values are present in the line a) at the times which already correspond to a higher sampling rate.
  • the first frame is present only at a first sampling rate, for example 4 kHz, such as the non-zero values of the current frame in line a, but a subsequent encoding is for a threefold sampling rate, for example 12 kHz, then a corresponding number Null values are set between the existing samples. This is also shown in line a for the current frame.
  • a first sampling rate for example 4 kHz, such as the non-zero values of the current frame in line a
  • a subsequent encoding is for a threefold sampling rate, for example 12 kHz
  • the first frame is already contained in the adaptive codebook.
  • a suitable segment is selected from the adaptive codebook.
  • Ml MO * M3 if MO is the number of Ml at the first sampling rate, ie. B. at 4 kHz, present values.
  • the lower first sampling rate (of for example 4 kHz) against that between the original ones Samples intermediate intermediate values for non-integer basic speech frequency parameters p.
  • the second frame is represented, for example, by the elliptically rounded segment from the adaptive codebook ACB.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Codieren eines analogen Signals (AS), welches in Zeitrahmen zerlegt wird und an welches ein synthetisches Signal (AS_syn) angeglichen wird, wobei das synthetische Signal (AS_syn) zeitrahmenweise mittels eines Synthesefilters (A(z)), welcher durch ein Anregungssignal (exc) angeregt wird, gebildet wird, und das Anregungssignal (exc_p, exc) unter Verwendung zumindest eines adaptiven Codebuchs (ACB) gebildet wird, in dem ein früheres Anregungssignal (old_exc) als eine Mehrzahl von Abtastwerten, welche einen bestimmten Abtastabstand aufweisen, vorliegt und für das aktuelle Anregungssignal (exc_p, exc) ein der Länge des Zeitrahmens entsprechendes Segment aus der Mehrzahl von Abtastwerten mittels eines Sprachgrundfrequenzparameters (p) ausgewählt wird, welcher auch nicht ganzzahlige Werte annimmt und im Falle, dass der Sprachgrundfrequenzparameter (p) einen nichtganzzahligen Wert annimmt, durch den Sprachgrundfrequenzparameter (p) definierte Zwischenwerte zu den Abtastwerten gebildet werden, so dass sich eine Ver- ringerung des zeitlichen Abstandes zwischen den Zwischenwerten und den Abtastwerten ergibt, und dieses Gesamtheit von Zwischenwerten und Abtastwerten zum Bilden des Anregungssignals (exc_P, exc) verwendet wird.

Description

Beschreibung
Verfahren zum Codieren eines analogen Signals
Die Erfindung betrifft ein Verfahren zum Codieren eines analogen Signals , mittels einer Analyse durch Syntheseverfahren .
Derzeit wird eine Erweiterung der Bandbreite bei akustischen Signalen, z . B . eine Erweiterung von 4 kHz Telefoniebandbreite auf 8 kHz Breitbandtelefonie, vielfach diskutiert, da damit eine deutliche Verbesserung der Qualität des Sprachsignals einhergeht .
Allerdings ist, insbesondere bei mobiler Kommunikation, bei der zumindest ein Teil der Übertragung über eine Funkstrecke erfolgt, die Bandbreite eine begrenzte Ressource . D . h . , dass die vorgegebene, begrenzte Bandbreite auf eine Vielzahl von Benutzern verteilt werden muss . Wird nun für einen Benutzer die Bandbreite erhöht, so muss , bei einer gleich bleibenden Anzahl von Benutzern, zwangsläufig eine Reduktion der für die übrigen Benutzer zur Verfügung stehenden Bandbreite erfolgen .
Es werden daher verschiedene Verfahren angewandt, um aus dem Anregungssignal im Schmalband, d. h . z . B . mit einer 4 kHz Bandbreite im Bereich von 0 bis 4kHz , ein Signal höherer
Bandbreite, beispielsweise 8 kHz Bandbreite von 0 bis 8kHz , zu konstruieren .
Dies erfolgt beispielsweise durch ein Quadrieren des schmal- bandigen Signals im Zeitbereich und ein Erzeugen des fehlenden Bandes durch Spiegeln oder Verschieben des Schmalbandes im Frequenzbereich . Für das Beispiel der 4 kHz Bandbreite und einer gewünschten Bandbreite von 8 kHz bedeutet dies , dass das Spektrum von 0 bis 4 kHz an beispielsweise 4 kHz bespiegelt wird und so das Spektrum von 4 bis 8 kHz erzeugt wird. Alternativ ist ein Verschieben um 4 kHz möglich . Mittels dieser Verfahren lässt sich nun aus einem Schmalbandsignal ein Breitbandsignal konstruieren, allerdings ergibt sich als Nachteil, dass diese Verfahren entweder das Spektrum des schmalbandigen Anregungssignals verzerren oder auch Datenfehler im Spektrum verursachen .
Ausgehend von diesem Stand der Technik ergibt sich als Aufgabe der vorliegenden Erfindung, eine Möglichkeit zu schaffen, ein qualitativ im Vergleich zum Stand der Technik hochwertiges Signal bei gleichzeitig geringer erforderlicher Übertragungsbandbreite zu kreieren .
Diese Aufgabe wird durch die unabhängigen Ansprüche gelöst . Vorteilhafte Weiterbildungen sind Gegenstand der abhängigen Ansprüche .
Ein analoges Signal wird zur Codierung in Zeitrahmen zerlegt und ein synthetisch hergestelltes Signal wird zeitrahmenweise an das analoge Signal angeglichen . Das synthetische Signal wird als Ausgangssignal eines Synthesefilters generiert, welcher durch ein Anregungssignal als Eingangssignal angeregt wird.
Zur Bildung des Anregungssignals wird zumindest ein adaptives Codebuch verwendet, in dem das Anregungssignal für frühere Zeitrahmen vorliegt . Das frühere Anregungssignal wird hierbei als eine Vielzahl von Abtastwerten dargestellt .
Zur Darstellung des aktuellen Anregungssignals wird ein der Länge des aktuellen Zeitrahmens entsprechendes Segment aus der Vielzahl der im adaptiven Codebuch vorliegenden Abtastwerte ausgewählt . Die Auswahl wird mittels eines von einer Sprachgrundfrequenz abhängigen Referenzparameters vorgenommen, welcher auch nichtganzzahlige Werte annehmen kann, d. h . auf zwischen den tatsächlich vorliegenden Abtastwerten liegende Plätze für Zwischenwerte verweist .
Falls nun der Sprachgrundfrequenzparameter einen nichtganz- zahligen Wert annimmt, werden entsprechende Zwischenwerte zu den Abtastwerten in dem ausgewählten Segment gewählt . Wie bereits dargelegt entspricht das Segment in seiner Länge dem aktuellen Zeitrahmen und seine Lage im adaptiven Codebuch wird durch den Sprachgrundfrequenzparameter festgelegt .
Diese Bildung von Zwischenwerten erfolgt beispielsweise durch Interpolation . Eine Interpolation kann insbesondere mit einer (sin x) /x Funktion erfolgen .
Kern der Erfindung ist es nun, dass die Gesamtheit von Ab- tastwerten und Interpolationswerten zum Bilden des Anregungssignals verwendet wird.
Dies hat den Vorteil, dass eine effektive höhere Bandbreite erzielt wird, welche sich aus der effektiv höheren Abtastrate für die Abtastwerte und Zwischenwerte ergibt . Dadurch lässt sich die Qualität eines auf Empfängerseite reproduzierten, synthetischen Signals , welches dem tatsächlichen analogen Signal möglichst gut entspricht, deutlich verbessert wird. Diese Verbesserung geschieht ohne eine Erhöhung des Bedarfs an Übertragungsbandbreite, da diesselben Codierparameter wie bei einer Schmalbandlösung übertragen werden . Die Verbesserung wird dadurch erzielt, dass bereits erzeugte Zwischenwerte im Codebuch -insbesondere auf Sender und Empfängerseite beibehalten und zur Erzeugung des Anregungssignals verwendet werden . Dies steht im Gegensatz zu bisherigen Lösungen, bei denen zwar ein nicht-ganzzahliger Sprachgrundfrequenzparameter vorgesehen war, der zwar die Lage des Segments im adaptiven Codebuch festlegte, j edoch wurde der Abstand zwischen den für die Erzeugung des Anregungssignals verwendeten Zwischenwerten nicht verringert .
Mit anderen Worten, wenn beispielsweise der Sprachgrundfrequenzparameter den Beginn des ausgewählten Segments festlegt und auf den Wert 5 1/3 verweist, so werden die entsprechenden Zwischenwerte 5 1/3, 6 1/3, 7 1/3 etc gebildet und nur diese zur Erzeugung des Anregungssignals benutzt und im adaptiven Codebuch beibehalten . Gemäß der Erfindung aber würden die Werte 5 1/3, 5 2/3, 6, 6 1/3, 6 2/3 etc verwendet, was ohne zusätzliche Übertragung von Information vorgenommen werden kann . Somit wird bei einer effizienten Ausnutzung der Über- tragungskapazität eine Qualitätsverbesserung erzeugt .
Insbesondere lässt sich der Sprachgrundfrequenzparameter als Bruchteil einer ganzen Zahl N darstellen . Dann ergibt sich eine Reduktion des zeitlichen Abstandes um l/N . Wird bei- spielsweise N=2 oder 3 gewählt, was einer Verdopplung bzw .
Verdreifachung der Bandbreite des zu darstellenden Anregungssignals entspricht, reduziert sich der Abstand zwischen einem Abtastwert und einem Zwischenwert auf H bzw . 1/3. Ebenso ist im Fall N größer oder gleich 3 der Abstand zwischen zwei Zwi- schenwerten auf denselben Wert reduziert . Weiterhin lässt sich das Anregungssignal auch insbesondere mittels eines fixen Codebuches erzeugen . Beispielsweise liegen in einem fixen Codebuch feste Anregungssignale vor .
Gemäß einer vorteilhaften Ausgestaltung ist es vorgesehen, das fixe Codebuch in seiner ursprünglich vorgegebenen Bandbreite bzw . den ursprünglichen Abtastwerten beizubehalten und eine höhere Bandbreite nur mit dem adaptiven Codebuch zu erzielen . Dies hat den Vorteil einer besonders einfachen Umset- zung .
Um auch beim fixen Codebuch zwischen den ursprünglich vorliegenden festen Anregungssignalen Zwischenwerte zu schaffen kann eine Verschiebung eines fixen Codebucheintrags unter Beibehaltung der Zeitabstände zwischen den Signalkomponenten erfolgen . Weist beispielsweise ein fixer Codebucheintrag der Länge 4 eine Signalkomponente bei den Zeitpunkten 1 und 3 auf, und keine bzw . einen Nullwert der Signalkomponente bei den Zeitpunkte 0 , 2 und 4 , dann würde eine Verschiebung auf die Zeitpunkte 1/3 bis 4 1/3 erfolgen .
Alternativ kann es vorgesehen sein auch beim fixen Codebuch Zwischenwerte durch Interpolation zu bestimmen .
Zusätzlich oder alternativ zum fixen Codebuch kann ein weißes , d. h . im wesentlichen frequenzunabhängiges Rauschsignal zum Erzeugen des Anregungssignals herangezogen werden . Damit kann beipielsweise das fixe Codebuch eingespart werden . Es hat sich gezeigt, dass damit insbesondere bei Sprachsignalen eine sehr zufriedenstellende Qualität des auf Empfängerseite erzeugten Signals gewährleistet werden kann . Das Rauschsignal wird aus der Umgebung aufgenommen oder mittels eines Rauschgenerators erzeugt .
Um beispielsweise ein Überbetonen der harmonischen Struktur in dem so erweiterten Frequenzbereich, also beispielsweise dem Frequenzbereich zwischen 4 und 8 Khz im Falle eines Schmalbandsignals mit 4kHz Bandbreite zu vermeiden, kann ein Filtern des gebildeten Anregungssignals vorgesehen sein, insbesondere bevor es als Eingangssignal für den Synthesefilter verwendet wird. Es kann hierbei beispielsweise eine Wiener- FIR (finite impulse response) Filterung vorgenommen werden .
Die vorgeschlagenen Verfahren können in einem Kommunikationsendgerät mit einer Codiereinheit, wie beispielsweise einem Mobiltelefon, einem PDA (personal digital assistant) , einem Computer oder einem Festnetztelefon etc . stattfinden .
Ein entsprechender Empfänger, beispielsweise Übergangselemente zwischen verschiedenen Kommunikationssystemen, eine TRAU (transmission and rate adaption unit) weist eine entsprechende Decodierungseinheit auf .
Ein geeignetes Kommunikationssystem weist zumindest ein Kommunikationsendgerät und einen Empfänger auf .
Weitere Vorteile werden anhand beispielhafter Ausgestaltungen dargelegt, welche teilweise auch in den Figuren gezeigt sind. Von diesen zeigen :
FIG Ia : Die Darstellung der Generierung eines synthetisierten Signals ; FIG Ib : Die Darstellung der Generierung eines Anregungssignals für eine Breitbandlösung;
FIG 2 : Darstellung eines Codebucheintrags aus dem adaptiven Codebuch für unterschiedliche Bandbreiten;
FIG 3 : Eine beispielhafte Bandbreitenerweiterung im adaptiven Codebuch .
In FIG Ia ist die Verwendung eines Anregungssignals exe zur Anregung eines Synthesefilters A (z ) dargestellt . Der Synthesefilter A (z ) simuliert im Falle von Sprachsignalen im menschlichen Vokaltrakt, so dass in diesem Falle mittels eines geeigneten Anregungssignals exe ein synthetischen akusti- sches Signal AS syn generiert wird. Dieses wird mittels eines Komperators C mit dem tatsächlichen akustischen Signal as verglichen . Sukzessive wird das Anregungssignal exe so angeglichen, dass das synthetische akustische Signal AS_syn dem tatsächlichen akustischen Signal as möglichst gut ähnelt .
In FIG Ib ist dann die Generierung des Anregungssignals exe dargestellt . Dazu werden mehrere Parameter verwendet, welche letztlich zur effektiven Bandbreitennutzung übertragen werden, da die Übertragung dieser Parameter weniger Übertra- gungskapazität erfordert, als die Übertragung des Anregungssignals exe selbst :
In FIG Ib ist die Generierung eines Anregungssignals exe im Falle einer Breitbandlösung dargestellt . Unter Breitbandlösung wird in diesem Fall verstanden, dass die Bandbreite des auf Empfängerseite rekonstruierten Signals größer ist, als usprünglich - z . B . durch die Ausgestaltung von Codebüchern vorgesehen . Im Falle einer Erweiterung des G .729 wird von einem Signal mit 4kHz Bandbreite als Schmalbandsignal gesprochen, von einem auf 8kHz Bandbreite erweiterten Signal als Breitbandsginal .
Zur Generierung des Anregungssignals ist ein adaptives Codebuch ACB vorgesehen, mit dem harmonische Anteile des akustischen Signals dargestellt werden . Dazu beinhaltet das adaptive Codebuch frühere Anregungssignale old_exc, d. h . solche aus vorhergegangenen Zeitrahmen bzw . Zeitabschnitten . Die Auswahl eines Eintrags aus dem adaptiven Codebuch ACB erfolgt über einen nicht ganzzahligen Sprachgrundfrequenzparameter p, welcher durch seinen ganzzahligen Anteil N* (int p) , wobei N eine Integerzahl darstellt, und den Bruchteil p frac dargestellt wird.
Beispielsweise wird der Sprachgrundfrequenzparameter in Fig .2 auf Basis der Bandbreite in Zeile a) ermittelt . Um beispielsweise zum 3. Abtastwert zu kommen wird p=3 gewählt . Um zu diesem Abtastwert zu gelangen, wenn ein N-tel geringerer Ab- stand zwischen Abtastwerten oder Zwischenwerten und Zwischenwerten vorliegt, d. h . das im adaptiven Codebuch ACB eine N- fach höhere Bandbreite aufweist, ist ein Wert von N*p + p frac erforderlich .
In FIG 2 sind hierbei Abtastwerte des Anregungssignals exe für unterschiedliche Abtastraten dargestellt . Je nach Abtastrate ergibt sich eine 4 kHz Bandbreite (Fall A) , eine 8 kHz Bandbreite (Fall B) oder eine 12 kHz Bandbreite (Fall C) . Die einzelnen Abtastwerte sind als Punkte dargestellt, die ver- schiedenen Abtastraten werden durch unterschiedliche zeitliche Abstände zwischen den Abtastwerten auf der Zeitachse deutlich . Im Folgenden wird wieder auf Fig . Ib verwiesen . Zur Generierung des Anregungssignales exe ist auch ein fixes Codebuch SCB vorgesehen, welches oft auch als innovatives Codebuch be- zeichnet wird. Mittels einer Referenz idx s auf das fixe Codebuch SCB wird ein bestimmter Eintrag aus dem fixen Codebuch SCB ausgewählt . Dieser wird durch einen geeigneten Verstärkungsfaktor g_s verstärkt . Das daraus hervorgegangene Signal bildet das fixe Anregungssignal exe s .
Um ein bandbreitenerweitertes fixes Anregungssignal exe s zu erhalten, werden optional im fixen Codebuch Werte zwischen die vorhandenen Werte gesetzt . Die Anzahl der dazwischenge- setzten Werte hängt von der gewünschten Bandbreitenerweite- rung ab . Dieses Dazwischensetzen soll durch den Eintrag int N verdeutlicht werden .
In FIG 3 ist die im adaptiven Codebuch ACB erfasste Historie (history ACB) dargestellt, sowie ein aktueller Zeitrahmen (actual frame) . Der j eweilige aktuelle Rahmen ist einerseits rechts von der gestrichelten Linie dargestellt, wodurch die fortlaufende Zeit auf einer Zeitachse (t) nach rechts ausgedrückt werden soll . Zur besseren Sichtbarkeit ist der Rahmen andererseits oberhalb der im adaptiven Codebuch vorliegenden Abtastwerte und Zwischenwerte dargestellt .
Als Abtastwert werden die in einer ursprünglichen ersten Abtastfrequenz abgetasteten Werte bezeichnet . Als Zwischenwerte werden die zunächst künstlich dazwischengesetzten Werte be- zeichnet, welche zunächst den Wert 0 und dann in Abhängigkeit von den j eweiligen neuen Zeitrahmen des Signals Werte ≠ 0 annehmen . In Zeile a) sind Positionen an denen Abtastwerte in der ursprünglichen geringeren Bandbreite vorgesehen sind mit Kreisen umrundet, die dazwischen liegenden Werte sind Zwischenwerte .
Für den ersten Rahmen (frame 1 ) ist das adaptive Codebuch ACB leer, d. h . es liegen lediglich Nullwerte an den Zeitpunkten vor, welche einer gewünschten Abtastrate entsprechen . Gleichzeitig sind bereits Nullen als Zwischenwerte eingefügt, so dass in Zeile a) im adaptiven Codebuch Null-Werte an den Zeitpunkten vorliegen, welche bereits einer höheren Abtastra- te entsprechen .
Liegt der erste Rahmen beispielsweise nur in einer ersten Abtastrate, beispielsweise 4 kHz vor, wie etwa durch die von Null verschiedenen Werte des aktuellen Rahmens in Zeile a und soll aber eine nachfolgende Codierung für eine dreifache Abtastrate, beispielsweise 12 kHz erfolgen, so werden entsprechend viele Nullwerte zwischen die vorhandenen Abtastwerte gesetzt . Dies ist auch in Zeile a für den aktuellen Rahmen dargestellt .
Erfolgt beispielsweise eine Erweiterung auf die dreifache Abtastrate, was dann einer dreifachen Bandbreite des damit erzielbaren Signals entspricht, so werden 3 minus 1 Zwischenwerte zwischen vorhandene Abtastwerte gesetzt . Für den zwei- ten Rahmen (frame 2 ) ist der erste Rahmen bereits im adaptiven Codebuch enthalten . Mittels eines Indexes , mit dem j eder der Abtastpunkte und Zwischenwerte ausgewählt werden kann, wird ein geeignetes Segment aus dem adaptiven Codebuch ausgewählt . Im adaptiven Codebuch ACB sind eine Anzahl von Ml Wer- ten enthalten, wobei Ml=MO * M3 wenn MO die Anzahl der bei der ersten Abtastrate, also z . B . bei 4 kHz , vorhandenen Werte darstellt . In Bezug auf die niedrigere erste Abtastrate (von beispielsweise 4 kHz ) gegen die zwischen den ursprünglichen Abtastwerten liegenden Zwischenwerten bei nicht ganzzahligen Sprachgrundfrequenzparametern p .
Der zweite Rahmen wird beispielsweise durch das elliptisch eingerundete Segment aus dem adaptiven Codebuch ACB dargestellt .
Für den dritten Zeitrahmen (Zeile D) , der durch das elliptisch umrundete Segment aus dem adaptiven Codebuch ACB darge- stellt wird, sind bereits Zwischenwerte ≠ 0 im adaptiven Codebuch ACB vorhanden . In der gezeigten Weise baut sich sukzessive ein adaptives Codebuch auf .

Claims

Patentansprüche
1. Verfahren zum Codieren eines analogen Signals (AS) , welches in Zeitrahmen zerlegt wird und an welches ein syn- thetisches Signal (AS_syn) angeglichen wird, a . wobei das synthetische Signal (AS_syn) zeitrahmen- weise mittels eines Synthesefilters (A (z ) ) , welcher durch ein Anregungssignal (exe) angeregt wird, gebildet wird, und b . das Anregungssignal (exc_p, exe) unter Verwendung zumindest eines adaptiven Codebuchs (ACB) gebildet wird, in dem ein früheres Anregungssignal (old_exc) als eine Mehrzahl von Abtastwerten, welche einen bestimmten Abtastabstand aufweisen, vorliegt und c . für das aktuelle Anregungssignal (exe p, exe) ein der Länge des Zeitrahmens entsprechendes Segment aus der Mehrzahl von Abtastwerten mittels eines Sprachgrundfrequenzparameters (p) ausgewählt wird, welcher auch nicht ganzzahlige Werte annimmt und d. im Falle, dass der Sprachgrundfrequenzparameter (p) einen nicht-ganzzahligen Wert annimmt, durch den Sprachgrundfrequenzparameter (p) definierte Zwischenwerte zu den Abtastwerten gebildet werden, so dass sich eine Verringerung des zeitlichen Abstan- des zwischen den Zwischenwerten und den Abtastwerten ergibt, e . und dieses Gesamtheit von Zwischenwerten und Abtastwerten zum Bilden des Anregungssignals (exe P, exe) verwendet wird.
2. Verfahren nach Anspruch 1 , bei dem der Sprachgrundfrequenzparameter (p) als Bruchteil einer ganzen Zahl N darstellbar ist und der zeitliche Abstand zwischen Ab- tastwerten und Zwischenwerten ebenfalls um die Zahl N reduziert ist .
3. Verfahren gemäß einem der vorhergehenden Ansprüche, wo- bei weiterhin zur Bildung des Anregungssignals (exe) ein fixes Codebuch (SCB) verwendet wird.
4. Verfahren gemäß Anspruch 3, bei dem Zwischenwerte bei einem Eintrag des fixen Codebuches (SCB) durch ein zeit- liches Verschieben des fixen Codebucheintrags erfolgen .
5. Verfahren gemäß Anspruch 3, bei dem Zwischenwerte durch eine Interpolation von Signalkomponenten eines Eintrags des fixen Codebuchs erfolgen
6. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem zur Bildung des Anregungssignals (exe) weiterhin ein weißes Rauschsignal verwendet wird.
7. Verfahren gemäß Anspruch 6, bei dem das weisse Rauschsignal aus der Umgebung erfasst wird oder mittels eines Rauschgenerators generiert wird.
8. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem das Bilden der Zwischenwerte durch Interpolation der bereits vorliegenden Abtastwerte erfolgt .
9. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem das Anregungssignal (exc_p, exe) mittels eines Wie- ner FIR Filters gefiltert wird.
10. Kommunikationsendgerät mit einer Sendeeinheit zum Übertragen von Codierparametern und einer Recheneinheit, welche zur Durchführung eines Verfahrens gemäß einem der Ansprüche 1 bis 8 eingerichtet ist .
11. Empfänger mit einer Empfangseinheit zum Empfangen von Codierparametern und einer Recheneinheit, welche zum Decodieren von mittels einem der Verfahren 1 bis 8 codierten Signalen eingerichtet ist .
12. Kommunikationssystem mit zumindest einem Kommunika- tionsendgerät gemäß Anspruch 9 und einem Empfänger gemäß
Anspruch 10.
EP05815885.8A 2005-01-05 2005-12-05 Verfahren zum codieren eines analogen signals Active EP1834322B1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005000828A DE102005000828A1 (de) 2005-01-05 2005-01-05 Verfahren zum Codieren eines analogen Signals
PCT/EP2005/056479 WO2006072519A1 (de) 2005-01-05 2005-12-05 Verfahren zum codieren eines analogen signals

Publications (2)

Publication Number Publication Date
EP1834322A1 true EP1834322A1 (de) 2007-09-19
EP1834322B1 EP1834322B1 (de) 2015-02-18

Family

ID=35697206

Family Applications (1)

Application Number Title Priority Date Filing Date
EP05815885.8A Active EP1834322B1 (de) 2005-01-05 2005-12-05 Verfahren zum codieren eines analogen signals

Country Status (5)

Country Link
US (1) US7957978B2 (de)
EP (1) EP1834322B1 (de)
CN (2) CN101099198B (de)
DE (1) DE102005000828A1 (de)
WO (1) WO2006072519A1 (de)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5774838A (en) * 1994-09-30 1998-06-30 Kabushiki Kaisha Toshiba Speech coding system utilizing vector quantization capable of minimizing quality degradation caused by transmission code error
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
JP3343082B2 (ja) * 1998-10-27 2002-11-11 松下電器産業株式会社 Celp型音声符号化装置
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
US7139700B1 (en) * 1999-09-22 2006-11-21 Texas Instruments Incorporated Hybrid speech coding and system
US7039581B1 (en) * 1999-09-22 2006-05-02 Texas Instruments Incorporated Hybrid speed coding and system
GB0025659D0 (en) * 2000-10-19 2000-12-06 Radioscape Ltd Hybrid analogue/digital transmission or communication system
DE10124420C1 (de) * 2001-05-18 2002-11-28 Siemens Ag Verfahren zur Codierung und zur Übertragung von Sprachsignalen

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2006072519A1 *

Also Published As

Publication number Publication date
US7957978B2 (en) 2011-06-07
CN102655004B (zh) 2015-06-17
WO2006072519A1 (de) 2006-07-13
CN102655004A (zh) 2012-09-05
CN101099198A (zh) 2008-01-02
CN101099198B (zh) 2012-06-27
EP1834322B1 (de) 2015-02-18
US20090276226A1 (en) 2009-11-05
DE102005000828A1 (de) 2006-07-13

Similar Documents

Publication Publication Date Title
DE69910240T2 (de) Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE60034484T2 (de) Verfahren und vorrichtung in einem kommunikationssystem
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE60024123T2 (de) Lpc-harmonischer sprachkodierer mit überrahmenformat
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
EP1869671B1 (de) Verfahren und vorrichtung zur geräuschunterdrückung
DE3736193C2 (de)
WO2007073949A1 (de) Verfahren und vorrichtung zur künstlichen erweiterung der bandbreite von sprachsignalen
EP2245621A1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
DE69820362T2 (de) Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen
DE69033510T3 (de) Numerischer sprachcodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
WO1999017587A1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE4491015C2 (de) Verfahren zum Erzeugen eines Spektralrauschbewertungsfilters zur Verwendung in einem Sprachcoder
DE60016305T2 (de) Verfahren zum Betrieb eines Sprachkodierers
DE69830816T2 (de) Mehrstufige Audiodekodierung
EP0658874B1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
DE2303497C2 (de) Verfahren zur Übertragung von Sprachsignalen
EP1834322B1 (de) Verfahren zum codieren eines analogen signals
WO2006072526A1 (de) Verfahren zur bandbreitenerweiterung
EP2380169B1 (de) Verfahren und mittel zur skalierbaren verbesserung der qualität eines signalcodierverfahrens
CH680030A5 (de)

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20070531

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE FR GB IT SE

17Q First examination report despatched

Effective date: 20071214

DAX Request for extension of the european patent (deleted)
RBV Designated contracting states (corrected)

Designated state(s): DE FR GB IT SE

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: SIEMENS ENTERPRISE COMMUNICATIONS GMBH & CO. KG

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: UNIFY GMBH & CO. KG

REG Reference to a national code

Ref country code: DE

Ref legal event code: R079

Ref document number: 502005014685

Country of ref document: DE

Free format text: PREVIOUS MAIN CLASS: G10L0019080000

Ipc: G10L0019090000

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

RIC1 Information provided on ipc code assigned before grant

Ipc: G10L 19/09 20130101AFI20140702BHEP

INTG Intention to grant announced

Effective date: 20140718

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE FR GB IT SE

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: DE

Ref legal event code: R081

Ref document number: 502005014685

Country of ref document: DE

Owner name: UNIFY GMBH & CO. KG, DE

Free format text: FORMER OWNER: SIEMENS AKTIENGESELLSCHAFT, 80333 MUENCHEN, DE

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 502005014685

Country of ref document: DE

Effective date: 20150402

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20150218

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 502005014685

Country of ref document: DE

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 11

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20151119

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20151222

Year of fee payment: 11

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 502005014685

Country of ref document: DE

Representative=s name: SCHAAFHAUSEN PATENTANWAELTE PARTNERSCHAFTSGESE, DE

Ref country code: DE

Ref legal event code: R082

Ref document number: 502005014685

Country of ref document: DE

Representative=s name: FRITZSCHE PATENTANWAELTE, DE

Ref country code: DE

Ref legal event code: R081

Ref document number: 502005014685

Country of ref document: DE

Owner name: UNIFY GMBH & CO. KG, DE

Free format text: FORMER OWNER: UNIFY GMBH & CO. KG, 81379 MUENCHEN, DE

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 12

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20161205

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 13

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 502005014685

Country of ref document: DE

Representative=s name: SCHAAFHAUSEN PATENTANWAELTE PARTNERSCHAFTSGESE, DE

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20231220

Year of fee payment: 19

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20231219

Year of fee payment: 19

Ref country code: DE

Payment date: 20231214

Year of fee payment: 19