EP1834322B1 - Verfahren zum codieren eines analogen signals - Google Patents

Verfahren zum codieren eines analogen signals Download PDF

Info

Publication number
EP1834322B1
EP1834322B1 EP05815885.8A EP05815885A EP1834322B1 EP 1834322 B1 EP1834322 B1 EP 1834322B1 EP 05815885 A EP05815885 A EP 05815885A EP 1834322 B1 EP1834322 B1 EP 1834322B1
Authority
EP
European Patent Office
Prior art keywords
exc
values
signal
excitation signal
scanning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
EP05815885.8A
Other languages
English (en)
French (fr)
Other versions
EP1834322A1 (de
Inventor
Wolfgang Bauer
Stefan Schandl
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unify GmbH and Co KG
Original Assignee
Unify GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unify GmbH and Co KG filed Critical Unify GmbH and Co KG
Publication of EP1834322A1 publication Critical patent/EP1834322A1/de
Application granted granted Critical
Publication of EP1834322B1 publication Critical patent/EP1834322B1/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Definitions

  • the invention relates to a method for coding an analog voice signal sampled at a sampling rate by means of an analysis by synthesis methods.
  • bandwidth is a limited resource. That is, the predetermined, limited bandwidth must be distributed to a plurality of users. If the bandwidth for a user is now increased, a reduction of the bandwidth available to the remaining users must inevitably occur given a constant number of users.
  • various methods are used to extract from the excitation signal in the narrow band, i. e.g. with a 4 kHz bandwidth in the range of 0 to 4 kHz, to construct a higher bandwidth signal, for example 8 kHz bandwidth from 0 to 8 kHz.
  • US Pat. No. 6,173,257 B1 discloses an adaptive codebook (adaptive codebook) for speech coding by code-excited linear prediction (CELP) using a multi-rate CODEC.
  • An analog signal is decomposed into frames for coding and a synthesized signal is timed to match the analog signal.
  • the synthetic signal is generated as an output signal of a synthesis filter, which is excited by an excitation signal as an input signal.
  • At least one adaptive codebook is used in which the excitation signal is present for earlier time frames.
  • the earlier excitation signal is shown here as a plurality of samples.
  • a segment corresponding to the length of the current time frame is output of the plurality of samples present in the adaptive codebook.
  • the selection is made by means of a reference parameter which is dependent on a basic speech frequency and which can also assume non-integer values, that is to say refers to places for intermediate values lying between the actually present samples.
  • the basic speech frequency parameter now assumes a non-integer value, corresponding intermediate values are selected for the samples in the selected segment.
  • the segment corresponds in length to the current time frame and its position in the adaptive codebook is determined by the speech fundamental frequency parameter.
  • This formation of intermediate values takes place, for example, by interpolation.
  • an interpolation can take place with a (sin x) / x function.
  • the improvement is achieved in that already generated intermediate values in the codebook - in particular on the transmitter and receiver side - maintained and used to generate the excitation signal.
  • a non-integer speech frequency parameter has been provided which, while defining the position of the segment in the adaptive codebook, has not reduced the distance between the intermediate values used to generate the excitation signal.
  • the speech fundamental frequency parameter determines the beginning of the selected segment and refers to the value 5 1/3
  • the corresponding intermediate values 5 1/3, 6 1/3, 7 1/3 etc are formed and only these for generation of the excitation signal and maintained in the adaptive codebook.
  • the values 5 1/3, 5 2/3, 6, 6 1/3, 6 2/3 etc would be used, which can be done without additional transmission of information.
  • a quality improvement is generated.
  • the excitation signal can also be generated in particular by means of a fixed codebook.
  • fixed excitation signals are present in a fixed codebook.
  • a shift of a fixed codebook entry can take place while maintaining the time intervals between the signal components. For example, if a fixed codebook entry of length 4 has a signal component at times 1 and 3, and no or zero value of the signal component at times 0, 2, and 4, then a shift to times 1/3 to 4 would be 1/3 respectively.
  • a white, ie substantially frequency-independent, noise signal can be used to generate the excitation signal.
  • the fixed codebook can be saved. It has been found that, in particular with speech signals, a very satisfactory quality of the signal generated on the receiver side can be ensured.
  • the noise signal is picked up from the environment or generated by means of a noise generator.
  • filtering of the excitation signal formed may be provided, in particular before it is used as an input signal to the synthesis filter is used.
  • a Wiener FIR (finite impulse response) filtering can be performed here.
  • the proposed methods may take place in a communication terminal with an encoding unit, such as a mobile phone, a PDA (personal digital assistant), a computer or a landline telephone, etc.
  • an encoding unit such as a mobile phone, a PDA (personal digital assistant), a computer or a landline telephone, etc.
  • a corresponding receiver for example transition elements between different communication systems, a TRAU (transmission and rate adaptation unit) has a corresponding decoding unit.
  • TRAU transmission and rate adaptation unit
  • a suitable communication system has at least one communication terminal and one receiver.
  • an excitation signal exc for excitation of a synthesis filter A (z) is shown.
  • the synthesis filter A (z) simulates in the case of speech signals in the human vocal tract, so that in this case by means of a suitable excitation signal exc a synthetic acoustic signal AS_syn is generated. This is compared by means of a comparator C with the actual acoustic signal as. Successively, the excitation signal exc is adjusted so that the synthetic acoustic signal AS_syn resembles the actual acoustic signal AS as well as possible.
  • an adaptive codebook ACB is provided, with which harmonic components of the acoustic signal are displayed.
  • the adaptive codebook includes earlier excitation signals old_exc, i. those from previous time frames or time periods.
  • the selection of an entry from the adaptive codebook ACB takes place via a non-integer speech basic frequency parameter p, which is represented by its integer part N * (int p), where N represents an integer, and the fraction p_frac.
  • FIGS. 2A to 2C In this case, samples of the excitation signal exc for different sampling rates are shown. Depending on the sampling rate results in a 4 kHz bandwidth (case A), an 8 kHz bandwidth (case B) or a 12 kHz bandwidth (case C). The individual samples are shown as dots, the different sampling rates are made clear by different time intervals between the samples on the time axis.
  • a fixed codebook SCB is also provided, which is often referred to as an innovative codebook.
  • a reference idx_s to the fixed codebook SCB, a specific entry is selected from the fixed codebook SCB. This is amplified by a suitable amplification factor g_s. The resulting signal forms the fixed excitation signal exc_s.
  • values are optionally set in the fixed codebook between the existing values.
  • the number of values interspersed depends on the desired bandwidth extension. This intermediate is to be clarified by the entry int N.
  • FIGS. 3A to 3D the history recorded in the adaptive codebook ACB (history ACB) is shown as well as a current time frame (actual frame).
  • the respective current frame is shown on the right hand side of the dashed line, whereby the continuous time on a time axis (t) is to be expressed to the right.
  • the frame is shown above the samples and intermediate values present in the adaptive codebook.
  • a sample is the value sampled at an original first sampling frequency.
  • Intermediate values are the initially artificially interposed values which first assume the value 0 and then values ⁇ 0 as a function of the respective new time frames of the signal.
  • the intermediate values are intermediate values.
  • the adaptive codebook ACB is empty, ie there are only zero values at those times which correspond to a desired sampling rate. At the same time zeros are already inserted as intermediate values, so that in 3A in the adaptive codebook zero values are present at the times which already correspond to a higher sampling rate.
  • the first frame is present only at a first sampling rate, for example 4 kHz, such as the non-zero values of the current frame in 3A and if, however, a subsequent encoding is to take place for a threefold sampling rate, for example 12 kHz, a corresponding number of zero values are set between the available sampling values. This is also in 3A shown for the current frame.
  • a first sampling rate for example 4 kHz
  • a subsequent encoding is to take place for a threefold sampling rate, for example 12 kHz
  • a corresponding number of zero values are set between the available sampling values. This is also in 3A shown for the current frame.
  • the first frame is already included in the adaptive codebook.
  • a suitable segment is selected from the adaptive codebook.
  • M1 M0 * M3 when M0 represents the number of values present at the first sampling rate, eg at 4 kHz.
  • M1 M0 * M3 when M0 represents the number of values present at the first sampling rate, eg at 4 kHz.
  • the lower first sampling rate (of for example 4 kHz) against that between the original ones Samples intermediate intermediate values for non-integer basic speech frequency parameters p.
  • the second frame is represented, for example, by the elliptically rounded segment from the adaptive codebook ACB.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die Erfindung betrifft ein Verfahren zum Codieren eines mit einer Abtastrate abgetasteten analogen Sprachsignals, mittels einer Analyse durch Syntheseverfahren.
  • Derzeit wird eine Erweiterung der Bandbreite bei akustischen Signalen, z.B. eine Erweiterung von 4 kHz Telefoniebandbreite auf 8 kHz Breitbandtelefonie, vielfach diskutiert, da damit eine deutliche Verbesserung der Qualität des Sprachsignals einhergeht.
  • Allerdings ist, insbesondere bei mobiler Kommunikation, bei der zumindest ein Teil der Übertragung über eine Funkstrecke erfolgt, die Bandbreite eine begrenzte Ressource. D.h., dass die vorgegebene, begrenzte Bandbreite auf eine Vielzahl von Benutzern verteilt werden muss. Wird nun für einen Benutzer die Bandbreite erhöht, so muss, bei einer gleich bleibenden Anzahl von Benutzern, zwangsläufig eine Reduktion der für die übrigen Benutzer zur Verfügung stehenden Bandbreite erfolgen.
  • Es werden daher verschiedene Verfahren angewandt, um aus dem Anregungssignal im Schmalband, d.h. z.B. mit einer 4 kHz Bandbreite im Bereich von 0 bis 4 kHz, ein Signal höherer Bandbreite, beispielsweise 8 kHz Bandbreite von 0 bis 8kHz, zu konstruieren.
  • Dies erfolgt beispielsweise durch ein Quadrieren des schmalbandigen Signals im Zeitbereich und ein Erzeugen des fehlenden Bandes durch Spiegeln oder Verschieben des Schmalbandes im Frequenzbereich. Für das Beispiel der 4 kHz Bandbreite und einer gewünschten Bandbreite von 8 kHz bedeutet dies, dass das Spektrum von 0 bis 4 kHz an beispielsweise 4 kHz bespiegelt wird und so das Spektrum von 4 bis 8 kHz erzeugt wird. Alternativ ist ein Verschieben um 4 kHz möglich. Mittels dieser Verfahren lässt sich nun aus einem Schmalbandsignal ein Breitbandsignal konstruieren, allerdings ergibt sich als Nachteil, dass diese Verfahren entweder das Spektrum des schmalbandigen Anregungssignals verzerren oder auch Datenfehler im Spektrum verursachen.
  • US 6 173 257 B1 offenbart ein adaptives codebuch (adaptive codebuch) zur Sprachcodierung mittels CELP(code-excited linear prediction) unter Verwendung eines Multirate CODEC.
  • Ausgehend von diesem Stand der Technik ergibt sich als Aufgabe der vorliegenden Erfindung, eine Möglichkeit zu schaffen, ein qualitativ im Vergleich zum Stand der Technik hochwertiges Signal bei gleichzeitig geringer erforderlicher Übertragungsbandbreite zu kreieren.
  • Diese Aufgabe wird durch die unabhängigen Ansprüche gelöst. Vorteilhafte Weiterbildungen sind Gegenstand der abhängigen Ansprüche.
  • Ein analoges Signal wird zur Codierung in Zeitrahmen zerlegt und ein synthetisch hergestelltes Signal wird zeitrahmenweise an das analoge Signal angeglichen. Das synthetische Signal wird als Ausgangssignal eines Synthesefilters generiert, welcher durch ein Anregungssignal als Eingangssignal angeregt wird.
  • Zur Bildung des Anregungssignals wird zumindest ein adaptives Codebuch verwendet, in dem das Anregungssignal für frühere Zeitrahmen vorliegt. Das frühere Anregungssignal wird hierbei als eine Vielzahl von Abtastwerten dargestellt.
  • Zur Darstellung des aktuellen Anregungssignals wird ein der Länge des aktuellen Zeitrahmens entsprechendes Segment aus der Vielzahl der im adaptiven Codebuch vorliegenden Abtastwerte ausgewählt. Die Auswahl wird mittels eines von einer Sprachgrundfrequenz abhängigen Referenzparameters vorgenommen, welcher auch nichtganzzahlige Werte annehmen kann, d.h. auf zwischen den tatsächlich vorliegenden Abtastwerten liegende Plätze für Zwischenwerte verweist.
  • Falls nun der Sprachgrundfrequenzparameter einen nichtganzzahligen Wert annimmt, werden entsprechende Zwischenwerte zu den Abtastwerten in dem ausgewählten Segment gewählt. Wie bereits dargelegt entspricht das Segment in seiner Länge dem aktuellen Zeitrahmen und seine Lage im adaptiven Codebuch wird durch den Sprachgrundfrequenzparameter festgelegt.
  • Diese Bildung von Zwischenwerten erfolgt beispielsweise durch Interpolation. Eine Interpolation kann insbesondere mit einer (sin x)/x Funktion erfolgen.
  • Kern der Erfindung ist es nun, dass die Gesamtheit von Abtastwerten und Interpolationswerten zum Bilden des Anregungssignals verwendet wird.
  • Dies hat den Vorteil, dass eine effektive höhere Bandbreite erzielt wird, welche sich aus der effektiv höheren Abtastrate für die Abtastwerte und Zwischenwerte ergibt. Dadurch lässt sich die Qualität eines auf Empfängerseite reproduzierten, synthetischen Signals, welches dem tatsächlichen analogen Signal möglichst gut entspricht, deutlich verbessert wird. Diese Verbesserung geschieht ohne eine Erhöhung des Bedarfs an Übertragungsbandbreite, da diesselben Codierparameter wie bei einer Schmalbandlösung übertragen werden.
  • Die Verbesserung wird dadurch erzielt, dass bereits erzeugte Zwischenwerte im Codebuch - insbesondere auf Sender und Empfängerseite - beibehalten und zur Erzeugung des Anregungssignals verwendet werden.
    Dies steht im Gegensatz zu bisherigen Lösungen, bei denen zwar ein nicht-ganzzahliger Sprachgrundfrequenzparameter vorgesehen war, der zwar die Lage des Segments im adaptiven Codebuch festlegte, jedoch wurde der Abstand zwischen den für die Erzeugung des Anregungssignals verwendeten Zwischenwerten nicht verringert.
    Mit anderen Worten, wenn beispielsweise der Sprachgrundfrequenzparameter den Beginn des ausgewählten Segments festlegt und auf den Wert 5 1/3 verweist, so werden die entsprechenden Zwischenwerte 5 1/3, 6 1/3, 7 1/3 etc gebildet und nur diese zur Erzeugung des Anregungssignals benutzt und im adaptiven Codebuch beibehalten. Gemäß der Erfindung aber würden die Werte 5 1/3, 5 2/3, 6, 6 1/3, 6 2/3 etc,verwendet, was ohne zusätzliche Übertragung von Information vorgenommen werden kann. Somit wird bei einer effizienten Ausnutzung der Übertragungskapazität eine Qualitätsverbesserung erzeugt.
  • Insbesondere lässt sich der Sprachgrundfrequenzparameter als Bruchteil einer ganzen Zahl N darstellen. Dann ergibt sich eine Reduktion des zeitlichen Abstandes um 1/N. Wird beispielsweise N=2 oder 3 gewählt, was einer Verdopplung bzw. Verdreifachung der Bandbreite des zu darstellenden Anregungssignals entspricht, reduziert sich der Abstand zwischen einem Abtastwert und einem Zwischenwert auf 1/2 bzw. 1/3. Ebenso ist im Fall N größer oder gleich 3 der Abstand zwischen zwei Zwischenwerten auf denselben Wert reduziert.
  • Weiterhin lässt sich das Anregungssignal auch insbesondere mittels eines fixen Codebuches erzeugen. Beispielsweise liegen in einem fixen Codebuch feste Anregungssignale vor.
  • Gemäß einer vorteilhaften Ausgestaltung ist es vorgesehen, das fixe Codebuch in seiner ursprünglich vorgegebenen Bandbreite bzw. den ursprünglichen Abtastwerten beizubehalten und eine höhere Bandbreite nur mit dem adaptiven Codebuch zu erzielen. Dies hat den Vorteil einer besonders einfachen Umsetzung.
  • Um auch beim fixen Codebuch zwischen den ursprünglich vorliegenden festen Anregungssignalen Zwischenwerte zu schaffen kann eine Verschiebung eines fixen Codebucheintrags unter Beibehaltung der Zeitabstände zwischen den Signalkomponenten erfolgen. Weist beispielsweise ein fixer Codebucheintrag der Länge 4 eine Signalkomponente bei den Zeitpunkten 1 und 3 auf, und keine bzw. einen Nullwert der Signalkomponente bei den Zeitpunkten 0, 2 und 4, dann würde eine Verschiebung auf die Zeitpunkte 1/3 bis 4 1/3 erfolgen.
  • Alternativ kann es vorgesehen sein auch beim fixen Codebuch Zwischenwerte durch Interpolation zu bestimmen.
  • Zusätzlich oder alternativ zum fixen Codebuch kann ein weißes, d.h. im wesentlichen frequenzunabhängiges Rauschsignal zum Erzeugen des Anregungssignals herangezogen werden. Damit kann beipielsweise das fixe Codebuch eingespart werden. Es hat sich gezeigt, dass damit insbesondere bei Sprachsignalen eine sehr zufriedenstellende Qualität des auf Empfängerseite erzeugten Signals gewährleistet werden kann.
  • Das Rauschsignal wird aus der Umgebung aufgenommen oder mittels eines Rauschgenerators erzeugt.
  • Um beispielsweise ein Überbetonen der harmonischen Struktur in dem so erweiterten Frequenzbereich, also beispielsweise dem Frequenzbereich zwischen 4 und 8 kHz im Falle eines Schmalbandsignals mit 4 kHz Bandbreite zu vermeiden, kann ein Filtern des gebildeten Anregungssignals vorgesehen sein, insbesondere bevor es als Eingangssignal für den Synthesefilter verwendet wird. Es kann hierbei beispielsweise eine Wiener FIR (finite impulse response) Filterung vorgenommen werden.
  • Die vorgeschlagenen Verfahren können in einem Kommunikationsendgerät mit einer Codiereinheit, wie beispielsweise einem Mobiltelefon, einem PDA (personal digital assistant), einem Computer oder einem Festnetztelefon etc. stattfinden.
  • Ein entsprechender Empfänger, beispielsweise Übergangselemente zwischen verschiedenen Kommunikationssystemen, eine TRAU (transmission and rate adaption unit) weist eine entsprechende Decodierungseinheit auf.
  • Ein geeignetes Kommunikationssystem weist zumindest ein Kommunikationsendgerät und einen Empfänger auf.
  • Weitere Vorteile werden anhand beispielhafter Ausgestaltungen dargelegt, welche teilweise auch in den Figuren gezeigt sind. Von diesen zeigen:
  • FIG 1A:
    Die Darstellung der Generierung eines synthetisierten Signals;
    FIG 1B:
    Die Darstellung der Generierung eines Anregungssignals für eine Breitbandlösung;
    FIG 2A, 2B, 2C:
    Darstellungen eines Codebucheintrags aus dem adaptiven Codebuch für unterschiedliche Bandbreiten;
    FIG 3A, 3B, 3C, 3D :
    Eine beispielhafte Bandbreitenerweiterung im adaptiven Codebuch.
  • In FIG 1A ist die Verwendung eines Anregungssignals exc zur Anregung eines Synthesefilters A(z) dargestellt. Der Synthesefilter A(z) simuliert im Falle von Sprachsignalen im menschlichen Vokaltrakt, so dass in diesem Falle mittels eines geeigneten Anregungssignals exc ein synthetischen akustisches Signal AS_syn generiert wird. Dieses wird mittels eines Komperators C mit dem tatsächlichen akustischen Signal as verglichen. Sukzessive wird das Anregungssignal exc so angeglichen, dass das synthetische akustische Signal AS_syn dem tatsächlichen akustischen Signal AS möglichst gut ähnelt.
  • In FIG 1B ist dann die Generierung des Anregungssignals exc dargestellt. Dazu werden mehrere Parameter verwendet, welche letztlich zur effektiven Bandbreitennutzung übertragen werden, da die Übertragung dieser Parameter weniger Übertragungskapazität erfordert, als die Übertragung des Anregungssignals exc selbst:
    • In FIG 1B ist die Generierung eines Anregungssignals exc im Falle einer Breitbandlösung dargestellt.
      Unter Breitbandlösung wird in diesem Fall verstanden, dass die Bandbreite des auf Empfängerseite rekonstruierten Signals größer ist, als usprünglich - z.B. durch die Ausgestaltung von Codebüchern vorgesehen. Im Falle einer Erweiterung des G.729 wird von einem Signal mit 4 kHz Bandbreite als Schmalbandsignal gesprochen, von einem auf 8 kHz Bandbreite erweiterten Signal als Breitbandsginal.
  • Zur Generierung des Anregungssignals ist ein adaptives Codebuch ACB vorgesehen, mit dem harmonische Anteile des akustischen Signals dargestellt werden. Dazu beinhaltet das adaptive Codebuch frühere Anregungssignale old_exc, d.h. solche aus vorhergegangenen Zeitrahmen bzw. Zeitabschnitten. Die Auswahl eines Eintrags aus dem adaptiven Codebuch ACB erfolgt über einen nicht ganzzahligen Sprachgrundfrequenzparameter p, welcher durch seinen ganzzahligen Anteil N*(int p), wobei N eine Integerzahl darstellt, und den Bruchteil p_frac dargestellt wird.
  • Beispielsweise wird der Sprachgrundfrequenzparameter in FIG 2A auf Basis der Bandbreite ermittelt. Um beispielsweise zum 3. Abtastwert zu kommen wird p=3 gewählt. Um zu diesem Abtastwert zu gelangen, wenn ein N-tel geringerer Abstand zwischen Abtastwerten oder Zwischenwerten und Zwischenwerten vorliegt, d.h. das adaptive Codebuch ACB eine N-fach höhere Bandbreite aufweist, ist ein Wert von N*p + p_frac erforderlich.
  • In FIG 2A bis 2C sind hierbei Abtastwerte des Anregungssignals exc für unterschiedliche Abtastraten dargestellt. Je nach Abtastrate ergibt sich eine 4 kHz Bandbreite (Fall A), eine 8 kHz Bandbreite (Fall B) oder eine 12 kHz Bandbreite (Fall C). Die einzelnen Abtastwerte sind als Punkte dargestellt, die verschiedenen Abtastraten werden durch unterschiedliche zeitliche Abstände zwischen den Abtastwerten auf der Zeitachse deutlich.
  • Im Folgenden wird wieder auf FIG 1B verwiesen. Zur Generierung des Anregungssignales exc ist auch ein fixes Codebuch SCB vorgesehen, welches oft auch als innovatives Codebuch bezeichnet wird. Mittels einer Referenz idx_s auf das fixe Codebuch SCB wird ein bestimmter Eintrag aus dem fixen Codebuch SCB ausgewählt. Dieser wird durch einen geeigneten Verstärkungsfaktor g_s verstärkt. Das daraus hervorgegangene Signal bildet das fixe Anregungssignal exc_s.
  • Um ein bandbreitenerweitertes fixes Anregungssignal exc_s zu erhalten, werden optional im fixen Codebuch Werte zwischen die vorhandenen Werte gesetzt. Die Anzahl der dazwischengesetzten Werte hängt von der gewünschten Bandbreitenerweiterung ab. Dieses Dazwischensetzen soll durch den Eintrag int N verdeutlicht werden.
  • In FIG 3A bis FIG 3D ist die im adaptiven Codebuch ACB jeweils erfasste Historie (history ACB) dargestellt, sowie ein aktueller Zeitrahmen (actual frame). Der jeweilige aktuelle Rahmen ist einerseits rechts von der gestrichelten Linie dargestellt, wodurch die fortlaufende Zeit auf einer Zeitachse (t) nach rechts ausgedrückt werden soll. Zur besseren Sichtbarkeit ist der Rahmen andererseits oberhalb der im adaptiven Codebuch vorliegenden Abtastwerte und Zwischenwerte dargestellt.
  • Als Abtastwert werden die in einer ursprünglichen ersten Abtastfrequenz abgetasteten Werte bezeichnet. Als Zwischenwerte werden die zunächst künstlich dazwischengesetzten Werte bezeichnet, welche zunächst den Wert 0 und dann in Abhängigkeit von den jeweiligen neuen Zeitrahmen des Signals Werte ≠ 0 annehmen. In FIG 3A sind Positionen an denen Abtastwerte in der ursprünglichen geringeren Bandbreite vorgesehen sind mit Kreisen umrundet, die dazwischen liegenden Werte sind Zwischenwerte.
  • Für den ersten Rahmen (Frame 1) ist das adaptive Codebuch ACB leer, d.h. es liegen lediglich Nullwerte an den Zeitpunkten vor, welche einer gewünschten Abtastrate entsprechen. Gleichzeitig sind bereits Nullen als Zwischenwerte eingefügt, so dass in FIG 3A im adaptiven Codebuch Null-Werte an den Zeitpunkten vorliegen, welche bereits einer höheren Abtastrate entsprechen.
  • Liegt der erste Rahmen beispielsweise nur in einer ersten Abtastrate, beispielsweise 4 kHz vor, wie etwa durch die von Null verschiedenen Werte des aktuellen Rahmens in FIG 3A und soll aber eine nachfolgende Codierung für eine dreifache Abtastrate, beispielsweise 12 kHz erfolgen, so werden entsprechend viele Nullwerte zwischen die vorhandenen Abtastwerte gesetzt. Dies ist auch in FIG 3A für den aktuellen Rahmen dargestellt.
  • Erfolgt beispielsweise eine Erweiterung auf die dreifache Abtastrate, was dann einer dreifachen Bandbreite des damit erzielbaren Signals entspricht, so werden 3 minus 1 Zwischenwerte zwischen vorhandene Abtastwerte gesetzt. Für den zweiten Rahmen (Frame 2) ist der erste Rahmen bereits im adaptiven Codebuch enthalten. Mittels eines Indexes, mit dem jeder der Abtastpunkte und Zwischenwerte ausgewählt werden kann, wird ein geeignetes Segment aus dem adaptiven Codebuch ausgewählt. Im adaptiven Codebuch ACB sind eine Anzahl von M1 Werten enthalten, wobei M1=M0 * M3 wenn M0 die Anzahl der bei der ersten Abtastrate, also z.B. bei 4 kHz, vorhandenen Werte darstellt. In Bezug auf die niedrigere erste Abtastrate (von beispielsweise 4 kHz) gegen die zwischen den ursprünglichen Abtastwerten liegenden Zwischenwerten bei nicht ganzzahligen Sprachgrundfrequenzparametern p.
  • Der zweite Rahmen wird beispielsweise durch das elliptisch eingerundete Segment aus dem adaptiven Codebuch ACB dargestellt.
  • Für den dritten Zeitrahmen (FIG 3D), der durch das elliptisch umrundete Segment aus dem adaptiven Codebuch ACB dargestellt wird, sind bereits Zwischenwerte ≠ 0 im adaptiven Codebuch ACB vorhanden. In der gezeigten Weise baut sich sukzessive ein adaptives Codebuch auf.

Claims (10)

  1. Verfahren zum Codieren eines mit einer Abtastrate abgetasteten analogen Sprachsignals (AS), welches in Zeitrahmen zerlegt wird und an welches ein synthetisches Signal (AS_syn) angeglichen wird,
    a. wobei das synthetische Signal (AS_syn) zeitrahmenweise mittels eines Synthesefilters (A(z)), welcher durch ein Anregungssignal (exc) angeregt wird, gebildet wird, und
    b. das Anregungssignal (exc_p, exc) unter Verwendung zumindest eines adaptiven Codebuchs (ACB) gebildet wird, in dem ein früheres Anregungssignal (old_exc) als eine Mehrzahl von Abtastwerten, welche einen bestimmten Abtastabstand aufweisen, vorliegt, wobei das adaptive Codebuch (ACB) eine N-fach höhere Bandbreite als die Abtastrate aufweist, wodurch ein N-tel geringerer Abstand durch Bildung von Zwischenwerten zwischen den Abtastwerten gebildet wird, wobei N eine Integerzahl größer oder gleich 2 ist, und
    c. für das aktuelle Anregungssignal (exc_p, exc) ein der Länge des Zeitrahmens entsprechendes Segment aus der Mehrzahl von Abtastwerten mittels eines Sprachgrundfrequenzparameters (p) ausgewählt wird, welcher auch nicht ganzzahlige Werte annimmt und
    d. im Falle, dass der Sprachgrundfrequenzparameter (p) einen nicht ganzzahligen Wert annimmt, durch den Sprachgrundfrequenzparameter (p) definierte zu interpolierende Zwischenwerte zu den Abtastwerten gebildet werden, so dass sich eine Verringerung des zeitlichen Abstandes zwischen den Zwischenwerten und den Abtastwerten ergibt,
    e. und diese Gesamtheit von Zwischenwerten und Abtastwerten zum Bilden des Anregungssignals (exc_p, exc) verwendet wird, wodurch eine effektiv höhere Bandbreite erzielt wird, wodurch die Qualität eines auf einer Empfängerseite reproduzierten synthetischen Signals verbessert wird.
  2. Verfahren nach Anspruch 1, bei dem der Sprachgrundfrequenzparameter (p) als Bruchteil einer ganzen Zahl N darstellbar ist und der zeitliche Abstand zwischen Abtastwerten und Zwischenwerten ebenfalls um die Zahl N reduziert ist.
  3. Verfahren gemäß einem der vorhergehenden Ansprüche, wobei weiterhin zur Bildung des Anregungssignals (exc) ein fixes Codebuch (SCB) verwendet wird.
  4. Verfahren gemäß Anspruch 3, bei dem Zwischenwerte bei einem Eintrag des fixen Codebuches (SCB) durch ein zeitliches Verschieben des fixen Codebucheintrags erfolgen.
  5. Verfahren gemäß Anspruch 3, bei dem Zwischenwerte durch eine Interpolation von Signalkomponenten eines Eintrags des fixen Codebuchs erfolgen.
  6. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem zur Bildung des Anregungssignals (exc) weiterhin ein weißes Rauschsignal verwendet wird.
  7. Verfahren gemäß Anspruch 6, bei dem das weiße Rauschsignal aus der Umgebung erfasst wird oder mittels eines Rauschgenerators generiert wird.
  8. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem das Bilden der Zwischenwerte durch Interpolation der bereits vorliegenden Abtastwerte erfolgt.
  9. Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem das Anregungssignal (exc_p, exc) mittels eines Wiener FIR Filters gefiltert wird.
  10. Kommunikationsendgerät mit einer Sendeeinheit zum Übertragen von Codierparametern und einer Recheneinheit, welche Mittel aufweist, die zur Durchführung aller Schritte eines Verfahrens gemäß einem der Ansprüche 1 bis 8 eingerichtet sind.
EP05815885.8A 2005-01-05 2005-12-05 Verfahren zum codieren eines analogen signals Active EP1834322B1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005000828A DE102005000828A1 (de) 2005-01-05 2005-01-05 Verfahren zum Codieren eines analogen Signals
PCT/EP2005/056479 WO2006072519A1 (de) 2005-01-05 2005-12-05 Verfahren zum codieren eines analogen signals

Publications (2)

Publication Number Publication Date
EP1834322A1 EP1834322A1 (de) 2007-09-19
EP1834322B1 true EP1834322B1 (de) 2015-02-18

Family

ID=35697206

Family Applications (1)

Application Number Title Priority Date Filing Date
EP05815885.8A Active EP1834322B1 (de) 2005-01-05 2005-12-05 Verfahren zum codieren eines analogen signals

Country Status (5)

Country Link
US (1) US7957978B2 (de)
EP (1) EP1834322B1 (de)
CN (2) CN101099198B (de)
DE (1) DE102005000828A1 (de)
WO (1) WO2006072519A1 (de)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
EP0704836B1 (de) * 1994-09-30 2002-03-27 Kabushiki Kaisha Toshiba Vorrichtung zur Vektorquantisierung
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
JP3343082B2 (ja) * 1998-10-27 2002-11-11 松下電器産業株式会社 Celp型音声符号化装置
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US7039581B1 (en) * 1999-09-22 2006-05-02 Texas Instruments Incorporated Hybrid speed coding and system
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
US7139700B1 (en) * 1999-09-22 2006-11-21 Texas Instruments Incorporated Hybrid speech coding and system
GB0025659D0 (en) * 2000-10-19 2000-12-06 Radioscape Ltd Hybrid analogue/digital transmission or communication system
DE10124420C1 (de) * 2001-05-18 2002-11-28 Siemens Ag Verfahren zur Codierung und zur Übertragung von Sprachsignalen

Also Published As

Publication number Publication date
CN101099198A (zh) 2008-01-02
US20090276226A1 (en) 2009-11-05
CN102655004A (zh) 2012-09-05
WO2006072519A1 (de) 2006-07-13
CN101099198B (zh) 2012-06-27
CN102655004B (zh) 2015-06-17
EP1834322A1 (de) 2007-09-19
DE102005000828A1 (de) 2006-07-13
US7957978B2 (en) 2011-06-07

Similar Documents

Publication Publication Date Title
EP1741039B1 (de) Informationssignalverarbeitung durch modifikation in der spektral-/modulationsspektralbereichsdarstellung
DE69910240T2 (de) Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE60024123T2 (de) Lpc-harmonischer sprachkodierer mit überrahmenformat
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE60303214T2 (de) Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden
DE69731588T2 (de) Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem
DE69121411T2 (de) Methode und gerät zur codierung von analogen signalen
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
EP2062254B1 (de) Steganographie in digitalen signal-codierern
DE2229149A1 (de) Verfahren zur Übertragung von Sprache
DE3736193C2 (de)
DE69033510T3 (de) Numerischer sprachcodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
DE69820362T2 (de) Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen
WO2006114368A1 (de) Verfahren und vorrichtung zur geräuschunterdrückung
EP1979899A1 (de) Verfahren und anordnungen zur audiosignalkodierung
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE4491015C2 (de) Verfahren zum Erzeugen eines Spektralrauschbewertungsfilters zur Verwendung in einem Sprachcoder
DE69028434T2 (de) System zur Codierung von Breitbandaudiosignalen
DE60016305T2 (de) Verfahren zum Betrieb eines Sprachkodierers
EP1834322B1 (de) Verfahren zum codieren eines analogen signals
DE69127339T2 (de) Methode und Einrichtung zur Kodierung und Dekodierung eines abgetasteten Analogsignals mit Wiederholungseigenschaften

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20070531

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE FR GB IT SE

17Q First examination report despatched

Effective date: 20071214

DAX Request for extension of the european patent (deleted)
RBV Designated contracting states (corrected)

Designated state(s): DE FR GB IT SE

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: SIEMENS ENTERPRISE COMMUNICATIONS GMBH & CO. KG

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: UNIFY GMBH & CO. KG

REG Reference to a national code

Ref country code: DE

Ref legal event code: R079

Ref document number: 502005014685

Country of ref document: DE

Free format text: PREVIOUS MAIN CLASS: G10L0019080000

Ipc: G10L0019090000

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

RIC1 Information provided on ipc code assigned before grant

Ipc: G10L 19/09 20130101AFI20140702BHEP

INTG Intention to grant announced

Effective date: 20140718

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE FR GB IT SE

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: DE

Ref legal event code: R081

Ref document number: 502005014685

Country of ref document: DE

Owner name: UNIFY GMBH & CO. KG, DE

Free format text: FORMER OWNER: SIEMENS AKTIENGESELLSCHAFT, 80333 MUENCHEN, DE

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 502005014685

Country of ref document: DE

Effective date: 20150402

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20150218

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 502005014685

Country of ref document: DE

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 11

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20151119

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20151222

Year of fee payment: 11

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 502005014685

Country of ref document: DE

Representative=s name: SCHAAFHAUSEN PATENTANWAELTE PARTNERSCHAFTSGESE, DE

Ref country code: DE

Ref legal event code: R082

Ref document number: 502005014685

Country of ref document: DE

Representative=s name: FRITZSCHE PATENTANWAELTE, DE

Ref country code: DE

Ref legal event code: R081

Ref document number: 502005014685

Country of ref document: DE

Owner name: UNIFY GMBH & CO. KG, DE

Free format text: FORMER OWNER: UNIFY GMBH & CO. KG, 81379 MUENCHEN, DE

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 12

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20161205

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 13

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 502005014685

Country of ref document: DE

Representative=s name: SCHAAFHAUSEN PATENTANWAELTE PARTNERSCHAFTSGESE, DE

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20231220

Year of fee payment: 19

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20231219

Year of fee payment: 19

Ref country code: DE

Payment date: 20231214

Year of fee payment: 19