EP1834322B1 - Verfahren zum codieren eines analogen signals - Google Patents
Verfahren zum codieren eines analogen signals Download PDFInfo
- Publication number
- EP1834322B1 EP1834322B1 EP05815885.8A EP05815885A EP1834322B1 EP 1834322 B1 EP1834322 B1 EP 1834322B1 EP 05815885 A EP05815885 A EP 05815885A EP 1834322 B1 EP1834322 B1 EP 1834322B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- exc
- values
- signal
- excitation signal
- scanning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 16
- 230000005284 excitation Effects 0.000 claims description 39
- 230000003044 adaptive effect Effects 0.000 claims description 27
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims 3
- 238000006073 displacement reaction Methods 0.000 claims 1
- 238000005070 sampling Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
Definitions
- the invention relates to a method for coding an analog voice signal sampled at a sampling rate by means of an analysis by synthesis methods.
- bandwidth is a limited resource. That is, the predetermined, limited bandwidth must be distributed to a plurality of users. If the bandwidth for a user is now increased, a reduction of the bandwidth available to the remaining users must inevitably occur given a constant number of users.
- various methods are used to extract from the excitation signal in the narrow band, i. e.g. with a 4 kHz bandwidth in the range of 0 to 4 kHz, to construct a higher bandwidth signal, for example 8 kHz bandwidth from 0 to 8 kHz.
- US Pat. No. 6,173,257 B1 discloses an adaptive codebook (adaptive codebook) for speech coding by code-excited linear prediction (CELP) using a multi-rate CODEC.
- An analog signal is decomposed into frames for coding and a synthesized signal is timed to match the analog signal.
- the synthetic signal is generated as an output signal of a synthesis filter, which is excited by an excitation signal as an input signal.
- At least one adaptive codebook is used in which the excitation signal is present for earlier time frames.
- the earlier excitation signal is shown here as a plurality of samples.
- a segment corresponding to the length of the current time frame is output of the plurality of samples present in the adaptive codebook.
- the selection is made by means of a reference parameter which is dependent on a basic speech frequency and which can also assume non-integer values, that is to say refers to places for intermediate values lying between the actually present samples.
- the basic speech frequency parameter now assumes a non-integer value, corresponding intermediate values are selected for the samples in the selected segment.
- the segment corresponds in length to the current time frame and its position in the adaptive codebook is determined by the speech fundamental frequency parameter.
- This formation of intermediate values takes place, for example, by interpolation.
- an interpolation can take place with a (sin x) / x function.
- the improvement is achieved in that already generated intermediate values in the codebook - in particular on the transmitter and receiver side - maintained and used to generate the excitation signal.
- a non-integer speech frequency parameter has been provided which, while defining the position of the segment in the adaptive codebook, has not reduced the distance between the intermediate values used to generate the excitation signal.
- the speech fundamental frequency parameter determines the beginning of the selected segment and refers to the value 5 1/3
- the corresponding intermediate values 5 1/3, 6 1/3, 7 1/3 etc are formed and only these for generation of the excitation signal and maintained in the adaptive codebook.
- the values 5 1/3, 5 2/3, 6, 6 1/3, 6 2/3 etc would be used, which can be done without additional transmission of information.
- a quality improvement is generated.
- the excitation signal can also be generated in particular by means of a fixed codebook.
- fixed excitation signals are present in a fixed codebook.
- a shift of a fixed codebook entry can take place while maintaining the time intervals between the signal components. For example, if a fixed codebook entry of length 4 has a signal component at times 1 and 3, and no or zero value of the signal component at times 0, 2, and 4, then a shift to times 1/3 to 4 would be 1/3 respectively.
- a white, ie substantially frequency-independent, noise signal can be used to generate the excitation signal.
- the fixed codebook can be saved. It has been found that, in particular with speech signals, a very satisfactory quality of the signal generated on the receiver side can be ensured.
- the noise signal is picked up from the environment or generated by means of a noise generator.
- filtering of the excitation signal formed may be provided, in particular before it is used as an input signal to the synthesis filter is used.
- a Wiener FIR (finite impulse response) filtering can be performed here.
- the proposed methods may take place in a communication terminal with an encoding unit, such as a mobile phone, a PDA (personal digital assistant), a computer or a landline telephone, etc.
- an encoding unit such as a mobile phone, a PDA (personal digital assistant), a computer or a landline telephone, etc.
- a corresponding receiver for example transition elements between different communication systems, a TRAU (transmission and rate adaptation unit) has a corresponding decoding unit.
- TRAU transmission and rate adaptation unit
- a suitable communication system has at least one communication terminal and one receiver.
- an excitation signal exc for excitation of a synthesis filter A (z) is shown.
- the synthesis filter A (z) simulates in the case of speech signals in the human vocal tract, so that in this case by means of a suitable excitation signal exc a synthetic acoustic signal AS_syn is generated. This is compared by means of a comparator C with the actual acoustic signal as. Successively, the excitation signal exc is adjusted so that the synthetic acoustic signal AS_syn resembles the actual acoustic signal AS as well as possible.
- an adaptive codebook ACB is provided, with which harmonic components of the acoustic signal are displayed.
- the adaptive codebook includes earlier excitation signals old_exc, i. those from previous time frames or time periods.
- the selection of an entry from the adaptive codebook ACB takes place via a non-integer speech basic frequency parameter p, which is represented by its integer part N * (int p), where N represents an integer, and the fraction p_frac.
- FIGS. 2A to 2C In this case, samples of the excitation signal exc for different sampling rates are shown. Depending on the sampling rate results in a 4 kHz bandwidth (case A), an 8 kHz bandwidth (case B) or a 12 kHz bandwidth (case C). The individual samples are shown as dots, the different sampling rates are made clear by different time intervals between the samples on the time axis.
- a fixed codebook SCB is also provided, which is often referred to as an innovative codebook.
- a reference idx_s to the fixed codebook SCB, a specific entry is selected from the fixed codebook SCB. This is amplified by a suitable amplification factor g_s. The resulting signal forms the fixed excitation signal exc_s.
- values are optionally set in the fixed codebook between the existing values.
- the number of values interspersed depends on the desired bandwidth extension. This intermediate is to be clarified by the entry int N.
- FIGS. 3A to 3D the history recorded in the adaptive codebook ACB (history ACB) is shown as well as a current time frame (actual frame).
- the respective current frame is shown on the right hand side of the dashed line, whereby the continuous time on a time axis (t) is to be expressed to the right.
- the frame is shown above the samples and intermediate values present in the adaptive codebook.
- a sample is the value sampled at an original first sampling frequency.
- Intermediate values are the initially artificially interposed values which first assume the value 0 and then values ⁇ 0 as a function of the respective new time frames of the signal.
- the intermediate values are intermediate values.
- the adaptive codebook ACB is empty, ie there are only zero values at those times which correspond to a desired sampling rate. At the same time zeros are already inserted as intermediate values, so that in 3A in the adaptive codebook zero values are present at the times which already correspond to a higher sampling rate.
- the first frame is present only at a first sampling rate, for example 4 kHz, such as the non-zero values of the current frame in 3A and if, however, a subsequent encoding is to take place for a threefold sampling rate, for example 12 kHz, a corresponding number of zero values are set between the available sampling values. This is also in 3A shown for the current frame.
- a first sampling rate for example 4 kHz
- a subsequent encoding is to take place for a threefold sampling rate, for example 12 kHz
- a corresponding number of zero values are set between the available sampling values. This is also in 3A shown for the current frame.
- the first frame is already included in the adaptive codebook.
- a suitable segment is selected from the adaptive codebook.
- M1 M0 * M3 when M0 represents the number of values present at the first sampling rate, eg at 4 kHz.
- M1 M0 * M3 when M0 represents the number of values present at the first sampling rate, eg at 4 kHz.
- the lower first sampling rate (of for example 4 kHz) against that between the original ones Samples intermediate intermediate values for non-integer basic speech frequency parameters p.
- the second frame is represented, for example, by the elliptically rounded segment from the adaptive codebook ACB.
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
- Die Erfindung betrifft ein Verfahren zum Codieren eines mit einer Abtastrate abgetasteten analogen Sprachsignals, mittels einer Analyse durch Syntheseverfahren.
- Derzeit wird eine Erweiterung der Bandbreite bei akustischen Signalen, z.B. eine Erweiterung von 4 kHz Telefoniebandbreite auf 8 kHz Breitbandtelefonie, vielfach diskutiert, da damit eine deutliche Verbesserung der Qualität des Sprachsignals einhergeht.
- Allerdings ist, insbesondere bei mobiler Kommunikation, bei der zumindest ein Teil der Übertragung über eine Funkstrecke erfolgt, die Bandbreite eine begrenzte Ressource. D.h., dass die vorgegebene, begrenzte Bandbreite auf eine Vielzahl von Benutzern verteilt werden muss. Wird nun für einen Benutzer die Bandbreite erhöht, so muss, bei einer gleich bleibenden Anzahl von Benutzern, zwangsläufig eine Reduktion der für die übrigen Benutzer zur Verfügung stehenden Bandbreite erfolgen.
- Es werden daher verschiedene Verfahren angewandt, um aus dem Anregungssignal im Schmalband, d.h. z.B. mit einer 4 kHz Bandbreite im Bereich von 0 bis 4 kHz, ein Signal höherer Bandbreite, beispielsweise 8 kHz Bandbreite von 0 bis 8kHz, zu konstruieren.
- Dies erfolgt beispielsweise durch ein Quadrieren des schmalbandigen Signals im Zeitbereich und ein Erzeugen des fehlenden Bandes durch Spiegeln oder Verschieben des Schmalbandes im Frequenzbereich. Für das Beispiel der 4 kHz Bandbreite und einer gewünschten Bandbreite von 8 kHz bedeutet dies, dass das Spektrum von 0 bis 4 kHz an beispielsweise 4 kHz bespiegelt wird und so das Spektrum von 4 bis 8 kHz erzeugt wird. Alternativ ist ein Verschieben um 4 kHz möglich. Mittels dieser Verfahren lässt sich nun aus einem Schmalbandsignal ein Breitbandsignal konstruieren, allerdings ergibt sich als Nachteil, dass diese Verfahren entweder das Spektrum des schmalbandigen Anregungssignals verzerren oder auch Datenfehler im Spektrum verursachen.
-
US 6 173 257 B1 offenbart ein adaptives codebuch (adaptive codebuch) zur Sprachcodierung mittels CELP(code-excited linear prediction) unter Verwendung eines Multirate CODEC. - Ausgehend von diesem Stand der Technik ergibt sich als Aufgabe der vorliegenden Erfindung, eine Möglichkeit zu schaffen, ein qualitativ im Vergleich zum Stand der Technik hochwertiges Signal bei gleichzeitig geringer erforderlicher Übertragungsbandbreite zu kreieren.
- Diese Aufgabe wird durch die unabhängigen Ansprüche gelöst. Vorteilhafte Weiterbildungen sind Gegenstand der abhängigen Ansprüche.
- Ein analoges Signal wird zur Codierung in Zeitrahmen zerlegt und ein synthetisch hergestelltes Signal wird zeitrahmenweise an das analoge Signal angeglichen. Das synthetische Signal wird als Ausgangssignal eines Synthesefilters generiert, welcher durch ein Anregungssignal als Eingangssignal angeregt wird.
- Zur Bildung des Anregungssignals wird zumindest ein adaptives Codebuch verwendet, in dem das Anregungssignal für frühere Zeitrahmen vorliegt. Das frühere Anregungssignal wird hierbei als eine Vielzahl von Abtastwerten dargestellt.
- Zur Darstellung des aktuellen Anregungssignals wird ein der Länge des aktuellen Zeitrahmens entsprechendes Segment aus der Vielzahl der im adaptiven Codebuch vorliegenden Abtastwerte ausgewählt. Die Auswahl wird mittels eines von einer Sprachgrundfrequenz abhängigen Referenzparameters vorgenommen, welcher auch nichtganzzahlige Werte annehmen kann, d.h. auf zwischen den tatsächlich vorliegenden Abtastwerten liegende Plätze für Zwischenwerte verweist.
- Falls nun der Sprachgrundfrequenzparameter einen nichtganzzahligen Wert annimmt, werden entsprechende Zwischenwerte zu den Abtastwerten in dem ausgewählten Segment gewählt. Wie bereits dargelegt entspricht das Segment in seiner Länge dem aktuellen Zeitrahmen und seine Lage im adaptiven Codebuch wird durch den Sprachgrundfrequenzparameter festgelegt.
- Diese Bildung von Zwischenwerten erfolgt beispielsweise durch Interpolation. Eine Interpolation kann insbesondere mit einer (sin x)/x Funktion erfolgen.
- Kern der Erfindung ist es nun, dass die Gesamtheit von Abtastwerten und Interpolationswerten zum Bilden des Anregungssignals verwendet wird.
- Dies hat den Vorteil, dass eine effektive höhere Bandbreite erzielt wird, welche sich aus der effektiv höheren Abtastrate für die Abtastwerte und Zwischenwerte ergibt. Dadurch lässt sich die Qualität eines auf Empfängerseite reproduzierten, synthetischen Signals, welches dem tatsächlichen analogen Signal möglichst gut entspricht, deutlich verbessert wird. Diese Verbesserung geschieht ohne eine Erhöhung des Bedarfs an Übertragungsbandbreite, da diesselben Codierparameter wie bei einer Schmalbandlösung übertragen werden.
- Die Verbesserung wird dadurch erzielt, dass bereits erzeugte Zwischenwerte im Codebuch - insbesondere auf Sender und Empfängerseite - beibehalten und zur Erzeugung des Anregungssignals verwendet werden.
Dies steht im Gegensatz zu bisherigen Lösungen, bei denen zwar ein nicht-ganzzahliger Sprachgrundfrequenzparameter vorgesehen war, der zwar die Lage des Segments im adaptiven Codebuch festlegte, jedoch wurde der Abstand zwischen den für die Erzeugung des Anregungssignals verwendeten Zwischenwerten nicht verringert.
Mit anderen Worten, wenn beispielsweise der Sprachgrundfrequenzparameter den Beginn des ausgewählten Segments festlegt und auf den Wert 5 1/3 verweist, so werden die entsprechenden Zwischenwerte 5 1/3, 6 1/3, 7 1/3 etc gebildet und nur diese zur Erzeugung des Anregungssignals benutzt und im adaptiven Codebuch beibehalten. Gemäß der Erfindung aber würden die Werte 5 1/3, 5 2/3, 6, 6 1/3, 6 2/3 etc,verwendet, was ohne zusätzliche Übertragung von Information vorgenommen werden kann. Somit wird bei einer effizienten Ausnutzung der Übertragungskapazität eine Qualitätsverbesserung erzeugt. - Insbesondere lässt sich der Sprachgrundfrequenzparameter als Bruchteil einer ganzen Zahl N darstellen. Dann ergibt sich eine Reduktion des zeitlichen Abstandes um 1/N. Wird beispielsweise N=2 oder 3 gewählt, was einer Verdopplung bzw. Verdreifachung der Bandbreite des zu darstellenden Anregungssignals entspricht, reduziert sich der Abstand zwischen einem Abtastwert und einem Zwischenwert auf 1/2 bzw. 1/3. Ebenso ist im Fall N größer oder gleich 3 der Abstand zwischen zwei Zwischenwerten auf denselben Wert reduziert.
- Weiterhin lässt sich das Anregungssignal auch insbesondere mittels eines fixen Codebuches erzeugen. Beispielsweise liegen in einem fixen Codebuch feste Anregungssignale vor.
- Gemäß einer vorteilhaften Ausgestaltung ist es vorgesehen, das fixe Codebuch in seiner ursprünglich vorgegebenen Bandbreite bzw. den ursprünglichen Abtastwerten beizubehalten und eine höhere Bandbreite nur mit dem adaptiven Codebuch zu erzielen. Dies hat den Vorteil einer besonders einfachen Umsetzung.
- Um auch beim fixen Codebuch zwischen den ursprünglich vorliegenden festen Anregungssignalen Zwischenwerte zu schaffen kann eine Verschiebung eines fixen Codebucheintrags unter Beibehaltung der Zeitabstände zwischen den Signalkomponenten erfolgen. Weist beispielsweise ein fixer Codebucheintrag der Länge 4 eine Signalkomponente bei den Zeitpunkten 1 und 3 auf, und keine bzw. einen Nullwert der Signalkomponente bei den Zeitpunkten 0, 2 und 4, dann würde eine Verschiebung auf die Zeitpunkte 1/3 bis 4 1/3 erfolgen.
- Alternativ kann es vorgesehen sein auch beim fixen Codebuch Zwischenwerte durch Interpolation zu bestimmen.
- Zusätzlich oder alternativ zum fixen Codebuch kann ein weißes, d.h. im wesentlichen frequenzunabhängiges Rauschsignal zum Erzeugen des Anregungssignals herangezogen werden. Damit kann beipielsweise das fixe Codebuch eingespart werden. Es hat sich gezeigt, dass damit insbesondere bei Sprachsignalen eine sehr zufriedenstellende Qualität des auf Empfängerseite erzeugten Signals gewährleistet werden kann.
- Das Rauschsignal wird aus der Umgebung aufgenommen oder mittels eines Rauschgenerators erzeugt.
- Um beispielsweise ein Überbetonen der harmonischen Struktur in dem so erweiterten Frequenzbereich, also beispielsweise dem Frequenzbereich zwischen 4 und 8 kHz im Falle eines Schmalbandsignals mit 4 kHz Bandbreite zu vermeiden, kann ein Filtern des gebildeten Anregungssignals vorgesehen sein, insbesondere bevor es als Eingangssignal für den Synthesefilter verwendet wird. Es kann hierbei beispielsweise eine Wiener FIR (finite impulse response) Filterung vorgenommen werden.
- Die vorgeschlagenen Verfahren können in einem Kommunikationsendgerät mit einer Codiereinheit, wie beispielsweise einem Mobiltelefon, einem PDA (personal digital assistant), einem Computer oder einem Festnetztelefon etc. stattfinden.
- Ein entsprechender Empfänger, beispielsweise Übergangselemente zwischen verschiedenen Kommunikationssystemen, eine TRAU (transmission and rate adaption unit) weist eine entsprechende Decodierungseinheit auf.
- Ein geeignetes Kommunikationssystem weist zumindest ein Kommunikationsendgerät und einen Empfänger auf.
- Weitere Vorteile werden anhand beispielhafter Ausgestaltungen dargelegt, welche teilweise auch in den Figuren gezeigt sind. Von diesen zeigen:
- FIG 1A:
- Die Darstellung der Generierung eines synthetisierten Signals;
- FIG 1B:
- Die Darstellung der Generierung eines Anregungssignals für eine Breitbandlösung;
- FIG 2A, 2B, 2C:
- Darstellungen eines Codebucheintrags aus dem adaptiven Codebuch für unterschiedliche Bandbreiten;
- FIG 3A, 3B, 3C, 3D :
- Eine beispielhafte Bandbreitenerweiterung im adaptiven Codebuch.
- In
FIG 1A ist die Verwendung eines Anregungssignals exc zur Anregung eines Synthesefilters A(z) dargestellt. Der Synthesefilter A(z) simuliert im Falle von Sprachsignalen im menschlichen Vokaltrakt, so dass in diesem Falle mittels eines geeigneten Anregungssignals exc ein synthetischen akustisches Signal AS_syn generiert wird. Dieses wird mittels eines Komperators C mit dem tatsächlichen akustischen Signal as verglichen. Sukzessive wird das Anregungssignal exc so angeglichen, dass das synthetische akustische Signal AS_syn dem tatsächlichen akustischen Signal AS möglichst gut ähnelt. - In
FIG 1B ist dann die Generierung des Anregungssignals exc dargestellt. Dazu werden mehrere Parameter verwendet, welche letztlich zur effektiven Bandbreitennutzung übertragen werden, da die Übertragung dieser Parameter weniger Übertragungskapazität erfordert, als die Übertragung des Anregungssignals exc selbst: - In
FIG 1B ist die Generierung eines Anregungssignals exc im Falle einer Breitbandlösung dargestellt.
Unter Breitbandlösung wird in diesem Fall verstanden, dass die Bandbreite des auf Empfängerseite rekonstruierten Signals größer ist, als usprünglich - z.B. durch die Ausgestaltung von Codebüchern vorgesehen. Im Falle einer Erweiterung des G.729 wird von einem Signal mit 4 kHz Bandbreite als Schmalbandsignal gesprochen, von einem auf 8 kHz Bandbreite erweiterten Signal als Breitbandsginal. - Zur Generierung des Anregungssignals ist ein adaptives Codebuch ACB vorgesehen, mit dem harmonische Anteile des akustischen Signals dargestellt werden. Dazu beinhaltet das adaptive Codebuch frühere Anregungssignale old_exc, d.h. solche aus vorhergegangenen Zeitrahmen bzw. Zeitabschnitten. Die Auswahl eines Eintrags aus dem adaptiven Codebuch ACB erfolgt über einen nicht ganzzahligen Sprachgrundfrequenzparameter p, welcher durch seinen ganzzahligen Anteil N*(int p), wobei N eine Integerzahl darstellt, und den Bruchteil p_frac dargestellt wird.
- Beispielsweise wird der Sprachgrundfrequenzparameter in
FIG 2A auf Basis der Bandbreite ermittelt. Um beispielsweise zum 3. Abtastwert zu kommen wird p=3 gewählt. Um zu diesem Abtastwert zu gelangen, wenn ein N-tel geringerer Abstand zwischen Abtastwerten oder Zwischenwerten und Zwischenwerten vorliegt, d.h. das adaptive Codebuch ACB eine N-fach höhere Bandbreite aufweist, ist ein Wert von N*p + p_frac erforderlich. - In
FIG 2A bis 2C sind hierbei Abtastwerte des Anregungssignals exc für unterschiedliche Abtastraten dargestellt. Je nach Abtastrate ergibt sich eine 4 kHz Bandbreite (Fall A), eine 8 kHz Bandbreite (Fall B) oder eine 12 kHz Bandbreite (Fall C). Die einzelnen Abtastwerte sind als Punkte dargestellt, die verschiedenen Abtastraten werden durch unterschiedliche zeitliche Abstände zwischen den Abtastwerten auf der Zeitachse deutlich. - Im Folgenden wird wieder auf
FIG 1B verwiesen. Zur Generierung des Anregungssignales exc ist auch ein fixes Codebuch SCB vorgesehen, welches oft auch als innovatives Codebuch bezeichnet wird. Mittels einer Referenz idx_s auf das fixe Codebuch SCB wird ein bestimmter Eintrag aus dem fixen Codebuch SCB ausgewählt. Dieser wird durch einen geeigneten Verstärkungsfaktor g_s verstärkt. Das daraus hervorgegangene Signal bildet das fixe Anregungssignal exc_s. - Um ein bandbreitenerweitertes fixes Anregungssignal exc_s zu erhalten, werden optional im fixen Codebuch Werte zwischen die vorhandenen Werte gesetzt. Die Anzahl der dazwischengesetzten Werte hängt von der gewünschten Bandbreitenerweiterung ab. Dieses Dazwischensetzen soll durch den Eintrag int N verdeutlicht werden.
- In
FIG 3A bis FIG 3D ist die im adaptiven Codebuch ACB jeweils erfasste Historie (history ACB) dargestellt, sowie ein aktueller Zeitrahmen (actual frame). Der jeweilige aktuelle Rahmen ist einerseits rechts von der gestrichelten Linie dargestellt, wodurch die fortlaufende Zeit auf einer Zeitachse (t) nach rechts ausgedrückt werden soll. Zur besseren Sichtbarkeit ist der Rahmen andererseits oberhalb der im adaptiven Codebuch vorliegenden Abtastwerte und Zwischenwerte dargestellt. - Als Abtastwert werden die in einer ursprünglichen ersten Abtastfrequenz abgetasteten Werte bezeichnet. Als Zwischenwerte werden die zunächst künstlich dazwischengesetzten Werte bezeichnet, welche zunächst den Wert 0 und dann in Abhängigkeit von den jeweiligen neuen Zeitrahmen des Signals Werte ≠ 0 annehmen. In
FIG 3A sind Positionen an denen Abtastwerte in der ursprünglichen geringeren Bandbreite vorgesehen sind mit Kreisen umrundet, die dazwischen liegenden Werte sind Zwischenwerte. - Für den ersten Rahmen (Frame 1) ist das adaptive Codebuch ACB leer, d.h. es liegen lediglich Nullwerte an den Zeitpunkten vor, welche einer gewünschten Abtastrate entsprechen. Gleichzeitig sind bereits Nullen als Zwischenwerte eingefügt, so dass in
FIG 3A im adaptiven Codebuch Null-Werte an den Zeitpunkten vorliegen, welche bereits einer höheren Abtastrate entsprechen. - Liegt der erste Rahmen beispielsweise nur in einer ersten Abtastrate, beispielsweise 4 kHz vor, wie etwa durch die von Null verschiedenen Werte des aktuellen Rahmens in
FIG 3A und soll aber eine nachfolgende Codierung für eine dreifache Abtastrate, beispielsweise 12 kHz erfolgen, so werden entsprechend viele Nullwerte zwischen die vorhandenen Abtastwerte gesetzt. Dies ist auch inFIG 3A für den aktuellen Rahmen dargestellt. - Erfolgt beispielsweise eine Erweiterung auf die dreifache Abtastrate, was dann einer dreifachen Bandbreite des damit erzielbaren Signals entspricht, so werden 3 minus 1 Zwischenwerte zwischen vorhandene Abtastwerte gesetzt. Für den zweiten Rahmen (Frame 2) ist der erste Rahmen bereits im adaptiven Codebuch enthalten. Mittels eines Indexes, mit dem jeder der Abtastpunkte und Zwischenwerte ausgewählt werden kann, wird ein geeignetes Segment aus dem adaptiven Codebuch ausgewählt. Im adaptiven Codebuch ACB sind eine Anzahl von M1 Werten enthalten, wobei M1=M0 * M3 wenn M0 die Anzahl der bei der ersten Abtastrate, also z.B. bei 4 kHz, vorhandenen Werte darstellt. In Bezug auf die niedrigere erste Abtastrate (von beispielsweise 4 kHz) gegen die zwischen den ursprünglichen Abtastwerten liegenden Zwischenwerten bei nicht ganzzahligen Sprachgrundfrequenzparametern p.
- Der zweite Rahmen wird beispielsweise durch das elliptisch eingerundete Segment aus dem adaptiven Codebuch ACB dargestellt.
- Für den dritten Zeitrahmen (
FIG 3D ), der durch das elliptisch umrundete Segment aus dem adaptiven Codebuch ACB dargestellt wird, sind bereits Zwischenwerte ≠ 0 im adaptiven Codebuch ACB vorhanden. In der gezeigten Weise baut sich sukzessive ein adaptives Codebuch auf.
Claims (10)
- Verfahren zum Codieren eines mit einer Abtastrate abgetasteten analogen Sprachsignals (AS), welches in Zeitrahmen zerlegt wird und an welches ein synthetisches Signal (AS_syn) angeglichen wird,a. wobei das synthetische Signal (AS_syn) zeitrahmenweise mittels eines Synthesefilters (A(z)), welcher durch ein Anregungssignal (exc) angeregt wird, gebildet wird, undb. das Anregungssignal (exc_p, exc) unter Verwendung zumindest eines adaptiven Codebuchs (ACB) gebildet wird, in dem ein früheres Anregungssignal (old_exc) als eine Mehrzahl von Abtastwerten, welche einen bestimmten Abtastabstand aufweisen, vorliegt, wobei das adaptive Codebuch (ACB) eine N-fach höhere Bandbreite als die Abtastrate aufweist, wodurch ein N-tel geringerer Abstand durch Bildung von Zwischenwerten zwischen den Abtastwerten gebildet wird, wobei N eine Integerzahl größer oder gleich 2 ist, undc. für das aktuelle Anregungssignal (exc_p, exc) ein der Länge des Zeitrahmens entsprechendes Segment aus der Mehrzahl von Abtastwerten mittels eines Sprachgrundfrequenzparameters (p) ausgewählt wird, welcher auch nicht ganzzahlige Werte annimmt undd. im Falle, dass der Sprachgrundfrequenzparameter (p) einen nicht ganzzahligen Wert annimmt, durch den Sprachgrundfrequenzparameter (p) definierte zu interpolierende Zwischenwerte zu den Abtastwerten gebildet werden, so dass sich eine Verringerung des zeitlichen Abstandes zwischen den Zwischenwerten und den Abtastwerten ergibt,e. und diese Gesamtheit von Zwischenwerten und Abtastwerten zum Bilden des Anregungssignals (exc_p, exc) verwendet wird, wodurch eine effektiv höhere Bandbreite erzielt wird, wodurch die Qualität eines auf einer Empfängerseite reproduzierten synthetischen Signals verbessert wird.
- Verfahren nach Anspruch 1, bei dem der Sprachgrundfrequenzparameter (p) als Bruchteil einer ganzen Zahl N darstellbar ist und der zeitliche Abstand zwischen Abtastwerten und Zwischenwerten ebenfalls um die Zahl N reduziert ist.
- Verfahren gemäß einem der vorhergehenden Ansprüche, wobei weiterhin zur Bildung des Anregungssignals (exc) ein fixes Codebuch (SCB) verwendet wird.
- Verfahren gemäß Anspruch 3, bei dem Zwischenwerte bei einem Eintrag des fixen Codebuches (SCB) durch ein zeitliches Verschieben des fixen Codebucheintrags erfolgen.
- Verfahren gemäß Anspruch 3, bei dem Zwischenwerte durch eine Interpolation von Signalkomponenten eines Eintrags des fixen Codebuchs erfolgen.
- Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem zur Bildung des Anregungssignals (exc) weiterhin ein weißes Rauschsignal verwendet wird.
- Verfahren gemäß Anspruch 6, bei dem das weiße Rauschsignal aus der Umgebung erfasst wird oder mittels eines Rauschgenerators generiert wird.
- Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem das Bilden der Zwischenwerte durch Interpolation der bereits vorliegenden Abtastwerte erfolgt.
- Verfahren gemäß einem der vorhergehenden Ansprüche, bei dem das Anregungssignal (exc_p, exc) mittels eines Wiener FIR Filters gefiltert wird.
- Kommunikationsendgerät mit einer Sendeeinheit zum Übertragen von Codierparametern und einer Recheneinheit, welche Mittel aufweist, die zur Durchführung aller Schritte eines Verfahrens gemäß einem der Ansprüche 1 bis 8 eingerichtet sind.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102005000828A DE102005000828A1 (de) | 2005-01-05 | 2005-01-05 | Verfahren zum Codieren eines analogen Signals |
PCT/EP2005/056479 WO2006072519A1 (de) | 2005-01-05 | 2005-12-05 | Verfahren zum codieren eines analogen signals |
Publications (2)
Publication Number | Publication Date |
---|---|
EP1834322A1 EP1834322A1 (de) | 2007-09-19 |
EP1834322B1 true EP1834322B1 (de) | 2015-02-18 |
Family
ID=35697206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP05815885.8A Active EP1834322B1 (de) | 2005-01-05 | 2005-12-05 | Verfahren zum codieren eines analogen signals |
Country Status (5)
Country | Link |
---|---|
US (1) | US7957978B2 (de) |
EP (1) | EP1834322B1 (de) |
CN (2) | CN101099198B (de) |
DE (1) | DE102005000828A1 (de) |
WO (1) | WO2006072519A1 (de) |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
EP0704836B1 (de) * | 1994-09-30 | 2002-03-27 | Kabushiki Kaisha Toshiba | Vorrichtung zur Vektorquantisierung |
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
US6173257B1 (en) * | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
JP3343082B2 (ja) * | 1998-10-27 | 2002-11-11 | 松下電器産業株式会社 | Celp型音声符号化装置 |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US7039581B1 (en) * | 1999-09-22 | 2006-05-02 | Texas Instruments Incorporated | Hybrid speed coding and system |
US7222070B1 (en) * | 1999-09-22 | 2007-05-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
US7139700B1 (en) * | 1999-09-22 | 2006-11-21 | Texas Instruments Incorporated | Hybrid speech coding and system |
GB0025659D0 (en) * | 2000-10-19 | 2000-12-06 | Radioscape Ltd | Hybrid analogue/digital transmission or communication system |
DE10124420C1 (de) * | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Codierung und zur Übertragung von Sprachsignalen |
-
2005
- 2005-01-05 DE DE102005000828A patent/DE102005000828A1/de not_active Withdrawn
- 2005-12-05 US US11/794,790 patent/US7957978B2/en active Active
- 2005-12-05 EP EP05815885.8A patent/EP1834322B1/de active Active
- 2005-12-05 WO PCT/EP2005/056479 patent/WO2006072519A1/de active Application Filing
- 2005-12-05 CN CN2005800460485A patent/CN101099198B/zh not_active Expired - Fee Related
- 2005-12-05 CN CN201210137786.2A patent/CN102655004B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101099198A (zh) | 2008-01-02 |
US20090276226A1 (en) | 2009-11-05 |
CN102655004A (zh) | 2012-09-05 |
WO2006072519A1 (de) | 2006-07-13 |
CN101099198B (zh) | 2012-06-27 |
CN102655004B (zh) | 2015-06-17 |
EP1834322A1 (de) | 2007-09-19 |
DE102005000828A1 (de) | 2006-07-13 |
US7957978B2 (en) | 2011-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1741039B1 (de) | Informationssignalverarbeitung durch modifikation in der spektral-/modulationsspektralbereichsdarstellung | |
DE69910240T2 (de) | Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals | |
DE60006271T2 (de) | Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung | |
DE19604273C2 (de) | Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit | |
EP1979901B1 (de) | Verfahren und anordnungen zur audiosignalkodierung | |
DE60121405T2 (de) | Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen | |
DE60024123T2 (de) | Lpc-harmonischer sprachkodierer mit überrahmenformat | |
DE69634645T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
DE60303214T2 (de) | Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden | |
DE69731588T2 (de) | Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem | |
DE69121411T2 (de) | Methode und gerät zur codierung von analogen signalen | |
DE69730721T2 (de) | Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form | |
EP2062254B1 (de) | Steganographie in digitalen signal-codierern | |
DE2229149A1 (de) | Verfahren zur Übertragung von Sprache | |
DE3736193C2 (de) | ||
DE69033510T3 (de) | Numerischer sprachcodierer mit verbesserter langzeitvorhersage durch subabtastauflösung | |
DE69820362T2 (de) | Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen | |
WO2006114368A1 (de) | Verfahren und vorrichtung zur geräuschunterdrückung | |
EP1979899A1 (de) | Verfahren und anordnungen zur audiosignalkodierung | |
EP1023777B1 (de) | Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms | |
DE4491015C2 (de) | Verfahren zum Erzeugen eines Spektralrauschbewertungsfilters zur Verwendung in einem Sprachcoder | |
DE69028434T2 (de) | System zur Codierung von Breitbandaudiosignalen | |
DE60016305T2 (de) | Verfahren zum Betrieb eines Sprachkodierers | |
EP1834322B1 (de) | Verfahren zum codieren eines analogen signals | |
DE69127339T2 (de) | Methode und Einrichtung zur Kodierung und Dekodierung eines abgetasteten Analogsignals mit Wiederholungseigenschaften |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20070531 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): DE FR GB IT SE |
|
17Q | First examination report despatched |
Effective date: 20071214 |
|
DAX | Request for extension of the european patent (deleted) | ||
RBV | Designated contracting states (corrected) |
Designated state(s): DE FR GB IT SE |
|
RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: SIEMENS ENTERPRISE COMMUNICATIONS GMBH & CO. KG |
|
RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: UNIFY GMBH & CO. KG |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R079 Ref document number: 502005014685 Country of ref document: DE Free format text: PREVIOUS MAIN CLASS: G10L0019080000 Ipc: G10L0019090000 |
|
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
RIC1 | Information provided on ipc code assigned before grant |
Ipc: G10L 19/09 20130101AFI20140702BHEP |
|
INTG | Intention to grant announced |
Effective date: 20140718 |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): DE FR GB IT SE |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R081 Ref document number: 502005014685 Country of ref document: DE Owner name: UNIFY GMBH & CO. KG, DE Free format text: FORMER OWNER: SIEMENS AKTIENGESELLSCHAFT, 80333 MUENCHEN, DE |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R096 Ref document number: 502005014685 Country of ref document: DE Effective date: 20150402 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: SE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20150218 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R097 Ref document number: 502005014685 Country of ref document: DE |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 11 |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed |
Effective date: 20151119 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: IT Payment date: 20151222 Year of fee payment: 11 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R082 Ref document number: 502005014685 Country of ref document: DE Representative=s name: SCHAAFHAUSEN PATENTANWAELTE PARTNERSCHAFTSGESE, DE Ref country code: DE Ref legal event code: R082 Ref document number: 502005014685 Country of ref document: DE Representative=s name: FRITZSCHE PATENTANWAELTE, DE Ref country code: DE Ref legal event code: R081 Ref document number: 502005014685 Country of ref document: DE Owner name: UNIFY GMBH & CO. KG, DE Free format text: FORMER OWNER: UNIFY GMBH & CO. KG, 81379 MUENCHEN, DE |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 12 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IT Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20161205 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 13 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R082 Ref document number: 502005014685 Country of ref document: DE Representative=s name: SCHAAFHAUSEN PATENTANWAELTE PARTNERSCHAFTSGESE, DE |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: GB Payment date: 20231220 Year of fee payment: 19 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20231219 Year of fee payment: 19 Ref country code: DE Payment date: 20231214 Year of fee payment: 19 |