DE60118631T2 - Verfahren zum ersetzen verfälschter audiodaten - Google Patents

Verfahren zum ersetzen verfälschter audiodaten Download PDF

Info

Publication number
DE60118631T2
DE60118631T2 DE60118631T DE60118631T DE60118631T2 DE 60118631 T2 DE60118631 T2 DE 60118631T2 DE 60118631 T DE60118631 T DE 60118631T DE 60118631 T DE60118631 T DE 60118631T DE 60118631 T2 DE60118631 T2 DE 60118631T2
Authority
DE
Germany
Prior art keywords
data
decoder
signals
output
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60118631T
Other languages
English (en)
Other versions
DE60118631D1 (de
Inventor
Jan Stemerdink
Arjan Meijerink
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of DE60118631D1 publication Critical patent/DE60118631D1/de
Application granted granted Critical
Publication of DE60118631T2 publication Critical patent/DE60118631T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Description

  • Die Erfindung betrifft ein Dekodierverfahren zum Dekodieren von Audiodaten, wobei das Dekodierverfahren folgendes aufweist: den Empfang kodierter Daten, welche zumindest Audiodaten darstellen, die mit einem Kodierverfahren kodierte sind, wobei die Audiodaten Audiosignale darstellen; die Erkennung von beschädigten Daten in den kodierten Daten; den Ersatz von zumindest einem Teil der beschädigten Daten durch Ersatzdaten; das Dekodieren der kodierten Daten mit einem Dekodierverfahren, welches im Wesentlichen die Umkehrung des Kodierverfahrens ist, wodurch die Audiodaten erhalten werden; und die Weiterübermittlung der erzielten Audiodaten. Die Erfindung betrifft ferner ein Dekodiersystem, Vorrichtungen, welche solch ein System aufweisen, und ein Computerprogramm zum Ausführen der Schritte des Verfahrens.
  • In Datenverbindungen wird mit einer gewissen Wahrscheinlichkeit die Übertragung von Daten durch Interferenzen bzw. Störungen beeinträchtigt. Beispielsweise treten bei Bluetooth-Sprachverbindungen mit einer gewissen Wahrscheinlichkeit Störungen von Mikrowellengeräten, anderen Bluetooth-Verbindungen oder kabellosen Übertragungssystemen auf, die in dem Frequenzband von 2400 bis 2500 MHz arbeiten. Interferenzen erscheinen häufig in der Gestalt von kurzen Fehlerpulsen, das heißt kurzen Zeitperioden, in welchen die empfangenen Daten so gut wie keine übertragene Information enthalten und mehr oder weniger willkürlich sind. Wenn die Daten Audiosignale darstellen und wenn die beschädigten Daten direkt in einen Audio-Dekodierer eingegeben werden, ergibt sich ein nerviges Knistergeräusch. Wenn der Informationsverlust erfasst ist, können die fehlenden oder fehlerhaften Sprachdaten durch andere Daten ersetzt werden, die in den Audio-Dekodierer eingegeben werden, um dieses Knistergeräusch zu vermeiden. Aus dem Stand der Technik sind mehrere dieser Verfahren bekannt.
  • Beispielsweise ist aus der Druckschrift J. Bray, C. F. Sturman, "Bluetooth, Connect Without Cables", Prentice Hall PTR 20001, Seiten 98 bis 99, bekannt, fehlerhafte oder verlorengegangene Datenblöcke kodierter Daten, welche Sprachsignale darstellen, mit einem Silence-Code (was aus dem Stand der Technik als Stummschaltung bzw. Muting bekannt ist) oder mit zuvor empfangenen Datenblöcken kodierter Daten zu ersetzen (was aus dem Stand der Technik als Code-Wiederholung bekannt ist).
  • Bei der Stummschaltung bzw. Muting wird dem Audio-Dekodierer ein Silence-Code zugeführt, wenn ein Datenverlust erfasst wurde. Bei dem mit "continuous variable slope delta modulation" bezeichneten Verfahren zur komprimierten digitalen Übertragung analoger Sprachsignale (CVSD-Kodierverfahren) besteht dieser Silence-Code aus einander sich abwechselnden Bits ("101010 ..."). Der Silence-Code sorgt dafür, dass der Dekodierer eine Geräuschlosigkeit erzeugt, das heißt Nullgeräusch-Signalabtastungen bzw. Signalsamples. Das Ausgangssignal des Dekodierers klinkt Schritt für Schritt auf Null ab. Damit werden nervige Knistergeräusche vermieden, die infolge von Diskontinuitäten zwischen dem Silence-Code und den empfangenen kodierten Daten hervorgerufen werden.
  • Bei der Code-Wiederholung werden die fehlerhaften Daten mit früheren, richtig empfangenen Daten ersetzt. Derart wird versucht, bei der Ausgabe des Dekodierers die Charakteristika des Audiosignals beizubehalten, und zwar indem angenommen wird, dass sich das Audiosignal während dieser kurzen Zeit nicht zu stark geändert hat.
  • Des Weiteren ist beispielsweise aus der Druckschrift "C. Perkins, O. Hodson, und V. Hardman, "A survey of packet-loss recovery techniques for streaming audio", IEEE Network Magazine, Sept./Okt. 1998, und aus der Druckschrift D. J. Goodman, G. B. Lockhart, O. J. Wasem, und W. Wong "Waveform substitution techniques for recovering missing speech segments in packet voice communications", IEEE Transactions on Acoustics, Speech and Signal Processing, ASSP-34: 1449–1464, Dezember 1986, bekannt, verlorengegangene oder fehlerhafte Puls-Code-Modulation(PCM)-Datenpakete (PCM = ein Verfahren zur Digitalisierung und Mehrkanalübertragung analoger Quellsignale), das heißt nicht-kodierte Daten, mit sich wiederholenden PCM-Samples von einer früheren Pitchperiode so oft wie nötig zu wiederholen, um einen verlorengegangenen Datenblock aufzufüllen.
  • Allerdings sind die bekannten Verfahren aus verschiedenen Gründen nachteilig.
  • Erstens, obwohl im Vergleich zu der Verwendung der fehlerhaften Daten, was zu Knistergeräuschen führt, das Ersetzen der fehlenden oder fehlerhaften Sprach-Daten zu einer höheren Klangqualität führt, hört sich das sich ergebende, ausgegebene Sprachsignal grob bzw. schlecht an. Bei der Stummschaltung wird zwar das störende Knistergeräusch entfernt, allerdings klingt infolge der eingeführten Ruhe-Perioden das ausgegebene Audiosignal schlecht. Diese Ruhe-Perioden sind insbesondere in Audiosignalen differenzierbar bzw. unterscheidbar, welche Sprache darstellen, und insbesondere in der stimmhaften Sprache (das heißt bei Vokalen, wie "a", "e", "i"). Wenn das Ersetzen von verlorengegangenen oder fehlerhaften Daten durch einen vorangehenden Code verwendet wird, können in dem sich ergebenden, ausgegebenen Audiosignal Phasenfehler auftreten. Diese Phasenfehler werden durch die Länge der Ersatzdaten hervorgerufen, weil die Länge der Ersatzdaten im Allgemeinen nicht der Pitchperiode des Audiosignals entspricht, welches von den Daten dargestellt wird. Der Klang des sich ergebenden Ausgangs-Audiosignals kann sogar schlechter als ein Sprachsignal klingen, bei welchem der Stummschaltungs-Mechanismus angewandt wird.
  • Darüber hinaus führt im Allgemeinen das Wiederholen von Ausgangs-Samples zu Diskontinuitäten an den Grenzen der sich wiederholenden Audio-Teilen. Da diese Diskontinuitäten eindeutig akustisch wahrnehmbar sind, sind zusätzliche Maßnahmen erforderlich, um die Diskontinuitäten aufzulösen. Wenn darüber hinaus die Audiosignale kodiert werden, wird im Allgemeinen am Ende eines Fehlerpulses der Zustand des Dekodier-Registers fehlerhaft sein. Daraus folgt, dass im Allgemeinen nach der Wiederholung von Ausgabesamples ein Ausgabefehler auftreten wird, es sei denn, dass zusätzliche Maßnahmen berücksichtigt werden, um nach einem Fehlerpuls die Dekodier-Register zu aktualisieren.
  • Die Erfindung strebt danach, ein Verfahren mit weniger als die zuvor erwähnten Nachteile anzugeben. Demgemäss weist in Übereinstimmung mit der Erfindung ein Dekodierverfahren, wie es zuvor angedeutet wurde, ferner folgendes auf: das Speichern der empfangenen kodierten Daten in einem Zwischenspeicher als zwischengespeicherte Daten; das Bestimmen einer abgeschätzten Periodizität der Audiosignale, die mit den fehlerhaften Daten dargestellt werden; und wobei der Ersatz der fehlerhaften Daten folgendes aufweist: der Ersatz der fehlerhaften Daten mit zwischengespeicherten Daten bzw. gepufferten Daten, die während eines Zeitintervalls in dem Zwischenspeicher gespeichert werden, welches im Wesentlichen der abgeschätzten Periodizität oder im Wesentlichen einem ganzzahligen Vielfachen der abgeschätzten Periodizität entspricht, bevor die fehlerhaften Daten empfangen werden.
  • Wenn die fehlerhaften Daten mit den Daten von dem Zwischenspeicher ersetzt werden, die während eines Zeitintervalls der abgeschätzten Periodizität oder während eines ganzzahligen Vielfaches hiervon in dem Zwischenspeicher gespeichert wurden, sind die mit den zwischengespeicherten Daten dargestellten Audiosignale im Wesentlichen von der gleichen Periode und Phase wie die mit den kodierten Daten dargestellten Audiosignale, welche ersetzt werden, wodurch Phasenfehler zwischen den fehlerhaften Daten und den Ersatzdaten reduziert werden. Darüber hinaus wird ein gleichmäßigerer Übergang zwischen den kodierten Daten und den Ersatzdaten und von daher ein gleichmäßigeres Knistern erzielt. Ebenso dient die Dekodierung als ein Leck-Integrator (bzw. "leaky integration"), das heißt ein vorhandener Dekodierzustand wird von einem früheren Dekodierzustand beeinflusst. Dadurch nehmen die erzielten Audiodaten von dem Eintrag bzw. der Einführung der zwischengespeicherten Daten allmählich ab, so dass der Übergang von den Ersatzdaten zu den ursprünglichen Daten bzw. Originaldaten grundsätzlich kontinuierlich ist, und zwar ohne dass zusätzliche Maßnahmen erforderlich sind.
  • Ebenso wird gemäß der Erfindung ein Daten-Dekodiersystem bereitgestellt, welches Folgendes aufweist: einen Systemeingang zum Empfang kodierter Daten; eine Schaltervorrichtung mit: einem ersten an dem Systemeingang angeschlossenen Schaltereingang; einem zweiten, an eine Zwischenspeicher-Vorrichtung bzw. Puffervorrichtung angeschlossenen Schaltereingang; und mit einem Schalterausgang, wobei die Schaltervorrichtung einen ersten Zustand, in welchem der erste Schaltereingang in kommunikativer Verbindung mit dem Schalterausgang steht, und einen zweiten Zustand aufweist, in welchem der zweite Schaltereingang in kommunikativer Verbindung mit dem Schalterausgang steht; einem an den Systemeingang angeschlossenen Bitfehler-Detektor zum Erfassen von fehlerhaften Daten in den kodierten Daten, wobei die Bitfehler-Detektorvorrichtung die Schaltervorrichtung in den zweiten Zustand schaltet, wenn fehlerhafte Daten erfasst werden, und wobei die Bitfehler-Detektorvorrichtung die Schaltervorrichtung in den ersten Zustand schaltet, wenn keine fehlerhaften Daten erfasst werden; einer Zwischenspeicher-Vorrichtung bzw. Puffervorrichtung mit einem an dem Systemeingang angeschlossenen Zwischenspeichereingang bzw. Puffereingang zum Zwischenspeichern kodierter Daten als zwischengespeicherter Daten und einem Zwischenspeicherausgang bzw. Pufferausgang zum Ausgeben der zwischengespeicherten Daten, welche hinsichtlich des Zeitpunktes des Empfangs der Daten eine Zeitverzögerung ausweisen; einer an den Schalterausgang angeschlossenen Detektorvorrichtung zum Dekodieren zumindest der kodierten Daten, wodurch ursprüngliche Daten bzw. Originaldaten erzielt werden, und wobei die Detektorvorrichtung einen Detektoreingang und einen Detektorausgang aufweist; einer an den Detektorausgang angeschlossenen Periodizitäts-Messvorrichtung bzw. Pitch-Messvorrichtung zum Bestimmen einer abgeschätzten Periodizität der durch die fehlerhaften Daten dargestellten Originaldaten; wobei die Pitch-Abschätzvorrichtung bzw. Periodizitäts-Abschätzvorrichtung die Zeitverzögerung auf im Wesentlichen die geschätzte Periode oder ein ganzzahliges Vielfaches hiervon einstellt; einem Systemausgang, der zur Weiterübermittlung der Originaldaten kommunikativ an den Detektorausgang angeschlossen ist.
  • Solch ein Dekodiersystem ist ausgelegt, ein Verfahren gemäß der vorliegenden Erfindung auszuführen. Darüber hinaus kann solch ein System auch lediglich bei der Empfangsseite einer Datenverbindung implementiert sein, wodurch eine Anpassung von Kommunikationsprotokollen oder eine kostenaufwendige Implementation bei der Übertragungsseite der Datenverbindung vermieden wird.
  • Darüber hinaus werden Vorrichtungen, die solch ein Dekodiersystem aufweisen, und ein Computerprogramm zum Durchführen der Verfahrensschritte eines Verfahrens gemäß der Erfindung bereitgestellt.
  • Besondere Ausführungsformen der Erfindung sind in den abhängigen Ansprüchen angegeben.
  • Weitere Details, Aspekte und Ausführungsformen der Erfindung werden unter Bezugnahme der Figuren in den beigefügten Zeichnungen beschrieben.
  • 1 zeigt ein Blockdiagramm eines Beispiels einer Ausführungsform eines Dekodiersystems gemäß der Erfindung.
  • 2 zeigt ein Blockdiagramm eines Beispiels eines Zwischenspeichers bzw. einer Puffervorrichtung und einer Schaltervorrichtung, welche in dem Beispiel der 1 verwendet werden können.
  • 3 zeigt ein Ablaufdiagramm eines Beispiels eines Verfahrens gemäß der Erfindung.
  • 4 zeigt eine graphische Darstellung eines quasi-periodischen Sprachsignals.
  • 5 zeigt eine graphische Darstellung der Autokorrelationsfunktion des Sprachsignals in 4.
  • 6 zeigt eine graphische Darstellung eines Signals ohne Datenfehler und eines Signals mit Datenfehlern, die mit einem Verfahren gemäß der vorliegenden Erfindung dekodiert sind.
  • 7 zeigt schematisch eine Ausführungsform einer Daten-Speichervorrichtung, in welcher ein Dekodiersystem gemäß der Erfindung implementiert ist.
  • 8 zeigt schematisch eine Ausführungsform einer Daten-Verarbeitungsvorrichtung, in welcher ein Dekodiersystem gemäß der Erfindung implementiert ist.
  • 9 zeigt schematisch eine Ausführungsform einer Audio-Vorrichtung, in welcher ein Dekodiersystem gemäß der Erfindung implementiert ist.
  • 10 zeigt schematisch eine Ausführungsform eines Datennetzwerkes, in welchem ein Dekodiersystem gemäß der Erfindung implementiert ist.
  • Nachfolgend wird die Erfindung rein exemplarisch im Hinblick auf die Anwendung der kodierten Audiosignale oder Audiosignale beschrieben. Allerdings kann die Erfindung auf gleicher Weise an anderen Daten und/oder Signalen angewandt werden, wie etwa beispielsweise an Videodaten.
  • In 1 ist ein Dekodiersystem 1 gezeigt. Das Dekodiersystem 1 weist einen Systemeingang 2 auf, bei welchem kodierte Daten empfangen werden können. Der Systemeingang 2 ist mit einem ersten Schaltereingang 311 einer Schaltervorrichtung 3 verbunden. Die Schaltervorrichtung 3 bildet in einem ersten Zustand des ersten Schaltereingangs 311 eine Verbindung zu dem Schalterausgang 32, und in einem zweiten Zustand der Schaltervorrichtung ist ein zweiter Schaltereingang 312 mit dem Schalterausgang 32 verbunden. Die Schaltervorrichtung 3 selektiert von daher einen der Schaltereingänge als einen Eingang für solche Vorrichtungen, die mit dem Schalterausgang 32 verbunden sind. An dem Schalterausgang 32 ist eine Dekodiervorrichtung 4 mit einem Eingang 41 des Dekodierers und mit einem Ausgang 42 des Dekodierers verbunden. Die Dekodiervorrichtung 4 dekodiert die bei dem Eingang 41 des Dekodierers empfangenen Daten. Nach der Dekodierung der kodierten Daten überträgt die Dekodiervorrichtung 4 die sich ergebenden Daten zu einem Systemausgang 8 der Dekodiervorrichtung 1, wobei der Systemausgang mit dem Ausgang 42 des Dekodierers verbunden ist.
  • Bei diesem Beispiel ist die Dekodiervorrichtung 4 eine CVSD-Dekodiervorrichtung (CVSD = Continuous Variable Slope Delta Modulation; Verfahren zur komprimierten digitalen Übertragung analoger Sprachsignale), welche CVSD-kodierte PCM-Daten (PCM = Pulse Code Modulation; Verfahren zur Digitalisierung und Mehrkanalübertragung analoger Quellsignale) gemäß einem CVSD-Dekodieralgorithmus dekodiert, wie es allgemein aus dem Stand der Technik, beispielsweise aus der Druckschrift K. Shayood "Introduction to data compression", 2. Ausgabe, Morgan Kauf man San Francisco 2000, bekannt ist. In vielen Arten der Datenverbindungen werden CVSD-Dekodierer verwendet, wie beispielsweise in Bluetooth-Datenverbindungen. Allerdings kann die Dekodiervorrichtung ebenso von einer verschiedenen Art sein. Der Dekodierer kann beispielsweise ein Differential-Wellenform-Dekodierer sein. Darüber hinaus kann der Dekodierer von einem Typ sein, der allgemein für Audiosignale oder im Einzelnen für Sprachsignale ausgelegt ist, wie es aus der erwähnten Veröffentlichung von Shayood auf den Seiten 329 bis 334 bekannt ist, wobei diese Veröffentlichung durch Verweis in dieser Anmeldung enthalten ist.
  • An dem Schalterausgang 32 ist ein Puffereingang bzw. Zwischenspeichereingang 61 einer Puffer- bzw. Zwischenspeichervorrichtung 6 angeschlossen. Eine Kopie der empfangenen kodierten Daten wird als zwischengespeicherte Daten in der Zwischenspeichervorrichtung 6 gespeichert. Ein Zwischenspeicherausgang bzw. Pufferausgang 62 ist an dem zweiten Schaltereingang 312 angeschlossen. Wenn sich der Schalter 3 in dem zweiten Zustand befindet, werden dadurch die zwischengespeicherten Daten als Eingangsdaten für jene Vorrichtungen verwendet, die an dem Schalterausgang 32 angeschlossen sind, und von daher werden die zwischengespeicherten Daten als Eingangsdaten des CVSD-Dekodierers 4 verwendet. Der Zustand des Schalters 3 wird mit einem Datenfehler-Detektor 7 gesteuert. Wenn keine Datenfehler erfasst werden, befindet sich der Schalter 3 in dem ersten Zustand, und von daher werden die bei dem Systemeingang 2 empfangenen kodierten Daten dem Dekodierer 4 vorgelegt. Wenn der Fehlerdetektor einen Fehler in den empfangenen kodierten Daten erfasst, schaltet der Detektor 7 den Schalter 3 in den zweiten Zustand, und die zwischengespeicherten Daten werden mit einer bestimmten Verzögerung τ zu dem zweiten Schaltereingang 312 rückgekoppelt. Demgemäss werden die in dem Zwischenspeicher 6 gespeicherten Daten als Eingang für den Dekodierer 4 verwendet.
  • Der Fehlerdetektor kann jedwede Vorrichtung sein, die ausgelegt ist, eine Fehlererfassung durchzuführen. Beispielsweise kann eine Vorrichtung verwendet werden, die in der Lage ist, eine Fehlererfassung durchzuführen, wie sie aus der Druckschrift L. Peterson, B. Davie "Computer networks, a systems approach", Morgan Kaufman San Francisco 2000, Seite 92, bekannt ist, wobei diese Druckschrift ferner hierin durch Verweis enthalten ist. Allerdings können auch andere Verfahren zum Erfassen von Datenfehlern verwendet werden, und die Erfindung ist nicht auf ein bestimmtes Verfahren zur Fehlererfassung oder auf eine bestimmte Fehler-Detektorvorrichtung beschränkt.
  • Der Zwischenspeicher 6 in 1 kann beispielsweise so wie in 2 gezeigt implementiert sein. Der Zwischenspeicher 6 weist eine variable Verzögerung auf und enthält einen N-Bit-Schieberegister 63 und einen N-Kanalselektor 64, wobei N der Anzahl der Schieberegisterbereiche entspricht und gleich der maximalen Zwischenspeicherverzögerung ist. Der Schieberegister 63 ist mit dem Zwischenspeichereingang 61 verbunden und weist N Speicherpositionen auf, wobei vier Speicherpositionen 631 bis 634 dargestellt sind. Indem eine von den Registerpositionen über den Kanalselektor 64 mit dem Zwischenspeicherausgang 62 verbunden wird, wird die Verzögerung τ des Zwischenspeichers 6 auf p·tsample gesetzt, wobei tsample das Zeitintervall zwischen aufeinanderfolgenden Abtastungen bzw. Samples der Eingangsdaten des Zwischenspeichers ist, und wobei p die Position des angeschlossenen Registers ist.
  • Die Verzögerung τ des Zwischenspeichers 6 wird mit einer Periodizitäts- bzw. Pitch-Messvorrichtung 5 festgesetzt, die an den Ausgang 42 des Dekodierers angeschlossen ist. Die Pitch-Messvorrichtung 5 ist mit dem Zwischenspeicher 6 verbunden und legt in Übereinstimmung mit einer abgeschätzten Periodizitäts- bzw. Pitchperiode die Verzögerung des Zwischenspeichers fest. Die Pitchperiode wird hinsichtlich der dekodierten Signale mit der Pitch-Messvorrichtung 5 bei dem Ausgang 42 des Dekodierers gemessen. Die rückgekoppelten zwischengespeicherten Daten sind hinsichtlich der Zeit periodisch, weil die Verzögerung in Übereinstimmung mit der abgeschätzten Pitchperiode der dekodierten Daten festgelegt ist.
  • Der Austausch der fehlerhaft kodierten Daten erfordert keine zusätzlichen Maßnahmen, um nach einem Fehlerpuls den Zustand des Dekodierers (Akkumulations- und Schrittgröße) und die Register des Dezimierungsfilters anzupassen. Der Dezimierungsfilter wird für die Herunter-Konvertierung der Signal-Abtastungsrate verwendet. Beispielsweise tastet bei der Bluetooth-Luftschnittstelle der Dekodierer mit 64000 Abtastungen pro Sekunde ab, wohingegen die Standart-Abtastungsrate für Sprachsignale 8000 Abtastungen pro Sekunde beträgt. Die Herunter-Konvertierung ist eine zweistufige Operation. Zunächst filtert der Dezimierungsfilter sämtliche Signalkomponenten oberhalb einer bestimmten Frequenz heraus, die in dem Fall von Bluetooth 4 kHz beträgt, und in dem zweiten Schritt werden von allen acht aufeinanderfolgenden Abtastungen sieben Abtastungen entfernt. Da darüber hinaus die Dekodiervorrichtung als Leck-Integrator tätig wird, ist die Kontinuität ihrer Ausgangs-Sprachsignale implizit garantiert. Demzufolge sind keine zusätzlichen Maßnahmen erforderlich, um korrekte und ersetzte Datensignalteile zusammenzufügen.
  • Das Dekodiersystem 1 ist in der Lage, ein Verfahren auszuführen, wie es mit dem in 3 dargestellten Ablaufdiagramm dargestellt wird. Im Verfahrensschritt I werden kodierte Daten empfangen. Eine Kopie der kodierten Daten wird im Verfahrensschritt II in dem Zwischenspeicher gespeichert. Gleichzeitig werden im Verfahrensschritt III die kodierten Daten hinsichtlich von Datenfehlern überprüft. Wenn keine Fehler erfasst werden, werden die Daten im Verfahrensschritt VII dekodiert und die dekodierten Daten werden weiter im Verfahrensschritt VIII übertragen. Bei dem Beispiel sind die dekodierten Daten Audiodaten, welche Audiosignale darstellen, und die Audiosignale werden im Verfahrensschritt IX ausgegeben und dann wird die Ausführung vom Verfahrensschritt I wiederholt.
  • Die Audiosignale können beispielsweise Sprachsignale sein, die mit einem Kopfhörer empfangen werden, der über ein Bluetooth-Protokoll mit einem Mobiltelefon kommuniziert. In diesem Fall würde der Verfahrensschritt IX dann die Ausgabe der Sprachsignale mit den Kopfhörern in die Ohren einer Person sein. Wenn im Verfahrensschritt III herausgefunden wird, dass die kodierten Daten fehlerhaft sind, wird im Verfahrensschritt IV der mit früheren dekodierten Daten dargestellte Pitch bzw. die mit früheren dekodierten Daten dargestellte Periodizität der Audiosignale abgeschätzt. Basierend auf dem abgeschätzten Pitch bzw. der abgeschätzten Periodizität wird im Verfahrensschritt V eine Zeitverzögerung des Zwischenspeichers festgelegt. Danach werden im Verfahrensschritt VI die in dem Zwischenspeicher gespeicherten Daten mit der festgelegten Zeitverzögerung eingeführt, und die Verfahrensschritte VII bis IX werden mit den Daten von dem Zwischenspeicher durchgeführt. Das Verfahren wird so lange wie erforderlich wiederholt oder fortgeführt.
  • Bei der in 6 dargestellten graphischen Darstellung ist die Entwicklung hinsichtlich der Zeit eines nicht beschädigten bzw. nicht fehlerhaften Signals dargestellt, welches mit einer dicken durchgezogenen Linie A dargestellt ist. Das gleiche Signal, allerdings beschädigt bzw. fehlerhaft, wie es mit der dünnen durchgezogenen Linie B dargestellt ist, ist ebenso gezeigt. Zwischen dem Zeitpunkt t0 und dem Zeitpunkt t1 wurden fehlerhafte Daten des fehlerhaften Signals mit einem Verfahren gemäß der Erfindung ersetzt. Wie es anhand der 6 zu erkennen ist, sind in dem resultierenden Signal keine Diskontinuitäten gezeigt. Das nicht-beschädigte bzw. nicht-fehlerhafte Signal und das Signal, welches mit dem vorgeschlagenen Verfahren behandelt wurde, sind nahezu identisch. Von daher weist das behandelte Signal nahezu die gleiche Qualität wie das ursprüngliche eigentliche Signal auf, und demgemäss gibt es nur kleine Unterschiede zwischen dem fehlerhaften Signal und dem ursprünglichen eigentlichen Signal. Der Unterschied zwischen dem mit der durchgezogenen Linie A dargestellten Signal und dem mit der gestichelten Linie B dargestellten Signal nach dem Zeitpunkt t1 wird durch die Leck-Integration der Dekodierung bewirkt. Um die Periodizität bzw. Pitchperiode des Sprachsignals beim Empfang eines Datenfehlers abschätzen zu können, wird eine Anzahl W von Sprachabtastungen, die unmittelbar vor dem Zeitpunkt, als der Datenfehler erfasst wurde, übertragen wurden, angenommen und mit der Pitch-Abschätzvorrichtung 5 analysiert. Die Analyse führt zu einer optimalen Pitchperioden-Vorhersage bzw. Periodizitäts-Vorhersage kp_opt, die irgendwo in einem zuvor festgelegten Intervall [kp_min, kp_max] liegen muss. Typische Werte für die Parameter W, kp_min und kp_max sind in der Druckschrift N. S. Jayant, Peter Noll "Digital Coding of Waveforms, (Principles and Applications to Speech and Video)", Prentice-Hall, Englewood Cliffs, New Jersey, 1984, aufgeführt und sind in der Tabelle 1 zusammengefasst.
  • Tabelle 1
    Figure 00140001
  • Aus der Veröffentlichung von "Jayant" ist ein Verfahren zum Messen der Pitchperiode eines diskreten Zeitsignals x[n] bei einem bekannten Zeitmoment m bekannt, wobei die Kurzzeit-Autokorrelationsfunktion (Autokorrelationsfunktion) des Signals x[n] bestimmt wird. Das Verfahren kann mathematisch durch den folgenden Ausdruck beschrieben werden:
  • Figure 00140002
  • In dieser Gleichung stellt Rxx den Wert der Autokorrelation dar, n ist ein Summationsindex, der von 0 bis W – k – 1 reicht, und k ist eine Variable, die verwendet wird, um die Autokorrelationsfunktion zu optimieren. Die Pitchperiode kann aufgefunden werden, indem die Autokorrelationsfunktion hinsichtlich k maximiert wird, wobei k aus dem Bereich [kp_min, kp_max] genommen wird.
  • Dieser Mechanismus ist in den 4 und 5 dargestellt. In 4 ist die Entwicklung während 30 ms eines Sprachsignals in einem Zeitintervall von 1600 ms bis 1630 ms gezeigt. In 5 ist die entsprechende Kurzzeit-Autokorrelationsfunktion für ein Intervall von Parameterwerten k von 0 bis 30 ms dargestellt. Wie es in 5 gesehen werden kann, weist die Autokorrelationsfunktion bei Zeitdifferenzen k1, k2, k3, k4 und k5 lokale Maxima auf. Die Zeitdifferenzen k2 bis k5 sind ganzzahlige Vielfache von k1. Von daher wird die Periode des Signals derart abgeschätzt, dass sie gleich k1 ist. Der Wert von k1 beträgt in etwa 5 ms. Wie es in 4 zu sehen ist, ist eine einzelne Periode des Signals gleich dem Intervall von T0 bis T1 und beträgt in etwa 5 ms. Die Abschätzung der Pitchperiode durch Berechnung des Maximums der Autokorrelationsfunktion führt von daher zu einer richtig abgeschätzten Pitchperiode.
  • Die Kurzzeit-Autokorrelationsfunktion kann ebenso gemäß einem Verfahren berechnet werden, welches mit der nachfolgend angegebenen Gleichung ausgedrückt wird: Rxx(k,m) = α·Rxx(k,m – 1) + x[m]·x[m – k] (2)
  • Das Berechnen der Autokorrelationsfunktion gemäß Gleichung 2 fordert im Vergleich zu der Gleichung 1 eine geringere Verarbeitung, insbesondere wenn α auf 1 – 2b festgelegt ist, wobei b eine Ganzzahl ist. Die Gleichung 2 kann verwendet werden, wenn eine schnelle Abschätzung der Pitchperiode erforderlich ist. Obwohl die Gleichung 2 nicht genau die gleichen Ergebnisse wie die Gleichung 1 liefert, wurde gezeigt, dass die Gleichung 2 Ergebnisse mit einer vergleichbaren Verlässlichkeit liefert.
  • Wenn der Abschätzungsbereich der Pitchperiode gemäß der Tabelle 1 ausgewählt wird, können störende Piepgeräusche in nicht stimmhaften Sprachteilen auftreten. Nicht stimmhafte Sprachteile sind nicht periodisch und weisen im Allgemeinen eine Abnahme der Kurzzeit-Autokorrelationsfunktion auf. Das Maximieren der Autokorrelationsfunktion führt von daher zu einer niedrigeren Pitchperiodenabschätzung, nahe an der unteren Grenze des Pitch-Abschätzungsbereiches. Wenn die untere Grenze nahe an 2 ms gewählt ist, wird ein Codesegment, welches einem nicht stimmhaften Sprachteil von in etwa 2 ms entspricht, so oft wie notwendig wiederholt, um die verlorengegangenen Datenpakete zu ersetzen. Da der sich daraus ergebende Ausgangs-Sprachsignalteil in etwa periodisch hinsichtlich der Zeit mit einer äußerst kurzen Periode ist, kann dies in dem Ausgangs-Sprachsignal einen störenden Ton bewirken. Um die Piepgeräusche in der Ausgabe zu vermeiden, können nicht stimmhafte Sprachsignalteile stumm geschaltet werden, oder es kann die untere Grenze des Pitch-Abschätzbereiches auf beispielsweise 4 ms erhöht werden.
  • Wenn die Stummschaltung verwendet wird, ist ein Mechanismus erforderlich, um zwischen stimmhaften und nicht stimmhaften (Sprach-)Signalen zu unterscheiden. Dieses kann durchgeführt werden, indem Signale als „nicht stimmhaft" gekennzeichnet werden, wenn die Pitchperiodenabschätzung unterhalb eines bestimmten Schwellenwertes liegt (beispielsweise 4 ms). Ebenso können andere Verfahren verwendet werden, beispielsweise die Verwendung von Unterschiede in den Charakteristika zwischen stimmhaften und nicht stimmhaften (Sprach-)Signalen, wie etwa das Fehlen einer Periodizität oder das Signal-Zu-Rausch-Verhältnis.
  • Wenn die untere Grenze der Pitch-Abschätzung erhöht wird, führen stimmhafte Sprachsignalteile mit einer Pitchperiode unterhalb der unteren Grenze des Pitchperioden-Abschätzungsbereiches zu einer Pitchperiodenabschätzung, die in etwa ein Vielfaches der tatsächlichen Pitchperiode ist. Da stimmhafte Sprachsignalteile hinsichtlich der Zeit in etwa periodisch sind, führt dies nicht in einer groben Verschlechterung des ausgegebenen Sprachsignals.
  • Für den Fachmann sollte es ersichtlich sein, dass die Erfindung nicht auf die Implementation in dem offenbarten Beispiel einer physikalischen Vorrichtung beschränkt ist, vielmehr kann die Erfindung auf ähnliche Weise in einer anderen Vorrichtung angewandt werden. Im Einzelnen ist die Erfindung nicht auf physikalische Vorrichtungen beschränkt, sondern kann ebenso in logischen Vorrichtungen von einer abstrakteren Art oder in Software angewandt werden, die ausgelegt ist, die Funktionen der Vorrichtung auszuführen, wenn diese auf einem Allzweck-Computersystem abläuft. Darüber hinaus sollte es ersichtlich sein, dass ein jedwedes hinreichend genaues Pitch-Abschätzverfahren verwendet werden kann, und dass die Erfindung nicht auf die beschriebenen Beispiele der Pitch-Bestimmung beschränkt ist. Verschiedene andere Pitch-Bestimmungsverfahren sind aus dem Stand der Technik bekannt, und die Erfindung ist nicht auf ein spezielles Verfahren hiervon beschränkt.
  • Ein Dekodiersystem gemäß der Erfindung kann in irgendeiner Signalverarbeitungsvorrichtung verwendet werden, die einen Signalempfänger aufweist, der mit einem Dekodiersystem gemäß der Erfindung verbunden ist. Das Dekodiersystem kann an einen Signalverarbeitungsabschnitt angeschlossen sein, der die dekodierten Signale weiterverarbeitet. Die 7 bis 10 zeigen Beispiele von Signalverarbeitungsvorrichtungen, in welchen ein Dekodiersystem, wie es vorgeschlagen wird, verwendet wird. Wie es beispielsweise in 7 gezeigt ist, kann in einer Datenspeichervorrichtung 130 ein Dekodiersystem 1 verwendet werden, beispielsweise ein MPEG 3-Recorder, der über eine Bluetooth-Verbindung mit dem Internet verbunden ist, um Daten in einer Datenspeichervorrichtung 131 zu speichern, beispielsweise in einer Flash-Speicherkarte. Die Datenspeichervorrichtung 130 in 7 weist folgendes auf: eine Halterung 132 für eine Datenspeichervorrichtung 131; eine Schreibeinrichtung 133 zum Schreiben von Daten in die Datenspeichervorrichtung 131; eine Eingangssignal-Empfangseinrichtung 134, beispielsweise einen kabellosen Empfänger; und eine Dekodiervorrichtung 1, die zwischen der Eingangssignal-Empfängereinrichtung 134 und der Schreibeinrichtung 133 angeschlossen ist. Zwischen dem Dekodierer und der Empfangseinrichtung 134 ist eine Vorrichtung 135 zum Verarbeiten der empfangenen Signale angeordnet. Selbstverständlich können nach der Dekodierung der Signale andere Verarbeitungen durchgeführt werden, bevor die Daten in dem Datenspeicher 132 gespeichert werden.
  • Gegebenenfalls ist es weiter möglich, eine Datenverarbeitungsvorrichtung 140 bereitzustellen, die eine Eingangssignal-Empfangseinrichtung 141, wie etwa eine drahtlose Verbindung zu einem Computernetzwerk, und eine Datenverarbeitungseinrichtung 142 mit einer Dekodiervorrichtung 1 gemäß der Erfindung aufweist, wie es in 8 gezeigt ist. Solch eine Datenverarbeitungsvorrichtung 140 kann ein Laptop-Computer sein, der über eine drahtlose Verbindung, wie etwa eine Bluetooth-Datenverbindung, mit einem LAN oder dem Internet verbunden ist.
  • Ebenso ist es möglich, eine Audio-Vorrichtung 150, wie etwa eine Stereoanlage oder ein Multikanal-Abspielgerät bereitzustellen, welche eine Dateneingangseinrichtung 151, wie etwa einen Funk- oder Bluetooth-Empfänger, und eine Audio-Ausgabeeinrichtung 152, wie etwa einen Lautsprecher, mit einer Dekodiervorrichtung 1 gemäß der Erfindung aufweist, wie es in 9 gezeigt ist. Dies ist insbesondere vorteilhaft, wenn die Audio-Vorrichtung Daten über ein Bluetooth-Protokoll empfängt, und wenn die Dekodiervorrichtung 1 ein CVSD-Dekodierer ist, da die CVSD-Dekodierung mit dem Bluetooth-Standard übereinstimmt, wodurch die Qualität der Ausgabe erhöht wird.
  • Ein Dekodiersystem gemäß der Erfindung kann ebenso in einem Daten-Netzwerk angewandt werden, welches einen Senderknoten und eine Verbindung zwischen dem Senderknoten und einem Empfängerknoten aufweist. Der Empfängerknoten in dem Netzwerk kann dann ein Dekodiersystem gemäß der Erfindung aufweisen. Ein Beispiel von solch einem Netzwerk ist bei 180 in 10 gezeigt. Das Netzwerk 180 weist einen Kopfhörer 183 als Empfängerknoten auf, der Sprachdaten über eine drahtlose Bluetooth-Verbindung 182 von einem Mobiltelefon 181 empfängt, welches als Senderknoten tätig wird. Der Kopfhörer 183 weist eine Empfängervorrichtung 1831 auf, die mit einem Dekodiersystem 1 gemäß der Erfindung verbunden ist. Bei dem Ausgang des Dekodiersystems 1 ist ein Lautsprecher 1832 vorgesehen, der Audiosignale ausgibt, die von den kodierten Daten dargestellt werden.
  • Gemäß der zuvor angegebenen Beschreibung liegen für den Fachmann andere Anwendungen der Erfindung nahe.

Claims (28)

  1. Dekodierverfahren zum Dekodieren kodierter Daten, einschliessend: den Empfang kodierter Daten, die Originaldaten darstellen, die mit einem Kodierverfahren kodiert worden sind; die Erkennung beschädigter Daten in den kodierten Daten; den Ersatz zumindest eines Teiles der beschädigten Daten durch Ersatzdaten; die Dekodierung der kodierten Daten mit einem Dekodierverfahren, das im Wesentlichen die Umkehrung des Kodierverfahrens ist, wodurch die Originaldaten erhalten werden; und Weiterübermittlung der erhaltenen Originaldaten; dadurch gekennzeichnet, dass das Verfahren weiter einschliesst: die Speicherung der empfangenen kodierten Daten in einem Puffer als gepufferte Daten; die Bestimmung einer geschätzten Periodizität der durch beschädigte Daten dargestellten Originaldaten; und der Ersatz der beschädigten Daten einschliesst: den Ersatz der beschädigten Daten mit gepufferten Daten, die vor dem Empfang der beschädigten Daten während eines Zeitintervalles, das im Wesentlichen der geschätzten Periodizität oder im Wesentlichen einem ganzen Vielfachen der geschätzten Periodizität entspricht, im Puffer gespeichert worden waren.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Bestimmung einer geschätzten Periodizität auf Originaldaten beruht, die gewonnen oder empfangen worden waren, ehe die beschädigten Daten erkannt wurden.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die Bestimmung einer geschätzten Periodizität auf einer Periodizität von Originaldaten beruht, die aus kodierten Daten gewonnen wurden, die empfangen worden waren, gerade ehe die beschädigten Daten erkannt wurden.
  4. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass die Bestimmung einer geschätzten Periodizität einschliesst, eine Autokorrelationsfunktion der Originaldaten zu bestimmen.
  5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die Bestimmung der Autokorrelationsfunktion eine Operation ist, die durch den mathematischen Algorithmus:
    Figure 00210001
    dargestellt wird, wo der Algorithmus Rxx den Autokorrelationswert darstellt; x[m – n] einen Wert des Signals zum Zeitpunkt m – n darstellt; k eine Zeitverschiebung darstellt; W die Anzahl von Werten des Signals darstellt, die genommen wurden, um die Autokorrelationsfunktion dafür zu berechnen; und m einen bestimmten Zeitpunkt darstellt.
  6. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die Bestimmung der Autokorrelationsfunktion eine Operation ist, die durch den mathematischen Algorithmus: Rxx(k,m) = α·Rxx(k,m – 1) + x[m]·x[m – k]dargestellt wird, wo der Algorithmus Rxx den Autokorrelationswert darstellt; x[m – n] einen Wert des Signals zum Zeitpunkt m – n darstellt; k eine Zeitverschiebung darstellt; W die Anzahl von Werten des Signals darstellt, die genommen wurden, um die Autokorrelationsfunktion dafür zu berechnen; m einen bestimmten Zeitpunkt darstellt; und α eine konstante Zahl darstellt.
  7. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass die Originaldaten Audiodaten sind, die Audiosignale darstellen.
  8. Verfahren nach Anspruch 7, weiter einschliessend: die Bestimmung, ob die Audiodaten stimmhafte Signale oder stimmlose Signale darstellen und falls die Audiodaten stimmlose Signale darstellen: Ersatz zumindest eines Teiles der beschädigten Daten mit Ersatzdaten, die Ruhekode darstellen, und falls die Audiodaten stimmhafte Signale darstellen: Ausführung der Schritte eines Verfahrens nach Anspruch 1.
  9. Verfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet, dass die kodierten Daten mit einem für Sprachsignale geeigneten Verfahren kodiert wurden.
  10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass die kodierten Daten mit einem differentiellen Wellenform-Kodierverfahren kodiert wurden.
  11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass die kodierten Daten mit einem Continuous Variable Slope Delta-Kodierverfahren kodiert wurden.
  12. Verfahren nach einem der Ansprüche 7 bis 11, weiter nach Weiterübermittlung der Audiodaten einen Schritt einschliessend, die Audiosignale in einer für Menschen wahrnehmbaren Form auszugeben.
  13. Datendekodersystem, einschliessend: einen Systemeingang (2) zum Empfang kodierter Daten; eine Schaltervorrichtung (3) mit: einem ersten, an den Systemeingang angeschlossenen Schaltereingang (311); einem zweiten, an einen Puffervorrichtung angeschlossenen Schaltereingang (312); und einem Schalterausgang (32), wobei die Schaltervorrichtung einen ersten Zustand, in dem der erste Schaltereingang in kommunikativer Verbindung mit dem Schalterausgang steht, und einen zweiten Zustand besitzt, in dem der zweite Schaltereingang in kommunikativer Verbindung mit dem Schalterausgang steht, einem an den Systemeingang angeschlossenen Bitfehlerdetektor zur Erkennung beschädigter Daten in den kodierten Daten, wobei der Bitfehlerdetektor die Schaltervorrichtung in den zweiten Zustand schaltet, wenn beschädigte Daten erkannt werden, aber die Schaltervorrichtung in den ersten Zustand schaltet, wenn keine beschädigten Daten erkannt werden; einer Puffervorrichtung (6) mit einem an den Systemeingang angeschlossenen Puffereingang zur Speicherung kodierer Daten als gepufferter Daten und einem Pufferausgang zur Ausgabe der gepufferter Daten, der eine Zeitverzögerung bezüglich des Zeitpunktes des Empfangs der Daten aufweist; einer an den Schalterausgang angeschlossenen Dekodervorrichtung (1; 4) zur Dekodierung zumindest der kodierten Daten, wodurch Originaldaten gewonnen werden und wobei die Dekodervorrichtung einen Dekodereingang und einen Dekoderausgang besitzt; einer an den Dekoderausgang angeschlossenen Periodizitätsschätzvorrichtung zur Bestimmung einer geschätzten Periodizität der durch die beschädigten Daten dargestellten Originaldaten; wobei die Periodizitätsschätzvorrichtung die Zeitverzögerung auf im Wesentlichen die geschätzte Periode oder ein ganzes Vielfaches davon einstellt; einem Systemausgang (8), der zur Weiterübermittlung der Originaldaten kommunikativ an den Dekoderausgang angeschlossen ist.
  14. System nach Anspruch 13, dadurch gekennzeichnet, dass die Periodizitätsschätzvorrichtung so eingerichtet ist, dass eine Periode von Originaldaten bestimmt wird, die gewonnen oder empfangen worden waren, ehe die beschädigten Daten erkannt wurden.
  15. System nach Anspruch 14, dadurch gekennzeichnet, dass die Periodizitätsschätzvorrichtung so eingerichtet ist, dass die Periode von Originaldaten geschätzt wird, die aus kodierten Daten gewonnen wurden, die empfangen worden waren, gerade ehe die beschädigten Daten erkannt wurden.
  16. System nach einem der Ansprüche 13 bis 15, dadurch gekennzeichnet, dass die Periodizitätsschätzvorrichtung ein Autokorrelator für die Berechnung einer Autokorrelationsfunktion der Originaldaten ist.
  17. System nach Anspruch 16, dadurch gekennzeichnet, dass der Autokorrelator so eingerichtet ist, dass er eine Operation ausführt, die durch den mathematischen Algorithmus:
    Figure 00230001
    dargestellt wird, wo der Algorithmus Rxx den Autokorrelationswert darstellt; x[m – n] einen Wert des Signals zum Zeitpunkt m – n darstellt; k eine Zeitverschiebung darstellt; W die Anzahl von Werten des Signals darstellt, die genommen wurden, um die Autokorrelationsfunktion dafür zu berechnen; und m einen bestimmten Zeitpunkt darstellt.
  18. System nach Anspruch 16, dadurch gekennzeichnet, dass der Autokorrelator so eingerichtet ist, dass er eine Operation ausführt, die durch den mathematischen Algorithmus: Rxx(k,m) = α·Rxx(k,m – 1) + x[m]·x[m – k]dargestellt wird, wo der Algorithmus Rxx den Autokorrelationswert darstellt; x[m – n] einen Wert des Signals zum Zeitpunkt m – n darstellt; k eine Zeitverschiebung darstellt; W die Anzahl von Werten des Signals darstellt, die genommen wurden, um die Autokorrelationsfunktion dafür zu berechnen; m einen bestimmten Zeitpunkt darstellt und α eine kontante Zahl darstellt.
  19. System nach einem der Ansprüche 13 bis 18, dadurch gekennzeichnet, dass die Originaldaten Audiodaten sind, die Audiosignale darstellen.
  20. System nach Anspruch 19, weiter einschliessend: einen an den Dekoderausgang angeschlossenen Detektor für stimmlose Signale, um zu bestimmen, ob die Audiodaten stimmhafte Signale oder stimmlose Signale darstellen; einen an den Dekodereingang angeschlossenen Bitgenerator, um Daten zu erzeugen, die ein voreingestelltes Signal darstellen, wobei der Bitgenerator aktiviert wird, wenn der Detektor für stimmlose Signale ein stimmloses Signal erkennt, und kommunikativ damit verbunden wird.
  21. System nach einem der Ansprüche 19 bis 20, dadurch gekennzeichnet, dass die Dekodiervorrichtung dafür eingerichtet ist, Sprachsignale zu kodieren.
  22. System nach Anspruch 21, dadurch gekennzeichnet, dass die Dekodiervorrichtung eine differentielle Wellenform-Kodiervorrichtung ist.
  23. System nach Anspruch 22, dadurch gekennzeichnet, dass die Dekodiervorrichtung eine Continuous Variable Slope Delta-Kodiervorrichtung ist.
  24. System nach einem der Ansprüche 19 bis 22, dadurch gekennzeichnet, dass der Dekoderausgang kommunikativ mit einer Audioausgabevorrichtung verbunden ist, um die durch die Audiodaten dargestellten Audiosignale in einer für Menschen wahrnehmbaren Form auszugeben.
  25. Computerprogramm zum Betreiben eines Computersystems, dadurch gekennzeichnet, dass das Computerprogramm Kodeabschnitte enthält, um die Schritte eines Verfahrens nach einem der Ansprüche 1 bis 12 auszuführen, wenn auf einem Computersystem ablaufend.
  26. Datenträger mit Daten, die ein Computerprogramm nach Anspruch 25 darstellen.
  27. Signalverarbeitungsvorrichtung, zumindest einschliessend: eine Empfangsvorrichtung zum Empfang von Signalen; ein mit dem Systemeingang an die Empfangsvorrichtung angeschlossenes Dekodersystem nach einem der Ansprüche 13 bis 24; und einen Signalverarbeitungsabschnitt zur Weiterverarbeitung der dekodierten Signale, wobei der Signalverarbeitungsabschnitt an den Systemausgang des Dekoders angeschlossen ist.
  28. Datenbehälter, Daten enthaltend, die Signale darstellen, die mit einem Verfahren nach einem der Ansprüche 1 bis 12 dekodiert wurden.
DE60118631T 2001-11-30 2001-11-30 Verfahren zum ersetzen verfälschter audiodaten Expired - Lifetime DE60118631T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/NL2001/000873 WO2003047115A1 (en) 2001-11-30 2001-11-30 Method for replacing corrupted audio data

Publications (2)

Publication Number Publication Date
DE60118631D1 DE60118631D1 (de) 2006-05-18
DE60118631T2 true DE60118631T2 (de) 2007-02-15

Family

ID=19760780

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60118631T Expired - Lifetime DE60118631T2 (de) 2001-11-30 2001-11-30 Verfahren zum ersetzen verfälschter audiodaten

Country Status (5)

Country Link
US (1) US7206986B2 (de)
EP (1) EP1449305B1 (de)
AU (1) AU2002216472A1 (de)
DE (1) DE60118631T2 (de)
WO (1) WO2003047115A1 (de)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7142250B1 (en) 2003-04-05 2006-11-28 Apple Computer, Inc. Method and apparatus for synchronizing audio and video streams
US7835916B2 (en) * 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
US7865255B2 (en) * 2004-03-31 2011-01-04 Mstar Semiconductor, Inc. Audio buffering system and method of buffering audio in a multimedia receiver
GB0416720D0 (en) 2004-07-27 2004-09-01 British Telecomm Method and system for voice over IP streaming optimisation
JP2007114417A (ja) * 2005-10-19 2007-05-10 Fujitsu Ltd 音声データ処理方法及び装置
DE602006015328D1 (de) * 2006-11-03 2010-08-19 Psytechnics Ltd Abtastfehlerkompensation
US7843460B2 (en) * 2007-04-13 2010-11-30 Seiko Epson Corporation Method and apparatus for bandwidth corruption recovery
US8386246B2 (en) * 2007-06-27 2013-02-26 Broadcom Corporation Low-complexity frame erasure concealment
US20100324911A1 (en) * 2008-04-07 2010-12-23 Broadcom Corporation Cvsd decoder state update after packet loss
ATE536614T1 (de) * 2008-06-10 2011-12-15 Dolby Lab Licensing Corp Verbergen von audioartefakten
US20100017670A1 (en) * 2008-07-21 2010-01-21 International Business Machines Corporation Automatic Data Recovery System
US8762561B2 (en) * 2008-07-23 2014-06-24 Qualcomm Incorporated System, method or apparatus for combining multiple streams of media data
US8676573B2 (en) * 2009-03-30 2014-03-18 Cambridge Silicon Radio Limited Error concealment
US8316267B2 (en) 2009-05-01 2012-11-20 Cambridge Silicon Radio Limited Error concealment
US8908882B2 (en) * 2009-06-29 2014-12-09 Audience, Inc. Reparation of corrupted audio signals
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8862254B2 (en) 2011-01-13 2014-10-14 Apple Inc. Background audio processing
US8621355B2 (en) 2011-02-02 2013-12-31 Apple Inc. Automatic synchronization of media clips
US9196256B2 (en) * 2013-02-07 2015-11-24 Mediatek Inc. Data processing method that selectively performs error correction operation in response to determination based on characteristic of packets corresponding to same set of speech data, and associated data processing apparatus
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
DE112015004185T5 (de) 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
US9880803B2 (en) * 2016-04-06 2018-01-30 International Business Machines Corporation Audio buffering continuity
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
CN108011686B (zh) * 2016-10-31 2020-07-14 腾讯科技(深圳)有限公司 信息编码帧丢失恢复方法和装置
CN107680605A (zh) * 2017-09-29 2018-02-09 湖南国科微电子股份有限公司 一种ape格式错误数据处理方法及***

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2746033B2 (ja) * 1992-12-24 1998-04-28 日本電気株式会社 音声復号化装置
DE69419515T2 (de) * 1994-11-10 2000-01-20 Ericsson Telefon Ab L M Verfahren und Einrichtung zur Tonwiederherstellung während Auslöschungen
WO1996037964A1 (en) * 1995-05-22 1996-11-28 Ntt Mobile Communications Network Inc. Sound decoding device
US5907822A (en) 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
US6421802B1 (en) * 1997-04-23 2002-07-16 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method for masking defects in a stream of audio data
US6026506A (en) * 1997-09-26 2000-02-15 International Business Machines Corporation Concealing errors in transport stream data
US6009389A (en) * 1997-11-14 1999-12-28 Cirrus Logic, Inc. Dual processor audio decoder and methods with sustained data pipelining during error conditions
EP1199709A1 (de) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Fehlerverdeckung in Bezug auf die Dekodierung von kodierten akustischen Signalen
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission

Also Published As

Publication number Publication date
EP1449305B1 (de) 2006-04-05
AU2002216472A1 (en) 2003-06-10
DE60118631D1 (de) 2006-05-18
US20050043959A1 (en) 2005-02-24
WO2003047115A1 (en) 2003-06-05
US7206986B2 (en) 2007-04-17
EP1449305A1 (de) 2004-08-25

Similar Documents

Publication Publication Date Title
DE60118631T2 (de) Verfahren zum ersetzen verfälschter audiodaten
DE69915830T2 (de) Verbesserte verfahren zur rückgewinnung verlorener datenrahmen für ein lpc-basiertes, parametrisches sprachkodierungsystem.
DE69534285T2 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate
DE60122203T2 (de) Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation
DE102008016502B4 (de) Verfahren zur Datenübermittlung über einen Sprachkanal eines drahtlosen Kommunikationsnetzes unter Verwendung einer kontinuierlichen Signalmodulation
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
DE69631318T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem
DE60220485T2 (de) Verfahren und Vorrichtung zur Verschleierung von Rahmenausfall von prädiktionskodierter Sprache unter Verwendung von Extrapolation der Wellenform
EP0978172B1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
DE19617630B4 (de) Verfahren zum Herleiten der Nachwirkperiode in einem Sprachdecodierer bei diskontinuierlicher Übertragung, sowie Sprachcodierer und Sender-Empfänger
DE60125219T2 (de) Spektralmerkmal ersatz für die verschleierung von rahmenfehlern in einem sprachdekoder
DE60217522T2 (de) Verbessertes verfahren zur verschleierung von bitfehlern bei der sprachcodierung
DE69923555T2 (de) Verfahren und vorrichtung zur entropie-kodierung von quantisierten transformationskoeffizienten eines signals
DE602004006211T2 (de) Verfahren zur Maskierung von Paketverlusten und/oder Rahmenausfall in einem Kommunikationssystem
DE60319590T2 (de) Verfahren zur codierung und decodierung von audio mit variabler rate
EP1388147B1 (de) Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
EP0251028B1 (de) Verfahren zur Übertragung eines Audiosignales
DE60007487T2 (de) Anordnung und Verfahren zum Bestimmen der Datenrate in einem drahtlosen Kommunikationssystem
EP2345028A1 (de) Verfahren zur fehlerverdeckung bei fehlerhafter übertragung von sprachdaten
EP0287578B1 (de) Digitales codierverfahren
DE60224962T2 (de) Verfahren und Vorrichtung zur Verschleierung von fehlerbehafteten Sprachrahmen
DE60124079T2 (de) Sprachverarbeitung
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE69206300T2 (de) Verfahren und Einrichtung zur Bearbeitung von Vorechos eines mittels einer Frequenztransformation kodierten digitalen Audiosignals.
DE4427351C1 (de) Signalverarbeitungsverfahren und -anordnung für blockweise codierte Sprachsignale eines Nachrichtensystems

Legal Events

Date Code Title Description
8364 No opposition during term of opposition