DE69700837T2 - System zur kodierung und dekodierung eines signals, insbesondere eines digitalen audiosignals - Google Patents

System zur kodierung und dekodierung eines signals, insbesondere eines digitalen audiosignals

Info

Publication number
DE69700837T2
DE69700837T2 DE69700837T DE69700837T DE69700837T2 DE 69700837 T2 DE69700837 T2 DE 69700837T2 DE 69700837 T DE69700837 T DE 69700837T DE 69700837 T DE69700837 T DE 69700837T DE 69700837 T2 DE69700837 T2 DE 69700837T2
Authority
DE
Germany
Prior art keywords
primary
coding
flow
filter bank
raster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69700837T
Other languages
English (en)
Other versions
DE69700837D1 (de
Inventor
Laurent Mainard
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telediffusion de France ets Public de Diffusion
Orange SA
Original Assignee
Telediffusion de France ets Public de Diffusion
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telediffusion de France ets Public de Diffusion, France Telecom SA filed Critical Telediffusion de France ets Public de Diffusion
Publication of DE69700837D1 publication Critical patent/DE69700837D1/de
Application granted granted Critical
Publication of DE69700837T2 publication Critical patent/DE69700837T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die vorliegende Erfindung betrifft ein System zur Kodierung und Dekodierung eines Signals, insbesondere eines audionumerischen Signals. Diese Systeme finden Anwendung bei der Übertragung einer geringen Durchgangsmenge an Lautsignalen mit einer möglichst geringen erforderlichen Zeit für die Kodierung/Dekodierung, die beispielsweise durch die Rücksendung einer Kontrollstimme vorgegeben wird.
  • Bei der Übertragung von numerischen Signalen, werden diese numerisch in einem Sender kodiert und sodann dekodiert, um in einem Empfänger wiederhergestellt zu werden. Die vorliegende Erfindung ist betroffen von dem Gegensatz zwischen einerseits der Suche nach einer Qualität der Übertragung, die im allgemeinen für eine festgelegte Durchgangsmenge eine relativ lange Zeit für die Kodierung und Dekodierung nach sich zieht, und andererseits der Zeit für die Kodierung/Dekodierung, die bei gewissen Anwendungen kurz sein soll.
  • In der vorliegenden Beschreibung wird als Zeit für die Kondierung/Dekodierung die Zeitdauer bezeichnet, die zwischen dem Eintritt eines Musters in den Kodierer und dem Austritt des entsprechenden Musters aus dem Dekoder liegt. Um den besonderen Einsatz des Kodierverfahrens und/oder die Struktur der Schaltungen, die diese Kodierung ermöglichen, nicht berücksichtigen zu müssen, wird angenommen, dass die bei diesen Verfahren durchgeführten Berechnungen unendlich schnell sind, sowohl im Kodierer als auch im Dekoder. Bei der Berechnung der Zeit für die Kodierung/Dekodierung werden somit nur solche Parameter berücksichtigt, wie beispielsweise die Zeit für die Übernahme der numerischen Signalraster, die von einer Filterbank geforderte Zeit und/oder die Zeitdauer, die einem Mustermultiplexing entspricht.
  • Im Falle eines Kodierers mit Transformierter ist diese Zeit grösser als die Zeitdauer eines kodierten Rasters, der zu der Verzögerung hinzugerechnet wird, die von der Transformierten erzeugt wird. Im Falle eines Kodierers geringer Verzögerung vom Typ LD-CELP, wie jenem, der von J. H. Chen et al. in dem Artikel mit dem Titel "A low delay CELP coder for the CCITT 16 kb/s speech coding standard" erschienen in IEEE J. Sel. Areas Commun., Band 10, Seiten 830-849, beschrieben wird, ist die Kodierzeit mit den fünf Mustern verbunden, die einen Basisraster bilden. Es ist anzumerken, dass ein Kodierschema eine Kodierzeit, ausgedrückt in Anzahl von Mustern, besitzt. Um davon einen zeitlichen Wert abzuleiten, muss die Frequenz der Musternahme berücksichtigt werden, mit der der Kodierer betrieben wird, nach dem Verhältnis:
  • Zeitdauer = Kodierzeit in Mustern/Frequenz der Musternahme
  • Was die Kodierqualität betrifft, ist diese ein schwer zu definierender Parameter, da der Endempfänger, d. h. das Ohr des Zuhörers, keine genauen quantitativen Ergebnisse angeben kann. Überdies sind die Messungen, wie jene des Signal- Lärm-Verhältnisses nicht stichhaltig, da sie nicht die Eigenschaften der psychoakustischen Überdeckung des auditiven Systems berücksichtigen. Statistische Techniken, wie jene, die durch das Gutachten ITU-R-BS-1116 empfohlen werden, ermöglichen es, verschiedene Kodieralgorithmen im Hinblick auf die Kodierqualität zu bestimmen.
  • Es ist allerdings anzumerken, dass es eine Verbesserung des Signal-Lärm-Verhältnisses, die an der Gesamtheit der Frequenzen des Lautsignals vorgenommen wird, ermöglicht, eine Verbesserung der wahrgenommenen Qualität zu erreichen.
  • Die Kodiersysteme von übergeordneten audionumerischen Signalen, d. h. ohne Annahme über die Art der Erzeugung dieser Signale, haben bisher nur wenige den Aspekt der Wiederherstellungszeit des Signals als zwingend angesehen. Eine Ausnahme wird allerdings durch das Verfahren aufgezeigt, das von F. Rumseyi in einem Artikel mit dem Titel "Hearing both sides-stereo sound for TV in the UK", erschienen in IEE rev., Band 36, Nr. 5, Seiten 173-176, beschrieben wird. Jedoch bei diesem Verfahren ermöglichen es die erreichten Kompressionen nicht, mit den herkömmlichen Kodierern mit Transformierter zu konkurrieren.
  • Unter den Algorithmen, die nach ISO (ISO/IEC 13818-3) genormt sind, reichen die Mindestzeiten für die Wiederherstellung von 18 ms für den einfachsten - und somit am wenigsten wirksamen - Kodierer bis über 100 ms für den umfassendsten Kodierer. Weitere Kodierverfahren, die nicht nach ISO genormt sind, wie beispielsweise das sogenannte AC3-Verfahren, das von C. Todd et al. beschrieben wird, wie auch das sogenannte ASPEC-Verfahren (Adaptative Spectral Perceptual Entropy Coding), das von K. Brandeburg et al. beschrieben wird, oder das sogenannte ATRAC-Verfahren (Adaptative Transform Acoustic Coding), das von K. Tsutsui beschrieben wird, weisen typischerweise Kodier- /Dekodierzeiten von ungefähr hundert Millisekunden auf.
  • Die Wirksamkeit von Kodiersystemen hängt mit der Grösse der Filterbanken, die im allgemeinen verwendet werden, mit der langfristigen Berücksichtigung der Redundanzen in den zu kodierenden Signalen, mit der optimalen Verteilung der Binärzuteilungen auf eine grössere Zeitdauer als der Raster, usw. zusammen. Die Berücksichtigung dieser Elemente zum Zeitpunkt der Kodierung führt zu einer Erhöhung der Kodier-/Dekodierzeit des Systems.
  • Es ist anzumerken, dass die Kodierer geringer Verzögerung oft mit der Kodierung der Sprache für Duplextelefonverbin dungen beispielsweise oder für die Verbindung mit Echounterdrückern zusammenhängen. Sie sind meistens für Bemusterungsfrequenzen von 8 kHz bis 16 kHz ausgeführt, und ihr Qualitätsniveau reicht nicht aus, um übergeordnete audionumerische Signale ursprungsgetreu zu kodieren.
  • Ziel der Erfindung ist es, in diesem Zusammenhang ein Kodiersystem und das zugehörige Dekodiersystem vorzuschlagen, das es auf der Empfängerseite ermöglicht, sowohl ein qualitativ hochwertiges audionumerisches Signal als auch ein audionumerisches Signal minderer Qualität wiederherzustellen, dessen Kodier-/Dekodierzeit allerdings möglichst gering ist.
  • Ein solches Kodier--/Dekodiersystem ist bereits bekannt, und es ist der Vorabdruck 4132 der 99. Konvention AES von Oktober 1995 in New York zu nennen, in dem Bernhard Grill et al. hierarchische audionumerische Kodiersysteme beschreiben, d. h. deren Ausgangsbitfluss eine Bituntereinheit umfasst, die eine Dekodierung und eine Wiederherstellung eines bezeichnenden oder stichhaltigen Lautsignals ermöglichen kann, das jedoch eine geringe Qualität verglichen mit jener aufweist, die durch Dekodierung und Wiederherstellung aus einem Gesamtbitfluss erzielt wird.
  • Solche Kodiersysteme umfassen einen Kodierer, um ein Lautsignal hoher Qualität zu kodieren, dessen Ausgang mit dem Eingang eines Dekoders verbunden ist, und eine Differenzschaltung, die die Differenz zwischen dem am Ausgang des Dekoders erhaltenen Signal und dem ursprünglichen Signal herstellt. Das Differenzsignal wird selbst in einer zweiten Stufe analogen Behandlungen des Kodierens, Dekodierens und der Differenzberechnung unterzogen. Die dritte Stufe kodiert das Restdifferenzsignal. Die aus den Kodierern der drei Stufen kommenden Signale werden nun gemultiplext, um einen hierarchischen numerischen Fluss zu bilden. Mehrere Ausführungsarten werden dargestellt, von denen eine an führt, dass in der ersten Stufe der Kodierer ein Kodierer mit geringer Bitdurchgangsmenge ist, der eine relativ kurze Kodierzeit aufweist. Der Kodierer der zweiten Stufe ist hingegen ein Kodierer mit längerer Kodierzeit.
  • Mit einem solchen System sind somit drei gemultiplexte Flüsse in einem einzigen Ausgangsfluss vorhanden, wobei einer dieser Flüsse, der von dem Kodierer geringer Verzögerung erzeugt wird, eine geringe Kodierzeit und eine mindere Qualität aufweist, während die beiden anderen längere Kodierzeiten aufweisen, allerdings den Fluss von erforderlichen Informationen für eine Wiederherstellung guter Qualität liefern.
  • Jedoch bei den von Bernhard Grill vorgestellten Systemen wird in Wirklichkeit jeder Kodierer von einer unterbemusterten Filterbank und einem Kodierer gebildet. Ebenso wird jeder Dekoder in Wirklichkeit von einem Dekoder und einer Filterbank gebildet, die mit der Filterbank des Kodierers verbunden ist und eine Überbemusterung durchführt. Es konnte festgestellt werden, dass die Verwendung solcher Kodierer und Dekoder in dieser besonderen Struktur zu einer noch relativ hohen Kodier-/Dekodierzeit für den Fluss geringer Qualität führt.
  • Ziel der Erfindung ist es, ein Kodiersystem vorzuschlagen, das eine Kodier-/Dekodierzeit für den Fluss geringer Qualität aufweist, die kürzer ist als die des oben beschriebenen Systems.
  • Zu diesem Zweck ist ein erfindungsgemässes Kodiersystem dadurch gekennzeichnet, dass es eine Filterbank, die dazu vorgesehen ist, den zu kodierenden eingehenden Fluss zu empfangen und Signale jeweils in unterschiedlichen Unterbändern der Kodierer, Primärkodierer genannt, zu erzeugen, um die Signale in Unterbändern zu kodieren und auf diese Weise Primärflüsse zu bilden, wobei Dekoder die Primär flüsse empfangen und diese Flüsse dekodieren, Subtrahierglieder, von denen jedes dazu vorgesehen ist, die Differenz zwischen den von der Filterbank in jedem Unterband gelieferten Signalen und den von dem entsprechenden Dekoder gelieferten Signalen zu erstellen, einen Kodierer, genannt Sekundärkodierer, um die Kodierung der von den Subtrahiergliedern gekommenen Signale durchzuführen und auf diese Weise einen Sekundärfluss zu erzeugen, und einen Multiplexer umfasst, um in einem einzigen Gesamtfluss die Primärflüsse, die von den Primärkodierern gekommen sind, und den Sekundärfluss, der von dem Sekundärkodierer gekommen ist, zu multiplexen.
  • Es umfasst ferner eine zweite Filterbank, genannt Sekundärfilterbank, die an jedem ihrer Eingänge das Differenzsignal empfängt, das von jedem Subtrahierglied ausgegangen ist, und die einen gefilterten Fluss an den Eingang des Sekundärkodierers liefert. Die Sekundärfilterbank umfasst vorzugsweise für jedes Unterband einen Eingang, um den Primärfluss, der von dem Primärkodierer gekommen ist und von dem entsprechenden Dekoder dekodiert wurde, zu empfangen, um mit Hilfe eines psychoakustischen Modells die maximalen Lärmniveaus zu bestimmen, die in jedes der Unterbänder eingeleitet werden können, wobei der Sekundärkodierer ein Wahrnehmungskodierer ist, dessen Kodierung auf der psychoakustischen Analyse beruht, die von der Sekundärfilterbank durchgeführt wurde.
  • Nach einer Ausführungsvariante der Erfindung umfasst die Sekundärfilterbank für jedes Unterband einen Eingang, um das Unterbandsignal, das von der Primärfilterbank gekommen ist, zu empfangen, um mit Hilfe eines psychoakustischen Modells die maximalen Lärmniveaus zu bestimmen, die in jedes der Unterbänder eingeleitet werden können, wobei der Sekundärkodierer ein Wahrnehmungskodierer ist, dessen Kodierung auf der psychoakustischen Analyse beruht, die von der Sekundärfilterbank durchgeführt wurde.
  • Vorzugsweise ist jeder Primärkodierer ein bezüglich der Durchgangsmenge rekonfigurierbarer Kodierer.
  • Die vorliegende Erfindung betrifft auch ein Mulitplexing- Verfahren eines Primärrasters mit einem Sekundärraster, die durch ein Kodiersystem eines zu kodierenden Signals erzeugt werden, das einen Gesamtfluss liefert, der von einem Primärfluss, der einer Kodierung des eingehenden Flusses, genannt Primärkodierung, entspricht, und einem Sekundärfluss gebildet wird, der einer Sekundärkodierung entspricht.
  • Es besteht darin, einen Raster, genannt Gesamtraster, zu bilden, der von der Aneinanderkettung einer Mehrzahl von Primärrastern und einer Mehrzahl von Fragmenten von mindestens einem Sekundärraster gebildet wird, wobei ein Primärraster mit einem Sekundärrasterfragment abwechselt, wobei die Bitanzahl eines Sekundärrasterfragments gleich der dem Sekundärfluss zugeteilten Durchflussmenge ist, multipliziert mit der Emissionszeit eines Primärrasters. Die Emission der Gesamtraster erfolgt vorzugsweise während aller Zeitdauern der Primärraster. Ebenso ist die Dauer eines Gesamtrasters gleich der Emissionsdauer eines Primärrasters, multipliziert mit der Anzahl von Primärrastern.
  • Die vorliegende Erfindung betrifft auch ein Dekodiersystem für einen durch ein Kodiersystem, wie oben beschrieben, kodierten Fluss. Es umfasst einen Flussmultiplexer, der eine Mehrzahl von Primärflüssen und einen Sekundärfluss liefert, eine Mehrzahl von Primärdekodern zur Dekodierung der Primärflüsse, wobei der Ausgang jedes Dekoders mit einem entsprechenden Eingang einer Primärfilterbank verbunden ist, die nun einen dekodierten Fluss geringer Verzögerung liefert, wobei der Ausgang jedes Dekoders ebenfalls mit einem Eingang einer entsprechenden Verzögerungsleitung verbunden ist, deren Ausgang mit dem ersten Eingang eines Summators verbunden ist, wobei ein Sekundärdekoder einen dekodierten Sekundärfluss liefert, der an einen zweiten Eingang jedes Summators geliefert wird, wobei der Ausgang jedes Summators mit dem Eingang einer zweiten Primärfilterbank verbunden ist, um einen dekodierten Fluss hoher Qualität zu liefern. Es umfasst ferner eine Sekundärfilterbank.
  • Die oben erwähnten Merkmale der Erfindung, wie auch andere, gehen deutlicher aus der Studie der nachfolgenden Beschreibung eines Ausführungsbeispiels hervor, wobei sich die Beschreibung auf die beiliegenden Zeichnungen bezieht, wobei:
  • Fig. 1 eine schematische Ansicht eines erfindungsgemässen Kodiersystems ist,
  • Fig. 2 das Multiplexing-Verfahren darstellt, das in einem erfindungsgemässen Kodiersystem eingesetzt wird,
  • Fig. 3 eine schematische Ansicht eines erfindungsgemässen Dekodiersystems ist.
  • Das in Fig. 1 dargestellte Kodiersystem wird von einer Filterbank 10 gebildet, deren Eingag einen eingehenden, zu kodierenden audionumerischen Fluss FE empfängt. Die Filterbank 10 liefert mehrere Signale, die sich in unterschiedlichen Unterbändern, genannt Primärunterbänder, befinden. Diese Signale werden jeweils an die Eingänge von Primärkodierern geringer Durchflussmenge 20&sub1; bis 20&sub4; geliefert, von denen hier vier vorhanden sind, die aber auch in einer beliebigen Anzahl n grösser als zwei vorhanden sein können. Der Ausgang jedes Primärkodierers 20i (i = 1 bis n) ist einerseits mit einem entsprechenden Eingang eines Multiplexers 30 und andererseits mit dem Eingang eines Primärdekoders geringer Verzögerung 40i (i = 1 bis n) verbunden. Der Ausgang jedes Dekoders 40i ist mit einem ersten Eingang eines Subtrahiergliedes 50i verbunden, dessen anderer Eingang das Signal des entsprechenden Primärunterbandes empfängt, das von der Filterbank 10 geliefert wird. Das Differenzsignal, das von dem Subtrahierglied 5% gekommen ist, wird an den Eingang einer Sekundärfilterbank 60 geliefert, deren Ausgang mit einem Kodierer 70 verbunden ist. Der Ausgang des Kodierers 70 ist mit einem entsprechenden Eingang des Multiplexers 30 verbunden.
  • Der Multiplexer 30 führt die Verflechtung der Primär- und Sekundärflüsse, die von den Kodierern 20 bzw. 70 gekommen sind, durch. Fig. 2 stellt das Verflechtungsverfahren dar.
  • Es sind zwei Zeitachsen dargestellt, von denen eine in bezug auf die andere erweitert ist, wobei punktierte Linien die zeitliche Entsprechung zwischen diesen Achsen darstellen. Auf der ersten Achse sind Segmente dargestellt, deren Länge der Dauer für die Erstellung t eines Primärrasters entspricht, der durch Verbindung der vier Primärflüsse erhalten wird, die von den Kodierern 20&sub1; bis 20&sub4; gekommen sind. Auf der anderen Achse ist ein Gesamtraster TG dargestellt, der von einem Eingang H, von vier Primärrastern TP und vier Fragmenten eines Sekundärrasters FTS gebildet wird, wobei die Sekundärrasterfragmente FTS mit den Primärrastern TP abwechseln. Die Sekundärrasterfragmente FTS sind das Ergebnis einer Fragmentierung des Sekundärrasters TS, der von dem Sekundärkodierer 70 geliefert wird. Die Bitanzahl eines Fragments FTS ist gleich der Durchflussmenge, die dem Sekundärfluss zugeteilt wird, multipliziert mit der Emissionsdauer t der Primärkodierer.
  • Es ist festzustellen, dass die Dauer Tt des Gesamtrasters TG ein ganzes Vielfaches der Dauer t des oben erwähnten Primärrasters ist (hier vier). Ebenso ist die Dauer Tt des Gesamtrasters TG ein ganzes Vielfaches der Dauer T des Sekundärrasters TS. Vorzugsweise ist die Dauer des Gesamtrasters Tt gleich der Dauer T eines Sekundärrasters TS. In diesem Fall befindet sich ein einziger Sekundärraster TS in dem Gesamtraster TG eingeschlossen, wie dies in Fig. 2 der Fall ist.
  • Es ist anzumerken, dass die Anzahl von Primärrastern TP und die Anzahl von Sekundärrasterfragmenten TS des Gesamtrasters ungleich vier sein könnte, ohne das Konzept der Erfindung grundlegend zu verändern. Insbesondere ist diese Anzahl nicht mit der Anzahl von Unterbändern verbunden, die in einem Primärraster enthalten sind.
  • Um die Kodier-/Dekodierzeit des Primärflusses zu verringern, erfolgt die Emission des Gesamtflusses auf alle Zeitdauern der Primärraster TP. Genauer entsprechen jeder Emission die Informationen eines Primärrasters TP und des nachfolgenden Sekundärrasterfragments FTS.
  • Über die Dauer Tt des Gesamtrasters ist die binäre Durchflussmenge, die jedem Primärkodierer 20i zugeteilt wird, unterschiedlich. Diese Zuteilung ist für das Kodiersystem und für das Dekodiersystem bekannt. Beispielsweise kann die Zuteilung nach der Energie in jedem primären Unterband erfolgen.
  • Die Kopfzeile H enthält ein Synchronisationswort, um das Dekodiersystem zu blockieren und die Zuteilungen der verschiedenen Primärkodierer 20i zu liefern. Diese Zuteilungen der Rasterkopfzeile, die von dem Kodiersystem ausgesandt werden, dienen nun zur Initialisierung des Dekodiersystems und zur Vermeidung möglicher Übertragungsfehler.
  • Für jedes Unterband der Filterbank 10 umfasst die Filterbank 60 einen Eingang, um das betreffende Unterband zu empfangen, das von der Primärfilterbank 10 geliefert wird. Ausgehend von diesem Signal bestimmt ein geeignetes psychoakustisches Modell, beispielsweise das erste Modell, das von der Norm ISO/IEC 13818-3 vorgeschlagen wird, die maxi malen Lärmniveaus, die unhörbar in jedes der Sekundärunterbänder eingeleitet werden können.
  • Der Kodierer 70 ist ein Wahrnehmungskodierer, dessen Kodierung auf der psychoakustischen Analyse basiert, die von der Filterbank 60 geliefert wird.
  • Wenn der Fluss des Primärkodierers 2% über eine ausreichende Bitanzahl verfügt, beispielsweise über 2,5 Bits pro Muster, ist es vorzuziehen, das ursprüngliche Signal am Eingang der Filterbank für seine Bearbeitung nach dem psychoakustischen Modell in seiner kodierten und sodann dekodierten Form, die von dem Dekoder 4% in das betreffende Pirmärunterband geliefert wird, zu ersetzen. Der Vorteil besteht darin, dass der Sekundärdekoder des Dekodiersystems, das mit dem vorliegenden Kodiersystem verbunden und somit mit dem selben psychoakustischen Modell wie die Filterbank 60 versehen ist, die feinen Zuteilungsniveaus ableiten kann, die von dem Sekundärkodierer 70 berechnet wurden. Dies ermöglicht somit Einsparungen bei den Übertragungskosten.
  • Die Primärfilterbank kann eine Filterbank der Familie der QMF (Quadrature Mirror Filterbank) oder Filterbänke vom Typ MOT (Modulated Orthogonal Transforms) mit einer ausreichend geringen Anzahl an Unterbändern sein, um keine zu grosse Verzögerungsfrist zu erzeugen. Eine Bank von zu Unterbändern ungleicher Breiten modulierten Filtern oder eine Bank von kaskadenartigen Filtern vom Typ mit Wellen oder sonstige sind auch möglich, unter der Voraussetzung, dass die Wahl mit der erforderlichen Zeit vereinbart ist. Eine Filterbank mit acht modulierten Unterbändern aus einem Filter mit einer Länge von zweiunddreissig, wie beispielsweise die von H. S. Malvar in einem Artikel mit dem Titel "Extended Lapped Transforms: Porperties, Applications, and Fast Algorithms", erschienen in IEEE Transactions on signal processing, Band 40, Nr. 11, Seiten 2703-2714 von Novem ber 1992 beschrieben, ist ein gutes Beispiel für eine Filterbank, die an das erfindungsgemässe System angepasst ist.
  • Jeder Kodierer geringer Verzögerung 20i kann ein hinsichtlich der Durchflussmenge rekonfigurierbarer Kodierer sein, damit die mit jedem Unterband verbundene Durchflussmenge variabel ist. Jeder Kodierer 20i erzeugt einen Fluss an einer geringen Anzahl von zusammengefassten Mustern, die eine konstante, von dem Unterband unabhängige Zeitdauer darstellen. Diese Zeitdauer wird in der Folge Primärdauer genannt.
  • Beispielsweise kann ein Kodierer vom Typ LD-CELP (Low Delay - Code Excited Linear Prediction) gewählt werden, wie beispielsweise jener, der von J. H. Chen et al. in einem Artikel mit dem Titel "A low delay CELP coder for the CCITT 16 kb/s speech coding standard", erschienen in IEEE J. Sel. Areas Commun., Band 10, Seiten 830-849 von Juni 1992 beschrieben wird. Dieser LD-CELP-Kodierer kann eine Auswahl von Wörterbüchern unterschiedlicher Grössen enthalten.
  • Was jeden Dekoder 40i betrifft, ist anzumerken, dass er in den zugehörigen Kodierer 20i eingeschlossen sein könnte.
  • Was die Sekundärfilterbank 60 betrifft, ist ihre Wahl viel freier als für die Primärfilterbank 10, insofern als keinerlei Erfordernis hinsichtlich der Verzögerung, die sie einleitet, geltend gemacht wird. Eine solche Filterbank kann eine variable Anzahl von Unterbändern pro Primärunterband liefern, und zwar je nach dem stationären Zustand des Signals im Unterband. Ferner ist es, um die Spektrenüberdeckungen der Primärfilterbank nicht berücksichtigen zu müssen, interessant, Aliasingreduktionsklappen zu verwenden, wie jene, die von B. Tang et al. in einem Artikel mit dem Titel "Spectral analysis of subband filtered signals", erschienen in ICAASP, Band 2, Seiten 1324-1327, 1995 beschrieben werden.
  • Beispielsweise kann im Falle einer Primärfilterbank 10 mit acht Unterbändern für jedes der vier ersten Primärunterbänder eine Filterbank vom Typ MOT (Modulated Orthogonal Transforms) mit Mitteln, die je nach dem stationären Zustand des Signals die Umwandlung eines Längenfensters 128 oder 32, das 64 bzw. 16 Unterbänder erzeugt ermöglichen, und für die vier anderen Primärunterbänder eine Filterbank vom Typ MOT in 32 Unterbändern mit einer Länge 64 ausgewählt werden.
  • Die für den Sekundärkodierer 70 verfügbare Durchflussmenge wird berechnet, indem die von den Primärkodierern geringe Verzögerung 20i verwendete Durchflussmenge von der Gesamtdurchflussmenge abgezogen wird. Beispielsweise können für eine Gesamtdurchflussmenge von 64 kbits/s 32 kbits/s der Gesamtheit der Primärkodierer 20&sub1; bis 20&sub4; und 32 kbits/s dem Sekundärkodierer 70 zugeteilt werden.
  • Das in Fig. 3 dargestellte Dekodiersystem wird von Elementen gebildet, deren Bezugszeichen zwischen 110 und 180 liegen. Jedes Element ist das Paar eines Elements des in Fig. 1 dargestellten Kodiersystems, mit Ausnahme der Elemente 180i. Sein Bezugszeichen ist somit dasselbe, vergrössert um hundert. Als Beispiel ist der Demultiplexer 130 das Paar des Multiplexers 30.
  • In der vorliegenden Beschreibung ist ein Element das Paar eines anderen Elements, wenn es dazu vorgesehen ist, die umgekehrte Funktion zu diesem ersten zu erfüllen.
  • Das in Fig. 3 dargestellte Dekodiersystem wird von einem Demultiplexer 130 gebildet, dessen Ausgänge mit den Eingängen von Primärdekodern 120&sub1; bis 120&sub4; bzw. einem Sekundärkodierer 170 verbunden sind.
  • Der Ausgang jedes Primärdekoders 120&sub1; bis 120&sub4; ist einerseits mit einer zugehörigen Verzögerungsleitung 180&sub1; bis 180&sub4; und andererseits mit einem Eingang einer ersten Primärfilterbank 110 verbunden. Der Ausgang der Filterbank 110 liefert den dekodierten Primärfluss Fd. Der dekodierte Primärfluss Fd ist der Fluss minderer Qualität, der jedoch eine geringere Kodier-/Dekodierzeit aufweist.
  • Der Ausgang jeder Verzögerungsleitung 180&sub1; bis 180&sub4; ist mit einem ersten Eingang eines entsprechenden Summators 150&sub1; bis 150&sub4; verbunden.
  • Der Ausgang des Sekundärdekoders 170 ist mit dem Eingang einer Filterbank 160 verbunden, deren Ausgänge jeweils mit den zweiten Eingängen der Summatoren 150&sub1; bis 150&sub4; sind.
  • Schliesslich sind die Ausgänge der Summatoren 150&sub1; bis 150&sub4; jeweils mit den entsprechenden Eingängen einer Filterbank 110' verbunden, deren Ausgang den dekodierten Fluss hoher Qualität Fdhq liefert.
  • Eine Verbindung zwischen jeder Verzögerungsleitung 1801 und dem Dekoder 170 ist derart vorgesehen, dass an letztgenannten zum gewünschten Zeitpunkt die Zuteilungsinformationen geliefert werden, die in dem Primärfluss vorhanden sind, der von dem entsprechenden Dekoder 120i kommt.
  • Der Demultiplexer 130 des Dekodiersystems führt die Trennung des Gesamtrasters TG in Primärraster TP und in einen Sekundärraster durch, die abwechselnd an die Primärdekoder 120&sub1; bis 120&sub4; und an den Sekundärdekoder 170 geliefert werden. Der Ausgang geringer Verzögerung des Dekodiersystems wird erhalten durch Dekodieren der Primärraster in Unterbänder in den Primärdekodern 120i, sodann durch Überleitung in die reziproke Filterbank 110 der Filterbank mit geringer Verzögerung 10. In jedem der Unterbänder werden der Primärfluss, der von dem Primärdekoder 120i gekommen ist, sowie die Zuteilungsinformationen, die er enthält, in die entsprechende Verzögerungsleitung 180i geschickt, um den Teil hoher Qualität zu versorgen. Die Zuteilungsinformationen, die von den Verzögerungsleitungen gekommen sind, werden für jeden Primärfluss an den Sekundärdekoder 170 übertragen, der nun eine Dekodierung des Sekundärrasters durchführt. Sodann werden die reziproken Aliasingreduktionsklappen der Kodierklappen, sodann die Sekundärfilterbank 160 angelegt. Nun werden die von den Primärdekodern 120i gekommenen Signale über die Verzögerungsleitungen 180i angelegt, um die Primärfilterbank 110' zu versorgen. Am Ausgang wird das Signal hoher Qualität Fdhq erhalten.

Claims (10)

1. System zur Kodierung eines zu kodierenden Signals, welches einen Gesamtfluß liefert, der von einem primären Fluß, der einer Kodierung eines eingehenden Flusses, Primärkodierung genannt, entspricht, und von einem sekundären Fluß gebildet wird, der einer Sekundärkodierung entspricht, wobei die Kodierzeit der Primärkodierung kleiner ist als die der Sekundärkodierung, dadurch gekennzeichnet, daß es eine Filterbank (10), die dazu vorgesehen ist, den zu kodierenden eingehenden Fluß (FE) zu empfangen und Signale jeweils in unterschiedlichen Unterbändern der Kodierer, Primärkodierer (20&sub1; bis 20&sub4;) genannt, zu erzeugen, um die Signale in Unterbändern zu kodieren und auf diese Weise Primärflüsse (TP) zu bilden, wobei Dekoder (40&sub1; bis 40&sub4;) die Primärflüsse (TP) empfangen und diese Flüsse dekodieren, Subtrahierglieder (50&sub1; bis 50&sub4;), von denen jedes dazu vorgesehen ist, die Differenz zwischen den von der Filterbank (10) in jedem Unterband gelieferten Signalen und den von dem entsprechenden Dekoder (40&sub1; bis 40&sub4;) gelieferten Signalen zu erstellen, einen Kodierer (70), genannt Sekundärkodierer, um die Kodierung der von den Subtrahiergliedern (50&sub1; bis 50&sub4;) gekommenen Signale durchzuführen und auf diese Weise einen Sekundärfluß (TS) zu erzeugen, und einen Multiplexer (30) umfaßt, um in einem einzigen Gesamtfluß (TG) die Primärflüsse (TP), die von den Primärkodierern (20&sub1; bis 20&sub4;) gekommen sind, und den Sekundärfluß (TS), der von dem Sekundärkodierer (70) gekommen ist, zu multiplexen.
2. Kodiersystem nach Anspruch 1, dadurch gekennzeichnet, daß es eine zweite Filterbank (60), genannt Sekundärfilterbank, umfaßt, die an jedem ihrer Eingänge das Differenzsignal empfängt, das von jedem Subtrahierglied (50&sub1; bis 50&sub4;) ausgegangen ist, und die einen gefilterten Fluß an den Eingang des Sekundärkodierers (70) liefert.
3. Kodiersystem nach Anspruch 2, dadurch gekennzeichnet, daß die Sekundärfilterbank (60) für jedes Unterband einen Eingang umfaßt, um den Primärfluß (TP), der von dem Primärkodierer (20&sub1; bis 20&sub4;) gekommen ist und von dem entsprechenden Dekoder (40&sub1; bis 40&sub4;) dekodiert wurde, zu empfangen, um mit Hilfe eines psychoakustischen Modells die maximalen Lärmniveaus zu bestimmen, die in jedes der Unterbänder eingeleitet werden können, wobei der Sekundärkodierer (70) ein Wahrnehmungskodierer ist, dessen Kodierung auf der psychoakustischen Analyse beruht, die von der Sekundärfilterbank (60) durchgeführt wurde.
4. Kodiersystem nach Anspruch 2, dadurch gekennzeichnet, daß die Sekundärfilterbank (60) für jedes Unterband einen Eingang umfaßt, um das Unterbandsignal, das von der Primärfilterbank (10) gekommen ist, zu empfangen, um mit Hilfe eines psychoakustischen Modells die maximalen Lärmniveaus zu bestimmen, die in jedes der Unterbänder eingeleitet werden können, wobei der Sekundärkodierer (70) ein Wahrnehmungskodierer ist, dessen Kodierung auf der psychoakustischen Analyse beruht, die von der Sekundärfilterbank (60) durchgeführt wurde.
5. Kodiersystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß jeder Primärkodierer (20&sub1; bis 20&sub4;) ein bezüglich der Durchgangsmenge rekonfigurierbarer Kodierer ist.
6. Multiplexing-Verfahren eines Primärrasters (TP) mit einem Sekundärraster (TS), die durch ein Kodiersystem eines zu kodierenden Signals erzeugt werden, das einen Gesamtfluß liefert, der von einem Primärfluß, der einer Kodierung des eingehenden Flusses, genannt Primärkodierung, entspricht, und einem Sekundärfluß gebildet wird, der einer Sekundärkodierung entspricht, dadurch gekennzeichnet, daß es darin besteht, einen Raster, genannt Gesamtraster (TG), zu bilden, der von der Aneinanderkettung einer Mehrzahl von Primärrastern (TP) und einer Mehrzahl von Fragmenten (FTS) von mindestens einem Sekundärraster (TS) gebildet wird, wobei ein Primärraster (TP) mit einem Sekundärrasterfragment (FTS) abwechselt, wobei die Bitanzahl eines Sekundärrasterfragments (FTS) gleich der dem Sekundärfluß (TS) zugeteilten Durchflußmenge ist, multipliziert mit der Emissionszeit eines Primärrasters (TP).
7. Multiplexing-Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Emission der Gesamtraster (TG) während aller Zeitdauern der Primärraster (TP) erfolgt.
8. Multiplexing-Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, daß die Dauer eines Gesamtrasters (TG) gleich der Emissionsdauer eines Primärrasters (TP), multipliziert mit der Anzahl von Primärrastern (TP) ist.
9. Dekodiersystem für einen durch ein Kodiersystem nach einem der Ansprüche 1 bis 5 kodierten Fluß, dadurch gekennzeichnet, daß es einen Flußdemultiplexer (130) umfaßt, der eine Mehrzahl von Primärflüssen und Sekundärflüssen liefert, und eine Mehrzahl von Pirmärdekodern (120&sub1; bis 120&sub4;) zur Dekodierung der Primärflüsse umfaßt, wobei der Ausgang jedes Dekoders (120&sub1; bis 120&sub4;) mit einem entsprechenden Eingang einer Pirmärfilterbank (110) verbunden ist, die nun einen dekodierten Fluß geringer Verzögerung (Fd) liefert, wobei der Ausgang jedes Dekoders (120&sub1; bis 120&sub4;) ebenfalls mit einem Eingang einer entsprechenden Verzögerungs leitung (180&sub1; bis 180&sub4;) verbunden ist, deren Ausgang mit dem ersten Eingang eines Summators (150&sub1; bis 150&sub4;) verbunden ist, wobei ein Sekundärdekoder (170) einen dekodierten Sekundärfluß liefert, der an einen zweiten Eingang jedes Summators (150&sub1; bis 150&sub4;) geliefert wird, wobei der Ausgang jedes Summators (150&sub1; bis 150&sub4;) mit dem Eingang einer zweiten Primärfilterbank (110') verbunden ist, um einen dekodierten Fluß hoher Qualität (Fdqh) zu liefern.
10. Dekodiersystem nach Anspruch 9, dadurch gekennzeichnet, daß es ferner eine Sekundärfilterbank (160) umfaßt.
DE69700837T 1996-04-03 1997-04-02 System zur kodierung und dekodierung eines signals, insbesondere eines digitalen audiosignals Expired - Lifetime DE69700837T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9604483A FR2747225B1 (fr) 1996-04-03 1996-04-03 Systeme de codage et systeme de decodage d'un signal, notamment d'un signal audionumerique
PCT/FR1997/000582 WO1997038417A1 (fr) 1996-04-03 1997-04-02 Systeme de codage et systeme de decodage d'un signal, notamment d'un signal audionumerique

Publications (2)

Publication Number Publication Date
DE69700837D1 DE69700837D1 (de) 1999-12-30
DE69700837T2 true DE69700837T2 (de) 2000-07-20

Family

ID=9491074

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69700837T Expired - Lifetime DE69700837T2 (de) 1996-04-03 1997-04-02 System zur kodierung und dekodierung eines signals, insbesondere eines digitalen audiosignals

Country Status (5)

Country Link
US (1) US6058361A (de)
EP (1) EP0891617B1 (de)
DE (1) DE69700837T2 (de)
FR (1) FR2747225B1 (de)
WO (1) WO1997038417A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6728344B1 (en) * 1999-07-16 2004-04-27 Agere Systems Inc. Efficient compression of VROM messages for telephone answering devices
JP2004522198A (ja) * 2001-05-08 2004-07-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化方法
JP3855827B2 (ja) * 2002-04-05 2006-12-13 ソニー株式会社 2次元サブバンド符号化装置
US8352248B2 (en) * 2003-01-03 2013-01-08 Marvell International Ltd. Speech compression method and apparatus
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
FI20065010A0 (fi) * 2006-01-09 2006-01-09 Nokia Corp Häiriönvaimennuksen yhdistäminen tietoliikennejärjestelmässä

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
US5495552A (en) * 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory

Also Published As

Publication number Publication date
FR2747225B1 (fr) 1998-04-30
DE69700837D1 (de) 1999-12-30
US6058361A (en) 2000-05-02
EP0891617B1 (de) 1999-11-24
WO1997038417A1 (fr) 1997-10-16
EP0891617A1 (de) 1999-01-20
FR2747225A1 (fr) 1997-10-10

Similar Documents

Publication Publication Date Title
EP0910928B1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE19730129C2 (de) Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
EP0667063B1 (de) Verfahren zur übertragung und/oder speicherung digitaler signale mehrerer kanäle
DE19549621B4 (de) Vorrichtung zum Codieren von Audiosignalen
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE19730130C2 (de) Verfahren zum Codieren eines Audiosignals
DE69429499T2 (de) Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium
DE69323106T2 (de) Verfahren und Vorrichtung für perceptuelles Kodieren von Audio-Signalen
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE602004005846T2 (de) Audiosignalgenerierung
DE4320990B4 (de) Verfahren zur Redundanzreduktion
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE60117471T2 (de) Breitband-signalübertragungssystem
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
EP1230827B1 (de) Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals
DE60319590T2 (de) Verfahren zur codierung und decodierung von audio mit variabler rate
EP1016319B1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
DE3115859A1 (de) Codierverfahren und -vorrichtung fuer adpcm
EP0611516B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle
DE102004043521A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
EP0642719B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer voneinander abhängiger kanäle
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE102006055737A1 (de) Verfahren zur skalierbaren Codierung von Stereo-Signalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition