DE3784120T2 - Tabellengesteuerte dynamische bitverteilung in einem teilband-sprachkodierer mit veraenderlicher datenrate. - Google Patents

Tabellengesteuerte dynamische bitverteilung in einem teilband-sprachkodierer mit veraenderlicher datenrate.

Info

Publication number
DE3784120T2
DE3784120T2 DE8787109393T DE3784120T DE3784120T2 DE 3784120 T2 DE3784120 T2 DE 3784120T2 DE 8787109393 T DE8787109393 T DE 8787109393T DE 3784120 T DE3784120 T DE 3784120T DE 3784120 T2 DE3784120 T2 DE 3784120T2
Authority
DE
Germany
Prior art keywords
samples
bits
values
digital
subband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE8787109393T
Other languages
English (en)
Other versions
DE3784120D1 (de
Inventor
William George Crouse
Malcolm Scott Ware
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE3784120D1 publication Critical patent/DE3784120D1/de
Application granted granted Critical
Publication of DE3784120T2 publication Critical patent/DE3784120T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

    Gebiet der Erfindung
  • Diese Erfindung betrifft allgemein Digital/Analog- und Analog/- Digitalwandler und im besonderen analog/digitale Sprachabtastungs- und Codiermittel zum Aufbereiten einer oder mehrerer Sprachsignalquellen zur Übertragung über eine digitale Verbindung und zur Wiederherstellung durch Digital/Analogwandler im Empfänger. Sie ist besonders brauchbar zur Mehrkanalsprachkompression bei der Übertragung.
  • Hintergrund der Erfindung
  • Es sind viele Unterband-Sprachcodierer bekannt, wie Sprachcodierer, die auf digitalen Mikroprozessoren zur Handhabung der Verarbeitung des digitalen Energiepegels des Abtastwertes, der normalerweise in solchen Systemen auftritt, basieren. Hinweise sind in der Schriften: 1977, IEEE International Conference on Acoustics, Speech and Signal Processing record, vom 9. bis 11. Mai, 1977, Seiten 191 bis 195, und IEEE Acoustics, Speech and Signals Processing Society Proceedings vom 9. bis 11. April, 1980, Vol. 1, Seiten 332 bis 335, enthalten, die typische Unterband-Sprachcodierer- und -decodierer-Anordnungen zur Verwendung für eine Mehrkanalsprachübertragung zeigen.
  • In Systemen, wie denen der oben zitierten Veröffentlichungen, ist die subjektive Qualität der Funktion des Unterband- Sprachcodierers, die durch einen Hörer am Empfänger empfunden wird, stark von der Zuordnung der verfügbaren Bits im Übertragungsmedium zu den einzelnen Frequenzbändern im Unterband-Codierer abhängig. Eine Hauptverbesserung, die kürzlich vorgenommen wurde, betrifft die Verwendung von dynamischen Bitzuteilungen, wobei die verfügbaren Bits dynamisch unter den Frequenzbändern gemäß der in jedem Bandabtastwert vorhandenen Energie verteilt werden. Diese Technik wurde erweitert zu einem System mit variabler Bitrate, wobei viele Sprachcodierer ein gemeinsames Bitratenhilfsmittel teilen können, beispielsweise einen Übertragungskanal durch Zuweisen von Bits zu allen Bändern aller Codierer gemäß der Energie in jedem einzelnen Frequenzband in ihrem Verhältnis zu allen anderen Frequenzbändern.
  • Der typische Unterband-Sprachcodierer verwendet das O bis 4 Kilohertz Sprachspektrum und tastet es bei einer typischen Abtastrate von 8.000 Abtastungen pro Sekunde ab. Durch Filtern und Unterabtasten wird das Sprachspektrum in Unterspektren aufgeteilt, typischerweise in acht Unterbänder von jeweils 500 Hertz Breite. In einem derartigen System, das schematisch in Fig. 1 gezeigt wird, werden ankommende analoge Signale auf der Analogleitung 1 in einen digitalen Abtaststrom durch den Analog/Digitalwandler 2 umgewandelt, von diesem werden Abtastwerte durch den Taktgeber 4 über Leitung 3 typischerweise bei einer 8 Kilohertz Abtastrate zu einer Parallelfilterbank 5 ausgetaktet.
  • Die Filterbank 5 unterteilt den ankommenden digitalen Strom typischerweise in 8 Frequenzunterbänder, die das Spektrum von 0 bis 4.000 Hertz umfassen. Infolgedessen ist die Ausgabe eine Serie von acht einzelnen Kanälen, die einzelne Abtastwerte aufweisen, die bei einer Rate von 1.000 Abtastungen pro Sekunde auftreten, wie schematisch durch den Taktgeber 6 gezeigt wird, der die Ausgabe der Filterbank 5 über die Leitungen 7 steuert.
  • Einzelne Frequenzbandspitzen und die gesamten Spitzenwerte werden durch den Spitzenwert-Größenwandler 9 gemessen, was die Signalabtastwerte innerhalb eines Zeitrahmens normiert. Eine vorwärts gerichtete Fehlerkorrektur und eine dynamische Bitzuteilung werden auf die quantisierten Abtastwerte angewandt, durch den vorwärts gerichteten Korrekturgeber 10 und durch die dynamische Bitzuteilungstechnik oder den Bitzuteilungsalgorithmus, der normalerweise in einem Mikroprozessor, wie durch die dynamische Bitzuteilungseinheit 11 gezeigt wird, durchgeführt wird. Der Ausgang der Filterbank 5 wird dann im Pegel durch den Kompandierer 8 kompandiert oder normiert und auf die Anzahl der Bits, die durch 11 zugeordnet werden, quantisiert.
  • Der Ausgang des Kompandierers ist typischerweise ein Signalstrom von annähernd 13.000 Bits/s und der vorwärtsgerichtete Korrekturgeber 10 erzeugt einen Ausgabestrom von annähernd 3.000 Bits/s einschließlich der Spitzenumsetzungsdaten, welches einen gesamten Datenstrom zum Parallel/Serienumsetzer 13 zur Übertragung über den Datenkanal 14 von annähernd 16.000 darstellt. Dieser serielle Signalstrom enthält die aktuell kompandierten Abtastsignale und einen Seitenkanal für Informationen, welche die Bitzuteilung, die für jedes einzelne Frequenzunterband und den vorwärts gerichteten Fehlerkorrekturcode bereitgestellt wird, anzeigt.
  • Bezugnehmend auf Fig. 1 als Stand der Technik, wird das 0 bis 4 Kilohertz Eingabespektrum auf Leitung 1 typischerweise mit 8.000 Abtastungen pro Sekunde abgetastet, nachdem es aus dem A/D-Wandler 2 herauskommt. Dies wird durch den Abtasttaktgeber 4, der den Ausgang auf Leitung 3 des Analog/Digitalwandlers 2 steuert, gezeigt. Filtern und Unterabtasten wird in der Filterbank 5, welche die ankommenden Folgen von Abtastwerten in dem gesamten Spektrum in typischerweise 8 Unterspektren unterteilt, durchgeführt. In dem angegebenen Beispiel wird das 0 bis 4 Kilohertz Eingangspektrum in 8 Unterbänder von jeweils 500 Hertz Breite unterteilt. Das erste Band ist das 0 bis 0,5 Kilohertz Band, das zweite ist das 0.5 bis 1 Kilohertz Band, usw. Jede der zeitlichen Wellenformen der Unterbänder werden durch einen Bitstrom von 1.000 Abtastungen pro Sekunde an dem Ausgang der Filterbank 5, wie zum Beispiel durch den Taktgeber 6 gesteuert, dargestellt. Gelegentlich werden ungleiche Unterbandbreiten verwendet.
  • Die acht einzelnen zeitlichen Wellenformen des Unterbandes werden normalerweise in Zeitblocklängen, die von 4 bis 32 Millisekunden dauern, in einem Signalprozessor, der typischerweise als ein Mikroprozessor ausgeführt ist, bearbeitet. Die Darstellung in Fig. 1 nimmt eine 16 Millisekunden Abtast-Zeitblocklänge an. Der Spitzenwert-Größenwandler 9 in Fig. 1 findet die Spitzenhöhe des Signals in jedem Unterband innerhalb eines gegebenen Zeitblockes oder aus einer Folge von Abtastwerten heraus. Die einzelnen Unterbandfrequenzspitzen werden logarithmisch, typischerweise mit einem Auflösungsgrad von 2 bis 4 dB, quantisiert,
  • Die Information wird dann zu einem dynamischen Bitzuteilungs- Mittel und zu einem vorwärts gerichteten Korrekturfehlercodierer, der einen Fehlerschutz addiert, geleitet. Das Ergebnis wird dann zu einem Parallel/Serienumsetzer 13 geleitet, der die aktuellen Bits aus dem Übertragungsstrom von Abtastwerten, die von der Parallelfilterbank 5 kommen, multiplext. Die Bitzuteilung wurde bei einem reduzierten Pegel durch die in Box 11 durchgeführte Bitzuteilungstechnik zugeordnet. Die Bitreduktion wird während dieses Abtastblockes von 16 Millisekunden auf dem Pegel durchgeführt, der im Kompandierer 8 auftritt, der auch die Seitenbandinformation, die den Empfänger von der spezifischen Bitzuteilung informiert, multiplext.
  • In Fig. 1 ordnet die dynamische Bitzuteilungsfunktion 11 verfügbare Bit-Bandbreiten für einen gegebenen Zeitblock von 16 Millisekunden einzelnen Frequenzunterbändern normalerweise bei einer Rate von 1 Bit für alle 6 dB des Spitzensignals zu.
  • Ein gegebenes Frequenzunterband mit zweifachem Spitzenwert eines zweiten Unterbandes würde ein Bit mehr als das zweite Unterband erhalten. Ein Band mit vierfacher Spitzenenergie würde zwei Bits mehr als das andere Unterband und so weiter erhalten. Diese ideale Zuordnung kann praktisch nicht erreicht werden, weil eine festgelegte Anzahl von verfügbaren Bit-Bandbreiten nicht genau in dieser Weise unter allen verfügbaren Unterbändern aufgeteilt werden kann. Das ,aktuelle Verfahren führt eine Anfangsbitzuteilung durch, die möglicherweise einige sehr große Zahlen einschließlich negativer Zahlen und Bruchzahlen enthält. Diese werden dann zu ganzen Zahlen gerundet und auf ein Minimum von 0 und ein Maximum von vielleicht 5 Bits begrenzt. Dies ergibt gewöhnlich eine falsche Gesamtzahl von Bits, die für die Zuordnung erforderlich ist, so daß eine iterative Rückverteilung der Bits erforderlich wird. All das ist ein großes Zeit und Hardware verbrauchendes Verfahren, das keine ideale Genauigkeit bereitstellt.
  • Der Abtastwerte-Kompandierer und -Umsetzer 8 verwendet die quantisierte Information der Spitzenenergie, um die zeitliche Wellenform zu kompandieren oder zu normieren. Dann quantisiert er jeden einzelnen Abtastwert in jedem einzelnen Frequenzunterband mit der Anzahl Bits, die durch die Bitzuteilungstechnik für dieses Frequenzunterband zugeordnet sind. Die gesamte Information, die zum Kompandieren und zur Bitzuteilung verwendet wird, wird dem Empfänger oder Demodulator am äußersten Ende des Systems verfügbar gemacht, so daß er die originalen zeitlichen Wellenformen wiederherstellen und sie dem wiederherstellenden Digital/Analogfilter zuführen kann, um das originale 0 bis 4 Kilohertz Eingangssignal anzunähern. Die Empfangsseite wird in Fig. 1 nicht gezeigt, kann aber eindeutig in der oben zitierten IEEE International Conference on Acoustic Speech and Signal Processing, Vol. 1, nachgesehen werden.
  • In diesem Verfahren werden einige Sprachqualitäts-Verschlechterungen stattfinden, weil die verfügbaren Bits, beispielsweise die Bandbreite, die diesem Codierer bei dem Übertragungssystem zugeordnet ist, nicht ausreichend sein können, um genau das Eingangssignal in seiner originalen Form wiederherzustellen.
  • Die Probleme die mit diesem Systemtyp verbunden sind, sind in erster Linie die der Bitzuteilung. Die oben beschriebene Bitzuteilungstechnik versucht die erforderlichen Funktionen anzunähern und ein optimales Signal-Rausch-Verhältnis für eine zulässige festgelegte Anzahl von Bits oder Bandbreite die dem Codierer zur Verfügung steht, zu erreichen. Das erste Problem ist, daß das Signal-Rausch-Verhältnis in jedem Sprachspektrum, aufgrund der festgelegten Anzahl von zugeordneten Bits pro Sekunde, stark beeinträchtigt wird. Flachen Spektren werden sehr wenige Bits in all ihren Unterbändern zugeordnet, während Spektren mit wenigen Abtastwerten viele Bits auf wenige der höheren Energieunterbänder zugeordnet werden und deshalb ein großes Signal-Rausch-Verhältnis, verglichen mit dem niedrigen Signal- Rausch-Verhältnis in den flachen Spektren, liefern werden. Zweitens wurde beobachtet, daß Menschen nicht das Rauschen eines Signals proportional dem Signal-Rausch-Verhältnis wahrnehmen. Zusätzlich hören nicht alle Menschen das Gleiche und hören nicht gemäß irgendwelcher bekannter Gleichungen oder mathematischer Modelle. Die Ausgabequalität eines Sprachcodierers wird üblichlicherweise durch Experten auf ihr subjektives gleichwertiges Signal-Rausch-Verhältnis bewertet, das auf ihrer Einschätzung der wahrgenommenen Qualität der Sprache, so wie sie wiederhergestellt ist, beruht. Gewöhnlich ist ihr geschätztes Signal-Rausch-Verhältnis dramatisch unterschiedlich zu dem aktuellen quantitativen Signal-Rausch-Verhältnis, das vorliegt.
  • Einige Teillösungen wurden zu diesen vorerwähnten Nachteilen angeboten. Eine Bitzuordnung bei einer Rate kleiner als 1 Bit pro 6 dB des Eingangsspitzensignals hat geholfen. Ein nicht linearer Umsetzer hat ebenfalls geholfen. Variable Bitraten-Zuordnungstechniken können helfen, wenn man bestimmen kann, wie die Bitratenzuordnung zu variieren ist. All diese Versuche laufen auf ein Raten, wie Menschen die Qualität von Klang durch Hören tatsächlich wahrnehmen, hinaus. All diese Techniken verwenden einige Formeln, was bequem oder einfach durchzuführen ist, im Gegensatz zu dem, was wirklich benötigt wird.
  • Bekannt ist aus: IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING ICASSP 86, TOKIO, 7. bis 11. April 1986, Vol. 4, Seiten 3079 bis 3082, IEEE, Tokio JP, L. M. LUND- HEIM und andere: "Variable rate coding for speech storage", ein adaptiver Unterbandcodierer, wobei ein Vektor von N Unterbandabtastwerten von einer analytischen Filterbank erzeugt wird. Acht derartige Vektoren bilden infolgedessen einen 15 ms quasi-stationären Block. Für jeden Block werden eine Gesamtleistung at und ein Vektor der normierten Unterbandleistung a berechnet und quantisiert, die jeweils ein 6t und 6 ergeben. Die Unterbandsignale werden durch beide 6t und 6 vor der Quantisierung normiert. Für jeden Block ist eine endliche Anzahl von Bits, die durch die Rate bestimmt werden, für den Umsetzer verfügbar. Ein Bitzuteilungsalgorithmus verteilt dann die Bits unter den Unterbändern auf.
  • Ein adaptiver Bitzuteiler ist auch aus US-A-4,535,472 bekannt, das ein Unterbandcodiersystem offenbart, wobei eine verbesserte Wirkung der Bitzuteilung zu einzelnen Unterbandsignalen aus einer Mehrzahl durch Anwenden einer sogenannten Modellanpassungstechnik realisiert wird.
  • Eine Mehrzahl von höchstwahrscheinlichen Bitzuteilungsmustern und eine entsprechende Mehrzahl von Modellen, die eine Darstellung von einem vorbeschriebenen Merkmal der Unterbandsignale enthalten, was ein entsprechendes Merkmal der Bitzuteilungsmuster erzeugen würde, werden zur späteren Verwendung gespeichert. Die Auswahl eines Bitzuteilungsmusters zur Verwendung beim codieren und/oder decodieren der Unterbandsignalen wird durch Anpassung gemäß eines gegebenen Musters der gespeicherten Modelle zur Darstellung des vorbeschriebenen Merkmals der Unterbandsignale, die gerade codiert werden, beeinflußt.
  • Aufgaben der Erfindung
  • Im Licht der vorangegangenen bekannten Nachteile mit Unterband- Sprachcodierern ist es eine Aufgabe der vorliegenden Erfindung ein verbessertes Verfahren zum Vermindern der gesamten quantisierten Spitzeninformation in eine endliche und teilbare Anzahl von Zuständen, was ausreichend sowohl den Pegel als auch das Spektrum jedes Zeitblocks der Signale darstellt, bereitzustellen und Mittel zum Zuordnen der Bitzuteilung zu den Unterbändern in Übereinstimmung mit einer gewünschten objektiven gesamten Sprachqualitätsausgabe vorzusehen.
  • Noch eine andere Aufgabe der vorliegenden Erfindung ist es, verbesserte Mittel zur Bitzuordnung, die das Verteilungsspektrum des Signalpegels und des Signalenergiepegels für jeden einzelnen Zeitblock nutzen, um auf eine Tabelle von Bitzuordnungen zuzugreifen, die für die gegebene Qualität der Sprachausgabe notwendig sind, bereitzustellen.
  • Außerdem ist eine andere Aufgabe der vorliegenden Erfindung, eine Verwendung von Mehrfach-Bitzuordnungstabellen zuzulassen, um einen Handel mit Bitratenzuordnungen für die gesamt wahrgenommene Sprachqualitätsausgabe zu erlauben, entweder zum Anpassen einer Verminderung in der Bitrate, wenn mehr Benutzer vorhanden sind oder um einen höheren Qualitätsservice für einen oder mehrere Benutzer zur Verfügung zu stellen, gegenüber dem, was anderen für eine gegebene Bitrate bereitgestellt wird.
  • Zusammenfassung der Erfindung
  • Gemäß der Erfindung wird ein Verfahren der Bitzuteilung für kompaktierte Eingangssignal-Abtastdaten in einem Unterband-Sprachcodiersystem bereitgestellt, mit Mittel zum Umwandeln der Eingangssprachsignale in digitale Werte, mit Mitteln zum Abtasten der digitalen Werte, mit Mitteln zum Unterteilen der digitalen Abtastwert in Frequenzunterbänder und mit Mitteln zum Übertragen normierter und/oder kompandierter Werte der Abtastungen zusammen mit codierten Zeichen, welche die verwendete Normierung und Kompaktierung für einen entfernten Empfänger bezeichnen, wobei das Verfahren folgende Schritte umfaßt:
  • - Abtasten der Eingangssignale und Umwandeln der erhaltenen Abtastwerte in digitale Datenabtastwerte,
  • - Unterteilen der Eingangssignale in Zeitblöcke digitaler Datenabtastpwerte,
  • - Messen des Gesamtspitzenenergiepegels der digitalen Signale in jedem Zeitblock digitaler Datensignale,
  • - Messen der einzelnen Unterband-Spitzenenergien in jedem Frequenzunterband der digitalen Datenabtastwerte,
  • - Zuteilen einer Zahl von Bits von jeder der digitalen Datenabtastwerte in dem Zeitblock gemäß der Gesamt- und der Unterband-Spitzenenergiemessungen in dem Zeitblock;
  • Dadurch gekennzeichnet, daß das Zuteilen durch Löschen von Bits gemäß den Zuständen der gemessenen Spitzenenergien erreicht wird durch:
  • - Zugreifen auf eine gespeicherte Tabelle von Werten, welche die Zahl der in jedem digitalen Datenabtastwert des Zeitblocks zu löschenden Bits repräsentiert, wobei das Zugreifen erreicht wird, indem diese Wertetabelle unter Verwendung von Darstellungen der Spitzenenergiemessungen adressiert wird, wobei mehrere Tabellen dieser Werte, die je einem anderen Qualitätspegel entsprechen, enthalten sind und das Verfahren weiterhin den folgenden Schritt aufweist:
  • - Zugreifen lediglich auf eine der Tabellen während eines Zeitblocks, wobei dieses Zugreifen weiterhin gemäß der gewünschten Qualität der Sprachdarstellung erfolgt.
  • Die Lösung der vorhergehenden Nachteile, welche die erwähnten Aufgaben dieser Erfindung erfüllt, kann in ihrer allgemeinsten Form wie folgt fortgesetzt werden. Die gesamte quantisierte Unterbandinformation ist vermindert in eine endliche und teilbare Zahl von Zuständen, was sowohl den absoluten Spitzenenergiepegel als auch die spektrale Energiepegelverteilung innerhalb der Unterbänder während jedes zu bearbeitenden Zeitblocks der Signale ausreichend repräsentiert. Der Energiepegel und die spektrale Verteilung repräsentieren eine gegebene Permutation von Signalzuständen, was also Adressen für die Tabellen-Durchsicht verwendet werden kann. Die Tabellen, auf die zugegriffen wird, enthalten die erforderlichen Bitzuteilungen für jede gewünschte subjektive Sprachqualitätsausgabe. Die Tabellenwerte sind basierend auf subjektiven Experimenten zugeordnet und Mehrfachtabellen können für unterschiedliche Ausführungsqualitäten im Verhältnis zu einem mittleren Bitratendurchsatz bereitgestellt werden. Separate Tabellen können ebenso für Signale, wie derartigen für Modems, die nur einen objektiven Qualitätspegel erfordern, bereitgestellt werden.
  • Die Verfahrens-Taktzeit wurde auf 4 Millisekunden bei einer 8 Kilohertz Abtastrate gewählt, so daß 32 Abtastungen durch das Spaltbandfilter während jeweils 4 Millisekunden erzeugt werden. Vier Signalabtastwerte sind infolgedessen für jedes Unterband verfügbar und 8 Unterbänder werden vorausgesetzt. Der 4 Millisekunden-Zeitblock wurde gewählt, um die Blockbearbeitungsverzögerung zu vermindern und um das Erdumlaufecho bei direkter Telefonunterhaltung zu minimieren. Längere Blöcke vermindern zwar den Gesamtbetrag der erforderlichen Seitenkanal-Bitrateninformation verursachen aber eine größere Echoverzögerung, was wichtiger ist.
  • Eine Bandspitze für einen Zeitblock wird durch Berechnen der Größe der vier Abtastwerte in jedem Unterband bestimmt und durch Auswählen der größten Bandspitze, die während des Blockes in jedem Unterband auftritt. Eine Gesamtblockspitze wird auch durch Auffinden der größten der Bandspitzen in der Gruppe der Abtastungen während des 4 Millisekunden Zeitblocks bestimmt. Die Blockspitze wird quantisiert, um mit einer der zweiunddreißig Pegelstufen zusammenzufallen, jede um 2 dB separiert, beispielsweise wird die gefundene Blockspitze mit einer 32-Pegel Blockspitzen-Energieskala verglichen und die gegebene Spitzenmessung des Blockes wird als einer der Pegel identifiziert. Die Spitzenmessung wird dann codiert als eine 5-Bit- Binärzahl, welches die Zahl des Pegels aus den 32 möglichen Pegeln ist, die als Blockspitze gefunden wurde. Diese 5-Bit- Binärzahl muß in der Seitenkanalinformation zur Übertragung zum Demodulator enthalten sein, um die Gesamtskala der Maximalspitze in diesem Datenblock zu identifizieren.
  • Die Gesamtblockspitze oder der absolute Energiepegel in dem Block wird dann verwendet, um einen Multiplikator oder einen Kompandierungswert wiederaufzufinden, der als Skalierungsfaktor zum Komprimieren aller Abtastwerte aus den verschiedenen Frequenzunterbändern in einen normierten Bereich verwendet wird. Die kompandierten Abtastwerte werden dann in einem linearen 6 Bit Umsetzer quantisiert und werden zeitweise als quantisierte Abtastwerte gespeichert. Die Werte der Abtastwerte sind 64 ganze Zahlen, die von -32 bis +31 reichen und die 0 enthalten. Für viele der Abtastproben sind sechs Bits mehr als benötigt, um die Information darzustellen. Eine Reduktion wird später durchgeführt.
  • Die einzelnen Unterbandspitzenenergien werden ebenso durch die Blockspitzenskala kompandiert, sie werden dann aber linear mit doppelter Auflösung gegenüber den einzelnen Abtastwerten quantisiert. Bandspitzen sind nur positive Zahlen, beispielsweise Größen, so daß lediglich 64 Pegel möglich sind. Dieses sind zugeordnete Pegel von 0 bis 63 mit 63 als größtem Pegel.
  • Wenn man die Natur der binären Zahlen berücksichtigt, ist es offensichtlich, daß Bänder mit Spitzen größer als 31 ein sechstes Datenbit erfordern, um den Pegel darzustellen oder zu beschreiben, bei dem dieser Abtastwert unter die Skala von 0 bis 63 fällt. Derartige Frequenzunterbänder mit Spitzen, deren Pegel von 16 bis 31 reichen, weisen zwei gleiche Bits höherer Ordnung auf und die Unterbandfrequenzspitzen, die in der Größenordnung von 8 bis 15 liegen, weisen drei gleiche Bits höherer Ordnung auf und so weiter. Infolgedessen kann eine Tabelle erstellt werden, um schnell auf der Grundlage der einzelnen gemessenen Bandspitzenenergien zu adressieren, was zeigen wird, wie viele der originalen 6-Bit quantisierten Abtastwertinformationen erhalten bleiben müssen, um all die Originalinformationen, die in den Abtastwerten enthalten sind, zurückzuerhalten. Bandspitzenpegel, die auf den Pegeln 32 bis 63 liegen, erfordern 6 Bits; Bandspitzenpegel zwischen 16 und 31 erfordern 5 Bits der originalen 6 zu bewahrenden Bits, die Pegel 8 bis 15 erfordern 4; die Pegel 4 bis 7 erfordern 3; die Pegel 2 und 3 erfordern 2; der Pegel 1 erfordert nur 1 Bit und der Pegel 0 erfordert keines.
  • Die Benennung der Anzahl der erforderlichen Bits kann durch Nutzung von 3 Bits codiert werden, weil 3 Bits die Zahlen 0 bis 7 darstellen können, was zum Codieren der erforderlichen Bit-Zuordnungen 0 bis 6 mehr als ausreichend ist. Diese Information, die dem Decoder beim Empfänger zuzuleiten ist, ist für den Informationsseitenkanal bestimmt. Mit acht Frequenzseitenbändern, die 3 Bits für jedes Frequenzseitenband zulassen, um den Empfänger darüber zu informieren, wieviele Bits in dem Abtaststrom zugeordnet sein müssen, um die einzelnen Bandspitzenpegel zu codieren, ergeben sich bei 8 Frequenzunterbändern mit jeweils 3 Bits, 24 Bits, die dort im Seitenbandkanal erforderlich werden, um dem Decoder oder Demodulator mitzuteilen, wieviele Bits für jeden Abtastwert in jedem Band erforderlich sind. Dies ist nur ein Hinweis dafür, wo die Bits höherer Ordnung von jedem Abtastwert wegfallen werden.
  • Eine weitere Bitratenreduktion, die von der Qualität abgezogen wird, aber keinen nachteiligen Grad erreichen wird, basiert auf Bitreduktionen, die gleichmäßig auf die Unterbänder angewandt wird und auf Ergebnissen des Energiespektrums und des absoluten Gesamtenergiepegels in der Zeitblockabtastung beruht. Die anzuwendenden Bitratenreduktionen sind in einer Qualitätstabelle, die in größeren Einzelheiten später beschrieben wird, enthalten.
  • Kurze Beschreibung der Zeichnungen
  • Fig. 1 zeigt ein Schema einer Darstellung des Standes der Technik eines Unterbandcodierers der die Bitzuteilungstechnik der vorliegenden Erfindung nutzen kann.
  • Fig. 2 zeigt eine gekürzte Tabelle, die schematisch zeigt, wie das Spektrum der Energiepegel in den einzelnen Unterbändern und der absolute Energiepegel im Gesamtblock der Abtastwerte als Tabellenadressen, um eine Tabelle zu adressieren, genutzt werden kann, wobei die Tabelle Bitzuteilungszustände enthält, die bestimmen, wieviele Bits von jedem Signalabtastwert fallen zu lassen sind.
  • Beschreibung im Einzelnen
  • Wie in der obigen Zusammenfassung vermerkt, kann der Codierer, wie er darin beschrieben wird, eine nahezu transparente Sprachqualität für den Telefondienst liefern. Jedoch wird die erforderliche Bitrate übermäßig hoch und erreicht 50.000 Bits/s während der Freizeiten (Leerlaufzeiten). Um diese erforderliche Bitrate mit geringen Sprachqualitätseinbußen zu reduzieren, ist es möglich, das achte Unterband vollständig fallen zu lassen. Jedoch wird es in der gegenwärtigen Ausführung aufbewahrt; denn es könnte erforderlich sein, um internationale Anforderungen zu erfüllen. Weitere Bitratenreduktionen können jedoch auf der Grundlage des Gesamtspektrums und Energiepegels des einzelnen Abtastblockes durchgeführt werden, was im folgenden beschrieben wird.
  • Wie bis hierher beschrieben, hat der Sprachcodierer innerhalb eines Blockes acht Unterbänder in Bezug auf die Frequenz, jedes mit zwischen 0 und 6 ihm zugeordneten Datenbits, um den Blockspitzenpegel zu beschreiben, der im Bereich von 0 bis 31 liegt, was mit 5 binären Bits codiert werden kann. In der meisten Zeit, während einer normalen Sprachunterhaltung, sind viel mehr Bits in den Abtastwerten vorhanden, als wirklich notwendig sind, um sogar eine sehr hohe vorhandene Qualität beizubehalten. In den meisten Fällen können einige der Bits fallengelassen werden, insbesondere die Bits mit niedriger Ordnung, die nur kleine analoge Ausgangsvariationen darstellen, wenn das digitale Signal rekonstruiert wird. Die Bits niedriger Ordnung oder zumindest einige Bits niedriger Ordnung können fallengelassen werden, während weiterhin der allgemeine hohe Gesamtqualitätspegel der Sprachrekonstruktion beibehalten bleibt. Die Bedingungen, unter denen diese Bits fallengelassen werden können, können durch die Seitenkanalinformation erkannt werden, beispielsweise durch das Blockspitzenmaximum und durch die einzelne Spektralverteilung der Seitenbandspitzen, welche die Verteilung der Energie über dem Spektrum in dem Abtastwert zeigt.
  • Eine Tabelle kann mit einer einzigen Adresse für jede der Seitenkanal-Zustandskombinationen konstruiert werden, mit Einträgen in die Tabelle, die auf einer subjektiven Basis, die durch die Qualität einer akzeptablen gewünschten Ausgangs-Sprachrekonstruktion gesetzt wird, willkürlich aufgestellt sind. Die Tabellen-Eintragungen enthalten eine Anzahl von Bits, die in jeder Zustandsbedingung fallenzulassen sind. Die volle Anzahl von Adressen würde 26 Millionen übersteigen, selbst wenn das achte Unterband weggelassen wird. Allein mit sieben Unterbändern und mit bis zu sechs Bits, die in jedem Unterband erforderlich sind, um den Energiepegel zu identifizieren, sind 832.542 Kombinationen in den Verteilungen des Unterband-Energiespektrums bei sieben Frequenzunterbändern möglich. Mit einem Gesamtspektrum des Energiepegels in dem Block von 32 möglichen Energiepegeln würde die gesamte Tabellengröße 26.353.344 Positionen umfassen. Eine derartige Tabelle von Eintragungen wäre schwerfällig, um wenigstens das zu sagen, und deshalb wurde eine Anzahl von Schritten unternommen, um die Anzahl der Eintragungen auf 148 mögliche Kombinationen für die gegenwärtige Ausführung zu reduzieren.
  • Die Tabelle kann durch Kombinieren oder Gruppieren einiger Frequenzunterbänder gekürzt werden. Acht oder sieben Unterbänder sind mehr als eine ausreichende Zahl, um eine gute Anzeige der Gesamtcharakteristik der Sprache bereitzustellen. Deshalb werden, um die Größe der Tabelle und das folgende Adressierungsproblem zu reduzieren, die acht Unterbänder in drei Unterbandgruppen gruppiert, die dem gut bekannten Artikulationsindex ein wenig folgen. Die Bandgruppe 0 wird die Frequenzunterbänder 0 und 1 enthalten. Die Bandgruppe 2 wird die Frequenzunterbänder 2 und 3- enthalten und die Bandgruppe 3 wird die verbleibenden Unterbänder 4, 5, 6 und 7 enthalten. Jeder Bandgruppe wird der Wert der größten Bitzuteilung in seinen enthaltenen Bändern zugewiesen.
  • Eine weitere Reduktion in der Größe der Tabelle kann durch Reduzieren der Zahl der Pegel oder Bits, die in jeder Bandgruppe zuzuteilen sind, erreicht werden. Die Anfangspegel sind 0 bis 6. Diese können unterschiedlich durch Gruppieren dargestellt werden, wobei jeder beliebige der ursprünglichen Pegel 0, 1 und 2, als neuer Pegel 0 bezeichnet werden kann. Die ursprünglichen Pegel 3 und 4 können als 1 dargestellt werden, der originale Pegel 5 kann als 2 dargestellt werden und der originale Pegel 6 wird durch die 3 dargestellt. Bis zu diesem Zeitpunkt sind keine Bitzuteilungen neu festgesetzt worden, sondern lediglich das Gruppieren der Information in gröbere Segmente ist durchgeführt worden, um die Zahl der Zustände, die in der Tabelle zu adressieren sind, zu reduzieren.
  • Diese Reduktionen haben eine Situation mit sich gebracht und erzeugt, in der lediglich drei Bandgruppen existieren und jede nur vier mögliche Pegel aufweist. Angenommen, daß alle Kombinationen möglich sind, bestehen dort immer noch 64 Zustände oder Permutationen dieser Information. Lediglich 37 Zustände würden zu verwenden sein, wenn angenommen wird, daß zumindest einer Bandgruppe 6 Bits mit ihrem zugeordneten Pegel 3 zugeteilt sind. Bei sehr niedrigen Energiepegeln ist es möglich, daß kein Unterband alle 6 zugeordneten Bits aufweist, weil der Signalpegel unter den Kompandierungspegel gefallen ist. In diesem Fall ist die Genauigkeit nicht sehr kritisch, so daß angenommen wird, daß der Pegel in der Bandgruppe 2 auf einem Pegel 3 ist, um auf diese Weise die Verwendung von lediglich 37 Permutationen von den ursprünglich 64 oben erwähnten aufrechtzuerhalten. Diese 37 Zustände können als Tabellenadressen, die auf Spektren basieren, genutzt werden, weil sie in einer verdichteten Form eine Zuordnung der Verteilung der Spitzenpegel unter den ursprünglichen sieben oder acht Frequenzunterbändern darstellen, beispielsweise dem Energiespektrum in den ursprünglichen Blockabtastwerten.
  • Eine Qualitätstabelle, die auf der Nutzung dieser 37 Zustände als Spektrenadressen aufgebaut ist, hat eine begrenzte Größe und ist wichtig, weil das menschliche Hören auf der spektralen Energieverteilung in dem wahrgenommenen Signal beruht. Trotzdem verbleiben dort 32 mögliche Pegel für die Blockspitze. Wenn all diese Pegel gespeichert würden, hätte man 37 mal 32 Adressen in jeder Qualitätstabelle bei einer Gesamtzahl von 1184 Adressen. Der Pegel ist in dem subjektiven menschlichen Sprachqualitätsempfinden lediglich bis zu einem gewissen Grade bedeutsam, so wie das menschliche Hören einen begrenzten Bereich aufweist. Das bedeutet, daß das Wahrnehmen einer Verzerrung bei niedrigeren Klangpegeln geringer ist. In der vorliegenden spezifischen Ausführung können die 32 Pegel in lediglich 4 allgemeine Bereiche unterteilt werden. Diese können subjektiv durch eine Pegeltabelle ausgewählt werden. Wird das am wenigsten signifikante Bit der 5-Bit Blockspitze fallengelassen, vermindert dies den Bereich auf nur 16 Pegel mit einer 4 dB Teilung. Die verbleibende 4-Bit Binärzahl kann als eine Adresse für eine 16- Adressentabelle verwendet werden, die lediglich die Zahlen 0, 37, 74, und 111 enthält.
  • Um die vollständige Adresse zu erhalten, wird eine Pegeladresse unter Verwendung der gemessenen Blockspitze festgestellt, beispielsweise hat die 5-Bit-Blockspitze mit ihrem am wenigsten signifikanten fallengelassenen Bit eine 4-Bit-Zahl, die mit einer der vier oben erwähnten Bereiche korreliert werden kann. Dieser Teil der Adresse plus der spektralen Adresse, die wie vorher gezeigt, erzeugt wurde, kann der Einsprungadressenzeiger für die Qualitätstabellen sein. Die Qualitätstabelle selbst weist dann 37 · 4 insgesamt gespeicherte Werte oder 148 Adressenpositionen auf. Die Qualitätstabelle wird einen Wert enthalten, der die Anzahl der Bits, die von jedem Abtastwert, der tatsächlich von der Filterbank kommt, fallenzulassen sind, darstellt. Die Anzahl der Bits, die fallenzulassen sind, ist idealerweise durch bevorzugtes Testen mit einer Gruppe von Menschen gekennzeichnet. Bei jeder Adresse oder ausgesuchten Gruppe von Adressen kann die fallenzulassende Bitzahl, dadurch, daß Menschen den codierten gesprochenen Sätzen zuhören, unter Verwendung der Technik dieser Erfindung, variieren. Alternativ kann jede Adresse 8 einzelne fallenzulassende Bitzahlen freihalten, wobei jede mit jedem der 8 Unterbänder korrespondiert. Durch Vergleich der subjektiven Meinungen der Zuhörer kann jede gegebene Adresse die fallenzulassenden Bits maximieren, während ein gewünschter Qualitätspegel aufrechterhalten wird. Vielfach-Tabellen von 148 Adressen können leicht erzeugt werden, wobei jede einen unterschiedlichen Qualitätspegel aufweist. Vier Qualitätstabellen sind eine ausreichende Anzahl, um einen sinnvollen Bereich hoher Transparenz abzudecken, in der keine Verzerrungen wahrnehmbar sind, bei einer minimalen akzeptablen Qualität, die lediglich eine minimale Bitrate erfordert.
  • In dieser Weise stellt die Qualitätstabelle eine Lösung für das komplexe Problem dar, wie ein menschlicher Gehörnerv und ein menschliches Gehirn zusammenwirken, um eine subjektive Bewertung der codierten Ausführung der Sprache durch einen Zuhörer zu definieren. Bisherige Lösungen basierten auf Definitionen, die einige festgelegte Gleichungen verwendeten, um ein paar Parameter einschließlich dem Signal/Rauschverhältnis zu optimieren. Anstatt eine vereinfachende festgelegte Gleichung anzunehmen, erlaubt der Qualitätstabellen-Ansatz einer großen Gruppe von Zuhörern festzulegen, wie Bits von Sprachblöcken zu entfernen sind, um die subjektiven Wünsche der Sprachqualität in der Gruppe zu optimieren. Die Qualitätstabelle ist deshalb ein statistisch definierter Sprachcodierer und die Definition für die bereitgestellte Auflösung basiert auf den subjektiven Ergebnissen einer großen Menge von Zuhörern, die den Vorzug zwischen zwei unterschiedlichen Qualitätstabellen auswählen.
  • Fig. 2 stellt schematisch die Tabellennäherung dar und zeigt, wie sie bei all den möglichen Kombinationen, die sich aus 7 Unterbändern im Bereich von 0 bis 3500 Hertz ergeben, gekürzt werden kann, die verbleibenden Kombinationen von 3.500 bis 4.000 sind in diesem Beispiel und damit 32 absolute Blockspitzen-Energiepegel, fallengelassen. Jede Tabelle wird durch die 7 Unterband-Energiepegelzahlen, die in der Unterband-Spitzenenergie- Bestimmungsphase festgestellt wurden, adressiert. Den anderen Eintrag bildet der gesamte absulute Energiepegel, der innerhalb eines der 32 vorher bestimmten Pegel liegt.
  • Die gesamte Tabelle kann bei Beachtung der folgenden Regeln auf eine Tabelle von 148 Positionen verdichtet werden. Schritt l: das Maximum der Unterband-Zahl 0 und 1 wird Bandgruppe 0 benannt. Der Maximalwert der Unterbandspitzen-Zahlen in Unterband 2 und 3 wird Bandgruppe 1 genannt. Das Maximum der Bandzahlen 4, 5 und 6 wird als Bandgruppe 2 bezeichnet. Die groben Gruppierungen, wie oben erwähnt, sind in dieser Tabelle durchgeführt, die eine unbearbeitete spektrale Verteilung wie folgt für die Spitzenenergiepegel in den Unterbändern angeben. Energiespitzen mögen als 4, 6, 2, 1, 3, 1 und 0 für die Energie der Unterbänder 0 bis 6 dargestellt sein und der absolute Blockspitzen Energiepegel mag 4 Dezimalen oder in Binärzahlen 00100 sein. Unter der Annahme der Regel der Gruppierung von gemeinsamen Unterbändern existieren für jede Bandgruppe vier willkürliche Zustände A, B, C oder D und sind wie folgt zugeordnet. Zustand A, falls die Bandgruppe 0 die 0, 1 oder 2 aufweist; Zustand B, falls die Bandgruppe 0, die 3 oder 4 aufweist; Zustand C, falls der Pegel der Bandgruppe 0 die 5 ist und Zustand D wenn der Pegel der Bandgruppe 0 die 6 ist. Das Gleiche trifft für die anderen Bandgruppen 1 oder 2 zu. Es wird daran erinnert, daß Bandgruppe 0 die Messungen von den Energie-Unterbandspitzen 0 und 1 umfaßt, daß Bandgruppe 1 die Energiespitzen der Frequenzunterbänder 2 und 3 umfaßt und daß Bandgruppe 2 die Energiespitzen der Frequenzunterbänder 4, 5 und 6 umfaßt.
  • Der absolute Energiepegel kann folglich mehrere unterschiedliche Zustände besetzen, die zu 4 Zuständen - anstelle von 32 - durch das Gruppieren wie vorher ausgeführt reduziert werden. Werte des absoluten Energiepegels von 0 bis 7 werden dem Zustand A zugeordnet. Der Zustand B umfaßt den Pegel 8 bis 15; Zustand C umfaßt die absoluten Energiepegel von 16 bis 23 und Zustand D umfaßt die Energiepegel 24 bis 31.
  • Zurückkehrend zu dem oben begonnenen Beispiel, bei dem eine unbearbeitete Spektrumsverteilung von 4, 6, 2, 1, 3, 1, 0 mit einem absoluten Spitzenenergiepegel in dem Block als 4 gefunden wurde, wird dann der einzige Energiezustand, der in der Tabelle definiert wird, sein: Bandgruppe 0, welches das Maximum von 4 und 6 ist, wird gleich 6 sein und mit Zustand D korrespondieren. Bandgruppe 1, die ein Maximum von 2 und 1 ist, wird 2 sein, was mit dem Zustand A korrespondiert. Bandgruppe 2, die das Maximum von 3, 1 und 0 ist, wird 3 sein, was mit dem Zustand B korrespondiert. Der absolute Energiepegel, der 4 ist, korrespondiert mit Zustand A. Infolgedessen wird die endgültige Position innerhalb der Tabelle durch die Koordinaten DABA definiert. Es ist zu beachten, daß zahlreiche spektrale Bandzahl-Permutationen und zahlreiche Energiepegel-Permutationen deshalb innerhalb einer Einzelregion in der Tabelle zusammen gruppiert werden und jede spezifische Eintragung, die auf einer Permutation von den sieben Spitzenenergiepegel-Messungen des Unterbands und der absoluten Energiepegel-Messung in jedem Gesamtblock beruht, in einen gegebenen Bereich fallen wird und derselbe Wert innerhalb der Tabelle gegeben wird. Der Inhalt in den adressierten Teilen der Tabelle wird eine willkürliche Anzahl von Bits sein, wie 0, l, 2 oder 3, die von den zu übertragenden Abtastwerten fallenzulassen sind.
  • Für die höchste Sprachübertragungsqualität werden die Tabellenzeichen für hohe Qualität auf vielen Positionen mit 0 Inhalt geladen sein und anzeigen, daß keine Bits von den Abtastwerten, unter der Annahme, daß die ursprünglichen Signalabtastwerte die üblichen 16 Bit mit 2 komplementären Abtastwerten sind, fallenzulassen sind. Für jede der vier Signalabtastwerte in jedem der Frequenzunterbänder ist es möglich, größtenteils die gesamte Übertragungskanalbelegung durch Fallenlassen der am wenigsten signifikanten Bits zu vermindern und dem Empfänger anzuzeigen, wieviele der am wenigsten signifikanten Bits von jedem Abtastwert während einer gegebenen Übertragungszeitspanne des Blocks fallengelassen wurden. Zwei oder drei Bits, die von jedem Abtastwert fallengelassen wurden, können wenige oder keine bemerkbaren Verzerrungen des am Ende empfangenen und rekonstruierten Signals erzeugen, aber das Löschen einer der Bits von hoher Ordnung wird ernsthafte Verzerrungen erzeugen. Der Pegel der Verzerrung, der noch akzeptabel ist, ist ein subjektives Kriterium, das auf der Akzeptanz des gesamten von Menschen wahrgenommenen Signals beruht. Eine typische Qualitätstabelle von minimaler akzeptabler Auflösung erfordert die Löschung von 0 bis 6 Bits aus jedem Abtastwert, während die höchstmögliche Qualitätstabelle eine 0-Bit Löschung von jedem Abtastwert diktiert.
  • Es ist ersichtlich, daß Qualitätstabellen für jeden Bereich möglicher Qualität erstellt werden können, vom höchsten bis zum niedrigsten akzeptierbaren Qualitätspegel. Es ist genauso klar, daß Verfahren auf einer speziellen Sprachleitung für einen speziellen Benutzer festgelegt werden können, die von einem hohen Qualitätsgrad für vorrangige Unterhaltungen begleitet werden, aber lediglich einen objektiv sehr niedrigen Qualitätsgrad auf der gleichen Leitung für Maschinen, wie für ein Modem, bereitstellen. Der einzige Unterschied in der Konstruktion wird sein, daß unterschiedliche Qualitätstabellen-Ausführungen benutzt werden, die von der Art der Eingabe abhängen. Ein Benutzer, der einen solchen Dienst zu erwerben wünscht, kann sich über solch ein Kommunikationssystem für hohe Qualität, für eine Übertragung mit einem hohen Signal-Rausch-Verhältnis entscheiden und wird einer Ausführung einer Qualitätstabelle zugeordnet mit geringer oder keiner Bit-Löschung zu einem relativ höheren Preis, weil beim Versorgen mit einem hohem Qualitätsservice anteilig mehr der gesamten Kanalbandbreite gebraucht wird und die daraus folgende Anzahl von Bits, die zum Erzeugen der hohen Qualität erforderlich ist, wird mehr von dem Kanal belegen. In ähnlicher Weise kann der Benutzer einen weniger teuren oder weniger anteiligen Betrag der Kanalbandbreite für den Gebrauch eines Modems verlangen. Das Gebiet möglicher Dienste und Qualitäten daraus ist tatsächlich unbegrenzt, wenn jemand die ganze mögliche Breite bedenkt, den diese Qualitätstabellen bieten.
  • Ein üblicheres Szenarium ist,, daß das System, wie es in Fig. 1 gezeigt wird, den höchsten Qualitätservice für alle Benutzer durchführt, in Übereinstimmung mit der gesamten Nachfrage, die an das System durch die Anzahl der vorhandenen Benutzer, die durch die dem System verfügbare Bandbreite gegeben ist, gestellt wird. Wird entweder die Kanalbandbreite begrenzt oder vermindert oder die Anzahl der Benutzer erhöht, kann leicht ein Ausweichen auf niedrigere Übertragungsqualitätstabellen, beispielsweise eine Zuweisung von weniger Bits für jeden Benutzer, durch Umschalten auf eine unterschiedliche Sprachqualitätstabelle für den nächsten oder einen beliebigen der nachfolgenden Abtastblöcke angepaßt werden, bis entweder die Benutzer-Nachfrage sinkt oder die Kanalkapazität erhöht wird.
  • Beispiele für Qualitätstabellen werden empirisch, wie oben beschrieben, festgelegt. Zwei Beispiele, eines für einen moderaten Qualitätsgrad und eines für einen niedrigen Qualitätsgrad folgen. Es werden wie vorher festgesetzt Spektrumadressen erzeugt, um einen von 37 möglichen Zuständen zu erstellen. Eine einfache Regel zur Adressenerstellung ist: wenn Bandgruppe 0 einen Bandgruppenpegelwert von weniger als 3 aufweist und Bandgruppe l einen Pegelwert von weniger als 3 hat, dann ist die Spektrumsadresse der dreifache Pegel der Bandgruppe 0 plus dem Pegel der Bandgruppe 1, was Spektrumsadressen 0 bis 8 generiert. Wenn Bandgruppe 0 einen Pegel von weniger als 3 hat und Bandgruppe 1 einen Pegel 3 aufweist, dann ist die Spektrumsadresse der vierfache Pegel der Bandgruppe 0 plus dem Pegel der Bandgruppe 2 plus 9, was Spektrumsadressen von 9 bis 20 generiert. Und falls der Pegel der Bandgruppe 0 gleich 3 ist, dann wird die Spektrumsadresse der vierfache Pegel der Bandgruppe 1 plus dem Pegel der Bandgruppe 2 plus 21 sein, was die Spektrumsadressen von 21 bis 36 generiert.
  • Der andere Eintrag in die Tabelle stammt aus den 32 möglichen Pegeln der Blockspitze. Die 32 Pegel werden auf vier Bereiche durch Fallenlassen des am wenigsten signifikanten Bits von den 5 Bits des Blockspitzenpegels verdichtet, was seinen Bereich auf lediglich 16 Pegel mit einem 4 dB Abstand zwischen jedem reduziert. Die verbleibenden 4-Bit Zahlen werden genutzt, um eine 16 Adressentabelle zu adressieren, die lediglich die Zahlen 0, 37, 74 und Ill, wie vorher beschrieben, enthält. Die aktuelle Ausdehnung zwischen den Unterteilungspunkten in der Tabelle zwischen den Werten 0, 37, 74 und 111 wird empirisch festgelegt, durch Wahrnehmenlassen des Ergebnisses von den Benutzern und Auswählenlassen der am besten wahrgenommenen Qualität. Es kann jedoch beobachtet werden, daß mit hohen Energiepegeln die insgesamt wahrgenommene Qualität größtenteils eine Angelegenheit der Signal/Rauschverzerrungen ist und daß bei sehr niedrigen Pegeln das Signal-Rausch-Verhältnis im Qualitätsempfinden der Sprache nicht sehr wichtig ist. Deshalb würde ein gleichmäßiges Teilen der vier möglichen Bereiche unter den Möglichkeiten den sehr niedrigen Signalpegeln einen höheren Qualitätsgrad, als nötig ist, zuordnen. Folglich sind in dem gegebenen Beispiel nur zwei von den 16 möglichen Adressen den niedrigsten Energiezuständen zugeordnet, drei den nächst niedrigeren, fünf den folgenden und sechs der letzten oder höchsten Stufe der Energiepegel. In dem speziellen Ausführungsbeispiel, das hiermit vorgeschlagen wird, sind deshalb anstelle der Nutzung der ganzen 32 Pegel, die für den absoluten Spitzenenergiepegel möglich sind, die 32 Pegel in lediglich 4 Bereiche geteilt und die Bereiche, in die eine gegebene absolute Energiepegel-Messung fällt, bestimmen einen Bereich von Tabellenwerten, auf den zuzugreifen ist.
  • Als ein Überblick über das gesamte Codierverfahren ergeben sich die folgenden Schritte. Zuerst werden die eingehenden Signalabtastwerte in Blöcke geteilt. In unserem Beispiel sind alle Abtastwerte, die innerhalb einer Zeitspanne von 4 Millisekunden auftreten, ein Block. Die Spitze innerhalb des Blocks, beispielweise die Spitzengröße von allen 32 Signalabtastwerten in den 8 Unterbändern mit 4 Signalabtastungen pro Unterband, wird gefunden. Zweiunddreißig logarithmisch geordnete Segmente werden für die Größe der Blockspitze festgelegt. Das Segment, in dem die gegebene Blockspitze gefunden wird, wird als 5-Bit-Binärzahl codiert, die das Segment unter den 32 darstellt, in dem sie gefunden wurde. Als nächstes wird ein Signalabtast-Bereich gefunden, der innerhalb des oberen Bereichs des Blockspitzen-Segmentes, das für die gegebene Blockspitze identifiziert wurde, liegt. Vierundsechzig lineare Untersegmente werden für den Bereich, in dem die Blockspitze liegt, definiert und dann wird ein spezifisches Untersegment, in dem ein gegebener Signalabtastwert liegt, durch eine 6-Bit-Binärzahl, dargestellt im Zweierkomplement zur Identifizierung, innerhalb des Bereichs der Spitze, deren Pegel durch einen spezifischen Signalabtastwert besetzt ist, definiert. Die einzelne Frequenzunterband- Spitzengröße für jedes Unterband wird gefunden und wird dargestellt als ein spezifisches Untersegment der 64 möglichen Werte durch ihre 6-Bit-Binärzahl, dargestellt im Zweierkomplement. Die Seitenkanalinformation, die festgelegte 29 Bits mit dem folgenden Format aufweist, wird dann übertragen:
  • Fünf binäre Bits (um die gesamten Blockspitzen-Segmentzahlen innerhalb von 32 möglichen Segmenten zu codieren) gefolgt von drei Bits für jedes der acht Frequenzunterbänder (24 Bits/binäre Gesamtsumme), die das Segment innerhalb der 64 möglichen Segmente des identifizierten Block-Spitzenpegel-Segments, in dem die einzelne Frequenzunterbandspitze gefunden wurde, anzeigen. Wie oben festgestellt, werden nur 3 binäre Bits gebraucht, um zu identifizieren, wieviele der 6 möglichen Bits erforderlich sind, um die Spitze in jedem Frequenzunterband darzustellen. Das bedeutet, daß 0 bis 6 Bits erforderlich sein können, um den Pegel im Binärcode unter den 64 möglichen Pegeln, der von dem gegebenen Unterband-Spitzenabtastwert besetzt ist, zu codieren, daß aber nur 3 Bits im Binärcode erforderlich sind, um an den Empfänger zu übertragen, welche Zahl von 0 bis 6 Bits der Spitze innerhalb des Unterbandes zugeordnet wurde.
  • Der Übertragung der Seitenkanalinformation in dem oben angegebenen Format folgend, wird die Hauptkanalinformation übertragen, beispielsweise die einzelnen Signalabtastwerte (alle 32 von ihnen). Die Anzahl der Bits, die gebraucht werden, um jeden Abtastwert darzustellen, wird gemäß dem gefundenen Wert in der gemäß dieser Erfindung benutzten Tabelle gekürzt. In grober Vereinfachung wird, wenn die minimal akzeptable Qualität erreicht ist, festgelegt, daß jeder der Signalabtastwerte seine X-niedrigsten Bits fallenlassen muß, wobei X der in der Tabelle, die mit der niedrigsten akzeptablen Service-Qualität assoziiert ist, gefundene Wert ist. Tatsächlich wird die Anzahl der fallengelassenen Bits alle 4 Millisekunden unterschiedlich sein. Die verschiedenen Qualitäten resultieren einfacherweise aus unterschiedlichen Zahlen von fallengelassenen Bits.
  • Das gesamte Verfahren wird für den nächsten Signalblock an Abtastwerten von 4 Millisekunden wiederholt, was schließlich verständlich ist.

Claims (3)

1. Verfahren zur Bitaufteilung für verdichtete Eingangssignal- Abtastdaten in einem Unterband-Sprachcodiersystem mit Mitteln (2) zum Umwandeln des Eingangssprachsingals in digitale Werte, mit Mitteln (4) zum Abtasten der digitalen Werte, mit Mitteln (5) zum Unterteilen der digitalen Abtastwerte in Frequenzunterbänder und mit Mitteln (13) zum Übertragen normalisierter und/oder kompandierter Werte dieser Abtastungen zusammen mit codierten Zeichen, welche die verwendete Normierung und Kompaktierung bezeichnen, an einen entfernten Empfänger, und das Verfahren die folgenden Schritte enthält:
- Abtasten der Eingangssignale und Umwandeln der erhaltenen Abtastwerte in digitale Datenabtastproben,
- Unterteilen der Eingangssignale in Zeitblöcke digitaler Datenabtastproben,
- Messen des Gesamtenergiespitzenpegels der digitalen Signale in jedem Zeitblock digitaler Datensignale
- Messen der einzelnen Unterband-Spitzenenergien in jedem Frequenzband der digitalen Datenabtastproben,
- Aufteilen einer Zahl von Bits aus jeder der digitalen Datenabtastproben in dem Zeitblock in Einklang mit dem Zustand der Gesamt- und der Unterband-Spitzenenergiemessungen in dem Zeitblock, dadurch gekennzeichnet, daß das Aufteilen durch Tilgen von Bits in Einklang mit den Zuständen der gemessenen Spitzenenergien durchgeführt und zustandegebracht wird durch:
- Zugreifen auf eine abgespeicherte Tabelle von Werten, welche die Zahl der in jeder digitalen Datenabtastprobe des Zeitblocks zu tilgender Bits repräsentiert, wobei das Zugreifen durchgeführt wird, indem diese Wertetabelle unter Verwendung von Darstellungen der Spitzenenergiemessungen adressiert wird, wobei mehrere Tabellen dieser Werte, die je einem anderen Qualitätspegel entsprechen, aufgenommen sind und das Verfahren weiters den folgenden Schritt aufweist:
- Zugreifen lediglich auf eine der Tabellen während eines Zeitblocks, wobei dieses Zugreifen weiters entsprechend der gewünschten Qualität der Sprachdarstellung erfolgt.
2. Verfahren zur Bitaufteilung für verdichtete Eingangssignal- Abtastdaten in einem Unterband-Sprachcodiersystem mit Mitteln (2) zum Umwandeln des Eingangssprachsignals in digitale Werte, mit Mitteln (4) zum Abtasten der digitalen Werte, mit Mitteln (5) zum Unterteilen der digitalen Abtastwerte in Frequenzunterbänder und mit Mitteln (13) zum Übertragen normalisierter und/oder kompandierter Werte dieser Abtastungen zusammen mit codierten Zeichen, welche die verwendete Normierung und Kompaktierung bezeichnen, an einen entfernten Empfänger, und das Verfahren die folgenden Schritte enthält:
- Abtasten der Eingangssignale und Umwandeln der erhaltenen Abtastwerte in digitale Datenabtastproben,
- Unterteilen der Eingangssignale in Zeitblöcke digitaler Datenabtastproben,
- Messen des Gesamtenergiespitzenpegels der digitalen Signale in jedem Zeitblock digitaler Datensignale
- Messen der einzelnen Unterband-Spitzenenergien in jedem Frequenzunterband der digitalen Datenabtastproben,
- Aufteilen einer Zahl von Bits aus jeder der digitalen Datenabtastproben in dem Zeitblock in Einklang mit dem Zustand der Gesamt- und Unterband-Spitzenenergiemessung in dem Zeitblock, dadurch gekennzeichnet, daß das Aufteilen durch Tilgen von Bits in Einklang mit den, Zuständen der gemessenen Spitzenenergien durchgeführt und zustandegebracht wird durch:
- Zugreifen auf eine abgespeicherte Tabelle von Werten, welche die Zahl der in jeder digitalen Datenabtastprobe des Zeitblocks zu tilgender Bits repräsentiert, wobei das Zugreifen durchgeführt wird, indem diese Wertetabelle unter Verwendung von Darstellungen der Spitzenenergiemessungen adressiert wird, wobei mehrere Tabellen dieser Werte, die je einem anderen Qualitätspegel entsprechen, aufgenommen sind und das Verfahren weiters einen folgenden Schritt aufweist:
- Zugreifen lediglich auf eine der Tabellen während eines Zeitblocks, wobei dieses Zugreifen weiters entsprechend der zur Verfügung stehenden Bitbandbreite und den gesamten Datenverkehrsanforderungen in dem System erfolgt.
3. Unterband-Sprachcodiersystem mit Mitteln (2) zum Umwandeln des Eingangssprachsignals in digitale Werte, mit Mitteln (4) zum Abtasten der digitalen Werte, mit Mitteln (5) zum Unterteilen der digitalen Abtastwerte in Frequenzunterbänder und mit Mitteln (13) zum Übertragen normalisierter und/oder kompandierter Werte dieser Abtastungen zusammen mit codierten Zeichen, welche die bei diesen Abtastungen verwendete Normierung und Kompaktierung bezeichnen, dadurch gekennzeichnet, daß es besitzt:
- Mittel (6) zum Unterteilen der digitalen Abtastsignale in Zeitblöcke, die je eine gleiche Zahl von Abtastproben enthalten,
- Mittel zum Messen des gesamten Spitzenenergieabtastwertes, der in jedem Zeitblock digitaler Datensignale auftritt,
- Mittel (9) zum Messen der einzelnen Frequenzunterband- Spitzenenergien in jedem Zeitblock der digitalen Datenabtastproben,
- Mittel (11) zum Aufteilen einer Zahl von Bits aus jeder der digitalen Datenabtastproben in dem Zeitblock in Einklang mit dem Zustand der Gesamt- und der Unterband-Spitzenenergiemessungen in dem Zeitblock, dadurch gekennzeichnet, daß die Mittel zum Aufteilen Mittel (11) enthalten, um in jeder digitalen Datenabtastprobe Bits zu tilgen, mit einer Mehrzahl abgespeicherter Tabellen von Werten, welche die Zahl der zu tilgenden Bits repräsentieren, wobei diese Werte in den Tabellen in Einklang mit den Zuständen der Spitzenenergiemessungen angeordnet sind, wobei jede dieser Tabellen einem unterschiedlichen Qualitätspegel entspricht, und daß Mittel vorgesehen sind, um lediglich eine der gespeicherten Tabellen von Werten während der Übertragung eines gegebenen Zeitblocks von Datenabtastproben auszuwählen, wobei diese Auswahl in Einklang mit dem gewünschten Maß an Genauigkeit der Darstellung des analogen Sprachsignals durchgeführt wird.
DE8787109393T 1986-08-25 1987-06-30 Tabellengesteuerte dynamische bitverteilung in einem teilband-sprachkodierer mit veraenderlicher datenrate. Expired - Fee Related DE3784120T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US06/900,113 US4899384A (en) 1986-08-25 1986-08-25 Table controlled dynamic bit allocation in a variable rate sub-band speech coder

Publications (2)

Publication Number Publication Date
DE3784120D1 DE3784120D1 (de) 1993-03-25
DE3784120T2 true DE3784120T2 (de) 1993-08-12

Family

ID=25411991

Family Applications (1)

Application Number Title Priority Date Filing Date
DE8787109393T Expired - Fee Related DE3784120T2 (de) 1986-08-25 1987-06-30 Tabellengesteuerte dynamische bitverteilung in einem teilband-sprachkodierer mit veraenderlicher datenrate.

Country Status (4)

Country Link
US (1) US4899384A (de)
EP (1) EP0259553B1 (de)
JP (1) JPS6358500A (de)
DE (1) DE3784120T2 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19727938B4 (de) * 1997-07-01 2006-12-14 Mayah Communications Gmbh Verfahren und Vorrichtung zum Codieren von Signalen
DE19638997B4 (de) * 1995-09-22 2009-12-10 Samsung Electronics Co., Ltd., Suwon Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742735A (en) * 1987-10-06 1998-04-21 Fraunhofer Gesellschaft Zur Forderung Der Angewanten Forschung E.V. Digital adaptive transformation coding method
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
CA2032765C (en) * 1989-12-21 1995-12-12 Hidetaka Yoshikawa Variable rate encoding and communicating apparatus
DE69132427D1 (de) * 1990-07-05 2000-11-02 Fujitsu Ltd Digitalmultiplex-Übertragungssystem
JP2833212B2 (ja) * 1990-11-29 1998-12-09 松下電器産業株式会社 帯域分割符号化のビット割当方法
DE69233397T2 (de) * 1991-06-11 2005-08-11 Qualcomm, Inc., San Diego Vorrichtung und Methode zur Maskierung von Fehlern in Datenrahmen
US5369724A (en) * 1992-01-17 1994-11-29 Massachusetts Institute Of Technology Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients
US5394508A (en) * 1992-01-17 1995-02-28 Massachusetts Institute Of Technology Method and apparatus for encoding decoding and compression of audio-type data
TW235392B (de) * 1992-06-02 1994-12-01 Philips Electronics Nv
US5341456A (en) * 1992-12-02 1994-08-23 Qualcomm Incorporated Method for determining speech encoding rate in a variable rate vocoder
US5479447A (en) * 1993-05-03 1995-12-26 The Board Of Trustees Of The Leland Stanford, Junior University Method and apparatus for adaptive, variable bandwidth, high-speed data transmission of a multicarrier signal over digital subscriber lines
CN1045852C (zh) * 1993-10-08 1999-10-20 索尼公司 数字信号处理装置和数字信号处理方法
US5506866A (en) * 1993-11-15 1996-04-09 At&T Corp. Side-channel communications in simultaneous voice and data transmission
JP3125543B2 (ja) * 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US5761636A (en) * 1994-03-09 1998-06-02 Motorola, Inc. Bit allocation method for improved audio quality perception using psychoacoustic parameters
TW271524B (de) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
KR100648475B1 (ko) * 1996-01-29 2007-01-31 소니 가부시끼 가이샤 통신자원할당방법및장치
CN1106085C (zh) * 1996-04-26 2003-04-16 德国汤姆逊-布朗特公司 对数字音频信号编码的方法和装置
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
US6084917A (en) 1997-12-16 2000-07-04 Integrated Telecom Express Circuit for configuring and dynamically adapting data and energy parameters in a multi-channel communications system
US6128348A (en) * 1997-12-16 2000-10-03 Integrated Telecom Express Method for configuring data and energy parameters in a multi-channel communications system
US6094459A (en) * 1997-12-16 2000-07-25 Integrated Telecom Express Circuit for configuring data and energy parameters in a multi-channel communications system
US6075821A (en) * 1997-12-16 2000-06-13 Integrated Telecom Express Method of configuring and dynamically adapting data and energy parameters in a multi-channel communications system
US6084906A (en) * 1997-12-17 2000-07-04 Integrated Telecom Express ADSL transceiver implemented with associated bit and energy loading integrated circuit
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
AU754877B2 (en) * 1998-12-28 2002-11-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method and devices for coding or decoding an audio signal or bit stream
FR2791166B1 (fr) * 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage
AU3078501A (en) * 1999-11-08 2001-06-06 Ericsson Inc. Integrated voice and data transmission based on bit importance ranking
US6369722B1 (en) 2000-03-17 2002-04-09 Matra Nortel Communications Coding, decoding and transcoding methods
JP2005071522A (ja) * 2003-08-27 2005-03-17 Sony Corp コンテンツ再生方法、コンテンツ再生装置およびコンテンツ配信方法
KR20050028193A (ko) * 2003-09-17 2005-03-22 삼성전자주식회사 오디오 신호에 적응적으로 부가 정보를 삽입하기 위한방법, 오디오 신호에 삽입된 부가 정보의 재생 방법, 및그 장치와 이를 구현하기 위한 프로그램이 기록된 기록 매체
CN101989428B (zh) * 2009-07-31 2012-07-04 华为技术有限公司 比特分配方法、编码方法、解码方法、编码器及解码器
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
FR2973551A1 (fr) * 2011-03-29 2012-10-05 France Telecom Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique
CN105825859B (zh) * 2011-05-13 2020-02-14 三星电子株式会社 比特分配、音频编码和解码
MX341885B (es) * 2012-12-13 2016-09-07 Panasonic Ip Corp America Dispositivo de codificacion de sonido de voz, dispositivo de decodificacion de sonido de voz, metodo de codificacion de sonido de voz y metodo de decodificacion de sonido de voz.

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2389277A1 (fr) * 1977-04-29 1978-11-24 Ibm France Procede de quantification a allocation dynamique du taux de bits disponible, et dispositif de mise en oeuvre dudit procede
JPS542050A (en) * 1977-06-07 1979-01-09 Nec Corp Block coding and decoding system
FR2412987A1 (fr) * 1977-12-23 1979-07-20 Ibm France Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede
US4386237A (en) * 1980-12-22 1983-05-31 Intelsat NIC Processor using variable precision block quantization
JPS5921039B2 (ja) * 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
DE3267481D1 (en) * 1982-02-09 1986-01-02 Ibm Method for multi-speed digital transmission and apparatus for carrying out said method
JPS58193598A (ja) * 1982-05-07 1983-11-11 日本電気株式会社 音声符号化方式とそれに供する装置
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
CA1253255A (en) * 1983-05-16 1989-04-25 Nec Corporation System for simultaneously coding and decoding a plurality of signals
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19638997B4 (de) * 1995-09-22 2009-12-10 Samsung Electronics Co., Ltd., Suwon Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung
DE19727938B4 (de) * 1997-07-01 2006-12-14 Mayah Communications Gmbh Verfahren und Vorrichtung zum Codieren von Signalen

Also Published As

Publication number Publication date
DE3784120D1 (de) 1993-03-25
JPS6358500A (ja) 1988-03-14
EP0259553B1 (de) 1993-02-10
US4899384A (en) 1990-02-06
EP0259553A2 (de) 1988-03-16
EP0259553A3 (en) 1989-06-07

Similar Documents

Publication Publication Date Title
DE3784120T2 (de) Tabellengesteuerte dynamische bitverteilung in einem teilband-sprachkodierer mit veraenderlicher datenrate.
DE69329796T2 (de) Verfahren zur kodierung, dekodierung und kompression von audiodaten
DE2818052C2 (de) Quantisierung eines Signals mit einem sich über ein gegebenes Frequenzband erstreckendem Spetkrum
DE69225100T2 (de) Reduzierung der Zusaztinformation bei Teilbandkodierungsverfahren
DE69705642T2 (de) Audio-kodierverfahren mit veränderlicher kodelänge unter verwendung einer mehrzahl von teilband-bitverteilungsmoden
DE3688980T2 (de) Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens.
DE69023604T2 (de) Digitalsignalkodiergerät.
DE69401514T2 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung
DE69924431T2 (de) Vorrichtung und Verfahren zur dynamischen Bitverteilung für Audiokodierung
DE69907267T2 (de) Entropie-code modenwechsel zur frequenzbereichsaudiokodierung
DE69431622T2 (de) Verfahren und gerät zum kodieren von mit mehreren bits kodiertem digitalem ton durch subtraktion eines adaptiven zittersignals, einfügen von versteckten kanalbits und filtrierung, sowie kodiergerät zur verwendung bei diesem verfahren
DE69525836T2 (de) Kodierung und dekodierung eines breitbandigen digitalen informationssignals
DE69628972T2 (de) MPEG Audio Dekoder
DE69401517T2 (de) Teilbandkodierer mit differentiell kodierten skalenfaktoren
EP0667063B1 (de) Verfahren zur übertragung und/oder speicherung digitaler signale mehrerer kanäle
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE69219718T2 (de) Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
EP0910927B1 (de) Verfahren zum codieren und decodieren von stereoaudiospektralwerten
DE69326484T2 (de) Vorrichtung und Verfahren zur Datenkompression
DE3878017T2 (de) System zur teilbandkodierung eines digitalen audiosignals.
DE69320872T2 (de) Kompression und Dehnung von digitalen Signalen
DE60015448T2 (de) Teilband-Audiokodiersystem
DE69107511T2 (de) Codierverfahren und Codieranordnung mit einem Unterbandcoder und Sender mit der Codieranordnung.
DE69106580T2 (de) Codieranordnung mit einem Unterbandcoder und Sender mit der Codieranordnung.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee