DE69324213T2 - Sprachkodierer und Verfahren zur Sprachkodierung - Google Patents

Sprachkodierer und Verfahren zur Sprachkodierung

Info

Publication number
DE69324213T2
DE69324213T2 DE69324213T DE69324213T DE69324213T2 DE 69324213 T2 DE69324213 T2 DE 69324213T2 DE 69324213 T DE69324213 T DE 69324213T DE 69324213 T DE69324213 T DE 69324213T DE 69324213 T2 DE69324213 T2 DE 69324213T2
Authority
DE
Germany
Prior art keywords
speech
data block
input signal
acoustic input
background noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69324213T
Other languages
English (en)
Other versions
DE69324213D1 (de
Inventor
Toshihiro C/O Nec Corporation Tokyo Hayata
Yoshihiro C/O Nec Corporation Tokyo Unno
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Application granted granted Critical
Publication of DE69324213D1 publication Critical patent/DE69324213D1/de
Publication of DE69324213T2 publication Critical patent/DE69324213T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

  • Die vorliegende Erfindung betrifft einen Sprachcodierer und ein Verfahren zur Sprachcodierung.
  • Verschiedene Einrichtungen und Vorrichtungen sind als Sprachcodierer (Sprache-zu-digital-Wandler) vorgeschlagen worden, die eingegebene akustische Signale codieren. Im Falle der Anwendung eines Sprachcodierers auf ein mobiles Funkkommunikationssystem oder ein Satellitenkommunikationssystem ist es wichtig, die Codemenge zu reduzieren, dabei jedoch die Codierqualität aufrecht zu erhalten, um einen schlechten Wirkungsgrad oder Störungen im Kommunikationskanal zu beseitigen.
  • Wenn es als ein Ziel genommen wird, die menschliche Sprache zu codieren, wird ein spezieller Sprecher bei einer Unterhaltung offenbar nicht die gesamte Zeit sprechen. Wenn das Codieren während der Zeit angehalten wird, in der der Sprecher nicht tatsächlich spricht, so kann die Menge von Codierung reduziert werden. Außerdem kann in einem Mobilfunkkommunikationsanschluß eine Reduktion des Verbrauchs an elektrischer Leistung erzielt werden, wenn das Codieren angehalten wird, was eine längere Batterielebenszeit ermöglicht. Zum Beispiel sind in GSM-Empfehlungen (Global System for Mobile Communication; globales System für mobile Kommunikation) wie zum Beispiel "GSM-Full-rate Speech Transcoding, (GSM vollständige Sprachtranscodierung)" (ETSI/PT 12, GSM Recommendation 06. 10., Januar 1990) und "Discontinuous Transmission (DTx) for Full-rate Speech Traffic Channels, (Diskontinuierliche Übertragung (DTx) für vollständige Sprachverkehrskanäle)", (ETSI/PT 12, GSM Recommendation 06. 31, Januar 1990), Techniken offenbart, bei denen Übertragungseinrichtungen auf der Seite der Mobilstationen nicht aktiviert sind, wenn es keine Sprachaktivität gibt, wenn Tonsignale bei der Kommunikation zwischen einer Mobilstation und einer Basisstation codiert werden.
  • Fig. 1 zeigt ein Blockdiagramm des Aufbaus eines Beispiels eines konventionellen Sprachcodierers. Dieser Sprachcodierer 50 ist aus einem Eingangsanschluß 51 zum Eingeben von Eingangstonsignalen für jeden Datenblock, einer synthetischen Filterkoeffizientberechnungsschaltung 52 zum Berechnen eines synthetischen Filterkoeffizienten für jeden Datenblock, einer Datenblockenergie-Berechnungsschaltung 53 zum Berechnen des Datenblockenergiewertes für jeden Datenblock, einer Sprachaktivitätsdetektionsschaltung 54 zum Unterscheiden, ob es im gegenwärtigen Datenblock Sprechaktivität gibt oder nicht, einer Sprachcodierschaltung (Sprache-zu-digital-Schaltung) 55 zum Codieren des laufenden Datenblocks beruhend auf dem synthetischen Filterkoeffizienten und dem Datenblockenergiewert, einem Ausgangsanschluß 56 zum Ausgeben des codierten Ergebnisses (Codeworte) der Sprachcodierschaltung 55 und einer Steuerschaltung 57 aufgebaut, die den Gesamtbetrieb des Sprachcodierers 50 steuert.
  • Ein eingegebenes akustisches Signal ist ein akustisches Signal, das mit Hilfe eines Handapparates, eines Mikrophons oder dergleichen erhalten wurde und schließt nicht nur die Stimme des Sprechers ein, sondern auch Hintergrundgeräusche oder Töne während Pausen im Sprechvorgang des Sprechers. In diesem Falle ist die Anwesenheit von Sprachaktivität ein Zustand, in dem das eingegebene akustische Signal die Sprache des Sprechers einschließt, und die Abwesenheit von Sprechaktivität ist ein Zustand, in dem das eingegebene akustische Signal die Sprache des Sprechers nicht einschließt. Das codierte Signal, das vom Ausgangsanschluß 56 ausgegeben wird, wird dann mit Hilfe eines Kommunikationskanals 58 übertragen und durch einen Sprachdecodierer (digital-zu-Sprache-Wandler) 59 auf der Seite des anderen Sprechers demoduliert.
  • In dem Sprachcodierer 50 beurteilt die Sprechaktivitätsdetektionsschaltung 54 die Abwesenheit oder die Anwesenheit von Sprechaktivität bei jedem der Datenblöcke. Die Abwesenheit von Sprechaktivität, d. h. ein Zustand, in dem das eingegebene akustische Signal nicht die Sprache des Sprechers ist, sondern Hintergrundgeräusche, wird in der Sprechaktivitätsdetektionsschaltung 54 bestimmt. Wenn die Information der Abwesenheit von Sprechaktivität in die Steuerschaltung 57 eingegeben wird, dann steuert die Steuerschaltung 57 die Sprachcodierschaltung 55 und beendet, nachdem sie Codieren und Übertragen des Datenblocks zur Zeit der Bestimmung ermöglicht hat, die Ausgabe des codierten Signals von der Sprachcodierschaltung 55, bis die Anwesenheit von Sprechaktivität bestimmt wird. Dem Signal des codierten Datenblocks zu dem Zeitpunkt, zu dem die Abwesenheit von Sprechaktivität festgestellt wurde, wird ein Flag hinzu geführt, der anzeigt, das es sich um Hintergrundgeräusche handelt. Wenn es hier bestimmt wird, daß Sprechaktivität vorhanden ist, nimmt die Sprachcodierschaltung 55 das Codieren aufgrund des synthetischen Filterkoeffizienten und des Datenblockenergiewertes wieder auf. Außerdem wird, obwohl weiterhin keine Sprechaktivität vorhanden ist, ein Datenblock, der als Hintergrundgeräusche codiert ist, nach Ablauf jeder festen Zeitperiode ΔT gesandt. Hier kann die feste Zeit ΔT als die "kontinuierliche Hintergrundgeräuschezeit" bezeichnet werden.
  • Wenn die Abwesenheit von Sprechaktivität für eine lange Zeit andauert, wird ein codiertes Signal nicht von dem Sprachco dierer 50 zum Sprachdecodierer 59 während jeder Periode der kontinuierlichen Hintergrundgeräusche gesendet. Als Ergebnis hiervon werden während der Zeitperiode der kontinuierlichen Hintergrundgeräusche demodulierte Daten am Spannungsdecodierer 59 aufgrund des Datenblocks ausgegeben, der der Unterbrechung der codierten Übertragung voranging, d. h. des Datenblocks, der mit einem Flag versehen wurde, der andeutet, daß es sich um Hintergrundgeräusche handelt. Insbesondere demoduliert der Sprachdecodierer 59 zuerst Datenblöcke, die als Hintergrundgeräusche übertragen sind und fährt während Zeiten der kontinuierlichen Hintergrundgeräusche fort, zu demodulieren, wobei er einen Teil des Codes des übertragenen Datenblocks ändert, der Hintergrundgeräusche darstellt. Wenn ein neuer Datenblock von Hintergrundgeräuschen entsprechend dem Ablauf der Zeit ΔT seit der Übertragung des vorherigen Datenblocks von Hintergrundgeräuschen gesendet wird, aktualisiert der Spannungsdecodierer 59 die Hintergrundgeräusche aufgrund des Datenblocks von Hintergrundgeräuschen, der gerade vom Sprachcodierer 50 gesendet worden ist und fährt mit der Demodulierung aufgrund der aktualisierten Hintergrundgeräusche fort.
  • Wie dies oben erläutert wurde, wird bei einem Sprachcodierer des Standes der Technik, solange wie dauernd festgestellt wird, daß keine Sprechaktivität vorhanden ist, ein als Hintergrundgeräusche codierter Datenblock bei Ablauf jeder Zeitperiode ΔT der dauernden Hintergrundgeräusche gesendet, und wenn dies nicht der Fall ist (während einer Prüfperiode), dann werden keine codierten Daten ausgegeben. Es werden also beim Sprachcodierer die Hintergrundgeräusche während jeder Zeitperiode ΔT der dauernden Hintergrundgeräusche aktualisiert, und es wird dann während einer Ruheperiode die Demodulierung aufgrund der aktualisierten Hintergrundgeräusche fortgesetzt. Als Ergebnis werden, wenn die Abwesenheit von Sprechaktivität mit einer großen Änderung des eingegebenen akustischen Signals einhergeht, die Hintergrundgeräusche sich stark während jeder Zeitperiode der dauernden Hintergrundgeräusche ändern, und das vom Sprachdecodierer ausgegebene akustische Signal wird sich stark in der Qualität für jede feste Zeit ΔT verändern, und diese Veränderung in der Tonqualität wird unnatürlich für die Person auf der empfangenden Seite klingen.
  • EP 0 459 363 beschreibt ein Sprachsignalcodiersystem, das einen Sprachsignaldetektor zum Empfangen eines gemischten Signals aus einem Sprachsignal und einem Hintergrundgeräuschsignal und zum Detektieren der Anwesenheit und Abwesenheit des Sprachsignals, das im gemischten Signal enthalten ist, einschließt. Ein Sprechsignalperiodendetektor ist vorgesehen, um einen Sprechsignalperiode zu detektieren, in der das Sprechsignal vorhanden ist. Eine codierende Periodensteuerschaltung ist mit dem Sprechsignalperiodendetektor verbunden, um ein codierendes Periodensteuersignal während der Sprechsignalperiode zu erzeugen. Eine codierende Schaltung empfängt und codiert das gemischte Signal als Reaktion auf das Codierperiodensteuersignal.
  • Ein Zweck der vorliegenden Erfindung besteht in der Schaffung eines Sprachcodierers, der nicht bewirkt, daß ein unnatürliches akustisches Signal vom Sprachcodierer auf der Empfangsseite während dauernder Abwesenheit von Sprechaktivität ausgegeben wird.
  • Demgemäß schafft die vorliegende Erfindung einen Sprachcodierer, der Eingangsmittel zum Eingeben eines akustischen Eingangssignals, das in Datenblöcke aufgeteilt ist, Sprechaktivitätsdetektionsmittel zum Bestimmen, ob eine Sprechaktivität in jedem Datenblock des akustischen Eingangssignals vorhanden ist oder nicht vorhanden ist, und Sprachcodiermittel zum Codieren des akustischen Eingangssignals Datenblock für Datenblock aufweist, dadurch gekennzeichnet, daß er weiter Hintergrundgeräusche-Aktualisierungs-Beurteilungsmittel zum Detektieren einer Änderung in den Charakteristiken jedes Datenblocks des akustischen Eingangssignals, wenn keine Sprechaktivität vorhanden ist, wobei die Hintergrundgeräusche-Aktualisierungs-Beurteilungsmittel einen gegenwärtigen Datenblock und einen vorher ausgegebenen Hintergrundgeräuschdatenblock vergleichen und beurteilen, ob eine Änderung in den Charakteristiken des akustischen Eingangssignals stattgefunden hat, und Steuermittel zum zeitweiligen Anhalten des Betriebs der Sprachcodiermittel aufweist, wenn detektiert wird, daß keine Sprechaktivität vorhanden ist und, wenn eine Änderung in den Charakteristiken des akustischen Eingangssignals durch die Hintergrundgeräusche-Aktualisierungs-Beurteilungsmittel detektiert wird, zu bewirken, daß die Sprachcodiermittel das akustischen Eingangssignal zu dem Zeitpunkt als einen Hintergrundgeräuschdatenblock codieren.
  • Die vorliegende Erfindung schafft auch ein Verfahren zur Sprachcodierung gemäß Anspruch 9.
  • Die obigen und andere Zwecke, Merkmale und andere Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung unter Bezugnahme auf die beigefügten Zeichnungen deutlich werden, die ein Beispiel einer bevorzugten Ausführungsform der vorliegenden Erfindung darstellen. Es zeigen:
  • Fig. 1 ein Blockdiagramm, das den Aufbau eines Beispiels eines konventionellen Sprachcodierers zeigt;
  • Fig. 2 ein Blockdiagramm, das den Aufbau einer bevorzugten Ausführungsform des Sprachcodierers der vorliegenden Erfindung zeigt; und
  • Fig. 3 eine charakteristische graphische Darstellung, die einen Vergleich von synthetischen Filterkoeffizienten zeigt.
  • Eine bevorzugte Ausführungsform der vorliegenden Erfindung soll nun nur beispielsweise unter Bezugnahme auf die Zeichnungen beschrieben werden. In dem in Fig. 2 gezeigten Sprachcodierer 10 wird ein akustisches Eingangssignal, das in Datenblöcke aufgeteilt ist, in einen Eingangsanschluß 11 eingegeben. Eine synthetische Filterkoeffizientenberechnungsschaltung 12, die einen synthetischen Filterkoeffizienten für jeden Datenblock berechnet, und eine Datenblockenergieberechnungsschaltung 13, die einen Datenblockenergiewert für jeden Datenblock berechnet, sind jeweils mit dem Eingangsanschluß 11 verbunden. Das Verfahren der Berechnung des synthetischen Filterkoeffizienten kann zum Beispiel ein Verfahren sein, das auf LPC (Linear Prediction Coding, Codierung mit linearer Vorhersage) beruht. Der berechnete synthetische Filterkoeffizient und der Datenblockenergiewert werden beide einer Sprechaktivitätdetektionsschaltung 14, einer Sprachcodierschaltung 15 und einer Hintergrundgeräusche-Aktualisierungs- Beurteilungsschaltung 20 zugeführt.
  • Die Sprechaktivitätdetektionsschaltung 14 bestimmt, ob Sprechaktivität im laufenden Datenblock fehlt oder vorhanden ist, und zwar beruhend auf dem synthetischen Filterkoeffizienten und dem Datenblockenergiewert. Diese Beurteilung wird für jeden Datenblock durchgeführt. Das Ergebnis der Beurteilung der Sprechaktivitätdetektionsschaltung 14 wird zur Steuerschaltung 17 ausgegeben.
  • Die Sprachcodierschaltung 15 ist zum Codieren des laufenden Datenblocks unter Verwendung des synthetischen Filterkoeffizienten und des Datenblockenergiewertes bestimmt, und ihr Betrieb wird durch die Steuerschaltung 17 gesteuert, wie dies unten erläutert werden wird. Das Sprachcodierverfahren der vorliegenden Erfindung kann zum Beispiel ein RPE-LTP (Regular Pulse Excitation - Long Term Predictor; Gewöhnliche Pulserregung - Langzeitvorhersager) - Verfahren verwenden. Das Ausgangssignal der Sprachcodierschaltung 15, Codeworte, wird nach außen als Ausgangssignal des Spannungscodierers 10 durch den Ausgangsanschluß 16 ausgegeben. Bei der vorliegenden Ausführungsform ist dieser Sprachcodierer 10 mit einem Sprachdecodierer 19 durch eine Kommunikationsleitung 18 verbunden.
  • Die Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung 20 ist zum Detektieren bestimmt, ob es eine Variation oder Änderung in den Charakteristiken des akustischen Eingangssignals gibt, wenn Sprechaktivität fehlt, und zwar aufgrund des synthetischen Filterkoeffizienten und des Datenblockenergiewertes. Das Beurteilungsergebnis der Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung 20 wird zur Steuerschaltung 17 ausgegeben.
  • Die Steuerschaltung 17 ist so aufgebaut, daß sie die Sprachcodierschaltung 15 in der folgenden Weise steuert. Wenn die Abwesenheit von Sprechaktivität durch die Sprechaktivitätsdetektionsschaltung 14 detektiert wird, wenn die Sprachcodierschaltung 15 in Betrieb ist, bewirkt die Steuerschaltung 17, daß der Datenblock zu diesem Zeitpunkt als ein Hintergrundgeräuschdatenblock codiert wird und hält dann zeitweilig den Betrieb der Sprachcodierschaltung 15 an; und wenn die Anwesenheit von Sprechaktivität detektiert wird, wenn die Sprachcodierschaltung 15 nicht in Betrieb ist, bewirkt die Steuerschaltung 17, daß die Sprachcodierschaltung 15 den Betrieb wieder aufnimmt. Wenn die Sprachcodierschaltung 15 nicht in Betrieb ist, wenn Variation oder Änderung in den Charakteristiken des akustischen Eingangssignals durch die Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung 20 detektiert wird, bewirkt darüber hinaus die Steuerschaltung 17, daß die Sprachcodierschaltung 15 den Datenblock zu diesem Zeitpunkt als einen Hintergrundgeräuschedatenblock codiert und dann wiederum den Betrieb der Sprachcodierschaltung 15 anhält.
  • Hier ist ein Hintergrundgeräuschedatenblock ein Datenblock, der erzeugt wird, indem ein akustisches Eingangssignal codiert wird, wenn Sprechaktivität abwesend ist, d. h. ein Datenblock von codierten Hintergrundgeräuschen, und ist ein Datenblock, der anzeigt, daß das Codieren zeitweilig beendet werden soll, nachdem der Datenblock ausgegeben ist. Insbesondere ist ein Hintergrundgeräuschedatenblock aus einem Dateiendesignal und den folgenden codierten Daten aufgebaut. Ein Dateiendesignal ist ein Signal, das anzeigt, daß (1) der Ausgang des Sprachcodierers 10 zeitweilig angehalten werden soll, da die Sprechaktivität aufgehört hat, und (2) daß die als nächstes zu übertragende Dateneinheit Hintergrundgeräusche sind.
  • Als nächstes soll die Hintergrundgeräusche-Aktualisierungs- Beurteilungsschaltung 20 detaillierter beschrieben werden. Die Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung 20 hält den synthetischen Filterkoeffizienten und den Datenblockenergiewert des vorher übertragenen Hintergrundgeräuschedatenblocks und vergleicht den synthetischen Filterkoeffizienten und den Datenblockenergiewert des vorher übertragenen Datenblocks mit dem synthetischen Filterkoeffizienten und dem Datenblockenergiewert des gegenwärtigen Datenblocks. Hier muß zunächst der synthetische Filterkoeffizient erklärt wird.
  • Der synthetische Filterkoeffizient gibt die Charakteristiken des synthetischen Filters an, der beim Codieren des akustischen Signals verwendet wird und bezeichnet allgemein die Spektrumcharakteristiken des entsprechenden synthetischen Filters. Verschiedene Verfahren zum Vergleichen der beiden synthetischen Filterkoeffizienten können in Betracht gezogen werden, bei der vorliegenden Ausführungsform wird unter Berücksichtigung der spektralen Hüllkurve des synthetischen Filters, der jedem synthetischen Filterkoeffizienten entspricht, ein Vergleich entsprechend Werten durchgeführt, die durch Integrieren gemäß der Frequenz des absoluten Wertes des Unterschiedes in der spektralen Intensität der Hüllkurve von zwei synthetischen Filtern für jede Frequenz abgeleitet sind. Anders gesagt ist die spektrale Hüllkurve, die durch den synthetischen Filterkoeffizienten des vorher ausgegebenen Hintergrundgeräuschedatenblocks dargestellt ist, fpre(ν), und die spektrale Hüllkurve, die durch den synthetischen Filterkoeffizienten des gegenwärtigen Datenblocks dargestellt ist, ist fcurr(ν). Hier ist ν die Frequenz und f&sub1; und f&sub2; sind die niedrigste Grenzfrequenz und die höchste Grenzfrequenz eines Frequenzbandes. Der Integralwert LD, der durch Formel (1) unten angegeben wird, wird als "LPC-Verzerrung" bezeichnet, wobei x den Absolutwert von x darstellt.
  • LD fpre(ν) - fcurr(ν) dν .... (1)
  • In Fig. 3 sind die spektralen Hüllkurven fpre(ν) und fcurr(ν) durch eine ausgezogene und eine gestrichelte Linie dargestellt. Der Bereich, der durch die ausgezogenen und gestrichelten Linien umschlossen ist, d. h., die Fläche, die mit Diagonallinien markiert ist, ist der Integralwert LD.
  • Als nächstes sollen die Prinzipien für die Beurteilung der Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung 20 erklärt werden. Wenn weiterhin die Sprechaktivität abwesend ist und die Hintergrundgeräusche aktualisiert werden, kann es als wahrscheinlich angesehen werden, (1) wenn es eine verhältnismäßig große Änderung in der Signalintensität (Datenblockenergie) vom Beginn bis zur Ende der Aktualisierung gibt oder (2) wenn es eine verhältnismäßig große Änderung der Tonqualität des akustischen Signals vom Beginn bis zum Ende der Aktualisierung gibt, daß das Ausgangssignal des Sprachdecoders auf der empfangenden Seite unnatürlich klingen wird. Wenn der Datenblockenergiewert des gegenwärtigen Datenblocks ROcurr, der Datenblockenergiewert der vorher übertragenen Hintergrundgeräusche ROpre, der Schwellenwert der Datenblockenergie ROth und der Schwellenwert für den Integralwert (LPC-Verzerrung) LD = LDth ist, so bestimmt die Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung 20, daß eine Änderung oder eine Variation in den Charakteristiken des akustischen Eingangssignals aufgetreten ist, wenn wenigstens eine der beiden Formeln (2) und (3) erfüllt ist.
  • ...(2)
  • LD > LDth ... (3)
  • Formel (2) ist eine Bedingung zum Aktualisieren der Hintergrundgeräusche, bevor die Differenz zwischen ROpre und ROcurr sehr groß wird, um plötzliche Änderungen in der Datenblockenergie vom Anfang bis zum Ende des Aktualisierens zu verhindern. Anstatt, daß die Bedingungen aufgrund eines einfachen Unterschiedes beurteilt werden, wird die Bedingungsbeurteilung unter Verwendung eines Logarithmus durchgeführt, da die menschliche Wahrnehmung einer logarithmische Charakteristik hat. Formel (3) ist eine Bedingung, um plötzliche Änderungen in der Tonqualität vom Anfang bis zum Ende des Aktualisierens zu verhindern. Die Schwellenwerte ROth und LDth, die in Formeln (2) und (3) verwendet werden, sind Parameter, die zum Bestimmen verwendet werden, ob die Hintergrundgeräusche auf der Seite des Decodierers zwangsmäßig aktualisiert werden sollen oder nicht, und können auf geeignete Weise gemäß der Tonqualität auf der Empfangsseite oder dem Typ der akustischen Eingangssignale eingestellt werden.
  • Was die Betriebsweise dieses Sprachcodierers 10 anbetrifft, so beurteilt die Sprechaktivitätdetektionsschaltung 14, ob Sprechaktivität bei jedem der Datenblöcke fehlt oder vorhanden ist, und, wenn eine Sprechaktivität vorhanden ist, codiert die Sprachcodierschaltung 15 weiterhin eingegebene Datenblöcke, und die eingegebenen Datenblöcke werden vom Ausgangsanschluß 16 ausgegeben. Wenn Sprechaktivität detektiert wird, wenn der Betrieb der Sprachcodierschaltung 15 aufgrund der Abwesenheit von Sprechaktivität angehalten ist, wird der Betrieb der Sprachcodierschaltung 15 wieder aufgenommen.
  • Was den Übergang von der Anwesenheit zur Abwesenheit von Sprechaktivität anbetrifft, so wird, wenn die Abwesenheit von Sprechaktivität detektiert wird, das akustische Eingangssignal zu diesem Zeitpunkt als Hintergrundgeräuschedatenblock codiert und ausgegeben, wonach die Sprachcodierschaltung 15 durch die Steuerschaltung 17 angehalten wird. Während der Betrieb der Sprachcodierdigitalschaltung 15 angehalten ist, überwacht die Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung 20 den synthetischen Filterkoeffizienten und den Datenblockenergiewert jedes Datenblocks, und, wenn wenigstens eine der Formeln (2) und (3) erfüllt ist, wird es bestimmt, daß eine Änderung in den Charakteristiken des akustischen Eingangssignals aufgetreten ist. Wenn eine Änderung in den Charakteristiken des akustischen Eingangssignals detektiert worden ist, so codiert die Sprachcodierschaltung 15 den Datenblock und gibt ihn zu diesem Zeitpunkt als einen Hintergrundgeräuschedatenblock aus unter Steuerung durch die Steuerschaltung 17. Die Sprachcodierschaltung 15 kehrt dann in einen Ruhezustand zurück, wo sie verbleibt, bis Sprechaktivität vorhanden ist oder wiederum eine Änderung in den Charakteristiken des akustischen Eingangssignals detektiert wird. Wenn weder Formel (2) noch (3) erfüllt ist, wird der gegenwärtige Datenblock nicht codiert.
  • Wie dies oben beschrieben wurde, so werden bei der vorliegenden bevorzugten Ausführungsform, wenn eine Änderung in den Charakteristiken des akustischen Eingangssignals detektiert wird, Hintergrundgeräusche zwangsmäßig aktualisiert, und als Ergebnis hiervon ist es möglich, Unangenehmheit (unnatürliche Tonqualität) aufgrund von plötzlichen Änderungen in den Hintergrundgeräuschen für die Person auf der Sprachdecodierseite zu verringern.
  • Die vorliegende Erfindung erlaubt eine Anzahl von unterschiedlichen Ausführungsformen. Zum Beispiel, wenn eine feste Zeit ΔT abgelaufen ist, seit zuletzt ein Hintergrundgeräuschedatenblock gesendet worden ist, können die Hintergrundgeräusche unabhängig von der Beurteilung aktualisiert werden, die durch die Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung 20 getroffen wurde. Die feste Zeitperiode ΔT entspricht einer dauernden Hintergrundgeräuschezeit im Sprachcodierer des Standes der Technik.
  • Bei der oben beschriebenen Ausführungsform wurde die Beurteilung unter Verwendung des Verhältnisses von ROcurr zu ROpre in Formel (2) getroffen, die Beurteilung kann aber auch aufgrund des Unterschiedes zwischen ROpre und ROcurr gemacht werden. Zusätzlich ist es, wenn der Integralwert LD berechnet wird, möglich, die spektrale Intensität gemäß den empfundenen Charakteristiken mit Gewichten zu versehen oder Integration nichtlinear durchzuführen. Es ist auch möglich, die Schwellenwerte ROth und LDth gemäß dem Zustand des synthetischen Filterkoeffizienten oder des Datenblockenergiewertes zu verändern. Weiter können die Hintergrundgeräusche nur dann aktualisiert werden, wenn Änderungen sowohl in dem synthetischen Filterkoeffizienten als auch im Datenblockenergiewert auftreten.
  • Zusammenfassend kann festgestellt werden, daß bei der vorliegenden Ausführungsform des Sprachcodierers das Ausgeben von Codeworten unterbrochen wird, wenn Sprechaktivität nicht vorhanden ist. Ein akustisches Eingangssignal wird in Datenblöcke aufgeteilt und in den Sprachcodierer eingegeben. Der Sprachcodierer weist eine Sprechaktivitätsdetektionsschaltung zum Bestimmen bei jedem Datenblock, ob Sprechaktivität abwesend oder vorhanden ist, eine Sprachcodierschaltung, eine Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung zum Detektieren einer Änderung in den Charakteristiken des akustischen Eingangssignals und eine Steuerschaltung auf. Wenn die Abwesenheit von Sprechaktivität detektiert wird, so bewirkt die Steuerschaltung, daß der Datenblock zu diesem Zeitpunkt als ein Hintergrundgeräuschedatenblock codiert wird und unterbricht dann den Betrieb der Sprachcodierschaltung. Wenn die Anwesenheit von Sprechaktivität detektiert wird, wird der Betrieb der Sprachcodierschaltung wieder aufgenommen. Wenn die Sprachcodierschaltung nicht in Betrieb ist, wenn eine Änderung der Charakteristiken des akustischen Eingangssignals detektiert wird, so bewirkt darüber hinaus die Steuerschaltung, daß die Sprachcodierschaltung den Datenblock zu diesem Zeitpunkt als einen Hintergrundgeräuschedatenblock codiert und dann wiederum den Betrieb der Sprachcodierschaltung unterbricht.
  • Man wird verstehen, daß die vorliegende Erfindung lediglich beispielsweise beschrieben worden ist und daß Änderungen von Einzelheiten innerhalb des Bereichs der Erfindung vorgenommen werden können, wie er durch die beigefügten Ansprüche definiert wird.

Claims (10)

1. Sprachcodierer, der aufweist:
Eingangsmittel (11) zum Eingeben eines akustischen Eingangssignals, das in Datenblöcke aufgeteilt ist;
Sprechaktivitätsdetektionsmittel (14) zum Bestimmen, ob Sprechaktivität in jedem Datenblock des akustischen Eingangssignals fehlt oder vorhanden ist; und
Sprachcodiermittel (15) zum Codieren des akustischen Eingangssignals Datenblock für Datenblock;
dadurch gekennzeichnet, daß er weiter aufweist:
Hintergrundgeräusche-Aktualisierungs-Beurteilungsmittel (20) zum Detektieren einer Änderung in den Charakteristiken jedes Datenblocks des akustischen Eingangssignals, wenn Sprechaktivität fehlt, wobei die Hintergrundgeräusche-Aktualisierungs-Beurteilungsmittel (20) einen gegenwärtigen Datenblock und einen vorher ausgegebenen Hintergrundgeräuschedatenblock vergleichen und beurteilen, ob eine Änderung in den Charakteristiken des akustischen Eingangssignals aufgetreten ist; und
Steuermittel (17) zum zeitweiligen Beenden des Betriebs der Sprachcodiermittel, wenn detektiert wird, daß Sprechaktivität fehlt, und, wenn eine Änderung in den Charakteristiken des akustischen Eingangssignals durch die Hintergrundgeräusche-Aktualisierungs-Beurteilungsmittel detektiert wird, zu bewirken, daß die Sprachcodiermittel das akustische Eingangssignal zu diesem Zeitpunkt als einen Hintergrundgeräuschedatenblock codieren.
2. Sprachcodierer nach Anspruch 1, bei dem, wenn es detektiert wird, das Sprechaktivität fehlt, der Betrieb der Sprachcodiermittel (15) zeitweilig angehalten werden soll, nachdem das akustische Eingangssignal zu diesem Zeitpunkt als der Hintergrundgeräuschedatenblock codiert ist.
3. Sprachcodierer nach Anspruch 1 oder 2, der dazu ausgebildet ist, den Hintergrundgeräuschedatenblock bei vorbestimmten Zeitintervallen auszugeben, während die Sprechaktivität weiterhin fehlt.
4. Sprachcodierer nach Anspruch 1, der weiter aufweist:
synthetische Filterkoeffizientenberechnungsmittel (12) zum Analysieren des akustischen Eingangssignals und zum Berechnen eines synthetischen Filterkoeffizienten für jeden Datenblock des akustischen Eingangssignals; und
Datenblockenergieberechnungsmittel (13) zum Analysieren des akustischen Eingangssignals und zum Berechnen eines Datenblockenergiewertes für jeden der Datenblöcke;
wobei die Sprachcodiermittel dazu ausgebildet sind, Datenblock für Datenblock das akustische Eingangssignal beruhend auf dem synthetischen Filterkoeffizienten und dem Datenblockenergiewert zu codieren; und wobei die Hintergrundgeräusche-Aktualisierungs-Beurteilungsmittel dazu ausgebildet sind, festzustellen, daß eine Änderung in den Charakteristiken des akustischen Eingangssignals aufgetreten ist, wenn die Änderung wenigstens des synthetischen Filterkoeffizienten und/oder des Datenblockenergiewertes einen vorbestimmten Schwellenwert überschreitet.
5. Sprachcodierer nach Anspruch 4, bei dem die Sprechaktivitätdetektionsmittel (14) dazu ausgebildet sind, aufgrund des synthetischen Filterkoeffizienten und des Datenblockenergiewerts zu bestimmen, ob Sprechaktivität fehlt oder vorhanden ist.
6. Sprachcodierer nach Anspruch 4 oder 5, bei dem es beurteilt wird, daß eine Änderung im akustischen Eingangssignal aufgetreten ist, wenn das Verhältnis des Datenblockenergiewertes des gegenwärtigen Datenblocks zum Datenblockenergiewert des vorher ausgegebenen Hintergrundgeräuschedatenblocks von einem vorbestimmten Bereich abweicht.
7. Sprachcodierer nach einem der Ansprüche 4 bis 6, bei dem es beurteilt wird, daß eine Änderung in den Charakteristiken des akustischen Eingangssignals aufgetreten ist, wenn die Fläche oder das Gebiet des Unterschieds zwischen den spektralen Charakteristiken, die durch den synthetischen Filterkoeffizienten des gegenwärtigen Datenblocks gezeigt werden, und den spektralen Charakteristiken, die durch den synthetischen Filterkoeffizienten des vorher ausgegebenen Hintergrundgeräuschedatenblocks gezeigt werden, einen vorbestimmten Wert überschreitet.
8. Sprachcodierer nach einem vorangehenden Ansprüche, bei dem der Betrieb der Sprachcodiermittel wieder aufgenommen werden soll, wenn es beurteilt wird, daß Sprechaktivität vorhanden ist, wenn sich der Betrieb der Sprachcodiermittel in einem Ruhezustand befindet.
9. Verfahren zum Sprachcodieren, das aufweist:
ein in Datenblöcke aufgeteiltes akustisches Eingangssignal einzugeben;
zu bestimmen, ob Sprechaktivität in jedem Datenblock des akustischen Eingangssignals fehlt oder vorhanden ist; und
das akustische Eingangssignal Datenblock für Datenblock zu codieren;
dadurch gekennzeichnet, daß es weiter die Schritte aufweist:
eine Änderung in den Charakteristiken jedes Datenblocks des akustischen Eingangssignals zu detektieren, wenn Sprechaktivität fehlt;
einen gegenwärtigen Datenblock und einen vorher ausgegebenen Hintergrundgeräuschedatenblock zu vergleichen; und
zu beurteilen, ob eine Änderung in den Charakteristiken des akustischen Eingangssignals aufgetreten ist;
wobei das Codieren zeitweilig angehalten wird, wenn detektiert wird, daß Sprechaktivität fehlt, und, wenn eine Änderung in den Charakteristiken des akustischen Eingangssignals detektiert wird, wenn Sprechaktivität fehlt, das akustische Eingangssignal zu diesem Zeitpunkt als ein Hintergrundgeräuschedatenblock codiert wird.
10. Verfahren nach Anspruch 9, das weiter die Schritte aufweist:
das akustische Eingangssignal zu analysieren und einen synthetischen Filterkoeffizienten für jeden Datenblock des akustischen Eingangssignals zu berechnen;
das akustische Eingangssignal zu analysieren und einen Datenblockenergiewert für jeden der Datenblöcke zu berechnen;
wobei der Schritt, das akustische Eingangssignal Datenblock für Datenblock zu codieren, auf dem synthetischen Filterkoeffizienten und dem Datenblockenergiewert beruht; und
wobei der Beurteilungsschritt es aufweist, zu beurteilen, daß eine Änderung in den Charakteristiken des akustischen Eingangssignals aufgetreten ist, wenn die Änderung wenigstens des synthetischen Filterkoeffizienten und/oder des Datenblockenergiewertes einen vorbestimmten Schwellenwert überschreitet.
Übersetzung der Zeichnungen
Fig. 1:
Synthetic Filter Coefficient Calculation Circuit - Synthetische Filterkoeffizientenberechnungsschaltung
Frame Energy Calculation Circuit - Datenblockenergieberechnungsschaltung
Synthetic Filter Coefficient - Synthetischer Filterkoeffizienten
Frame Energy Value - Datenblockenergiewert
Voice Activity Detecting Circuit - Sprechaktivitätdetektionsschaltung
Voice Encoding Circuit - Sprachcodierschaltung
Control Circuit - Steuerschaltung
Voice Decoder - Sprachdecodierer
Prior Art - Stand der Technik
Fig. 2:
Synthetic Filter Coefficient Calculation Circuit - Synthetische Filterkoeffizientenberechnungsschaltung
Frame Energy Calculation Circuit - Datenblockenergieberechnungsschaltung
Background Noise Update Judging Circuit - Hintergrundgeräusche-Aktualisierungs-Beurteilungsschaltung
Synthetic Filter Coefficient - Synthetischer Filterkoeffizient
Frame Energy Value - Datenblockenergiewert
Voice Activity Detecting Circuit - Sprechaktivitätdetektionsschaltung
Voice Encoding Circuit - Sprachcodierschaltung
Control Circuit - Steuerschaltung
Voice Decoder - Sprachdecodierer
Fig. 3
Spectrum Intensity - Spektrale Intensität
Frequency - Frequenz
DE69324213T 1992-11-27 1993-11-29 Sprachkodierer und Verfahren zur Sprachkodierung Expired - Fee Related DE69324213T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31763992 1992-11-27

Publications (2)

Publication Number Publication Date
DE69324213D1 DE69324213D1 (de) 1999-05-06
DE69324213T2 true DE69324213T2 (de) 1999-07-29

Family

ID=18090399

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69324213T Expired - Fee Related DE69324213T2 (de) 1992-11-27 1993-11-29 Sprachkodierer und Verfahren zur Sprachkodierung

Country Status (4)

Country Link
US (1) US5819218A (de)
EP (1) EP0599664B1 (de)
CA (1) CA2110090C (de)
DE (1) DE69324213T2 (de)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI103700B1 (fi) * 1994-09-20 1999-08-13 Nokia Mobile Phones Ltd Samanaikainen puheen ja datan siirto matkaviestinjärjestelmässä
JP3418463B2 (ja) * 1994-10-27 2003-06-23 富士通株式会社 ディジタル移動電話通信方法と通話チャネル切換方法及びそれらを実現するための移動局と基地局
GB2312133B (en) * 1994-10-27 1998-03-11 Fujitsu Ltd Digital mobile telephone communication apparatus
SE9500858L (sv) * 1995-03-10 1996-09-11 Ericsson Telefon Ab L M Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning
US6182035B1 (en) * 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
JP2000022603A (ja) * 1998-07-02 2000-01-21 Oki Electric Ind Co Ltd コンフォートノイズ発生装置
US6108610A (en) * 1998-10-13 2000-08-22 Noise Cancellation Technologies, Inc. Method and system for updating noise estimates during pauses in an information signal
US6519260B1 (en) 1999-03-17 2003-02-11 Telefonaktiebolaget Lm Ericsson (Publ) Reduced delay priority for comfort noise
GB2348342B (en) * 1999-03-25 2004-01-21 Roke Manor Research Improvements in or relating to telecommunication systems
JP3451998B2 (ja) * 1999-05-31 2003-09-29 日本電気株式会社 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
US6480472B1 (en) 1999-07-21 2002-11-12 Qualcomm Incorporated Mobile station supervision of the forward dedicated control channel when in the discontinuous transmission mode
US6741873B1 (en) * 2000-07-05 2004-05-25 Motorola, Inc. Background noise adaptable speaker phone for use in a mobile communication device
US6807525B1 (en) * 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
US20030033143A1 (en) * 2001-08-13 2003-02-13 Hagai Aronowitz Decreasing noise sensitivity in speech processing under adverse conditions
US7171356B2 (en) * 2002-06-28 2007-01-30 Intel Corporation Low-power noise characterization over a distributed speech recognition channel
US20050091049A1 (en) * 2003-10-28 2005-04-28 Rongzhen Yang Method and apparatus for reduction of musical noise during speech enhancement
JP4490090B2 (ja) * 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP4601970B2 (ja) * 2004-01-28 2010-12-22 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP3815482B2 (ja) * 2004-03-09 2006-08-30 セイコーエプソン株式会社 データ転送制御装置及び電子機器
EP1814109A1 (de) * 2006-01-27 2007-08-01 Texas Instruments Incorporated Sprachsignalverstärker zur Modellierung des Lombard-Effekts
US7573907B2 (en) * 2006-08-22 2009-08-11 Nokia Corporation Discontinuous transmission of speech signals
ES2860986T3 (es) 2010-12-24 2021-10-05 Huawei Tech Co Ltd Método y aparato para detectar adaptivamente una actividad de voz en una señal de audio de entrada
CN106169297B (zh) 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2454231A1 (fr) * 1979-04-13 1980-11-07 Thomson Csf Emetteur-recepteur a commande automatique d'alternat et reseau de telecommunications comportant un tel emetteur-recepteur
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
EP0309869B1 (de) * 1987-09-28 1993-04-21 Siemens Aktiengesellschaft Verfahren zur Kompensation von mit Störungen behafteten Sprachsignalen für Spracherkennungssysteme
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
EP0459364B1 (de) * 1990-05-28 1996-08-14 Matsushita Electric Industrial Co., Ltd. Geräuschsignalvorhersagevorrichtung
DE69127134T2 (de) * 1990-05-28 1998-02-26 Matsushita Electric Ind Co Ltd Sprachkodierer
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
JP2518765B2 (ja) * 1991-05-31 1996-07-31 国際電気株式会社 音声符号化通信方式及びその装置
US5410632A (en) * 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
US5630016A (en) * 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置
US5555546A (en) * 1994-06-20 1996-09-10 Kokusai Electric Co., Ltd. Apparatus for decoding a DPCM encoded signal

Also Published As

Publication number Publication date
DE69324213D1 (de) 1999-05-06
EP0599664A2 (de) 1994-06-01
CA2110090C (en) 1998-09-15
EP0599664B1 (de) 1999-03-31
EP0599664A3 (en) 1994-09-14
CA2110090A1 (en) 1994-05-28
US5819218A (en) 1998-10-06

Similar Documents

Publication Publication Date Title
DE69324213T2 (de) Sprachkodierer und Verfahren zur Sprachkodierung
DE69621613T2 (de) Anordnung und verfahren zur sprachübertragung und eine derartige anordnung enthaltende fernsprechanlage
DE69518174T2 (de) Rauschkorrektur durch Feststellung der Anwesenheit von Sprachsignalen
DE69534285T3 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate
DE69830721T2 (de) Verfahren und vorrichtung zur bestimmung der übertragungsrate in einem kommunikationssystem
DE69724739T2 (de) Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung
DE69925168T2 (de) Erkennung der aktivität komplexer signale für verbesserte sprach-/rauschklassifizierung von einem audiosignal
DE69631318T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem
DE69917677T2 (de) SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT
DE69535723T2 (de) Verfahren und vorrichtung zur sprachkodierung mit reduzierter, variabler bitrate
DE69226500T2 (de) Verfahren und Gerät zur Sprachsignalübertragung
DE60029147T2 (de) Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk
DE69429917T2 (de) Verfahren und vorrichtung zur gruppenkodierung von signalen
DE60122203T2 (de) Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation
DE60020317T2 (de) Rauschunterdrückung unter verwendung eines externen sprach-aktivitäts-detektors
DE69617077T2 (de) Mobile Kommunikationseinrichtung
DE69620585T2 (de) Verfahren und vorrichtung zur detektion und umgehung von tandem-sprachkodierung
DE60214599T2 (de) Skalierbare audiokodierung
DE69721349T2 (de) Sprachkodierung
DE69633936T2 (de) Unterdrückung eines akustischen echos in einem digitalen mobilkommunikationssystem
DE69729024T2 (de) Verfahren zur bestimmung der rahmenqualität und empfänger
DE69738476T2 (de) Verfahren und Gerät für Anrufregistrierung in einem Speicher
DE69618358T2 (de) Mobile Funkeinheit
WO2002093561A1 (de) Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
DE68913691T2 (de) System zur Sprachcodierung und -decodierung.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee