DE60129072T2 - Multimodale Sprachkodierung und Geräuschunterdrückung - Google Patents

Multimodale Sprachkodierung und Geräuschunterdrückung Download PDF

Info

Publication number
DE60129072T2
DE60129072T2 DE60129072T DE60129072T DE60129072T2 DE 60129072 T2 DE60129072 T2 DE 60129072T2 DE 60129072 T DE60129072 T DE 60129072T DE 60129072 T DE60129072 T DE 60129072T DE 60129072 T2 DE60129072 T2 DE 60129072T2
Authority
DE
Germany
Prior art keywords
noise
coding
section
algorithm
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60129072T
Other languages
English (en)
Other versions
DE60129072D1 (de
Inventor
Takayuki Minato-ku Taniguchi
Yuriko Minato-ku Tsukahara
Kimio Minato-ku Miseki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Application granted granted Critical
Publication of DE60129072D1 publication Critical patent/DE60129072D1/de
Publication of DE60129072T2 publication Critical patent/DE60129072T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf einen Rauschunterdrücker zum Reduzieren von Rauschen, welches in einem übertragenen/empfangenen Sprachsignal enthalten ist, welcher in Funkkommunikationseinrichtungen von verschiedenen digitalen Kommunikationsverfahren verwendet wird, welche ein digitales Mobiltelefonsystem enthalten.
  • Ein Telefondienst, welcher eine Sprachkommunikation verwendet, ist als ein grundlegender Dienst einer Mobilkommunikation bekannt. Ein Mobiltelefonsystem begann zunächst mit einem analogen Verfahren, wobei sich derzeit ein digitales Verfahren durchgesetzt hat.
  • Im digitalen Verfahren wird ein A/D-Wandler benötigt, um analoge Sprachsignale in digitale Signale umzuwandeln. Jedoch erfordert eine einfache A/D-Umwandlung eine Kodierungsrate von ungefähr 100 kbps. Wenn beschränkte Funkwellenressourcen in Betracht gezogen werden, ist es notwendig, die digitalen Signale auf 1/10 bis 1/20 zu komprimieren. Um diese Anforderung zu erfüllen, wird ein hochwirksames Sprachkodierungsverfahren, welches im Allgemeinen Sprachkomprimierung genannt wird, verwendet, und es ist als ein Sprach-CODEC ausgeführt.
  • In derzeitigen Mobilkommunikationen wird ein Sprach-CODEC mit einer Kodierungsrate von ungefähr 3,5 kbps bis 32 kbps verwendet. Im Niedrigraten-CODEC wird die Kodierungsrate verringert, indem die Eigenschaften von Sprachsignalen soweit wie möglich verwendet werden. Daraus resultierend, sogar wenn eine adäquate Sprachqualität erzielt wird, neigen die Reproduzierbarkeit und Qualität von einem „Klang", welcher sich von Sprache unterscheidet, dazu, sich zu verschlechtern.
  • Ein Niedrigraten Sprach-CODEC wird als eine Anwendung in Mobiltelefonen verwendet, welche oftmals im Freien verwendet werden. In einigen Fällen werden Mobiltelefone in einer Umgebung mit starkem Hintergrundrauschen verwendet.
  • Wenn Hintergrundrauschen dem Niedrigraten Sprach-CODEC eingegeben wird, welcher hauptsächlich für „Sprache" entworfen ist, wird die Sprachqualität variieren. Die Klarheit und Qualität von Sprache wird sich in der Umgebung mit Hintergrundrauschen verschlechtern.
  • Als Techniken zum Lösen dieses Problems wurde jüngst eine Aufmerksamkeit auf Rauschunterdrücker (oder Rauschlöscher) gerichtet, welche dazu entworfen sind, um Hintergrundrauschen zu unterdrücken, welches durch Mikrophone eingeführt wird, und um dem Sprach-CODEC lediglich Sprache zuzuführen.
  • Beispielsweise ist ein Rauschlöscher im Kapitel „Half-Rate Speech CODEC” im „Personal Digital Cellular Telecommunication System RCR STD-27", veröffentlicht durch die Association of Radio Industries and Businesses (ARIB) in Japan, beschrieben.
  • Neue Sprach-CODECs wurden durch technische Innovationen entwickelt. Es gibt jüngst einen Trend eines Multi-Modus, mit anderen Worten ein Multi-Algorithmus, bei welchem neue CODECs in Systeme eingeführt werden, um eine Zwei-Algorithmus-Umschaltung (zwei Sprach-CODECs können umgeschaltet werden) oder eine Drei-Algorithmus-Umschaltung (drei Sprach-CODECs können umgeschaltet werden) zu erreichen.
  • Andererseits, wie bei EVRC (Enhanced Variable Rate Codec), welcher als der TIA (Telecommunications Industry Association) Standard IS-127 in den USA oder als AMR (Adaptive Multi Rate) bekannt ist, wurden Mehrfachraten-Systeme vorgeschlagen, bei welchem ein CODEC verwendet wird, während mehrere unterschiedliche Kodierungsraten unterstützt werden.
  • Beispielsweise offenbart die PCT-Anmeldung BO 00/11650 ein Sprachenkodierungssystem. Der Sprachenkoder des Sprachenkodierungssystems enkodiert die digitalisierte Sprache unter Verwendung eines aus einer Mehrzahl von Enkodierungs-Modi, basierend auf den Kommunikationskanal-Umgebungen.
  • Ebenfalls offenbart das Dokument „A Multi Mode Variable Rate Speech Coder for CDMA Cellular Systems" von Naoja Tanaka et al., Conference Proceedings of the Vehicular Technology Conference, 1996, Mobile Technology for the Human Race. IEEE 46TH, Atlanta, GA, USA, vol 1, Seiten 198-202, ein Sprachenkodierungssystem. Dieses System verwendet eine Mehrzahl von Kodierungsmodi, wobei einer von ihnen durch einen Modus-Auswähler ausgewählt wird, welcher durch einen Rauschunterdrücker gesteuert wird, welcher dem ausgewählten Koder das Eingabesignal zuführt.
  • Darüber hinaus wurde eine Freihand-Funktion, welche es einem Benutzer ermöglicht, Rufe aufzubauen, ohne sein/ihr Handgerät anheben zu müssen, für den Benutzerkomfort bereitgestellt.
  • Jedoch kann bei der herkömmlichen Mehrfach-Modus- oder Mehrfach-Raten-Kommunikationseinrichtung der Rauschunterdrücker nicht vollständig funktionieren, und zwar aufgrund von einer Fehlanpassung zwischen dem Sprach-CODEC und dem Rauschunterdrücker in einem bestimmten ausgewählten Modus oder einer Rate. Daraus folgend kann eine übertragene Sprache oder eine empfangene Sprache mit hoher Qualität nicht erlangt werden.
  • Darüber hinaus kann bei der herkömmlichen Kommunikationseinrichtung mit der Freihand-Funktion, gemäß der Umschaltung zwischen dem Freihand-Algorithmus und dem Nicht-Freihand-Algorithmus, ein Spracheingabe-Pfad an den Rauschunterdrücker über ein Mikrophon, einen analogen Verstärker, usw., variieren, oder es können Spracheingabe-Eigenschaften variieren. Außerdem, wenn sich die Benutzungsumgebung ändert, kann, wenn beispielsweise eine neue Vorrichtung, wie beispielsweise ein Echo-Auslöscher, im Signalpfad zur Echo-Steuerung bereitgestellt ist, der Rauschunterdrücker nicht vollständig funktionieren, und eine übertragene Sprache oder empfangene Sprache kann nicht in hoher Qualität erlangt werden.
  • Es ist eine Aufgabe der vorliegenden Erfindung, eine Signalverarbeitungseinrichtung und ein Mobilfunkkommunikations-Endgerät bereitzustellen, wobei ein Rauschunterdrücker vollständig wirken kann und Sprache in hoher Qualität übertragen und empfangen werden kann, sogar wenn die Einstellungen zur Verwendung aufgrund von einer Umschaltung eines Algorithmus und von Raten oder von einer Umschaltung zwischen einem Freihandbetrieb und einem Nicht-Freihandbetrieb variiert werden.
  • Gemäß der Erfindung wird das Problem durch die Signalverarbeitungseinrichtung nach Anspruch 1 gelöst.
  • Zusätzlich, um die Aufgabe zu lösen, stellt die Ausführungsform von Anspruch 2 eine Signalverarbeitungseinrichtung bereit, welche enthält: einen Rauschunterdrücker, welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welcher ein Hintergrundrauschen, welches in einem Sprachsignal enthalten ist, unterdrückt; einen Sprachenkoder, welcher eine Mehrzahl von unterschiedlichen Kodierungsalgorithmen hat, welcher das unterdrückte Sprachsignal unter Verwendung eines der unterschiedlichen Kodierungsalgorithmen enkodiert; und wobei der Rauschunterdrücker eine Rauschunterdrückungscharakteristik gemäß dem verwendeten Kodierungsalgorithmus am Sprachenkoder auswählt.
  • In der Signalverarbeitungseinrichtung mit diesem Aufbau wird in einem Fall, bei welchem mehrere unterschiedliche Kodierungsalgorithmen selektiv durchgeführt werden, eine Rauschkomponente, welche in einem Sprachsignal enthalten ist, in einer Vorderstufe in Zusammenhang mit einem Kodierungsalgorithmus, welcher in einer Rückstufe durchgeführt wird, unterdrückt.
  • Gemäß der Signalverarbeitungseinrichtung mit diesem Aufbau wird, da die Rauschkomponente in Zusammenhang mit dem Kodierungsalgorithmus unterdrückt wird, die Rauschkomponente vollständig unterdrückt, und zwar sogar dann, wenn der Inhalt des Kodierungsalgorithmus variiert wird, und eine Sprache in hoher Qualität kann übertragen werden.
  • Zusätzlich, um die Aufgabe zu lösen, stellt die Ausführungsform von Anspruch 3 eine Signalverarbeitungseinrichtung bereit, welche enthält: einen Rauschunterdrücker, welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welcher ein Hintergrundrauschen, welches in einem Sprachsignal enthalten ist, unterdrückt; einen Sprachenkoder, welcher eine Mehrzahl von unterschiedlichen Kodierungsraten hat, welcher das unterdrückte Sprachsignal unter Verwendung einer der unterschiedlichen Kodierungsraten enkodiert; und wobei der Rauschunterdrücker eine Rauschunterdrückungscharakteristik gemäß der verwendeten Kodierungsrate am Sprachenkoder auswählt.
  • In der Signalverarbeitungseinrichtung mit diesem Aufbau wird in einem Fall, bei welchem mehrere unterschiedliche Kodierungsraten selektiv durchgeführt werden, eine Rauschkomponente, welche in einem Sprachsignal enthalten ist, in einer Vorderstufe in Zusammenhang mit einer Kodierungsrate, welche in einer Rückstufe durchgeführt wird, unterdrückt.
  • Gemäß der Signalverarbeitungseinrichtung mit diesem Aufbau werden, da die Rauschkomponente in Zusammenhang mit der Kodierungsrate unterdrückt wird, die Rauschkomponenten vollständig unterdrückt, und zwar sogar dann, wenn die Kodierungsrate variiert wird, und eine Sprache in hoher Qualität kann übertragen werden.
  • Gemäß der Erfindung wird das Problem ferner durch die Signalverarbeitungseinrichtung nach Anspruch 9 gelöst.
  • Zusätzlich, um die Aufgabe zu lösen, stellt die Erfindung nach Anspruch 10 eine Signalverarbeitungseinrichtung bereit, welche enthält: einen Sprachdekoder, welcher eine Mehrzahl von unterschiedlichen Dekodierungs-Algorithmen hat, welcher das enkodierte Sprachsignal unter Verwendung eines der unterschiedlichen Dekodierungs-Algorithmen dekodiert; einen Rauschunterdrücker, welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welcher eine Rauschkomponente, welche im dekodierten Sprachsignal enthalten ist, unterdrückt; und wobei der Rauschunterdrücker eine Rauschunterdrückungscharakteristik gemäß dem verwendeten Dekodierungs-Algorithmus am Sprachenkoder auswählt.
  • In der Signalverarbeitungseinrichtung mit diesem Aufbau werden mehrere unterschiedliche Dekodierungs-Algorithmen selektiv durchgeführt. Wenn eine Rauschkomponente, welche in einem Sprachsignal enthalten ist, in einer Rückstufe unterdrückt wird, wird eine Rauschkomponenten-Unterdrückung gemäß dem durchgeführten Dekodierungs-Algorithmus durchgeführt.
  • Gemäß der Signalverarbeitungseinrichtung mit diesem Aufbau wird, da die Rauschkomponente in Zusammenhang mit dem Dekodierungs-Algorithmus unterdrückt wird, die Rauschkomponente vollständig unterdrückt, und zwar sogar dann, wenn der Inhalt des Dekodierungs-Algorithmus variiert wird, und es kann eine Sprache in hoher Qualität empfangen werden.
  • Zusätzlich, um die Aufgabe zu lösen, stellt die Erfindung nach Anspruch 17 ein Mobilfunkkommunikations-Endgerät bereit, welches eine Signalverarbeitungseinrichtung hat, wobei die Signalverarbeitungseinrichtung enthält: einen Rauschunterdrücker, welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welcher ein Hintergrundrauschen, welches in einem Sprachsignal enthalten ist, unterdrückt; einen Sprachenkoder, welcher eine Mehrzahl von unterschiedlichen Kodierungsalgorithmen hat, welcher das unterdrückte Sprachsignal unter Verwendung eines der unterschiedlichen Kodierungsalgorithmen enkodiert; und wobei der Rauschunterdrücker eine Rauschunterdrückungscharakteristik gemäß dem verwendeten Kodierungsalgorithmus am Sprachenkoder auswählt.
  • In dem Mobilfunkkommunikations-Endgerät mit diesem Aufbau wird in einem Fall, bei welchem mehrere unterschiedliche Kodierungsalgorithmen selektiv durchgeführt werden, eine Rauschkomponente, welche in einem Sprachsignal enthalten ist, in einer Vorderstufe in Zusammenhang mit einem Kodierungsalgorithmus, welcher in einer Rückstufe durchgeführt wird, unterdrückt.
  • Gemäß dem Mobilfunkkommunikations-Endgerät mit diesem Aufbau wird, da die Rauschkomponente in Zusammenhang mit dem Kodierungsalgorithmus unterdrückt wird, die Rauschkomponente vollständig unterdrückt, und zwar sogar dann, wenn der Inhalt des Kodierungsalgorithmus variiert wird, und eine Sprache in hoher Qualität kann übertragen werden.
  • Zusätzlich, um die Aufgabe zu lösen, stellt die Erfindung nach Anspruch 17 ein Mobilfunkkommunikations-Endgerät bereit, welches eine Signalverarbeitungseinrichtung hat, wobei die Signalverarbeitungseinrichtung enthält: einen Rauschunterdrücker, welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welcher ein Hintergrundrauschen, welches in einem Sprachsignal enthalten ist, unterdrückt; einen Sprachenkoder, welcher eine Mehrzahl von unterschiedlichen Kodierungsraten hat, welcher das unterdrückte Sprachsignal unter Verwendung einer der unterschiedlichen Kodierungsraten enkodiert; und wobei der Rauschunterdrücker eine Rauschunterdrückungscharakteristik gemäß der verwendeten Kodierungsrate am Sprachenkoder auswählt.
  • In dem Mobilfunkkommunikations-Endgerät mit diesem Aufbau werden mehrere unterschiedliche Dekodierungsraten selektiv durchgeführt. Wenn eine Rauschkomponente, welche in einem Sprachsignal enthalten ist, in einer Rückstufe unterdrückt wird, wird eine Rauschkomponenten-Unterdrückung gemäß der verwendeten Kodierungsrate am Sprachenkoder durchgeführt.
  • Gemäß dem Mobilfunkkommunikations-Endgerät mit diesem Aufbau wird, da die Rauschkomponente in Zusammenhang mit der Kodierungsrate unterdrückt wird, die Rauschkomponente vollständig unterdrückt, und zwar sogar dann, wenn die Kodierungsrate variiert wird, und es kann eine Sprache in hoher Qualität empfangen werden.
  • Gemäß der Erfindung wird das Problem ferner durch die Signalverarbeitungseinrichtung nach Anspruch 18 gelöst.
  • Zusätzlich, um die Aufgabe zu lösen, stellt die Erfindung nach Anspruch 19 eine Signalverarbeitungseinrichtung bereit, welche enthält: einen Rauschunterdrücker, welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welcher ein Hintergrundrauschen unterdrückt, welches in einem Sprachsignal enthalten ist, wobei die Anzahl der Rauschunterdrückungscharakteristiken gleich Q (Q: eine positive Ganzzahl) ist; einen Sprachenkoder, welcher eine Mehrzahl von unterschiedlichen Kodierungs-Algorithmen hat, welcher das unterdrückte Sprachsignal unter Verwendung eines der unterschiedlichen Kodierungs-Algorithmen enkodiert, wobei die Anzahl der Kodierungs-Algorithmen gleich P (P: eine positive Ganzzahl) ist; und wobei der Rauschunterdrücker eine Rauschunterdrückungs-Charakteristik gemäß dem verwendeten Kodierungs-Algorithmus am Sprachenkoder auswählt, wobei die folgende Beziehung aufgebaut ist: P ≥ Q > 1.
  • In der Signalverarbeitungseinrichtung mit diesem Aufbau wird in einem Fall, bei welchem Kodierungsprozesse von mehreren unterschiedlichen Kodierungsalgorithmen selektiv durchgeführt werden, wenn eine Rauschkomponente, welche in einem Sprachsignal enthalten ist, in einer Vorderstufe zu unterdrücken ist, ein Rauschunterdrücker zum Unterdrücken der Rauschkomponente in Zusammenhang mit dem Kodierungsalgorithmus, welcher in einer Rückstufe durchgeführt wird, aus mehreren Rauschunterdrückern ausgewählt. Die Beziehung zwischen der Anzahl P der Kodierungsalgorithmen und der Anzahl Q der Rauschunterdrücker wird auf P ≥ Q > 1 eingestellt.
  • Gemäß der Signalverarbeitungseinrichtung mit diesem Aufbau kann, sogar wenn die Beziehung zwischen der Anzahl P der Kodierungsalgorithmen und der Anzahl Q der Rauschunterdrücker auf P ≥ Q > 1 eingestellt ist, die Rauschkomponente in Zusammenhang mit dem Kodierungsalgorithmus unterdrückt werden. Daher, sogar wenn der Inhalt des Kodierungsalgorithmus variiert wird, wird die Rauschkomponente vollständig unterdrückt, und es kann eine Sprache in hoher Qualität übertragen werden.
  • Zusätzlich, um die Aufgabe zu lösen, stellt die Erfindung nach Anspruch 20 eine Signalverarbeitungseinrichtung bereit, welche enthält: einen Rauschunterdrücker, welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welcher ein Hintergrundrauschen unterdrückt, welches in einem Sprachsignal enthalten ist, wobei die Anzahl der Rauschunterdrückungscharakteristiken gleich Q (Q: eine positive Ganzzahl) ist; einen Sprachenkoder, welcher eine Mehrzahl von unterschiedlichen Kodierungsraten hat, welcher das unterdrückte Sprachsignal unter Verwendung einer der unterschiedlichen Kodierungsraten enkodiert, wobei die Anzahl der Kodierungsraten gleich R (R: eine positive Ganzzahl) ist; und wobei der Rauschunterdrücker eine Rauschunterdrückungscharakteristik gemäß der verwendeten Kodierungsrate am Sprachenkoder auswählt, wobei die folgende Beziehung aufgebaut ist: R ≥ Q > 1.
  • In der Signalverarbeitungseinrichtung mit diesem Aufbau wird in einem Fall, bei welchem Kodierungsalgorithmen von mehreren unterschiedlichen Kodierungsraten selektiv durchgeführt werden, wenn eine Rauschkomponente, welche in einem Sprachsignal enthalten ist, in einer Vorderstufe zu unterdrücken ist, ein Rauschunterdrücker zum Unterdrücken der Rauschkomponente in Zusammenhang mit dem Kodierungsalgorithmus, welcher in einer Rückstufe durchgeführt wird, aus mehreren Rauschunterdrückern ausgewählt. Die Beziehung zwischen der Anzahl R der Kodierungsraten und der Anzahl Q der Rauschunterdrücker wird auf R ≥ Q > 1 eingestellt.
  • Gemäß der Signalverarbeitungseinrichtung mit diesem Aufbau kann, sogar wenn die Beziehung zwischen der Anzahl R der Kodierungsraten und der Anzahl Q der Rauschunterdrücker auf R ≥ Q > 1 eingestellt ist, die Rauschkomponente in Zusammenhang mit dem Kodierungsalgorithmus unterdrückt werden. Daher, sogar wenn die Kodierungsrate variiert wird, wird die Rauschkomponente vollständig unterdrückt, und es kann eine Sprache in hoher Qualität übertragen werden.
  • Zusätzlich, um die Aufgabe zu lösen, stellt die Erfindung nach Anspruch 21 eine Signalverarbeitungseinrichtung bereit, welche enthält: einen Rauschunterdrücker, welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welcher ein Hintergrundrauschen unterdrückt, welches in einem Sprachsignal enthalten ist, wobei die Rauschunterdrückungscharakteristiken gemäß einem Parameter variiert werden, welcher durch ein Parameter-Einstellmittel eingestellt ist; einen Sprachenkoder, welcher eine Mehrzahl von unterschiedlichen Kodierungsalgorithmen hat, welcher das unterdrückte Sprachsignal unter Verwendung eines der unterschiedlichen Kodierungsalgorithmen enkodiert, wobei die Anzahl der Kodierungsalgorithmen gleich P (P: eine positive Ganzzahl) ist; und wobei das Parameter-Einstellmittel einen geeigneten Parameter einstellt, um somit eine optimale Rauschunterdrückungscharakteristik gemäß dem verwendeten Kodierungsalgorithmus am Sprachenkoder auszuwählen, wobei die Anzahl der Parameter gleich S (S: eine positive Ganzzahl) ist, wobei die folgende Beziehung aufgebaut ist: R ≥ S > 1.
  • In der Signalverarbeitungseinrichtung mit diesem Aufbau werden in einem Fall, bei welchem Kodierungsprozesse von mehreren unterschiedlichen Kodierungsalgorithmen selektiv durchgeführt werden, wenn eine Rauschkomponente, welche in einem Sprachsignal enthalten ist, in einer Vorderstufe zu unterdrücken ist, Parameter aus mehreren Parameter-Einstellungen für einen Rauschunterdrücker ausgewählt, so dass der Rauschunterdrücker die Rauschkomponente mit Charakteristiken unterdrücken kann, welche für den Kodierungsalgorithmus geeignet sind, welcher in einer Rückstufe durchgeführt wird. Die Beziehung zwischen der Anzahl P der Kodierungsalgorithmen und der Anzahl S der Parameter-Einstellungen ist auf P ≥ S > 1 eingestellt.
  • Gemäß der Signalverarbeitungseinrichtung mit diesem Aufbau, sogar wenn die Beziehung zwischen der Anzahl P der Kodierungsalgorithmen und der Anzahl S der Parameter-Einstellungen auf P ≥ S > 1 eingestellt ist, kann die Rauschkomponente in Zusammenhang mit dem Kodierungsalgorithmus unterdrückt werden. Daher, sogar wenn der Inhalt des Kodierungsalgorithmus variiert wird, wird die Rauschkomponente vollständig unterdrückt, und es kann Sprache in hoher Qualität übertragen werden.
  • Zusätzlich, um die Aufgabe zu lösen, stellt die Erfindung nach Anspruch 22 eine Signalverarbeitungseinrichtung bereit, welche enthält: einen Rauschunterdrücker, welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welcher ein Hintergrundrauschen unterdrückt, welches in einem Sprachsignal enthalten ist, wobei die Rauschunterdrückungscharakteristiken gemäß einem Parameter variiert werden, welcher durch ein Parameter-Einstellmittel eingestellt ist; einen Sprachenkoder, welcher eine Mehrzahl von unterschiedlichen Kodierungsraten hat, welcher das unterdrückte Sprachsignal unter Verwendung einer der unterschiedlichen Kodierungsraten enkodiert, wobei die Anzahl der Kodierungsraten gleich R (R: eine positive Ganzzahl) ist; und wobei das Parameter-Einstellmittel einen geeigneten Parameter einstellt, um somit eine optimale Rauschunterdrückungscharakteristik gemäß der verwendeten Kodierungsrate am Sprachenkoder auszuwählen, wobei die Anzahl der Parameter gleich S (S: eine positive Ganzzahl) ist, wobei die folgende Beziehung aufgebaut ist: R ≥ S > 1.
  • In der Signalverarbeitungseinrichtung mit diesem Aufbau werden in einem Fall, bei welchem Kodierungsalgorithmen von mehreren unterschiedlichen Kodierungsraten selektiv durchgeführt werden, wenn eine Rauschkomponente, welche in einem Sprachsignal enthalten ist, in einer Vorderstufe zu unterdrücken ist, Parameter aus mehreren Parameter-Einstellungen für einen Rauschunterdrücker ausgewählt, so dass der Rauschunterdrücker die Rauschkomponente mit Eigenschaften unterdrücken kann, welche für den Kodierungsalgorithmus geeignet sind, welcher in einer Rückstufe durchgeführt wird. Die Beziehung zwischen der Anzahl R der Kodierungsraten und der Anzahl S der Parameter-Einstellungen ist auf R ≥ S > 1 eingestellt.
  • Gemäß der Signalverarbeitungseinrichtung mit diesem Aufbau, sogar wenn die Beziehung zwischen der Anzahl R der Kodierungsraten und der Anzahl S der Parameter-Einstellungen auf R ≥ S > 1 eingestellt ist, kann die Rauschkomponente in Zusammenhang mit dem Kodierungsalgorithmus unterdrückt werden. Daher wird, sogar wenn die Kodierungsrate variiert wird, die Rauschkomponente vollständig unterdrückt, und es kann Sprache in hoher Qualität übertragen werden.
  • Dieser Umriss der Erfindung beschreibt nicht notwendigerweise alle notwendigen Merkmale, so dass die Erfindung ebenfalls eine Unterkombination dieser beschriebenen Merkmale sein kann.
  • Die Erfindung kann vollständiger anhand der folgenden detaillierten Beschreibung verstanden werden, wenn sie in Verbindung mit den begleitenden Zeichnungen genommen wird, in denen:
  • 1 ein Sektions-Blockdiagramm ist, welches den Aufbau einer Signalverarbeitungseinrichtung gemäß einer ersten Ausführungsform der vorliegenden Erfindung zeigt;
  • 2 ein Ablaufdiagramm ist, welches den Betrieb der Signalverarbeitungseinrichtung gemäß der in 1 gezeigten ersten Ausführungsform darstellt;
  • 3 ein Sektions-Blockdiagramm ist, welches den Aufbau einer Signalverarbeitungseinrichtung gemäß einer zweiten Ausführungsform der vorliegenden Erfindung zeigt;
  • 4 ein Ablaufdiagramm ist, welches den Betrieb der Signalverarbeitungseinrichtung gemäß der in 3 gezeigten zweiten Ausführungsform darstellt;
  • 5 ein Sektions-Blockdiagramm ist, welches den Aufbau einer Signalverarbeitungseinrichtung gemäß einer dritten Ausführungsform der vorliegenden Erfindung zeigt;
  • 6 ein Ablaufdiagramm ist, welches den Betrieb der Signalverarbeitungseinrichtung gemäß der in 5 gezeigten dritten Ausführungsform darstellt;
  • 7 ein Sektions-Blockdiagramm ist, welches den Aufbau einer Signalverarbeitungseinrichtung gemäß einer vierten Ausführungsform der vorliegenden Erfindung zeigt;
  • 8 ein Ablaufdiagramm ist, welches den Betrieb der Signalverarbeitungseinrichtung gemäß der in 7 gezeigten vierten Ausführungsform darstellt;
  • 9 einen schematischen Aufbau einer Eingabe-Sprachkodierungs-Sektion zeigt, an welche die Signalverarbeitungseinrichtung der vorliegenden Erfindung angewendet wird;
  • 10 ein Sektions-Blockdiagramm ist, welches den Aufbau von einer Modifikation der dritten Ausführungsform zeigt;
  • 11 ein Kurvenverlauf ist, welcher eine Beziehung zwischen einem Kodierungs-Prozess und einem Rauschunterdrückungs-Prozess in einem Fall zeigt, bei welchem die Anzahl von Arten von Kodierungs-Prozessen nicht gleich der Anzahl von Arten von Rauschunterdrückungs-Prozessen ist;
  • 12 einen schematischen Aufbau einer Ausgabe-Sprachdekodierungs-Sektion zeigt, an welche die Signalverarbeitungseinrichtung der vorliegenden Erfindung angewendet wird;
  • 13 ein Beispiel des Aufbaus zeigt, bei welchem die Erfindung auf die Dekodierungssysteme angewendet wird;
  • 14 ein Ablaufdiagramm ist, welches den Betrieb der in 13 gezeigten Einrichtung darstellt;
  • 15 ein Sektions-Blockdiagramm ist, welches den Aufbau einer Modifikation des Sprachkoders in den in 1-7 gezeigten Signalverarbeitungseinrichtungen zeigt;
  • 16 ein Sektions-Blockdiagramm ist, welches den Aufbau von einer Modifikation des Rauschunterdrückers in den in 1-7 gezeigten Signalverarbeitungseinrichtungen zeigt;
  • 17 ein Beispiel von einer Parameter-Einstellung in dem in 16 gezeigten Rauschunterdrücker zeigt;
  • 18 ein weiteres Beispiel von einer Parameter-Einstellung in dem in 16 gezeigten Rauschunterdrücker zeigt;
  • 19 ein weiteres Beispiel von einer Parameter-Einstellung in dem in 16 gezeigten Rauschunterdrücker zeigt;
  • 20 ein Sektions-Blockdiagramm ist, welches den Aufbau von einer Modifikation des Rauschunterdrückers in den in 1-7 gezeigten Signalverarbeitungseinrichtungen zeigt;
  • 21 ein Sektions-Blockdiagramm ist, welches den Aufbau einer Signalverarbeitungseinrichtung zeigt, welche nicht beansprucht ist, jedoch aus Darstellungsgründen von weiteren Anwendungen im Bereich der Erfindung vorliegt;
  • 22 ein Ablaufdiagramm ist, welches den Betrieb der in 21 gezeigten Signalverarbeitungseinrichtung darstellt;
  • 23 ein Sektions-Blockdiagramm ist, welches den Aufbau einer Signalverarbeitungseinrichtung zeigt, welche nicht beansprucht ist, jedoch aus Darstellungsgründen von weiteren Anwendungen im Bereich der Erfindung vorliegt; und
  • 24 ein Ablaufdiagramm ist, welches den Betrieb der in 23 gezeigten Signalverarbeitungseinrichtung darstellt.
  • Es werden nun Ausführungsformen der vorliegenden Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.
  • 1 zeigt den Aufbau einer Signalverarbeitungseinrichtung gemäß einer ersten Ausführungsform der vorliegenden Erfindung.
  • Bezugszeichen 101 kennzeichnet ein Mikrophon zum Einfangen einer Benutzersprache, Umwandeln derer in ein elektrisches analoges Sprachsignal und Aufnehmen des analogen Sprachsignals; 102 kennzeichnet einen A/D-Umwandler zum Umwandeln des durch das Mikrophon 101 aufgenommenen analogen Sprachsignals in digitale Sprachdaten; 110 kennzeichnet einen Rauschunterdrücker zum Unterdrücken von Hintergrundrauschen, welches in den Sprachdaten enthalten ist, durch digitale Signalverarbeitung; 103 kennzeichnet Sprachdaten, bei welchem Hintergrundrauschen durch den Rauschunterdrücker 110 unterdrückt wurde; 120 kennzeichnet einen Sprachkoder zum Komprimieren und Kodieren der digitalen Sprachdaten 103; und 104 kennzeichnet kodierte Daten, welche durch den Sprachkoder 120 komprimiert sind.
  • Der Sprachkoder 120 enthält als drei Sektionen zum Kodieren von Sprachdaten durch unterschiedliche Algorithmen, eine Algorithmus-A Kodierungssektion 121, eine Algorithmus-B Kodierungssektion 122 und eine Algorithmus-C Kodierungssektion 123. Zusätzlich enthält der Sprachkoder 120 eine Kodierungsalgorithmus-Umschaltsteuersektion 124.
  • Beispielsweise führt die Algorithmus-A Kodierungssektion 121 einen Kodierungsprozess durch, bei welchem die Kodierungsrate niedrig ist, jedoch die Qualität von kodiertem Klang, in Relation zum Hintergrundrauschen, nicht gut ist. Die Algorithmus-C Kodierungssektion 123 führt einen Kodierungsprozess durch, bei welchem die Kodierungsrate hoch ist und die Qualität von kodiertem Klang, in Relation zum Hintergrundrauschen, relativ gut ist. Die Algorithmus-B Kodierungssektion 122 führt einen Kodierungsprozess durch, welcher dazu in der Lage ist, eine mittlere Sprachqualität zwischen der Algorithmus-A Kodierungssektion 121 und der Algorithmus-C Kodierungssektion 123 zu erlangen.
  • In Ansprechen auf einen externen Kodierungsalgorithmus-Auswahlbefehl 105, bewirkt die Kodierungsalgorithmus-Umschaltsteuersektion 124 ein Umschalten unter der Algorithmus-A Kodierungssektion 121, Algorithmus-B Kodierungssektion 122 und Algorithmus-C Kodierungssektion 123, so dass eine aus ihnen wirken kann. Zusätzlich führt die Kodierungsalgorithmus-Umschaltsteuersektion 124 eine Information, welche den durch die Umschaltung ausgewählten Kodierungsalgorithmus darstellt, an den Rauschunterdrücker 110 als eine Kodierungsalgorithmus-Auswahlinformation 106 zu.
  • Der Rauschunterdrücker 110 enthält, als drei Sektionen zum Unterdrücken von Hintergrundrauschen durch unterschiedliche Algorithmen, eine Algorithmus-X Rauschunterdrückungs-Sektion 111, eine Algorithmus-Y Rauschunterdrückungs-Sektion 112 und eine Algorithmus-Z Rauschunterdrückungs-Sektion 113. Jede Rauschunterdrückungs-Sektion hat jeweils eine unterschiedliche Rauschunterdrückungscharakteristik. Zusätzlich enthält der Rauschunterdrücker 110 eine Unterdrückungsalgorithmus-Umschaltsteuersektion 114.
  • In Ansprechen auf die Kodierungsalgorithmus-Auswahlinformation 106, bewirkt die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 ein Umschalten unter der Algorithmus-X Rauschunterdrückungs-Sektion 111, Algorithmus-Y Rauschunterdrückungs-Sektion 112 und Algorithmus-Z Rauschunterdrückungs-Sektion 113, so dass eine optimale unter ihnen wirken kann.
  • Bei der Umschaltsteuerung durch die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 wird die optimale Rauschunterdrückungs-Sektion (111, 112 oder 113) derart erstellt, um in Zusammenhang mit der Kodierungssektion (121, 122 oder 123), welche im Sprachkoder 120 aktiviert ist, zu wirken. Genauer gesagt, wenn die Algorithmus-A Kodierungssektion 121 wirkt, wird die Algorithmus-X Rauschunterdrückungs-Sektion 111 durch die Kodierungsalgorithmus-Auswahlinformation 106 ausgewählt. Wenn die Algorithmus-B Kodierungssektion 122 wirkt, wird die Algorithmus-Y Rauschunterdrückungs-Sektion 112 durch die Kodierungsalgorithmus-Auswahlinformation 106 ausgewählt. Wenn die Algorithmus-C Kodierungssektion 123 wirkt, wird die Algorithmus-Z Rauschunterdrückungs-Sektion 113 durch die Kodierungsalgorithmus-Auswahlinformation 106 ausgewählt.
  • Um die Übereinstimmung zwischen der Kodierungssektion und der Rauschunterdrückungs-Sektion zu optimieren, adaptiert die Algorithmus-X Rauschunterdrückungs-Sektion 111 beispielsweise ein spektrales Subtraktions-(SS)-Verfahren in einer Frequenzdomäne mit einer hohen Rauschunterdrückungsleistung, obwohl eine ein wenig komplexere Verarbeitung durchzuführen ist. Die Algorithmus-Y Rauschunterdrückungs-Sektion 112 adaptiert ein ähnliches SS-Verfahren, bei welchem jedoch eine weniger komplexe Verarbeitung als bei der Algorithmus-X Rauschunterdrückungs-Sektion 111 durchzuführen ist. Die Algorithmus-Z Rauschunterdrückungs-Sektion 113 adaptiert ein adaptives Filterverfahren in einer Zeitdomäne mit einem relativ einfachen Schema.
  • Der Betrieb der Signalverarbeitungseinrichtung gemäß der ersten Ausführungsform wird nun beschrieben. 2 ist ein Ablaufdiagramm, welches diesen Betrieb darstellt.
  • In einem Befehlseingabe-Bereitschaftszustand in Schritt 2a wird, wenn der Kodierungsalgorithmus-Auswahlbefehl 105 auf die Wirkung, dass „Benutze den Algorithmus-A als den Kodierungsalgorithmus" der Kodierungsalgorithmus-Umschaltsteuersektion 124 eingegeben wurde, die Steuerung mit Schritt 2b fortfahren, um den ausgewiesenen Kodierungsalgorithmus zu bestimmen. Da der ausgewiesene Kodierungsalgorithmus in diesem Fall der Algorithmus-A ist, geht die Steuerung auf Schritt 2c.
  • In Schritt 2c steuert die Kodierungsalgorithmus-Umschaltsteuersektion 124 die Umschaltung derart, dass die digitalen Daten 103 der Algorithmus-A Kodierungssektion 121 eingegeben werden können. Demgemäß beginnt die Algorithmus-A Kodierungssektion 121 mit einer Kodierung der eingegebenen digitalen Daten 103.
  • In Schritt 2c, parallel zur Umschaltsteuerung, gibt die Kodierungsalgorithmus-Umschaltsteuersektion 124 als die Kodierungsalgorithmus-Auswahlinformation 106 die Information auf die Wirkung, dass die Algorithmus-A Kodierungssektion 121 zur Kodierung der digitalen Daten 103 zu verwenden ist, an die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 aus. Die Steuerung geht dann auf Schritt 2d.
  • In Schritt 2d steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 die Steuerung derart, dass die Ausgabe vom A/D-Umwandler 102 in die Algorithmus-X Rauschunterdrückungs-Sektion 111 eintreten kann, wodurch eine Rauschunterdrückung durch die Algorithmus-X Rauschunterdrückungs-Sektion 111 bewirkt werden kann, welche für die Kodierung durch die Algorithmus-A Kodierungssektion 121 optimiert ist. Die Steuerung geht dann auf Schritt 2i.
  • Durch diesen Umschaltsteuerbetrieb wird die Ausgabe vom A/D-Umwandler 102 einer Rauschunterdrückung in der Algorithmus-X Rauschunterdrückungs-Sektion 111 unterworfen. Die Ausgabe von der Algorithmus-X Rauschunterdrückungs-Sektion 111 wird der Algorithmus-A Kodierungssektion 121 als digitale Daten 103 eingegeben. Die digitalen Daten 103 werden in der Algorithmus-A Kodierungssektion 121 kodiert, und die resultierenden Daten werden als kodierte Daten 104 ausgegeben.
  • In Schritt 2i wird, wenn der Kodierungsalgorithmus-Auswahlbefehl 105 auf die Wirkung, dass „Benutze den Algorithmus-B als Kodierungsalgorithmus" der Kodierungsalgorithmus-Umschaltsteuersektion 124 eingegeben wurde, die Steuerung mit Schritt 2b fortfahren, um den ausgewiesenen Kodierungsalgorithmus zu bestimmen. Da der ausgewiesene Kodierungsalgorithmus in diesem Fall der Algorithmus-B ist, geht die Steuerung auf Schritt 2e.
  • In Schritt 2e steuert die Kodierungsalgorithmus-Umschaltsteuersektion 124 eine Umschaltung zu einem korrekten Zeitpunkt, so dass die digitalen Daten 103 der Algorithmus-B Kodierungssektion 122 eingegeben werden können. Demgemäß beendet die Algorithmus-A Kodierungssektion 121 ihre Wirkung, und anstelle dessen beginnt die Algorithmus-B Kodierungssektion 122 eine Kodierung der eingegebenen digitalen Daten 103.
  • In Schritt 2e, parallel zur Umschaltsteuerung, gibt die Kodierungsalgorithmus-Umschaltsteuersektion 124 als die Kodierungsalgorithmus-Auswahlinformation 106 die Information auf die Wirkung, dass die Algorithmus-B Kodierungssektion 122 zur Kodierung der digitalen Daten 103 zu verwenden ist, an die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 aus. Die Steuerung geht dann auf Schritt 2f.
  • In Schritt 2f steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 eine Umschaltung derart, dass die Ausgabe vom A/D-Umwandler 102 in die Algorithmus-Y Rauschunterdrückungs-Sektion 112 eintreten kann, wodurch eine Rauschunterdrückung durch die Algorithmus-Y Rauschunterdrückungs-Sektion 112 bewirkt wird, welche für die Kodierung durch die Algorithmus-B Kodierungssektion 122 optimiert ist. Die Steuerung geht dann auf Schritt 2i.
  • Durch diesen Umschaltsteuerbetrieb wird die Ausgabe vom A/D-Umwandler 102 einer Rauschunterdrückung in der Algorithmus-Y Rauschunterdrückungs-Sektion 112 unterworfen. Die Ausgabe von der Algorithmus-Y Rauschunterdrückungs-Sektion 112 wird der Algorithmus-B Kodierungssektion 122 als digitalen Daten 103 eingegeben. Die digitalen Daten 103 werden in der Algorithmus-B Kodierungssektion 122 kodiert, und die resultierenden Daten werden als kodierte Daten 104 ausgegeben.
  • In Schritt 2i wird, wenn der Kodierungsalgorithmus-Auswahlbefehl 105 auf die Wirkung, dass „Benutze den Algorithmus-C als den Kodierungsalgorithmus" der Kodierungsalgorithmus-Umschaltsteuersektion 124 eingegeben wurde, während die digitalen Daten 103 in der Algorithmus-A Kodierungssektion 121 oder Algorithmus-B Kodierungssektion 122 kodiert werden, wie oben beschrieben, die Steuerung mit Schritt 2b fortfahren, um den ausgewiesenen Kodierungsalgorithmus zu bestimmen. Da der ausgewiesene Kodierungsalgorithmus in diesem Fall der Algorithmus-C ist, geht die Steuerung auf Schritt 2g.
  • In Schritt 2g steuert die Kodierungsalgorithmus-Umschaltsteuersektion 124 die Umschaltung zu einem korrekten Zeitpunkt derart, dass die digitalen Daten 103 der Algorithmus-C Kodierungssektion 123 eingegeben werden können. Demgemäß beendet die Algorithmus-A Kodierungssektion 121 oder Algorithmus-B Kodierungssektion 122 ihre Wirkung, und anstelle dessen beginnt die Algorithmus-C Kodierungssektion 123 eine Kodierung der eingegebenen digitalen Daten 103.
  • In Schritt 2g, parallel zur Umschaltsteuerung, gibt die Kodierungsalgorithmus-Umschaltsteuersektion 124 als die Kodierungsalgorithmus-Auswahlinformation 106, die Information auf die Wirkung, dass die Algorithmus-C Kodierungssektion 123 zur Kodierung der digitalen Daten 103 zu verwenden ist, an die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 aus. Die Steuerung geht dann auf Schritt 2h.
  • In Schritt 2h steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 die Umschaltung derart, dass die Ausgabe von A/D-Umwandler 102 in die Algorithmus-Z Rauschunterdrückungs-Sektion 113 eintreten kann, wodurch eine Rauschunterdrückung durch die Algorithmus-Z Rauschunterdrückungs-Sektion 113 bewirkt wird, welche für die Kodierung durch die Algorithmus-C Kodierungssektion 123 optimiert ist. Die Steuerung geht dann auf Schritt 2i.
  • Durch diesen Umschaltsteuerbetrieb wird die Ausgabe vom A/D-Umwandler 102 einer Rauschunterdrückung in der Algorithmus-Z Rauschunterdrückungs-Sektion 113 unterworfen. Die Ausgabe von der Algorithmus-Z Rauschunterdrückungs-Sektion 113 wird der Algorithmus-C Kodierungssektion 123 als digitale Daten 103 eingegeben. Die digitalen Daten 103 werden in der Algorithmus-C Kodierungssektion 123 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 104 ausgegeben.
  • In Schritt 2i, wenn kein Befehl eingegeben wird, geht die Steuerung auf Schritt 2j. In Schritt 2j wird bestimmt, ob eine Kommunikationsende-Anforderung eingegeben ist. Wenn die Kommunikationsende-Anforderung eingegeben wurde, ist der vorliegende Prozess beendet. Wenn die Kommunikationsende-Anforderung nicht eingegeben wurde, wird die Befehlseingabe abermals in Schritt 2i überwacht.
  • Wie oben beschrieben, wird in der Signalverarbeitungseinrichtung, welche den obigen Aufbau hat, wenn die komprimierten kodierten Daten 104 zu erlangen sind, die optimale Rauschunterdrückungs-Sektion (111, 112 oder 113) gemäß der Kodierungssektion (121, 122 oder 123), welche im Sprachkoder 120 wirkt, aktiviert.
  • Gemäß der Signalverarbeitungseinrichtung mit dem obigen Aufbau wird eine Rauschunterdrückung durch die optimale Rauschunterdrückungs-Sektion für die Kodierung durch den Sprachkoder 120 bewirkt. Somit wirkt die Rauschunterdrückungs-Sektion mit hoher Leistung, und es kann Sprache in hoher Qualität übertragen werden.
  • Die vorliegende Erfindung ist nicht auf die oben beschriebene Ausführungsform beschränkt. Beispielsweise wirkt in der ersten Ausführungsform die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 zum Aktivieren der optimalen Rauschunterdrückungs-Sektion gemäß der Kodierungssektion, welche im Sprachkoder 120 wirkt, auf der Basis von der Kodierungsalgorithmus-Auswahlinformation 106 von der Kodierungsalgorithmus-Umschaltsteuersektion 124.
  • Anstelle dessen kann die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 zum Aktivieren der optimalen Rauschunterdrückungs-Sektion gemäß der Kodierungssektion wirken, welche im Sprachkoder 120 wirkt, und zwar auf der Basis des Kodierungsalgorithmus-Auswahlbefehls 105. Durch diese Modifikation kann der gleiche Vorteil ebenfalls erlangt werden.
  • In diesem Fall steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 114 ein Umschalten, um die optimale Rauschunterdrückungs-Sektion zu einem korrekten Zeitpunkt in Anbetracht von der Umschaltzeit der Kodierungssektion im Sprachkoder 120 zu aktivieren.
  • Eine Signalverarbeitungseinrichtung gemäß einer zweiten Ausführungsform der vorliegenden Erfindung wird nun beschrieben. 3 zeigt den Aufbau dieser Signalverarbeitungseinrichtung.
  • Bezugszeichen 201 kennzeichnet ein Mikrophon zum Einfangen einer Benutzerruf-Sprache, Umwandeln derer in ein elektrisches analoges Sprachsignal und Aufnehmen des analogen Sprachsignals; 202 kennzeichnet einen A/D-Umwandler zum Umwandeln des analogen Sprachsignals, welches durch das Mikrophon 201 aufgenommen ist, in digitale Sprachdaten; 210 kennzeichnet einen Rauschunterdrücker zum Unterdrücken von Hintergrundrauschen, welches in den Sprachdaten enthalten ist, durch digitale Signalverarbeitung; 203 kennzeichnet Sprachdaten, in welchen ein Hintergrundrauschen durch den Rauschunterdrücker 210 unterdrückt wurde; 220 kennzeichnet einen Sprachkoder zum Komprimieren und Kodieren der digitalen Sprachdaten 203; und 204 kennzeichnet kodierte Daten, welche durch den Sprachkoder 220 komprimiert sind.
  • Der Sprachkoder 220 enthält, als drei Sektionen zum Kodieren von Sprachdaten durch unterschiedliche Algorithmen, eine Algorithmus-A Kodierungssektion 221, eine Algorithmus-B Kodierungssektion 222 und eine Algorithmus-C Kodierungssektion 223. Zusätzlich enthält der Sprachkoder 220 eine Kodierungsalgorithmus-Umschaltsteuersektion 224.
  • Beispielsweise führt die Algorithmus-A Kodierungssektion 221 einen Kodierungsprozess durch, bei welchem die Kodierungsrate niedrig ist, jedoch die Qualität von kodiertem Klang in Relation zum Hintergrundrauschen nicht gut ist. Die Algorithmus-C Kodierungssektion 223 führt einen Kodierungsprozess durch, bei welchem die Kodierungsrate hoch ist und die Qualität von kodiertem Klang in Relation zum Hintergrundrauschen relativ gut ist. Die Algorithmus-B Kodierungssektion 222 führt einen Kodierungsprozess durch, welcher dazu in der Lage ist, eine mittlere Sprachqualität zwischen der Algorithmus-A Kodierungssektion 221 und der Algorithmus-C Kodierungssektion 223 zu erlangen.
  • In Ansprechen auf einen externen Kodierungsalgorithmus-Auswahlbefehl 205 bewirkt die Kodierungsalgorithmus-Umschaltsteuersektion 224 ein Umschalten unter der Algorithmus-A Kodierungssektion 221, Algorithmus-B Kodierungssektion 222 und Algorithmus-C Kodierungssektion 223, so dass eine von ihnen wirken kann. Zusätzlich führt die Kodierungsalgorithmus-Umschaltsteuersektion 224 eine Information, welche den durch die Umschaltung ausgewählten Kodierungsalgorithmus darstellt, an den Rauschunterdrücker 210 als Kodierungsalgorithmus-Auswahlinformation 206 zu.
  • Der Rauschunterdrücker 210 enthält eine Rauschunterdrückungs-Sektion 215, eine Parameter-Tabelle 216 und eine Parameter-Umschaltsteuersektion 217.
  • Die Rauschunterdrückungs-Sektion 215 unterdrückt Hintergrundrauschen, welches in Sprachdaten enthalten ist, welche vom A/D-Umwandler 202 ausgegeben werden. Die Unterdrückungscharakteristiken zur Hintergrundrauschunterdrückung werden durch Parameter gesteuert, welche von der Parameter-Tabelle 216 eingegeben werden.
  • Die Parameter-Tabelle 216 speichert Parameter zum Einstellen der Charakteristiken für eine Hintergrundrauschunterdrückung, welche durch die Rauschunterdrückungs-Sektion 215 zu bewirken ist. Genauer gesagt, speichert die Parameter-Tabelle 216 drei Parameter-Einstellungen, um optimale Rauschunterdrückungscharakteristiken für den jeweiligen Kodierungsalgorithmus von der Algorithmus-A Kodierungssektion 221, Algorithmus-B Kodierungssektion 222 und Algorithmus-C Kodierungssektion 223 bereitzustellen. Eine Optimale aus den Parameter-Einstellungen wird der Rauschunterdrückungs-Sektion 215 durch die Steuerung der Parameter-Umschaltsteuersektion 217 eingegeben.
  • In der vorliegenden Ausführungsform wird angenommen, dass jede Parameter-Einstellung fünf Parameter enthält, und es werden Parameter-Einstellungen (drei in dieser Ausführungsform) für den jeweiligen Kodierungsalgorithmus vorbereitet.
  • Die Parameter-Umschaltsteuersektion 217 steuert die Parameter-Tabelle 216. Somit kann, basierend auf der Kodierungsalgorithmus-Auswahlinformation 206, eine der Parameter-Einstellungen, welche für die Kodierungssektion (221, 222 oder 223) optimal ist, welche im Sprachkoder 220 wirkt, selektiv in der Rauschunterdrückungs-Sektion 215 eingestellt werden.
  • Um die Übereinstimmung zwischen der Kodierungssektion und der Parameter-Einstellung (Rauschunterdrückungscharakteristik-Einstellung) in der Rauschunterdrückungs-Sektion zu optimieren, realisiert die Parameter-Einstellung, welche beispielsweise mit der Algorithmus-A Kodierungssektion 221 in Zusammenhang steht, solche Charakteristiken, um eine relativ hohe Rauschunterdrückungsgröße bereitzustellen, und um ein Rauschen soweit wie möglich zu reduzieren, sogar wenn eine bestimmte Störung in der Sprachkomponente auftritt. Die Parameter-Einstellung, welche mit der Algorithmus-C Kodierungssektion 223 in Zusammenhang steht, realisiert solche Charakteristiken, um eine relativ geringe Rauschunterdrückungsgröße bereitzustellen, und um Rauschen passieren zu lassen, welches natürlicherweise gehört werden kann.
  • Die Parameter-Einstellung, welche mit der Algorithmus-B Kodierungssektion 222 in Zusammenhang steht, stellt Zwischencharakteristiken zwischen jenen für die Algorithmus-A Kodierungssektion 221 und jenen für die Algorithmus-C Kodierungssektion 223 bereit.
  • Der Betrieb der Signalverarbeitungseinrichtung gemäß der zweiten Ausführungsform wird nun beschrieben. 4 ist ein Ablaufdiagramm, welches diesen Betrieb darstellt.
  • Bei einem Befehlseingabe-Bereitschaftszustand in Schritt 4a wird, wenn der Kodierungsalgorithmus-Auswahlbefehl 205 auf die Wirkung, dass „Benutze den Algorithmus-A als den Kodierungsalgorithmus" an die Kodierungsalgorithmus-Umschaltsteuersektion 224 eingegeben wurde, die Steuerung mit Schritt 4b fortfahren, um den ausgewiesenen Kodierungsalgorithmus zu bestimmen. Da der ausgewiesene Kodierungsalgorithmus in diesem Fall der Algorithmus-A ist, geht die Steuerung auf Schritt 4c.
  • In Schritt 4c steuert die Kodierungsalgorithmus-Umschaltsteuersektion 224 das Umschalten derart, dass die digitalen Daten 203 der Algorithmus-A Kodierungssektion 221 eingegeben werden können. Demgemäß beginnt die Algorithmus-A Kodierungssektion 221 mit einer Kodierung der eingegebenen digitalen Daten 203.
  • In Schritt 4c, parallel zur Umschaltsteuerung, gibt die Kodierungsalgorithmus-Umschaltsteuersektion 224, als die Kodierungsalgorithmus-Auswahlinformation 206, die Information auf die Wirkung, dass die Algorithmus-A Kodierungssektion 221 zur Kodierung der digitalen Daten 203 zu verwenden ist, an die Parameter-Umschaltsteuersektion 217 aus. Die Steuerung geht dann auf Schritt 4d.
  • In Schritt 4d steuert die Parameter-Umschaltsteuersektion 217 die Parameter-Tabelle 216, um die Parameter-Einstellung, welche mit der Algorithmus-A Kodierungssektion 221 in Zusammenhang steht, an die Rauschunterdrückungs-Sektion 215 einzugeben, so dass die Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 215 optimal für die Kodierung durch die Algorithmus-A Kodierungssektion 221 werden können. Die Steuerung geht dann auf Schritt 4i.
  • Durch diesen Parameter-Einstellungs-(Unterdrückungscharakteristik-Einstellung)-Steuerbetrieb, wird die Ausgabe von A/D-Umwandler 202 einer Rauschunterdrückung mit den Unterdrückungscharakteristiken unterworfen, welche für die Kodierung durch die Algorithmus-A Kodierungssektion 221 geeignet sind. Die Ausgabe von der Rauschunterdrückungs-Sektion 215 wird der Algorithmus-A Kodierungssektion 221 als digitale Daten 203 eingegeben. Die digitalen Daten 203 werden in der Algorithmus-A Kodierungssektion 221 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 204 ausgegeben.
  • In Schritt 4i wird, wenn der Kodierungsalgorithmus-Auswahlbefehl 205 auf die Wirkung, dass „Verwende den Algorithmus-B als den Kodierungsalgorithmus" der Kodierungsalgorithmus-Umschaltsteuersektion 224 eingegeben wurde, die Steuerung mit Schritt 4b fortfahren, um den ausgewiesenen Kodierungsalgorithmus zu bestimmen. Da der ausgewiesene Kodierungsalgorithmus in diesem Fall der Algorithmus-B ist, geht die Steuerung auf Schritt 4e.
  • In Schritt 4e steuert die Kodierungsalgorithmus-Umschaltsteuersektion 224 eine Umschaltung zu einem korrekten Zeitpunkt, so dass die digitalen Daten 203 der Algorithmus-B Kodierungssektion 222 eingegeben werden können. Demgemäß beendet die Algorithmus-A Kodierungssektion 221 ihren Betrieb, und anstelle dessen beginnt die Algorithmus-B Kodierungssektion 222 mit einer Kodierung der eingegebenen digitalen Daten 203.
  • In Schritt 4e, parallel zur Umschaltsteuerung, gibt die Kodierungsalgorithmus-Umschaltsteuersektion 224, als die Kodierungsalgorithmus-Auswahlinformation 206, die Information auf die Wirkung, dass die Algorithmus-B Kodierungssektion 222 zur Kodierung der digitalen Daten 203 zu verwenden ist, an die Parameter-Umschaltsteuersektion 217 aus. Die Steuerung geht dann auf Schritt 4f.
  • In Schritt 4f steuert die Parameter-Umschaltsteuersektion 217 die Parameter-Tabelle 216, um die Parameter-Einstellung, welche mit der Algorithmus-B Kodierungssektion 222 in Zusammenhang steht, der Rauschunterdrückungs-Sektion 215 einzugeben, so dass die Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 215 für die Kodierung durch die Algorithmus-B Kodierungssektion 222 optimal werden. Die Steuerung geht dann auf Schritt 4i.
  • Durch diesen Parameter-Einstellungs-(Unterdrückungscharakteristik-Einstellung)-Steuerbetrieb, wird die Ausgabe vom A/D-Umwandler 202 der Rauschunterdrückung mit den Unterdrückungscharakteristiken unterworfen, welche für die Kodierung durch die Algorithmus-B Kodierungssektion 222 geeignet sind. Die Ausgabe von der Rauschunterdrückungs-Sektion 215 wird der Algorithmus-B Kodierungssektion 222 als digitale Daten 203 eingegeben. Die digitalen Daten 203 werden in der Algorithmus-B Kodierungssektion 222 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 204 ausgegeben.
  • In Schritt 4i, wenn der Kodierungsalgorithmus-Auswahlbefehl 205 auf die Wirkung, dass „Verwende den Algorithmus-C als den Kodierungsalgorithmus" der Kodierungsalgorithmus-Umschaltsteuersektion 224 eingegeben wurde, während die digitalen Daten 203 in der Algorithmus-A Kodierungssektion 221 oder Algorithmus-B Kodierungssektion 222 kodiert werden, wie oben beschrieben, fährt die Steuerung mit Schritt 4b fort, um den ausgewiesenen Kodierungsalgorithmus zu bestimmen. Da der ausgewiesene Kodierungsalgorithmus in diesem Fall der Algorithmus-C ist, geht die Steuerung auf Schritt 4g.
  • In Schritt 4g steuert die Kodierungsalgorithmus-Umschaltsteuersektion 224 ein Umschalten zu einer korrekten Zeit, so dass die digitalen Daten 203 der Algorithmus-C Kodierungssektion 223 eingegeben werden können. Demgemäß beendet die Algorithmus-A Kodierungssektion 221 oder Algorithmus-B Kodierungssektion 222 ihren Betrieb, und anstelle dessen beginnt die Algorithmus-C Kodierungssektion 223 eine Kodierung der eingegebenen digitalen Daten 203.
  • In Schritt 4g, parallel zur Umschaltsteuerung, gibt die Kodierungsalgorithmus-Umschaltsteuersektion 224, als die Kodierungsalgorithmus-Auswahlinformation 206, die Information auf die Wirkung, dass die Algorithmus-C Kodierungssektion 223 zur Kodierung der digitalen Daten 203 zu verwenden ist, an die Parameter-Umschaltsteuersektion 217 aus. Die Steuerung geht dann auf Schritt 4h.
  • In Schritt 4h steuert die Parameter-Umschaltsteuersektion 217 die Parameter-Tabelle 216, um die Parameter-Einstellung, welche mit der Algorithmus-C Kodierungssektion 223 in Zusammenhang steht, an die Rauschunterdrückungs-Sektion 215 einzugeben, so dass die Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 215 für die Kodierung durch die Algorithmus-C Kodierungssektion 223 optimal werden können. Die Steuerung geht dann auf Schritt 4i.
  • Durch diesen Parameter-Einstellungs-(Unterdrückungscharakteristik-Einstellung)-Steuerbetrieb, wird die Ausgabe vom A/D-Umwandler 202 einer Rauschunterdrückung mit den Unterdrückungscharakteristiken unterworfen, welche für die Kodierung durch die Algorithmus-C Kodierungssektion 223 geeignet sind. Die Ausgabe von der Rauschunterdrückungs-Sektion 215 wird der Algorithmus-C Kodierungssektion 223 als digitale Daten 203 eingegeben. Die digitalen Daten 203 werden in der Algorithmus-C Kodierungssektion 223 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 204 ausgegeben.
  • In Schritt 4i, wenn kein Befehl eingegeben wird, geht die Steuerung auf Schritt 4j. In Schritt 4j wird bestimmt, ob eine Kommunikationsende-Anforderung eingegeben ist. Wenn die Kommunikationsende-Anforderung eingegeben wurde, wird der vorliegende Prozess beendet. Wenn die Kommunikationsende-Anforderung nicht eingegeben ist, wird eine Befehlseingabe abermals in Schritt 4i überwacht.
  • Wie oben beschrieben wurde, werden in der Signalverarbeitungseinrichtung, welche den obigen Aufbau hat, wenn die komprimierten kodierten Daten 204 zu erlangen sind, die Parameter in der Rauschunterdrückungs-Sektion 215 gemäß der Kodierungssektion (221, 222, 223), welche im Sprachkoder 220 wirkt, variiert. Dadurch werden die Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 215 für den Kodierungsprozess optimal eingestellt.
  • Gemäß der Signalverarbeitungseinrichtung mit dem obigen Aufbau wird eine optimale Rauschunterdrückung für die Kodierung durch den Sprachkoder 220 bewirkt. Somit wirkt die Rauschunterdrückungs-Sektion mit hoher Leistung, und es kann eine Sprache in hoher Qualität übertragen werden.
  • Die vorliegende Erfindung ist nicht auf die oben beschriebene Ausführungsform beschränkt. Beispielsweise, in der zweiten Ausführungsform, wirkt die Parameter-Umschaltsteuersektion 217 zur Optimierung der Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 215 gemäß der Kodierungssektion, welche im Sprachkoder 220 wirkt, auf der Basis der Kodierungsalgorithmus-Auswahlinformation 206 von der Kodierungsalgorithmus-Umschaltsteuersektion 224.
  • Anstelle dessen kann die Parameter-Umschaltsteuersektion 217 dazu wirken, um die Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 215 gemäß der Kodierungssektion, welche im Sprachkoder 220 wirkt, auf der Basis des Kodierungsalgorithmus-Auswahlbefehls 205 zu optimieren. Durch diese Modifikation kann der gleiche Vorteil ebenfalls erlangt werden.
  • In diesem Fall führt die Parameter-Umschaltsteuersektion 217 eine Steuerung zum Einstellen der Parameter-Einstellung durch, um die optimalen Rauschunterdrückungscharakteristiken zu einer korrekten Zeit hinsichtlich der Umschaltzeit von der Kodierungssektion im Sprachkoder 220 zu erlangen.
  • Eine Signalverarbeitungseinrichtung gemäß einer dritten Ausführungsform der vorliegenden Erfindung wird nun beschrieben. 5 zeigt den Aufbau dieser Signalverarbeitungseinrichtung.
  • Bezugszeichen 301 kennzeichnet ein Mikrophon zum Einfangen einer Benutzerruf-Sprache, Umwandeln derer in ein elektrisches analoges Sprachsignal und Aufnehmen des analogen Sprachsignals; 302 kennzeichnet einen A/D-Umwandler zum Umwandeln des analogen Sprachsignals, welches durch das Mikrophon 301 aufgenommen ist, in digitale Sprachdaten; 310 kennzeichnet einen Rauschunterdrücker zum Unterdrücken von Hintergrundrauschen, welches in den Sprachdaten enthalten ist, durch digitale Signalverarbeitung; 303 kennzeichnet Sprachdaten, in welchen Hintergrundrauschen durch den Rauschunterdrücker 310 unterdrückt wurden; 320 kennzeichnet einen Sprachkoder zum Komprimieren und Kodieren der digitalen Sprachdaten 303; und 304 kennzeichnet kodierte Daten, welche durch den Sprachkoder 320 komprimiert sind.
  • Der Sprachkoder 320 enthält, als drei Sektionen zum Kodieren von Sprachdaten durch unterschiedliche Kodierungsraten, eine Rate-A Kodierungssektion 321, eine Rate-B Kodierungssektion 322 und eine Rate-C Kodierungssektion 323. Zusätzlich enthält der Sprachkoder 320 eine Kodierungsrate-Umschaltsteuersektion 324.
  • Beispielsweise hat die Rate-A Kodierungssektion 321 eine niedrigste Kodierungsrate aus den drei Kodierungssektionen. Die Rate-C Kodierungssektion 323 hat eine höchste Kodierungsrate aus den drei Kodierungssektionen. Die Rate-B Kodierungssektion 322 hat eine mittlere Kodierungsrate zwischen der Rate-A Kodierungssektion 321 und der Rate-C Kodierungssektion 323.
  • In Ansprechen auf einen externen Kodierungsrate-Auswahlbefehl 305 bewirkt die Kodierungsrate-Umschaltsteuersektion 324 ein Umschalten unter der Rate-A Kodierungssektion 321, Rate-B Kodierungssektion 322 und Rate-C Kodierungssektion 323, so dass eine aus ihnen wirken kann. Zusätzlich führt die Kodierungsrate-Umschaltsteuersektion 324 eine Information, welche über die Kodierungsrate hinweist, welche durch die Umschaltung gewählt ist, an den Rauschunterdrücker 310 als eine Kodierungsrate-Auswahlinformation 306 zu.
  • Der Rauschunterdrücker 310 enthält, als drei Sektionen zum Unterdrücken von Hintergrundrauschen durch einen unterschiedlichen Algorithmus, eine Algorithmus-X Rauschunterdrückungs-Sektion 311, eine Algorithmus-Y Rauschunterdrückungs-Sektion 312 und eine Algorithmus-Z Rauschunterdrückungs-Sektion 313. Zusätzlich enthält der Rauschunterdrücker 310 eine Unterdrückungsalgorithmus-Umschaltsteuersektion 314.
  • In Ansprechen auf die Kodierungsrate-Auswahlinformation 306 bewirkt die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 ein Umschalten unter der Algorithmus-X Rauschunterdrückungs-Sektion 311, Algorithmus-Y Rauschunterdrückungs-Sektion 312 und Algorithmus-Z Rauschunterdrückungs-Sektion 313, so dass eine Optimale aus ihnen wirken kann.
  • Bei der Umschaltsteuerung durch die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 wird die optimale Rauschunterdrückungs-Sektion (311, 312 oder 313) zur Wirkung in Zusammenhang mit der Kodierungssektion (321, 322 oder 323), welche im Sprachkoder 320 aktiviert ist, erstellt. Genauer gesagt, wenn die Rate-A Kodierungssektion 321 wirkt, wird die Algorithmus-X Rauschunterdrückungs-Sektion 311 durch die Kodierungsrate-Auswahlinformation 306 ausgewählt. Wenn die Rate-B Kodierungssektion 322 wirkt, wird die Algorithmus-Y Rauschunterdrückungs-Sektion 312 durch die Kodierungsrate-Auswahlinformation 306 ausgewählt. Wenn die Rate-C Kodierungssektion 323 wirkt, wird die Algorithmus-Z Rauschunterdrückungs-Sektion 313 durch die Kodierungsrate-Auswahlinformation 306 ausgewählt.
  • Um die Übereinstimmung zwischen der Kodierungssektion und der Rauschunterdrückungs-Sektion zu optimieren, adaptiert die Algorithmus-X Rauschunterdrückungs-Sektion 311, beispielsweise ein spektrales Subtraktions-(SS)-Verfahren in einer Frequenzdomäne mit einer hohen Rauschunterdrückungsleistung, obwohl eine bestimmte komplexe Verarbeitung durchgeführt werden sollte. Die Algorithmus-Y Rauschunterdrückungs-Sektion 312 adaptiert ein ähnliches SS-Verfahren, bei welchem jedoch eine weniger komplexe Verarbeitung als in der Algorithmus-X Rauschunterdrückungs-Sektion 311 durchgeführt werden sollte. Die Algorithmus-Z Rauschunterdrückungs-Sektion 313 adaptiert ein adaptives Filterverfahren in einer Zeitdomäne mit einem relativ einfachen Schema.
  • Der Betrieb der Signalverarbeitungseinrichtung gemäß der dritten Ausführungsform wird nun beschrieben. 6 ist ein Ablaufdiagramm, welches diesen Betrieb darstellt.
  • In einem Befehlseingabe-Bereitschaftszustand in Schritt 6a, wenn der Kodierungsrate-Auswahlbefehl 305 auf die Wirkung, dass „Verwende die Rate-A als die Kodierungsrate" der Kodierungsrate-Umschaltsteuersektion 324 eingegeben wurde, fährt die Steuerung mit Schritt 6b weiter, um die ausgewiesene Kodierungsrate zu bestimmen. Da die ausgewiesene Kodierungsrate in diesem Fall die Rate-A ist, geht die Steuerung auf Schritt 6c.
  • In Schritt 6c steuert die Kodierungsrate-Umschaltsteuersektion 324 ein Umschalten derart, dass die digitalen Daten 303 der Rate-A Kodierungssektion 321 eingegeben werden können. Demgemäß beginnt die Rate-A Kodierungssektion 321 mit einer Kodierung der eingegebenen digitalen Daten 303.
  • In Schritt 6c, parallel zur Umschaltsteuerung, gibt die Kodierungsrate-Umschaltsteuersektion 324 als die Kodierungsrate-Auswahlinformation 306, die Information auf die Wirkung, dass die Rate-A Kodierungssektion 321 zur Kodierung der digitalen Daten 303 zu verwenden ist, an die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 aus. Die Steuerung geht dann auf Schritt 6d.
  • In Schritt 6d steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 eine Umschaltung derart, dass die Ausgabe von A/D-Umwandler 302 in die Algorithmus-X Rauschunterdrückungs-Sektion 311 eingehen kann, wodurch eine Rauschunterdrückung durch die Algorithmus-X Rauschunterdrückungs-Sektion 311 bewirkt wird, welche für die Kodierung durch die Rate-A Kodierungssektion 321 optimiert ist. Die Steuerung geht dann auf Schritt 6i.
  • Mit diesem Umschaltsteuerbetrieb wird die Ausgabe vom A/D-Umwandler 302 einer Rauschunterdrückung in der Algorithmus-X Rauschunterdrückungs-Sektion 311 unterworfen. Die Ausgabe von der Algorithmus-X Rauschunterdrückungs-Sektion 311 wird der Rate-A Kodierungssektion 321 als digitale Daten 303 eingegeben. Die digitalen Daten 303 werden in der Rate-A Kodierungssektion 321 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 304 ausgegeben.
  • In Schritt 6i, wenn der Kodierungsrate-Auswahlbefehl 305 auf die Wirkung, dass „Verwende die Rate-B als die Kodierungsrate" der Kodierungsrate-Umschaltsteuersektion 324 eingegeben wurde, fährt die Steuerung mit Schritt 6b fort, um die ausgewiesene Kodierungsrate zu bestimmen. Da die ausgewiesene Kodierungsrate in diesem Fall die Rate-B ist, geht die Steuerung auf Schritt 6e.
  • In Schritt 6e steuert die Kodierungsrate-Umschaltsteuersektion 324 eine Umschaltung zu einem korrekten Zeitpunkt, so dass die digitalen Daten 303 der Rate-B Kodierungssektion 322 eingegeben werden können. Demgemäß beendet die Rate-A Kodierungssektion 321 ihren Betrieb, und anstelle dessen beginnt die Rate-B Kodierungssektion 322 eine Kodierung der eingegebenen digitalen Daten 303.
  • In Schritt 6e, parallel zur Umschaltsteuerung, gibt die Kodierungsrate-Umschaltsteuersektion 324 als die Kodierungsrate-Auswahlinformation 306 die Information auf die Wirkung, dass die Rate-B Kodierungssektion 322 zu verwenden ist, um die digitalen Daten 303 zu kodieren, an die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 aus. Die Steuerung geht dann auf Schritt 6f.
  • In Schritt 6f steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 die Umschaltung derart, dass die Ausgabe vom A/D-Umwandler 302 in die Algorithmus-Y Rauschunterdrückungs-Sektion 312 eintreten kann, wodurch die Rauschunterdrückung durch die Algorithmus-Y Rauschunterdrückungs-Sektion 312 bewirkt wird, welche zur Kodierung durch die Rate-B Kodierungssektion 322 optimiert ist. Die Steuerung geht dann auf Schritt 6i.
  • Durch diesen Umschaltsteuerbetrieb wird die Ausgabe vom A/D-Umwandler 302 der Rauschunterdrückung in der Algorithmus-Y Rauschunterdrückungs-Sektion 312 unterworfen. Die Ausgabe von der Algorithmus-Y Rauschunterdrückungs-Sektion 312 wird der Rate-B Kodierungssektion 322 als digitale Daten 303 eingegeben. Die digitalen Daten 303 werden in der Rate-B Kodierungssektion 322 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 304 ausgegeben.
  • In Schritt 6i wird, wenn der Kodierungsrate-Auswahlbefehl 305 auf die Wirkung, dass „Verwende die Rate-C als die Kodierungsrate" der Kodierungsrate-Umschaltsteuersektion 324 eingegeben wurde, während die digitalen Daten 303 in der Rate-A Kodierungssektion 321 oder Rate-B Kodierungssektion 322 kodiert werden, wie oben beschrieben, die Steuerung mit Schritt 6b fortfahren, um die ausgewiesene Kodierungsrate zu bestimmen. Da die ausgewiesene Kodierungsrate in diesem Fall die Rate-C ist, geht die Steuerung auf Schritt 6g.
  • In Schritt 6g steuert die Kodierungsrate-Umschaltsteuersektion 324 das Umschalten zu einem korrekten Zeitpunkt, so dass die digitalen Daten 303 der Rate-C Kodierungssektion 323 eingegeben werden können. Demgemäß beendet die Rate-A Kodierungssektion 321 oder Rate-B Kodierungssektion 322 ihren Betrieb, und anstelle dessen beginnt die Rate-C Kodierungssektion 323 eine Kodierung der eingegebenen digitalen Daten 303.
  • In Schritt 6g, parallel zur Umschaltsteuerung, gibt die Kodierungsrate-Umschaltsteuersektion 324 als die Kodierungsrate-Auswahlinformation 306 die Information auf die Wirkung, dass die Rate-C Kodierungssektion 323 zur Kodierung der digitalen Daten 303 zu verwenden ist, an die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 aus. Die Steuerung geht dann auf Schritt 6h.
  • In Schritt 6h steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 ein Umschalten derart, dass die Ausgabe vom A/D-Umwandler 302 in die Algorithmus-Z Rauschunterdrückungs-Sektion 313 eintreten kann, wodurch eine Rauschunterdrückung durch die Algorithmus-Z Rauschunterdrückungs-Sektion 313 bewirkt wird, welche für die Kodierung durch die Rate-C Kodierungssektion 323 optimiert ist. Die Steuerung geht dann auf Schritt 6i.
  • Mit diesem Umschaltsteuerbetrieb wird die Ausgabe vom A/D-Umwandler 302 der Rauschunterdrückung in der Algorithmus-Z Rauschunterdrückungs-Sektion 313 unterworfen. Die Ausgabe von der Algorithmus-Z Rauschunterdrückungs-Sektion 313 wird der Rate-C Kodierungssektion 323 als digitale Daten 303 eingegeben. Die digitalen Daten 303 werden in der Rate-C Kodierungssektion 323 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 304 ausgegeben.
  • In Schritt 6i geht die Steuerung, wenn kein Befehl eingegeben wird, auf Schritt 6j. In Schritt 6j wird bestimmt, ob eine Kommunikationsende-Anforderung eingegeben ist. Wenn die Kommunikationsende-Anforderung eingegeben wurde, wird der vorliegende Prozess beendet. Wenn die Kommunikationsende-Anforderung nicht eingegeben ist, wird die Befehlseingabe in Schritt 6i abermals überwacht.
  • Wie oben beschrieben, wird bei der Signalverarbeitungseinrichtung, welche den obigen Aufbau hat, wenn die komprimierten kodierten Daten 304 zu erlangen sind, die optimale Rauschunterdrückungs-Sektion (311, 312 oder 313) gemäß der Kodierungssektion (321, 322 oder 323), welche im Sprachkoder 320 wirkt, aktiviert.
  • Gemäß der Signalverarbeitungseinrichtung mit dem obigen Aufbau wird eine Rauschunterdrückung durch die optimale Rauschunterdrückungs-Sektion für die Kodierung durch den Sprachkoder 320 bewirkt. Somit wirkt die Rauschunterdrückungs-Sektion mit hoher Leistung, und es kann eine Sprache in hoher Qualität übertragen werden.
  • Die vorliegende Erfindung ist nicht auf die oben beschriebene Ausführungsform beschränkt. Beispielsweise wirkt in der dritten Ausführungsform die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 zur Aktivierung der optimalen Rauschunterdrückungs-Sektion gemäß der Kodierungssektion, welche im Sprachkoder 320 wirkt, und zwar auf der Basis von der Kodierungsrate-Auswahlinformation 320 von der Kodierungsrate-Umschaltsteuersektion 324.
  • Anstelle dessen kann die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 zur Aktivierung der optimalen Rauschunterdrückungs-Sektion gemäß der Kodierungssektion, welche im Sprachkoder 320 wirkt, auf der Basis des Kodierungsrate-Auswahlbefehls 305 wirken. Durch diese Modifikation kann der gleiche Vorteil ebenfalls erlangt werden.
  • In diesem Fall steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 314 ein Umschalten, um die optimale Rauschunterdrückungs-Sektion zu einem korrekten Zeitpunkt hinsichtlich der Umschaltzeit von der Kodierungssektion im Sprachkoder 320 zu aktivieren.
  • Eine Signalverarbeitungseinrichtung gemäß einer vierten Ausführungsform der vorliegenden Erfindung wird nun beschrieben. 7 zeigt den Aufbau dieser Signalverarbeitungseinrichtung.
  • Bezugszeichen 401 kennzeichnet ein Mikrophon zum Einfangen einer Benutzerruf-Sprache, Umwandeln derer in ein elektrisches analoges Sprachsignal und Aufnehmen des analogen Sprachsignals; 402 kennzeichnet einen A/D-Umwandler zum Umwandeln des durch das Mikrophon 401 aufgenommenen analogen Sprachsignals in digitale Sprachdaten; 410 kennzeichnet einen Rauschunterdrücker zum Unterdrücken von Hintergrundrauschen, welches in den Sprachdaten enthalten ist, durch eine digitale Signalverarbeitung; 403 kennzeichnet Sprachdaten, in welchen Hintergrundrauschen durch den Rauschunterdrücker 410 unterdrückt wurde; 420 kennzeichnet einen Sprachkoder zum Komprimieren und Kodieren der digitalen Sprachdaten 403; und 404 kennzeichnet kodierte Daten, welche durch den Sprachkoder 420 komprimiert sind.
  • Der Sprachkoder 420 enthält, als drei Sektionen zum Kodieren von Sprachdaten durch unterschiedliche Kodierungsraten, eine Rate-A Kodierungssektion 421, eine Rate-B Kodierungssektion 422 und eine Rate-C Kodierungssektion 423. Zusätzlich enthält der Sprachkoder 420 eine Kodierungsrate-Umschaltsteuersektion 424.
  • Beispielsweise hat die Rate-A Kodierungssektion 421 eine niedrigste Kodierungsrate von den drei Kodierungssektionen. Die Rate-C Kodierungssektion 423 hat eine höchste Kodierungsrate von den drei Kodierungssektionen. Die Rate-B Kodierungssektion 422 hat eine mittlere Kodierungsrate zwischen der Rate-A Kodierungssektion 421 und der Rate-C Kodierungssektion 423.
  • In Ansprechen auf einen externen Kodierungsrate-Auswahlbefehl 405 bewirkt die Kodierungsrate-Umschaltsteuersektion 424 ein Umschalten unter der Rate-A Kodierungssektion 421, Rate-B Kodierungssektion 422 und Rate-C Kodierungssektion 423, so dass eine aus ihnen wirken kann. Zusätzlich führt die Kodierungsrate-Umschaltsteuersektion 424 eine Information, welche über die Kodierungsrate hinweist, welche durch das Umschalten ausgewählt ist, an den Rauschunterdrücker 410 als Kodierungsrate-Auswahlinformation 406 zu.
  • Der Rauschunterdrücker 410 enthält eine Rauschunterdrückungs-Sektion 415, eine Parameter-Tabelle 416 und eine Parameter-Umschaltsteuersektion 417.
  • Die Rauschunterdrückungs-Sektion 415 unterdrückt ein Hintergrundrauschen, welches in Sprachdaten enthalten ist, welche vom A/D-Umwandler 402 ausgegeben werden. Die Unterdrückungscharakteristiken zur Hintergrundrauschen-Unterdrückung werden durch Parameter gesteuert, welche von der Parameter-Tabelle 416 eingegeben werden.
  • Die Parameter-Tabelle 416 speichert Parameter zum Einstellen der Charakteristiken zur Hintergrundrauschen-Unterdrückung, welche durch die Rauschunterdrückungs-Sektion 415 zu bewirken ist. Genauer gesagt, speichert die Parameter-Tabelle 416 drei Parameter-Einstellungen, um optimale Rauschunterdrückungscharakteristiken für die jeweiligen Kodierungsraten der Rate-A Kodierungssektion 421, Rate-B Kodierungssektion 422 und Rate-C Kodierungssektion 423 bereitzustellen. Eine Optimale aus den Parameter-Einstellungen wird der Rauschunterdrückungs-Sektion 415 durch die Steuerung der Parameter-Umschaltsteuersektion 417 eingegeben.
  • Die Parameter-Umschaltsteuersektion 417 steuert die Parameter-Tabelle 416. Somit kann, basierend auf der Kodierungsrate-Auswahlinformation 406, eine der Parameter-Einstellungen, welche für die Kodierungssektion (421, 422 oder 423) optimal ist, welche im Sprachkoder 420 wirkt, selektiv in der Rauschunterdrückungs-Sektion 415 eingestellt werden.
  • Um die Übereinstimmung zwischen der Kodierungssektion und der Parameter-Einstellung (Rauschunterdrückungscharakteristik-Einstellung) in der Rauschunterdrückungs-Sektion zu optimieren, realisiert beispielsweise die Parameter-Einstellung, welche mit der Rate-A Kodierungssektion 421 in Zusammenhang steht, solche Charakteristiken, um eine relativ hohe Rauschunterdrückungsgröße bereitzustellen und um Rauschen soweit wie möglich zu reduzieren, und zwar sogar dann, wenn eine bestimmte Störung in der Sprachkomponente auftritt. Die Parameter-Einstellung, welche mit der Rate-C Kodierungssektion 423 in Zusammenhang steht, realisiert solche Charakteristiken, um eine relativ geringe Rauschunterdrückungsgröße bereitzustellen und um Rauschen zu passieren, welches naturgemäß gehört werden kann.
  • Die Parameter-Einstellung, welche mit der Rate-B Kodierungssektion 422 in Zusammenhang steht, stellt mittlere Charakteristiken zwischen jenen für die Rate-A Kodierungssektion 421 und jenen für die Rate-C Kodierungssektion 423 bereit.
  • Der Betrieb der Signalverarbeitungseinrichtung gemäß der vierten Ausführungsform wird nun beschrieben. 8 ist ein Ablaufdiagramm, welches diesen Betrieb darstellt.
  • In einem Befehlseingabe-Bereitschaftszustand in Schritt 8a, wenn der Kodierungsrate-Auswahlbefehl 405 auf die Wirkung, dass „Verwende die Rate-A als die Kodierungsrate" der Kodierungsrate-Umschaltsteuersektion 424 eingegeben wurde, fährt die Steuerung mit Schritt 8b fort, um die ausgewiesene Kodierungsrate zu bestimmen. Da die ausgewiesene Kodierungsrate in diesem Fall die Rate-A ist, geht die Steuerung auf Schritt 8c.
  • In Schritt 8c steuert die Kodierungsrate-Umschaltsteuersektion 424 ein Umschalten derart, dass die digitalen Daten 403 der Rate-A Kodierungssektion 421 eingegeben werden können. Demgemäß beginnt die Rate-A Kodierungssektion 421 eine Kodierung der eingegebenen digitalen Daten 403.
  • In Schritt 8c, parallel zur Umschaltsteuerung, gibt die Kodierungsrate-Umschaltsteuersektion 424 als die Kodierungsrate-Auswahlinformation 406, die Information auf die Wirkung, dass die Rate-A Kodierungssektion 421 zur Kodierung der digitalen Daten 403 zu verwenden ist, an die Parameter-Umschaltsteuersektion 417 aus. Die Steuerung geht dann auf Schritt 8d.
  • In Schritt 8d steuert die Parameter-Umschaltsteuersektion 417 die Parameter-Tabelle 416, um die Parameter-Einstellung, welche mit der Rate-A Kodierungssektion 421 in Zusammenhang steht, der Rauschunterdrückungs-Sektion 415 einzugeben, so dass die Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 415 für die Kodierung durch die Rate-A Kodierungssektion 421 optimal werden können. Die Steuerung geht dann auf Schritt 8i.
  • Mit diesem Parameter-Einstellungs-(Unterdrückungscharakteristik-Einstellung)-Steuerbetrieb wird die Ausgabe vom A/D-Umwandler 402 der Rauschunterdrückung mit den Unterdrückungscharakteristiken unterworfen, welche für die Kodierung durch die Rate-A Kodierungssektion 421 geeignet sind. Die Ausgabe von der Rauschunterdrückungs-Sektion 415 wird der Rate-A Kodierungssektion 421 als digitale Daten 403 eingegeben. Die digitalen Daten 403 werden in der Rate-A Kodierungssektion 421 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 404 ausgegeben.
  • In Schritt 8i, wenn der Kodierungsrate-Auswahlbefehl 405 auf die Wirkung, dass „Verwende die Rate-B als die Kodierungsrate" der Kodierungsrate-Umschaltsteuersektion 424 eingegeben wurde, fährt die Steuerung mit Schritt 8b fort, um die ausgewiesene Kodierungsrate zu bestimmen. Da die ausgewiesene Kodierungsrate in diesem Fall die Rate-B ist, geht die Steuerung auf Schritt 8e.
  • In Schritt 8e steuert die Kodierungsrate-Umschaltsteuersektion 424 ein Umschalten zu einem korrekten Zeitpunkt, so dass die digitalen Daten 403 der Rate-B Kodierungssektion 422 eingegeben werden können. Demgemäß beendet die Rate-A Kodierungssektion 421 ihren Betrieb, und anstelle dessen beginnt die Rate-B Kodierungssektion 422 eine Kodierung der eingegebenen digitalen Daten 403.
  • In Schritt 8e, parallel zur Umschaltsteuerung, gibt die Kodierungsrate-Umschaltsteuersektion 424 als die Kodierungsrate-Auswahlinformation 406 die Information auf die Wirkung, dass die Rate-B Kodierungssektion 422 zur Kodierung der digitalen Daten 403 zu verwenden ist, an die Parameter-Umschaltsteuersektion 417 aus. Die Steuerung geht dann auf Schritt 8f.
  • In Schritt 8f steuert die Parameter-Umschaltsteuersektion 417 die Parameter-Tabelle 416, um die Parameter-Einstellung, welche mit der Rate-B Kodierungssektion 422 in Zusammenhang steht, der Rauschunterdrückungs-Sektion 415 einzugeben, so dass die Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 415 für die Kodierung durch die Rate-B Kodierungssektion 422 optimal werden können. Die Steuerung geht dann auf Schritt 8i.
  • Mit diesem Parameter-Einstellungs-(Unterdrückungscharakteristik-Einstellung)-Steuerbetrieb wird die Ausgabe vom A/D-Umwandler 402 einer Rauschunterdrückung mit den Unterdrückungscharakteristiken unterworfen, welche für die Kodierung durch die Rate-B Kodierungssektion 422 geeignet sind. Die Ausgabe von der Rauschunterdrückungs-Sektion 415 wird der Rate-B Kodierungssektion 422 als digitale Daten 403 eingegeben. Die digitalen Daten 403 werden in der Rate-B Kodierungssektion 422 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 404 ausgegeben.
  • In Schritt 8i, wenn der Kodierungsrate-Auswahlbefehl 405 auf die Wirkung, dass „Verwende die Rate-C als die Kodierungsrate" der Kodierungsrate-Umschaltsteuersektion 424 eingegeben wurde, während die digitalen Daten 403 in der Rate-A Kodierungssektion 421 oder Rate-B Kodierungssektion 422 kodiert werden, wie oben beschrieben, fährt die Steuerung mit Schritt 8b fort, um die ausgewiesene Kodierungsrate zu bestimmen. Da die ausgewiesene Kodierungsrate in diesem Fall die Rate-C ist, geht die Steuerung auf Schritt 8g.
  • In Schritt 8g steuert die Kodierungsrate-Umschaltsteuersektion 424 ein Umschalten zu einem korrekten Zeitpunkt, so dass die digitalen Daten 403 der Rate-C Kodierungssektion 423 eingegeben werden können. Demgemäß beendet die Rate-A Kodierungssektion 421 oder Rate-B Kodierungssektion 422 ihren Betrieb, und anstelle dessen beginnt die Rate-C Kodierungssektion 423 eine Kodierung der eingegebenen digitalen Daten 403.
  • In Schritt 8g, parallel zur Umschaltsteuerung, gibt die Kodierungsrate-Umschaltsteuersektion 424 als die Kodierungsrate-Auswahlinformation 406 die Information auf die Wirkung, dass die Rate-C Kodierungssektion 423 zur Kodierung der digitalen Daten 403 zu verwenden ist, an die Parameter-Umschaltsteuersektion 417 aus. Die Steuerung geht dann auf Schritt 8h.
  • In Schritt 8h steuert die Parameter-Umschaltsteuersektion 417 die Parameter-Tabelle 416, um die Parameter-Einstellung, welche mit der Rate-C Kodierungssektion 423 in Zusammenhang steht, der Rauschunterdrückungs-Sektion 415 einzugeben, so dass die Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 415 für die Kodierung durch die Rate-C Kodierungssektion 423 optimal werden können. Die Steuerung geht dann auf Schritt 8i.
  • Mit diesem Parameter-Einstellungs-(Unterdrückungscharakteristik-Einstellung)-Steuerbetrieb wird die Ausgabe vom A/D-Umwandler 402 der Rauschunterdrückung mit den Unterdrückungscharakteristiken unterworfen, welche für die Kodierung durch die Rate-C Kodierungssektion 423 geeignet sind. Die Ausgabe von der Rauschunterdrückungs-Sektion 415 wird der Rate-C Kodierungssektion 423 als digitale Daten 403 eingegeben. Die digitalen Daten 403 werden in der Rate-C Kodierungssektion 423 kodiert, und die resultierenden Daten werden als komprimierte kodierte Daten 404 ausgegeben.
  • In Schritt 8i, wenn kein Befehl eingegeben wird, geht die Steuerung auf Schritt 8j. In Schritt 8j wird bestimmt, ob eine Kommunikationsende-Anforderung eingegeben ist. Wenn die Kommunikationsende-Anforderung eingegeben wurde, wird der vorliegende Prozess beendet. Wenn die Kommunikationsende-Anforderung nicht eingegeben ist, wird die Befehlseingabe in Schritt 8i abermals überwacht.
  • Wie oben beschrieben, werden in der Signalverarbeitungseinrichtung, welche den obigen Aufbau hat, wenn die komprimierten kodierten Daten 404 zu erlangen sind, die Parameter in der Rauschunterdrückungs-Sektion 415 gemäß der Kodierungssektion (421, 422 oder 423), welche im Sprachkoder 420 wirkt, variiert. Dadurch werden die Rauschunterdrückungscharakteristiken der Rauschunterdrückungs-Sektion 415 derart eingestellt, um für den Kodierungsprozess optimal zu sein.
  • Gemäß der Signalverarbeitungseinrichtung mit dem obigen Aufbau wird eine optimale Rauschunterdrückung für die Kodierung durch den Sprachkoder 420 bewirkt. Somit wirkt die Rauschunterdrückungs-Sektion mit hoher Leistung, und es kann eine Sprache mit hoher Qualität übertragen werden.
  • Die vorliegende Erfindung ist nicht auf die oben beschriebene Ausführungsform beschränkt. Beispielsweise wirkt in der vierten Ausführungsform die Parameter-Umschaltsteuersektion 417 zur Optimierung der Rauschunterdrückungscharakteristiken von der Rauschunterdrückungs-Sektion 415 gemäß der Kodierungssektion, welche im Sprachkoder 420 wirkt, auf der Basis von der Kodierungsrate-Auswahlinformation 406 von der Kodierungsrate-Umschaltsteuersektion 424.
  • Anstelle dessen kann die Parameter-Umschaltsteuersektion 417 dazu wirken, um die Rauschunterdrückungscharakteristiken von der Rauschunterdrückungs-Sektion 415 gemäß der Kodierungssektion, welche im Sprachkoder 420 wirkt, auf der Basis vom Kodierungsrate-Auswahlbefehl 405 zu optimieren. Durch diese Modifikation kann der gleiche Vorteil ebenfalls erlangt werden.
  • In diesem Fall führt die Parameter-Umschaltsteuersektion 417 eine Steuerung durch, um die Parameter-Einstellung einzustellen, um die optimalen Rauschunterdrückungscharakteristiken zu einem korrekten Zeitpunkt in Anbetracht des Umschalt-Zeitpunktes von der Kodierungssektion im Sprachkoder 420 zu erlangen.
  • Wie in 9 dargestellt, wird in der ersten bis vierten Ausführungsform eine zu übertragene Sprache kodiert. In 9 kennzeichnet Bezugszeichen 1 ein Mikrophon und kennzeichnet 2 einen A/D-Umwandler. Ein Rauschunterdrücker 10 entspricht dem Rauschunterdrücker 110, 210, 310, 410, und ein Sprachkoder 20 entspricht dem Sprachkoder 120, 220, 320, 420.
  • In der ersten und zweiten Ausführungsform wird angenommen, dass die Anzahl von Kodierungsalgorithmen (das heißt drei; Algorithmus-A, Algorithmus-B und Algorithmus-C) gleich der Anzahl von Rauschunterdrückungsalgorithmen (das heißt drei; Algorithmus-X, Algorithmus-Y und Algorithmus-Z) ist, und dass die Anzahl von Kodierungsalgorithmen gleich der Anzahl von Parameter-Einstellungen ist, welche in der Rauschunterdrückungs-Sektion eingestellt sind.
  • In der dritten und vierten Ausführungsform wird ebenfalls angenommen, dass die Anzahl von Kodierungsraten (das heißt drei; Rate-A, Rate-B und Rate-C) gleich der Anzahl von Rauschunterdrückungsalgorithmen (das heißt drei; Algorithmus-X, Algorithmus-Y und Algorithmus-Z) ist, und dass die Anzahl von Kodierungsraten gleich der Anzahl von Parameter-Einstellungen ist, welche in der Rauschunterdrückungs-Sektion eingestellt sind.
  • Jedoch kann bei der praktischen Umsetzung der vorliegenden Erfindung die Anzahl von Kodierungsalgorithmen ungleich der Anzahl von Rauschunterdrückungsalgorithmen sein, und die Anzahl von Kodierungsalgorithmen kann ungleich der Anzahl von Parameter-Einstellungen sein, welche in der Rauschunterdrückungs-Sektion eingestellt sind.
  • Außerdem kann die Anzahl von Kodierungsraten ungleich der Anzahl von Rauschunterdrückungsalgorithmen sein, und die Anzahl von Kodierungsraten kann ungleich der Anzahl von Parameter-Einstellungen sein, welche in der Rauschunterdrückungs-Sektion eingestellt sind.
  • Bezug nehmend auf die dritte Ausführungsform, wie beispielsweise in 10 gezeigt, können acht Kodierungssektionen (Rate-A, Rate-B, Rate-C, ..., Rate-H) im Sprachkoder 320 bereitgestellt sein, und zwei Rauschunterdrückungs-Sektionen, das heißt eine Algorithmus-X Rauschunterdrückungs-Sektion und eine Algorithmus-Y Rauschunterdrückungs-Sektion, können im Rauschunterdrücker 310 bereitgestellt sein.
  • Beispielsweise, wie in 11 gezeigt, kann die Algorithmus-X Rauschunterdrückungs-Sektion 311 in Zusammenhang mit der Rate-A Kodierungssektion 321 verwendet werden, deren Sprachqualität nicht gut ist, und die Algorithmus-Y Rauschunterdrückungs-Sektion 312 kann in Zusammenhang mit den Kodierungssektionen mit den weiteren Kodierungsraten verwendet werden.
  • Außerdem kann die Algorithmus-X Rauschunterdrückung für die Rate-A, Rate-B, Rate-C und Rate-D adaptiert werden, und die Algorithmus-Y Rauschunterdrückung kann für die Rate-E, Rate-F, Rate-G und Rate-H adaptiert werden. Es erübrigt sich auf diese Weise, zu erwähnen, dass verschiedene Modifikationen möglich sind.
  • Kurz gesagt, ist es wichtig, zuvor die Kodierungsraten mit dem Rauschunterdrückungsalgorithmus in Zusammenhang zu bringen, welcher gemäß den Kodierungsraten zu verwenden ist (oder die Parameter-Einstellungen, welche für die Rauschunterdrückungssteuerung gemäß den Kodierungsraten einzustellen sind). Dadurch können verschiedene Ausführungsformen der vorliegenden Erfindung realisiert werden.
  • Bezogen auf die in 1 gezeigte erste Ausführungsform, bei welcher die Anzahl von Kodierungssektionen mit unterschiedlichen Kodierungsalgorithmen im Sprachkoder 120 gleich P (= eine positive Ganzzahl) ist, und die Anzahl von Rauschunterdrückungs-Sektionen mit unterschiedlichen Rauschunterdrückungsalgorithmen im Rauschunterdrücker 110 gleich Q (= eine positive Ganzzahl) ist, sollte es ausreichen, wenn die folgende Beziehung aufgebaut ist:
    P ≥ Q > 1.
  • Bezogen auf die in 3 gezeigte zweite Ausführungsform, bei welcher die Anzahl von Kodierungssektionen mit unterschiedlichen Kodierungsalgorithmen im Sprachkoder 220 gleich P (= eine positive Ganzzahl) ist, und die Anzahl von Parameter-Einstellungen, welche in der Rauschunterdrückungs-Sektion 215 vom Rauschunterdrücker 210 einzustellen sind, gleich S (= eine positive Ganzzahl) ist, sollte es ausreichen, wenn die folgende Beziehung aufgebaut ist:
    P ≥ S > 1.
  • Bezogen auf die in 5 gezeigte dritte Ausführungsform, bei welcher die Anzahl von Kodierungssektionen mit unterschiedlichen Kodierungsraten im Sprachkoder 320 gleich R (= eine positive Ganzzahl) ist, und die Anzahl von Rauschunterdrückungs-Sektionen mit unterschiedlichen Rauschunterdrückungsalgorithmen im Rauschunterdrücker 310 gleich Q (= eine positive Ganzzahl) ist, sollte es ausreichen, wenn die folgende Beziehung aufgebaut ist:
    R ≥ Q > 1.
  • Bezogen auf die in 7 gezeigte vierte Ausführungsform, bei welcher die Anzahl von Kodierungssektionen mit unterschiedlichen Kodierungsalgorithmen im Sprachkoder 420 gleich R (= eine positive Ganzzahl) ist, und die Anzahl von Parameter-Einstellungen, welche in der Rauschunterdrückungs-Sektion 415 vom Rauschunterdrücker 410 einzustellen sind, gleich S (= eine positive Ganzzahl) ist, sollte es ausreichen, wenn die folgende Beziehung aufgebaut ist:
    R ≥ S > 1.
  • Die vorliegende Erfindung ist nicht nur auf die Kodierung von zu übertragener Sprache, wie oben beschrieben, anwendbar, sondern ebenfalls zur Dekodierung von kodierten Sprachdaten, wie in 12 dargestellt.
  • In 12 kennzeichnet Bezugszeichen 3 einen Lautsprecher und kennzeichnet 4 einen D/A-Umwandler. Bezugszeichen 40 kennzeichnet einen Sprachdekoder zum Dekodieren von Sprachdaten durch selektives Verwenden einer Mehrzahl von Dekodierungsalgorithmen oder einer Mehrzahl von Kodierungsraten. Ein Rauschunterdrücker 30 führt einen optimalen Hintergrundrauschen-Unterdrückungsprozess gemäß dem Dekodierungsprozess des Sprachdekoders 40 durch.
  • Dort wo die vorliegende Erfindung auf den Dekodierungsprozess, gleich dem Kodierungsprozess, angewendet wird, können die Aufbauten gemäß den vier Ausführungsformen adaptiert werden. Sogar wenn der Dekodierungsalgorithmus oder die Kodierungsrate bei diesen Aufbauten umgeschaltet wird, kann der Rauschunterdrücker mit hoher Leistung wirken, und kann Sprache mit hoher Qualität empfangen werden.
  • Die vorliegende Erfindung kann durch den Fachmann einfach auf Dekodierungssysteme auf der Basis von den obigen Beschreibungen und von 1-11 angewendet werden, wenn die „Kodierung" in den Beschreibungen als „Dekodierung" gelesen wird und der Ablauf von Signalen, wie in 12 gezeigt, adaptiert wird.
  • Es wird nun eine Beschreibung von einem Beispiel der Dekodierung, wie bei der oben beschriebenen ersten Ausführungsform angewendet, gegeben. 13 zeigt den Aufbau in diesem Beispiel.
  • In 13 kennzeichnet Bezugszeichen 104a komprimierte kodierte Daten; 120a kennzeichnet einen Sprachdekoder zum Dekomprimieren der dekodierten Daten 104a in Sprachdaten 103; 110a kennzeichnet einen Rauschunterdrücker zum Unterdrücken von Hintergrundrauschen, welches in den Sprachdaten 103 enthalten ist; 102a kennzeichnet einen D/A-Umwandler zum Umwandeln der Sprachdaten, bei welchen das Hintergrundrauschen durch den Rauschunterdrücker 110a unterdrückt wurde, in ein analoges Sprachsignal; und 101a kennzeichnet einen Lautsprecher zum Ausgeben des analogen Sprachsignals.
  • Der Sprachdekoder 120a enthält, als drei Sektionen zum Dekodieren von kodierten Sprachdaten durch unterschiedliche Algorithmen, eine Algorithmus-A Dekodierungssektion 121a, eine Algorithmus-B Dekodierungssektion 122a und eine Algorithmus-C Dekodierungssektion 123a. Zusätzlich enthält der Sprachdekoder 120a eine Dekodierungsalgorithmus-Umschaltsteuersektion 124a.
  • Beispielsweise führt die Algorithmus-A Dekodierungssektion 121a einen Dekodierungsprozess durch, bei welchem die Dekodierungsrate niedrig ist, jedoch die Qualität von dekodiertem Klang in Relation zum Hintergrundrauschen nicht gut ist. Die Algorithmus-C Dekodierungssektion 123a führt einen Dekodierungsprozess durch, bei welchem die Dekodierungsrate hoch ist und die Qualität von dekodiertem Klang in Relation zum Hintergrundrauschen relativ gut ist. Die Algorithmus-B Dekodierungssektion 122a führt einen Dekodierungsprozess durch, welcher dazu in der Lage ist, eine mittlere Sprachqualität zwischen der Algorithmus-A Dekodierungssektion 121a und der Algorithmus-C Dekodierungssektion 123a zu erlangen.
  • In Ansprechen auf einen externen Dekodierungsalgorithmus-Auswahlbefehl 105a bewirkt die Dekodierungsalgorithmus-Umschaltsteuersektion 124a ein Umschalten unter der Algorithmus-A Dekodierungssektion 121a, Algorithmus-B Dekodierungssektion 122a und Algorithmus-C Dekodierungssektion 123a, so dass eine von ihnen wirken kann. Zusätzlich führt die Dekodierungsalgorithmus-Umschaltsteuersektion 124a eine Information, welche über den Dekodierungsalgorithmus hinweist, welcher durch das Umschalten ausgewählt ist, an den Rauschunterdrücker 110a als Dekodierungsalgorithmus-Auswahlinformation 106a zu.
  • Der Rauschunterdrücker 110a enthält, als drei Sektionen zum Unterdrücken von Hintergrundrauschen durch unterschiedliche Algorithmen, eine Algorithmus-X Rauschunterdrückungs-Sektion 111a, Algorithmus-Y Rauschunterdrückungs-Sektion 112a und eine Algorithmus-Z Rauschunterdrückungs-Sektion 113a. Zusätzlich enthält der Rauschunterdrücker 110a eine Unterdrückungsalgorithmus-Umschaltsteuersektion 114a.
  • In Ansprechen auf die Dekodierungsalgorithmus-Auswahlinformation 106a, bewirkt die Unterdrückungsalgorithmus-Umschaltsteuersektion 114a ein Umschalten unter der Algorithmus-X Rauschunterdrückungs-Sektion 111a, Algorithmus-Y Rauschunterdrückungs-Sektion 112a und Algorithmus-Z Rauschunterdrückungs-Sektion 113a, so dass eine Optimale aus ihnen wirken kann.
  • Bei der Umschaltsteuerung durch die Unterdrückungsalgorithmus-Umschaltsteuersektion 114a wird die optimale Rauschunterdrückungs-Sektion (111a, 112a oder 113a) zur Wirkung in Zusammenhang mit der Dekodierungssektion (121a, 122a oder 123a) erstellt, welche im Sprachdekoder 120a aktiviert wird. Genauer gesagt, wenn die Algorithmus-A Dekodierungssektion 121a wirkt, wird die Algorithmus-X Rauschunterdrückungs-Sektion 111a durch die Dekodierungsalgorithmus-Auswahlinformation 106a ausgewählt. Wenn die Algorithmus-B Dekodierungssektion 122a wirkt, wird die Algorithmus-Y Rauschunterdrückungs-Sektion 112a durch die Dekodierungsalgorithmus-Auswahlinformation 106a ausgewählt. Wenn die Algorithmus-C Dekodierungssektion 123a wirkt, wird die Algorithmus-Z Rauschunterdrückungs-Sektion 113a durch die Dekodierungsalgorithmus-Auswahlinformation 106a ausgewählt.
  • Um die Übereinstimmung zwischen der Dekodierungssektion und der Rauschunterdrückungs-Sektion zu optimieren, adoptiert beispielsweise die Algorithmus-X Rauschunterdrückungs-Sektion 111a ein spektrales Subtraktions-(SS)-Verfahren in einer Frequenzdomäne mit einer hohen Rauschunterdrückungsleistung, obwohl eine etwas komplexere Verarbeitung durchzuführen ist. Die Algorithmus-Y Rauschunterdrückungs-Sektion 112a adoptiert ein ähnliches SS-Verfahren, bei welchem jedoch eine weniger komplexe Verarbeitung als in der Algorithmus-X Rauschunterdrückungs-Sektion 111a durchzuführen ist. Die Algorithmus-Z Rauschunterdrückungs-Sektion 113a adoptiert ein adaptives Filterverfahren in einer Zeitdomäne mit einem relativ einfachen Schema.
  • Der Betrieb der Signalverarbeitungseinrichtung mit dem obigen Aufbau wird nun beschrieben. 14 ist ein Ablaufdiagramm, welches diesen Betrieb darstellt.
  • In einem Befehlseingabe-Bereitschaftszustand in Schritt 14a, wenn der Dekodierungsalgorithmus-Auswahlbefehl 105a auf die Wirkung, dass „Verwende den Algorithmus-A als den Dekodierungsalgorithmus" der Dekodierungsalgorithmus-Umschaltsteuersektion 124a eingegeben wurde, fährt die Steuerung mit Schritt 14b fort, um den ausgewiesenen Dekodierungsalgorithmus zu bestimmen. Da der ausgewiesene Dekodierungsalgorithmus in diesem Fall der Algorithmus-A ist, geht die Steuerung auf Schritt 14c.
  • In Schritt 14c steuert die Dekodierungsalgorithmus-Umschaltsteuersektion 124a ein Umschalten derart, dass die kodierten Daten 104a der Algorithmus-A Dekodierungssektion 121a eingegeben werden können. Demgemäß beginnt die Algorithmus-A Dekodierungssektion 121a mit einer Dekodierung der eingegebenen kodierten Daten 104a.
  • In Schritt 14c, parallel zur Umschaltsteuerung, gibt die Dekodierungsalgorithmus-Umschaltsteuersektion 124a als die Dekodierungsalgorithmus-Auswahlinformation 106a die Information auf die Wirkung, dass die Algorithmus-A Dekodierungssektion 121a zur Dekodierung der kodierten Daten 104a zu verwenden ist, an die Unterdrückungsalgorithmus-Umschaltsteuersektion 114a aus. Die Steuerung geht dann auf Schritt 14d.
  • In Schritt 14d steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 114a ein Umschalten derart, dass die Ausgabe von Sprachdekoder 120a in die Algorithmus-X Rauschunterdrückungs-Sektion 111a eintreten kann, wodurch eine Rauschunterdrückung durch die Algorithmus-X Rauschunterdrückungs-Sektion 111a bewirkt werden kann, welche für die Dekodierung durch die Algorithmus-A Dekodierungssektion 121a optimiert ist. Die Steuerung geht dann auf Schritt 14i.
  • Mit diesem Umschaltsteuerbetrieb werden die kodierten Daten 104a durch die Algorithmus-A Dekodierungssektion 121a dekodiert und einer Rauschunterdrückung in der Algorithmus-X Rauschunterdrückungs-Sektion 111a unterworfen. Die Ausgabe von der Algorithmus-X Rauschunterdrückungs-Sektion 111a wird durch den D/A-Umwandler 102a D/A-umgewandelt und vom Lautsprecher 101a ausgegeben.
  • In Schritt 14i, wenn der Dekodierungsalgorithmus-Auswahlbefehl 105a auf die Wirkung, dass „Verwende den Algorithmus-B als den Dekodierungsalgorithmus" der Dekodierungsalgorithmus-Umschaltsteuersektion 124a eingegeben wurde, wird die Steuerung mit Schritt 14b fortfahren, um den ausgewiesenen Dekodierungsalgorithmus zu bestimmen. Da der ausgewiesene Dekodierungsalgorithmus in diesem Fall der Algorithmus-B ist, geht die Steuerung auf Schritt 14e.
  • In Schritt 14e steuert die Dekodierungsalgorithmus-Umschaltsteuersektion 124a ein Umschalten zu einem korrekten Zeitpunkt, so dass die kodierten Daten 104a der Algorithmus-B Dekodierungssektion 122a eingegeben werden können. Demgemäß beendet die Algorithmus-A Dekodierungssektion 121a ihren Betrieb, und anstelle dessen beginnt die Algorithmus-B Dekodierungssektion 122a eine Dekodierung der eingegebenen kodierten Daten 104a.
  • In Schritt 14e, parallel zur Umschaltsteuerung, gibt die Dekodierungsalgorithmus-Umschaltsteuersektion 124a als die Dekodierungsalgorithmus-Auswahlinformation 106a die Information auf die Wirkung, dass die Algorithmus-B Dekodierungssektion 122a zur Dekodierung der kodierten Daten 104a zu verwenden ist, an die Unterdrückungsalgorithmus-Umschaltsteuersektion 114a aus. Die Steuerung geht dann auf Schritt 14f.
  • In Schritt 14f steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 114a ein Umschalten derart, dass die Sprachdaten 103a vom Sprachdekoder 120a in die Algorithmus-Y Rauschunterdrückungs-Sektion 112a eintreten können, wodurch eine Rauschunterdrückung durch die Algorithmus-Y Rauschunterdrückungs-Sektion 112a, welche für die Dekodierung durch die Algorithmus-B Dekodierungssektion 122a optimiert ist, bewirkt wird. Die Steuerung geht dann auf Schritt 14i.
  • Mit diesem Umschaltsteuerbetrieb werden die kodierten Daten 104a durch die Algorithmus-B Dekodierungssektion 122a dekodiert und einer Rauschunterdrückung in der Algorithmus-Y Rauschunterdrückungs-Sektion 112a unterworfen. Die Ausgabe von der Algorithmus-Y Rauschunterdrückungs-Sektion 112a wird durch den D/A-Umwandler 102a D/A-umgewandelt und vom Lautsprecher 101a ausgegeben.
  • In Schritt 14i, wenn der Dekodierungsalgorithmus-Auswahlbefehl 105a auf die Wirkung, dass „Verwende den Algorithmus-C als den Dekodierungsalgorithmus" der Dekodierungsalgorithmus-Umschaltsteuersektion 124a eingegeben wurde, während die kodierten Daten 104a in der Algorithmus-A Dekodierungssektion 121a oder Algorithmus-B Dekodierungssektion 122a kodiert werden, wie oben beschrieben, wird die Steuerung mit Schritt 14b fortfahren, um den ausgewiesenen Dekodierungsalgorithmus zu bestimmen. Da der ausgewiesene Dekodierungsalgorithmus in diesem Fall der Algorithmus-C ist, geht die Steuerung auf Schritt 14g.
  • In Schritt 14g steuert die Dekodierungsalgorithmus-Umschaltsteuersektion 124a ein Umschalten zu einer korrekten Zeit, so dass die kodierten Daten 104a der Algorithmus-C Dekodierungssektion 123a eingegeben werden können. Demgemäß beendet die Algorithmus-A Dekodierungssektion 121a oder Algorithmus-B Dekodierungssektion 122a ihren Betrieb, und anstelle dessen beginnt die Algorithmus-C Dekodierungssektion 123a eine Dekodierung der eingegebenen kodierten Daten 104a.
  • In Schritt 14g, parallel zur Umschaltsteuerung, gibt die Dekodierungsalgorithmus-Umschaltsteuersektion 124a als die Dekodierungsalgorithmus-Auswahlinformation 106a die Information auf die Wirkung, dass die Algorithmus-C Dekodierungssektion 123a zur Dekodierung der kodierten Daten 104a zu verwenden ist, an die Unterdrückungsalgorithmus-Umschaltsteuersektion 114a aus. Die Steuerung geht dann auf Schritt 14h.
  • In Schritt 14h steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 114a ein Umschalten derart, dass die Sprachdaten 103a vom Sprachdekoder 120a in die Algorithmus-Z Rauschunterdrückungs-Sektion 113a eintreten können, wodurch eine Rauschunterdrückung durch die Algorithmus-Z Rauschunterdrückungs-Sektion 113a bewirkt wird, welche für die Dekodierung durch die Algorithmus-C Dekodierungssektion 123a optimiert ist. Die Steuerung geht dann auf Schritt 14i.
  • Mit diesem Umschaltsteuerbetrieb werden die kodierten Daten 104a durch die Algorithmus-C Dekodierungssektion 123a dekodiert und einer Rauschunterdrückung in der Algorithmus-Z Rauschunterdrückungs-Sektion 113a unterworfen. Die Ausgabe von der Algorithmus-Z Rauschunterdrückungs-Sektion 113a wird durch den D/A-Umwandler 102a D/A-umgewandelt und vom Lautsprecher 101a ausgegeben.
  • In Schritt 14i geht die Steuerung, wenn kein Befehl eingegeben ist, auf Schritt 14j. In Schritt 14j wird bestimmt, ob eine Kommunikationsende-Anforderung eingegeben ist. Wenn die Kommunikationsende-Anforderung eingegeben wurde, wird der vorliegende Prozess beendet. Wenn die Kommunikationsende-Anforderung nicht eingegeben ist, wird die Befehlseingabe in Schritt 14i abermals überwacht.
  • Wie oben beschrieben, wird in der Signalverarbeitungseinrichtung, welche den obigen Aufbau hat, wenn eine Sprache vom Lautsprecher auszugeben ist, die optimale Rauschunterdrückungs-Sektion (111a, 112a oder 113a) gemäß der Dekodierungssektion (121a, 122a oder 123a), welche im Sprachdekoder 120a wirkt, aktiviert.
  • Gemäß der Signalverarbeitungseinrichtung mit dem obigen Aufbau wird eine Rauschunterdrückung durch die optimale Rauschunterdrückungs-Sektion für die Dekodierung durch den Sprachdekoder 120a bewirkt. Somit wirkt die Rauschunterdrückungs-Sektion mit hoher Leistung, und es kann eine Sprache mit hoher Qualität vom Lautsprecher ausgegeben werden.
  • Mittlerweile werden in der dritten und vierten Ausführungsform die drei Sektionen selektiv im Sprachkoder 320 (420) mit der variablen Kodierungsrate, wie in 5 und 7 gezeigt, verwendet.
  • Jedoch ist die vorliegende Erfindung nicht auf diesen Aufbau beschränkt. Wie in 15 gezeigt, können Parameter in einer Kodierungssektion 725, welche in einem Sprachkoder 720 bereitgestellt ist, variiert werden, so dass die Kodierungsrate ebenfalls geändert werden kann.
  • Bei dem in 15 gezeigten Aufbau werden Parameter-Einstellungen zur Kodierung mit mehreren Kodierungsraten zuvor in einer Parameter-Tabelle 726 gespeichert. In Ansprechen auf eine Anforderung von außen bewirkt eine Kodierungsrate-Umschaltsteuersektion 727 bei der Parameter-Tabelle 726 eine optimale Parameter-Einstellung an die Kodierungssektion 725 auszugeben.
  • Sogar wenn der Sprachkoder 720 mit diesem Aufbau verwendet wird, kann die Rauschunterdrückungs-Sektion mit hoher Leistung wirken, und es kann eine Sprache mit hoher Qualität empfangen werden, wie bei der dritten und vierten Ausführungsform.
  • Es ist möglich, den Sprachkoder 720, wie in 15 gezeigt, durch irgendeine der Kodierungssektionen 121-123 (221-223) des Sprachkoders 120 (220) in 1 und 3 zu ersetzen.
  • Es ist ebenfalls möglich, den Aufbau von 15 auf den in 12 gezeigten dekodierungsseitigen Aufbau anzuwenden, obwohl es einen Unterschied zwischen dem Kodierungsprozess und dem Dekodierungsprozess gibt. Sogar wenn der Dekodierungsalgorithmus oder die Kodierungsrate in diesem Fall umgeschaltet wird, kann der Rauschunterdrücker mit hoher Leistung wirken, und es kann eine Sprache mit hoher Qualität empfangen werden.
  • In der vierten Ausführungsform kann der Aufbau des Rauschunterdrückers 410 derart modifiziert werden, dass, wenn eine spezifische Kodierungsrate-Information erfasst wurde, eine Rauschunterdrückung in allen Frequenzbändern oder einem Teil von Frequenzbändern ausgeschaltet wird (das heißt, dass eine Rauschunterdrückung nicht bewirkt wird).
  • 16 zeigt ein Beispiel, bei welchem der Aufbau zum Durchführen einer solchen Rauschunterdrückung auf den Rauschunterdrücker 410 angewendet wird. Eine genaue Beschreibung wird nun mit Bezug auf 16 gegeben.
  • Bei diesem Beispiel wird eine Rauschunterdrückung durch ein spektrales Subtraktions-(SS)-Verfahren ausgeführt, wobei ein Sprachsignal in M-Frequenzbänder unterteilt wird. Der Wert von M ist normalerweise 6-32, obwohl er in Abhängigkeit vom Rauschunterdrückungsalgorithmus variiert.
  • Die Parameter-Umschaltsteuersektion 417 erfasst die im Sprachkoder 420 verwendete Kodierungsrate auf der Basis von der Kodierungsrate-Auswahlinformation 406. Die Parameter-Umschaltsteuersektion 417 bewirkt die Parameter-Tabelle 416, die Parameter-Einstellung entsprechend der erfassten Kodierungsrate einer Individual-Band Unterdrückungskoeffizienten-Berechnungssektion 460 in der Rauschunterdrückungs-Sektion 415 zuzuführen.
  • In diesem Fall enthält die Parameter-Einstellung, welche von der Parameter-Tabelle 416 der Individual-Band Unterdrückungskoeffizienten-Berechnungssektion 460 eingegeben ist, L-Steuerparameter. Wenn eine Rauschunterdrückung in allen Frequenzbändern auf einen im Wesentlichen gleichen Pegel gesteuert wird, wird ein Steuerparameter (L = 1) in Zusammenhang mit einer Kodierungsrate ausgegeben.
  • Andererseits, wenn eine Rauschunterdrückung auf unterschiedlichen Pegeln in M-Frequenzbändern gesteuert wird, werden M-Steuerparameter (L = M) in Zusammenhang mit einer Kodierungsrate erzeugt. Der Wert von L ist jedoch nicht auf M beschränkt.
  • Zum Zwecke einer einfacheren Beschreibung wird angenommen, dass drei Kodierungsraten A, B und C adoptiert sind, und L = M ist. Steuerparameter, welche mit der Kodierungsrate A in Zusammenhang stehen, können durch C (A, 0), C (A, 1), ..., C (A, M – 1) dargestellt werden.
  • Das Symbol C (A, k) kennzeichnet beispielsweise einen Steuerparameter, welcher mit der Kodierungsrate A in Zusammenhang steht und zum Steuern eines k-ten Bandes von M unterteilten Frequenzbändern verwendet wird. 17 ist eine Tabelle, welche die Beziehung zwischen den Kodierungsraten (Bitraten) und den unterteilten Bändern zeigt.
  • Wie bereits in Verbindung mit der vierten Ausführungsform beschrieben, unterwirft die Rauschunterdrückungs-Sektion 415 das eingegebene Signal einer Rauschunterdrückung gemäß dem Steuerparameter, welcher von der Parameter-Tabelle 416 zugeführt ist. Die Rauschunterdrückungs-Sektion 415 enthält eine FFT-Sektion 440, eine Individual-Band Rauschpegel-Abschätzsektion 450, eine Individual-Band Unterdrückungskoeffizienten-Berechnungssektion 460 eine Rauschunterdrückungs-Sektion 470 und eine inverse FFT-Sektion 480.
  • Die FFT-Sektion 440 wandelt das eingegebene Sprachsignal von einer Zeitdomäne in eine Frequenzdomäne durch FFT (Fast Fourier Transform) um. Weitere Verfahren zum Umwandeln in eine Frequenzdomäne, nämlich DCT oder weitere Transformationen, können ebenfalls verwendet werden.
  • Die Individual-Band Rauschpegel-Abschätzsektion 450 unterteilt das Sprachsignal, welches in die Frequenzdomäne umgewandelt wurde, in eine vorbestimmte Anzahl (M) von Bändern und schätzt Rauschpegel im Sprachsignal in einzelnen Bändern ab. Die Individual-Band Unterdrückungskoeffizienten-Berechnungssektion 460 berechnet Rauschunterdrückungskoeffizienten von individuellen Bändern auf der Basis von Individual-Band Rauschpegeln, welche durch die Individual-Band Rauschpegel-Abschätzsektion 450 abgeschätzt sind.
  • Es wird angenommen, dass die Individual-Band Unterdrückungskoeffizienten gleich D (0), D (1) ... D (M – 1) sind. Das Symbol D (k) kennzeichnet einen Rauschunterdrückungskoeffizienten, welcher zum Steuern eines k-ten Bandes von M unterteilten Frequenzbändern verwendet wird.
  • In der vorliegenden Erfindung wird der Rauschunterdrückungsprozess gesteuert, indem nicht nur die Rauschunterdrückungskoeffizienten, welche lediglich durch die Analyse des eingegebenen Signals erlangt werden, sondern ebenfalls Steuerparameter, welche basierend auf der Kodierungsrate-Information erlangt werden, verwendet werden. In einem Verfahren, um dies zu realisieren, wird ein Steuerparameter derart eingestellt, dass ein Wert, welcher durch ein Multiplizieren des Steuerparameters mit einem Rauschunterdrückungskoeffizienten erlangt werden kann, als ein neuer Rauschunterdrückungskoeffizient verwendet werden kann.
  • Beispielsweise wird der Rauschunterdrückungskoeffizient D (k) unter Verwendung des Steuerparameters C (k), welcher von der Kodierungsrate-Information erlangt wird, gemäß dem im Folgenden gezeigten Betrieb modifiziert. Der modifizierte Rauschunterdrückungskoeffizient D (k) wird der Rauschunterdrückungs-Sektion 470 ausgegeben. D (k) <- D (k) × C (k) (k = 0, ..., M – 1)
  • Die Rauschunterdrückungs-Sektion 470 multipliziert das Frequenz-Dimension Sprachspektrum, welches vom eingegebenen Sprachsignal erlangt wird, mit 1 – D (k) in jedem Band, unter Verwendung des modifizierten Unterdrückungskoeffizienten, welcher durch die Individual-Band Unterdrückungskoeffizienten-Berechnungssektion 460 erlangt wird. Somit erzeugt die Rauschunterdrückungs-Sektion 470 ein rauschunterdrücktes Sprachspektrum. Die inverse FFT-Sektion 480 wandelt das Sprachspektrum, welches durch die Rauschunterdrückungs-Sektion 470 erzeugt ist, in ein Zeit-Dimension Sprachsignal um.
  • Wenn beispielsweise eine Rauschunterdrückung auszuschalten ist (das heißt, dass eine Rauschunterdrückung nicht auszuführen ist), und zwar in allen Frequenzbändern zum Zeitpunkt der Kodierungsrate C, welche eine höchste Kodierungsrate ist, werden alle Individual-Band Steuerparameter, welche verwendet werden, wenn die Bitrate C erfasst wird, auf „0" eingestellt, wie in 18 gezeigt.
  • Wenn eine Rauschunterdrückung auszuschalten ist (das heißt, dass eine Rauschunterdrückung nicht auszuführen ist), und zwar in dem Frequenzband M – 1, alleine zu dem Zeitpunkt der Kodierungsrate B, wird der Steuerparameter, welcher verwendet wird, wenn die Bitrate B erfasst wird, auf „0" eingestellt, wie in 19 gezeigt.
  • Gemäß dem oben beschriebenen Aufbau sind natürlich weitere verschiedene Einstellungen möglich.
  • Wie oben beschrieben, wird der Rauschunterdrückungsprozess, welcher durch die Rauschunterdrückungs-Sektion 415 durchzuführen ist, unter Verwendung der Steuerparameter gesteuert, welche von der Kodierungsrate-Information erzeugt werden. Somit kann die Sprachverarbeitungseinrichtung mit variabler Rate, bei welcher die gesamte Balance zwischen der Rauschunterdrückung und der Sprachkodierung mit variabler Rate mehr als im Stand der Technik in Betracht gezogen wird, realisiert werden.
  • Wie bereits bekannt, ist der Rauschunterdrückungsprozess aus dem Stand der Technik dazu unfähig, ein Rauschen alleine von einem eingegebenen Sprachsignal vollständig zu eliminieren. Wenn ein Versuch dazu unternommen wird, das Rauschen vollständig zu eliminieren, wird ein Teil des Sprachsignals zusammen mit dem Rauschen entfernt. Daraus folgend würde ein bestimmter Laut ausgelassen oder es würde ein Laut, welcher vom Hintergrundrauschen unterschiedlich ist, eingehen. Daraus folgend würde eine rauschunterdrückte Sprache die Natürlichkeit verlieren und sich verschlechtern.
  • Es ist ebenfalls bekannt, dass eine Abnahme in der Sprachqualität aufgrund einer Kodierung im Allgemeinen gering ist, wenn ein klares Lautsignal mit geringstem Rauschen kodiert wird, weil eine Analyse zum Kodieren erfolgreich durchgeführt wird und ein solch klares Sprachsignal mit einem Kodierungsalgorithmus übereinstimmt.
  • Andererseits, wenn ein Sprachsignal mit viel Hintergrundrauschen kodiert wird, insbesondere mit einer geringen Kodierungsrate, würde sich eine Kodierung von Nicht-Sprache-Komponenten sehr verschlechtern. Somit wird eine höhere Sprachqualität erlangt, wenn ein Sprachsignal, aus welchem ein Hintergrundrauschen auf ein gewisses Ausmaß entfernt wurde, kodiert wird.
  • Im Falle einer Sprachkodierung bei einer hohen Kodierungsrate, ist die Leistung einer Kodierung selber hoch, sogar wenn eine zu kodierende Sprache ein Hintergrundrauschen mit relativ hohem Pegel enthält. Demgemäß ist eine Verschlechterung der Sprachqualität aufgrund von Hintergrundrauschen gering, und es wird eine Sprachqualität nahe einer natürlichen erlangt.
  • Im Falle einer Sprachkodierung bei einer niedrigen Kodierungsrate, kann eine Rauschunterdrückung auf einen gewissen Grad möglicherweise insgesamt eine gute Sprachqualität bereitstellen. Jedoch ist im Falle einer Sprachkodierung bei einer hohen Kodierungsrate eine Rauschunterdrückung nicht immer in einer Anwendung benötigt, welche eine Sprachqualität mit hoher Natürlichkeit erfordert.
  • Ein wirksames Verfahren in diesem Fall ist eines, welches mit Bezug auf 18 erläutert ist, bei welchem alle Steuerparameter in individuellen Bändern bei einer spezifischen Kodierungsrate (oder Kodierungsraten) auf „0" eingestellt sind, und somit eine Rauschunterdrückung in allen Frequenzbändern ausgeschaltet wird (das heißt, dass eine Rauschunterdrückung nicht vorgenommen wird).
  • Wenn der in 16 gezeigte Rauschunterdrücker 410 zu diesem Zwecke verwendet wird, kann die Rauschunterdrückungsfunktion gemäß der Kodierungsrate flexibler als im Stand der Technik gesteuert werden. Somit kann die Sprachqualität verbessert werden, wenn die Sprachverarbeitungseinrichtung mit variabler Rate in einer Umgebung verwendet wird, bei welcher viel Hintergrundrauschen eingehen kann.
  • In dem vorliegenden Beispiel wird der in 16 gezeigte Aufbau auf den wie in 7 gezeigten Rauschunterdrücker 410 angewendet, bei welchem die Kodierungsrate auf der Kodierungs-Seite variiert wird. Jedoch kann er ebenfalls auf einem Rauschunterdrücker angewendet werden, welcher Rauschen gemäß der Kodierungsrate auf der Dekodierungs-Seite unterdrückt, oder auf einen Rauschunterdrücker, welcher Rauschen gemäß dem Kodierungsalgorithmus oder Dekodierungsalgorithmus unterdrückt. In diesen Fällen können die gleichen Vorteile natürlich ebenfalls erlangt werden.
  • In der vierten Ausführungsform kann der Rauschunterdrücker 410 durch einen Rauschunterdrücker 411 ersetzt werden, welcher einen wie in 20 gezeigten Aufbau hat. Mit diesem Aufbau wird eine Rauschunterdrückung forciert ausgeschaltet (das heißt, dass eine Rauschunterdrückung nicht vorgenommen wird), und zwar gemäß einer Anfrage von außerhalb, unabhängig von der Kodierungsrate.
  • In 20 sind die Rauschunterdrückungs-Sektion 415, Parameter-Tabelle 416 und Parameter-Umschaltsteuersektion 417 gleich dem Aufbau der vierten Ausführungsform, und eine Beschreibung derer wird ausgelassen. Es wird nun eine Beschreibung auf neu bereitgestellte Elemente gegeben: eine EIN/AUS-Informationserfassungssektion 419 und ein Umschaltschalter 418.
  • Die EIN/AUS-Informationserfassungssektion 419 erfasst/bestimmt eine Information von außerhalb, welche eine EIN/AUS-Steuerung von einer Funktion zur Unterdrückung von Rauschen anweist, und betreibt den Umschaltschalter 418 gemäß dem Bestimmungsergebnis.
  • Genauer gesagt, wenn die Anweisung zum Einschalten der Funktion zur Unterdrückung von Rauschen erfasst wurde, wird der Schalter 418 dazu betrieben, die Sprachdaten vom A/D-Umwandler 402 der Rauschunterdrückungs-Sektion 415 zuzuführen. Andererseits, wenn die Anweisung zum Ausschalten der Funktion zum Unterdrücken von Rauschen erfasst wurde, wird der Schalter 418 dazu betrieben, die Sprachdaten vom A/D-Umwandler dem Sprachkoder 420 an der Rückstufe als digitale Daten 403 ohne ein Eingreifen der Rauschunterdrückungs-Sektion 415 zuzuführen.
  • In einem Beispiel der externen Steuerung zum Ein-/Ausschalten der Rauschunterdrückungsfunktion, kann der Rauschunterdrücker 411 von einem Kommunikationsnetzwerk ein-/ausgesteuert werden. In einem Kommunikationspfad kann eine sogenannte Tandem-Verbindung auftreten, bei welcher eine Kodierung/Dekodierung zwischen der Empfangsseite und der Übertragungsseite zwei Mal durchgeführt wird. Ein Grund dafür, warum die externe Steuerung benötigt wird, liegt darin, dass es notwendig ist, ein Auftreten der Tandem-Verbindung zu verhindern, wenn eine Rauschunterdrückung zwei Mal durchgeführt wird.
  • Das Wesentliche der Steuerung zum Verhindern der Tandem-Verbindung wohnt nicht dem Einschalten (Aktivierung) der Rauschunterdrückung, sondern dem Ausschalten (Inaktivierung) der Rauschunterdrückung inne. Wenn dies in Betracht gezogen wird, können, wenn die Rauschunterdrückungsfunktion von außerhalb ein-/ausgesteuert wird, beispielsweise vom Kommunikationsnetzwerk, Steuerbetriebe auf der Basis von Absichten von sowohl der Übertragungs- als auch der Empfangs-Seite zusammengefasst werden.
  • In dem vorliegenden Beispiel wird der Aufbau des in 20 gezeigten Rauschunterdrückers 411 auf den in 7 gezeigten Rauschunterdrücker 410 angewendet, bei welchem die Kodierungsrate auf der Kodierungsseite variiert wird. Jedoch kann dieser Aufbau auf einen Rauschunterdrücker zum Unterdrücken von Rauschen gemäß der Kodierungsrate auf der Dekodierungsseite oder auf einen Rauschunterdrücker zum Unterdrücken von Rauschen gemäß dem Kodierungsalgorithmus oder Dekodierungsalgorithmus angewendet werden. In diesen Fällen können die gleichen Vorteile natürlich ebenfalls erlangt werden.
  • Eine Signalverarbeitungseinrichtung, welche nicht beansprucht ist, jedoch aus Gründen der Darstellung von weiteren Anwendungen im Bereich von der Erfindung vorliegt, wird nun beschrieben. 21 zeigt den Aufbau von dieser Einrichtung.
  • Eine Spracheingabesektion 540 wirkt zum Einfangen einer zu übertragenen Benutzersprache, Umwandeln derer in ein elektrisches Signal und Digitalisieren des Signals, um Sprachdaten zu erzeugen. Die Spracheingabesektion 540 enthält ein Mikrophon 541 für einen Freihandbetrieb, einen Mikrophonverstärker 542 für einen Freihandbetrieb, ein Mikrophon 543 für einen Nicht-Freihandbetrieb, einen Mikrophonverstärker 544 für einen Nicht-Freihandbetrieb, eine Mikrophon-Umschaltsteuersektion 545 und einen A/D-Umwandler 546.
  • Die Mikrophon-Umschaltsteuersektion 545 steuert ein Umschalten zwischen dem Freihand-Analogsystem und dem Nicht-Freihand-Analogsystem gemäß einem Steuerbefehl 553 zum Umschalten des Freihand-/Nicht-Freihandbetriebes.
  • Der A/D-Umwandler 546 empfängt ein analoges Sprachsignal von dem Analogsystem, welches durch die Umschaltsteuerung von der Mikrophon-Umschaltsteuersektion 545 ausgewählt ist, und digitalisiert das analoge Sprachsignal, um Sprachdaten zu erzeugen.
  • Im Nicht-Freihandbetrieb sind die Empfangsrichtung von Sprache und die Reisedistanz von Sprache im Wesentlichen unveränderlich. Somit wird ein Mikrophon, welches eine Empfindlichkeit und Richtcharakteristik hat, welche diese Bedingung einhalten, verwendet. Andererseits muss ein Mikrophon im Freihandbetrieb eine höhere Empfindlichkeit haben, so dass eine Sprache von weit her eingefangen werden kann. Zusätzlich, da die Richtung von ankommender Sprache variabel ist, muss die Richtcharakteristik des Mikrophons erhöht werden. Somit sind die Eigenschaften des analogen Sprachsignals, welches vom A/D-Umwandler 546 zugeführt wird, zwischen den Freihandbetrieb und dem Nicht-Freihandbetrieb unterschiedlich.
  • Eine Echo-Steuereinheit 530 enthält eine Freihand-Echo-Steuersektion 531, eine Nicht-Freihand-Echo-Steuersektion 532 und eine Echo-Umschaltsteuersektion 533.
  • Die Freihand-Echo-Steuersektion 531 ist geeignet, wenn das Freihand-Mikrophon 541 und der Freihand-Mikrophon-Verstärker 542 verwendet werden. Die Freihand-Echo-Steuersektion 531 reduziert ein Echo, welches auf die Sprachdaten überlagert wird, welche vom A/D-Umwandler 546 ausgegeben werden.
  • Andererseits ist die Nicht-Freihand Echo-Steuersektion 532 geeignet, wenn das Nicht-Freihand-Mikrophon 543 und der Nicht-Freihand-Mikrophon-Verstärker 544 verwendet werden. Die Nicht-Freihand Echo-Steuersektion 532 reduziert ein Echo, welches auf die Sprachdaten überlagert ist, welche vom A/D-Umwandler 546 ausgegeben werden. Wenn jedoch eine Echounterdrückung nicht benötigt ist, werden die Sprachdaten direkt ohne Echo-Steuerung ausgegeben.
  • Die Echo-Umschaltsteuersektion 533 steuert ein Umschalten zwischen der Freihand-Echo-Steuersektion 531 und Nicht-Freihand-Echo-Steuersektion 532 gemäß dem Steuerbefehl 553 zum Umschalten des Freihand-/Nicht-Freihandbetriebes, so dass die Ausgewählte aus den Echo-Steuersektionen 531 und 532 die Sprachdaten vom A/D-Umwandler 546 empfangen kann.
  • Durch diese Steuerung werden Sprachdaten 551, welche durch die Freihand-Echo-Steuersektion 531 oder die Nicht-Freihand-Echo-Steuersektion 532 im Echo reduziert wurden, an einen Rauschunterdrücker 510 ausgegeben.
  • Der Rauschunterdrücker 510 enthält als zwei Sektionen zum Unterdrücken von Hintergrundrauschen durch einen unterschiedlichen Algorithmus eine Algorithmus-X Rauschunterdrückungs-Sektion 511 und eine Algorithmus-Y Rauschunterdrückungs-Sektion 512. Zusätzlich enthält der Rauschunterdrücker 510 eine Unterdrückungsalgorithmus-Umschaltsteuersektion 514.
  • Die Algorithmus-X Rauschunterdrückungs-Sektion 511 ist dazu entworfen, um geeigneterweise ein Rauschen in den Sprachdaten 551 zu unterdrücken, welches durch das Freihand-Mikrophon 541, den Freihand-Mikrophon-Verstärker 542 und die Freihand-Echo-Steuersektion 531 erzeugt wird, welche im Freihandbetrieb verwendet werden.
  • Andererseits ist die Algorithmus-Y Rauschunterdrückungs-Sektion 512 dazu entworfen, um geeigneterweise ein Rauschen in den Sprachdaten 551 zu unterdrücken, welches durch das Nicht-Freihand-Mikrophon 543, den Nicht-Freihand-Mikrophon-Verstärker 544 und die Nicht-Freihand-Echo-Steuersektion 532 erzeugt wird, welche im Nicht-Freihandbetrieb verwendet werden.
  • Die Unterdrückungsalgorithmus-Umschaltsteuersektion 514 steuert ein Umschalten zwischen der Algorithmus-X Rauschunterdrückungs-Sektion 511 und Algorithmus-Y Rauschunterdrückungs-Sektion 512 gemäß dem Steuerbefehl 553 zum Umschalten des Freihand-/Nicht-Freihandbetriebes, so dass die optimale aus Rauschunterdrückungs-Sektionen 511 und 512 die Sprachdaten 551 empfangen kann.
  • Der Betrieb von der in 21 gezeigten Signalverarbeitungseinrichtung wird nun beschrieben. 22 ist ein Ablaufdiagramm, welches diesen Betrieb darstellt.
  • In einem Befehlseingabe-Bereitschaftszustand in Schritt 22a, wenn der Steuerbefehl 553 auf die Wirkung, dass „Führe einen Freihandbetrieb durch" eingegeben wurde, fährt die Steuerung mit Schritt 22b fort, um den Inhalt des eingegebenen Befehls zu bestimmen. Da sich der eingegebene Befehl auf den Beginn des Freihandbetriebes bezieht, geht die Steuerung auf Schritt 22c.
  • In Schritt 22c beginnt die Mikrophon-Umschaltsteuersektion 545 eine Umschaltsteuerung, so dass das analoge Sprachsignal, welches vom Freihand-Mikrophon 541 und Freihand-Mikrophon-Verstärker 542 kommt, dem A/D-Umwandler 546 eingegeben werden kann.
  • In Schritt 22c, parallel zur Umschaltsteuerung, bewirkt die Echo-Umschaltsteuersektion 533 ein Umschalten gemäß des Steuerbefehls 553, so dass die Sprachdaten vom A/D-Umwandler 546 der Freihand-Echo-Steuersektion 531 eingegeben werden können. Die Steuerung geht dann auf Schritt 22d.
  • In Schritt 22d, gemäß dem Steuerbefehl 553, steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 514 ein Umschalten derart, dass die Sprachdaten von der Freihand-Echo-Steuersektion 531 in die Algorithmus-X Rauschunterdrückungs-Sektion 511 eintreten können. Die Steuerung geht dann auf Schritt 22g.
  • Demgemäß, wenn der Freihandbetriebsbefehl eingegeben ist, wird die obige Umschaltsteuerung bewirkt, und die Benutzersprache, welche vom Freihand-Mikrophon 541 eingegeben wird, wird in der Freihand-Echo-Steuersektion 531 der Echo-Steuerung unterworfen, welche für den Fall geeignet ist, bei welchem das Freihand-Mikrophon 541 und der Freihand-Mikrophon-Verstärker 542 verwendet werden.
  • Die im Echo gesteuerten Sprachdaten 551 werden in der Algorithmus-X Rauschunterdrückungs-Sektion 511 dem Rauschunterdrückungsprozess unterworfen, welcher für den Fall geeignet ist, bei welchem das Freihand-Mikrophon 541, der Freihand-Mikrophon-Verstärker 542 und die Freihand-Echo-Steuersektion 531 verwendet werden. Die resultierenden Daten werden der Übertragungssektion an der Rückstufe als Übertragungs-Sprachdaten 552 ausgegeben.
  • In Schritt 22g, wenn der Steuerbefehl 553 auf die Wirkung, dass „Beende den Freihandbetrieb" eingegeben ist, geht die Steuerung auf Schritt 22b, um den Inhalt des eingegebenen Befehls zu bestimmen. Da sich der eingegebene Befehl auf die Beendigung des Freihandbetriebes bezieht, geht die Steuerung auf Schritt 22e.
  • In Schritt 22e beginnt die Mikrophon-Umschaltsteuersektion 545 eine Umschaltsteuerung, so dass das analoge Sprachsignal, welches von dem Nicht-Freihand-Mikrophon 543 und Nicht-Freihand-Mikrophon-Verstärker 544 kommt, in den A/D-Umwandler 546 eingegeben werden kann.
  • In Schritt 22e, parallel zur Umschaltsteuerung, bewirkt die Echo-Umschaltsteuersektion 533 ein Umschalten gemäß des Steuerbefehls 553, so dass die Sprachdaten vom A/D-Umwandler 546 der Nicht-Freihand Echo-Steuersektion 532 eingegeben werden können. Die Steuerung geht dann auf Schritt 22f.
  • In Schritt 22f, gemäß des Steuerbefehls 553, steuert die Unterdrückungsalgorithmus-Umschaltsteuersektion 514 ein Umschalten derart, dass die Sprachdaten von der Nicht-Freihand Echo-Steuersektion 532 in die Algorithmus-Y Rauschunterdrückungs-Sektion 512 eintreten können. Die Steuerung geht dann auf Schritt 22g.
  • Demgemäß, wenn der Befehl zum Beenden des Freihandbetriebes eingegeben ist, wird die obige Umschaltsteuerung bewirkt, und die Benutzersprache, welche vom Nicht-Freihand-Mikrophon 543 eingegeben ist, wird in der Nicht-Freihand Echo-Steuersektion 532 der Echo-Steuerung unterworfen, welche für den Fall geeignet ist, bei welchem das Nicht-Freihand-Mikrophon 543 und der Nicht-Freihand-Mikrophon-Verstärker 544 verwendet werden.
  • Die im Echo gesteuerten Sprachdaten 551 werden in der Algorithmus-Y Rauschunterdrückungs-Sektion 512 dem Rauschunterdrückungsprozess unterworfen, welcher für den Fall optimal ist, bei welchem das Nicht-Freihand-Mikrophon 543, der Nicht-Freihand-Mikrophon-Verstärker 544 und die Nicht-Freihand-Echo-Steuersektion 532 verwendet werden. Die resultierenden Daten werden der Übertragungssektion an der Rückstufe als Übertragungs-Sprachdaten 552 ausgegeben.
  • In Schritt 22g, geht die Steuerung, wenn kein Befehl eingegeben ist, auf Schritt 22h. In Schritt 22h wird bestimmt, ob eine Kommunikations-Ende-Anforderung eingegeben ist. Wenn die Kommunikations-Ende-Anforderung eingegeben wurde, wird der vorliegende Prozess beendet. Wenn die Kommunikations-Ende-Anforderung nicht eingegeben ist, wird die Befehlseingabe in Schritt 22g abermals überwacht.
  • Wie oben beschrieben, wird in der Signalverarbeitungseinrichtung, welche den obigen Aufbau hat, wenn die im Echo gesteuerten, rauschunterdrückten Übertragungs-Sprachdaten 552 zu erlangen sind, die optimale Rauschunterdrückungs-Sektion (511 oder 512) gemäß dem Freihand-/Nicht-Freihand-Sprachdaten-Erzeugungspfad aktiviert.
  • Gemäß der Signalverarbeitungseinrichtung mit dem obigen Aufbau wird eine Rauschunterdrückung durch die Rauschunterdrückungs-Sektion bewirkt, welche für den Sprachdaten-Erzeugungspfad geeignet ist, das heißt Sprachdaten-Charakteristiken, und zwar sogar dann, wenn der Freihandbetrieb und der Nicht-Freihandbetrieb umgeschaltet sind. Somit wirkt die Rauschunterdrückungs-Sektion mit einer hohen Leistung, und es kann eine Sprache in hoher Qualität übertragen werden.
  • Eine Signalverarbeitungseinrichtung, welche nicht beansprucht ist, jedoch aus Gründen der Darstellung von weiteren Anwendungen im Bereich von der Erfindung vorliegt, wird nun beschrieben. 23 zeigt den Aufbau von dieser Einrichtung.
  • Eine Spracheingabesektion 640 wirkt zum Einfangen einer zu übertragenen Benutzersprache, Umwandeln derer in ein elektrisches Signal und Digitalisieren des Signals, um Sprachdaten zu erzeugen. Die Spracheingabesektion 640 enthält ein Mikrophon 641 für einen Freihandbetrieb, einen Mikrophonverstärker 642 für einen Freihandbetrieb, ein Mikrophon 643 für einen Nicht-Freihandbetrieb, einen Mikrophonverstärker 644 für einen Nicht-Freihandbetrieb, eine Mikrophon-Umschaltsteuersektion 645 und einen A/D-Umwandler 646.
  • Die Mikrophon-Umschaltsteuersektion 645 steuert ein Umschalten zwischen dem Freihand-Analogsystem und dem Nicht-Freihand-Analogsystem gemäß einem Steuerbefehl 653 zum Umschalten des Freihand-/Nicht-Freihandbetriebes.
  • Der A/D-Umwandler 646 empfängt ein analoges Sprachsignal von dem Analogsystem, welches durch die Umschaltsteuerung von der Mikrophon-Umschaltsteuersektion 645 ausgewählt ist, und digitalisiert das analoge Sprachsignal, um Sprachdaten zu erzeugen.
  • Im Nicht-Freihandbetrieb sind die Empfangsrichtung von Sprache und die Reisedistanz von Sprache im Wesentlichen unveränderlich. Somit wird ein Mikrophon, welches eine Empfindlichkeit und Richtcharakteristik hat, welche diese Bedingung einhalten, verwendet. Andererseits muss ein Mikrophon im Freihandbetrieb eine höhere Empfindlichkeit haben, so dass eine Sprache von weit her eingefangen werden kann. Zusätzlich, da die Richtung von ankommender Sprache variabel ist, muss die Richtcharakteristik des Mikrophons erhöht werden. Somit sind die Eigenschaften des analogen Sprachsignals, welches vom A/D-Umwandler 646 zugeführt wird, zwischen den Freihandbetrieb und dem Nicht-Freihandbetrieb unterschiedlich.
  • Eine Echo-Steuereinheit 630 enthält eine Freihand-Echo-Steuersektion 631, eine Nicht-Freihand-Echo-Steuersektion 632 und eine Echo-Umschaltsteuersektion 633.
  • Die Freihand-Echo-Steuersektion 631 ist geeignet, wenn das Freihand-Mikrophon 641 und der Freihand-Mikrophon-Verstärker 642 verwendet werden. Die Freihand-Echo-Steuersektion 631 reduziert ein Echo, welches auf die Sprachdaten überlagert wird, welche vom A/D-Umwandler 646 ausgegeben werden.
  • Andererseits ist die Nicht-Freihand Echo-Steuersektion 632 dazu geeignet, wenn das Nicht-Freihand-Mikrophon 643 und der Nicht-Freihand-Mikrophon-Verstärker 644 verwendet werden. Die Nicht-Freihand Echo-Steuersektion 632 reduziert ein Echo, welches auf die Sprachdaten überlagert ist, welche vom A/D-Umwandler 646 ausgegeben werden. Wenn jedoch eine Echounterdrückung nicht benötigt ist, werden die Sprachdaten direkt ohne Echo-Steuerung ausgegeben.
  • Die Echo-Umschaltsteuersektion 633 steuert ein Umschalten zwischen der Freihand-Echo-Steuersektion 631 und Nicht-Freihand-Echo-Steuersektion 632 gemäß dem Steuerbefehl 653 zum Umschalten des Freihand-/Nicht-Freihandbetriebes, so dass die Ausgewählte aus den Echo-Steuersektionen 631 und 632 die Sprachdaten vom A/D-Umwandler 646 empfangen kann.
  • Durch diese Steuerung werden Sprachdaten 651, welche durch die Freihand-Echo-Steuersektion 631 oder die Nicht-Freihand-Echo-Steuersektion 632 im Echo reduziert wurden, an einen Rauschunterdrücker 610 ausgegeben.
  • Der Rauschunterdrücker 610 enthält eine Rauschunterdrückungs-Sektion 615, eine Parameter-Tabelle 616 und eine Parameter-Umschaltsteuersektion 617. Die Rauschunterdrückungs-Sektion 615 unterdrückt ein Hintergrundrauschen, welches in Sprachdaten enthalten ist, welche von der Echo-Steuereinheit 630 ausgegeben werden. Die Unterdrückungs-Charakteristiken für eine Hintergrundrauschen-Unterdrückung werden durch Parameter gesteuert, welche von der Parameter-Tabelle 616 eingegeben werden.
  • Die Parameter-Tabelle 616 speichert Parameter zum Einstellen der Charakteristiken für eine Hintergrundrauschen-Unterdrückung, um auf die Rauschunterdrückungs-Sektion 615 bewirkt zu werden. Genauer gesagt, speichert die Parameter-Tabelle 616 eine Parameter-Einstellung A, welche für den Freihandbetrieb optimal ist, und eine Parameter-Einstellung B, welche für den Nicht-Freihandbetrieb optimal ist. Eine optimale aus den Parameter-Einstellungen wird der Rauschunterdrückungs-Sektion 615 durch die Steuerung der Parameter-Umschaltsteuersektion 617 eingegeben.
  • Die Parameter-Einstellung A stellt Charakteristiken bereit, welche für eine Rauschunterdrückung von den Sprachdaten 651 geeignet sind, welche durch das Freihand-Mikrophon 651, den Freihand-Mikrophon-Verstärker 642 und die Freihand-Echo-Steuersektion 631 erzeugt sind, welche im Freihandbetrieb verwendet werden.
  • Andererseits stellt die Parameter-Einstellung B Charakteristiken bereit, welche für eine Rauschunterdrückung von den Sprachdaten 651 geeignet sind, welche durch das Nicht-Freihand-Mikrophon 631, den Nicht-Freihand-Mikrophon-Verstärker 644 und die Nicht-Freihand-Echo-Steuersektion 632 erzeugt sind, welche im Nicht-Freihandbetrieb verwendet werden.
  • Die Parameter-Umschaltsteuersektion 617 steuert die Parameter-Tabelle 616. Somit kann, basierend auf dem Steuerbefehl 653 zum Umschalten des Freihand-/Nicht-Freihandbetriebes, eine der Parameter-Einstellungen, welche für die Rauschunterdrückung von den Sprachdaten 651 optimal ist, selektiv in der Rauschunterdrückungs-Sektion 615 eingestellt werden.
  • Der Betrieb von der in 23 gezeigten Signalverarbeitungseinrichtung wird nun beschrieben. 24 ist ein Ablaufdiagramm, welches diesen Betrieb darstellt.
  • In einem Befehlseingabe-Bereitschaftszustand in Schritt 24a, wenn der Steuerbefehl 653 auf die Wirkung, dass „Führe den Freihandbetrieb durch" eingegeben wurde, fährt die Steuerung mit Schritt 22d fort, um den Inhalt des eingegebenen Befehls zu bestimmen. Da sich der eingegebene Befehl auf den Beginn des Freihandbetriebes bezieht, geht die Steuerung auf Schritt 24c.
  • In Schritt 24c beginnt die Mikrophon-Umschaltsteuersektion 645 mit einer Umschaltsteuerung, so dass das analoge Sprachsignal, welches vom Freihand-Mikrophon 641 und dem Freihand-Mikrophon-Verstärker 642 kommt, dem A/D-Umwandler 646 eingegeben werden kann.
  • In Schritt 24c, parallel zur Umschaltsteuerung, bewirkt die Echo-Umschaltsteuersektion 633 ein Umschalten gemäß des Steuerbefehls 653, so dass die Sprachdaten vom A/D-Umwandler 646 der Freihand-Echo-Steuersektion 631 eingegeben werden können. Die Steuerung geht dann auf Schritt 24d.
  • In Schritt 24d, gemäß dem Steuerbefehl 653, steuert die Parameter-Umschaltsteuersektion 617 die Parameter-Tabelle 616 und stellt die optimale Parameter-Einstellung A für den Freihandbetrieb in der Rauschunterdrückungs-Sektion 615 ein. Die Steuerung geht dann auf Schritt 24g.
  • Demgemäß wird, wenn der Freihandbetriebsbefehl eingegeben ist, die obige Umschaltsteuerung bewirkt, und die Benutzersprache, welche vom Freihand-Mikrophon 641 eingegeben ist, wird in der Freihand-Echo-Steuersektion 631 der Echo-Steuerung unterworfen, welche für den Fall geeignet ist, bei welchem das Freihand-Mikrophon 641 und der Freihand-Mikrophon-Verstärker 642 verwendet werden.
  • Die im Echo gesteuerten Sprachdaten 651 werden in der Rauschunterdrückungs-Sektion 615, in welcher die Parameter Einstellung A eingestellt ist, dem Rauschunterdrückungsprozess unterworfen, welcher für den Fall geeignet ist, bei welchem das Freihand-Mikrophon 641, der Freihand-Mikrophon-Verstärker 642 und die Freihand-Echo-Steuersektion 631 verwendet werden. Die resultierenden Daten werden der Übertragungssektion an der Rückstufe als Übertragungs-Sprachdaten 652 ausgegeben.
  • In Schritt 24g, wenn der Steuerbefehl 653 auf die Wirkung, dass „Beende den Freihandbetrieb" eingegeben ist, geht die Steuerung auf Schritt 24b, um den Inhalt des eingegebenen Befehls zu bestimmen. Da sich der eingegebene Befehl auf die Beendigung des Freihandbetriebes bezieht, geht die Steuerung auf Schritt 24e.
  • In Schritt 24e beginnt die Mikrophon-Umschaltsteuersektion 645 eine Umschaltsteuerung, so dass das analoge Sprachsignal, welches vom Nicht-Freihand-Mikrophon 643 und Nicht-Freihand-Mikrophon-Verstärker 644 kommt, dem A/D-Umwandler 646 eingegeben werden kann.
  • In Schritt 24e, parallel zur Umschaltsteuerung, bewirkt die Echo-Umschaltsteuersektion 633 ein Umschalten gemäß des Steuerbefehls 653, so dass die Sprachdaten vom A/D-Umwandler 646 der Nicht-Freihand Echo-Steuersektion 632 eingegeben werden können. Die Steuerung geht dann auf Schritt 24f.
  • In Schritt 24f, gemäß dem Steuerbefehl 653, steuert die Parameter-Umschaltsteuersektion 617 die Parameter-Tabelle 616 und stellt die optimale Parameter-Einstellung B für den Nicht-Freihandbetrieb in der Rauschunterdrückungs-Sektion 615 ein. Die Steuerung geht dann auf Schritt 24g.
  • Demgemäß, wenn der Befehl zum Beenden des Freihandbetriebes eingegeben ist, wird die obige Umschaltsteuerung bewirkt, und die Benutzersprache, welche vom Nicht-Freihand-Mikrophon 643 eingegeben ist, wird in der Nicht-Freihand Echo-Steuersektion 632 der Echo-Steuerung unterworfen, welche für den Fall geeignet ist, bei welchem das Nicht-Freihand-Mikrophon 643 und der Nicht-Freihand-Mikrophon-Verstärker 644 verwendet werden.
  • Die im Echo gesteuerten Sprachdaten 651 werden in der Rauschunterdrückungs-Sektion 615, in welcher die Parameter-Einstellung B eingestellt ist, dem Rauschunterdrückungsprozess unterworfen, welcher für den Fall geeignet ist, bei welchem das Nicht-Freihand-Mikrophon 643, der Nicht-Freihand-Mikrophon-Verstärker 644 und die Nicht-Freihand-Echo-Steuersektion 632 verwendet werden. Die resultierenden Daten werden der Übertragungssektion an der Rückstufe als Übertragungs-Sprachdaten 652 ausgegeben.
  • In Schritt 24g geht die Steuerung, wenn kein Befehl eingegeben ist, auf Schritt 24h. In Schritt 24h wird bestimmt, ob eine Kommunikations-Ende-Anforderung eingegeben ist. Wenn die Kommunikations-Ende-Anforderung eingegeben wurde, wird der vorliegende Prozess beendet. Wenn die Kommunikations-Ende-Anforderung nicht eingegeben ist, wird die Befehlseingabe in Schritt 24g abermals überwacht.
  • Wie oben beschrieben, wird in der Signalverarbeitungseinrichtung, welche den obigen Aufbau hat, wenn die im Echo gesteuerten, rauschunterdrückten Übertragungs-Sprachdaten 652 zu erlangen sind, die Rauschunterdrückungs-Sektion 615 derart gesteuert, um optimale Rauschunterdrückungscharakteristiken gemäß dem Freihand-/Nicht-Freihand-Sprachdaten-Erzeugungspfad zu haben.
  • Gemäß der Signalverarbeitungseinrichtung mit dem obigen Aufbau wird eine Rauschunterdrückung durch die Rauschunterdrückungs-Sektion bewirkt, welche für den Sprachdaten-Erzeugungspfad geeignet ist, das heißt, Sprachdaten-Charakteristiken, und zwar sogar dann, wenn der Freihandbetrieb und der Nicht-Freihandbetrieb umgeschaltet werden. Somit wirkt die Rauschunterdrückungs-Sektion mit einer hohen Leistung, und es kann eine Sprache mit hoher Qualität übertragen werden.
  • Die vorliegende Erfindung ist nicht auf die oben beschriebenen Ausführungsformen beschränkt. In jeder Ausführungsform sind der Rauschunterdrücker, der Sprachkoder (Dekoder), die Echo-Steuereinheit, usw., als separate Sektionen beschrieben. Jedoch können diese Elemente in jeder Ausführungsform auf einen Chip integriert sein. Somit kann die Erfindung auf einem einzelnen DSP-Chip realisiert werden.
  • Alternativ ist es natürlich möglich, einen Hochgeschwindigkeits-Prozessor und einen Speicher zu verwenden, um im Speicher ein Programm zu speichern, welches Funktionen des Rauschunterdrückers, des Sprachkoders (Dekoders), der Echo-Steuereinheit, usw., aufweist, und um den Prozessor gemäß diesem Programm zu aktivieren.

Claims (26)

  1. Signalverarbeitungseinrichtung, welche enthält: einen Sprachenkoder (120, 220, 320, 420), welcher eine Mehrzahl von unterschiedlichen Kodierungs-Modi hat, wobei der Sprachenkoder unterdrückte Sprachsignale unter Verwendung eines der unterschiedlichen Kodierungs-Modi enkodiert; einen Rauschunterdrücker (110, 210, 310, 410), welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, wobei der Rauschunterdrücker ein Hintergrundrauschen, welches in einem Sprachsignal enthalten ist, unterdrückt und das rauschunterdrückte Sprachsignal erzeugt; dadurch gekennzeichnet, dass: der Rauschunterdrücker (110, 210, 310, 410) eine Rauschunterdrückungscharakteristik gemäß dem verwendeten Kodierungs-Modus am Sprachenkoder (120, 220, 320, 420) auswählt.
  2. Signalverarbeitungseinrichtung nach Anspruch 1, dadurch gekennzeichnet, dass: der Sprachenkoder (120, 220) eine Mehrzahl von unterschiedlichen Kodierungsalgorithmen hat und das rauschunterdrückte Sprachsignal unter Verwendung eines der unterschiedlichen Kodierungsalgorithmen enkodiert; der Rauschunterdrücker (110, 210) eine Rauschunterdrückungscharakteristik gemäß dem verwendeten Kodierungsalgorithmus am Sprachenkoder (120, 200) auswählt.
  3. Signalverarbeitungseinrichtung nach Anspruch 1, dadurch gekennzeichnet, dass: der Sprachenkoder (320, 420) eine Mehrzahl von unterschiedlichen Kodierungsraten hat und das rauschunterdrückte Sprachsignal unter Verwendung einer der unterschiedlichen Kodierungsraten enkodiert; und der Rauschunterdrücker (310, 410) eine Rauschunterdrückungscharakteristik gemäß der verwendeten Kodierungsrate am Sprachenkoder (320, 420) auswählt.
  4. Signalverarbeitungseinrichtung nach Anspruch 3, dadurch gekennzeichnet, dass der Rauschunterdrücker (310, 410) einen Frequenzteiler enthält, welcher das Sprachsignal in mehrere Sprachsignale aufteilt, wobei jedes der Sprachsignale ein unterschiedliches Frequenzband hat, wobei der Rauschunterdrücker (310, 410) lediglich Hintergrundrauschen, welches im Sprachsignal enthalten ist, welches ein vorbestimmtes Frequenzband hat, unterdrückt, wenn der Sprachenkoder (320, 420) eine vorbestimmte Kodierungsrate zur Enkodierung des Sprachsignals auswählt.
  5. Signalverarbeitungseinrichtung nach Anspruch 3, dadurch gekennzeichnet, dass der Rauschunterdrücker (310, 410) einen Frequenzteiler enthält, welcher das Sprachsignal in mehrere Sprachsignale aufteilt, wobei jedes der Sprachsignale ein unterschiedliches Frequenzband hat und der Rauschunterdrücker (310, 410) eine Unterdrückung von Hintergrundrauschen, welches im Sprachsignal enthalten ist, welches ein vorbestimmtes Frequenzband hat, beendet, wenn der Sprachenkoder (320, 420) eine vorbestimmte Kodierungsrate zum Enkodieren des Sprachsignals auswählt.
  6. Signalverarbeitungseinrichtung nach Anspruch 3, dadurch gekennzeichnet, dass der Rauschunterdrücker (310, 410) eine Unterdrückung von Hintergrundrauschen, welches im Sprachsignal enthalten ist, beendet, wenn der Sprachenkoder (320, 420) eine vorbestimmte Kodierungsrate zum Enkodieren des Sprachsignals auswählt.
  7. Signalverarbeitungseinrichtung nach Anspruch 2, dadurch gekennzeichnet, dass der Rauschunterdrücker (410) ein Parameter-Einstellmittel (410) zum Einstellen eines Parameters enthält, um somit eine Rauschunterdrückungscharakteristik auszuwählen, wobei die Parameter die Rauschunterdrückungscharakteristik variieren.
  8. Signalverarbeitungseinrichtung nach Anspruch 7, dadurch gekennzeichnet, dass die Parameter gemäß dem verwendeten Kodierungsalgorithmus am Sprachenkoder (420) eingestellt sind.
  9. Signalverarbeitungseinrichtung nach Anspruch 3, dadurch gekennzeichnet, dass der Rauschunterdrücker (410) ein Parameter-Einstellmittel (410) zum Einstellen eines Parameters enthält, um somit eine Rauschunterdrückungscharakteristik auszuwählen, und wobei die Parameter die Rauschunterdrückungscharakteristik variieren.
  10. Signalverarbeitungseinrichtung nach Anspruch 9, dadurch gekennzeichnet, dass die Parameter gemäß dem verwendeten Kodierungsalgorithmus am Sprachenkoder (420) eingestellt sind.
  11. Signalverarbeitungseinrichtung, welche enthält: einen Sprachdekoder (40, 120a), welcher eine Mehrzahl von unterschiedlichen Dekodierungs-Modi hat, wobei der Sprachdekoder ein enkodiertes Sprachsignal unter Verwendung eines der unterschiedlichen Dekodierungs-Modi dekodiert; dadurch gekennzeichnet, dass sie ferner enthält: einen Rauschunterdrücker (30, 110a), welcher eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat, welche eine im dekodierten Sprachsignal enthaltene Rauschkomponente unterdrücken; wobei der Rauschunterdrücker (30, 110a) eine Rauschunterdrückungscharakteristik gemäß dem verwendeten Dekodierungs-Modus am Sprachdekoder (40, 120a) auswählt.
  12. Signalverarbeitungseinrichtung nach Anspruch 11, dadurch gekennzeichnet, dass: der Sprachdekoder (120a) eine Mehrzahl von unterschiedlichen Dekodierungsalgorithmen hat und ein enkodiertes Sprachsignal unter Verwendung eines der unterschiedlichen Dekodierungsalgorithmen dekodiert; der Rauschunterdrücker (110a) eine Rauschunterdrückungscharakteristik gemäß dem verwendeten Dekodierungsalgorithmus am Sprachdekoder (120a) auswählt.
  13. Signalverarbeitungseinrichtung nach Anspruch 11, dadurch gekennzeichnet, dass: der Sprachdekoder (40) eine Mehrzahl von unterschiedlichen Dekodierungsraten hat und ein enkodiertes Sprachsignal unter Verwendung einer der unterschiedlichen Dekodierungsraten dekodiert; der Rauschunterdrücker (30) eine Rauschunterdrückungscharakteristik gemäß der verwendeten Rate am Sprachdekoder (40) auswählt.
  14. Signalverarbeitungseinrichtung nach Anspruch 13, dadurch gekennzeichnet, dass der Rauschunterdrücker (30) lediglich die Rauschkomponente unterdrückt, welche im dekodierten Signal enthalten ist, welches ein vorbestimmtes Frequenzband hat, wenn der Sprachdekoder (40) eine vorbestimmte Rate zum Dekodieren des enkodierten Sprachsignals auswählt.
  15. Signalverarbeitungseinrichtung nach Anspruch 13, dadurch gekennzeichnet, dass der Rauschunterdrücker (30) eine Unterdrückung der Rauschkomponente, welche im dekodierten Sprachsignal enthalten ist, welches ein vorbestimmtes Frequenzband hat, beendet, wenn der Sprachdekoder (40) eine vorbestimmte Rate zum Dekodieren des enkodierten Sprachsignals auswählt.
  16. Signalverarbeitungseinrichtung nach Anspruch 13, dadurch gekennzeichnet, dass der Rauschunterdrücker (30) eine Unterdrückung von Hintergrundrauschen, welches im dekodierten Sprachsignal enthalten ist, beendet, wenn der Sprachdekoder (40) ein vorbestimmtes Verhältnis zum Dekodieren des enkodierten Sprachsignals auswählt.
  17. Signalverarbeitungseinrichtung nach Anspruch 12, dadurch gekennzeichnet, dass der Rauschunterdrücker (30) ein Parameter-Einstellmittel (410, 411) zum Einstellen eines Parameters enthält, um somit eine Rauschunterdrückungscharakteristik auszuwählen, wobei der Parameter die Rauschunterdrückungscharakteristik variiert.
  18. Signalverarbeitungseinrichtung nach Anspruch 17, dadurch gekennzeichnet, dass der Parameter gemäß dem verwendeten Dekodierungsalgorithmus am Sprachdekoder (40) eingestellt ist.
  19. Signalverarbeitungseinrichtung nach Anspruch 13, dadurch gekennzeichnet, dass der Rauschunterdrücker (30) ein Parameter-Einstellmittel (410, 411) zum Einstellen eines Parameters enthält, um somit eine Rauschunterdrückungscharakteristik auszuwählen, wobei der Parameter die Rauschunterdrückungscharakteristik variiert.
  20. Signalverarbeitungseinrichtung nach Anspruch 19, dadurch gekennzeichnet, dass der Parameter gemäß der verwendeten Rate am Sprachdekoder (40) eingestellt ist.
  21. Mobilfunkkommunikations-Endgerät, welches eine Signalverarbeitungseinrichtung hat, wobei die Signalverarbeitungseinrichtung gemäß einem der vorherigen Ansprüche ist.
  22. Signalverarbeitungseinrichtung nach Anspruch 1, dadurch gekennzeichnet, dass: die Anzahl der Rauschunterdrückungscharakteristiken einen ersten Wert hat; die Anzahl der Kodierungs-Modi einen zweiten Wert hat, und die folgende Beziehung aufgebaut ist: Zweiter Wert ≥ Erster Wert > 1.
  23. Signalverarbeitungseinrichtung nach Anspruch 22, dadurch gekennzeichnet, dass: der Rauschunterdrücker (110) eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat und ein Hintergrundrauschen unterdrückt, welches in einem Sprachsignal enthalten ist, wobei die Anzahl der Rauschunterdrückungscharakteristiken gleich Q (Q: eine positive Ganzzahl) ist; und der Sprachenkoder (120) eine Mehrzahl von unterschiedlichen Kodierungsalgorithmen hat und das unterdrückte Sprachsignal unter Verwendung eines der unterschiedlichen Kodierungsalgorithmen enkodiert, wobei die Anzahl der Kodierungsalgorithmen gleich P (P: eine positive Ganzzahl) ist; der Rauschunterdrücker (110) eine Rauschunterdrückungscharakteristik gemäß dem verwendeten Kodierungsalgorithmus am Sprachenkoder (120) auswählt, wobei die folgende Beziehung aufgebaut ist: P ≥ Q > 1.
  24. Signalverarbeitungseinrichtung nach Anspruch 22, dadurch gekennzeichnet, dass: der Rauschunterdrücker (310) eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat und ein Hintergrundrauschen unterdrückt, welches in einem Sprachsignal enthalten ist, wobei die Anzahl der Rauschunterdrückungscharakteristiken gleich Q (Q: eine positive Ganzzahl) ist; und der Sprachenkoder (320) eine Mehrzahl von unterschiedlichen Kodierungsraten hat und das unterdrückte Sprachsignal unter Verwendung einer der unterschiedlichen Kodierungsraten enkodiert, wobei die Anzahl der Kodierungsraten gleich R (R: eine positive Ganzzahl) ist; der Rauschunterdrücker (310) eine Rauschunterdrückungscharakteristik gemäß der verwendeten Kodierungsrate am Sprachenkoder (320) auswählt, wobei die folgende Beziehung aufgebaut ist: R ≥ Q > 1.
  25. Signalverarbeitungseinrichtung nach Anspruch 22, dadurch gekennzeichnet, dass: der Rauschunterdrücker (210) eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat und ein Hintergrundrauschen unterdrückt, welches in einem Sprachsignal enthalten ist, wobei die Rauschunterdrückungscharakteristiken gemäß einem Parameter variiert sind, welcher durch ein Parameter-Einstellmittel (210) eingestellt ist; und der Sprachenkoder (220) eine Mehrzahl von unterschiedlichen Kodierungsalgorithmen hat und das unterdrückte Sprachsignal unter Verwendung eines der unterschiedlichen Kodierungsalgorithmen enkodiert, wobei die Anzahl der Kodierungsalgorithmen gleich P (P: eine positive Ganzzahl) ist; und das Parameter-Einstellmittel (210) einen geeigneten Parameter einstellt, um somit eine optimale Rauschunterdrückungscharakteristik gemäß dem verwendeten Kodierungsalgorithmus am Sprachenkoder (220) auszuwählen, wobei die Anzahl der Parameter gleich S (S: eine positive Ganzzahl) ist, wobei die folgende Beziehung aufgebaut ist: R ≥ S > 1
  26. Signalverarbeitungseinrichtung nach Anspruch 22, dadurch gekennzeichnet, dass: der Rauschunterdrücker (410) eine Mehrzahl von unterschiedlichen Rauschunterdrückungscharakteristiken hat und ein Hintergrundrauschen unterdrückt, welches in einem Sprachsignal enthalten ist, wobei die Rauschunterdrückungscharakteristiken gemäß einem Parameter variiert sind, welcher durch ein Parameter-Einstellmittel (410) eingestellt ist; und der Sprachenkoder (420) eine Mehrzahl von unterschiedlichen Kodierungsraten hat, und das unterdrückte Sprachsignal unter Verwendung einer der unterschiedlichen Kodierungsraten enkodiert, wobei die Anzahl der Kodierungsraten gleich R (R: eine positive Ganzzahl) ist; das Parameter-Einstellmittel (410) einen geeigneten Parameter einstellt, um somit eine optimale Rauschunterdrückungscharakteristik gemäß der verwendeten Kodierungsrate am Sprachenkoder (420) auszuwählen, wobei die Anzahl der Parameter gleich S (S: eine positive Ganzzahl) ist, wobei die folgende Beziehung aufgebaut ist: R ≥ S > 1
DE60129072T 2000-05-10 2001-05-10 Multimodale Sprachkodierung und Geräuschunterdrückung Expired - Lifetime DE60129072T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000137181 2000-05-10
JP2000137181A JP2001318694A (ja) 2000-05-10 2000-05-10 信号処理装置、信号処理方法および記録媒体

Publications (2)

Publication Number Publication Date
DE60129072D1 DE60129072D1 (de) 2007-08-09
DE60129072T2 true DE60129072T2 (de) 2008-03-06

Family

ID=18644994

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60129072T Expired - Lifetime DE60129072T2 (de) 2000-05-10 2001-05-10 Multimodale Sprachkodierung und Geräuschunterdrückung

Country Status (4)

Country Link
US (2) US20010041976A1 (de)
EP (1) EP1154408B1 (de)
JP (1) JP2001318694A (de)
DE (1) DE60129072T2 (de)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2003021573A1 (ja) * 2001-08-31 2004-12-24 富士通株式会社 コーデック
US20030101407A1 (en) * 2001-11-09 2003-05-29 Cute Ltd. Selectable complexity turbo coding system
WO2003042976A1 (en) * 2001-11-16 2003-05-22 Koninklijke Philips Electronics N.V. Method and system for processing audio signals
US7443978B2 (en) * 2003-09-04 2008-10-28 Kabushiki Kaisha Toshiba Method and apparatus for audio coding with noise suppression
JP4536020B2 (ja) * 2006-03-13 2010-09-01 Necアクセステクニカ株式会社 雑音除去機能を有する音声入力装置および方法
JP5070873B2 (ja) * 2006-08-09 2012-11-14 富士通株式会社 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム
US20080059154A1 (en) * 2006-09-01 2008-03-06 Nokia Corporation Encoding an audio signal
US8060363B2 (en) * 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
US9178478B2 (en) 2007-04-19 2015-11-03 At&T Intellectual Property Ii, L.P. Method and apparatus for providing privacy for telephone conversations
JP5053712B2 (ja) * 2007-05-29 2012-10-17 京セラ株式会社 無線端末および無線端末の音声再生方法
JP5489431B2 (ja) * 2008-08-11 2014-05-14 京セラ株式会社 無線通信モジュールおよび無線端末、無線通信方法
CN102356427B (zh) * 2009-04-02 2013-10-30 三菱电机株式会社 噪声抑制装置
JP5535746B2 (ja) * 2009-05-22 2014-07-02 本田技研工業株式会社 音データ処理装置及び音データ処理方法
CN101996638B (zh) * 2009-08-10 2012-02-29 北京多思科技发展有限公司 一种语音编解码器和语音编解码方法
JP5519230B2 (ja) 2009-09-30 2014-06-11 パナソニック株式会社 オーディオエンコーダ及び音信号処理システム
JP5294085B2 (ja) * 2009-11-06 2013-09-18 日本電気株式会社 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
US8311817B2 (en) * 2010-11-04 2012-11-13 Audience, Inc. Systems and methods for enhancing voice quality in mobile device
US8831937B2 (en) * 2010-11-12 2014-09-09 Audience, Inc. Post-noise suppression processing to improve voice quality
WO2013136742A1 (ja) * 2012-03-14 2013-09-19 パナソニック株式会社 車載通話装置
RU2650025C2 (ru) 2012-12-21 2018-04-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов
PT2936486T (pt) 2012-12-21 2018-10-19 Fraunhofer Ges Forschung Adição de ruído de conforto para modelagem do ruído de fundo em baixas taxas de bits
US9601130B2 (en) * 2013-07-18 2017-03-21 Mitsubishi Electric Research Laboratories, Inc. Method for processing speech signals using an ensemble of speech enhancement procedures
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的***和方法
GB201509483D0 (en) * 2014-12-23 2015-07-15 Cirrus Logic Internat Uk Ltd Feature extraction
US9972334B2 (en) * 2015-09-10 2018-05-15 Qualcomm Incorporated Decoder audio classification
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
CN117219098B (zh) * 2023-09-13 2024-06-11 南京汇智互娱网络科技有限公司 一种用于智能体的数据处理***

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2580686Y2 (ja) * 1989-08-08 1998-09-10 富士電機株式会社 回転電機のスパイダ回転軸
JPH05300209A (ja) * 1992-04-20 1993-11-12 Toshiba Corp 無線電話装置
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
JP3745403B2 (ja) * 1994-04-12 2006-02-15 ゼロックス コーポレイション オーディオデータセグメントのクラスタリング方法
JPH08166800A (ja) * 1994-12-13 1996-06-25 Hitachi Ltd 複数種類の符号化方法を備える音声符号器および復号器
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
EP0852052B1 (de) * 1995-09-14 2001-06-13 Ericsson Inc. System zur adaptiven filterung von tonsignalen zur verbesserung der sprachverständlichkeit bei umgebungsgeräuschen
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
JP3309895B2 (ja) * 1996-03-25 2002-07-29 日本電信電話株式会社 雑音低減方法
JP3613303B2 (ja) * 1996-08-08 2005-01-26 富士通株式会社 音声情報圧縮蓄積方法及び装置
JP3644173B2 (ja) * 1997-01-24 2005-04-27 株式会社デンソー 車載用電話装置および車載アダプタならびに携帯電話機
US6097943A (en) * 1997-07-02 2000-08-01 Telefonaktiebolaget L M Ericsson Application bound parameter storage
EP1010169B1 (de) * 1997-09-02 2006-06-21 QUALCOMM Incorporated System und verfahren zur regelung der kanalverstärkung für geräuschunterdrückung in der sprachkommunikation
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
JP3870531B2 (ja) * 1998-02-13 2007-01-17 ソニー株式会社 電子機器のノイズ低減装置及び記録装置のノイズ低減装置
JPH11338499A (ja) * 1998-05-28 1999-12-10 Kokusai Electric Co Ltd ノイズキャンセラ
US6141639A (en) * 1998-06-05 2000-10-31 Conexant Systems, Inc. Method and apparatus for coding of signals containing speech and background noise
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6233549B1 (en) * 1998-11-23 2001-05-15 Qualcomm, Inc. Low frequency spectral enhancement system and method
JP3454190B2 (ja) * 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US6925435B1 (en) * 2000-11-27 2005-08-02 Mindspeed Technologies, Inc. Method and apparatus for improved noise reduction in a speech encoder

Also Published As

Publication number Publication date
EP1154408B1 (de) 2007-06-27
US7058574B2 (en) 2006-06-06
US20010041976A1 (en) 2001-11-15
JP2001318694A (ja) 2001-11-16
EP1154408A2 (de) 2001-11-14
EP1154408A3 (de) 2003-01-29
US20050096904A1 (en) 2005-05-05
DE60129072D1 (de) 2007-08-09

Similar Documents

Publication Publication Date Title
DE60129072T2 (de) Multimodale Sprachkodierung und Geräuschunterdrückung
DE60214599T2 (de) Skalierbare audiokodierung
DE60120504T2 (de) Verfahren zur transcodierung von audiosignalen, netzwerkelement, drahtloses kommunikationsnetzwerk und kommunikationssystem
DE69930848T2 (de) Skalierbarer audiokodierer und dekodierer
DE602004010188T2 (de) Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
DE60032797T2 (de) Geräuschunterdrückung
DE60132321T2 (de) Verfahren und vorrichtung zur verteilten geräuschunterdrückung
DE60118553T2 (de) Verfahren und anordnung zur änderung der signalquellenbandbreite in einer telekommunikationsverbindung mit mehrfach-bandbreitenfähigkeit
DE3639753C2 (de)
DE69423693T2 (de) System zur angepassten Reduktion von Geräuschen bei Sprachsignalen
DE60029147T2 (de) Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk
DE69533734T2 (de) Durch Sprachaktivitätsdetektion gesteuerte Rauschunterdrückung
DE60319590T2 (de) Verfahren zur codierung und decodierung von audio mit variabler rate
DE69219718T2 (de) Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit
EP1230827B1 (de) Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
DE69429917T2 (de) Verfahren und vorrichtung zur gruppenkodierung von signalen
DE60021083T2 (de) Verfahren zur verbesserung der kodierungseffizienz eines audiosignals
EP1745637B1 (de) Konferenz-endgerät mit echoreduktion für ein sprachkonferenzsystem
DE19935808A1 (de) Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
DE112009002617T5 (de) Wahlweises Schalten zwischen mehreren Mikrofonen
DE60131766T2 (de) Wahrnehmungsbezogen verbesserte codierung akustischer signale
DE60113602T2 (de) Audiokodierer mit psychoakustischer Bitzuweisung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition