DE102012102882A1 - Elektrische Vorrichtung und Verfahren zum Empfangen von Sprechstimmen-Signalen dafür - Google Patents

Elektrische Vorrichtung und Verfahren zum Empfangen von Sprechstimmen-Signalen dafür Download PDF

Info

Publication number
DE102012102882A1
DE102012102882A1 DE201210102882 DE102012102882A DE102012102882A1 DE 102012102882 A1 DE102012102882 A1 DE 102012102882A1 DE 201210102882 DE201210102882 DE 201210102882 DE 102012102882 A DE102012102882 A DE 102012102882A DE 102012102882 A1 DE102012102882 A1 DE 102012102882A1
Authority
DE
Germany
Prior art keywords
voice
signal
main
signals
transmission channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE201210102882
Other languages
English (en)
Inventor
Hann-Shi TONG
Ting-Wei SUN
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HTC Corp
Original Assignee
HTC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HTC Corp filed Critical HTC Corp
Publication of DE102012102882A1 publication Critical patent/DE102012102882A1/de
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Es werden eine elektrische Vorrichtung (200) und ein Sprechstimmen-Signalempfangsverfahren dafür offenbart. Die elektrische Vorrichtung beinhaltet mehrere Sprechstimmen-Empfänger (211, 212...), einen Sprechstimmen-Aktivitätsdetektor (220), einen Sprechstimmen-Kanalschalter (230) und einen Rausch-Eliminator (240). Die Sprechstimmen-Empfänger werden zum Empfangen der Sprechstimmen-Signale verwendet. Der Sprechstimmen-Aktivitätsdetektor (220) empfängt und erkennt die Sprechstimmen-Signale und gewinnt ein Haupt-Sprechstimmensignal aus den Sprechstimmen-Signalen. Der Sprechstimmen-Kanalschalter (230) überträgt das Haupt-Sprechstimmensignal zu einem Sprach-Übertragungskanal (MT) und überträgt mehrere andere Sprechstimmen-Signale aus den Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zu einem Rausch-Übertragungssignal (NT) gemäß einem Erkennungsergebnis des Sprechstimmen-Aktivitätsdetektors. Der Rausch-Eliminator (240) reduziert das Rauschen in der Hauptstimme gemäß den Sprechstimmen-Signalen von dem Rausch-Übertragungskanal.

Description

  • TECHNISCHES GEBIET
  • Die Offenbarung betrifft eine elektrische Vorrichtung, die zum Empfangen von Sprechstimmen-Signalen verwendet wird. Die Offenbarung betrifft insbesondere ein Kommunikationsgerät mit einer elektrischen Vorrichtung, die Sprechstimmen-Signale empfangen kann.
  • HINTERGRUND
  • Bezug genommen wird auf 1, wobei die 1 einem schematischen Diagramm einer herkömmlichen Sprechstimmen-Empfangsvorrichtung 100 entspricht. Die herkömmliche Sprechstimmen-Empfangsvorrichtung 100 beinhaltet zwei Mikrofone 111 und 112, einen Sprechstimmen-Aktivitätsdetektor (VAD: voice activity detector) 120 und einen Rausch-Eliminator 130.
  • In der herkömmlichen Sprechstimmen-Empfangsvorrichtung 100 wird das Mikrofon 111 zum Empfangen von Haupt-Sprechstimmen eingestellt und das Mikrofon 112 wird zum Empfangen von Nicht-Haupt-Sprechstimmen eingestellt. Die Mikrofone 111 und 112 werden jeweils mit dem VAD 120 und dem Rausch-Eliminator 130 gekoppelt. Der VAD 120 empfängt Sprechstimmen durch die Mikrofone 111 und 112 und überträgt die vom Mikrofon 111 empfangenen Sprechstimmen durch einen Sprach-Übertragungskanal MT in Form von Sprechstimmen-Signalen zum Rausch-Eliminator 130. Währenddessen überträgt der VAD 120 vom Mikrofon 112 kommende Sprechstimmen-Signale durch einen Rausch-Übertragungskanal NT zum Rausch-Eliminator 130. Der Rausch-Eliminator 130 eliminiert Rauschen in den vom Sprach-Übertragungskanal MT übertragenen Sprechstimmen-Signalen gemäß den vom Rausch-Übertragungskanal NT übertragenen Sprechstimmen-Signalen, um klare Sprechstimmen-Signale zu erhalten.
  • In einer realen Anwendung kann das Mikrofon 111 jedoch evtl. das Haupt-Sprechstimmensignal nicht empfangen. In einer Konferenz mit mehreren Personen wird das zum Empfangen der Haupt-Sprechstimmensignale verwendete Mikrofon dynamisch verändert. Wenn also die herkömmliche Sprechstimmen-Empfangsvorrichtung 100 verwendet wird, dann muss ein Benutzer eine Position des Hauptmikrofons 111 von Zeit zu Zeit einstellen, um klare Sprechstimmen-Signale zu erhalten, was beim Gebrauch unpraktisch ist.
  • ÜBERSICHT
  • Die Offenbarung betrifft eine elektrische Vorrichtung, die ein Haupt-Sprechstimmensignal und Nicht-Haupt-Sprechstimmensignale in mehreren Sprechstimmen-Signalen adaptiv erkennt, um Rauschen in den Sprechstimmen-Signalen effektiv zu reduzieren.
  • Die Offenbarung ist auf eine andere elektrische Vorrichtung gerichtet, die ein Haupt-Sprechstimmensignal und Nicht-Haupt-Sprechstimmensignale in mehreren Sprechstimmen-Signalen adaptiv erkennt, um Rauschen in den Sprechstimmen-Signalen effektiv zu reduzieren.
  • Die Offenbarung stellt eine elektrische Vorrichtung mit mehreren Sprechstimmen-Empfängern, einem Sprechstimmen-Aktivitätsdetektor, einem Sprechstimmen-Kanalschalter und einem Rausch-Eliminator bereit. Die Sprechstimmen-Empfänger werden zum Empfangen mehrerer Sprechstimmen und zum Umwandeln der Sprechstimmen in Sprechstimmen-Signale verwendet. Der Sprechstimmen-Aktivitätsdetektor ist mit den Sprechstimmen-Empfängern gekoppelt bzw. verbunden und empfängt und erkennt die Sprechstimmen-Signale und gewinnt ein Haupt-Sprechstimmensignal aus den Sprechstimmen-Signalen. Der Sprechstimmen-Kanalschalter ist mit den Sprechstimmen-Empfängern und dem Sprechstimmen-Aktivitätsdetektor gekoppelt und überträgt das Haupt-Sprechstimmensignal zu einem Sprach-Übertragungskanal und überträgt mehrere andere Sprechstimmen-Signalen aus den Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zu einem Rausch-Übertragungskanal gemäß einem Erkennungsergebnis des Sprechstimmen-Aktivitätsdetektors. Der Rausch-Eliminator ist mit dem Sprach-Übertragungskanal und dem Rausch-Übertragungskanal gekoppelt und reduziert Rauschen des Haupt-Sprechstimmensignals im Sprach-Übertragungskanal gemäß den anderen Sprechstimmen-Signalen des Rausch-Übertragungskanals.
  • In einer Ausgestaltung der Offenbarung ermittelt anhand einer charakteristischen Funktion des Sprechstimmen-Signals der Sprechstimmen-Aktivitätsdetektor, ob die einzelnen Sprechstimmen-Signale das Haupt-Sprechstimmensignal sind.
  • In einer Ausgestaltung der Offenbarung legt der Sprechstimmen-Aktivitätsdetektor mehrere Identifikations-Nummern für die Sprechstimmen-Signale fest und erzeugt ein Anzeigesignal gemäß der Identifikations-Nummer des Haupt-Sprechstimmensignals.
  • In einer Ausgestaltung der Offenbarung empfängt der Sprechstimmen-Kanalschalter das Anzeigesignal und überträgt das Haupt-Sprechstimmensignal mit der dem Anzeigesignal entsprechenden Identifikations-Nummer zum Sprach-Übertragungskanal und überträgt die Sprechstimmen-Signale mit dem Anzeigesignal nicht entsprechenden Identifikations-Nummern zum Rausch-Übertragungskanal.
  • In einer Ausgestaltung der Offenbarung ist der Rausch-Eliminator ein Prozessor und der Prozessor führt einen Rausch-Eliminierungs-Algorithmus aus, um das Rauschen im Haupt-Sprechstimmensignal auf dem Sprach-Übertragungskanal gemäß den anderen Sprechstimmen-Signalen auf dem Rausch-Übertragungskanal zu reduzieren.
  • Die Offenbarung stellt eine elektrische Vorrichtung mit einer Sprechstimmen-Empfangsvorrichtung bereit. Die Sprechstimmen-Empfangsvorrichtung hat mehrere Sprechstimmen-Empfänger zum Empfangen mehrerer Sprechstimmen und zum Umwandeln der Sprechstimmen in mehrere Sprechstimmen-Signale. Die Sprechstimmen-Empfangsvorrichtung beinhaltet einen Sprechstimmen-Aktivitätsdetektor, einen Sprechstimmen-Kanalschalter und einen Rausch-Eliminator. Der Sprechstimmen-Aktivitätsdetektor ist mit den Sprechstimmen-Empfängern gekoppelt und empfängt und erkennt die Sprechstimmen-Signale und gewinnt ein Haupt-Sprechstimmensignal aus den Sprechstimmen-Signalen. Der Sprechstimmen-Kanalschalter ist mit den Sprechstimmen-Empfängern und dem Sprechstimmen-Aktivitätsdetektor gekoppelt und überträgt das Haupt-Sprechstimmensignal zu einem Sprach-Übertragungskanal und überträgt mehrere andere Sprechstimmen-Signale aus den Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zu einem Rausch-Übertragungskanal gemäß einem Erkennungsergebnis des Sprechstimmen-Aktivitätsdetektors. Der Rausch-Eliminator ist mit dem Sprach-Übertragungskanal und dem Rausch-Übertragungskanal gekoppelt und reduziert Rauschen im Haupt-Sprechstimmensignal auf dem Sprach-Übertragungskanal gemäß den anderen Sprechstimmen-Signalen auf dem Rausch-Übertragungskanal.
  • Die Offenbarung stellt ferner ein Verfahren zum Verarbeiten von Sprechstimmen bereit, das die folgenden Schritte beinhaltet: Empfangen mehrerer Sprechstimmen und Umwandeln der Sprechstimmen in Sprechstimmen-Signale; Erkennen der Sprechstimmen-Signale zum Gewinnen eines Haupt-Sprechstimmensignals aus den Sprechstimmen-Signalen; ferner Übertragen des Haupt-Sprechstimmensignals zu einem Sprach-Übertragungskanal und Übertragen mehrerer anderer Sprechstimmen-Signale aus den Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zu einem Rausch-Übertragungskanal; ferner Reduzieren von Rauschen im Haupt-Sprechstimmensignal auf dem Sprach-Übertragungskanal gemäß den anderen Sprechstimmen-Signalen von dem Rausch-Übertragungskanal.
  • Gemäß den obigen Beschreibungen wird das Haupt-Sprechstimmensignal durch dynamisches Erkennen mehrerer Sprechstimmen-Signale erhalten. Die Rauschreduzierung erfolgt gemäß dem Haupt-Sprechstimmensignal und dem anderen Nicht-Haupt-Sprechstimmensignal, um das Sprechstimmen-Signal mit der höchsten Qualität und dem geringsten Rauschen zu gewinnen.
  • Damit die oben erwähnten sowie andere Merkmale und Vorteile der Offenbarung verständlich werden, werden nachfolgend mehrere beispielhafte Ausgestaltungen in Verbindung mit Figuren ausführlich beschrieben.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Die Begleitzeichnungen sollen das Verständnis der Offenbarung vertiefen und sind in dieser vorliegenden Spezifikation als Bestandteil derselben eingeschlossen. Die Zeichnungen illustrieren Ausgestaltungen der Offenbarung und dienen, zusammen mit der Beschreibung, zum Erläutern der Grundsätze der Offenbarung.
  • 1 ist ein schematisches Diagramm einer herkömmlichen Sprechstimmen-Empfangsvorrichtung 100.
  • 2 ist ein schematisches Diagramm einer elektrischen Vorrichtung 200 gemäß einer Ausgestaltung der Offenbarung.
  • 3 illustriert ein Sprach- bzw. Sprechstimmen-Spektrums-Diagramm.
  • 4 ist ein schematisches Diagramm eines Kommunikationsgeräts 400 gemäß einer Ausgestaltung der Offenbarung.
  • 5 ist ein Fließschema, das ein Verfahren zum Verarbeiten von Sprechstimmen gemäß einer Ausgestaltung der Offenbarung illustriert.
  • AUSFÜHRLICHE BESCHREIBUNG VON OFFENBARTEN AUSGESTALTUNGEN
  • Bezug wird auf 2 genommen, wobei die 2 einem schematischen Diagramm einer elektrischen Vorrichtung 200 gemäß einer Ausgestaltung der Offenbarung entspricht. Die elektrische Vorrichtung 200 beinhaltet mehrere Sprechstimmen-Empfänger 21121N, einen Sprechstimmen-Aktivitätsdetektor 220, einen Sprechstimmen-Kanalschalter 230 und einen Rausch-Eliminator 240. Die Sprechstimmen-Empfänger 21121N sind auf einer Sprechstimmen-Empfangsvorrichtung 200 angeordnet und werden zum Empfangen mehrerer Sprechstimmen aus verschiedenen Richtungen und zum Umwandeln der empfangenen Sprechstimmen in Sprechstimmen-Signale verwendet.
  • Der Sprechstimmen-Aktivitätsdetektor 220 ist mit den Sprechstimmen-Empfängern 21121N gekoppelt und empfängt die von den Sprechstimmen-Empfängern 21121N gesendeten Sprechstimmen-Signale. Ferner erkennt der Sprechstimmen-Aktivitätsdetektor 220 die Sprechstimmen-Signale, um ein Haupt-Sprechstimmensignal aus den von den Sprechstimmen-Empfängern 21121N übertragenen Sprechstimmen-Signalen zu gewinnen.
  • Bezug genommen wird auf 2 und 3, wobei 3 ein Sprach-Spektrumsdiagramm darstellt. Der Sprechstimmen-Aktivitätsdetektor 220 empfängt mehrere der von den Sprechstimmen-Empfängern 21121N kommenden Sprechstimmen-Signale und erkennt eine charakteristische Funktion jedes der Sprechstimmen-Signale, um zu ermitteln, ob das Sprechstimmen-Signal das Haupt-Sprechstimmensignal ist. Wenn man das Spektrumsdiagramm von 3 als Beispiel nimmt, dann entsprechen in einem Spektrum des Sprechstimmen-Signals verschiedene Frequenzen mehreren Endpunkten C1–C4. Der Sprechstimmen-Aktivitätsdetektor 220 kann die Zahl der Endpunkte C1–C4 jedes der Sprechstimmen-Signale erkennen, um zu lernen, ob die einzelnen Sprechstimmen-Signale menschlicher Sprache am nächsten kommen, d. h. dem Haupt-Sprechstimmensignal entsprechen.
  • Der Sprechstimmen-Aktivitätsdetektor 220 erkennt die Sprechstimmen-Signale anhand eines Sprechstimmen-Aktivitäts-Erkennungsalgorithmus. Der Sprechstimmen-Aktivitäts-Erkennungsalgorithmus wird auch als Endpunkt-Erkennungsverfahren bezeichnet. Der Sprechstimmen-Aktivitätsdetektor 220 kann die Erkennungen anhand der charakteristischen Funktionen (z. B. den Endpunkten im Spektrum) der Sprechstimmen-Signale durchführen und die üblicherweise benutzten Sprechstimmen-Aktivitäts-Erkennungsalgorithmen beinhalten Niederfrequenz-Spektralgröße (LFSM), Vollband-Spektralgröße (FBSM), kumulatives quantisiertes Spektrum (CQS) und logarithmische Hochpassenergie (HPLE) usw.
  • Es ist zu bemerken, dass der Sprechstimmen-Aktivitätsdetektor 220 Identifikations-Nummern für die empfangenen Sprechstimmen-Signale einstellen kann, z. B. Identifikation-Nummern 1 – N für die von den Sprechstimmen-Empfängern 21121N empfangenen Sprechstimmen-Signale. Wenn der Sprechstimmen-Aktivitätsdetektor 220 erkennt, dass das vom Sprechstimmen-Empfänger 215 empfangene Sprechstimmen-Signal das Haupt-Sprechstimmensignal ist, dann erzeugt der Sprechstimmen-Aktivitätsdetektor 220 ein Anzeigesignal gemäß der Identifikations-Nummer 5 des vom Sprechstimmen-Empfänger 215 empfangenen Sprechstimmen-Signals. Kurz, das Anzeigesignal kann ein digitaler Formatcode von 5 sein, d. h. „0101”.
  • Mit Bezug auf 2, der Sprechstimmen-Kanalschalter 230 ist mit den Sprechstimmen-Empfängern 21121N und dem Sprechstimmen-Aktivitätsdetektor 220 gekoppelt. Der Sprechstimmen-Kanalschalter 230 überträgt das Haupt-Sprechstimmen-Signal der von den Sprechstimmen-Empfängern 21121N kommenden Sprechstimmen-Signale zu einem Sprach-Übertragungskanal MT gemäß einem Erkennungsergebnis des Sprechstimmen-Aktivitätsdetektors 220. Ferner überträgt der Sprechstimmen-Kanalschalter 230 mehrere andere Sprechstimmen-Signale der von den Sprechstimmen-Empfängern 21121N kommenden Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zu einem Rausch-Übertragungskanal NT. Gemäß dem obigen Beispiel des Sprechstimmen-Aktivitätsdetektors 220 lernt der Sprechstimmen-Kanalschalter 230, wenn er das vom Sprechstimmen-Aktivitätsdetektor 220 gesendete Anzeigesignal „0101” empfängt, dass das Sprechstimmen-Signal mit der Identifikations-Nummer 5 das Haupt-Sprechstimmensignal ist. Daher überträgt der Sprechstimmen-Kanalschalter 230 das Sprechstimmen-Signal mit der Identifikations-Nummer 5 zum Sprach-Übertragungskanal MT und überträgt die Sprechstimmen-Signale mit anderen Identifikations-Nummern als 5 zum Rausch-Übertragungskanal NT.
  • Der Rausch-Eliminator 240 ist mit dem Sprach-Übertragungskanal MT und dem Rausch-Übertragungskanal NT gekoppelt und empfängt das Haupt-Sprechstimmensignal und die Nicht-Haupt-Sprechstimmensignale über den Sprach-Übertragungskanal MT und den Rausch-Übertragungskanal NT. Es ist zu bemerken, dass beim Erkennen der Sprechstimmen-Signale mehrere Faktoren ein Spracherkennungsergebnis beeinflussen könnten, wobei Hauptfaktoren additives Rauschen und Faltungsrauschen in der Umgebung sowie Bandbreiten-Begrenzungen bei der Sprach-Übertragung usw. sind. Additives Rauschen kann auch als Hintergrund-Rauschen bezeichnet werden, da alle Töne, die in der Umgebung erzeugt werden, in der sich die Sprechstimmen-Empfangsvorrichtung befindet, zu dem Sprechstimmen-Signal addiert werden, was zu Schwierigkeiten beim Erkennen der Sprechstimmen-Signale führt. Faltungs-Rauschen kann auch als Kanal-Rauschen oder als Kanal-Verzerrung bezeichnet werden, was hauptsächlich durch Unterschiede zwischen den Sprechstimmen-Empfängern 21121N (z. B. Mikrofone) und durch Einflüsse von externen elektromagnetischen Wellen aufgrund eines schlechten Abschirmungseffekts von Übertragungsleitungen verursacht wird.
  • Daher kann der Rausch-Eliminator 240 eine Datenbank der in der Umgebung erzeugten Rauschinformationen gemäß den ein oder mehreren der vom Rausch-Übertragungskanal NT übertragenen Nicht-Haupt-Sprechstimmensignalen erstellen. Der Rausch-Eliminator 240 kann das Rauschen des Haupt-Sprechstimmensignals gemäß der Rausch-Informationsdatenbank eliminieren und kann die Fähigkeit des Reduzierens des Rauschens des Haupt-Sprechstimmensignals gemäß verschiedenen Gebrauchsumgebungen und Betriebszuständen und Hardware-Begrenzungen weiter verbessern.
  • In der vorliegenden Ausgestaltung kann der Rausch-Eliminator 240 direkt durch eine Hardware-Schaltung implementiert werden oder kann ein Prozessor mit einer Rechenfähigkeit sein, die ein Software-Programm mit einem Rausch-Eliminierungs-Algorithmus ausführt, um Rausch-Reduzierung durchzuführen.
  • Bezug wird auf 4 genommen, wobei die 4 einem schematischen Diagramm eines Kommunikationsgeräts 400 gemäß einer Ausgestaltung der Offenbarung entspricht. Eine elektrische Vorrichtung des Kommunikationsgeräts 400 beinhaltet eine Sprechstimmen-Empfangsvorrichtung 420 und die Sprechstimmen-Empfangsvorrichtung 420 hat mehrere Sprechstimmen-Empfänger 411414 zum Empfangen mehrerer Sprechstimmen und zum Umwandeln der Sprechstimmen in mehrere Sprechstimmen-Signale. In der vorliegenden Ausgestaltung sind die Sprechstimmen-Empfänger 411414 jeweils auf vier Seiten des Kommunikationsgeräts 400 zum Empfangen von Sprechstimmen aus verschiedenen Richtungen angeordnet. Kurz, wenn ein Teilnehmer in der Nähe des Sprechstimmen-Empfängers 411 spricht, dann ermittelt die Sprechstimmen-Empfangsvorrichtung 420, dass das von dem Sprechstimmen-Empfänger 411 kommende Sprechstimmen-Signal das Haupt-Sprechstimmensignal ist, und von den Sprechstimmen-Empfängern 412413 empfangene Nicht-Hauptstimmen werden wahrscheinlich Geräusche in der Konferenzumgebung und/oder Geräusche sein, die durch gegenseitige Interferenzen von verschiedenen Komponenten im Kommunikationsgerät 400 verursacht werden. Daher kann die Sprechstimmen-Empfangsvorrichtung 420 die von den Sprechstimmen-Empfängern 412413 empfangenen Nicht-Haupt-Sprechstimmensignale als Rauschermittlungsbasis nehmen, um das Rauschen im Haupt-Sprechstimmensignal effektiv zu reduzieren, um die Qualität des Sprechstimmen-Signals zu verbessern.
  • Bezug genommen wird auf 5, wobei 5 ein Fließschema bzw. Ablaufdiagram ist, das ein Verfahren zum Verarbeiten von Sprechstimmen gemäß einer Ausgestaltung der Offenbarung illustriert. Das Verfahren beinhaltet die folgenden Schritte: erstens, Empfangen mehrerer Sprechstimmen und Umwandeln der Sprechstimmen in Sprechstimmen-Signale (S510); dann Erkennen der Sprechstimmen-Signale zum Gewinnen eines Haupt-Sprechstimmensignals aus den Sprechstimmen-Signalen (S520); ferner, Übertragen des Haupt-Sprechstimmensignals zu einem Sprach-Übertragungskanal und Übertragen mehrerer anderer Sprechstimmen-Signale aus den Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zu einem Rausch-Übertragungskanal (S530); ferner Reduzieren eines Rauschens des Haupt-Sprechstimmensignals im Sprach-Übertragungskanal gemäß den anderen Sprechstimmen-Signalen von dem Rausch-Übertragungskanal (S540). Sprechstimmen-Verarbeitungsdetails der vorliegenden Ausgestaltung wurden in den obigen Ausgestaltungen ausführlich beschrieben und werden hierin nicht wiederholt.
  • Zusammenfassend werden in der Offenbarung das Haupt-Sprechstimmensignal und die Nicht-Haupt-Sprechstimmensignale durch Erkennen der Sprechstimmen-Signale erhalten bzw. gewonnen, die von mehreren Sprechstimmen-Empfängern empfangen wurden. Dann wird das Rauschen des Haupt-Sprechstimmensignals gemäß den Nicht-Haupt-Sprechstimmensignalen eliminiert, um die Qualität des Haupt-Sprechstimmensignals zu verbessern. Da ein Haupt-Sprechstimmen-Empfänger in den Sprechstimmen-Empfängern dynamisch eingestellt bzw. angepasst wird, braucht die Sprechstimmen-Empfangsvorrichtung nicht gemäß der Position des Benutzers justiert zu werden, wodurch nicht nur die Bediener-Freundlichkeit erhöht, sondern auch die Sprechstimmen-Qualität effektiv verbessert wird.
  • Es wird für den Fachmann offensichtlich sein, dass verschiedene Modifikationen und Variationen an der Struktur der Offenbarung vorgenommen werden können, ohne von Umfang oder Wesen der Offenbarung abzuweichen. Im Hinblick auf das oben Gesagte ist beabsichtigt, dass die Offenbarung Modifikationen und Variationen der vorliegenden Offenbarung abdeckt, die in den Umfang der nachfolgenden Ansprüche und ihrer Äquivalente fallen.

Claims (13)

  1. Elektrische Vorrichtung (200; 400) aufweisend: mehrere Sprechstimmen-Empfänger (211, 212, ...; 411, 412...), die mehrere Sprechstimmen empfangen und die Sprechstimmen in Sprechstimmen-Signale umwandeln; einen Sprechstimmen-Aktivitätsdetektor (220; 420), der mit den Sprechstimmen-Empfängern gekoppelt ist und der die Sprechstimmen-Signale empfängt und erkennt und ein Haupt-Sprechstimmensignal aus den Sprechstimmen-Signalen gewinnt; einen Sprechstimmen-Kanalschalter (230), der mit den Sprechstimmen-Empfängern und dem Sprechstimmen-Aktivitätsdetektor gekoppelt ist und das Haupt-Sprechstimmensignal zu einem Sprach-Übertragungskanal (MT) überträgt und mehrere andere Sprechstimmen-Signale aus den Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zu einem Rausch-Übertragungskanal (NT) gemäß einem Erkennungsergebnis des Sprechstimmen-Aktivitätsdetektors überträgt; und einen Rausch-Eliminator (240), der mit dem Sprach-Übertragungskanal und dem Rausch-Übertragungskanal gekoppelt ist und ein Rauschen des Haupt-Sprechstimmensignals im Sprach-Übertragungskanal gemäß den anderen Sprechstimmen-Signalen des Rausch-Übertragungskanals reduziert.
  2. Elektrische Vorrichtung nach Anspruch 1, wobei der Sprechstimmen-Aktivitätsdetektor (220) gemäß einer charakteristischen Funktion des Sprechstimmen-Signals ermittelt, ob die einzelnen Sprechstimmen-Signale das Haupt-Sprechstimmensignal sind.
  3. Elektrische Vorrichtung nach Anspruch 1, wobei der Sprechstimmen-Aktivitätsdetektor (220) mehrere Identifikations-Nummern für die Sprechstimmen-Signale festlegt und ein Anzeigesignal gemäß der Identifikations-Nummer des Haupt-Sprechstimmensignals erzeugt.
  4. Elektrische Vorrichtung nach Anspruch 3, wobei der Sprechstimmen-Kanalschalter (230) das Anzeigesignal empfängt, das Haupt-Sprechstimmensignal mit der dem Anzeigesignal entsprechenden Identifikations-Nummer zum Sprach-Übertragungskanal (MT) überträgt und die Sprechstimmen-Signale mit dem Anzeigesignal nicht entsprechenden Identifikations-Nummern zum Rausch-Übertragungskanal (NT) überträgt.
  5. Elektrische Vorrichtung nach Anspruch 1, wobei der Rausch-Eliminator (240) ein Prozessor ist und der Prozessor einen Rausch-Eliminierungs-Algorithmus ausführt, um das Rauschen des Haupt-Sprechstimmensignals im Sprach-Übertragungskanal (MT) gemäß den anderen Sprechstimmen-Signalen des Rausch-Übertragungskanals (NT) zu reduzieren.
  6. Elektrische Vorrichtung (200; 400), aufweisend: ein Kommunikationsmodul mit einer Kommunikationsfunktion; eine Sprechstimmen-Empfangsvorrichtung (220; 420) mit mehreren Sprechstimmen-Empfängern (211, 212, ...; 411, 412...) zum Empfangen mehrerer Sprechstimmen und zum Umwandeln der Sprechstimmen in mehrere Sprechstimmen-Signale, die Folgendes umfasst: einen Sprechstimmen-Aktivitätsdetektor, der mit den Sprechstimmen-Empfängern gekoppelt ist und der die Sprechstimmen-Signale empfängt und erkennt und ein Haupt-Sprechstimmensignal aus den Sprechstimmen-Signalen gewinnt; einen Sprechstimmen-Kanalschalter, der mit den Sprechstimmen-Empfängern und dem Sprechstimmen-Aktivitätsdetektor gekoppelt ist und der das Haupt-Sprechstimmensignal zu einem Sprach-Übertragungskanal überträgt und mehrere andere Sprechstimmen-Signale aus den Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zu einem Rausch-Übertragungskanal gemäß einem Erkennungsergebnis des Sprechstimmen-Aktivitätsdetektors überträgt; und einen Rausch-Eliminator, der mit dem Sprach-Übertragungskanal und dem Rausch-Übertragungskanal gekoppelt ist und ein Rauschen des Haupt-Sprechstimmensignals im Sprach-Übertragungskanal gemäß den anderen Sprechstimmen-Signalen des Rausch-Übertragungskanals reduziert, wobei das gefilterte Haupt-Sprechstimmensignal vom Kommunikationsmodul übertragen wird.
  7. Elektrische Vorrichtung nach Anspruch 6, wobei der Sprechstimmen-Aktivitätsdetektor gemäß einer charakteristischen Funktion des Sprechstimmen-Signals ermittelt, ob die einzelnen Sprechstimmen-Signale das Haupt-Sprechstimmensignal sind.
  8. Elektrische Vorrichtung nach Anspruch 6, wobei der Sprechstimmen-Aktivitätsdetektor mehrere Identifikations-Nummern für die Sprechstimmen-Signale festlegt und ein Anzeigesignal gemäß der Identifikations-Nummer des Haupt-Sprechstimmensignals erzeugt.
  9. Elektrische Vorrichtung nach Anspruch 8, wobei der Sprechstimmen-Kanalschalter das Anzeigesignal empfängt, das Haupt-Sprechstimmensignal mit der dem Anzeigesignal entsprechenden Identifikations-Nummer zum Sprach-Übertragungskanal überträgt und die Sprechstimmen-Signale mit den dem Anzeigesignal nicht entsprechenden Identifikations-Nummern zum Rausch-Übertragungskanal überträgt.
  10. Elektrische Vorrichtung nach Anspruch 6, wobei der Rausch-Eliminator ein Prozessor ist und der Prozessor einen Rausch-Eliminierungs-Algorithmus ausführt, um das Rauschen im Haupt-Sprechstimmensignal auf dem Sprach-Übertragungskanal gemäß den anderen Sprechstimmen-Signalen des Rausch-Übertragungskanals zu reduzieren.
  11. Verfahren zum Verarbeiten von Sprechstimmen, das Folgendes beinhaltet: Empfangen mehrerer Sprechstimmen und Umwandeln der Sprechstimmen in Sprechstimmen-Signale (S510); Erkennen der Sprechstimmen-Signale, um ein Haupt-Sprechstimmensignal aus den Sprechstimmen-Signalen zu gewinnen (S520); Übertragen des Haupt-Sprechstimmensignals zu einem Sprach-Übertragungskanal und Übertragen mehrerer anderer Sprechstimmen-Signale aus den Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zu einem Rausch-Übertragungskanal (S530); und Reduzieren von Rauschen des Haupt-Sprechstimmensignals im Sprach-Übertragungskanal gemäß den anderen Sprechstimmen-Signalen des Rausch-Übertragungskanals (S540).
  12. Verfahren zum Verarbeiten von Sprechstimmen nach Anspruch 11, wobei der Schritt bzw. die Schritte (S510; S520) des Empfangens und Erkennens der Sprechstimmen-Signale zum Gewinnen des Haupt-Sprechstimmensignals aus den Sprechstimmen-Signalen Folgendes beinhaltet: Ermitteln, ob die einzelnen Sprechstimmen-Signale das Haupt-Sprechstimmensignal sind, gemäß einer charakteristischen Funktion des Sprechstimmen-Signals.
  13. Verfahren zum Verarbeiten von Sprechstimmen nach Anspruch 11, wobei der Schritt (S530) des Übertragens des Haupt-Sprechstimmensignals zum Sprach-Übertragungskanal und des Übertragens der anderen Sprechstimmen-Signale aus den Sprechstimmen-Signalen, die nicht das Haupt-Sprechstimmensignal sind, zum Rausch-Übertragungskanal gemäß einem Erkennungsergebnis des Sprechstimmen-Aktivitätsdetektors Folgendes beinhaltet: Festlegen mehrerer Identifikations-Nummern für die Sprechstimmen-Signale, wobei der Sprechstimmen-Aktivitätsdetektor ein Anzeigesignal gemäß der Identifikations-Nummer des Haupt-Sprechstimmensignals erzeugt; und Übertragen des Haupt-Sprechstimmensignals mit der dem Anzeigesignal entsprechenden Identifikations-Nummer zum Sprach-Übertragungskanal und Übertragen der Sprechstimmen-Signale mit den dem Anzeigesignal nicht entsprechenden Identifikations-Nummern zum Rausch-Übertragungskanal.
DE201210102882 2011-11-04 2012-04-03 Elektrische Vorrichtung und Verfahren zum Empfangen von Sprechstimmen-Signalen dafür Ceased DE102012102882A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/288,970 US8924206B2 (en) 2011-11-04 2011-11-04 Electrical apparatus and voice signals receiving method thereof
US13/288,970 2011-11-04

Publications (1)

Publication Number Publication Date
DE102012102882A1 true DE102012102882A1 (de) 2013-05-08

Family

ID=48129035

Family Applications (1)

Application Number Title Priority Date Filing Date
DE201210102882 Ceased DE102012102882A1 (de) 2011-11-04 2012-04-03 Elektrische Vorrichtung und Verfahren zum Empfangen von Sprechstimmen-Signalen dafür

Country Status (4)

Country Link
US (1) US8924206B2 (de)
CN (1) CN103093758B (de)
DE (1) DE102012102882A1 (de)
TW (1) TWI441169B (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9111542B1 (en) * 2012-03-26 2015-08-18 Amazon Technologies, Inc. Audio signal transmission techniques
KR102094392B1 (ko) * 2013-04-02 2020-03-27 삼성전자주식회사 복수의 마이크로폰들을 구비하는 사용자 기기 및 그 동작 방법
CN104810018B (zh) * 2015-04-30 2017-12-12 安徽大学 基于动态累积量估计的语音信号端点检测方法
CN105139853A (zh) * 2015-08-13 2015-12-09 深圳市双平泰科技有限公司 一种体征检测装置的控制方法及装置
CN111641794B (zh) * 2020-05-25 2023-03-28 维沃移动通信有限公司 声音信号采集方法和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020181686A1 (en) * 2001-05-03 2002-12-05 Howard Michael D. Teleconferencing system
US20070021958A1 (en) * 2005-07-22 2007-01-25 Erik Visser Robust separation of speech signals in a noisy environment
WO2008011902A1 (de) * 2006-07-28 2008-01-31 Siemens Aktiengesellschaft Verfahren zum durchführen einer audiokonferenz, audiokonferenzeinrichtung und umschalteverfahren zwischen kodierern
US20090248402A1 (en) * 2006-08-30 2009-10-01 Hironori Ito Voice mixing method and multipoint conference server and program using the same method

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4941187A (en) * 1984-02-03 1990-07-10 Slater Robert W Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments
US5758256A (en) * 1995-06-07 1998-05-26 Hughes Electronics Corporation Method of transporting speech information in a wireless cellular system
US6018525A (en) * 1996-03-11 2000-01-25 Sprint Communications Company, L.P. ATM transport of voice band signals with channel associated signaling
EP0867856B1 (de) * 1997-03-25 2005-10-26 Koninklijke Philips Electronics N.V. Verfahren und Vorrichtung zur Sprachdetektion
US6353609B1 (en) * 1998-06-19 2002-03-05 Marconi Communications, Inc. Digital packet network for the local access loop
US7158933B2 (en) * 2001-05-11 2007-01-02 Siemens Corporate Research, Inc. Multi-channel speech enhancement system and method based on psychoacoustic masking effects
US6990194B2 (en) * 2003-05-19 2006-01-24 Acoustic Technology, Inc. Dynamic balance control for telephone
US8503686B2 (en) * 2007-05-25 2013-08-06 Aliphcom Vibration sensor and acoustic voice activity detection system (VADS) for use with electronic systems
CN101192411B (zh) 2007-12-27 2010-06-02 北京中星微电子有限公司 大距离麦克风阵列噪声消除的方法和噪声消除***
CN102356427B (zh) * 2009-04-02 2013-10-30 三菱电机株式会社 噪声抑制装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020181686A1 (en) * 2001-05-03 2002-12-05 Howard Michael D. Teleconferencing system
US20070021958A1 (en) * 2005-07-22 2007-01-25 Erik Visser Robust separation of speech signals in a noisy environment
WO2008011902A1 (de) * 2006-07-28 2008-01-31 Siemens Aktiengesellschaft Verfahren zum durchführen einer audiokonferenz, audiokonferenzeinrichtung und umschalteverfahren zwischen kodierern
US20090248402A1 (en) * 2006-08-30 2009-10-01 Hironori Ito Voice mixing method and multipoint conference server and program using the same method

Also Published As

Publication number Publication date
US8924206B2 (en) 2014-12-30
US20130117017A1 (en) 2013-05-09
TW201320060A (zh) 2013-05-16
CN103093758B (zh) 2016-04-20
CN103093758A (zh) 2013-05-08
TWI441169B (zh) 2014-06-11

Similar Documents

Publication Publication Date Title
DE102017102134B4 (de) Global optimierte Nachfilterung mit der Kleinste-Quadrate-Methode für die Sprachverbesserung
DE60031354T2 (de) Geräuschunterdrückung vor der Sprachkodierung
EP3451705B1 (de) Verfahren und vorrichtung zum schnellen erkennen der eigenen stimme
US11482235B2 (en) Speech enhancement method and system
DE112016004161T5 (de) Mikrofonsignalzusammenführung
DE112016006218B4 (de) Schallsignal-Verbesserungsvorrichtung
DE102012102882A1 (de) Elektrische Vorrichtung und Verfahren zum Empfangen von Sprechstimmen-Signalen dafür
DE112017007005B4 (de) Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung
CN111489760A (zh) 语音信号去混响处理方法、装置、计算机设备和存储介质
DE60025748T2 (de) Spracherkennung
DE102017215825B3 (de) Verfahren zum Erkennen eines Defektes in einem Hörinstrument
DE102016225204B4 (de) Verfahren zum Betrieb eines Hörgerätes
DE102011087984A1 (de) Hörvorrichtung mit Sprecheraktivitätserkennung und Verfahren zum Betreiben einer Hörvorrichtung
DE112011106045B4 (de) Audiosignal-Wiederherstellungsvorrichtung und Audiosignal-Wiederherstellungsverfahren
DE102016225207A1 (de) Verfahren zum Betrieb eines Hörgerätes
DE112016006334T5 (de) Verfahren und systeme zur erreichung einer konsistenz bei der rauschunterdrückung während sprachphasen und sprachfreien phasen
CN104580764B (zh) 电话会议***中的超声配对信号控制
EP3836139A1 (de) Verfahren, bei welchem zwei hörgeräte miteinander gekoppelt werden, sowie hörgerät
Rao et al. Smartphone-based real-time speech enhancement for improving hearing aids speech perception
CN105656931B (zh) 网络电话语音质量客观评估处理的方法和装置
CN104464745A (zh) 一种双通道语音增强***及其方法
CN204117590U (zh) 语音采集降噪装置以及语音质量评价***
CN116597856B (zh) 基于蛙人对讲的语音质量增强方法
CN110010144A (zh) 语音信号增强方法及装置
EP2822300B1 (de) Erkennen von Hörsituationen mit unterschiedlichen Signalquellen

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0011020000

Ipc: G10L0025000000

R016 Response to examination communication
R016 Response to examination communication
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0025000000

Ipc: G10L0021020000

R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final