DE69427621T2 - Verfahren und Vorrichtung zur Audiosignalverarbeitung - Google Patents

Verfahren und Vorrichtung zur Audiosignalverarbeitung

Info

Publication number
DE69427621T2
DE69427621T2 DE69427621T DE69427621T DE69427621T2 DE 69427621 T2 DE69427621 T2 DE 69427621T2 DE 69427621 T DE69427621 T DE 69427621T DE 69427621 T DE69427621 T DE 69427621T DE 69427621 T2 DE69427621 T2 DE 69427621T2
Authority
DE
Germany
Prior art keywords
signal
pitch
level
audio signal
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69427621T
Other languages
English (en)
Other versions
DE69427621D1 (de
Inventor
Masaki Haranishi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP5232287A external-priority patent/JPH0764578A/ja
Priority claimed from JP6131529A external-priority patent/JPH07334192A/ja
Application filed by Canon Inc filed Critical Canon Inc
Publication of DE69427621D1 publication Critical patent/DE69427621D1/de
Application granted granted Critical
Publication of DE69427621T2 publication Critical patent/DE69427621T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

  • Diese Erfindung betrifft ein Verfahren und eine Vorrichtung zur Audiosignalverarbeitung, und insbesondere ein Verfahren und eine Vorrichtung zur Audiosignalverarbeitung in einem Fernsehkonferenzsystem unter Verwendung einer Vielzahl von Mikrophonen (Eingabemitteln), in denen es möglich ist zu bestimmen, ob momentan ein Individuum vor einem Mikrophon spricht und ob ein durch ein Mikrophon eingegebenes Audiosignal ein Sprachsignal oder ein unerwünschtes Geräusch wie Rauschen ist.
  • [Beschreibung des Standes der Technik]
  • In herkömmlichen Fernsehkonferenzsystemen verwendet ein Signalprozessor zum Zwecke des Steuerns von Videokameras einen Pegeldetektor zur Feststellung des Pegels eines Audiosignals, das über ein Mikrophon eingegeben wurde, und bestimmt auf der Grundlage des vom Pegeldetektor festgestellten Pegels, ob momentan ein Individuum vor dem Mikrophon spricht. Mit anderen Worten, wenn der Pegel des Audiosignals einen vorbestimmten Wert überschreitet, beurteilt der Signalprozessor, daß das Individuum momentan vor dem Mikrophon spricht, schaltet den Audioausgangsschalter um, der das Signal vom Mikrophon liefert, auf einen Lautsprecher, der als Ausgabeeinrichtung dient, und schaltet von einer Videokamera auf eine andere um, sodaß die Videokamera in Richtung des Mikrophons zeigt.
  • In einem derartigen System, bei dem die Steuerung zum Umschalten zwischen mehreren Videokameras auf der Grundlage des Audiosignals ausgeführt wird, reagieren die Videokameras in unerwünschter Weise durch fehlerhafte Arbeitsweise auf Geräusche, wie Rauschen und Nachhall.
  • Um dieses Problem zu lösen, sind kürzlich Anstrengungen unternommen worden, um die Mikrophone mit Richtvermögen bereitzustellen, um die Aufnahme unerwünschter Geräusche wie Rauschen und Nachhall zu minimieren.
  • Die Aufnahme unerwünschter Geräusche, wie Rauschen und Nachhall, kann jedoch nicht zuverlässig verhindert werden, selbst nicht mit Mikrophonen, die eine hohe Richtungsempfindlichkeit haben. Darüber hinaus gibt es einen Anstieg bei der Gesamtverstärkung, wenn der Audioausgangsschalter zum Liefern von Signalen aus einer Vielzahl von Mikrophonen an die Ausgabeeinrichtung eingeschaltet wird. Darüber hinaus verursacht die Aufnahme unerwünschter Geräusche, wie Rauschen und Nachhall, eine Verschlechterung des gesamten Störabstands und veranlaßt ein Audiosignal, in die Vielzahl von Mikrophonen zu gelangen. Dies ist die Ursache des Jaulens und Pfeifens.
  • Im herkömmlichen Audiosignalprozessor ist es folglich nicht möglich, zuverlässig zu bestimmen, ob momentan ein Individuum vor einem Mikrophon spricht oder nicht, ob ein Audiosignal, das über ein Mikrophon hereingelangt ist, ein Sprachsignal oder ein unerwünschter Ton wie Rauschen ist. Im Ergebnis arbeiten Videokameras fehlerhaft, indem sie auf diese unerwünschten Geräusche reagieren.
  • Das Dokument US-A-4 164 626 offenbart ein Verfahren und eine Vorrichtung zur Signalverarbeitung, wie es in dem Oberbegriff der neuen Patentansprüche 1 beziehungsweise 23 angegeben ist. Der beschriebene Tonhöhendetektor wird verwendet zum Wiederherstellen einer Tonhöheninformation für derartige Funktionen wie Sprachkompression zur Übertragung einer analogen Sprache mit engen Bandbreiten, und auch zur Spracherkennung durch elektronische Mittel.
  • Des weiteren offenbart das Dokument DE-C1-37 34 447 ein Signalverarbeitungsgerät, das eingerichtet ist zur Feststellung einer Sprachfrequenz, um zu bestimmen, ob ein Mikrophon ein Sprachsignal empfängt. Wenn dem so ist, wird die Sprache auf einem Übertragungsweg übertragen.
  • Es ist eine Aufgabe der vorliegenden Erfindung, ein Verfahren und eine Vorrichtung zur Audiosignalverarbeitung zu schaffen, womit es möglich ist, eine fehlerhafte Steuerung der Bildaufnahmemittel aufgrund unerwünschter Geräusche zu verhindern.
  • Diese Aufgabe wird gelöst durch ein Verfahren und eine Vorrichtung zur Audiosignalverarbeitung, wie in den Patentansprüchen 1 beziehungsweise 17 angegeben.
  • Andere Merkmale und Vorteile der vorliegenden Erfindung werden aus der nachstehenden Beschreibung in Verbindung mit der beiliegenden Zeichnung deutlich, in der gleiche Bezugszeichen dieselben oder ähnliche Teile in allen Figuren bedeuten.
  • Fig. 1 ist ein Blockdiagramm, das den Aufbau eines Audioverarbeitungssystems darstellt, das als ein Signalverarbeitungssystem nach einem ersten Ausführungsbeispiel der vorliegenden Erfindung dient;
  • Fig. 2 ist ein Ablaufdiagramm, das die Steuerprozedur einer Audioverarbeitung dieses Systems zeigt;
  • Fig. 3 ist ein Ablaufdiagramm, das die Steuerprozedur der Tonhöhenfeststellung und der Tonhöhenunterscheidungsverarbeitung in diesem System darstellt;
  • Fig. 4 ist ein Ablaufdiagramm, das die Steuerprozedur einer Zeitunterbrechungsverarbeitung in diesem System darstellt;
  • Fig. 5 ist ein Blockdiagramm, das eine Anordnung zeigt, in der ein Signalprozessor nach einem zweiten Ausführungsbeispiel der Erfindung bei einem Videokamera-Umschaltsteuersystem angewandt ist;
  • Fig. 6 ist ein Blockdiagramm, das den Aufbau eines Signalprozessors nach einem dritten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • Fig. 7 ist ein Ablaufdiagramm, das die Arbeitweise dieses Signalprozessors darstellt;
  • Fig. 8 ist ein Ablaufdiagramm, das die Arbeitsweise dieses Signalprozessors darstellt;
  • Fig. 9 ist ein vereinfachtes Blockdiagramm vom dritten Ausführungsbeispiel;
  • Fig. 10 ist ein Ablaufdiagramm der Sprachunterscheidungsverarbeitung nach dem dritten Ausführungsbeispiel;
  • Fig. 11 ist ein Ablaufdiagramm der Sprachunterscheidungsverarbeitung nach dem dritten Ausführungsbeispiel;
  • Fig. 12 ist ein Diagramm, das die Beziehung zwischen einem Vollbild (Zeitdauer t) und einem Block (Zeitdauer T) von Audiodaten zeigt, die in einer Speicherschaltung akkumuliert sind;
  • Fig. 13 ist ein Diagramm, das ein Beispiel einer Autokorrelationsfunktion zeigt;
  • Fig. 14(a) bis 14(d) sind Diagramme, die die Integration von Spitzenwerten einer Autokorrelationsfunktion und der Zeitkomponente eines Schwerpunktes der Spitzenwerte zeigen;
  • Fig. 15 ist ein Blockdiagramm, das eine Anordnung zeigt, bei der ein Sprachunterscheidungsprozessor des dritten Ausführungsbeispiels bei einer Kamerasteuerung angewandt wird; und
  • Fig. 16 ist ein Ablaufdiagramm, das ein Kamerasteuerungsverfahren für eine Kamerasteuerung als Reaktion auf ein Eingangssignal aus einem Mikrophon darstellt, das in Fig. 15 gezeigt ist.
  • Bevorzugte Ausführungsbeispiele nach der vorliegenden Erfindung sind nachstehend detailliert anhand der beiliegenden Zeichnung beschrieben.
  • Die Elemente eines Audiosignalprozessors nach einem Ausführungsbeispiel der vorliegenden Erfindung zum Lösen der zuvor genannten Aufgabe sind zunächst zusammengefaßt.
  • Ein Audiosignalprozessor flach einem Ausführungsbeispiel der vorliegenden Erfindung ist ausgestattet mit einer Eingabeeinheit zur Eingabe eines Audiosignals, einem Pegeldetektor zum Feststellen des Pegels vom Audiosignal, das von der Eingabeeinheit eingegeben worden ist, einem Pegeldiskriminator zum Herausfinden, ob der vom Pegeldetektor festgestellte Pegel größer als ein im voraus eingestellter Schwellwert ist, einem Tonhöhendetektor, der die Tonhöhe eines Audiosignals feststellt, das von der Eingabeeinheit eingegeben ist, und mit einem Tonhöhendiskriminator zum Herausfinden, ob die vom Tonhöhendetektor festgestellte Tonhöhe und eine im voraus eingestellte Mustertonhöhe übereinstimmen, wobei die Ausgabe eines Signals aus einer Eingabeeinheit an eine Audioausgabeeinheit ein-/ausgesteuert wird auf der Grundlage der Ergebnisse der Unterscheidung, die der Pegeldiskriminator und der Tonhöhendiskriminator ausgeführt haben.
  • Dank dieser Anordnung verwendet der Audioprozessor dieses Ausführungsbeispiels den Pegeldetektor und den Tonhöhendetektor, um den jeweiligen Pegel des Audiosignals festzustellen, der in die Eingabeeinheit eingegeben wird, beziehungsweise die Tonhöhe, die ein Parameter ist, der die Tonqualität darstellt; verwendet den Pegeldiskriminator zum Herausfinden, ob der Pegel des eingegebenen Audiosignals größer als der voreingestellte Schwellwert ist, sowie den Tonhöhendiskriminator, um herauszufinden, ob die zuvor genannte Tonhöhe mit der Tonhöhe des voreingestellten Musters übereinstimmt; und führt die Steuerung auf der Grundlage der Ausgabesignale aus dem Pegeldiskriminator und dem Tonhöhendiskriminator aus, um so die Ausgabe des Signals von der Eingabeeinheit zur Audioausgabeeinheit ein- und auszuschalten. Im Ergebnis wird die Aufnahme unerwünschter Geräusche, die andere Töne sind als Sprachsignale, unterdrückt, und es ist möglich, zu bestimmen, ob ein Individuum momentan vor der Eingabeeinheit spricht und ob das Audiosignal, das über die Eingabeeinheit hineingelangt, Sprache ist oder ein unerwünschter Ton.
  • Ein anderes Ausführungsbeispiel nach der Erfindung zum Lösen der zuvor genannten Aufgabe enthält des weiteren eine Eingabeeinheit zur Eingabe eines Audiosignals, einen Analog-zu- Digital-Wandler (ADC) zum Umsetzen eines analogen Signals aus der Eingabeeinheit in ein entsprechendes digitales Signal, erste und zweite Speichereinheiten zum Speichern des digitalen Signals, das der ADC erzeugt hat, in Rahmeneinheiten, einen Wähler zur Auswahl entweder der ersten oder der zweiten Speichereinheit, einen Pegeldiskriminator zum Feststellen der Pegel der in der ersten und zweiten Speichereinheit gespeicherten Signale und Herausfinden, ob das eingegebene Signal gültig ist, einen Tonhöhendetektor zum Feststellen der Tonhöhe aus den in der ersten und der zweiten Speichereinheit gespeicherten Signale, und eine Zähleinheit zum Zählen in Rahmeneinheiten von Ergebnissen des Herausfindens vom Pegeldiskriminator und Ergebnissen der Feststellung vom Tonhöhendetektor.
  • Dank dieser Anordnung verwendet der Audioprozessor dieses anderen Ausführungsbeispiels den ADC zum Umsetzen des analogen Signals aus der Eingabeeinheit in ein zugehöriges digitales Signal, an diese Eingabeeinheit wird ein Audiosignal angelegt; verwendet die erste und zweite Speichereinheit zum Speichern des digitalen Signals in Rahmeneinheiten; verwendet den Wähler zur Auswahl entweder der ersten oder der zweiten Speichereinheit; verwendet den Pegeldetektor zum Feststellen der Pegel der Signale, die in der ersten und in der zweiten Speichereinheit gespeichert sind, um damit zu bestimmen, ob das eingegebene Signal gültig ist; verwendet den Tonhöhendetektor zur Feststellung der Tonhöhe von den Signalen, die in der ersten und in der zweiten Speichereinheit gespeichert sind; und verwendet den Zähler zum Zählen des Ausgangssignals vom Pegeldetektor und der Ausgabe vom Tonhöhendetektor in Rahmeneinheiten. Im Ergebnis ist es möglich zu bestimmen, ob ein Individuum momentan vor der Eingabeeinheit spricht und ob das über die Eingabeeinheit eingegebene Audiosignal ein Sprachsignal oder ein unerwünschter Ton ist.
  • Ausführungsbeispiele der vorliegenden Erfindung sind nachstehend anhand der beiliegenden Zeichnung beschrieben. Die vorliegende Erfindung wird abgehandelt als eine Vielzahl von Ausführungsbeispielen zu beschreibenden Zwecken. Jedoch kann die Beschreibung eines jeden Ausführungsbeispiels ungefähr bei den anderen Ausführungsbeispielen auch angewandt werden.
  • (Erstes Ausführungsbeispiel)
  • Ein erstes Ausführungsbeispiel nach der Erfindung wird nun anhand der Fig. 1 bis 4 beschrieben. Fig. 1 ist ein Blockdiagramm, das den Aufbau eines Audiosignalprozessors nach dem ersten Ausführungsbeispiel zeigt. In Fig. 1 gelangt ein Audiosignal aus einem Richtmikrophon (Eingabeeinheit) herein. Das Audiosignal wird an ein Bandpaßfilter (BPF) 2 angelegt, das nur das Sprachfrequenzband (ungefähr 50 Hz-4 kHz) aus dem eingegebenen Audiosignal ausliest. Angemerkt sei, daß das BPF ersetzt werden kann durch ein Tiefpaßfilter, das in der Lage ist, Frequenzen unter 4 kHz auszulesen. Ein Verstärker (AMP) 3 verstärkt das vom Filter 2 eingegebene Sprachsignal.
  • Eine Pegelfeststellschaltung (Pegeldetektor) 4 stellt den Pegel des Signals fest, das vom Verstärker 3 angelegt wird. Eine Pegeldiskriminierschaltung (Pegeldiskriminator) 5 bestimmt, ob der Pegel des von der Pegelfeststellschaltung 4 festgestellten Signals größer als ein im voraus eingestellter Schwellwert ist. Wenn der Pegel als größer befunden wird als der Schwellwert, dann gibt die Pegeldiskriminierschaltung 5 ein Einschaltsignal zum Einschalten eines Sprachausgabe-Steuerschalters 13 aus. Wenn der Pegel gleich oder geringer als der Schwellwert ist, gibt die Schaltung 5 ein Ausschaltsignal ab. Eine A/D-Wandlerschaltung (ADC) 6 führt eine Umsetzverarbeitung aus zum Umsetzen des analogen Signals, das von der Pegeldiskriminierschaltung 5 eingegeben wurde, in ein digitales Signal.
  • Auf der Grundlage des Einschalt- oder Ausschaltsignals, das von der Pegeldiskriminierschaltung 5 kommt oder von einer Tonhöhendiskriminierschaltung 8, erzeugt der Sprachausgabe- Steuerschalter 13 ein Ein-/Ausschaltsteuersignal, welches einen spannungsgesteuerten Verstärker 9 veranlaßt, das Sprachsignal zu verstärken und abzugeben, und liefert dieses Steuersignal an den Verstärker 9. Auf der Grundlage dieses Ein- /Ausschaltsteuersignals entscheidet der spannungsgesteuerte Verstärker 9, ob das Sprachsignal zu verstärken und auszugeben ist.
  • Eine Tonhöhenfeststellschaltung 7 stellt die Tonhöhe des Signals fest, das aus der A/D-Wandlerschaltung 6 eingegeben wird. Die Tonhöhendiskriminierschaltung 8 bestimmt, ob die Tonhöhe (Tonhöhenmuster) vom festgestellten Signal durch die Tonhöhenfeststellschaltung 7 mit der Tonhöhe (dem Tonhöhenmuster) vom im voraus eingestellten Muster übereinstimmt. Wenn die Tonhöhen übereinstimmen, dann gibt die Tonhöhendiskriminierschaltung 8 das Einschaltsignal an den Sprachausgabe-Steuerschalter 13 ab. Die Tonhöhe dieses Signals wird die Reziproke der Grundfrequenz (die Minimalfrequenz) der Signalwellenform. Mit anderen Worten, die Tonhöhe wird angezeigt durch die Periode der Signalwellenform. Wenn das Einschaltsignal in den Sprachausgabe-Steuerschalter 13 gelangt, gibt der Schalter das Ein-Steuersignal an den spannungsgesteuerten Verstärker 9 ab. Nach Empfang des Ein-Steuersignals als ein Eingangssignal verstärkt der spannungsgesteuerte Verstärker 9, der eine Verstärkungseinstellung und eine Umschaltfunktion für die Sprachausgabe hat, das Sprachsignal aus dem Verstärker 3 und gibt das verstärkte Sprachsignal an einen Mischer 10 ab. Wenn im Gegensatz dazu das Aus-Steuersignal aus dem Sprachausgabe- Steuerschalter 13 kommt, verstärkt der spannungsgesteuerte Verstärker 9 das Sprachsignal aus dem Verstärker 3 nicht und erzeugt kein Ausgangssignal.
  • Das Mikrophon 1, das Filter 2, der Verstärker 3, die Pegelfeststellschaltung 4, die Pegeldiskriminierschaltung 5, die A/D-Wandlerschaltung 6, die Tonhöhenfeststellschaltung 7, die Tonhöhendiskriminierschaltung 8, der Sprachausgabe- Steuerschalter 13 und der spannungsgesteuerte Verstärker 9 bilden eine erste Signalverarbeitungsschaltung S. Das in Fig. 1 dargestellte Audioverarbeitungssystem hat eine weitere Signalverarbeitungsschaltung, die hiernach als eine zweite Signalverarbeitungsschaltung S' bezeichnet wird. Die Komponenten der zweiten Signalverarbeitungsschaltung S' sind denen der ersten Signalverarbeitungsschaltung S gleich und tragen folglich ein Apostroph "'", das den Bezugszeichen der zugehörigen Komponenten angehängt ist.
  • Die Mikrophone 1, 1' von der ersten und zweiten Signalverarbeitungsschaltung S, S' sind mit dem Mischer (MIX) 10 verbunden. Letzterer mischt die Töne, die von der Vielzahl der Mikrophone 1, 1' abgegeben werden. Ein Verstärker 11 verstärkt die Sprachsignale, die der Mischer 10 gemischt hat. Ein Lautsprecher (Audioausgabeeinheit) 12 gibt die Tonsignale ab.
  • Die Arbeitsweise des Audiosignalverarbeitungsgerätes mit dem zuvor beschriebenen Aufbau wird nun beschrieben. Zur Vereinfachung wird nur die erste Signalverarbeitungsschaltung S beschrieben. Da die zweite Signalverarbeitungsschaltung S' identisch mit der ersten ist, muß diese Schaltung nicht beschrieben werden.
  • Das Audiosignal gelangt durch das Mikrophon 1 herein und durchläuft das Filter 2, um nur das Sprachfrequenzband auszulesen. Das ausgelesene Sprachsignal wird vom Verstärker 3 verstärkt, nachdem der Pegel des verstärkten Signals von der Pegelfeststellschaltung 4 festgestellt worden ist. Als nächstes wird von der Pegeldiskriminierschaltung 5 herausgefunden, ob der Pegel des festgestellten Sprachsignals höher ist als der voreingestellte Schwellwert. Wenn der Pegel des von der Pegelfeststellschaltung 4 festgestellten Signals größer als der Schwellwert ist, wird das Einschaltsignal an den Sprachausgabe- Steuerschalter 13 abgegeben. Wenn das Einschaltsignal hereinkommt, gibt der Schalter 13 das Ein-Steuersignal an den spannungsgesteuerten Verstärker 9 ab. Wenn der Pegel des von der Pegelfeststellschaltung 4 festgestellten Sprachsignals gleich oder kleiner als der Schwellwert ist, wird das Ausschaltsignal an den Sprachausgabe-Steuerschalter 13 abgegeben. Wenn das Ausschaltsignal hereinkommt, gibt der Schalter 13 das Aus- Steuersignal an den spannungsgesteuerten Verstärker 9 ab.
  • Mehrere Rahmen ab dem Moment, wo der Pegel des Sprachsignals den Schwellwert erreicht, werden als ein "Einstellen" des Tones bezeichnet. Das analoge Signal aus dem Pegel wird während der Periode des Einstellens umgesetzt in ein digitales Signal oder digital umgesetzt von der A/D-Wandlerschaltung 6 zum Zwecke der Audioverarbeitung. Die Tonhöhe des Sprachsignals wird festgestellt von der Tonhöhenfeststellschaltung 7 auf der Grundlage des digital umgesetzten Signals (der Daten), und die Tonhöhendiskriminierschaltung 8 bestimmt, ob die festgestellte Tonhöhe des Sprachsignals mit der Tonhöhe des Musters übereinstimmt, das im voraus eingestellt worden ist. Wenn die Tonhöhe des Sprachsignals, festgestellt von der Tonhöhenfeststellschaltung 7, mit der Tonhöhe des Musters übereinstimmt, dann wird das Einschaltsignal an den spannungsgesteuerten Verstärker 9 geliefert. Wenn das Einschaltsignal hereinkommt, gibt der Sprachausgabe- Steuerschalter 13 das Ein-Steuersignal an den spannungsgesteuerten Verstärker ab. Wenn anderenfalls die Tonhöhe des Sprachsignals, festgestellt von der Tonhöhenfeststellschaltung 7, nicht mit der Tonhöhe des Musters übereinstimmt, dann wird das Ausschaltsignal an den spannungsgesteuerten Verstärker 9 gesandt. Wenn das Ausschaltsignal hereinkommt, gibt der Sprachausgabe- Steuerschalter 13 das Aus-Steuersignal an den spannungsgesteuerten Verstärker 9 ab. Auf der Grundlage des Ein- Steuersignals aus dem Sprachausgabe-Steuerschalter 13 verstärkt der spannungsgesteuerte Verstärker, der die Verstärkungseinstellung und die Umschaltfunktion zur Sprachausgabe hat, das Sprachsignal vom Verstärker 3 und gibt das verstärkte Sprachsignal an den Mischer 10 ab. Wenn anderenfalls das Aus-Steuersignal aus dem Sprachausgabe- Steuerschalter 13 hereinkommt, verstärkt der spannungsgesteuerte Verstärker 9 das Sprachsignal aus dem Verstärker nicht und gibt kein Ausgangssignal ab.
  • Wenn somit das Ein-Steuersignal in den spannungsgesteuerten Verstärker 9 hereinkommt, wird die Sprachausgabe gemäß dem Sprachsignal, das aus dem Mikrophon 1 hereinkommt, schließlich vom Lautsprecher 12 abgegeben.
  • Die Arbeitsweise des in der zuvor beschriebenen Weise aufgebauten Audiosignalverarbeitungsgerätes wird nun anhand der Ablaufdiagramme der Fig. 2 bis 4 beschrieben.
  • Fig. 2 ist ein Ablaufdiagramm, das die Steuerprozedur der Pegelfeststellschaltung 4 und der Pegeldiskriminierschaltung 5 bei der Audioverarbeitung darstellt, die im Audioverarbeitungsgerät ausgeführt wird. Fig. 3 ist ein Ablaufdiagramm, das die Steuerprozedur der Verarbeitung zur Tonhöhenfeststellung und Tonhöhendiskriminierverarbeitung im selben Gerät darstellt. Fig. 4 ist ein Ablaufdiagramm, das die Steuerprozedur der Zeitgeberunterbrechungsverarbeitung im selben Gerät darstellt.
  • Zuerst wird anhand Fig. 2 die Steuerprozedur der Pegelfeststellschaltung 4 und der Pegeldiskriminierschaltung 5 beschrieben.
  • Das Audiosignal gelangt vom Mikrophon 1 herein, nur das Sprachfrequenzband wird vom Filter 2 ausgelesen, das ausgelesene Sprachsignal wird vom Verstärker 3 verstärkt, und das verstärkte Sprachsignal gelangt in die Pegelfeststellschaltung 4.
  • In Schritt S2-1 in Fig. 2 empfängt die Pegelfeststellschaltung 4 das verstärkte Sprachsignal als ein Eingangssignal, stellt den Pegel L des Sprachsignals fest und gibt den Pegel L an die Pegeldiskriminierschaltung 5 ab.
  • Diesem folgt der Schritt S2-2, bei dem die Pegeldiskriminierschaltung 5 bestimmt, ob der Pegel L vom Sprachsignal, festgestellt in Schritt S2-1, größer als der voreingestellte Schwellwert ist. Wenn die Antwort "NEIN" lautet, dann kehrt das Programm zu Schritt S2-1 zurück. Wenn der Pegel L des Sprachsignals größer als der Schwellwert ist, dann wird das Einschaltsignal ausgegeben an den Sprachausgabe-Steuerschalter 13.
  • Als nächstes spricht in Schritt S2-3 der Sprachausgabe- Steuerschalter 3 auf die Eingabe des Einschaltsignals durch Ausgabe des Ein-Steuersignals an den spannungsgesteuerten Verstärker 9 an.
  • Als nächstes wird in Schritt S2-4 ein Kennzeichen (nicht dargestellt) eingeschaltet, das aufzeigt, daß das Individuum momentan vor dem Mikrophon 1 spricht.
  • Die Pegelfeststellschaltung 4 stellt erneut den Pegel L des Sprachsignals in Schritt S2-5 fest.
  • Diesem folgt der Schritt S2-6, bei dem die Pegeldiskriminierschaltung 5 bestimmt, ob der Pegel L vom Sprachsignal, festgestellt in Schritt S2-5, gleich oder kleiner als der Schwellwert ist, wodurch der Offset vom Sprachsignalpegel festgestellt wird. Wenn der Pegel L des Sprachsignals nicht gleich oder geringer als der Schwellwert ist, kehrt das Programm zu Schritt S2-5 zurück. Wenn andererseits der Pegel L vom Sprachsignal gleich oder kleiner als der Schwellwert ist, dann wird das Ausschaltsignal an den Sprachausgabe-Steuerschaltung 13 abgegeben.
  • In Schritt S2-7 empfängt der Sprachausgabe-Steuerschalter 13 das Eingangssignal vom Ausschaltsignal und gibt das Aus- Steuersignal an den spannungsgesteuerten Verstärker 9 ab.
  • Das zuvor beschriebene Kennzeichen wird in Schritt S2-8 abgeschaltet und das Programm kehrt zu Schritt S2-1 zurück.
  • Gleichzeitig mit der Verarbeitung von Fig. 2, wie sie zuvor beschrieben worden ist, werden eine Verarbeitung zur Tonhöhenfeststellung und eine Tonhöhendiskriminierverarbeitung gemäß der in Fig. 3 gezeigten Steuerprozedur ausgeführt. Die Verarbeitung von Fig. 3 wird unter Verwendung einer Zeitlänge von mehreren Rahmen von dem Moment an ausgeführt, zu dem das Einstellen in Schritt S2-2 in Fig. 2 festgestellt wird. Die Steuerprozedur der Verarbeitung zur Tonhöhenfeststellung und der Tonhöhendiskriminierverarbeitung ist nachstehend anhand Fig. 3 beschrieben.
  • Die Tonhöhendiskriminierschaltung 8 startet einen Zeitgeber 14 in Schritt S3-1. Der Zeitgeber 14 mißt den Ablauf einer vorgeschriebenen Zeitperiode und sendet der Tonhöhendiskriminierschaltung 8 ein Interruptanforderungssignal, wenn die vorgeschriebene Zeit verstrichen ist. Die Tonhöhendiskriminierschaltung 8 antwortet durch Starten einer in Fig. 4 dargestellten Interruptverarbeitungsroutine. Wenn die Interruptverarbeitungsroutine durch das Interruptanforderungssignal gestartet wird, überprüft diese Routine, ob das zuvor beschriebene Kennzeichen auf EIN ist, das heißt, ob das Sprachausgabeintervall geendet hat. Wenn das Kennzeichen auf AUS ist, wird die Operation des Zeitgebers angehalten. Wenn das Kennzeichen auf EIN ist, wird die Messung des Verstreichens der vorgeschriebenen Zeit weiter fortgesetzt. Fig. 4 veranschaulicht die Einzelheiten der Interruptverarbeitung. Insbesondere wird in Schritt S4-1 bestimmt, ob das Kennzeichen auf EIN ist. Wenn das Kennzeichen auf EIN ist, wird keinerlei Aktion unternommen, und die Verarbeitungsoperation ist abgeschlossen. Wenn das Kennzeichen auf AUS ist, wird andererseits der Zeitgeber in Schritt S4-1 gestartet, nachdem die Verarbeitungsoperation angehalten worden ist.
  • In Schritt S3-2 in Fig. 3 tastet die A/D-Wandlerschaltung 6 das Sprachsignal ab, das von der Pegeldiskriminierschaltung 5 in Einheiten von Rahmen eingegeben worden ist, und setzt das Signal in ein digitales Signal um. Hier wird das eingegebene Sprachsignal das Sprachsignal, das vom Verstärker 3 über die Pegelfeststellschaltung 4 und die Pegeldiskriminierschaltung 5 ausgegeben wird.
  • Die Tonhöhenfeststellschaltung 7 stellt die Tonhöhe des Sprachsignals in Schritt S3-3 fest. In Schritt S3-4 wird als nächstes die Tonhöhendiskriminierschaltung 8 bestimmen, ob die Tonhöhe des in Schritt S3-3 festgestellten Tonhöhensignals mit der Tonhöhe des voreingestellten Musters übereinstimmt. Diese Verarbeitungsoperation wird im Falle der herausgefundenen Übereinstimmung abgeschlossen. Wenn es keine Übereinstimmung gibt, wird das Ausschaltsignal an den Sprachausgabe- Steuerschalter 13 abgegeben.
  • Der Sprachausgabe-Steuerschalter 13 empfängt die Eingabe vom Ausschaltsignal und gibt in Schritt S3-5 das Aus-Steuersignal an den spannungsgesteuerten Verstärker 9 ab. Der spannungsgesteuerte Verstärker 9 antwortet auf die Eingabe vom Aus-Steuersignal durch Anhalten der Ausgabe des Sprachsignals.
  • Ein Beispiel eines Verfahrens zur Feststellung der Tonhöhe eines Sprachsignals, ausgeführt in Schritt S3-3, ist das Ausführen der Feststellung durch Heranziehen der Autokorrelation eines Restsignals, gewonnen nach dem linearen Prädiktionsverfahren. Ein anderes Beispiel ist das Herausfinden eines Spitzenwertes in angenäherter Weise aus der Hüllkurve eines Spektrums.
  • Das zuvor beschriebene Verfahren des Steuerns vom Audioausgangsignal kann folgendermaßen zusammengefaßt werden: Wenn analoge Verarbeitung zum Herausfinden ausgeführt wird, ist zuviel Zeit erforderlich, und es entsteht eine Zeitverzögerung. Folglich ist der Schalter vorgesehen zur Ausgabe des Steuersignals, das den Betrieb des spannungsgesteuerten Verstärkers 9 ein- und ausschaltet. Anfänglich wird der Schalter auf EIN-geschaltet oder auf AUS-geschaltet, darauf basierend, ob der Pegel des Sprachsignals höher als der Schwellwert ist. Wenn die Tonhöhe des Sprachsignals und die Tonhöhe des Musters übereinstimmen, wird somit der Schalter auf EIN-geschaltet.
  • Anderenfalls wird der Schalter auf AUS-geschaltet. Auf diese Weise wird die Sprachsignal-Ausgabeoperation des spannungsgesteuerten Verstärkers 9 gesteuert.
  • Somit führt der Sprachausgabe-Steuerschalter 13 die Ein- /Aus-Steuerung auf der Grundlage von Signalen aus, sowohl aus der Pegeldiskriminierschaltung 5 als auch aus der Tonhöhendiskriminierschaltung 8, wobei der Schalter 13 ein AND- Glied sein kann. Das heißt, es erübrigt sich zu sagen, daß wenn die Ergebnisse der Diskriminierung, ausgeführt sowohl von der Pegeldiskriminierschaltung 5 als auch von der Tonhöhendiskriminierschaltung 8, die auf EIN-Operation des spannungsgesteuerten Verstärkers 9 anfordern, eine AND- Verknüpfung ausgeführt werden kann zur Ausgabe des Ein- Steuersignals, das die auf EIN-Operation des spannungsgesteuerten Verstärkers 9 anfordert.
  • Gemäß dem zuvor beschriebenen Ausführungsbeispiel ist es somit möglich, die Aufnahme unerwünschter Geräusche leicht zu unterdrücken, nämlich Töne mit anderen Tonhöhen als ein Sprachsignal aus einem Mikrophon.
  • (Zweites Ausführungsbeispiel)
  • Nachstehend anhand Fig. 5 beschrieben ist ein zweites Ausführungsbeispiel nach der Erfindung. Dieses Ausführungsbeispiel ist so eingerichtet, daß eine Umschaltung von Videokameras gesteuert wird auf der Grundlage davon, ob die Tonhöhe des Sprachsignals mit der Tonhöhe des im voraus eingestellten Musters übereinstimmt.
  • Fig. 5 ist ein Blockdiagramm, das eine Anordnung zeigt, in der ein Signalprozessor nach einem zweiten Ausführungsbeispiel der Erfindung in einem Videokamera-Umschaltsteuersystem eingesetzt ist. In Fig. 5 bedeutet Bezugszeichen 13A eine Videokamera-Umschaltsteuerschaltung zur Eingangsseite, mit der eine Vielzahl von Tonhöhendiskriminierschaltungen (Tonhöhenmuster-Diskriminierschaltungen) 14a, 14b, 14c, ..., 14n verbunden sind. Diese Tonhöhendiskriminierschaltungen 14, 14b, 14c, ..., 14n haben eine gleiche Funktion wie diejenigen der Tonhöhendiskriminierschaltungen 8, 8' in Fig. 1 vom ersten zuvor beschriebenen Ausführungsbeispiel. Eine Tonhöhenfeststellschaltung, die den Tonhöhenfeststellschaltungen 6, 6' in Fig. 1 vom ersten Ausführungsbeispiel gleicht, ist mit der Eingangsseite einer jeden dieser Tonhöhendiskriminierschaltungen verbunden.
  • Eine Vielzahl von Videokameras 15a, 15b, 15c, ..., 15n gemäß den Tonhöhendiskriminierschaltungen 14, 14b, 14c, ..., 14n sind des weiteren mit der Ausgangsseite der Videokamera- Umschaltsteuerschaltung 13A verbunden. Die Ausgangsseite einer jeden der Videokameras 15a, 15b, 15c, ..., 15n ist mit einem Hauptmonitor 16 verbunden.
  • In der zuvor beschriebenen Anordnung bestimmen die Tonhöhendiskriminierschaltungen 14, 14b, 14c, ..., 14n, ob die Tonhöhen der von den Tonhöhenfeststellschaltungen festgestellten Sprachsignale mit der Tonhöhe der zuvor genannten, im voraus eingestellten Mustereinstellung übereinstimmen, genau wie im ersten Ausführungsbeispiel. Wenn die festgestellte Tonhöhe des Sprachsignals mit der Tonhöhe des Musters übereinstimmt, sendet die Tonhöhendiskriminierschaltung, die diese Übereinstimmung festgestellt hat, ein Steuersignal an die Videokamera- Umschaltsteuerschaltung 13A, wodurch das von der Videokamera aufgegriffene Bild gemäß der Tonhöhendiskriminierschaltung 8, die die Übereinstimmung herausgefunden hat, auf dem Bildschirm des Hauptmonitors 16 angezeigt wird.
  • Es kann eine Situation aufkommen, bei der eine Vielzahl von Individuen gleichzeitig sprechen. Durch Bereitstellen einer Steuerregel, gemäß der Videokameras in der Weise umgeschaltet werden, daß das Individuum, das mit dem Sprechen beginnt, zuerst auf dem Bildschirm des Hauptmonitors 16 erscheint, können die Videokameras 15a, 15b, 15c, ..., 15n in effektiver Weise umgeschaltet werden.
  • In diesem Ausführungsbeispiel ist ein Beispiel dargestellt, bei dem eine Videokamera, die das auf dem Hauptmonitor angezeigte Bild überträgt, auf der Grundlage der Tonhöhe des Tones ausgewählt wird. Jedoch erübrigt es sich zu sagen, daß die Auswahl sowohl aufgrund des Pegels als auch aufgrund der Tonhöhe des Tones erfolgen kann, wie zuvor zum ersten Ausführungsbeispiel beschrieben.
  • In Übereinstimmung mit dem zweiten Ausführungsbeispiel, wie es zuvor beschrieben worden ist, wird das Signal, das das Ergebnis der Diskriminieroperation aufzeigt, die von der Tonhöhendiskriminierschaltung ausgeführt wurde, als ein Steuersignal beim Steuern des Umschaltens der Videokameras verwendet. Dies ermöglicht es, fehlerhaften Betrieb der Videokameras durch Reaktion auf unerwünschte Geräusche, wie auf Nachhall, zu reagieren.
  • (Drittes Ausführungsbeispiel)
  • Ein drittes Ausführungsbeispiel der Erfindung wird nun anhand der Fig. 6 bis 8 beschrieben. Fig. 6 ist ein Blockdiagramm, das den Aufbau eines Bildsignalprozessors nach einem dritten Ausführungsbeispiel der Erfindung darstellt. Bezugszeichen 17 bedeutet ein Richtmikrophon (Eingabeeinheit). Ein Audiosignal gelangt vom Mikrophon 17 herein und beaufschlagt eine A/D-Wandlerschaltung 18, die das eingegebene analoge Audiosignal in ein digitales Signal umsetzt. Die Ausgangsseite des A/D-Wandlers 18 ist mit dem ersten Bildspeicher (erste Speichereinheit) 20a und mit einem zweiten Bildspeicher (zweite Speichereinheit) 20b über einen Umschalter (Wähler) 19 verbunden.
  • Der erste und der zweite Bildspeicher 20a, 20b speichern das Signal, das von der A/D-Wandlerschaltung 18 digital umgesetzt wurde, in Einheiten von beispielsweise 20 msec. Der Umschalter 19, der der Auswahl zwischen dem ersten und dem zweiten Bildspeicher 20a, 20b dient, hat einen Bewegungskontakt 19a und zwei feststehende Kontakte 19b, 19c. Daten können im ersten Bildspeicher 20a durch Verbinden des Bewegungskontaktes 19a mit dem einen feststehenden Kontakt 19b gespeichert werden, und im zweiten Bildspeicher 20b durch Verbinden des Bewegungskontaktes 19a mit dem anderen feststehenden Kontakt 19c.
  • Die Ausgangsseite sowohl vom ersten als auch vom zweiten Bildspeicher 20a, 20b ist mit einer Pegelfeststellschaltung (Pegeldetektor 21) verbunden. Letzterer stellt die Pegel der Signale in den Bildspeichern 20a, 20b fest und bestimmt, ob das spezielle Signal auf der Grundlage des festgestellten Pegels gültig ist. Die Ausgangsseite der Pegelfeststellschaltung 21 ist mit der Eingangsseite der Tonhöhenfeststellschaltung 22 verbunden. Letztere stellt die Tonhöhenkomponenten in den Signalen fest, die im ersten und zweiten Bildspeicher 20a, 20b gespeichert sind.
  • Von der Tonhöhe dieses Ausführungsbeispiels wird angenommen, daß sie eine Frequenzkomponente von mehr als 3 msec und weniger als 15 msec im eingegebenen Signal darstellt, das vom Mikrophon 17 kommt.
  • Das Feststellsignal aus der Pegelfeststellschaltung 21 und das Feststellsignal aus der Tonhöhenfeststellschaltung 22 gelangt in einen Zähler (Zähleinheit) 23. Der Zähler 23 enthält einen Tonhöhenzählabschnitt zur Aufzeichnung der Tonhöhenzählung und einen Rahmenzählabschnitt zum Zählen der Anzahl von Rahmen. Das Zählsignal aus dem Zähler 23 gelangt in eine Videokamera- Umschaltsteuerschaltung 24. Letztere steuert das Umschalten der Videokameras in der Weise, daß eine Videokamera in die Richtung des Mikrophons 17 zeigt, in das die Stimme des Individuums gelangt ist, das sich vor diesem Mikrophon befindet.
  • Die Arbeitsweise des Bildprozessors mit dem vorstehenden Aufbau wird nun beschrieben. Wenn zunächst ein Audiosignal vom Mikrophon 17 hereinkommt, wird das Signal von der A/D- Wandlerschaltung 18 digital umgesetzt, wodurch Bilder abgetastet werden. Die Abtastfrequenz beträgt 8 kHz und die Abtastdaten (Signal) werden anfänglich im ersten Bildspeicher 20a gespeichert. Wenn das Speichern von 20 msec von Daten im ersten Bildspeicher 20a endet, wird die Pegelfeststellverarbeitung von der Pegelfeststellschaltung 21 ausgeführt. Zur selben Zeit wird der Umschalter 19 umgeschaltet, um das Speichern in den zweiten Bildspeicher 20b zu ermöglichen, so daß 20 msec des abgetasteten Signals im zweiten Bildspeicher 20b gespeichert werden.
  • Die Pegelfeststellschaltung 21 nimmt den Mittelwert der im ersten Bildspeicher 20a gespeicherten Pegeldaten (oder im zweiten Bildspeicher 20b) und beurteilt, daß die, Daten im ersten Bildspeicher 20a (oder im zweiten Bildspeicher 20b) gültige Daten sind, wenn der Mittelwert einen Schwellwert übersteigt, der auf der Grundlage von Experimenten herausgefunden wurde (der Wert variiert abhängig von der Umgebung). Die Tonhöhenfeststellschaltung 22 führt dann eine Verarbeitung zur Tonhöhenfeststellung aus. Diese Verarbeitung umfaßt das Ausführen einer linearen Prädiktion unter Verwendung des eingegebenen Signals, Erzielen eines Prädiktionsfehlers zwischen dem vorhergesagten Wert und dem Wert des eingegebenen Signals und das Erzielen einer Tonhöhe durch Heranziehen der Autokorrelation vom vorhergesagten Fehler. Wenn die Tonhöhe festgestellt ist durch ein derartiges Ausführen der Verarbeitung zur Tonhöhenfeststellung wird die Anzahl von Rahmen vom Zähler 23 gezählt.
  • Die Verarbeitung zur Tonhöhenfeststellung wird angewandt auf die Daten in jedem der Bildspeicher 20a, 20b. Wenn die vom Zähler 23 aufgezeichnete Zählung einen Wert von zwei erreicht, wird beurteilt, daß das eingegebene Signal die Sprache des Individuums vor der Mikrophon 17 ist, und die Videokamera- Umschaltsteuerschaltung 24 plaziert ihren Steuerschalter (nicht dargestellt) in den auf EIN-Zustand. Nachdem die Zählung im Zähler 23 einen Wert von Eins erreicht hat, wird die Zählung im Zähler 23 auf Null gelöscht, und die Verarbeitung wird wieder aufgenommen, wenn ein Pegel nicht innerhalb von 300 msec (15 Rahmen) festgestellt wird oder wenn ein Pegel festgestellt, nicht aber eine Tonhöhe festgestellt wird.
  • Im Falle, bei dem der Pegel nicht festgestellt ist, bedeutet dies, daß es kein Eingangssignal gibt. Im Falle, bei dem der Pegel festgestellt wird, nicht jedoch die Tonhöhe, bedeutet dies, daß so etwas wie Rauschen festgestellt worden ist. In allen Fällen wird die Zählung im Zähler 23 nicht aktualisiert, und folglich bleibt der zuvor genannte Steuerschalter in seinem auf AUS-Zustand, und der Status der Videokameras wird nicht von der Videokamera-Umschaltsteuerschaltung 24 geändert.
  • Als nächstes anhand der Ablaufdiagramme der Fig. 7 und 8 beschrieben ist die Steueroperationsprozedur, die nach der Digitalisierungsverarbeitung von der A/D-Wandlerschaltung 18 vom Bildprozessor mit dem vorstehenden Aufbau ausgeführt wird.
  • Zuerst werden in Schritt S7-1 der Tonhöhenzählabschnitt und der Rahmenzählabschnitt vom Zähler 23 initialisiert. Der Tonhöhenzählabschnitt dient dem Zählen der Anzahl von Rahmen, in denen Tonhöhe festgestellt wird. Der Rahmenzählabschnitt dient der Zählung der Anzahl von Rahmen, in denen die Tonhöhe nicht festgestellt wird zwischen dem ersten Rahmen, in dem die Tonhöhe festgestellt wird, und dem zweiten Rahmen, in dem die Tonhöhe als nächstes festgestellt wird.
  • Als nächstes wird in Schritt S7-2 das abgetastete Signal im ersten Rahmenspeicher 20a gespeichert. Dann wird in Schritt S7-3 die Pegelfeststellverarbeitung bei einem Signal angewandt, das im ersten Rahmen 20a in Schritt S7-2 gespeichert ist. Gleichzeitig mit der in Schritt S7-3 ausgeführten Verarbeitung wird der Umschalter 19 in Schritt S7-15 umgeschaltet, und zwar in den Status, bei dem Daten in den zweiten Bildspeicher 20b gespeichert werden können. Dann folgt Schritt S7-16, bei dem das abgetastete Signal in den zweiten Rahmenspeicher 20b gespeichert wird.
  • Nachdem Schritt S7-3 ausgeführt ist, schreitet das Programm fort zu Schritt S7-4, bei dem die Pegelfeststellverarbeitung ausgeführt wird. Insbesondere wird bestimmt, ob der Pegel des im ersten Rahmenspeicher 20a gespeicherten Signals den vorbestimmten Schwellwert überschritten hat. Wenn der Schwellwert überschritten ist, schreitet das Programm fort zu Schritt S7-5, bei dem die Pegelfeststellverarbeitung angewandt wird auf ein Signal, das im ersten Rahmenspeicher 20a gespeichert ist. Ob die Tonhöhe festgestellt wurde, wird in Schritt S7-6 herausgefunden. Wenn die Tonhöhe festgestellt ist, wird die Zählung pc im Tonhöhenzählabschnitt vom Zähler 23 inkrementiert (auf pc + 1), und die Zählung fc für den nächsten Rahmenzählabschnitt wird in Schritt S7-7 auf Null gelöscht (fc = 0).
  • Das Programm schreitet dann fort zu Schritt S7-8, bei dem bestimmt wird, ob die Zählung pc im Tonhöhenzählabschnitt Zwei ist. Wenn pc gleich Zwei ist, dann wird beurteilt, daß das eingegebene Signal Sprache ist, und der Steuerschalter von der Videokamera-Umschaltsteuerschaltung 24 wird in Schritt S7-9 auf EIN geschaltet, wonach ein Übergang zur Verarbeitungsroutine von Fig. 8 erfolgt.
  • Im Falle, bei dem ein Pegel in Schritt S7-4 in Fig. 7 nicht festgestellt ist, schreitet das Programm fort zu Schritt S7-10, bei dem bestimmt wird, ob die Zählung pc im Tonhöhenzählabschnitt des Zählers 23 Null ist. Im Falle, daß pc gleich Null ist, wird der Steuerschalter der Videokamera- Umschaltsteuerschaltung 24 in Schritt S7-13 auf AUS geschaltet, wonach ein Übergang zur Verarbeitungsroutine von Fig. 8 erfolgt. Im Falle, bei dem die Zählung pc im Tonhöhenzählabschnitt nicht Null ist, wird die Zählung fc in Schritt S7-11 im Rahmenzählabschnitt inkrementiert (auf fc + 1), da die Tonhöhe im unmittelbar vorangehenden Rahmen festgestellt worden ist. Nachdem somit die Tonhöhe des zuvor beschriebenen ersten Rahmens festgestellt worden ist, werden Rahmen in einem Intervall gezählt, das sich bis dahin erstreckt, bis die momentane Tonhöhe die zweite Zeit festgestellt hat, das heißt, bis die Tonhöhe des zweiten Rahmens festgestellt ist.
  • Das Programm schreitet fort von Schritt S7-11 zu Schritt S7-12, bei dem festgestellt wird, ob die Anzahl von Rahmen (die Zählung fc, aufgezeichnet durch diesen Rahmenzählabschnitt) im zuvor beschriebenen Intervall 15 (300 msec) beträgt. Wenn die Zählung fc im Rahmenzählabschnitt 15 ist, dann wird fc in Schritt S7-13 auf Null gelöscht, wonach das Programm zu Schritt S7-14 fortschreitet. Hier wird der Steuerschalter der Videokamera-Umschaltsteuerschaltung 24 auf AUS geschaltet, wonach ein Übergang zur Verarbeitungsroutine von Fig. 8 erfolgt.
  • Nachstehend anhand Fig. 8 beschrieben ist die Verarbeitungsroutine.
  • Zuerst wird in Schritt S8-1 das Signal, das im zweiten Rahmenspeicher 20b gespeichert worden ist, der Pegelfeststellverarbeitung unterzogen. Dann wird in Schritt S8-2 bestimmt, ob der Pegel gemäß den zuvor beschriebenen Kriterien festgestellt worden ist. Gleichzeitig mit der Verarbeitung von Schritt S8-1 wird der Umschalter 19 in den Zustand umgeschaltet, in dem Daten in den ersten Rahmenspeicher 20a in Schritt S8-14 gespeichert werden können. Danach folgt Schritt S8-15, bei dem das abgetastete Signal in den ersten Speicher 20a gespeichert wird.
  • Wenn in Schritt S8-2 ein Pegel festgestellt ist, dann schreitet das Programm fort zu Schritt S8-3, bei dem die Verarbeitung zur Tonhöhenfeststellung für das Signal angewandt wird, das im zweiten Rahmenspeicher 20b gespeichert ist. Danach wird in Schritt S8-4 bestimmt, ob die Tonhöhe festgestellt worden ist. Wenn die Tonhöhe festgestellt worden ist, dann wird die Zählung pc im Tonhöhenzählabschnitt des Zählers 23 inkrementiert (auf pc + 1) und die Zählung fc im Rahmenzählabschnitt wird auf Null gelöscht (fc = 0).
  • Als nächstes schreitet das Programm fort zu Schritt S8-7, bei dem bestimmt wird, ob die Zählung pc im Tonhöhenzählabschnitt Zwei ist. Wenn die Zählung Zwei ist, dann wird beurteilt, daß das eingegebene Signal Sprache ist, und der Steuerschalter der Videokamera-Umschaltsteuerschaltung 24 wird in Schritt S8-8 auf EIN geschaltet, wonach ein Übergang zu Schritt S7-3 in Fig. 7 erfolgt.
  • Wenn in Schritt S8-2 ein Pegel nicht festgestellt wird, dann schreitet das Programm fort zu Schritt S8-9, bei dem bestimmt wird, ob die Zählung pc im Tonhöhenzählabschnitt des Zählers 23 Null ist. Wenn pc als Null befunden wird, dann wird der Steuerschalter der Videokamera-Umschaltsteuerschaltung 24 in Schritt S8-13 auf AUS geschaltet, wonach ein Übergang zu Schritt S7-3 in Fig. 7 erfolgt. Im Falle, daß die Zählung pc im Tonhöhenzählabschnitt nicht Null ist, wird die Zählung fc in Schritt S8-10 im Rahmenzählabschnitt inkrementiert (auf fc + 1), da die Tonhöhe im unmittelbar vorangehenden Rahmen festgestellt worden ist. Nachdem die Tonhöhe des zuvor erwähnten ersten Rahmens festgestellt worden ist, werden Rahmen in dem Intervall gezählt, das sich bis zu dem Moment erstreckt, in dem die Tonhöhe zum zweiten Mal festgestellt wird, das heißt, bis die Tonhöhe des zweiten Rahmens festgestellt ist.
  • Das Programm schreitet fort zu Schritt S8-11, bei dem bestimmt wird, ob die Anzahl von Rahmen (die Zählung fc, aufgezeichnet vom Rahmenzählabschnitt) im zuvor genannten Intervall 15 (300 msec) ist. Wenn die Zählung fc im Rahmenzählabschnitt 15 ist, dann wird fc in Schritt S8-12 auf Null gelöscht, wonach das Programm fortschreitet zu Schritt S8-13. Hier wird der Steuerschalter der Videokamera- Umschaltsteuerschaltung 24 auf AUS geschaltet, wonach ein Übergang zu Schritt S7-3 von Fig. 7 erfolgt. Wenn die Zählung fc im Rahmenzählabschnitt nicht 15 ist, wird keine Verarbeitung ausgeführt, und ein Übergang erfolgt zu Schritt S7-3 von Fig. 7.
  • Gemäß diesem zuvor beschriebenen Ausführungsbeispiel wird somit auf der Grundlage von Ergebnissen des Herausfindens herausgefunden, ob das eingegebene Signal ein unerwünschter Ton wie Rauschen ist, ausgeführt sowohl von der Pegelfeststellschaltung 21 als auch von der Tonhöhenfeststellschaltung 22. Folglich wird die Diskriminierverarbeitung in hochzuverlässiger Weise ausgeführt. Da des weiteren der Steuerschalter von der Videokamera- Umschaltsteuerschaltung 24 ein- und ausgeschaltet wird auf der Grundlage der Ergebnisse des zuvor beschriebenen Selektierens, ist es möglich, Videokameras daran zu hindern, durch Reagieren auf unerwünschte Töne fehlerhaft zu arbeiten, nämlich Töne, die andere als Stimmen sind.
  • Mit anderen Worten, die Aufnahme unerwünschter Töne, nämliche anderer Töne als Sprache, kann mit Sicherheit unterdrückt werden, und es ist möglich, leicht herauszufinden, ob ein Individuum momentan vor dem Eingabemittel spricht oder ob ein Audiosignal, das über das Eingabemittel hereinkommt, eine Sprache oder ein unerwünschter Ton ist.
  • (Viertes Ausführungsbeispiel)
  • Ein Audioverarbeitungsgerät nach einem vierten Ausführungsbeispiel der vorliegenden Erfindung ist nachstehend in Einzelheiten beschrieben. Zuerst werden die Hauptpunkte des Audiosignal-Verarbeitungsgerätes nach dem vierten Ausführungsbeispiel zusammengefaßt.
  • Das Gerät nach dem vierten Ausführungsbeispiel ist ausgestattet mit einem Pegeldetektor zum Feststellen des Pegels eines eingegebenen Audiosignals und zum Ausgeben eines Abschnitts des Signals über einem vorbestimmten Pegel, einem A/D-Wandler zum Umsetzen des analogen Audiosignals, das vom Pegeldetektor ausgegeben wird, in ein digitales Signal, einem Audiosignalspeicher zum Speichern des digitalen Audiosignals, das vom A/D-Wandler ausgegeben wird, und mit einem Sprachdiskriminator zum Feststellen einer Periodizität des digitalen Audiosignals, das im Audiosignalspeicher gespeichert ist, und zum Herausfinden, ob das Audiosignal eine menschliche Stimmen aufzeigt, abhängig davon, ob die festgestellte Periodizität in einen vorgeschriebenen Bereich fällt.
  • Der Sprachdiskriminator enthält eine autokorrelierende Recheneinheit zum Errechnen der Autokorrelation eingegebener Audiodaten, einen Maximumdetektor zum Feststellen eines vorgeschriebenen maximalen Punktes von einer Autokorrelationsfunktion, die von der autokorrelierenden Recheneinheit gewonnen wird, eine Schwerpunktswert-Recheneinheit zum Errechnen eines Schwerpunktwertes innerhalb einer vorbestimmten Zeitdauer und eines Korrelationswertes des vom Maximumdetektor festgestellten Maximumpunktes und einen Diskriminator zum Herausfinden, ob die eingegebenen Audiodaten Sprache sind, basierend auf einer Zeitkomponente und einer Korrelationswertkomponente vom Schwerpunktwert, der von der Schwerpunktwertrecheneinheit gewonnen wird.
  • Das Audiosignalverarbeitungsgerät vom vierten Ausführungsbeispiel wird nun detailliert anhand der beiliegenden Zeichnung beschrieben.
  • Fig. 9 ist ein Blockdiagramm einer Signalverarbeitung nach dem vierten Ausführungsbeispiel. In Fig. 9 gezeigt sind ein Mikrophon 100, ein Vorverstärker 120 zum Verstärken des Ausgangssignals vom Mikrophon 100, eine Pegeldetektionsschaltung 140 zum Feststellen des Pegels vom Audiosignal, das vom Vorverstärker 120 kommt, und zum Liefern eines Eingangssignals, das einen vorbestimmten Pegel überschreitet, ein A/D-Wandler 160 zum Umsetzen des analogen Ausgangssignals von der Pegelfeststellschaltung 140 in ein digitales Signal, eine Audiodatenspeicherschaltung 180 zum Speichern digitaler Audiodaten, die vom A/D-Wandler 160 kommen, eine Sprachdiskriminierschaltung 200 zum Herausfinden, ob die von der Audiodatenspeicherschaltung 180 ausgegebenen Daten Sprachdaten sind, und ein Ausgangsanschluß 220 zum Liefern externer Ergebnisse des von der Sprachselektierschaltung 200 ausgeführten Diskriminierens.
  • Die Arbeitsweise der in Fig. 9 gezeigten Schaltung wird nun beschrieben. Das vom Mikrophon 100 abgegebene Audiosignal wird vom Vorverstärker 120 verstärkt und dann einer Pegelfeststellschaltung 140 eingegeben. Letztere vergleicht das eingegebene Audiosignal mit einem vorgeschriebenen Bezugspegel und stellt dem A/D-Wandler 160 einen Abschnitt des Signals über dem vorgeschriebenen Bezugspegel bereit. Der A/D-Wandler 160 setzt das analoge Ausgangssignal von der Pegelfeststellschaltung 140 um in ein digitales Signal. Ein vorgeschriebenes Intervall vom sich ergebenden digitalen Signal wird in der Audiospeicherschaltung 180 gespeichert. Die Sprachdiskriminierschaltung 200 stellt die Periodizität der Audiodaten fest, die in der Audiodatenspeicherschaltung 180 gespeichert sind, findet heraus, ob die eingegebenen Audiodaten diejenigen einer menschlichen Stimme sind, basierend auf der festgestellten Fundamentalperiode, und gibt die Ergebnisse des Selektierens an den Ausgangsanschluß 220 ab.
  • Fig. 10 und 11 sind Ablaufdiagramme, die den Ablauf der von der Sprachselektierschaltung 200 ausgeführten Sprachdiskriminierverarbeitung darstellen. Zuerst wird in Schritt S1 ein Block einer Dauer T aus den Audiodaten genommen, die in der Audiodatenspeicherschaltung 180 gespeichert sind, und dann wird ein Rahmen der Dauer τ aus dem Block der Dauer T in Schritt S2 herausgenommen.
  • Die Beziehung zwischen T und τ ist in Fig. 12 veranschaulicht. Hiernach wird das Intervall, dessen Einheit der Messung die Dauer τ ist, als Rahmen bezeichnet, während das Intervall, dessen Einheit der Messung die Dauer T ist, als ein Block bezeichnet wird.
  • Als nächstes wird der erste Rahmen des ersten Blockes aus den Audiodaten gelesen, die in der Speicherschaltung 180 gespeichert sind (Schritt S3), dann erfolgt eine lineare Prädiktion aus den Audiodaten in diesem Rahmen (Schritt S4). Genauer gesagt, wenn St das Originalsignal darstellt und Stp das vorhergesagte Signal, dann kann eine Gleichung zum Ausführen der linearen Prädiktion unter Verwendung der vergangenen N Abtastungen folgendermaßen angegeben werden:
  • Stp = -(a&sub1;St-1 + a&sub2;St-2 + a&sub3;St-3 + ... + aNSt-N)
  • Als nächstes wird die Differenz Et zwischen dem Originalsignal St und dem vorhergesagten Signal Stp gewonnen (Schritt S5). Das heißt, die folgende Operation wird ausgeführt:
  • Et = St - Stp
  • Des weiteren wird eine Autokorrelationsverarbeitung zum Betrachten der Periodizität eines Originals ausgeführt (Schritt S6). In diesem Ausführungsbeispiel wird eine Autokorrelation folgendermaßen geschrieben, um das Ausmaß auszudrücken, welche Komponenten bis zur Periode τ vorhanden sind:
  • R = EtEt+τ
  • τ {0, 1, ..., T - 1}
  • Als nächstes wird die in Schritt S6 gewonnene Autokorrelationsfunktion normiert (Schritt S7). Das heißt, eine Operation, die durch die folgende Gleichung angegeben ist, in der Rn die normierte Autokorrelationsfunktion darstellt:
  • Rn(τ) = R(τ)/R(0)
  • Diese Autokorrelationsfunktion ist in Fig. 13 dargestellt, in der τ auf der horizontalen Achse aufgetragen ist und der Wert der normierten Autokorrelationsfunktion Rn(τ) längs der Vertikalachse aufgetragen ist.
  • Es wird entschieden, ob der Korrelationswert, der in Schritt S7 normiert worden ist, einen Spitzenwert besitzt, der einen Schwellwert übersteigt, der aufgrund von Erfahrungswerten festgelegt wurde, und dieser Spitzenwert wird ausgelesen (Schritt S8). Im Ergebnis dieser Verarbeitung wird der Abschnitt, der im Beispiel 13 durch den Pfeil aufgezeigt ist, ausgelesen.
  • Die Verarbeitung vom ersten Rahmen im ersten Block ist zuvor beschrieben worden. Als nächstes wird der zweite Rahmen des ersten Blockes ausgelesen und die Verarbeitung (Schritte S10 bis S14), die dieselbe ist wie jene der Schritte S4 bis S8 vom ersten Rahmen, wird zum Auslesen des Spitzenwertes vom Wert der Autokorrelationsfunktion Rn(τ) im zweiten Rahmen ausgeführt.
  • Die Verarbeitung zum Integrieren dieser Spitzenwerte wird in Schritt S15 ausgeführt, und der Schwerpunkt der Spitzenwerte wird in Schritt S16 aus dem Spitzenwert, der im ersten Rahmen ausgelesen wurde, den Spitzenwerten, ausgelesen im zweiten Rahmen, und dem Ergebnis der Integration dieser Spitzenwerte gewonnen.
  • Ein Verfahren zur Verarbeitung des Auslesens vom Schwerpunkt der Spitzenwerte wird nun in Einzelheiten anhand der Fig. 14(a) bis 14(d) beschrieben. Fig. 14(a) zeigt den Spitzenwert der Autokorrelationsfunktion auf, die im ersten Rahmen gewonnen wird, und Fig. 14(b) zeigt Spitzenwerte der Autokorrelation auf, die im zweiten Rahmen gewonnen werden. Das Ergebnis (Schritt S15) der Integration dieser Spitzenwerte ist in Fig. 14(c) gezeigt. Wie in Fig. 14(c) gezeigt, sind die Spitzen mit t&sub1;, t&sub2; und t&sub3; in aufsteigender Reihenfolge hinsichtlich der Zeit bezeichnet. Des weiteren wird der Schwerpunktwert wie unten gezeigt gewonnen, wobei die Korrelationswerte zu dieser Zeit dargestellt werden durch p(t&sub1;), p(t&sub2;) beziehungsweise p(t&sub3;). Insbesondere stellt mop den Moment der Reihenfolge 0 der Autokorrelationsfunktion dar, und so erhält man
  • mop = Σi=1 p(ti)
  • Des weiteren stellt mot den Moment der Reihenfolge 0 der Zeit dar, und so ergibt
  • mot = Σi=1 ti
  • Des weiteren stellt m&sub1; den Moment der ersten zeitlichen Reihenfolge dar, mit
  • m&sub1; = Σi=1 tip(ti)
  • Aus diesen Gleichungen wird der Schwerpunktwert g der Zeit folgendermaßen geschrieben:
  • tg = m&sub1;/mop
  • Andererseits wird der Schwerpunktwert pg der Korrelationswerte durch die Rechnung zu
  • pg = m&sub1;/mot
  • Der erzielte Schwerpunktwert ist in Fig. 14(d) dargestellt.
  • Es wird bestimmt, ob die Zeitkomponente tg des Schwerpunktwertes, der solchermaßen gewonnen wird, größer als 3 msec, jedoch gleich oder weniger als 15 msec ist, welches der Bereich ist, in dem die Periode der Tonhöhe der menschlichen Stimmen residiert. Wenn dieser Bedingung entsprochen ist, schreitet das Programm fort zu Schritt S18, in dem bestimmt wird, ob die Komponente pg des Korrelationswertes vom Schwerpunkt größer als ein Schwellwert ist, der auf der Grundlage von Versuchen entschieden ist. Wenn dieser Bedingung entsprochen ist, schreitet das Programm fort zu Schritt S19, bei dem beurteilt wird, daß das eingegebene Signal dasjenige einer menschlichen Stimme ist. Hier wird die Entscheidung wiedergegeben zu der Tatsache, daß alle Signale im ersten Block gegenwärtig der Verarbeitung unterzogen werden und die menschliche Stimme aufzeigen.
  • Wenn beurteilt ist, daß das eingegebene Signal keine Stimme ist, das heißt, wenn die Bedingung von Schritt S17 oder die Bedingung von Schritt S18 nicht erfüllt wird, schreitet das Programm fort zu Schritt S21.
  • In Schritt S21 wird bestimmt, ob die Verarbeitung bis zum letzten Rahmen beendet ist. Das Programm schreitet fort zu Schritt S22, wenn die Verarbeitung noch nicht beendet ist.
  • In Schritt S22 wird der dritte Rahmen des ersten Blockes ausgelesen, die Verarbeitung (Schritte S10 bis S14) wird ähnlich derjenigen des zweiten Rahmens ausgeführt, und der Spitzenwert wird ausgelesen. Ein neuer Schwerpunkt von Spitzenwerten wird gewonnen unter Verwendung dieses ausgelesenen Spitzenwertes und dem Schwerpunkt der Spitzenwerte vom ersten und zweiten Rahmen. Insbesondere wird der Schwerpunkt, der durch den ersten und den zweiten Rahmen gewonnen wird, durch den Spitzenwert des ersten Rahmens von Fig. 14(a) ersetzt, und der Spitzenwert des dritten Rahmens wird ersetzt gegen die Spitzenwerte des zweiten Rahmens von Fig. 14(b), wodurch ein neuer Schwerpunkt von Spitzenwerten erzielt werden kann.
  • Der solchermaßen gewonnene Schwerpunkt ist der Schwerpunkt bis zum dritten Rahmen. Wenn dieser Schwerpunkt den Bedingungen der menschlichen Sprache entspricht (Schritt S17 und S18), wird beurteilt, daß das Audiosignal vom ersten Block ein Stimmensignal ist, und ein Übergang erfolgt zur Verarbeitung des zweiten Blockes. Wenn hier beurteilt wird, daß das Audiosignal kein Stimmensignal ist, wird der vierte Rahmen vom ersten Block ausgelesen, und dieselbe Verarbeitung wird ausgeführt. Im Ergebnis wird der Schwerpunkt von Spitzenwerten bis zum vierten Rahmen vom ersten Block gewonnen.
  • Jeder Rahmen vom ersten Block wird verarbeitet, bis eine Entscheidung zur Bewirkung wiedergegeben wird, daß das solchermaßen eingegebene Audiosignal die menschliche Stimme aufzeigt. Wenn diese Entscheidung wiedergegeben wird, erfolgt die Initialisierung des Wertes des soweit gewonnenen Schwerpunktes, und die Verarbeitung zum Auslesen des Schwerpunktes vom zweiten Block wird neu ausgeführt.
  • Wenn diese Entscheidung zur Herbeiführung, daß das Audiosignal ein Stimmensignal ist, bis zum letzten Rahmen des ersten Blockes nicht wiedergegeben wird (das heißt, wenn der Schwerpunkt nicht den Bedingungen der menschlichen Sprache entspricht), erfolgt letztlich die Beurteilung, daß das Audiosignal des ersten Blockes kein Stimmensignal ist; der Wert des Schwerpunktes der Spitzenwerte, die solchermaßen gewonnen wurden, werden initialisiert, und die Schwerpunktausleseverarbeitung, wie diejenige des ersten Blockes, wird vom zweiten Block an angewandt.
  • Das Gerät zur Audiosignalverarbeitung von diesem Ausführungsbeispiel ist ausgestattet für jedes Mikrophon, und eine Kamera wird gemäß dem Ausgangssignal gesteuert, das die Ergebnisse der Stimmenunterscheidung aufzeigt, die von jedem Audiosignalprozessor ausgeführt wurde, wodurch das solchermaßen aufgebaute System als ein Kamerasteuersystem in einer Fernsehkonferenz verwendet werden kann. Fig. 14(a) bis 14(d) sind Blockdiagramme, die dieses System darstellen. Angemerkt sei, daß identische Komponenten wie jene in Fig. 9 mit denselben Bezugszeichen versehen sind.
  • In Fig. 15 bedeutet Bezugszeichen 300 ein Gerät zur Audiosignalverarbeitung, das aufgebaut ist, wie in Fig. 9 gezeigt; Bezugszeichen 320 bedeutet eine Kameraeinheit und Bezugszeichen 340 bedeutet eine Kamerasteuerschaltung, die gemäß dem Ausgangssignal der Sprachunterscheidungsschaltung 200 vom Audiosignalverarbeitungsgerät 300 die Kameraeinheit 320 in der Weise steuert, daß die Kameraeinheit hin zu dem Individuum zeigt, das das Mikrophon verwendet, in welches das Sprachsignal eingegeben worden ist. Die Kamerasteuerschaltung 340 steuert die Kameraeinheit 320 auch gemäß einem Kamerasteuersignal aus einer Systemsteuerschaltung, die nicht dargestellt ist.
  • Fig. 16 ist ein Ablaufdiagramm einer Kamerasteuerung bezüglich des in Fig. 15 gezeigten Mikrophons #1. Die Verarbeitung wird anhand dieses Ablaufdiagramms gesteuert.
  • Zuerst findet in Schritt S31 die Sprachunterscheidungsschaltung 200 vom Audiosignalverarbeitungsgerät 300 heraus, ob das eingegebene Audiosignal ein Stimmensignal ist.
  • Wenn als nächstes in Schritt S32 herausgefunden ist, daß das Ergebnis des Selektierens in Schritt S31 eine Stimme aufzeigt, schreitet das Programm fort zu Schritt S34, in dem die Kamerasteuerschaltung 340 ein Kennzeichen für das Mikrophon #1 (nicht dargestellt) in einem Kamerasteuerfeld gemäß dem Mikrophon #1 setzt. Wenn andererseits das Ergebnis des Selektierens in Schritt S31 eine Stimme nicht aufzeigt, schreitet das Programm fort zu Schritt S33, in dem das zuvor erwähnte Kennzeichen für das Mikrophon #1 im Kamerasteuerfeld gelöscht wird.
  • Die Kamerasteuerschaltung 340 führt in Schritt S35 eine Überprüfung aus, um zu bestimmen, ob das Kennzeichen vom Mikrophon #1 im Kamerasteuerfeld gesetzt worden ist. Wenn das Kennzeichen gesetzt worden ist, schreitet das Programm fort zu Schritt S36, bei dem der Schwenkkopf der Kameraeinheit 320 so gesteuert wird, daß die Kameraeinheit auf das individuelle verwendete Mikrophon #1 zeigt. Das Programm kehrt dann zur Verarbeitung von Schritt S31 zurück.
  • Wie aus der vorstehenden Beschreibung leicht ersichtlich ist, macht es dieses Ausführungsbeispiel solchermaßen möglich, genau zu bestimmen, ob ein eingegebenes Audiosignal dasjenige einer menschlichen Stimme ist. Im Ergebnis ist es möglich, eine Kamera daran zu hindern, beispielsweise in einer Fernsehkonferenz aufgrund von Rauschen fehlerhaft zu arbeiten.
  • Da viele weitestgehend unterschiedliche Ausführungsbeispiele der vorliegenden Erfindung ohne Abweichen vom Umfang derselben möglich sind, versteht es sich, daß die Erfindung nicht auf die speziellen Ausführungsbeispiele beschränkt ist, mit Ausnahme der Festlegung in den anliegenden Patentansprüchen.

Claims (32)

1. Verfahren zur Signalverarbeitung, mit den Verfahrensschritten:
a) Eingeben eines Audiosignals; und
b) Feststellen der Tonhöhe des eingegebenen Audiosignals; gekennzeichnet durch die Verfahrensschritte:
c) Erzeugen eines Bilderzeugungs-Anforderungssignals gemäß dem Audiosignal, dessen Tonhöhe ungefähr gleich einer vorbeschriebenen Tonhöhe ist,
d) Auswählen eines zugehörigen Bildaufnahmemittels aus einer Vielzahl von Bildaufnahmemitteln basierend auf dem im Verfahrensschritt des Erzeugens vom Bilderzeugungs- Anforderungssignal erzeugten Bilderzeugungs-Anforderungssignal; und
e) Senden eines vom Bildaufnahmemittel aufgenommenen im Verfahrensschritt des Auswählens ausgewählten Bildes zum Bilderzeugungsmittel und Veranlassen des Bilderzeugungsmittels, das zugehörige Bild zu erzeugen.
2. Verfahren nach Anspruch 1,
gekennzeichnet durch die Verfahrensschritte:
Feststellen eines Pegels vom im Verfahrensschritt des Eingebens eingegebenen Audiosignal und Erzeugen eines Pegelsignals, und
Ausgeben eines Signals gemäß dem im Verfahrensschritt des Eingebens eingegebenen Audiosignal, wenn das Pegelsignal größer als ein vorgeschriebener Schwellwert ist und die im Verfahrensschritt des Feststellens der Tonhöhe festgestellte Tonhöhe des Audiosignals ungefähr gleich einer vorgeschriebenen Tonhöhe ist.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß das Audiosignal im Sprachfrequenzband liegt.
4. Verfahren nach Anspruch 1,
gekennzeichnet durch die Verfahrensschritte:
Sprachbandfiltern, wodurch das eingegebene Signal eine Sprachbandpaß-Filterungsverarbeitung erfährt, um ein Sprachbandsignal zu erzeugen;
Feststellen vom Pegel des Sprachbandsignals und Erzeugen eines Pegelsignals;
wobei der Verfahrensschritt des Feststellens der Tonhöhe die Tonhöhe des Sprachbandsignals feststellt; und durch
Ausgeben eines Signals gemäß dem im Verfahrensschritt des Eingebens eingegebenen Audiosignal, wenn das Pegelsignal größer als ein vorgeschriebener Schwellwert und das Tonhöhensignal einer vorgeschriebenen Tonhöhe ungefähr gleicht.
5. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß
das Eingeben des Audiosignals aus jedem der Vielzahl von Audioeingabemitteln im Verfahrensschritt des Eingebens erfolgt;
ein Verfahrensschritt des Pegelfeststellens vorgesehen ist, der den Pegel eines jeden im Verfahrensschritt des Eingebens eingegebenen Audiosignals feststellt, und Erzeugen eines Pegelsignals gemäß einem jeden Audiosignal;
wobei der Verfahrensschritt der Tonhöhenfeststellung die Tonhöhe eines jeden im Verfahrensschritt des Eingebens eingegebenen Audiosignals feststellt;
wobei der Verfahrensschritt des Erzeugens vom Bilderzeugungs-Anforderungssignal ein Bilderzeugungs- Anforderungssignal gemäß dem Audiosignal des Pegels erzeugt, der größer als ein vorgeschriebener Schwellwert ist;
wobei der Verfahrensschritt des Auswählens einige Bildaufnahmemittel aus einer Vielzahl von Bildaufnahmemitteln auf der Grundlage eines jeden im Verfahrensschritt des Erzeugens vom Bilderzeugungs-Anforderungssignal erzeugten Bilderzeugungs- Anforderungssignals auswählt.
6. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß
jedes der Vielzahl von Audioeingabemitteln das Audiosignal eingibt;
der Verfahrensschritt des Feststellens der Tonhöhe die Tonhöhe eines jeden im Verfahrensschritt des Eingebens eingegebenen Audiosignals feststellt;
wobei der Verfahrensschritt des Erzeugens vom Bilderzeugungs-Anforderungssignal ein Bilderzeugungs- Anforderungssignal gemäß einem jeden Audiosignal erzeugt, wenn die Tonhöhe eines jeden im Verfahrensschritt des Feststellens der Tonhöhe festgestellten Audiosignals ungefähr gleich der vorgeschriebenen Tonhöhe ist;
der Verfahrensschritt des Auswählens einiger Bildaufnahmemittel aus der Vielzahl von Bildaufnahmemitteln auf der Grundlage eines jeden im Verfahrensschritt des Erzeugens vom Bilderzeugungs-Anforderungssignal erzeugten Bilderzeugungs- Anforderungssignals einige Bildaufnahmemittel auswählt.
7. Verfahren nach Anspruch 1, 4, 5 oder 6, dadurch gekennzeichnet, daß die Tonhöhe einer Sprachfrequenzband-Tonhöhe entspricht.
8. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß
ein Verfahrensschritt des Feststellens vom Pegel vorgesehen ist zur Feststellung des Pegels vom im Verfahrensschritt des Eingebens und Erzeugens eines Pegelsignals eingegeben Audiosignals; und daß
der Verfahrensschritt der Auswahl zugehörige Bildaufnahmemittel auswählt und ein Bild an das Aufnahmemittel abgibt, wenn das Pegelsignal größer als ein vorgeschriebener Schwellwert ist und die festgestellte Tonhöhe im Verfahrensschritt der Tonhöhenfeststellung in einen vorgeschriebenen Bereich fällt.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß der Verfahrensschritt des Auswählens das zugehörige Bildaufnahmemittel auswählt und das Bild an das Aufnahmemittel abgibt, wenn das Pegelsignal größer als der vorgeschriebene Schwellwert ist, ein Schwerpunkt von Autokorrelationswerten gemäß jeweiliger Perioden, festgestellt im Verfahrensschritt des Feststellens der Periode, in eine Zeitdauer T innerhalb eines vorgeschriebenen Schwerpunktsbereichs fällt und wenn ein Autokorrelationswert gemäß dem Schwerpunkt größer ist als ein vorgeschriebener Schwellwert.
10. Verfahren nach Anspruch 1,
gekennzeichnet durch die Verfahrensschritte:
Feststellen des im Verfahrensschritt des Eingebens vom Pegel eingegebenen Audiosignals und Erzeugen eines Pegelsignals; und durch
Ausgeben eines Audiosteuersignals gemäß dem im Verfahrensschritt des Eingebens eingegeben Audiosignal, wenn das Pegelsignal größer als ein vorgeschriebener Schwellwert ist und die im Verfahrensschritt des Feststellens der Tonhöhe festgestellte Tonhöhe in einen vorgeschriebenen Bereich fällt.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß der Verfahrensschritt des Ausgebens vom Audiosteuersignal ein Signal gemäß dem im Verfahrensschritt des Eingebens eingegebenen Audiosignal ausgibt, wenn das Pegelsignal größer als der vorgeschriebene Schwellwert ist, ein Schwerpunkt der Autokorrelationswerte gemäß jeweiligen Perioden, festgestellt im Verfahrensschritt des Feststellens der Periode, in eine Zeitdauer T innerhalb eines vorgeschriebenen Schwerpunktbereichs fällt und wenn ein Autokorrelationswert gemäß dem Schwerpunkt größer als ein vorgeschriebener Schwellwert ist.
12. Verfahren nach Anspruch 8 oder 10,
dadurch gekennzeichnet, daß
der Verfahrensschritt der Tonhöhenfeststellung folgende Verfahrensschritte einschließt:
Partitionieren des im Verfahrensschritt des Eingebens eingegebenen Audiosignals in Audiosignale jeweils von einer Zeitdauer T;
weiteres Partitionieren eines jeden partitionierten Audiosignals in Audiosignale jeweils von einer Zeitdauer τ; und
Feststellen einer Blockperiode des Feststellens der Periodizität von den Audiosignalen der Zeitdauer τ.
13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß der Verfahrensschritt des Feststellens der Blockperiode das Errechnen einer Autokorrelationsfunktion gemäß den Audiosignalen der Zeitdauer τ einschließt sowie Auswählen einer Periode gemäß einem maximalen Autokorrelationswert, der größer ist als der Schwellwert unter Autokorrelationswerten der Autokorrelationsfunktion.
14. Verfahren nach Anspruch 12,
dadurch gekennzeichnet, daß
der Verfahrensschritt des Feststellens der Blockperiode das Erzeugen einer linearen Prädiktionsgleichung einschließt, die der Annäherung des Audiosignals der Zeitdauer T basierend auf dem Audiosignal der Zeitdauer τ dient;
Errechnen einer Autokorrelationsfunktion bezüglich eines Restsignals zwischen dem Audiosignal der Zeitdauer T und einem vorgesagten Audiosignal basierend auf der linearen Prädiktionsgleichung; und
Auswählen einer Periode gemäß einem maximalen Autokorrelationswert, der größer als der Schwellwert ist, aus den Autokorrelationswerten der Autokorrelationsfunktion.
15. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß der vorgeschriebene Schwerpunktsbereich ungefähr drei bis fünf msec beträgt.
16. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß
das Eingeben des Audiosignals von jedem der Vielzahl von Audioeingabemitteln erfolgt;
ein Verfahrensschritt des Feststellens vorgesehen ist zum Feststellen des Pegels eines jeden im Verfahrensschritt des Eingebens eingegebenen Audiosignals und Erzeugen eines Pegelsignals gemäß einem jeden Audiosignal;
wobei der Verfahrensschritt der Tonhöhenfeststellung die Tonhöhe eines jeden im Verfahrensschritt des Eingebens eingegebenen Audiosignals feststellt;
ein Verfahrensschritt des Erzeugens eines Spracherzeugungs- Anforderungssignals vorgesehen ist zum Erzeugen eines Spracherzeugungs-Anforderungssignals gemäß einem jeden Audiosignal, wenn jedes Pegelsignal größer als ein vorgeschriebener Schwellwert ist und die Tonhöhe eines jeden im Verfahrensschritt des Feststellens der Tonhöhe festgestellten Audiosignals einer vorgeschriebenen Tonhöhe ungefähr gleicht;
ein Verfahrensschritt des Synthetisierens vorgesehen ist zum Synthetisieren eines jeden Audiosignals gemäß einem jeden im Verfahrensschritt des Erzeugens vom Spracherzeugungs- Anforderungssignal erzeugten Spracherzeugungs- Anforderungssignal; und
ein Verfahrensschritt der Audioausgabe vorgesehen ist zum Ausgeben eines Tones gemäß dem im Verfahrensschritt des Synthetisierens synthetisierten Audiosignal aus Audioausgabemitteln.
17. Vorrichtung zur Signalverarbeitung, mit:
a) einem Eingabemittel zur Eingabe eines Audiosignals; und
b) einem Tonhöhenfeststellmittel zum Feststellen der Tonhöhe eines jeden vom Eingabemittel eingegebenen Audiosignals;
gekennzeichnet durch
c) ein Signalverarbeitungsmittel (14a bis 14n) mit dem Tonhöhenfeststellmittel und einem Erzeugungsmittel zum Erzeugen eines Bilderzeugungs-Anforderungssignals, wenn die Tonhöhe des vom Tonhöhenfeststellmittel festgestellten Audiosignals einer vorgeschriebenen Tonhöhe ungefähr gleicht,
d) ein Auswahlmittel (13A) zum Auswählen eines entsprechenden Bildaufnahmemittels aus einer Vielzahl von Bildaufnahmemitteln (15a bis 15n) basierend auf dem vom Erzeugungsmittel erzeugten Bilderzeugungs-Anforderungssignal; und
e) ein Mittel zum Senden eines vom Bildaufnahmemittel aufgenommenen vom Auswahlmittel (13A) ausgewählten Bildes zum Bilderzeugungsmittel (16) und Veranlassen des Bilderzeugungsmittels (16) zum Erzeugen des zugehörigen Bildes.
18. Vorrichtung nach Anspruch 17,
gekennzeichnet durch
ein Pegelfeststellmittel (4) zum Feststellen eines Pegels des vom Eingabemittel (1) eingegebenen Audiosignals und Erzeugen eines Pegelsignals; und
ein Signalsteuer-Ausgabemittel (9) zum Ausgeben eines Signals gemäß dem vom Eingabemittel (1) eingegebenen Audiosignal, wenn das Pegelsignal größer als ein vorgeschriebener Schwellwert ist und die vom Tonhöhenfeststellmittel (7) festgestellte Tonhöhe des Audiosignals der vorgeschriebenen Tonhöhe ungefähr gleicht.
19. Vorrichtung nach Anspruch 17 oder 18, dadurch gekennzeichnet, daß das Audiosignal im Sprachfrequenzband liegt.
20. Vorrichtung nach Anspruch 17,
dadurch gekennzeichnet, daß
Sprachbandpaß-Filtermittel (2) vorgesehen sind zum Unterziehen des eingegebenen Signals der Sprachbandpaßfilterungs-Verarbeitung und Erzeugen eines Sprachbandsignals;
Pegelfeststellmittel (4) vorgesehen sind zum Feststellen des Pegels vom Sprachbandsignal und Erzeugen eines Pegelsignals,
wobei die Tonhöhenfeststellmittel eingerichtet sind zum Feststellen der Tonhöhe vom Sprachbandsignal und zum Erzeugen eines Tonhöhensignals; und
Audioausgabemittel (12) vorgesehen sind zur Ausgabe eines Klanges gemäß dem vom Eingabemittel eingegebenen Audiosignal, wenn der Signalpegel größer ist als ein vorgeschriebener Schwellwert und das Tonhöhensignal der vorgeschriebenen Tonhöhe ungefähr gleicht.
21. Vorrichtung nach Anspruch 17,
dadurch gekennzeichnet, daß
Pegelfeststellmittel vorgesehen sind zum Feststellen des Pegels vom durch das Eingabemittel eingegebene Audiosignal und Erzeugen eines Pegelsignals;
wobei das Erzeugungsmittel eingerichtet ist zum Erzeugen des Bilderzeugungs-Anforderungssignals, wenn das Pegelsignal größer als der vorgeschriebene Schwellwert ist und die vom Tonhöhenfeststellmittel festgestellte Tonhöhe des Audiosignals der vorgeschriebenen Tonhöhe ungefähr gleicht;
wobei das Auswahlmittel (13A) eingerichtet ist zur Auswahl einiger Bildaufnahmemittel aus einer Vielzahl von Bildaufnahmemitteln (15a bis 15n) basierend auf jedem durch ein jeweiliges der Signalverarbeitungsmittel erzeugten Bilderzeugungs-Anforderungssignal.
22. Vorrichtung nach Anspruch 17, dadurch gekennzeichnet, daß
das Auswahlmittel (13A) eingerichtet ist zur Auswahl einiger Bildaufnahmemittel aus einer Vielzahl von Bildaufnahmemitteln (15a bis 15n) basierend auf jedem von einem jeweiligen der Signalverarbeitungsmittel erzeugten Bilderzeugungs- Anforderungssignal.
23. Vorrichtung nach Anspruch 17, 20, 21 oder 22, dadurch gekennzeichnet, daß die Tonhöhe der Tonhöhe im Sprachfrequenzband entspricht.
24. Vorrichtung nach Anspruch 17,
dadurch gekennzeichnet, daß
Pegelfeststellmittel (21) vorgesehen sind zum Feststellen des Pegels vom durch das Eingabemittel eingegebene Audiosignal und Erzeugen eines Pegelsignals; und
wobei das Auswahlmittel (24) eingerichtet ist zum Auswählen jeweiliger Bildaufnahmemittel und Eingeben eines Bildes in das ausgewählte Bildaufnahmemittel, wenn das Pegelsignal größer als ein vorgeschriebener Schwellwert ist und die vom Tonhöhenfeststellmittel festgestellte Tonhöhe in einen vorgeschriebenen Bereich fällt.
25. Vorrichtung nach Anspruch 24, dadurch gekennzeichnet, daß das Auswahlmittel (24) das zugehörige Bildaufnahmemittel auswählt und das Bild in das ausgewählte Bildaufnahmemittel eingibt, wenn das Pegelsignal größer als der vorgeschriebene Schwellwert ist, ein Schwerpunkt der Autokorrelationswerte gemäß jeweiliger vom Periodenfeststellmittel festgestellter Perioden in eine Zeitdauer T in einen vorgeschriebenen Schwerpunktbereich fällt und ein Autokorrelationswert gemäß dem Schwerpunkt größer als ein vorgeschriebener Schwellwert ist.
26. Vorrichtung nach Anspruch 17,
gekennzeichnet durch
Pegelfeststellmittel (140) zum Feststellen des Pegels vom vom Eingabemittel eingegebenen Audiosignal und Erzeugen eines Pegelsignals; und
Audiosteuer-Ausgabemittel (200) zum Ausgeben eines Tones gemäß dem vom Eingabemittel eingegebenen Audiosignal, wenn das Pegelsignal größer als ein vorgeschriebener Schwellwert ist und die vom Tonhöhenfeststellmittel festgestellt Tonhöhe in einen vorgeschriebenen Bereich fällt.
27. Vorrichtung nach Anspruch 26, dadurch gekennzeichnet, daß das Audiosteuer-Ausgabemittel (200) einen Ton gemäß dem vom Eingangsmittel eingegebenen Audiosignal ausgibt, wenn der Signalpegel größer als der vorgeschriebene Schwellwert ist, ein Schwerpunkt von Autokorrelationswerten gemäß jeweiliger vom Periodenfeststellmittel festgestellter Perioden in eine Zeitdauer T innerhalb eines vorgeschriebenen Schwerpunktbereichs fällt und ein Autokorrelationswert gemäß dem Schwerpunkt größer als ein vorgeschriebener Schwellwert ist.
28. Vorrichtung nach Anspruch 24 oder 26,
dadurch gekennzeichnet, daß
das Tonhöhenfeststellmittel ausgestattet ist mit:
einem Mittel zum Partitionieren des vom Eingabemittel eingegebenen Audiosignals in Audiosignale jeweils von einer Zeitdauer T;
einem Mittel zum weiteren Partitionieren eines jeden der partitionierten Audiosignale in Audiosignale einer jeweiligen Zeitdauer τ; und
Blockperioden-Feststellmittel zum Feststellen einer Periodizität der Audiosignale der Zeitdauer τ.
29. Vorrichtung nach Anspruch 28, dadurch gekennzeichnet, daß das Blockperioden-Feststellmittel eine Autokorrelationsfunktion gemäß den Audiosignalen der Zeitdauer T errechnet und eine Periode gemäß einem maximalen Autokorrelationswert auswählt, der größer ist als der Schwellwert, aus Autokorrelationswerten der Autokorrelationsfunktion.
30. Vorrichtung nach Anspruch 28,
dadurch gekennzeichnet, daß
das Blockperioden-Feststellmittel ausgestattet ist mit:
einem Mittel zum Erzeugen einer linearen Prädiktionsgleichung, die der Annäherung des Audiosignals von der Zeitdauer T dient, basierend auf dem Audiosignal der Zeitdauer τ;
einem Mittel zum Errechnen einer Autokorrelationsfunktion bezüglich eines Restsignals zwischen dem Audiosignal von der Zeitdauer T und einem vorhergesagten Audiosignal basierend auf der linearen Prädiktionsgleichung; und
einem Mittel zum Auswählen einer Periode gemäß einem maximalen Autokorrelationswert, der größer als der Schwellwert ist, aus Korrelationswerten der Autokorrelationsfunktion.
31. Vorrichtung nach Anspruch 25 oder 27, dadurch gekennzeichnet, daß der vorgeschriebene Schwerpunktsbereich ungefähr drei bis fünf msec dauert.
32. Vorrichtung nach Anspruch 17,
dadurch gekennzeichnet, daß
das Eingabemittel eingerichtet ist zur Eingabe des Audiosignals aus jedem der Vielzahl von Audioeingabemitteln;
Pegelfeststellmittel (140) vorgesehen sind zum Feststellen des Pegels eines jeden vom Eingabemittel eingegebenen Audiosignals und Erzeugen eines Pegelsignals gemäß einem jeden Audiosignal;
Spracherzeugungs-Anforderungssignal-Erzeugungsmittel vorgesehen sind zum Erzeugen eines Spracherzeugungs- Anforderungssignal gemäß einem jeden Audiosignal, wenn jedes Pegelsignal größer als ein vorgeschriebener Schwellwert ist und die Tonhöhe eines jeden vom Tonhöhenfeststellmittel festgestellten Audiosignals einer vorgeschriebenen Tonhöhe ungefähr gleicht;
Synthetisiermittel vorgesehen sind zum Synthetisieren eines jeden Audiosignals gemäß einem jeden vom Spracherzeugungs- Anforderungssignal-Erzeugungsmittel erzeugten Spracherzeugungs- Anforderungssignal; und daß
Audioausgabemittel vorgesehen sind zum Ausgeben eines Tones gemäß dem vom Synthetisiermittel synthetisierten Audiosignal.
DE69427621T 1993-08-25 1994-08-24 Verfahren und Vorrichtung zur Audiosignalverarbeitung Expired - Fee Related DE69427621T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP5232287A JPH0764578A (ja) 1993-08-25 1993-08-25 信号処理装置
JP6131529A JPH07334192A (ja) 1994-06-14 1994-06-14 オーディオ信号処理装置及び音声判別回路

Publications (2)

Publication Number Publication Date
DE69427621D1 DE69427621D1 (de) 2001-08-09
DE69427621T2 true DE69427621T2 (de) 2002-05-08

Family

ID=26466348

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69427621T Expired - Fee Related DE69427621T2 (de) 1993-08-25 1994-08-24 Verfahren und Vorrichtung zur Audiosignalverarbeitung

Country Status (3)

Country Link
US (1) US5764779A (de)
EP (1) EP0640953B1 (de)
DE (1) DE69427621T2 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6505057B1 (en) * 1998-01-23 2003-01-07 Digisonix Llc Integrated vehicle voice enhancement system and hands-free cellular telephone system
US6453284B1 (en) 1999-07-26 2002-09-17 Texas Tech University Health Sciences Center Multiple voice tracking system and method
US7058190B1 (en) * 2000-05-22 2006-06-06 Harman Becker Automotive Systems-Wavemakers, Inc. Acoustic signal enhancement system
US7130705B2 (en) * 2001-01-08 2006-10-31 International Business Machines Corporation System and method for microphone gain adjust based on speaker orientation
US20040201681A1 (en) * 2001-06-21 2004-10-14 Jack Chen Multimedia data file producer combining image and sound information together in data file
US20060013415A1 (en) * 2004-07-15 2006-01-19 Winchester Charles E Voice activation and transmission system
EP1691348A1 (de) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametrische kombinierte Kodierung von Audio-Quellen
JP4311402B2 (ja) * 2005-12-21 2009-08-12 ヤマハ株式会社 拡声システム
KR100724736B1 (ko) * 2006-01-26 2007-06-04 삼성전자주식회사 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치
US8265341B2 (en) * 2010-01-25 2012-09-11 Microsoft Corporation Voice-body identity correlation
US9208772B2 (en) * 2011-12-23 2015-12-08 Bose Corporation Communications headset speech-based gain control
CN106033673B (zh) * 2015-03-09 2019-09-17 电信科学技术研究院 一种近端语音信号检测方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4164626A (en) * 1978-05-05 1979-08-14 Motorola, Inc. Pitch detector and method thereof
US4449189A (en) * 1981-11-20 1984-05-15 Siemens Corporation Personal access control system using speech and face recognition
EP0092611B1 (de) * 1982-04-27 1987-07-08 Koninklijke Philips Electronics N.V. Sprachanalysesystem
US4912764A (en) * 1985-08-28 1990-03-27 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder with different excitation types
DE3734447C1 (de) * 1987-10-12 1989-05-18 Telefonbau & Normalzeit Gmbh Konferenz-Freisprecheinrichtung
US5099455A (en) * 1990-07-02 1992-03-24 Parra Jorge M Passive acoustic aquatic animal finder apparatus and method
US5319715A (en) * 1991-05-30 1994-06-07 Fujitsu Ten Limited Noise sound controller

Also Published As

Publication number Publication date
DE69427621D1 (de) 2001-08-09
US5764779A (en) 1998-06-09
EP0640953B1 (de) 2001-07-04
EP0640953A1 (de) 1995-03-01

Similar Documents

Publication Publication Date Title
DE69427621T2 (de) Verfahren und Vorrichtung zur Audiosignalverarbeitung
DE4226420C2 (de) Steuerschaltkreis zur komprimierten Aufzeichnung und Wiedergabe einer Vielzahl von Viedosignalen
DE68905930T2 (de) Automatische irisblenden- und gamma-korrektur-einrichtung in abhaengigkeit von einem videosignal.
DE10002321C2 (de) Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung
DE69519361T2 (de) Elektronischer Bildstabilisator und damit versehene Kamera
DE3687247T2 (de) Diversity-funkempfaenger.
DE4029698A1 (de) Sprachgesteuertes fernbedienungssystem
DE68919094T2 (de) Schaltungen zur Rauschverminderung.
DE19825789A1 (de) Verfahren und Vorrichtung zur automatischen Kompensierung der Tonlautstärke
DE2749986A1 (de) Verfahren zur adaptiven filterung von tonfrequenzsignalen sowie adaptives filtersystem zur durchfuehrung des verfahrens
DE69226559T2 (de) Bildverarbeitung
DE4015048C2 (de)
DE4403723A1 (de) Mikrophon für eine Videokamera
DE3807751A1 (de) Rauschverringerungsschaltung fuer videosignal mit halbbildspeicher
DE69618266T2 (de) Bildaufnahme-Anlage und Bildwiedergabe-Anlage
DE69124195T2 (de) Gerät zur Stereo-Mono-Detektierung mit Differential- und Summenkomponentendetektierung
EP3598778A1 (de) Verfahren zum betrieb eines hörgeräts sowie hörgerät zur detektion der eigenstimme anhand eines individuellen schwellwerts
DE3019424A1 (de) Verstaerkungsregelschaltung fuer ein rauschverminderungssystem (b)
DE4240215B4 (de) Automatisches Bildqualitätsausgleichsverfahren und Vorrichtung dazu
DE69031608T2 (de) Verfahren und Vorrichtung zur Einstellung und Stabilisierung einer Irisblendeneinstellung in einer Videokamera mittels zweier aufeinanderfolgender Regelschleifen
DE3330882A1 (de) Kompressions-/dehnungsvorrichtung
DE19825779A1 (de) Verfahren und Vorrichtung zur automatischen Kompensierung der Klangfarbe
DE69319840T2 (de) Rauschverminderung für Videosignale
DE4202829C2 (de)
DE69221073T2 (de) Anordnung zur Reduktion der Störungen in Videosignalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee