DE3888631T2 - System zur Unterscheiden zwischen Audio- und Nicht-Audio-Signalen. - Google Patents

System zur Unterscheiden zwischen Audio- und Nicht-Audio-Signalen.

Info

Publication number
DE3888631T2
DE3888631T2 DE3888631T DE3888631T DE3888631T2 DE 3888631 T2 DE3888631 T2 DE 3888631T2 DE 3888631 T DE3888631 T DE 3888631T DE 3888631 T DE3888631 T DE 3888631T DE 3888631 T2 DE3888631 T2 DE 3888631T2
Authority
DE
Germany
Prior art keywords
signal
level
speech
audio signal
input audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE3888631T
Other languages
English (en)
Other versions
DE3888631D1 (de
Inventor
Yoshitomo C O Patents D Nakano
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Application granted granted Critical
Publication of DE3888631D1 publication Critical patent/DE3888631D1/de
Publication of DE3888631T2 publication Critical patent/DE3888631T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf Schaltungen zur Unterscheidung zwischen Audio- und Nichtaudiosignalen. Solche Schaltungen können beispielsweise bei einer Aufnahme-/Wiedergabevorrichtung verwendet werden, die sprachgesteuert ist.
  • Bei einer Aufzeichnungs-/Wiedergabevorrichtung, bei der ein Magnetband, ein Halbleiterspeicher, eine Magnetplatte oder dgl. als Aufzeichnungsmedium verwendet wird, ist es bekannt, mit dem verfügbaren Platz auf dem Speichermedium sparsam umzugehen, wobei man automatisch einen Aufzeichnungsmodus nur dann einstellt, um Sprachsignale auf zuzeichnen, wenn eine Person gerade spricht. Diese Recorder sind als sprachgesteuerte, sprachbetätigte oder sprachbetriebene Recorder bekannt und Anwendungen für eine solche Aufzeichnungs- /Wiedergabevorrichtung sknd automatische Telefonanrufbeantworter, Speicher, Aufzeichnungsmaschinen und dgl. Bei einer Vorrichtung, die sprachgesteuert sein soll, kann eine Schaltung zur Unterscheidung zwischen Audio- und Nichtaudiosignalen, d.h., eine Schaltung, die das Vorhandensein/Nichtvorhandensein eines eingehenden Sprachsignals beurteilt, verwendet werden.
  • Eine vor kurzem vorgeschlagene Audio- /Nichtaudiosignalbeurteilungsschaltung vergleicht den Pegel eines eingehenden Sprachsignals mit einem vorgegebenen Schwellpegel, bestimmt, daß das Sprachsignal ein Nichtaudiosignal ist, wenn der Pegel des Sprachsignals kleiner als der Schwellpegel ist, und bestimmt, daß es ein Audiosignal ist, wenn es den Schwellpegel übersteigt. Der Schwellpegel zum Unterscheiden zwischen Audio- und Nichtaudiosignalen liegt bei einem vorgegebenen Wert fest. Wenn daher eine große ständige Geräuschstörung vorhanden ist, wie ein unübliches Umgebungsgeräusch, das von einem Mikrophon oder Telefon oder einer Telefonleitung aufgenommen wird, dann übersteigt sogar, wenn der Benutzer nicht spricht, der Geräuschpegel den vorgegebenen Schwellpegel, und es wird das Vorhandensein eines Audio(sprach)signals irrtümlicherweise ermittelt. Als Folge davon wird die Aufzeichnungs-/Wiedergabevorrichtung unerwünschterweise in den Aufzeichnungsstatus versetzt und dieses Störungsgeräusch wird fälschlicherweise aufgezeichnet, wodurch die nutzbare Menge des Aufzeichnungsmediums vermindert wird und eine der ursprünglichen Aufgaben des sprachbetriebenen Recorders verfehlt wird.
  • Das Problem kann bei automatischen Telefonanrufbeantwortern besonders lästig sein, bei denen die Telefonleitung unterbrochen wird, wenn ein Nichtaudiosignal ermittelt wird d.h. das Nichtvorhandensein einer Sprache nach der Beendigung einer Nachricht von einem Anrufer. Wenn ein Ermittlungsfehler durch ein Geräusch verursacht wird, bleibt die Telefonleitung gleichstrommäßig verbunden, sogar dann, wenn die Nachricht beendet ist. Aus diesem Grund kann zusätzlich zur Verschwendung verfügbaren Raums auf dem Aufzeichnungsmedium der automatischen Telefonanrufbeantworter sich nicht auf den nächsten eingehenden Ruf vorbereiten, da die Telefonleitung unkorrekterweise geschaltet bleibt.
  • Bei einem Sprachbetriebsaufzeichnungsmodus (VOR) einer Diktier- oder Aufzeichnungsmaschine kann der Aufzeichnungsstatus durch eine große Geräuschstörung automatisch gestartet werden, und der Aufzeichnungsstatus hält dann nicht notwendigerweise an. Als Folge davon ist es nicht möglich, ein aktuelles eingehendes Sprachsignal aufzuzeichnen, da das Aufzeichnungsmedium aufgebraucht wurde.
  • Die US-PS 3 832 491 offenbart einen Sprachschalter, bei dem abgetastete Eingangsaudiosignalwerte mit einem Schwellwert verglichen werden, um den prozentualen Zeitanteil zu ermitteln, während der der Schwellwert überschritten wird Ein Wert von ungefähr 35% ist für die Sprache charakteristisch. Der Schwellwert wird eingestellt, um diesen Prozentsatz konstant zu halten, um so laute und leise Stimmen zu kompensieren. Das Vorkommnis von vier aufeinanderfolgenden Abtastwerten, die den Schwellwert übersteigen, wird dazu verwendet, um eine Sprache zu ermitteln.
  • Erfindungsgmäß ist eine Schaltung vorgesehen zum Unterscheiden zwischen Sprach- und Nichtsprachsignalen zum Bewerten eines Eingangsaudiosignals, ein Nichtsprachsignal zu sein, wenn ein Pegel des Eingangsaudiosignals kleiner ist als ein vorgegebener Pegel und zum Bewerten eines Eingangsaudiosignals, ein Sprachsignal zu sein, wenn der Pegel des Audiosignals höher als der vorgegebene Pegel ist, wobei die Schaltung aufweist:
  • einen Komparator zum Vergleichen des Pegels des Eingangsaudiosignals mit einem vorgegebenen Pegel; gekennzeichnet durch
  • Pegelwechselsteuerungsmittel zum Erhöhen oder Vermindern des Pegels des Eingangssprachsignals, das dem Komparator mit einer vorgegebenen Höhe gemäß dem Verhältnis der Nichtsprachzeitdauer des Eingangsaudiosignals zu einer Zeitdauer zugeführt wird, die einen Wert gleich einer vorgegebenen Konstante hat; und
  • einen variablen Leistungsverstärker und ein Bandpaßfilter, durch die nur Signale laufen, die eine Frequenz innerhalb eines Sprachbandes haben, die so angeschlossen sind, daß das Eingangsaudiosignal dadurch läuft, bevor es dem Komparator zugeführt wird, wobei die Pegelwechselsteuerungsmittel wirksam sind, den Pegel des Eingangsaudiosignals um eine vorgegebene Höhe durch Steuern der Verstärkung des variablen Leistungsverstärkers zu erhöhen oder zu senken.
  • Die Erfindung wird nun durch ein nicht beschränkendes Ausführungsbeispiel unter Bezugnahme auf die Zeichnungen beschrieben, in denen:
  • Fig. 1 eine schematische Darstellung eines Systems in Form eines Blockdiagramms ist, das die Erfindung verkörpert;
  • Fig. 2A bis 2C Zeitablaufdiagramme sind, um die Arbeitsweise der Ausführungsform nach Fig. 1 zu erklären; und
  • Fig. 3 ein Schaltungsdiagramm ist, das einen Teil des in Fig. 1 gezeigten Systems ausführlicher zeigt.
  • Bei der Ausführungsform von Fig. 1 wird die Erfindung für eine digitale Aufzeichnungs-/Wiedergabevorrichtung verwendet, wobei ein Halbleiterspeicher als Aufzeichnungsmedium verwendet wird. Fig. 1 zeigt ein System oder eine Vorrichtung, die einen Aufzeichnungs-/Wiedergabebereich 1 und einen Audio-/Nichtaudio-Signalbestimmungsschaltungsbereich 2 aufweist. Wenn der Aufzeichnungs-/Wiedergabebereich 1 im Aufzeichnungsmodus sich befindet, wird ein (analoges) Eingangssprachsignal SA1 von einem Mikrofon 3 durch einen Eingangsverstärker 4 auf einen Signalpegel angehoben und das verstärkte Signal wird zu einer digitalen Signalverarbeitungsschaltung 5 geliefert, wo es in ein digitales Signal konvertiert wird. Bei dieser Ausführungsform unterwirft die Schaltung 5 das Sprachsignal SA1 der bekannten adaptiven Deltamodulationsverarbeitung ADM) und konvertiert es in ein digitales Einbit-Sprachsignal SD. Das Signal SD wird dann in einem Speicher 6 aufzeichnet, der durch einen Halbleiterspeicher oder dgl. gebildet wird.
  • In Wiedergabemodus wird das Signal SD aus dem Speicher 6 ausgelesen und in das ursprüngliche analoge Signal SA1 durch die digitale Signalverarbeitungsschaltung 5 demoduliert. Das reproduzierte analoge Signal SA1 wird durch einen Ausgangsverstärker 7 verstärkt und zu einem Lautsprecher 8 geführt. Eine Systemsteuerung 9 steuert den Betrieb der Verarbeitungsschaltung 5 wie auch andere Schaltungen in dem System mit vorgegebenen Zeitsteuerungen in den Aufzeichnungs- und Wiedergabemodi.
  • Im Aufzeichnungsmodus wird das Ausgangssignal vom Eingangsverstärker 4 ebenfalls zum Audio- /Nichtaudiosignalbestimmungsschaltungsbereich 2 geliefert und dort einer Audio-/Nichtaudiosignalbestimmung unterwerfen, wie später beschrieben wird. Gemäß dieser Bestimmung wird nur dann, wenn das digitale Eingangssignal SD als Audiosignal bestimmt wird, die Dauer aufgrund der Steuerung der Systemsteuerung 9 in den Speicher 6 eingeschrieben.
  • Beim Betrieb des Audio- /Nichtaudiobeurteilungsschaltungsbereichs 2 wird, wenn eine Nichtaudiogesamtdauer wie durch einen vorgegebenen Audio- /Nichtaudiosignalschwellpegel bestimmt weniger als drei Sekunden ist, innerhalb eines ersten Intervalls von 30 s vom Beginn der Aufzeichnung, d.h. wenn die Summe der Sprachdauer eines Benutzers wie durch den Schwellpegel bestimmt und die Dauer des Geräusches lang ist, bestimmt, daß das, was im Augenblick aufgezeichnet wird, ein Geräusch ist, das eine lange Zeitdauer angehalten hat. Als Folge davon wird der Schwellpegel durch eine Stufe kräftig angehoben, um so die Empfindlichkeit gegenüber dem Geräusch zu vermindern, wodurch nur die Sprache vom Benutzer ermittelt wird. Es ist natürlich klar, daß die oben angegebenen Zeiten nur beispielhaft angegeben sind und daß viele andere Zeiten in vorteilhafter Weise verwendet werden können.
  • Wenn darüberhinaus die gesamte Nichtaudiosignaldauer, die durch den Schwellpegel bestimmt ist, der durch eine Stufe gerade angehoben wurde weniger als drei Sekunden innerhalb 30 s ist, die dem Intervall von 30 s nach dem Beginn der Aufzeichnung folgen, wird bestimmt, daß das unerwünschte Geräusch eine längere Zeitdauer angehalten hat. Als Folge davon wird der Schwellpegel durch eine andere Stufe angehoben, um weiter die Empfindlichkeit gegenüber einem Geräusch zu vermindern, wodurch nur die Sprache von Benutzer ermittelt wird. Danach bleibt der Schwellpegel unverändert.
  • Wenn darüberhinaus die gesamte Nichtaudiodauer weniger als drei Sekunden innerhalb eines Intervalls van 30 s vom Beginn der Aufzeichnung ist, aber drei Sekunden innerhalb eines Intervalls von 60 s vom Beginn der Aufzeichnung übersteigt, wird der Schwellpegel angehoben, denn das erste Intervall von 30 s vorüber ist, so daß nur die Sprache vom Benutzer ermittelt wird. Danach verbleibt der Schwellpegel unverändert.
  • Gemäß oben beschriebener Arbeitsweise wird, wenn die gesamte Nichtaudiodauer innerhalb einer vorgegebenen Zeitdauer kleiner als ein vorgegebener Wert ist (bei dieser Ausführungsform drei Sekunden), der Schwellpegel als Folge eine Bestimmung angehoben, daß ein großes Störgeräusch vorhanden ist. Daher kann nur die Sprache vom Benutzer ermittelt werden und ein irrtümlicher Betrieb und Verbrauch des verfügbaren Speichers aufgrund eines Geräusches kann damit vermieden werden.
  • Es wird nun der Audio- /Nichtaudiosignalbestimmungsschaltungsbereich 2 ausführlich unter Bezugnahme auf Fig. 1 beschrieben. Wenn der Aufzeichnungs-/Wiedergabebereich 1 in den Aufzeichnungsmodus versetzt wird, gibt die Systemsteuerung 9 ein Aufzeichnungsstartsignal ST aus und als Antwort auf das Signal ST werden die Speicherschaltungen 10, 11 und 12 gesetzt, während die Zähler 13 und 14 zurückgesetzt werden. Weiter gibt die Systemsteuerung 9 ein Taktsignal CK aus, das eine vorgegebene Frequenz hat, das zum Zähler 13 geliefert wird, um dort gezählt zu werden. Das Taktsignal CK wird ebenfalls zur Eingangsseite eines Schalters 15 geliefert. Anfangs wird die Verstärkung eines variablen Leistungsverstärkers 16, zu dem das Ausgangssignal vom Eingangsverstärker 4 geliefert wird, auf einen Maximalwert eingestellt.
  • Wenn die Aufzeichnung beginnt, wird das Ausgangssignal vom Eingangsverstärker 4 durch den variablen Leistungsverstärker 16 verstärkt, wobei sein maximaler Verstärkungsfaktor verwendet wird, und das verstärkte Signal wird durch ein Bandpaßfilter 17 geliefert, um ein Signal SA2 zu erzeugen, das nur Frequenzen im Sprachband aufweist. Der Pegel des Signals SA2 wird mit einem vorgegebenen Schwellpegel VS in einem Komparator 18 verglichen, so daß eine Audio- /Nichtaudiosignalbestimmung ausgeführt wird. Ein Signal SS, das das Ergebnis dieser Bestimmung darstellt, wird zur Systemsteuerung 9 geliefert und wird dazu verwendet, den Betrieb des Schalters 15 zu steuern.
  • Wenn das bestimmte Ergebnis, das durch das Signal SS angezeigt wird, ein "Nichtaudiosignal" ist, stoppt die Systemsteuerung 9 das Schreiben von Daten, die von der digitalen Signalverarbeitungsschaltung 5 erhalten werden, im Speicher 6. Gleichzeitig wird der Schalter 15 durch das Signal SS geschlossen und das Taktsignal CK von der Systemsteuerung 9 wird zum Zähler 14 über den Schalter 15 geffliefert. Danach mißt der Zähler 14 die gesamte Zeitdauer des Nichtaudiosignals. Bei dieser Ausführungsform ist die maximale Meßzeit im Zähler 14 auf drei Sekunden eingestellt.
  • Wenn der Zähler 13 Taktimpulse des Taktsignals CK 30 Sekunden lang vom Beginn der Aufzeichnung gezählt hat, gibt er ein 30 Sekunden langes Speichertriggersignal L1 zur Speicherschaltung 10 aus, und wenn der Zähler 13 Taktimpulse 60 Sekunden lang vom Beginn der Aufzeichnung gezählt hat, gibt er ein 60 Sekunden langes Speichertriggersignal L2 zur Speicherschaltung 11 aus. Man beachte, daß der Zähler 13 immer die Impulse des Taktsignals CK empfängt und zählt, während der Zähler 14 nur solche Taktimpulse während der Zeit zählt, wenn durch den Komparator 18 bestimmt wird, daß ein Nichtaudiosignal vorliegt.
  • Weiterhin speichert die Speicherschaltung 12 das Meßergebnis vom Zähler 14, d.h. die Anzeige, ob die gesamte Nichtaudiodauer vom Beginn der Aufzeichnung drei Sekunden erreicht hat oder nicht, und die Speicherschaltungen 10 und 11 speichern ein Ausgangssignal L0 oder von der Speicherschaltung 12. Bei dieser Ausführungsform gibt das Ausgangssignal L0 an, daß das Meßergebnis vom Zähler 14 kleiner als drei Sekunden ist, während das Ausgangssignal angibt, daß diese Messung drei Sekunden übersteigt. Die Ausgangssignale VC1 und VC2 von den Speicherschaltungen 10 und 11 sind jeweils Verstärkungssteuersignale zum Steuern des variablen Leistungsverstärkers 16.
  • Beispiele der Arbeitsweise des Systems von Fig. 1 sind in den Figuren 2A bis 2C gezeigt. Insbesondere wird in Fig. 2A, da das Meßergebnis der Nichtaudiodauer vom Zähler 14 nicht drei Sekunden in den ersten 30 Sekunden vom Beginn der Aufzeichnung beträgt das Signal L0 von der Speicherschaltung 12 ausgegeben und der Zähler 13 gibt das 30 Sekunden Speichertriggersignal L1 aus. Die Speicherschaltung 10 speichert das Ausgangssignal L0 vom Speicher 12 und sie gibt das entsprechende Signal VC1 an den variablen Leistungsverstärker 16 aus, um dessen Verstärkung um eine Stufe zu vermindern. Bei dieser Ausführungsform ist eine Stufe bei der Verminderung der Verstärkung bei ungefähr 3 dB eingestellt.
  • Da das gemessene Ergebnis der Dauer des Nichtaudiotons noch nicht drei Sekunden innerhalb der nächsten 30 Sekunden dauert, wird das Signal L0 noch einmal von der Speicherschaltung 12 ausgegeben. Dann gibt der Zähler 13 das 60 Sekunden Speichertriggersignal L2 an die Speicherschaltung 11 aus, und die Speicherschaltung 11 speichert das Ausgangssignal L0 und erzeugt das Signal VC2, das zum variablen Leistungsverstärker 16 geführt wird, wodurch die Verstärkung um eine weitere Stufe, vorzugsweise um 3 dB, vermindert wird.
  • Folglich wird, da die Verstärkung des variablen Leistungsverstärkers 16 in der oben beschriebenen Weise vermindert wird, der vorgegebene Schwellpegel des Komparators 18 kräftig in zwei Schritten erhöht.
  • Fig. 2B zeigt ein anderes Beispiel, bei dem, da die gemessene Gesamtzeit des Nichtaudiosignals nicht drei Sekunden innerhalb der ersten 30 Sekunden dauert, die dem Beginn der Aufzeichnung folgen, das Ausgangssignal L0 von der Speicherschaltung 12 ausgegeben wird. Als Folge davon wird das Signal VC1 durch die Spefcherschaltung 10 auf der Basis des 30 Sekunden Speichertriggersignals L1 erzeugt, und die Verstärkung des Leistungsverstärkers 16 wird um eine Stufe vermindert. Folglich wird der Schwellpegel des Komparators 18 um eine Stufe (3 dB) kräftig angehoben.
  • Da die gemessene Gesamtzeit der Nichtaudiosignale drei Sekunden innerhalb der nächsten folgenden 30 Sekunden übersteigt, wird das Ausgangssignal von der Speicherschaltung 12 ausgegeben. Die Speicherschaltung 11 speichert dann das Ausgangssignal L0 als Antwort aui das 60 Sekunden Speichertriggersignal L2 vom Zähler 13, d0-s Signal VC2 wird nicht erzeugt und die Verstärkung des variablen Leistungsverstärkers 16 bleibt unverändert. Das heißt, daß die Verstärkung nur um eine Stufe vermindert verbleibt. Daher verbleibt der Schwellpegel VS des Komparators 18 durch nur eine Stufe (3 dB) kräftig gesteigert.
  • Fig. 2C zeigt ein anderes Beispiel, bei dem, da die gemessene Gesamtdauer des Nichtaudiosignals drei Sekunden innerhalb der ersten 30 Sekunden übersteigt, das Ausgangssignal durch die Speicherschaltung 12 erzeugt wird. Da daher die Speicherschaltung 10 das Ausgangssignal L0 als Antwort auf das 30 Sekunden Speichertriggersignal L1 vom Zähler 13 speichert, wird das Signal VCl nicht erzeugt, und die Verstärkung des variablen Leistungsverstärkers 16 verbleibt unverändert bei ihrem ursprünglichen maximalen Pegel.
  • Da die Speicherschaltung 11 das Ausgangssignal als Antwort auf das 60 Sekunden Speichertriggersignal L2 vom Zähler 13 speichert, nachdem sogar die nächsten 30 Sekunden verstrichen sind, kann das Signal VC2 nicht erzeugt werden, und der variable Leistungsverstärker 16 fährt fort, die ursprüngliche Maximalverstärkung zu halten. Daher verbleibt der Schwellpegel VS des Komparators 18 im wesentlichen unverändert.
  • Fig. 3 zeigt eine Schaltungsanordnung des Audio- /Nichtaudiosignalbestimmungsschaltungsbereichs 2 von Fig. 1 im Detail. Die gleichen Bezugszeichen in Fig. 3 bezeichnen die gleichen Teile wie in Fig. 1. Nach Fig. 3 wird das Sprachsignal SA1, das im Eingangsverstärker 4 verstärkt wurde, der in Fig. 1 aber nicht in Fig. 3 gezeigt ist, zum Eingangsanschluß 19 geliefert. Die Anfangsverstärkung des Signals SA1 wird durch einen veränderlichen Widerstand 20 eingestellt, nachdem es durch den variablen Leistungsverstärker 16 und das Bandpaßfilter 17 gelaufen ist. Dann wird das Signal SA1 zum Komparator 18 geliefert und das resultierende Vergleichssignal SS, das durch den Komparator 18 erzeugt wurde, wird an einen Anschluß 21a ausgegeben und zu einem UND-Gatter geliefert, das den Schalter 15 von Fig. 1 bildet. Die verschiedenen in Fig. 3 gezeigten Anschlüsse 21a sind auf Gründen der schematischen Klarheit nicht verbunden gezeigt, man sollte jedoch verstehen, daß die Anschlüsse 21a elektrisch am selben Punkt miteinander verbunden sind.
  • Weiterhin wird das Aufzeichnungsgbeginnsignal ST von der Systemsteuerung 9 wie in Fig. 1 gezeigt zu einem Eingangsanschluß 22 geliefert. Als Antwort auf das Signal ST wird der Zähler 14 zurückgesetzt und die Speicherschaltungen 10, 11 und 12 werden in vorgegebene Zustände eingestellt. (Die Speicherschaltungen 10, 11 und 12 werden durch Flip- Flops vom D-Typ bei dieser Ausführungsfort gebildet). Die Ausgangssignale L0 und von der Speicherschaltung 12 werden jeweils durch die Speicherschaltungen 10 und 11 gespeichert. Die Ausgangssignale VC1 und VC2 von der Speicherschaltung 10 werden jeweils zu den Basisanschlussen der Transistoren 23 und 24 geliefert, um die Verstärkung des variablen Leistungsverstärkers 16 zu steuern.
  • Die oben beschriebene Verarbeitung kann auch durch einen Mikrocomputer ausgeführt werden, und Elemente wie die Zähler und die Speicherschaltung können im Mikrocomputer integriert sein.
  • Die Erfindung kann nicht nur bei einer digitalen Aufzeichnungs-/Wiedergabevorrichtung angewandt werden, sondern auch bei einer Aufzeichnungs-/Wiedergabevorrichtung, bei der Magnetbänder, Magnetplatten und dgl. verwendet werden.
  • Bei der bevorzugten Ausführungsform der Erfindung ist eine Sprach-/Nichtsprachsignalerkennungsschaltung vorgesehen, bei der ein Sprach-/Nichtsprachsignalschwellpegel gemäß dem Verhältnis der Dauer eines Nichtspracheingangssignals zu einer vorgegebenen Zeit geändert wurde. Wenn die totale Nichtsprachdauer innerhalb einer vorgegebenen Zeit als kurz ermittelt wird, wird bestimmt, daß ein langes und ständiges Geräusch, das den existierenden Beurteilungspegel überstiegt, vorhanden ist, und der Sprach-/Nichtsprachsignalschwellwert oder Beurteilungspegel wird angehoben, während dagegen, wenn die totale Nichtsprachdauer lang ist, bestimmt wird, daß eine ständige Geräuschstörung nicht vorhanden ist und der Schwellpegel wird beibehalten, wodurch genau zwischen Sprach- und Nichtsprachsignalen ungeachtet des Vorhandenseins eines Geräusches unterschieden wird.

Claims (5)

1. Schaltung zum Unterscheiden zwischen Sprach- und Nichtsprachsignalen zum Bewerten eines Eingangsaudiosignals, ein Nichtsprachsignal zu sein, wenn ein Pegel des Eingangsaudiosignals kleiner ist als ein vorgegebener Pegel und zum Bewerten eines Eingangsaudiosignals, ein Sprachsignal zu sein, wenn der Pegel des Audiosignals höher als der vorgegebene Pegel ist, wobei die Schaltung (2) aufweist:
einen Komparator (18) zum Vergleichen des Pegels des Eingangsaudiosignals mit einem vorgegebenen Pegel; gekennzeichnet durch
Pegelwechselsteuerungsmittel (10 bis 14) zum Erhöhen oder Vermindern des Pegels des Eingangssprachsignals, das dem Komparator (18) mit einer vorgegebenen Höhe gemäß dem Verhältnis der Nichtsprachzeitdauer des Eingangsaudiosignals zu einer Zeitdauer zugeführt wird, die einen Wert gleich einer vorgegebenen Konstante hat; und
einen variablen Leistungsverstärker (16) und ein Bandpaßfilter (17), durch die nur Signale laufen, die eine Frequenz innerhalb eines Sprachbandes haben, die so angeschlossen sind, daß das Eingangsaudiosignal dadurch läuft, bevor es dem Komparator (18) zugeführt wird, wobei die Pegelwechselsteuerungsmittel (10 bis 14) wirksam sind, den Pegel des Eingangsaudiosignals um eine vorgegebene Höhe durch Steuern der Verstärkung des variablen Leistungsverstärkers (16) zu erhöhen oder zu senken.
2. Schaltung nach Anspruch 1, wobei die Pegelwechselsteuerungsmittel (10 bis 14) aufweisen:
erste Zählermittel (14) zum Zählen einer totalen Nichtsprachzeitdauer und Bilden eines Ausgangssignals gemäß einem Ausgangssignal vom Komparator (18);
zweite Zählerinittel (13) zum Zählen der Zeit des Eingangsaudiosignals und Bilden eines Ausgangssignals, wenn eine
Zeitdauer, die einen Wert gleich einer vorgegebenen Konstante hat, verstrichen ist; und
Steuersignalerzeugungsmittel (10, 11, 12) zum Ausgeben eines Steuersignals zum Wechseln des Pegels des Eingangssprachsignals, das dem Komparator (18) in einer vorgegebenen Höhe als Antwort auf die Ausgangssignale von den ersten und zweiten Zählermitteln (13, 14) zugeführt wird.
3. Schaltung nach Anspruch 2, wobei die Steuersignalerzeugungsmittel (10, 11, 12) aufweisen:
erste Speichermittel (12) zum Speichern des Ausgangssignals von den ersten Zählermitteln (14) und Ausgeben des gespeicherten Ausgangssignals in Abhängigkeit davon, ob die totale Nichtsprachdauer die Zeitdauer übersteigt, die einen Wert gleich einer vorgegebenen Konstante aufweist; und
zweite Speichermlttel (10, 11) zum Speichern des Ausgangssignals von den zweiten Zählermitteln (13) und Ausgeben eines Steuersignals zum Ändern des Pegels des Eingangssprachsignals, das dem Komparator (18) in einer vorgegebenen Höhe als Antwort auf das Ausgangssignal von dem ersten Speichermitteln (12) zugeführt wird.
4. Schaltung nach Anspruch 3, wobei die zweiten Speichermittel (10, 11) eine Vielzahl von Speicherschaltungen (10, 11) zum jeweiligen Speichern einer Vielzahl von Ausgangssignalen von den zweiten Zählermitteln (13) aufweisen.
5. Schaltung nach Anspruch 2, wobei eine Vielzahl von Zeitdauern eingestellt werden, von denen jede einen Wert gleich der vorgegebenen Konstante aufweist, und wobei die zweiten Zählermittel (13) die Eingangszeit des Eingangsaudiosignals zählen, und um ein Ausgangssignal zu erzeugen, wenn jede Zeitdauer, die einen Wert gleich der vorgegebenen Konstante hat, verstrichen ist.
DE3888631T 1987-11-13 1988-11-08 System zur Unterscheiden zwischen Audio- und Nicht-Audio-Signalen. Expired - Fee Related DE3888631T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62286764A JP2551050B2 (ja) 1987-11-13 1987-11-13 有音無音判定回路

Publications (2)

Publication Number Publication Date
DE3888631D1 DE3888631D1 (de) 1994-04-28
DE3888631T2 true DE3888631T2 (de) 1994-07-07

Family

ID=17708743

Family Applications (1)

Application Number Title Priority Date Filing Date
DE3888631T Expired - Fee Related DE3888631T2 (de) 1987-11-13 1988-11-08 System zur Unterscheiden zwischen Audio- und Nicht-Audio-Signalen.

Country Status (6)

Country Link
US (1) US4926484A (de)
EP (1) EP0317157B1 (de)
JP (1) JP2551050B2 (de)
KR (1) KR970002751B1 (de)
CA (1) CA1326076C (de)
DE (1) DE3888631T2 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19629184C2 (de) * 1995-07-19 2001-05-17 Olympus Optical Co Sprachgesteuerte Aufzeichnungsvorrichtung

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2945692B2 (ja) * 1988-05-27 1999-09-06 コダック・リミテッド 注釈可能なイメージを処理するデータ処理システム
US5226090A (en) * 1989-12-29 1993-07-06 Pioneer Electronic Corporation Voice-operated remote control system
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
US5134658A (en) * 1990-09-27 1992-07-28 Advanced Micro Devices, Inc. Apparatus for discriminating information signals from noise signals in a communication signal
US5220287A (en) * 1991-02-19 1993-06-15 Audion Pty. Ltd. Voice processing apparatus
JPH0772961B2 (ja) * 1992-03-31 1995-08-02 日本コロムビア株式会社 曲間検出装置
US5278944A (en) * 1992-07-15 1994-01-11 Kokusai Electric Co., Ltd. Speech coding circuit
US5323337A (en) * 1992-08-04 1994-06-21 Loral Aerospace Corp. Signal detector employing mean energy and variance of energy content comparison for noise detection
WO1994028638A1 (en) * 1993-05-24 1994-12-08 Motorola, Inc. Method for improving stored voice message quality
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
JPH07225593A (ja) * 1994-02-10 1995-08-22 Fuji Xerox Co Ltd 音処理装置
US5617478A (en) * 1994-04-11 1997-04-01 Matsushita Electric Industrial Co., Ltd. Sound reproduction system and a sound reproduction method
US5867581A (en) * 1994-10-14 1999-02-02 Matsushita Electric Industrial Co., Ltd. Hearing aid
US5609508A (en) * 1995-10-23 1997-03-11 Sony Corporation Toy telephone with visual display for recorded messages
US5903868A (en) * 1995-11-22 1999-05-11 Yuen; Henry C. Audio recorder with retroactive storage
US5724410A (en) * 1995-12-18 1998-03-03 Sony Corporation Two-way voice messaging terminal having a speech to text converter
US5784436A (en) * 1996-06-19 1998-07-21 Rosen; Howard B. Automatic telephone recorder system incorporating a personal computer having a sound handling feature
KR19990000365A (ko) * 1997-06-05 1999-01-15 윤종용 자동응답기에서 음성메세지 녹음방법
US6496206B1 (en) 1998-06-29 2002-12-17 Scansoft, Inc. Displaying thumbnail images of document pages in an electronic folder
WO2001024041A1 (en) * 1999-09-30 2001-04-05 Dictaphone Corporation Automatic selection of recording mode in portable digital audio recorder
JP4348970B2 (ja) * 2003-03-06 2009-10-21 ソニー株式会社 情報検出装置及び方法、並びにプログラム
US20040264938A1 (en) * 2003-06-27 2004-12-30 Felder Matthew D. Audio event detection recording apparatus and method
US9263059B2 (en) * 2012-09-28 2016-02-16 International Business Machines Corporation Deep tagging background noises

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3832491A (en) * 1973-02-13 1974-08-27 Communications Satellite Corp Digital voice switch with an adaptive digitally-controlled threshold
US4008375A (en) * 1975-08-21 1977-02-15 Communications Satellite Corporation (Comsat) Digital voice switch for single or multiple channel applications
FR2502370A1 (fr) * 1981-03-18 1982-09-24 Trt Telecom Radio Electr Dispositif de reduction du bruit dans un signal de parole mele de bruit
US4449190A (en) * 1982-01-27 1984-05-15 Bell Telephone Laboratories, Incorporated Silence editing speech processor
DE3236000A1 (de) * 1982-09-29 1984-03-29 Blaupunkt-Werke Gmbh, 3200 Hildesheim Verfahren zum klassifizieren von audiosignalen
JPS59139099A (ja) * 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
US4700392A (en) * 1983-08-26 1987-10-13 Nec Corporation Speech signal detector having adaptive threshold values

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19629184C2 (de) * 1995-07-19 2001-05-17 Olympus Optical Co Sprachgesteuerte Aufzeichnungsvorrichtung

Also Published As

Publication number Publication date
JP2551050B2 (ja) 1996-11-06
EP0317157B1 (de) 1994-03-23
KR970002751B1 (ko) 1997-03-10
CA1326076C (en) 1994-01-11
US4926484A (en) 1990-05-15
DE3888631D1 (de) 1994-04-28
KR890009140A (ko) 1989-07-15
EP0317157A1 (de) 1989-05-24
JPH01128250A (ja) 1989-05-19

Similar Documents

Publication Publication Date Title
DE3888631T2 (de) System zur Unterscheiden zwischen Audio- und Nicht-Audio-Signalen.
DE3309467C2 (de)
DE4126902C2 (de) Sprachintervall - Feststelleinheit
DE19629184C2 (de) Sprachgesteuerte Aufzeichnungsvorrichtung
DE3534064C2 (de)
DE69729150T2 (de) Gerät mit Urheberrechtsinformation
DE3889331T2 (de) Vorrichtung zur Steuerung von Musiktönen gemäss einem Eingangswellenformsignal.
DE4029697A1 (de) Sprachgesteuertes fernbedienungssystem
DE2443253A1 (de) System zur ueberwachung von ueber eine fernsprechleitung gewaehlten nummern
DE3943353A1 (de) Pausesteuerung fuer eine aufzeichnungs/wiedergabevorrichtung
DE3782959T2 (de) Erzeuger von niederfrequenten toenen.
DE2610159A1 (de) Datenlesegeraet
EP0110483B1 (de) System zum Aufzeichnen und/oder Auswerten von zwei Markiersignalen
DE3430850A1 (de) Wiedergabegeraet fuer in einem speicher vorgespeicherte signale
DE130613T1 (de) Schaltung zur rauschverminderung.
EP0591842B1 (de) Verschleierung von Bitfehlern und Interpolationen in Digitaltonsignalen
DE3200150C2 (de) Einrichtung zur selbsttätigen Positionierung eines Magnetbandes auf den Anfang des nächstliegenden, für eine bestimmte Betriebsart in Frage kommenden Bandabschnittes
DD289172A5 (de) Anordnung zur verarbeitung von inforemationen sowie mit dieser anordnung erhaltener aufzeichnungstraeger
DE3346792C2 (de) Anrufbeantworter zum Anschluß an eine Fernsprechleitung
DE3019818A1 (de) Einrichtung zum erfassen eines zwischenraums zwischen benachbarten, auf einem aufzeichnungstraeger aufgezeichneten datenbloecken
DE3346745A1 (de) Geraet zum wiedergeben eines aufgezeichneten digitalen unipolaren signals
DE2921784A1 (de) Verfahren zur automatischen einstellung des vormagnetisierungsstromes bei der tonaufzeichnung mittels eines tonbandgeraetes mit 3 tonkoepfen und schaltungsanordnung zur durchfuehrung dieses verfahrens
DE69028393T2 (de) Verfahren und gerät zur diskriminierung eines datensignals
DE69923911T2 (de) Vorrichtung zur Übertragung und Wiedergabe eines digitalen Audiosignales
DE3734446C2 (de)

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee