DE3510660C2 - - Google Patents

Info

Publication number
DE3510660C2
DE3510660C2 DE3510660A DE3510660A DE3510660C2 DE 3510660 C2 DE3510660 C2 DE 3510660C2 DE 3510660 A DE3510660 A DE 3510660A DE 3510660 A DE3510660 A DE 3510660A DE 3510660 C2 DE3510660 C2 DE 3510660C2
Authority
DE
Germany
Prior art keywords
frequency
signal
changing component
output
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE3510660A
Other languages
English (en)
Other versions
DE3510660A1 (de
Inventor
Tomofumi Yokohama Kanagawa Jp Nakatani
Shogo Matsudo Chiba Jp Nakamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP59057161A external-priority patent/JPS60200177A/ja
Priority claimed from JP5908484A external-priority patent/JPS60203013A/ja
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of DE3510660A1 publication Critical patent/DE3510660A1/de
Application granted granted Critical
Publication of DE3510660C2 publication Critical patent/DE3510660C2/de
Granted legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/06Non-recursive filters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Complex Calculations (AREA)

Description

Die Erfindung betrifft ein Verfahren zum Verarbeiten eines Sprachsignals nach dem Oberbegriff des Anspruchs 1 sowie eine Einrichtung zur Durchführung dieses Verfahrens nach dem Oberbegriff des Anspruchs 5.
Ein derartiges Verfahren zum Verarbeiten eines Sprachsignals ist aus der DE-AS 25 36 640 bekannt. Auch bei diesem bekannten Verfahren wird ein Sprachsignal verarbeitet, welches sich über einen gewissen Frequenzbereich erstreckt und sowohl eine sich verhältnismäßig langsam ändernde Komponente als auch eine sich verhältnismäßig schnell ändernde Komponente aufweisen kann, was vom jeweiligen Sprachsignal abhängig ist. Gemäß diesem bekannten Verfahren wird das Spachsignal wiederholt von dem einen zu dem anderen Ende des Frequenzbereichs des Sprachsignals in einem vorbestimmten Zeitintervall abgefragt, um dadurch eine periodische Wellenform zu bilden, deren Periode zweimal der Frequenzbereich des zu verarbeitenden Sprachsignals ist. Die Einrichtung zur Durchführung dieses bekannten Verfahrens enthält einen Frequenzanalysator bzw. eine Filterbank, um das eingegebene Signal in eine Anzahl aneinander grenzender Frequenzbereiche oder spektraler Komponenten zu zerlegen.
Im folgenden wird anhand von Fig. 1 ein herkömmliches Verfahren nach der näher erläutert.
Ein in Fig. 1 dargestelltes Signal A weist eine Häufigkeitsverteilungskurve für ein Sprachsignal auf und, wie dargestellt, hat die Kurve A einen sich verhältnismäßig langsam ändernden (Schwingungs-)Anteil, in welchem deren Ausgangspegel abnimmt, wenn die Frequenz ansteigt, und auch einen sich verhältnismäßig schnell ändernden (Schwingungs-) Bereich, welcher durch drei örtliche Maxima B₁ bis B₃ angezeigt ist, welche eine phonetische Information darstellen. Bei einem Verfahren zur Erkennung eines Sprachsignals wird die phonetische Information B₁ bis B₃ aus dem Sprachsignal A extrahiert, das zur Erkennung des Sprachsignals verwendet wird. Wenn jedoch phonetische Informationen aus einem Sprachsignal extrahiert wird, kommt es in diesem Fall zu einer Verschlechterung der hochfrequenten Komponenten, was von der Klangerzeugungscharakteristik einer Klang- oder Schallquelle abhängt.
Um das Gewinnen bzw. Extrahieren von phonetischer Information durchzuführen, während gleichzeitig eine hohe Genauigkeit bis zu höheren Frequenzen erhalten bleibt, ist vorgeschlagen worden, eine Korrekturhilfe einer annähernd geraden Linie durchzuführen, welche mittels der Methode des kleinsten Quadrats erhalten worden ist. Gemäß diesem vorgeschlagenen Verfahren wird die spektrale Sprachverteilung X i , wobei i die Kanalzahl ist, durch eine Gerade angenähert, welche durch y = ai + b festgelegt ist, wobei X i - (ai + b) als ein neuer Kennlinienparameter der neuen spektralen Sprachverteilung festgelegt ist. In diesem Fall sind a und b festgesetzt durch:
Jedoch ist die Berechnung von a und b ziemlich kompliziert, zeitaufwendig und teuer.
Die der Erfindung zugrunde liegende Aufgabe besteht darin, ein Verfahren zum Verarbeiten eines Sprachsignals der angegebenen Gattung und eine Einrichtung zur Durchführung dieses Verfahrens zu schaffen, durch welches bzw. durch die aus dem Sprachsignal ohne eine Verzerrung des verarbeiteten Signals eine bestimmte sich verhältnismäßig schnell ändernde Komponente gewonnen werden kann.
Diese Aufgabe wird erfindungsgemäß durch die im Kennzeichnungsteil des Anspruchs 1 aufgeführten Merkmale gelöst.
Eine Einrichtung zur Durchführung des erfindungsgemäßen Verfahrens ergibt sich aus dem Kennzeichnungsteil des Anspruchs 5.
Besonders vorteilhafte Ausgestaltungen des erfindungsgemäßen Verfahrens ergeben sich aus den Ansprüchen 2 bis 4, während vorteilhafte Ausführungsformen der Einrichtung zur Durchführung des erfindungsgemäßen Verfahrens aus den Ansprüchen 6 bis 9 hervorgehen.
Im folgenden wird die Erfindung anhand von Ausführungsbeispielen unter Hinweis auf die Zeichnung näher erläutert. Es zeigt
Fig. 1 einen Graphen, in welchem die übliche spektrale Häufigkeitsverteilung eines Sprachsignals wiedergegeben ist, wobei fünfzehn Kanäle auf der Abszisse und auf der Ordinate die Pegel des jeweiligen Frequenzspektrums aufgetragen sind,
Fig. 2 und 3 schematische Darstellungen, welche zur Erläuterung des Grundgedankens der Erfindung verwendbar sind,
Fig. 4 ein Blockdiagramm einer Einrichtung zum Extrahieren der sich verhältnismäßig schnell ändernden Komponente (phonetische Information) des Sprachsignals,
Fig. 5 ein Blockdiagramm des Gesamtaufbaus eines Filters mit linearer Phasenkennlinie, welches insbesondere für eine Verwendung in der Einrichtung der Fig. 4 geeignet ist,
Fig. 6 ein Blockdiagramm einer weiteren Ausführungsform eines Linearphasenfilters,
Fig. 7 und 8 Blockdiagramme, die jeweils übliche, herkömmliche Linearphasenfilter mit Digitaltechnologie darstellen, und
Fig. 9 und 10 Blockdiagramme von Beispielen analoger Linearphasenfilter mit Merkmalen nach der Erfindung.
Wenn, wie in Fig. 1 dargestellt, der frequenzanalysierte Ausgang einer Filteranordnung u. ä. (15 Kanäle in dem dargestellten Beispiel) als Funktion der Frequenz aufgetragen wird, wird ein Signal A mit einer sich verhältnismäßig langsam ändernden Komponente, was durch ein allmähliches Abnehmen im Pegel von dem Kanal 1 bis zum Kanal 15 angezeigt ist, und einer sich verhältnismäßig schnell ändernden Komponente erhalten, was durch drei Maxima B₁ bis B₃ angezeigt ist. Die Frequenz- bzw. Häufigkeitsverteilungskurve A, welche durch Verarbeiten eines bestimmten Sprachsignals erhalten worden ist, ist durch die sich verhältnismäßig schnell ändernde Komponente oder durch Scheitelwerte und Täler charakterisiert, welche eine phonetische Information darstellen, welche einen Formanten u. ä. festlegt. Sofern eine Stimmerkennung betroffen ist, ist es somit erwünscht, die sich verhältnismäßig schnell ändernde Komponente aus der Häufigkeits- bzw. Frequenzverteilungskurve A zu extrahieren.
Gemäß der Erfindung wird dann das in Fig. 1 dargestellte Verteilungsmuster wiederholt durchlaufen, nämlich zuerst vom Kanal 1 zum Kanal 15, dann vom Kanal 15 zum Kanal 1 und dann wieder vom Kanal 1 zum Kanal 15, um dadurch eine periodische Wellenform auszubilden, welche sich bezüglich der Zeit ändert, wie in Fig. 2 dargestellt ist. Dann wird die niederfrequente Komponente, welche durch den sich verhältnismäßig langsam ändernden Anteil des Signals A festgelegt ist, wie durch die gestrichelte Linie angezeigt ist, durch ein Hochpaßfilter mit einer linearen Phasencharakteristik entfernt, so daß dadurch eine phonetische Information B₁ bis B₃ ohne Phasenverzerrung erzeugt wird, wie in Fig. 3 dargestellt ist.
Folglich wird gemäß der Erfindung, statt eine Korrektur mit Hilfe einer angenäherten Geraden durchzuführen, welche nach der Methode des kleinsten Quadrats erhalten worden ist, das Frequenzverteilungsmuster eines bestimmten Bereichs, welches als Ergebnis einer Frequenzanalyse eines Sprachsignals erhalten worden ist, abwechselnd entlang einer Zeitachse wiederholt, um eine periodische Wellenform zu bilden, welche dann gefiltert wird, um so die phonetische Information extrahiert erhalten zu können. Folglich kann gemäß der Erfindung das äquivalente Ergebnis erhalten werden, ohne daß eine nach der Methode des kleinsten Quadrats erhaltene, angenäherte Gerade verwendet wird.
In Fig. 4 ist in Blockform eine Einrichtung nach dem Anspruch 5 gemäß einer Ausführungsform der Erfindung wiedergegeben. Wie dargestellt, weist die Einrichtung einen Eingangsanschluß 1 zum Empfangen eines Tonsignals, wie einer Stimme, einen Frequenzanalysator 2 mit einer vorbestimmten Anzahl von Kanälen, um die Frequenz des Tonsignals über dem durch die Kanäle festgelegten Frequenzbereich zu analysieren, einen Selektor 3 zum Auswählen der Ausgangskanäle des Frequenzanalysators 2, eine Steuerschaltung 4 zum Steuern des Betriebs des Selektors 3, um die Ausgangskanäle des Frequenzanalysators 2 abzutasten, ein Hochpaßfilter 5 zum Entfernen der niederfrequenten Komponente und einen Ausgangsanschluß 6 auf, an welchem die extrahierte phonetische Information anliegt.
Wenn bei diesem Aufbau ein Tonsignal über den Eingangsanschluß 1 in den Frequenzanalysator 2 eingegeben wird, welcher beispielsweise aus einer Filteranordnung gebildet sein kann, wird eine spektrale Frequenz- oder Häufigkeitsverteilung erhalten, wie sie in Fig. 1 wiedergegeben ist. In der dargestellten Ausführungsform hat der Frequenzanalysator 2 fünfzehn Ausgangskanäle, und der Ausgangsselektor 3 tastet die Ausgangskanäle in der ersten Folge von Kanal 1 bis Kanal 15, in der anschließenden, zweiten Folge von Kanal 15 zu Kanal 1 in der weiteren, dritten Folge von Kanal 1 zu Kanal 15 usw. gesteuert durch die Steuerschaltung 4 ab. Folglich wird ein zeitlich gesteuertes Folgesignal erhalten, wie es in Fig. 2 dargestellt ist. Die Steuerschaltung 4 mit einer solchen Steuerfunktion kann ohne Schwierigkeiten beispielsweise aus einem Auf-/Abwärtszähler gebildet sein. Das auf diese Weise erhaltene sequentielle Signal über der Zeit, wie es in Fig. 2 dargestellt ist, wird durch das Hochpaßfilter 5 mit einer linearen Phasencharakteristik geschickt, wobei die niederfrequente Komponente, welche durch die gestrichelten Linien in Fig. 2 angezeigt ist, entfernt wird, so daß die hochfrequente Komponente am Ausgangsanschluß extrahiert erhalten wird.
In Fig. 5 ist in Blockform ein Beispiel des Hochpaßfilters mit einer linearen Phasencharakteristik dargestellt, welches sich insbesondere für eine Verwendung in der Einrichtung der Fig. 4 eignet. Wie dargestellt, ist in dem wiedergegebenen linearen Phasenfilter ein Kammfilter, welches durch eine geschlossene Schleife mit einem Verzögerungselement Z -8 festgelegt ist, und ein Allpolfilter vorgesehen, welches durch eine geschlossene Schleife mit einem Verzögerungselement Z -1 festgelegt und in Reihe mit dem Kammfilter geschaltet ist. Das Allpolfilter ist ein Filter, welches nur Pole und keine Nullen erzeugt. Folglich wird im Falle eines Allpolfilters mit einem Verzögerungselement Z -p eine Anzahl p Pole erzeugt. In der in Fig. 5 dargestellten Ausführung ist eine Reihenschaltung 8 aus Kamm- und Allpolfiltern in Reihe mit einer weiteren Reihenschaltung 8′ aus Kamm- und Allpolfiltern geschaffen, wodurch ein Tiefpaßfilter festgelegt ist. Ein Phasenkorrektor 13 ist über ein Subtrahierglied 14 parallel zu dem Tiefpaßfilter aus den zwei Stufen 8 und 8′ geschaltet, wodurch ein Hochpaßfilter festgelegt ist.
In dem in Fig. 5 dargestellten Aufbau sind die Elemente, welche mit Z -p bezeichnet wird, wie beispielsweise die Elemente 11, 11′, 13, 9 und 9′, alles Verzögerungselemente, wobei Z -1, Z -7 und Z -8 anzeigen, daß sie die Verzögerung von einer Grundzeitperiode, von sieben Grundzeitperioden bzw. von acht Grundzeitperioden schaffen. In den beiden Stufen 8 und 8′ wird der Ausgang jedes der Verzögerungselemente 9 und 9′, welche acht Grundzeitperioden schaffen, in einem der entsprechenden Addierer 10 bzw. 10′ zu dem Eingang addiert. Da die Verzögerungselemente 11 und 11′ zu den entsprechenden Addierern 10 und 10′ in einem Rückkopplungszweig geschaltet sind, wird der Ausgang des Addierers 10 oder 10′ mit einer Verzögerung von einer Grundzeitperiode zurück zu dem Addierer 10 oder 10′ addiert. Der auf diese Weise addierte Ausgang wird dann in einer Multipliziereinheit 12 oder 12′ mit einem Koeffizienten k multipliziert.
Wenn nunmehr k = 1/8 ist, ist die Übertragungsfunktion H(z) des Systems folgende:
Folglich ist ein Hochpaßfilter festgelegt. Eine derartige Schaltung kann beispielsweise ohne Schwierigkeit durch einen Mikroprozessor gebildet werden. Die vorstehende Gleichung (1) kann folgendermaßen umgeschrieben werden:
H(Z) = Z -7 (1 - (1/64) (1 + Z -1 + Z -2 + . . . + Z -7)²) (2)
In Fig. 6 ist in Blockform ein Beispiel der Schaltung dargestellt, welche gemäß der vorstehenden Gleichung (2) ausgeführt ist. In Fig. 6 sind Verzögerungselemente 9₁ bis 9₇ und 9₁′ bis 9₇′ vorgesehen; deren Ausgänge werden in Addierern 12 bzw. 12′ addiert und mit einem Koeffizienten k multipliziert (wobei k = 1/8 ist). Andererseits wird mit der Verzögerung des Elements Z -7 von dem Ausgang des Elements 9₇ der Ausgang des Addierers 12′ in einem Subtrahierglied 14 subtrahiert, um ein Ausgangssignal an dem Ausgangsanschluß 15 zu schaffen, so daß dadurch verständlich wird, daß dadurch ein Hochpaßfilter geschaffen ist. Jedes der Verzögerungselemente kann ohne weiteres durch ein analoges Schieberegister wie beispielsweise eine BBD- oder Eimerketten- Schaltung, oder durch eine Abfrage- und Halteschaltung ausgeführt sein.
Wie oben beschrieben, kann mit der Erfindung eine gewünschte spektrale Ton- oder Stimmfrequenzverteilung mit einem einfachen Schaltungsaufbau aus einem Sprachsignal ohne eine Phasenverzerrung extrahiert oder gewonnen werden, und die auf diese Weise erhaltene spektrale Verteilung ist in der Qualität im wesentlichen der Information äquivalent, welche durch eine Korrektur mit Hilfe einer angenäherten Geraden durch die Methode des kleinsten (Fehler-) Quadrats erhalten worden ist.
Ein weiterer Gesichtspunkt der Erfindung wird nunmehr anhand der Fig. 7 bis 10 beschrieben. Dieser Gesichtspunkt der Erfindung betrifft die Technologie beim Ausführen des digitalen Linearphasenfilters mit endlichem Impulsansprechverhalten in analoger Form. Im allgemeinen ist es erwünscht, ein einfaches Verfahren zu schaffen, um eine Information in dem Frequenzband außerhalb des interessierenden Bereichs zu entfernen, ohne daß eine Verzerrung in der Wellenform verursacht wird. Aus diesem Grund ist vorgeschlagen worden, ein sogenanntes Linearphasenfilter zu verwenden, bei welchem die digitale Technologie angewendet ist.
In Fig. 7 ist in Blockform ein solches Linearphasenfilter dargestellt, bei welchem die digitale Technologie angewendet ist; es weist einen Eingangsanschluß 21, ein Mehrfach-Verzögerungselement 22, um eine P-fache Grundzeitverzögerung zu schaffen, einen Addierer 23, ein Verzögerungselement 24 zum Erzeugen einer Grundzeitverzögerung, eine Multipliziereinheit 25 und einen Ausgangsanschluß 26 auf. Wie vorstehend beschrieben, ist das in Fig. 7 dargestellte Linearphasenfilter eine Reihenschaltung aus einem Kammfilter und einem Allpolfilter, so daß dessen Übertragungsfunktion folgendermaßen ausgedrückt werden kann:
Folglich ist durch den in Fig. 7 dargestellten Aufbau wirksam ein Tiefpaßfilter festgelegt.
Fig. 8 zeigt ein Hochpaßfilter, welches dadurch gebildet wird, daß ein Verzögerungselement 28 hinzugefügt wird, um eine Zeitverzögerung von (P-1)/2 bezüglich des in Fig. 7 wiedergegebenen Aufbaus zu schaffen, wobei das Verzögerungselement 28 über einen Addierer 29 zwischen die Eingangs- und Ausgangsanschlüsse des in Fig. 7 wiedergegebenen Aufbaus geschaltet ist. Folglich wird bei der Anordnung der Fig. 8 nach einer Phaseneinstellung durch das Verzögerungselement 28 das verzögerte Eingangssignal einer Subtrahiereinheit 29 zugeführt, in welchen die niederfrequente Komponente von dem Tiefpaßfilter 27 von dem verzögerten Eingangssignal subtrahiert wird, wodurch dann die hochfrequente Komponente an einem Ausgangsanschluß 30 geschaffen wird. Folglich kann die Übertragungsfunktion in diesem Fall folgendermaßen ausgedrückt werden:
Wie vorstehend beschrieben, zeigen die Elemente Z -1 und Z -p die Zeitverzögerung über eine Grundzeitperiode bzw. über das P-fache einer Grundzeitperiode an, und k ist ein Multiplikator, welcher üblicherweise gleich 1/P ist. Ganz offensichtlich kann ein solches digitales Filter in dem Fall nicht verwendet werden, wo das Signal in analoger Form wie in der vorstehend beschriebenen Anwendung verarbeitet wird.
Mit der vorstehenden Voraussetzung ist es daher möglich, ein digitales Linearphasenfilter in analoger Form zu schaffen, um dadurch das analoge Signal ohne Schwierigkeit verarbeiten zu können.
Die vorstehende Gleichung (3) kann modifiziert werden, um dann die folgende Gleichung zu erhalten:
H L (Z) = k (1 + Z -1 + Z -2 + . . . + Z -(P-1)) (3′)
Diese Funktion kann ausgeführt werden, indem eine Anzahl (P-1) von Grundverzögerungselementen, welche eine Grundzeitverzögerung schaffen, in Reihe geschaltet werden, und indem die Ausgänge dieser Verzögerungselemente nach einem Multiplizieren mit dem Koeffizienten k addiert werden.
In Fig. 9 ist in Blockform ein Beispiel eines Tiefpaßfilters dargestellt, das gemäß der vorstehenden Gleichung 3′ ausgeführt ist. Wie dargestellt, weist das Filter einen Eingangsanschluß 21 und eine Anzahl (P-1) Verzögerungselemente 31₁ bis 31 P-1 auf, welche ohne weiteres aus Abfrage- und Halteschaltungen oder Ladungstransfereinrichtungen, wie BB-Schaltungen bzw. Eimerketten-Schaltungen gebildet werden können, welche analoge Schieberegister in dem Fall sind, daß ein analoges (Schieberegister-)Signal zu behandeln ist. Auch sind Multipliziereinheiten 32₁ bis 32 p vorgesehen, welche das Signal mit dem Faktor k multiplizieren, welcher üblicherweise gleich 1/P ist. In der Ausführungsform der Fig. 10 sind auch ein Addierer 33, um die Ausgänge von den Multipliziereinheiten 32₁ bis 32 P-1 zu addieren, und ein Aussgangsanschluß 30 vorgesehen. Selbstverständlich kann die in Fig. 10 dargestellte Ausführungsform auch in Kaskade geschaltet werden.
Als nächstes kann die vorstehende Gleichung (5) modifiziert werden, um daraus die folgende Gleichung zu erhalten:
H H (Z) = Z -(P-1)/2 (1 - k (1 + Z -1 + Z -2 + . . . + Z -(P-1))) (5′)
In Fig. 10 ist ein Beispiel eines Hochpaßfilters dargestellt, das gemäß der vorstehenden Gleichung (5′) ausgeführt ist. In diesem Fall braucht, wie in Fig. 8 dargestellt ist, nur das Phaseneinstellelement 28 vorgesehen zu werden, das parallel zu dem Tiefpaßfilter 27 geschaltet ist, damit eine Subtraktion durchgeführt werden kann; das Tiefpaßfilter 27 kann mit Hilfe des in Fig. 9 dargestellten Aufbaus ausgeführt werden. In der in Fig. 8 dargestellten Ausführungsform ist das Phaseneinstellelement 28 als ein gesondertes Element vorgesehen. Wenn jedoch der Ausgang von dem Verzögerungselement 31 (P-1)/2 des in Fig. 9 dargestellten Tiefpaßfilters verwendet wird, wird ein Signal von dem Element Z -(P-1)/2 erhalten. Folglich kann ein solches diskretes Phaseneinstellelement 28 entfallen, wenn der Ausgang von dem Verzögerungselement 31 (P-1)/2 des Tiefpaßfilters 27 verwendet wird, wie in Fig. 10 dargestellt ist. In der in Fig. 10 dargestellten Ausführungsform wird die algebraische Differenz zwischen dem Ausgang des Verzögerungselements 31 (P-1)/2 und dem Ausgang des Addierers 33 des Tiefpaßfilters 27 an der Subtrahiereinheit 29 erhalten, wodurch dann ein hochpaßgefiltertes Ausgangssignal an dem Ausgangsanschluß 30 erzeugt werden kann. Selbstverständlich kann der Tiefpaßfilterteil in der Ausführungsform der Fig. 10 oder die Ausführungsform der Fig. 10 selbst auch in Form einer Kaskade geschaltet werden.
Die vorstehende Beschreibung gibt den Fall wieder, bei welchem ein lineares Phasenfilter gebildet ist, in dem diskrete Signale in analoger Form benutzt werden können; ein derartiger Aufbau kann jedoch auch durch eine Software in digitaler Form ausgeführt werden. Bei Berücksichtigung dieses Gesichtspunkts kann ein Linearphasenfilter, welches keine Phasenverschiebung erzeugt, durch einen einfachen Aufbau realisiert werden, was insbesondere dann vorteilhaft ist, wenn es in dem Fall angewendet wird, wo eine Belastung der Wellenforminformation zu vermeiden ist.

Claims (9)

1. Verfahren zum Verarbeiten eines Sprach-Signals, das sich über einen gewissen Frequenz-Bereich erstreckt und sowohl eine sich verhältnismäßig langsam ändernde Komponente als auch eine sich verhältnismäßig schnell ändernde Komponente aufweist, wobei das Sprach-Signal wiederholt von dem einen zu dem anderen Ende des Frequenz-Bereichs in einem vorherbestimmten Zeitintervall abgefragt wird, um dadurch zwangsläufig eine periodische Wellenform zu bilden, deren Periode zweimal der Frequenz-Bereich des zu verarbeitenden Signals ist, dadurch gekennzeichnet, daß das Ergebnis der Frequenzanalyse des Sprach-Signals erhaltene Frequenzverteilungsmuster des bestimmten Frequenzbereichs, abwechselnd entlang einer Zeitachse wiederholt wird, um eine periodische Wellenform zu bilden, und diese dann gefiltert wird, um so die sich verhältnismäßig schnell ändernde Komponente zu extrahieren.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die sich verhältnismäßig langsam ändernde Komponente des zu verarbeitenden Signals sich im Pegel gleichmäßig von dem einen Ende des Bereichs zu dessen anderen Ende hin ändert.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die sich verhältnismäßig schnell ändernde Komponente eine phonetische Information des Sprachsignals festlegt.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Entfernen mittels eines Hochpaßfilters durchgeführt wird.
5. Einrichtung zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 4, mit einer Eingabeeinrichtung zum Empfangen eines Signals, und mit einem Frequenzanalysator, um das empfangene Signal in eine Anzahl aneinandergrenzender Frequenzbereiche zu zerlegen, dadurch gekennzeichnet, daß an den Ausgang des Frequenzanalysators (2) ein Ausgangsselektor (3) mit einer Steuerschaltung (4) angeschaltet ist, um die aneinandergrenzenden Frequenzbereiche abwechselnd von einem Ende zu anderen Ende und vom anderen Ende zum einen Ende auszulesen, und daß an den Ausgang des Ausgangsselektors (3) ein Hochpaßfilter (5) mit einer linearen Phasencharakteristik angeschaltet ist, welches die niederfrequente Komponente aus dem Eingangssignal entfernt.
6. Einrichtung nach Anspruch 5, dadurch gekennzeichnet, daß die Steuerschaltung (4) aus einem Auf/Abwärtszähler gebildet ist.
7. Einrichtung nach Anspruch 5 oder 6, dadurch gekennzeichnet, daß das Hochpaßfilter (5) mit linearer Phasencharakteristik eine Reihenschaltung aus einem Kammfilter und einem Allpolfilter (Fig. 7) aufweist, welche nur Pole erzeugt.
8. Einrichtung nach einem der Ansprüche 5 bis 7, gekennzeichnet durch eine Anzahl (P -1) von Verzögerungseinheiten (22; 31₁ bis 31 P -1), welche zueinander in Reihe und in Reihe mit der Eingabeeinrichtung (3) geschaltet sind, und von denen jede eine Grundzeitverzögerung schafft, wobei P eine positive ganze Zahl ist; durch eine Anzahl (P -1) von Multipliziereinheiten (32₁- 32 P), welche entsprechend geschaltet sind, um die jeweiligen Ausgänge von den entsprechenden Verzögerungseinheiten (22; 31₁ bis 31 P -1) mit einem Faktor k zu multiplizieren, wobei k eine reelle Zahl ist, und durch eine weitere Multipliziereinheit (25), welche vorgesehen ist, um das von der Eingabeeinrichtung empfangene Signal mit demselben Faktor k zu multiplizieren, und durch eine Addiereinheit (33), um die Ausgänge von der Anzahl von P Multipliziereinheiten (32₁ bis 32 P) zu addieren und um einen addierten Wert an einen Ausgangsanschluß (26) zu liefern.
9. Einrichtung nach Anspruch 8, gekennzeichnet durch eine Subtrahiereinheit (29), um den addierten Wert, der von der Addiereinheit (33) zugeführt worden ist, von einem Ausgang der ((P -1)/2)-ten Verzögerungseinheit zu subtrahieren.
DE19853510660 1984-03-23 1985-03-23 Verfahren und einrichtung zum verarbeiten eines signals Granted DE3510660A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP59057161A JPS60200177A (ja) 1984-03-23 1984-03-23 信号処理方法
JP5908484A JPS60203013A (ja) 1984-03-27 1984-03-27 直線位相フイルタ

Publications (2)

Publication Number Publication Date
DE3510660A1 DE3510660A1 (de) 1985-10-31
DE3510660C2 true DE3510660C2 (de) 1990-05-17

Family

ID=26398186

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19853510660 Granted DE3510660A1 (de) 1984-03-23 1985-03-23 Verfahren und einrichtung zum verarbeiten eines signals

Country Status (4)

Country Link
US (1) US5150413A (de)
DE (1) DE3510660A1 (de)
FR (1) FR2580876A1 (de)
GB (2) GB2158980B (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004008225A1 (de) * 2004-02-19 2005-09-15 Infineon Technologies Ag Verfahren und Einrichtung zum Ermitteln von Merkmalsvektoren aus einem Signal zur Mustererkennung, Verfahren und Einrichtung zur Mustererkennung sowie computerlesbare Speichermedien

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2187585B (en) * 1985-11-21 1989-12-20 Ricoh Kk Voice spectrum analyzing system and method
US6993480B1 (en) 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
AT407584B (de) * 1999-06-21 2001-04-25 Bernhard Hans Peter Dipl Ing D Verfahren zur dynamischen und statischen darstellung von sprachsignalen
JP2002032770A (ja) * 2000-06-23 2002-01-31 Internatl Business Mach Corp <Ibm> 文書処理方法、文書処理システムおよび媒体
US20050228518A1 (en) * 2002-02-13 2005-10-13 Applied Neurosystems Corporation Filter set for frequency analysis
JP4649859B2 (ja) * 2004-03-25 2011-03-16 ソニー株式会社 信号処理装置および方法、記録媒体、並びにプログラム
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8194880B2 (en) * 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8050434B1 (en) 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
WO2014168777A1 (en) 2013-04-10 2014-10-16 Dolby Laboratories Licensing Corporation Speech dereverberation methods, devices and systems
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
KR20180088184A (ko) * 2017-01-26 2018-08-03 삼성전자주식회사 전자 장치 및 그 제어 방법

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2938079A (en) * 1957-01-29 1960-05-24 James L Flanagan Spectrum segmentation system for the automatic extraction of formant frequencies from human speech
US3639691A (en) * 1969-05-09 1972-02-01 Perception Technology Corp Characterizing audio signals
US3786188A (en) * 1972-12-07 1974-01-15 Bell Telephone Labor Inc Synthesis of pure speech from a reverberant signal
FR2273419B1 (de) * 1973-01-25 1976-09-10 Trt Telecom Radio Electr
US3894190A (en) * 1973-02-28 1975-07-08 Int Standard Electric Corp System for transferring wide-band sound signals
GB1436878A (en) * 1973-08-23 1976-05-26 Standard Telephones Cables Ltd Pulse density modulation to pcm modulation translation
DE2536640C3 (de) * 1975-08-16 1979-10-11 Philips Patentverwaltung Gmbh, 2000 Hamburg Anordnung zur Erkennung von Geräuschen
US4038495A (en) * 1975-11-14 1977-07-26 Rockwell International Corporation Speech analyzer/synthesizer using recursive filters
DE3121310A1 (de) * 1981-05-29 1982-12-16 Robert Bosch Gmbh, 7000 Stuttgart Digitales filter
US4430721A (en) * 1981-08-06 1984-02-07 Rca Corporation Arithmetic circuits for digital filters
US4524423A (en) * 1981-11-06 1985-06-18 Rca Corporation Digital signal separation filters
JPS58196595A (ja) * 1982-05-12 1983-11-16 日本電気株式会社 パタ−ン特徴抽出装置
US4674125A (en) * 1983-06-27 1987-06-16 Rca Corporation Real-time hierarchal pyramid signal processing apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004008225A1 (de) * 2004-02-19 2005-09-15 Infineon Technologies Ag Verfahren und Einrichtung zum Ermitteln von Merkmalsvektoren aus einem Signal zur Mustererkennung, Verfahren und Einrichtung zur Mustererkennung sowie computerlesbare Speichermedien
DE102004008225B4 (de) * 2004-02-19 2006-02-16 Infineon Technologies Ag Verfahren und Einrichtung zum Ermitteln von Merkmalsvektoren aus einem Signal zur Mustererkennung, Verfahren und Einrichtung zur Mustererkennung sowie computerlesbare Speichermedien

Also Published As

Publication number Publication date
GB2184312A (en) 1987-06-17
GB8507023D0 (en) 1985-04-24
GB2158980A (en) 1985-11-20
GB2158980B (en) 1989-01-05
US5150413A (en) 1992-09-22
GB2184312B (en) 1989-01-05
DE3510660A1 (de) 1985-10-31
GB8700623D0 (en) 1987-02-18
FR2580876A1 (fr) 1986-10-24
FR2580876B1 (de) 1995-03-17

Similar Documents

Publication Publication Date Title
DE3510660C2 (de)
EP0052847B1 (de) Verfahren und Schaltungsanordnung zur Umsetzung der Abtastfrequenz einer Abtastfolge unter Umgehung der Konversion in ein kontinuierliches Signal
DE3853739T2 (de) Digitales Entzerrergerät für getrennte Phasen- und Amplitudenmodifikation.
DE3485792T2 (de) Digitale signalverarbeitungseinrichtungen.
DE4316297C1 (de) Frequenzanalyseverfahren
DE2818204C2 (de) Signalverarbeitungsanlage zur Ableitung eines störverringerten Ausgangssignals
DE3124924A1 (de) Rekursives digitales tiefpassfilter
DE3018508A1 (de) Sprachanalysiervorrichtung
WO2004013839A1 (de) Vorrichtung und verfahren zum erzeugen einer komplexen spektraldarstellung eines zeitdiskreten signals
DE2616660A1 (de) Arithmetische einheit
DE68907098T2 (de) Differentieller Kodierer mit auto-adaptivem Prädiktorfilter und dazugehörigem Dekodierer.
DE2839229C2 (de) Frequenzweiche mit einem Transversalfilter
EP1755110A2 (de) Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
EP0554494B1 (de) Adaptives nichtrekursives Digitalfilter
DE2523625A1 (de) Digitalfilter
EP0135066B1 (de) Übertragungsanordnung für digitale Signale
DE3922469C2 (de)
DE3702215C2 (de)
DE10039666A1 (de) Verfahren und Vorrichtung zur Abschätzung der Frequenz und/oder der Phase eines digitalen Signals
DE3621446A1 (de) Geraet zum digitalen verarbeiten von kontinuierlichen bitstroemen
DE3836504A1 (de) Verfahren und vorrichtung zur digital-analog-wandlung
DE3037276C2 (de) Tonsynthesizer
DE4022381C2 (de) Verwendung langer Digitalfilter bei Vorkommnis von Abrundungsfehlern
EP0402519B1 (de) Verfahren und Anordnung zur Verbesserung des Dynamikbereichs eines adaptiven rekursiven Netzwerks zur Verarbeitung zeitdiskreter Signale
EP0158055A1 (de) Verfahren zur Ueberblendung digitaler Audiosignale, sowie Vorrichtung zur Durchfahrung des Verfahrens

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee