DE69700087T2 - Gerät und Verfahren zur Signalanalyse - Google Patents
Gerät und Verfahren zur SignalanalyseInfo
- Publication number
- DE69700087T2 DE69700087T2 DE69700087T DE69700087T DE69700087T2 DE 69700087 T2 DE69700087 T2 DE 69700087T2 DE 69700087 T DE69700087 T DE 69700087T DE 69700087 T DE69700087 T DE 69700087T DE 69700087 T2 DE69700087 T2 DE 69700087T2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- frequency
- filter
- stability index
- fundamental
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 37
- 238000004458 analytical method Methods 0.000 title claims description 21
- 238000004364 calculation method Methods 0.000 claims description 24
- 230000009466 transformation Effects 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 description 15
- 238000000605 extraction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 101150118300 cos gene Proteins 0.000 description 8
- 230000004044 response Effects 0.000 description 7
- 238000007689 inspection Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 210000004704 glottis Anatomy 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 101100234408 Danio rerio kif7 gene Proteins 0.000 description 2
- 101100221620 Drosophila melanogaster cos gene Proteins 0.000 description 2
- 101100398237 Xenopus tropicalis kif11 gene Proteins 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Measuring Frequencies, Analyzing Spectra (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf ein Verfahren und ein Gerät zur Signalanalyse. Genauer, die vorliegende Erfindung bezieht sich auf ein Verfahren und ein Gerät zur Signalanalyse, die nicht nur in dem sprachbezogenen Gebiet wie Extrahierung einer Fundamentalfrequenz zur Sprachanalyse und Synthese benutzt wird, sondern auch auf das Gebiet der Extrahierung von Periodizität von biologischen Signalen und Diagnose von Maschinenvibration, zum Extrahierung einer Fundamentalfrequenz von periodischen Signalen und fastperiodischen Signalen.
- Es ist wünschenswert, richtig eine Fundamentalfrequenz eines periodischen Signales auf dem Gebiet der Sprachanalyse zum Beispiel zu finden. Es ist jedoch ein befriedigendes Verfahren noch nicht gefunden worden. Bei einem herkömmlichen Verfahren wird auf der Grundlage einer Definition eines periodischen Signales eine unten definierte Periode T gefunden, deren Reziprokwert als die Fundamentalfrequenz betrachtet wird. Hier ist p(t) das zu analysierende periodische Signal, und n Z ist eine willkürliche ganze Zahl.
- p(t) = p(t + nT) ... (1)
- Ein herkömmliches Verfahren zum Erhalten der Periode eines solchen Signales enthält ein Zeitdomänenverfahren, ein Fre quenzdomänenverfahren, ein Autokorrelationsdomänenverfahren und ein Verfahren zum Untersuchen von Wellenformsingularitäten. Jedes dieser Verfahren verursacht einige Probleme, wenn es auf tatsächliche Audiosignale angewendet wird, und folglich ist es allgemein geglaubt worden, daß es kein allgemein anwendbares Universalverfahren gibt.
- In dem Zeitdomänenverfahren ( ) wird zum Beispiel eine Wellenform durch eine nicht-lineare Schaltung und dann durch ein Tiefpaßfilter gegeben, was von der Extrahierung eines Nulldurchgangspunktes oder Extrahierung einer Scheitelposition zum Erkennen der Periode gefolgt wird. Bei solche einem Verfahren ist, selbst wenn die Periode ungefähr zuvor bekannt ist, viel Einstellung einschließlich eines Einstellens der Frequenz des Tiefpaßfilters oder der nicht-linearen Schaltung, des Verfahrens des Erfassens des Scheitels usw. und des Fehlers, der von der Differenz des Signalpegels oder der Spektralform abgeleitet wird, unausweichlich gewesen.
- Ein Repräsentatives des Frequenzdomänenverfahrens ( ) ist es, einen Scheitel eines Cepstrums zu extrahieren, das als eine Fourier-Transformierte eines logarithmischen Leistungsspektrums definiert ist. Gemäß diesem Verfahren wird, wenn die Periodizität perfekt ist, die richtige Periode im Prinzip erhalten. Für die Signale wie Sprachsignal, das ungefähr periodisch ist, aber eine Variation bei jeder Periode aufweist, benötigt das Verfahren jedoch know-how zum Verhindern verschiedener Fehler wie niedriger Scheitel, fehlerhafte Extrahierung von Scheiteln, die durch Resonanz wie Sprachformant verursacht wird, oder fehlerhaftes Erfassen zweier Perioden als einer.
- Ein anderes Problem, das mit dem Verfahren der unten beschriebenen Autokorrelation gemeinsam ist, daß es notwendig ist, die Zeitlänge des für die Analyse benötigten Signale zu vergrößern, wenn die Periode genau zu berechnen ist, und daß das Verfahren keiner Zeitänderung folgen kann, wenn die Zeitänderung wie in dem Fall einer Sprache schnell ist, und wenn weiter das Zeitfenster ausreichend kurz zum Folgen der Änderung gemacht wird, kann die Periodizität nicht richtig extrahiert werden.
- Ein Verfahren auf der Grundlage der Autokorrelation ( ) normalisiert die detaillierte Leistungsspektrumsform gemäß einer globalen Leistungsspektrumsform unter Benutzung von Zeitfenstern verschiedener Länge, die modifizierte Autokorrelation wird durch die inverse Fouriertransformierte berechnet, und die Signalperiode wird als die Position ihres Scheitels berechnet. Wie jedoch in bezug auf das Cepstrum oben ausgeführt wurde, leidet dieses Verfahren unter ähnlichen Problemen, die sich damit befassen, wie mit schnell ändernde Periode fertig zu werden ist, und wo die globale Form von der detaillierten Form zu unterscheiden ist.
- Ein Verfahren ist vorgeschlagen worden, das unter Berücksichtigung der Tatsache, daß der Einfluß der globalen Spektrumsform von einem Restsignal entfernt ist, das als ein Resultat einer linearen Vorhersageanalyse erhalten wird, die Fundamentalfrequenz aus der Autokorrelation des Restsignales berechnet. Dieses Verfahren leidet jedoch auch unter dem ähnlichen Problem für schnell ändernde Signale.
- Ein Verfahren zum Untersuchen von Wellenformsingularität ( ) nimmt an, daß ein periodisches Signal periodisch durch ein Ereignis getrieben wird, das die Periodizität verursacht, so daß bei diesem Verfahren die Position des Ereignisses zum Extrahieren der Basisperiode und zum Finden der Basisfrequenz berechnet wird. Es gibt auch ein Verfahren, das die Phase einer Wavelettransformation als Mittel dafür bemerkt, was ein relativ neues Verfahren der Signalanalyse ist. Bei diesem Verfahren ist es jedoch auch unklar, welches Wavelet zu benutzen ist, und welches der erfaßten Signale zum Extrahieren der Fundamentalperiode als Hauptereignis zu benutzen ist.
- Wegen dieser prinzipiellen Schwierigkeiten gemäß den herkömmlichen Verfahren kann ein Bruchteil einer ganzen Zahl oder ein ganzzahliges Vielfaches eines geschätzten Wertes der Basisfrequenz möglicherweise fehlerhafterweise als die Fundamentalfrequenz geschätzt werden.
- Das US-Patent 5 214 708 offenbart die Benutzung der Ausgangssignale einer Filterbank zum Berechnen der Fundamentalfrequenz.
- Es ist eine Aufgabe der vorliegenden Erfindung, ein Verfahren und ein Gerät zur Signalanalyse vorzusehen, das richtig die Fundamentalfrequenz eines periodischen Signales extrahieren kann, in dem benutzt wird, daß die augenblickliche Frequenz einer bestimmten Komponente des Signales mit der Fundamentalfrequenz zusammenfällt.
- Kurz gesagt, die vorliegende Erfindung bezieht sich auf ein Verfahren zu Signalanalyse zum Extrahieren einer Fundamentalfrequenz eines Eingangssignals mit einem ersten Schritt des Berechnens unter Benutzung einer Gruppe von Filtern, die solch eine Abschneidecharakteristik haben, daß sie moderat auf der Niederfrequenzseite und steil auf der Hochfrequenzseite ist, eines Stabilitätsindex, der ein mathematischer Index ist, der Fundamentalheit der Fundamentalkomponente des Eingangssignales darstellt, für jede Filterausgabe als augenblickliche Frequenz unter Benutzung einer Filterausgabe, von der der Stabilitätsindex den Maximalwert vorsieht.
- Daher wird gemäß der vorliegenden Erfindung der mathematische Index, der die Fundamentalheit der Fundamentalkomponente des Eingangssignales darstellt, zum Auswählen eines Filters berechnet, das die maximale Fundamentalheit aufweist, und die Fundamentalfrequenz als die augenblickliche Frequenz kann unter Benutzung eines Filters extrahiert werden, daß die oben beschriebene spezielle Form aufweist. Indem nach der Fundamentalkomponente durch dieses Verfahren gesucht wird, die in einem willkürlichen Signal enthalten ist, ist es möglich, eine Abnormalität aus dem Geräusch einer mechanischen Vorrichtung zu diagnostizieren und Periodizität eines biologischen Signales zu analysieren, und somit ist die vorliegende Erfindung auf verschiedenen Gebieten anwendbar. Weiter ermöglicht auf einem Gebiet des Amüsierens die vorliegende Erfindung das richtige Extrahieren einer Singhöhe. Daher ist die vorliegende Erfindung auf eine weite Vielfachheit von Gebieten einschließlich automatischer Musikumschreibung, Rundfunk oder Herstellung von Compaktdisks anwendbar.
- Speziell bei einem typischen Einsatz enthält der erste Schritt den Schritt des Berechnens der Größe der Amplitudenmodulation und der Größe der Frequenzmodulation eines Filterausgangssignales unter Benutzung eines Filters, daß solch eine Abschneidecharakteristik hat, die moderat auf der Niederfrequenzseite und steil auf der Hochfrequenzseite ist.
- Der zweite Schritt enthält den Schritt des Berechnens eines Stabilitätsindex auf der Grundlage der Größe der Amplitudenmodulation und der Größe der Frequenzmodulation und des Berechnens eines Annäherungswerte der Fundamentalfrequenz als augenblickliche Frequenz aus einem Ausgang eines Kanales, der maximale Stabilität zeigt, auf der Grundlage des Resultates der Berechnung des Stabilitätsindex.
- Bei einer bevorzugteren Ausführungsform enthält der zweite Schritt den Schritt des Extrahierens der genauen augenblicklichen Frequenz durch Interpolieren eines Wertes einer augenblick lichen Frequenz aus einem benachbarten Frequenzkanal auf der Grundlage des angenäherten Wertes der Fundamentalfrequenz. Die weiteren und anderen Aufgaben, Merkmale, Aspekte und Vorteile der vorliegenden Erfindung werden ersichtlicher aus der folgenden detaillierten Beschreibung der vorliegenden Erfindung, wenn sie in Zusammenhang mit den begleitenden Zeichnungen genommen wird.
- Fig. 1 ist ein Blockschaltbild des Gerätes des Extrahierens der Fundamentalfrequenz gemäß der ersten Ausführungsform der vorliegenden Erfindung.
- Fig. 2 ist spezielles Blockschaltbild eines Berechnungsabschnittes des Stabilitätsindex und eines Extrahierungsabschnittes der Fundamentalfrequenz, die in Fig. 1 gezeigt sind.
- Fig. 3 zeigt die Zeitwellenformen von cos, sin und cos² + sin² eines Gabor-Filters.
- Fig. 4 zeigt die Frequenzantwort des Gabor-Filters.
- Fig. 5 zeigt Zeitwellenformen von cos, sin und cos² + sin² eines alternierenden Gabor-Filters, bei dem der Einfluß der zweiten Harmonischen entfernt ist.
- Fig. 6 zeigt die Frequenzantwort des in Fig. 5 gezeigten Gabor-Filters.
- Fig. 7 ist ein dreidimensionales Diagramm des Stabilitätsindex.
- Fig. 8 zeigt das Einstellen der Gewichte zum Einführen der Kenntnis der harmonischen Struktur und des Wissens der Stimmbandvibration in den Stabilitätsindex.
- Fig. 9A-9F sind Bilder von Wellenformen, die ein Resultat einer tatsächlichen Sprachwellenformanalyse zeigen.
- Fig. 10 ist ein Blockschaltbild, das eine andere Ausführungsform der vorliegenden Erfindung zeigt.
- Fig. 11 ist ein Blockschaltbild, das eine noch andere Ausführungsform der vorliegenden Erfindung zeigt.
- Vor der Beschreibung der Ausführungsformen wird das Prinzip der vorliegenden Erfindung beschrieben. Herkömmliche Tonlagenextrahierungsverfahren haben versagt, und da diese Verfahren versuchten, direkt die Fundamentalfrequenz aus der Definition eines periodischen Signales zu erhalten. Bei der vorliegenden Erfindung wird die augenblickliche Winkelfrequenz ω(t), die durch die folgenden Gleichungen definiert ist, in bezug auf die Fundamentalkomponente eines fast periodischen Signales s(t) berechnet.
- Hier stellt H die Hilbert-Transformierte eines Signales dar. Hilbert-Transformierte sehen ein Signal durch Drehen der Phase der harmonischen Komponente eines Signales um 90º vor. Die augenblickliche Frequenz f(t) wird gemäß der Gleichung f(t) = ω(t)/2π berechnet.
- Ein fast periodischer komplexer Ton c(t) wie Sprache kann unter Benutzung der augenblicklichen Frequenz gemäß der folgenden Gleichung (4) dargestellt werden.
- Hier stellt αk(t) und φk(t) die Amplitudenmodulations- (AM)Komponente der harmonischen Struktur bzw. die Kleinphasenmodulations-(PM)Komponente dar. Der Hauptteil oder die Mehrheit der Frequenzmodulation (FM) wird durch eine Änderung ω(t) erzeugt. Hier gilt durch geeignetes Einstellen des Zeitnullpunktes die folgende Diskussion, selbst wenn φ&sub1;(t) auf 0 gesetzt ist. N stellt die Menge der natürlichen Zahlen dar. Wenn daher nur eine Fundamentalkomponente vorgesehen wird, würde die gemäß der Gleichung (2) berechnete augenblickliche Frequenz die gleiche wie die Fundamentalfrequenz sein.
- Die Beziehung zwischen der auf diese Weise definierten augenblicklichen Frequenz und der gemäß dem herkömmlichen Verfahren berechneten Fundamentalfrequenz wird kurz beschrieben. Es sei angenommen, daß αk(t) und φk(t) zufällig verteilt sind und der Mittelwert 0 ist, der geschätzte Wert der durch das Korrelationsverfahren oder ähnliches berechneten Fundamentalfrequenz ist gleich dem Mittelwert der augenblicklichen Frequenz über eine lange Zeitdauer. Für ein periodisches Signal sind diese im wesentlichen äquivalent. Für ein fast periodisches Signal wird der richtige Wert nur erhalten durch das Verfahren, das auf der augenblicklichen Frequenz beruht und keinen Extraschritt des Mittelns beinhaltet.
- Wie oben beschrieben wurde, weist die augenblickliche Frequenz der Fundamentalwelle überlegene Charakteristik auf. Es ist jedoch nicht benutzt worden wegen des Problemes, wie die Fundamentalkomponente, deren augenblickliche Frequenz gewünscht wird, erhalten wird. Zum Finden der augenblicklichen Frequenz ist es notwendig, die Fundamentalkomponente herauszunehmen, was Berechnen der Fundamentalfrequenz bedeutet. Ohne eine Maßnahme zum Überwinden des toten Punktes führt dies zu einer Tautologie. Das ist der Grund, aus dem die augenblickliche Frequenz der Fundamentalkomponente, die verschiedene überlegene Charakteristiken aufweist, bis heute noch nicht benutzt worden ist.
- Daher wird bei der vorliegenden Erfindung der tote Punkt unter Benutzung einer Maßnahme, die nicht die Frequenz ist, zum Auswählen der Fundamentalkomponente überwunden. Für diesen Zweck wird die folgende Charakteristik der Signalverarbeitung, die ein Filter mit solch einer Abschneidecharakteristik aufweist, die moderat auf der Niederfrequenzseite und steil auf der Hochfrequenzseite ist, benutzt. Genauer, wenn die Mittelfrequenz des Filters sich von der Fundamentalkomponente eines Signales unterscheidet, nimmt die Frequenzmodulation der augenblicklichen Frequenz der Filterausgabe und die Amplitudenmodulation der Hüllenkomponente der Filterausgabe zu. Der Grund dafür ist der, daß das Signalrauschverhältnis der Fundamentalwelle und anderer Komponenten ein Maximum wird, wenn die Mittelfrequenz des Filters und die Frequenz der Fundamentalkomponente des Signales miteinander übereinstimmen.
- Wenn die Mittelfrequenz des Filters und die Frequenz von harmonischen Komponenten höherer Ordnung des Signales miteinander übereinstimmen, nimmt das Signalrauschverhältnis zu. Da jedoch das Filter eine moderate Abschneidecharakteristik aufweist, ist eine Mehrzahl von harmonischen Komponenten in einer Filterausgabe vorhanden, und daher nehmen die Variation der augenblicklichen Frequenz und der Amplitudenmodulation der Hüllenkomponente der Filterausgabe zu. Es gibt viele Filter, die solch eine Bedingung erfüllen. Praktisch ist es bequem, eine komplexe Gabor- Funktion zu benutzen, deren Frequenzauflösung 1,3 bis 1,4 besser als die Zeitauflösung ist.
- Um die Diskussionen einfacher zu machen, sei eine Fensterfunktion angenommen, deren Zeitauflösung und Frequenzauflösung in der folgenden Weise ausgeglichen sind. Zuerst wähle ein Zeitfenster aus, dessen Produkt aus Zeitauflösung und Frequenzauflösung ein Minimum ist und die Verhältnisse der entsprechenden Auflösungen in bezug auf die Fundamentalperiode und die Fundamentalfrequenz des Signales einander gleich sind. Ein Zeitfenster w(t), das diese Anforderungen erfüllt, ist die folgende Gauss-Funktion, von der die Fouriertransformierte W(ν) wird durch die folgende Gleichung dargestellt.
- wobei ν&sub0; = 2πf&sub0; ist. In dem diese Fensterfunktion benutzt wird und mit einem Signal multipliziert wird, dessen Realteil und Imaginärteil Phasendifferenzen von 90º gegeneinander aufweisen und die Periode von τ&sub0; aufweisen, wird ein Signal gr0(t) zur Inspektion wie folgt definiert. Das Signal gr0, das auf dieses Weise definiert ist, ist ein Inspektionssignal zum Erfassen eines Signales mit der Periode von τ&sub0;.
- Dieses Signal entspricht auch einer Gabor-Funktion, die unten definiert wird, mit α = τ²&sub0;/4π.
- Der Einfluß der Signalperiodizität auf die Phase und den Absolutwert des Resultates der Faltung eines Signales, das zu analysieren ist, und des Inspektionssignales wird untersucht. Eine Funktion D(t, τ), von der der Index der Fundamentalheit abgeleitet wird, wird wie folgt definiert.
- wobei T einen Bereich darstellt, außerhalb von dem die Amplitude von gr0(t) im wesentlichen als 0 betrachtet werden kann. Auf der Grundlage dieser Funktion wird der Index M(t, τ), der die Fundamentalheit darstellt, wie folgt definiert.
- Die letzten zwei Ausdrücke der Gleichung (10) oben sind Korrekturausdrücke zur Normalisierung eines Teiles in Abhängigkeit der Breite des Fensters und zur Normalisierung eines Teiles, an dem der Differentialwert sich in Abhängigkeit von der Frequenz des Zielsignales ändert. Durch solche Korrekturen entspricht, wenn M berechnet wird, wobei sich τ&sub0; verschieden ändert und der Wert von τ&sub0;, der ein maximales M vorsieht, gewählt wird, der gewählte Wert der Frequenz der Fundamentalkomponente. Eine Ausführungsform des Einführens des Extrahierens der Fundamentalfrequenz auf der Grundlage dieses Prinzipes wird im einzelnen im folgenden beschrieben.
- Fig. 1 ist ein schematische Blockschaltbild, das ein Gerät zum Extrahieren einer Fundamentalfrequenz gemäß einer Ausführungsform der vorliegenden Erfindung zeigt. Es wird Bezug genommen auf Fig. 1, ein Sprachsignal wird durch ein Eingabegerät wie ein Mikrophon 1 eingegeben. Bei dem eingegebenen Sprachsignal wird der Eingangspegel durch einen Distributionsverstärker 2 eingestellt und an eine cos-Gabor-Filtergruppe 3, eine sin- Gabor-Filtergruppe 4 und einen Extraktor 6 für eine augenblickliche Frequenz unter Benutzung von Interpolation verteilt und angelegt. Wenn die Fundamentalfrequenz eines Sprachsignales zu extrahieren ist, wird jedes der Filter in der Gabor-Filtergruppe an jedem 2112 so angeordnet, daß 12 Filter über eine Oktave in dem Bereich der Mittelfrequenz von 40 Hz bis 800 Hz plaziert werden können. Als Resultat dieser Ausführungsform werden 52 Filter in gleichem Abstand auf der logarithmischen Frequenzachse für cos- bzw. sin-Phasen angeordnet.
- Die cos-Gabor-Filtergruppe 3 ist eine Gruppe von Filtern, deren Zeitauflösung und Frequenzauflösung in der cos-Phase durch eine ausgeglichene Gleichung dargestellt werden. Durch diese Filtergruppe wird ein Signal entsprechend dem Realteil des Inspektionssignales, auf das die Gabor-Funktion der Gleichung angewendet wird, in entsprechende Kanäle ausgegeben. Die sin-Gabor- Filtergruppe 4 ist eine Gruppe von Filtern, deren Zeitauflösung und Frequenzauflösung in der sin-Phase durch eine ausgeglichene Gleichung dargestellt werden, und durch diese Filtergruppe wird ein Signal entsprechend dem Imaginärteil des Inspektionssignales, auf das die Gabor-Funktion der Gleichung angewendet wird, in entsprechende Kanäle ausgegeben wird.
- Ausgangssignale entsprechender Kanäle der cos-Gabor-Filtergruppe 3 und sin-Gabor-Filtergruppe 4 werden an einen Berechnungsabschnitt für Stabilitätsindex und Extraktionsabschnitt für eine Fundamentalfrequenz 5 angelegt. Der Berechnungsabschnitt des Stabilitätsindex und der Extraktionsabschnitt der Fundamentalfrequenz 5 berechnet den Stabilitätsindex aus dem Realteilsignal und dem Imaginärteilsignal und berechnet auf der Grundlage des Resultates der Berechnung einen angenäherten Wert der Fundamentalfrequenz als augenblickliche Frequenz aus den Daten des Kanales, der maximale Stabilität anzeigt, und legt das Resultat der Berechnung an den Extraktor der augenblicklichen Frequenz 6 unter Benutzung von Interpolation an. Der Extraktor der augenblicklichen Frequenz 6 interpoliert den Wert der augenblicklichen Frequenz aus dem benachbarten Frequenzkanal auf der Grundlage des Näherungswertes der Fundamentalfrequenz und extrahiert eine genaue augenblickliche Frequenz.
- Fig. 2 ist ein spezielles Blockschaltbild des Berechnungsabschnittes des Stabilitätsindex und des Extraktionsabschnittes der Fundamentalfrequenz 5, die in Fig. 1 gezeigt sind. Entsprechen den entsprechenden Ausgängen eines jeden Kanales der cos- Gabor-Filtergruppe 3 und der sin-Gabor-Filtergruppe 4, die in Fig. 1 gezeigt sind, ist ein Fig. 2 gezeigter Abschnitt 21 entsprechend einem Kanal vorgesehen, und der Stabilitätsindex für jeden Kanal wird berechnet. Die Berechnung wird gemäß der Gleichung (10) oben ausgeführt. Der Realteil 8 des Abschnittes 21 entsprechend dem Kanal ist ein Ausgang eines Filters der cos- Gabor-Filtergruppe 3, und der Imaginärteil 12 ist ein Ausgang von einem Filter der sin-Gabor-Filtergruppe 4.
- Der Realteil 8 und der Imaginärteil 12 werden an einen Berechnungsabschnitt des Absolutwertes 9 angelegt, das quadratische Mittel des Real- und Imaginärteiles werden zum Vorsehen des Absolutwertes berechnet. Der Absolutwert wird an den Vorverarbeitungsabschnitt 10 zur Berechnung der relativen Größenvariation angelegt, das Zeitdifferential des Absolutwertes wird berechnet, der quadratische Mittelwert wird unter Benutzung einer Integrationszeit gemäß der Zeitlänge einer jeden Kanalreaktion berechnet, und der quadratische Mittelwert des Absolutwertes selbst wird ebenfalls unter Benutzung der gleichen Integrationszeit berechnet. Der Berechnungsabschnitt 11 der relativen Größenvariation berechnet die relative Größenvariation durch Normalisieren des quadratischen Mittelwertes des Zeitdifferentiales, das in dem Vorverarbeitungsabschnitt 10 durch den quadratischen Mittelwert des Absolutwertes selbst berechnet worden ist.
- Der Realteil 8 und der Imaginärteil 12 werden ebenfalls an einen Berechnungsabschnitt 13 des Phasenwinkels angelegt, und der Berechnungsabschnitt 13 des Phasenwinkels berechnet den Phasenwinkel durch Berechnen des Verhältnis des Imaginärteiles in bezug auf den Realteil. Der berechnete Phasenwinkel wird an einen Phasenabwickelabschnitt 14 angelegt, und der Phasenabwickelabschnitt 14 verbindet die Phasen derart, daß ein Sprung von 2% der Phase auf 0 geht, wodurch der abgewickelte kontinuierliche Phasenwinkel berechnet wird. In dem Berechnungsabschnitt 15 der augenblicklichen Frequenz wird der von dem Phasenabwickelab schnitt 14 abgewickelte Phasenwinkel der Zeitdifferenzierung unterworfen, wodurch die augenblickliche Phase erhalten wird. Die erhaltene augenblickliche Phase wird an den Berechnungsabschnitt 16 der Frequenzvariation angelegt, das Zeitdifferential der der Frequenz wird berechnet, der quadratische Mittelwert wird unter Benutzung der Integrationszeit in Übereinstimmung mit der Zeitlänge einer jeden Kanalantwort berechnet, und somit wird die Frequenzvariation erhalten.
- Ein Einstellabschnitt 18 für den Schwellenwert setzt einen Schwellenwert eines Minimalindex, der als stabil angesehen werden kann, auf der Grundlage der Information eines jeden Kanales. Der eingestellte Schwellenwert, die relative Größenvariation, die durch den Berechnungsabschnitt 11 der relativen Größenvariation berechnet ist, und die Frequenzvariation, die von dem Berechnungsabschnitt 16 der Frequenzvariation berechnet ist, werden an den Berechnungsabschnitt 19 des Stabilitätsindex angelegt. In dem Berechnungsabschnitt des Stabilitätsindex wird der Stabilitätsindex auf der Grundlage der relativen Größenvariation, der Frequenzvariation, des Schwellenwertes und der Kanalzahl berechnet, und ein Paar 20 des Stabilitätsindex und der augenblicklichen Frequenz wird an einen Auswahlabschnitt 23 des Maximalwertes angelegt. Ein ähnliches Paar 22 des Stabilitätsindex und der augenblicklichen Frequenz eines anderen Kanales wird ebenfalls an den Auswahlabschnitt 23 des Maximalwertes angelegt. Auf der Grundlage der Stabilitätsindizes wählt der Auswahlabschnitt 23 des Maximalwertes den Maximalwert aus und wählt zur gleichen Zeit eine zu paarende Fundamentalfrequenz aus. Als Resultat werden eine ungefähre Fundamentalfrequenzinformation und ein Stabilitätsindex extrahiert.
- Fig. 3 bis 6 sind Diagramme, die sich auf eine Ausführungsform zum Verbessern der Filterstruktur beziehen. Fig. 3 zeigt Wellenformen einer cos-Phasenkomponente und einer sin-Komponente eines Gabor-Filters, bei dem Frequenzauflösung und Zeitauflösung ausgeglichen sind, als auch einer Hüllenwellenform, die als quadrierte Summe davon berechnet ist. Die Wellenformen entsprechen dem Realteil, dem Imaginärteil und dem Absolutwert der Gleichung (5) oben. Die Frequenzantwort des Filters weist die Charakteristik des Moderaten auf der Niederfrequenzseite und des Steilen auf der Hochfrequenzseite in der Darstellung auf, in der die Abszisse die logarithmische Frequenz darstellt, wie in Fig. 4 gezeigt ist. Es kann nämlich gesehen werden, daß das Filter die oben beschriebene Bedingung erfüllt.
- Obwohl die Hochfrequenzseite in Fig. 4 steil ist, beträgt jedoch die Abschwächung an einer Position der zweiten harmonischen Komponente nur 27 dB, wenn die Mittelfrequenz des Filters zu der Fundamentalkomponente paßt. Wenn daher die Fundamentalkomponente schwach im Vergleich mit der zweiten harmonischen Komponente ist, entspricht ein Filter mit einem maximalen Stabilitätsindex nicht unbedingt der Fundamentalkomponente.
- Fig. 5 zeigt eine Ausführungsform, die dieses Problem löst, bei der eine Filterreaktionswellenform, die gemäß der folgenden Gleichung (11) definiert ist, benutzt wird.
- ωd(t) = ω(t - τ&sub0;/4) - ω(t + τ&sub0;/4) ... (11)
- Eine durchgezogene Linie 29 von Fig. 5 stellt den Realteil dar, eine gestrichelte Linie 30 stellt den Imaginärteil dar, und eine punktierte Linie 31 stellt den Absolutwert dar. Unter Benutzung einer geeigneten Antwortwellenform, die auf diese Weise gebildet wird, wird die Filtercharakteristik sehr an dem Abschnitt der zweiten harmonischen Komponente geschwächt, wie bei 32 von Fig. 6 gezeigt ist. Selbst wenn folglich die zweite harmonische Komponente groß in bezug auf die Fundamentalkomponente ist, ist es möglich, daß das Filter mit dem maximalen Stabilitätsindex der Fundamentalkomponente entspricht.
- Fig. 7 ist ein dreidimensionales Bild des berechneten Stabilitätsindex, bei dem der mittlere hohe Abschnitt der Fundamentalkomponente entspricht. Die Fundamentalfrequenz der Fundamentalkomponente wird durch Erhalten der augenblicklichen Frequenz eines entsprechenden Kanales berechnet.
- Fig. 8 ist eine Darstellung, die eine Ausführungsform zum Verbessern des Stabilitätsindex zeigt. Bei tatsächlicher Sprache nimmt, wenn die Fundamentalkomponente schwach oder instabil ist oder wenn der Übergang, der durch Resonanz des Vokaltraktes verursacht wird, der durch Öffnen/Schließen der Glottis erregt wird, sehr stark ist, der Stabilitätsindex des Filters entsprechend der zweiten harmonischen Komponente ein Maximum an, oder der Stabilitätsindex eines Filters entsprechend der fünften oder höheren harmonischen Komponente kann ein Maximum mit einer Rate von einigen Prozent annehmen, was zu fehlerhafter Extraktion führt. Fig. 8 zeigt die Richtungseinstellung zum Einführen von Wissen der harmonischen Struktur und Wissen der Resonanz, die durch Vibration des Stimmbandes verursacht wird, damit solche Fehler verringert werden. Bezugszeichen 35 stellt eine Richtung dar, die einen positiven Einfluß auf die halbe Frequenz ausübt, und 36 stellt eine Wichtung dar, die einen negativen Einfluß auf die doppelte Frequenz ausübt. 37 stellt eine Wichtung dar, die einen negativen Einfluß auf die fünfte oder höhere Frequenzkomponente ausübt zum Korrigieren des Einflusses des Öffnens/ Schließens der Glottis. Die Wichtungen, die in dieser Weise definiert sind, werden als β(λ) als eine Funktion der logarithmischen Frequenz λ = logF dargestellt. Ähnlich kann der Stabilitätsindex M als M(λ) als eine Funktion der logarithmischen Frequenz der Mittelfrequenz der Mittelfrequenz des Filters dargestellt werden. In dem das benutzt wird, wird der durch das Wissen modifizierte Stabilitätsindex Mm(λ) gemäß der Gleichung 12 berechnet.
- Mm(λ) = β (η - λ)M(η)dη ... (12)
- Unter Benutzung des Stabilitätsindex, der durch die Kenntnis modifiziert ist, anstelle des oben erwähnten Stabilitätsindex können Fehler, die durch schwache oder Fundamentalwelle, sehr starke Resonanz des Vokaltraktes, die mit dem öffnen/Schließen der Glottis assoziiert sind, verringert werden. Diese Ausführungsform modifiziert nur den Betriebsschritt des Berechnungsabschnittes des Stabilitätsindex, der durch 19 in Fig. 2 dargestellt wird, und das Blockschaltbild ist das gleiche.
- Eine Ausführungsform zum Verbessern des Verfahrens des Stabilitätsindex wird beschrieben.
- Bei einer Sprache ist die Fundamentalfrequenz selten konstant, und sie endet in Anhebung oder Absenkung. In solch einem Fall sieht, da der Stabilitätsindex definiert wird unter Benutzung einer quadratischen Summe der Variation die scheinbare Stabilität aus, als ob sie absinkt, wenn die Bewegung des Anhebens oder Absenkens als Vorurteil dient, selbst wenn sie die Fundamentalkomponente ist. Damit dieses Problem vermieden wird, kann die quadrierte Summe eines Betrages, von dem der Mittelwert der Variation in dem Bereich Ω der Integration entfernt ist, bei dem Berechnen des Stabilitätsindexes benutzt werden. Der auf diese Weise modifizierte Stabilitätsindex wird als Mc dargestellt, der gemäß den Gleichungen (13) bis (15) unten berechnet wird.
- Fig. 9A-9F zeigen das Resultat einer Analyse einer tatsächlichen Sprachwellenform, eines Satzes "BAKUONGA GINSEKAINO KOUGENNI HIROGARU.". Dieser Satz ist bekannt als ein Beispiel für die Tonlagenextrahierung, da er Plosive und Friktative enthält. Fig. 9A stellt eine Sprachwellenform dar, Fig. 9B eine Sprachleistung, Fig. 9C eine Fundamentalfrequenz, Fig. 9D einen Stabilitätsindex, Fig. 9E einen FO-Leistung und Fig. 9F eine Grau- Skalenkarte des Stabilitätsindex. Bei der Grau-Skala in Fig. 9F stellt dunklerer Ton höhere Stabilität dar. Bei der Fundamentalfrequenz in Fig. 9C stellen die dünnen durchgezogenen Linien Abschnitte dar, von denen bestimmt wird, daß sie durch Vibration des Stimmbandes verursacht sind.
- Fig. 10 ist ein Blockschaltbild einer Ausführungsform, die auf eine Analyse eines Signales anzuwenden ist, das keine Fundamentalkomponente aufweist, aber ungefähr periodischer Natur in der Hülle ist. Bei der in Fig. 10 gezeigten Ausführungsform wird das Signal nicht direkt benutzt, sondern es wird einer nichtlinearen Transformation durch Halbwellenrektifikation zum Beispiel unterzogen, und selbst wenn das Signal daher keine Fundamentalwellenkomponente enthält, kann das Signal in eines mit einer ungefähr periodischen Fundamentalkomponente transformiert werden, wenn die Hülle ungefähr periodische Charakteristik aufweist. Genauer, durch das Vorsehen des nicht-linearen Wandlers 39 zwischen dem Mikrophon 1 und dem Distributionsverstärker 2 wird diese Ausführungsform realisiert. Für die nicht-lineare Transformation kann ein Hüllenextrahierungsvorgang unter Benutzung von Halbwellenrektifikation oder eine Hilbert-Transformation, gewichtete Summe der Halbwellenrektifikation Band um Band unter Benutzung einer Gruppe von Filtern oder gewichtete Summe des Hüllenextrahierungsvorganges Band um Band unter Benutzung einer Gruppe von Filtern benutzt werden.
- Fig. 11 zeigt eine noch weitere Ausführungsform der vorliegenden Erfindung. Bei dieser in Fig. 11 gezeigten Ausführungsform ist anstelle der zwei Sätze von Filtergruppen, das ist die cos- Gabor-Filtergruppe 3 und die sin-Gabor-Filtergruppe 4, die in Fig. 1 oben gezeigt sind, ein Satz von Filtergruppen zur Berechnung der Größen der Amplitudenmodulation und der Frequenzmodulation benutzt. Es wird die Tatsache benutzt, daß die Zeitableitung einer Filterausgabe ein cos ist, wenn das Ausgangssignal ein sin ist, es ist möglich, den Gewinn durch Zeitableitung des Signales des Realteiles anstelle des Signales des Imaginärteiles von Fig. 2 zu verwenden, wobei die Polarität invertiert ist. Durch dieses Verfahren wird die sin-Gabor-Filtergruppe 4 von Fig. 1 weggelassen, eine Differentialschaltung 40 und eine Polaritätsinversionsschaltung 41 sind vorgesehen, und ein Eingang zu dem Realteil geht durch die Differentialschaltung 40 und die Polaritätsinversionsschaltung 41, wo sie als Eingang zu dem Imaginärteil benutzt wird.
- Obwohl die vorliegende Erfindung im einzelnen beschrieben und dargestellt worden ist, ist klar zu verstehen, daß dieses nur als Weg der Darstellung und des Beispieles dient und nicht als Weg der Begrenzung zu nehmen ist, der Umfang der vorliegenden Erfindung wird nur durch den Inhalt der beigefügten Ansprüche begrenzt.
Claims (8)
1. Verfahren der Signalanalyse zum Extrahieren der
Fundamentalfrequenz eines Eingangssignales unter Benutzung einer Bank
von Filtern, von denen jedes eine moderate
Abschneidecharakteristik auf der Niederfrequenzseite und eine steile
Abschneidecharakteristik auf der Hochfrequenzseite aufweist, mit:
einem ersten Schritt (3, 4, 5) zum Berechnen eines
Stabilitätsindex für jeden der Filterausgänge, wobei der Stabilitätsindex
ein mathematischer Index ist, der ein Mali der Fundamentalheit
des Signales darstellt; und
einem zweiten Schritt (6) zum Extrahieren der ungefähren
Fundamentalfrequenz durch Auswählen eines speziellen Filters unter
Benutzung des berechneten Stabilitätsindex und Berechnen einer
augenblicklichen Frequenz aus der Ausgabe des Filters.
2. Verfahren der Signalanalyse nach Anspruch 1,
bei dem der erste Schritt den Schritt (5) des Berechnens des
Stabilitätsindex für jeden der Filterausgänge durch Finden der
Größe der Amplitudenmodulation und der Größe der
Frequenzmodulation des Ausganges von dem Filter aufweist.
3. Verfahren der Signalanalyse nach Anspruch 1 oder 2,
bei dem der Schritt (6) des Berechnens des ungefähren Wertes der
Fundamentalfrequenz als augenblickliche Frequenz von dem Ausgang
des Filters, für den die maximale Stabilität bezeichnet ist, auf
der Grundlage der Berechnung des Stabilitätsindex.
4. Verfahren der Signalanalyse nach einem der Ansprüche 1 bis
3,
bei dem der zweite Schritt den Schritt des Extrahierens der
genauen augenblicklichen Frequenz durch Interpolieren eines Wertes
der augenblicklichen Frequenz von einem benachbarten
Frequenzkanal enthält.
5. Gerät zur Signalanalyse zum Extrahieren der
Fundamentalfrequenz eines Eingangssignales, mit:
einem Distributionsmittel (2) zum Verteilen des
Eingangssignales;
einer Mehrzahl von Filtergruppen (3, 4), wobei jedes Filter eine
unterschiedliche Mittelfrequenz und eine
Abschneidecharakteristik aufweist, die moderat an der Niederfrequenzseite und steil
an der Hochfrequenzseite ist, wobei an jedes von denen ein
Signal, wie es durch das Distributionsmittel verteilt ist,
angelegt wird;
einem Berechnungsmittel (5) zum Berechnen eines Stabilitätsindex
für jeden der Filterausgänge, wobei der Stabilitätsindex ein
mathematischer Index ist, der ein Maß der Fundamentalheit des
Signales darstellt, indem die Größe der Amplitudenmodulation und
die Größe der Frequenzmodulation eines jeden der Ausgangssignale
von der Filtergruppe gefunden wird; und
einem Extrahiermittel (6) einer Fundamentalfrequenz zum
Berechnen der Fundamentalfrequenz als eine augenblickliche Frequenz
auf der Grundlage des Filters, für den maximale Stabilität
angezeigt worden ist, auf der Grundlage der Berechnung durch das
Berechnungsmittel für den Stabilitätsindex.
6. Gerät zur Signalanalyse nach Anspruch 5,
wobei die Mehrzahl von Filtergruppen eine cos-Gabor-Filtergruppe
(3), die ein Signal entsprechend einem Realteil einer Gabor-
Funktion ausgibt, und eine sin-Gabor-Filtergruppe (4), die ein
Signal entsprechend einem Imaginärteil der Gabor-Funktion
ausgibt, aufweist und
das Berechnungsmittel den Stabilitätsindex aus einem Signal des
Realteiles und einem Signal des Imaginärteiles berechnet.
7. Gerät zur Signalanalyse nach Anspruch 5,
bei dem die Filtergruppe eine cos-Gabor-Filtergruppe (3), die
ein Signal entsprechend einem Realteil einer Gabor-Funktion
ausgibt, aufweist und
das Gerät weiter aufweist ein Differentialmittel (40) zum
Differenzieren eines Ausganges von dem cos-Gabor-Filter und
ein Polaritätsinversionsmittel (41) zum Invertieren eines
Ausganges von dem Differentialmittel zum Ausgeben eines
Imaginärteiles der Gabor-Funktion;
wobei das Berechnungsmittel den Stabilitätsindex aus dem Signal
des Realteiles und dem Signal des Imaginärteiles berechnet.
8. Gerät zur Signalanalyse nach einem der Ansprüche 5 bis 7,
weiter mit
einem Mittel (39) zum Ausführen einer nicht-linearen
Transformation des Eingangssignales zum Erhalten eines Signales, das keine
Fundamentalkomponente enthält, und zum Anlegen des Signales an
das Distributionsmittel.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09017505A JP3112654B2 (ja) | 1997-01-14 | 1997-01-14 | 信号分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69700087D1 DE69700087D1 (de) | 1999-02-11 |
DE69700087T2 true DE69700087T2 (de) | 1999-07-15 |
Family
ID=11945847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69700087T Expired - Lifetime DE69700087T2 (de) | 1997-01-14 | 1997-07-02 | Gerät und Verfahren zur Signalanalyse |
Country Status (6)
Country | Link |
---|---|
US (1) | US6014617A (de) |
EP (1) | EP0853309B1 (de) |
JP (1) | JP3112654B2 (de) |
CA (1) | CA2209417C (de) |
DE (1) | DE69700087T2 (de) |
DK (1) | DK0853309T3 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10110168C1 (de) * | 1999-10-13 | 2002-08-22 | Toyota Motor Co Ltd | Vorrichtung und Verfahren zur Spitzenzeiterfassung |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3112654B2 (ja) | 1997-01-14 | 2000-11-27 | 株式会社エイ・ティ・アール人間情報通信研究所 | 信号分析方法 |
JP3417880B2 (ja) * | 1999-07-07 | 2003-06-16 | 科学技術振興事業団 | 音源情報の抽出方法及び装置 |
JP2001027895A (ja) * | 1999-07-14 | 2001-01-30 | Canon Inc | 信号分離方法及び装置 |
US6339715B1 (en) | 1999-09-30 | 2002-01-15 | Ob Scientific | Method and apparatus for processing a physiological signal |
US6686011B1 (en) | 2000-01-28 | 2004-02-03 | Kuraray Co., Ltd. | Coinjection stretch-blow molded container |
DE07003891T1 (de) | 2001-08-31 | 2007-11-08 | Kabushiki Kaisha Kenwood, Hachiouji | Vorrichtung und Verfahren zur Erzeugung von Tonhöhenwellensignalen und Vorrichtung sowie Verfahren zum Komprimieren, Erweitern und Synthetisieren von Sprachsignalen unter Verwendung dieser Tonhöhenwellensignale |
TW589618B (en) * | 2001-12-14 | 2004-06-01 | Ind Tech Res Inst | Method for determining the pitch mark of speech |
US6983065B1 (en) * | 2001-12-28 | 2006-01-03 | Cognex Technology And Investment Corporation | Method for extracting features from an image using oriented filters |
JP2004054526A (ja) * | 2002-07-18 | 2004-02-19 | Canon Finetech Inc | 画像処理システム、印刷装置、制御方法、制御コマンド実行方法、プログラムおよび記録媒体 |
JP4178319B2 (ja) * | 2002-09-13 | 2008-11-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理におけるフェーズ・アライメント |
EP1605439B1 (de) * | 2004-06-04 | 2007-06-27 | Honda Research Institute Europe GmbH | Einheitliche Behandlung von aufgelösten und nicht-aufgelösten Oberwellen |
EP1686561B1 (de) * | 2005-01-28 | 2012-01-04 | Honda Research Institute Europe GmbH | Feststellung einer gemeinsamen Fundamentalfrequenz harmonischer Signale |
US8204747B2 (en) | 2006-06-23 | 2012-06-19 | Panasonic Corporation | Emotion recognition apparatus |
KR100839436B1 (ko) | 2006-10-25 | 2008-06-19 | 명지대학교 산학협력단 | 코사인 필터와 사인 필터의 이득차를 이용한 주파수 측정방법 |
DE102007006084A1 (de) | 2007-02-07 | 2008-09-25 | Jacob, Christian E., Dr. Ing. | Verfahren zum zeitnahen Ermitteln der Kennwerte, Harmonischen und Nichtharmonischen von schnell veränderlichen Signalen mit zusätzlicher Ausgabe davon abgeleiteter Muster, Steuersignale, Ereignisstempel für die Nachverarbeitung sowie einer Gewichtung der Ergebnisse |
JP5275612B2 (ja) * | 2007-07-18 | 2013-08-28 | 国立大学法人 和歌山大学 | 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法 |
JP2009044268A (ja) * | 2007-08-06 | 2009-02-26 | Sharp Corp | 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、及び、記録媒体 |
CN101996628A (zh) * | 2009-08-21 | 2011-03-30 | 索尼株式会社 | 提取语音信号的韵律特征的方法和装置 |
JP5549842B2 (ja) * | 2009-09-15 | 2014-07-16 | 横河電機株式会社 | コリオリ流量計および周波数測定方法 |
JP5696828B2 (ja) * | 2010-01-12 | 2015-04-08 | ヤマハ株式会社 | 信号処理装置 |
EP3199956B1 (de) * | 2016-01-28 | 2020-09-09 | General Electric Technology GmbH | Vorrichtung zur bestimmung der frequenz eines elektrischen signals und zugehöriges verfahren |
JP6715740B2 (ja) * | 2016-10-13 | 2020-07-01 | 株式会社日立製作所 | 電力系統の潮流監視装置、電力系統安定化装置および電力系統の潮流監視方法 |
CN108181486B (zh) * | 2018-01-25 | 2019-12-03 | 中国科学院电子学研究所 | 加速度信号的处理方法及装置 |
CN112927715B (zh) * | 2021-02-26 | 2024-06-14 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频处理方法、设备及计算机可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8900520A (nl) | 1989-03-03 | 1990-10-01 | Philips Nv | Probabilistische toonhoogtemeter. |
US5214708A (en) | 1991-12-16 | 1993-05-25 | Mceachern Robert H | Speech information extractor |
JP3112654B2 (ja) | 1997-01-14 | 2000-11-27 | 株式会社エイ・ティ・アール人間情報通信研究所 | 信号分析方法 |
-
1997
- 1997-01-14 JP JP09017505A patent/JP3112654B2/ja not_active Expired - Fee Related
- 1997-06-30 CA CA002209417A patent/CA2209417C/en not_active Expired - Fee Related
- 1997-07-02 DE DE69700087T patent/DE69700087T2/de not_active Expired - Lifetime
- 1997-07-02 DK DK97111036T patent/DK0853309T3/da active
- 1997-07-02 EP EP97111036A patent/EP0853309B1/de not_active Expired - Lifetime
- 1997-08-04 US US08/905,545 patent/US6014617A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10110168C1 (de) * | 1999-10-13 | 2002-08-22 | Toyota Motor Co Ltd | Vorrichtung und Verfahren zur Spitzenzeiterfassung |
Also Published As
Publication number | Publication date |
---|---|
JP3112654B2 (ja) | 2000-11-27 |
DE69700087D1 (de) | 1999-02-11 |
JPH10197575A (ja) | 1998-07-31 |
EP0853309B1 (de) | 1998-12-30 |
CA2209417C (en) | 2000-11-07 |
CA2209417A1 (en) | 1998-07-14 |
US6014617A (en) | 2000-01-11 |
DK0853309T3 (da) | 1999-09-13 |
EP0853309A1 (de) | 1998-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69700087T2 (de) | Gerät und Verfahren zur Signalanalyse | |
DE69329511T2 (de) | Verfahren und Einrichtung zum Unterscheiden zwischen stimmhaften und stimmlosen Lauten | |
DE69932786T2 (de) | Tonhöhenerkennung | |
DE60303214T2 (de) | Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden | |
DE69700084T2 (de) | Verfahren zur Transformierung eines periodischen Signales unter Verwendung eines geplätteten Spectrogrammes, Verfahren zur Transformierung von Schall bei Verwendung von Phasenkomponenten und Verfahren zur Analyse eines Signales unter Verwendung einer optimalen Interpolationsfunktion | |
DE3687815T2 (de) | Verfahren und vorrichtung zur sprachanalyse. | |
DE69009545T2 (de) | Verfahren zur Sprachanalyse und -synthese. | |
DE3789476T2 (de) | Digitaler Vocoder. | |
DE69613646T2 (de) | Verfahren zur Sprachdetektion bei starken Umgebungsgeräuschen | |
DE3306730C2 (de) | ||
DE69420400T2 (de) | Verfahren und gerät zur sprechererkennung | |
DE69615832T2 (de) | Sprachsynthese mit wellenformen | |
DE69901606T2 (de) | Breitbandsprachsynthese von schmalbandigen sprachsignalen | |
DE69032551T2 (de) | Einrichtung zur Sprachkodierung | |
DE69529356T2 (de) | Wellenforminterpolation mittels Zerlegung in Rauschen und periodische Signalanteile | |
DE60013785T2 (de) | VERBESSERTE SUBJEKTIVE QUALITäT VON SBR (SPECTRAL BAND REPLICATION)UND HFR (HIGH FREQUENCY RECONSTRUCTION) KODIERVERFAHREN DURCH ADDIEREN VON GRUNDRAUSCHEN UND BEGRENZUNG DER RAUSCHSUBSTITUTION | |
DE69518454T2 (de) | Abschätzung von Anregungsparametern | |
DE69720134T2 (de) | Spracherkenner unter Verwendung von Grundfrequenzintensitätsdaten | |
DE69618408T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
DE2622423C3 (de) | Elektrische Anordnung zur Übertragung oder Speicherung eines Sprachoder Tonsignals in kodierter Form | |
DE69317802T2 (de) | Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern | |
DE69702261T2 (de) | Sprachkodierung | |
DE102019119776A1 (de) | Zeitverschachtelte digital-analog-wandler-korrektur | |
DE102017104207A1 (de) | Verfahren und Vorrichtung zur Bestimmung von Maschinendrehzahlen | |
DE60024403T2 (de) | Verfahren zur extraktion von klangquellen-informationen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: ADVANCED TELECOMMUNICATIONS RESEARCH INSTITUTE INT |