DE102021103175A1 - Verfahren und audioverarbeitungseinheit zur erfassung eines tons - Google Patents

Verfahren und audioverarbeitungseinheit zur erfassung eines tons Download PDF

Info

Publication number
DE102021103175A1
DE102021103175A1 DE102021103175.3A DE102021103175A DE102021103175A1 DE 102021103175 A1 DE102021103175 A1 DE 102021103175A1 DE 102021103175 A DE102021103175 A DE 102021103175A DE 102021103175 A1 DE102021103175 A1 DE 102021103175A1
Authority
DE
Germany
Prior art keywords
audio signal
analysis
energy level
frequency
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102021103175.3A
Other languages
English (en)
Inventor
Dimitrios Grimanis
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tymphany Acoustic Technology Huizhou Co Ltd
Original Assignee
Tymphany Acoustic Technology Huizhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tymphany Acoustic Technology Huizhou Co Ltd filed Critical Tymphany Acoustic Technology Huizhou Co Ltd
Publication of DE102021103175A1 publication Critical patent/DE102021103175A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/45Prevention of acoustic reaction, i.e. acoustic oscillatory feedback
    • H04R25/453Prevention of acoustic reaction, i.e. acoustic oscillatory feedback electronically
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

Die Erfindung bezieht sich auf ein Verfahren zum Erkennen eines markanten Tons eines Eingangsaudiosignals. Das Verfahren umfasst die folgenden Schritte: Erzeugen eines ersten Analyseaudiosignals basierend auf dem Eingangsaudiosignal; Erzeugen eines zweiten Analyseaudiosignals basierend auf dem Eingangsaudiosignal, wobei ein Analyseaudiosignal des ersten Analyseaudiosignals und des zweiten Analyseaudiosignals durch Anwenden eines Analyseaudiofilters auf das Eingangsaudiosignal erzeugt wird; Vergleichen des ersten Analyseaudiosignals und des zweiten Analyseaudiosignals, um einen Energiepegelkontrast zu erhalten; und Bestimmen einer Darstellung des markanten Tons durch Umwandeln des Energiepegelkontrasts durch eine Kontrast-zu-Frequenz-Abbildungsfunktion.

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf ein Verfahren zum Erkennen eines Tons eines Audiosignals. Die Erfindung betrifft ferner eine Audioverarbeitungseinheit zur Detektion eines Tons eines Audiosignals und die Verwendung einer Audioverarbeitungseinheit.
  • Hintergrund der Erfindung
  • Verschiedene Ansätze existieren zur Detektion von Tönen oder eines markanten Tons eines Audiosignals. Ein Beispiel ist einen Frequenzzähler, der einfach die Anzahl der Schwingungszyklen innerhalb einer festgelegten Zeitspanne zählen kann, zu verwenden. Dieser Ansatz ist jedoch anfällig für Fehler, z. B. kann, wenn ein erster Oberton im Signal vorhanden ist, der Frequenzzähler doppelt so viele Schwingungen erkennen. Ein anderer Ansatz ist die Verwendung eines Spektrumanalysators, der zum Beispiel auf der Durchführung einer Fourier-Transformation des Audiosignals basieren kann. Eine solche Analyse kann jedoch relativ langsam sein und/oder ein hohes Maß an Rechenleistung erfordern. Ein dritter Ansatz ist viele separate Bandpassfilter zur Isolierung vieler einzelner Frequenzsegmente zu verwenden, was wiederum die Implementierung einer umfangreichen Anzahl von Komponenten oder einer umfangreichen Rechenleistung erfordern kann.
  • Zusammenfassung der Erfindung
  • Die Erfinder haben die oben erwähnten Probleme und Herausforderungen im Zusammenhang mit der Erkennung eines Tons eines Audiosignals erkannt und daraufhin die nachfolgend beschriebene Erfindung gemacht, die eine solche Erkennung verbessern kann.
  • Die Erfindung betrifft ein Verfahren zum Erkennen eines markanten Tons eines Eingangsaudiosignals, wobei das Verfahren die folgenden Schritte umfasst:
    • Erzeugen eines ersten Analyseaudiosignals basierend auf dem Eingangsaudiosignal;
    • Erzeugen eines zweiten Analyseaudiosignals basierend auf dem Eingangsaudiosignal, wobei ein Analyseaudiosignal des ersten Analyseaudiosignals und des zweiten Analyseaudiosignals durch Anwenden eines Analyseaudiofilters auf das Eingangsaudiosignal erzeugt wird;
    • Vergleichen des ersten Analyseaudiosignals und des zweiten Analyseaudiosignals, um einen Energiepegelkontrast zu erhalten; und
    • Bestimmen einer Darstellung des markanten Tons durch Konvertieren des Energiepegelkontrasts durch eine Kontrast-zu-Frequenz-Abbildungsfunktion.
  • In einer beispielhaften Ausführungsform der Erfindung erleichtert eine Audioverarbeitungseinheit das erfindungsgemäße Verfahren. Es wird ein Eingangsaudiosignal bereitgestellt, das von einem einzelnen markanten Ton dominiert wird. Es kann zum Beispiel ein Audiosignal von einem Musikinstrument sein, das einen einzelnen Musikton spielt. Ein erster Analyseaudiofilter und ein zweiter Analyseaudiofilter werden auf dieses Eingangsaudiosignal angewendet, um ein erstes Analyseaudiosignal und ein zweites Analyseaudiosignal zu erzeugen. Der erste Audiofilter ist ein Bandpassfilter, der bei 40 Hz zentriert ist, und der zweite Audiofilter ist ein Bandpassfilter, der bei 80 Hz zentriert ist. Wenn der markante Ton bei etwa 40 Hz liegt, dämpft der erste Filter das Eingangsaudiosignal nicht wesentlich ab, um das erste Analyseaudiosignal zu erzeugen, aber der zweite Bandpassfilter dämpft das Eingangsaudiosignal wesentlich ab, z. B. um 20 dB, um das zweite Analyseaudiosignal zu erzeugen. Ähnlich, wenn der markante Ton bei ca. 80 Hz liegt, dämpft der erste Audiofilter dämpft das Eingangsaudiosignal erheblich, um das erste Analyseaudiosignal zu erzeugen, aber der zweite Audiofilter dämpft das Eingangsaudiosignal nicht erheblich, um das zweite Analyseaudiosignal zu erzeugen. Generell, wenn der markante Ton irgendwo zwischen den Mittenfrequenzen der beiden Filter liegt, enthalten das erste und das zweite Analyseaudiosignal in Kombination eine eindeutige relative Abschwächung des Eingangsaudiosignals. Diese eindeutige Beziehung zwischen der Frequenz und der relativen Dämpfung kann analysiert werden, um eine Darstellung des markanten Tons zu erhalten. Das erste Analyseaudiosignal und das zweite Analyseaudiosignal werden verglichen, um einen Energiepegelkontrast zu erhalten, der auf die relative Dämpfung schließen lässt. Dies kann z. B. einfach durch Messen eines Energiepegels des ersten Audiosignals und eines Energiepegels des zweiten Audiosignals und Subtraktion dieser Werte erfolgen, um die Differenz zwischen ihren Energiepegeln zu erhalten. Der Energiepegelkontrast kann dann in eine Darstellung des markanten Tons durch eine Kontrast-zu-Frequenz-Abbildungsfunktion umgewandelt werden, die vorzugsweise bezeichnend für die Beziehung zwischen der relativen Dämpfung und der Frequenz des markanten Tons ist. Die Darstellung des markanten Tons kann zum Beispiel bezeichnend für eine Frequenz des markanten Tons sein. Sie kann alternativ auch nur ein binäres Signal sein, z.B. ein Signal, das anzeigt, ob ein markanter Ton innerhalb eines bestimmten Frequenzintervalls im Eingangsaudiosignal vorhanden ist oder nicht.
  • Die Erfindung ermöglicht somit die Detektion eines markanten Tons in einem Eingangsaudiosignal. Im Stand der Technik gibt es verschiedene andere Ansätze zur Detektion eines markanten Tons. Im Vergleich dazu kann die Erfindung eine Darstellung eines markanten Tons bereitstellen, die weniger fehleranfällig, unabhängig von der Lautstärke des Eingangsaudiosignals, schneller, kostengünstiger und einfacher zu implementieren sein kann und/oder weniger Rechenleistung erfordert. Einige dieser Vorteile oder andere Vorteile können in unterschiedlichem Ausmaß und in unterschiedlichen Kombinationen durch verschiedene Ausführungsformen der vorliegenden Erfindung erreicht werden.
  • Die Erfindung ist daher nützlich in Anwendungen, in denen das Erkennen eines markanten Tons erforderlich ist, beispielsweise zum Stimmen von Musikinstrumenten, zum Erkennen von Audio-Rückkopplungen, wie z. B. unerwünschten Audio-Rückkopplungen, und zur allgemeinen Audioanalyse. Audio-Rückkopplungen können auch als akustische Rückkopplungen oder als Larsen-Effekt bezeichnet werden. Es ist jedoch zu beachten, dass die Erfindung nicht auf bestimmte Anwendungen beschränkt ist.
  • Figurenliste
  • Verschiedene Ausführungsformen der Erfindung werden im Folgenden unter Bezugnahme auf die Zeichnungen beschrieben, wobei
    • 1a-b eine Ausführungsform der Erfindung und eine zugehörige visuelle Darstellung eines Analyseaudiofilters dieser Ausführungsform illustrieren,
    • 2 illustriert eine Ausführungsform der Erfindung basierend auf zwei Analyseaudiofiltern,
    • 3 illustriert eine visuelle Darstellung von Verfahrensschritten gemäß einer Ausführungsform der Erfindung,
    • 4 illustriert eine Ausführungsform der Erfindung basierend auf zwei Analyseaudiofiltern und drei Analyseaudiokanälen,
    • 5 veranschaulicht eine Ausführungsform der Erfindung basierend auf drei Analysefiltern und zwei Energiepegelkontrasten,
    • 6 illustriert eine Ausführungsform der Erfindung basierend auf drei Analysefiltern, drei Energiepegelkontrasten und einer gewichteten Mittelungseinheit,
    • 7a-b illustrieren eine visuelle Darstellung von zwei Analyseaudiofiltern und eine zugehörige Darstellung einer relativen Abschwächung,
    • 8a-b illustrieren eine visuelle Darstellung von drei Analyseaudiofiltern und zwei Darstellungen einer relativen Dämpfung, und
    • 9a-c illustrieren visuelle Darstellungen von verschiedenen anderen Analyseaudiofilterkombinationen.
  • Ausführliche Beschreibung
  • Im Folgenden werden verschiedene Konzepte der Erfindung ohne Bezugnahme auf bestimmte Ausführungsformen dargestellt.
  • Ein Audioeingangssignal ist eine Art von Audiosignal, das beispielsweise als eine Art von digitalem oder analogem Signal verstanden werden kann, das hörbaren Schall darstellt. Das Audioeingangssignal kann beispielsweise geeignet sein, einem Lautsprecher zugeführt zu werden, optional mit einem oder mehreren Zwischenschritten der Verstärkung, Umwandlung (z. B. digital-zu-analog) oder einer anderen Verarbeitung. Das Eingangsaudiosignal kann z. B. über einen Audiosignaleingang zugeführt werden, z. B. über eine drahtgebundene oder drahtlose Verbindung zu einer Audiosignalquelle. Das Eingangsaudiosignal kann z. B. auch über ein Mikrofon bereitgestellt werden, das einen Ton aufnimmt, auf dem das Eingangsaudiosignal basiert, oder über einen digitalen Speicher.
  • Ein typisches Audiosignal kann aus mehreren Frequenzen zusammengesetzt sein. Dies kann z. B. durch eine Fourier-Transformation des Signals ersichtlich sein. Ein markanter Ton kann als eine Frequenzkomponente eines Audiosignals verstanden werden, bei der diese Frequenzkomponente zumindest teilweise von anderen Frequenzen des Audiosignals unterscheidbar ist, z. B. durch eine höhere Amplitude. Ein Beispiel für ein Audiosignal mit unterscheidbaren Frequenzen ist ein Audiosignal, das auf dem Spielen eines Musiktons auf einem Musikinstrument basiert. Ein solches Audiosignal kann z. B. sowohl eine Eigen-/Grundfrequenz als auch mehrere harmonische Frequenzen enthalten, wobei der markante Ton die Frequenzkomponente mit dem höchsten Pegel innerhalb des analysierten Frequenzbandes ist. Im Falle von Resonanz oder konstruktiven Interferenzen in einem Audiosystem kann ein markanter Ton bei der Resonanzfrequenz auftreten, wie z. B. bei Audio-Rückkopplungen. Ein Audiosignal, das aus einem einzelnen Ton besteht, wird als markanter Ton eines solchen Audiosignals betrachtet. Bei Audiosignalen, die aus mehreren Frequenzkomponenten bestehen, z. B. Musik, Sprache, den meisten natürlich vorkommenden Geräuschen, Rauschen usw., kann eine bestimmte Frequenzkomponente als markanter Ton betrachtet werden, wenn der Pegel dieser Frequenzkomponente zumindest teilweise von anderen Frequenzkomponenten oder Hintergrundgeräuschen unterscheidbar ist.
  • Einige Audiosignale setzen sich aus einem Kontinuum von Frequenzen zusammen, die sich dynamisch in Amplitude und Phase ändern. In solchen Fällen kann es sein, dass ein markanter Ton im Spektrum nicht klar unterscheidbar ist. In einigen Ausführungsformen der Erfindung wird besondere Sorgfalt darauf verwendet, solche komplexen Audiosignale zu analysieren, z. B. durch Implementierung zusätzlicher Filter, um dennoch eine genaue Darstellung des markanten Tons zu erhalten. Im Allgemeinen sind Ausführungsformen der Erfindung nicht darauf beschränkt, eine bestimmte Art von Audiosignal zu analysieren oder eine bestimmte Art der Darstellung des markanten Tons bereitzustellen, da eine nützliche Darstellung eines markanten Tons auch aus komplexen Audiosignalen durch unter Verwendung geeigneter Verarbeitungs- und Analysewerkzeuge extrahiert werden kann. Um jedoch die Beschreibung der Erfindung nicht mit unnötigen Details zu vernebeln, wird die Analyse des Eingangsaudiosignals hauptsächlich anhand einfacher Audiosignale als Beispielen erläutert. Ferner ist zu beachten, dass in einigen Ausführungsformen der Erfindung eine Darstellung eines markanten Tons unabhängig von der Komplexität des Audiosignals bereitgestellt werden kann, dass jedoch bei hinreichend komplexen Audiosignalen die Genauigkeit oder Präzision reduziert sein kann.
  • Eine Darstellung eines markanten Tons, vorzugsweise durch Angabe einer Frequenz oder eines Tonnamens, kann beispielsweise eine digitale Darstellung, eine analoge Darstellung, eine visuelle Anzeige oder tatsächliche Schallwellen sein.
  • Ein Analyseaudiofilter kann als ein Audiofilter verstanden werden, der z.B. wiederum eine frequenzabhängige Verstärkerschaltung sein kann, die z.B. im hörbaren Frequenzbereich, z.B. bis 20 kHz, arbeitet. Ein Analyseaudiofilter kann also typischerweise eine frequenzabhängige Verstärkung, Dämpfung, Durchlass und/oder Phasenverschiebung bieten. Ein Audiofilter kann z. B. als digitale Schaltung, als analoge Schaltung und/oder programmiert auf einer programmierbaren Einheit, wie z. B. einem digitalen Signalprozessor, implementiert sein. Beispiele für Audiofilter sind Tiefpassfilter, Hochpassfilter, Bandpassfilter und Allpassfilter. Ein Audiofilter kann in einer Audiofiltereinheit implementiert sein, die sowohl als physikalische Schaltung als auch als digital programmierte Einheit verstanden werden kann.
  • Wenn ein Audiofilter auf ein Audiosignal angewendet wird, kann dies als Erzeugung eines anderen Audiosignals interpretiert werden, z. B. kann die Anwendung eines Analyseaudiofilters auf ein Eingangsaudiosignal zur Erzeugung eines Analyseaudiosignals führen, z. B. eines ersten oder eines zweiten Analyseaudiosignals. Obwohl typischerweise mindestens einer der Analyseaudiofilter gefiltert ist, sind Analyseaudiosignale nicht auf gefilterte Signale beschränkt. Z.B. kann eines der ersten und zweiten Analyseaudiosignale ein gefiltertes Signal sein, während das andere nicht gefiltert ist.
  • Ein Energiepegelkontrast kann als eine Differenz zwischen den Energiepegeln zweier Audiosignale verstanden werden. Ein Energiepegel eines Audiosignals kann zum Beispiel ein RMS-Mittelwert, ein Spitzenwert, ein Mittelwert des Quadrats des Audiosignals oder ein Mittelwert einer Hüllkurve des Audiosignals sein. Ein Energiepegel eines Audiosignals kann auch mit einem Leistungspegel des Audiosignals zusammenhängen oder diesen anzeigen. Typischerweise kann ein Energiepegel ein Indikator für die Dämpfung eines Audiosignals sein. Wenn z. B. ein Audiosignal durch einen Audiofilter gedämpft wurde, ist sein Energiepegel niedriger als wenn das Audiosignal nicht gedämpft wurde. Ein Energiepegel kann z. B. in dB quantifiziert werden, z. B. relativ zu einer Bezugsenergie/-intensität/Audiolautstärke.
  • Der durch den Vergleich zweier Audiosignale erhaltene Energiepegelkontrast kann z. B. als Verhältnis oder als Subtraktion zwischen den Energiepegeln der beiden Signale ermittelt werden. Der Energiepegelkontrast erfordert nicht unbedingt die explizite Berechnung zweier Energiepegel, sondern kann z. B. durch den Vergleich zweier Audiosignale gewonnen werden. Der Energiepegelkontrast kann z. B. aus dem Verhältnis zweier Audiosignale gewonnen werden. Alternativ kann der Energiepegelkontrast auch durch explizite Berechnung eines (ersten) Energiepegels eines ersten Audiosignals und eines (zweiten) Energiepegels eines zweiten Audiosignals ermittelt werden. Die Ermittlung des Energiepegels eines Audiosignals kann z. B. durch einen Pegeldetektor erleichtert werden. Das Ermitteln eines Energiepegelkontrasts kann beispielsweise durch einen Energiepegelvergleicher erfolgen, der beispielsweise zwei Audiosignale oder zwei Energiepegel als Eingänge verwenden kann.
  • Eine Kontrast-zu-Frequenz-Abbildungsfunktion kann als eine physikalische oder digitale Einheit verstanden werden, die bei der Umwandlung eines Energiepegelkontrasts in eine entsprechende Darstellung des markanten Tons verwendet werden kann. In typischen Ausführungsformen der Erfindung hängt der Energiepegelkontrast aufgrund unterschiedlicher Analyseaudiofilter von der Frequenz des markanten Tons ab, zumindest in einem gewissen Frequenzbereich. Die Kontrast-zu-Frequenz-Abbildungsfunktion kann auf dieser Abhängigkeit basieren. Die Kontrast-zu-Frequenz-Abbildungsfunktion kann also z. B. eine Lookup-Tabelle einer stückweisen mathematischen Funktion sein. Sie kann z. B. in einer Frequenzabbildungseinheit implementiert sein.
  • In einigen Ausführungsformen der Erfindung kann eine Kontrast-zu-Frequenz-Abbildungsfunktion mehrere Energiepegelkontraste als Eingänge haben, beispielsweise einen Energiepegelkontrast aus einem ersten und einem zweiten Analyseaudiosignal und einen Energiepegelkontrast aus dem zweiten und einem dritten Analyseaudiosignal.
  • Im Folgenden werden verschiedene Ausführungsformen der Erfindung unter Bezugnahme auf die Figuren beschrieben.
  • 1a-b illustrieren eine Ausführungsform der Erfindung und eine zugehörige visuelle Darstellung eines Analyseaudiofilters dieser Ausführungsform. Insbesondere zeigt 1a eine schematische Darstellung der Ausführungsform, während 1b die frequenzabhängige Wirkung einer Filtereinheit 4a dieser Ausführungsform auf die Energie eines Audiosignals veranschaulicht.
  • Die Ausführungsform ist eine Audioverarbeitungseinheit 1, beispielsweise eine Audioverarbeitungseinheit, die zumindest teilweise mit einem digitalen Signalprozessor realisiert ist. Die Audioverarbeitungseinheit 1 empfängt ein Eingangsaudiosignal 3, z.B. von einem Audiosignaleingang. In dieser beispielhaften Beschreibung umfasst das Eingangsaudiosignal 3 einen markanten Ton.
  • Dieses Eingangsaudiosignal wird in zwei Analysepfade aufgeteilt; einen ersten Analyseaudiokanal 14a und einen zweiten Analyseaudiokanal 14b. Im ersten Analysepfad wird das Eingangsaudiosignal einer Filtereinheit 4a zugeführt, die einen Analyseaudiofilter anwendet. In dieser beispielhaften Ausführungsform ist die Filtereinheit 4a so eingerichtet, dass sie einen Tiefpassfilter auf das Eingangsaudiosignal anwendet, um ein erstes Analyseaudiosignal 5a zu erzeugen. Im zweiten Analyseaudiokanal 14b dient das Eingangsaudiosignal 3 als das zweite Analyseaudiosignal 5b. Der Unterschied zwischen dem ersten Analyseaudiosignal 5a und dem zweiten Analyseaudiosignal 5b resultiert also aus der Filterung, der die Signale unterzogen wurden.
  • Die Wirkung des Filters ist in 1b detailliert dargestellt. Die horizontale Achse ist eine Frequenzachse in Einheiten von Hz, während die vertikale Achse eine Energiepegelachse in Einheiten von dB ist. Die frequenzabhängige Wirkung, die die Filtereinheit 4a auf ein Audiosignal ausübt, ist als eine erste Frequenzdarstellung der Energiepegelabschwächung 15a dargestellt. Da es sich bei der Filtereinheit um ein Tiefpassfilter handelt, dämpft sie Signale bei niedrigen Frequenzen unterhalb von ca. 50 Hz minimal. Frequenzen oberhalb von 50 Hz werden jedoch gedämpft, und je höher die Frequenzen sind, desto größer ist die Abschwächung. Ein Eingangsaudiosignal 3, das über den ersten Analyseaudiokanal 14a und die Filtereinheit 4a zum Energiepegelvergleicher 8a gelangt, wird also gemäß der dargestellten ersten Frequenzdarstellung der Energiepegeldämpfung 15a basierend auf der Frequenz des Audiosignals abgeschwächt. Im Gegensatz dazu wird ein Eingangsaudiosignal 3, das über den zweiten Analyseaudiokanal 14b zum Energiepegelvergleicher 8a gelangt, nicht gedämpft. Mit anderen Worten, es wird gemäß der dargestellten zweiten Frequenzdarstellung der Energiepegeldämpfung 15b gedämpft, die eine frequenzunabhängige Linie bei 0 dB ist.
  • Das erste und das zweite Analyseaudiosignal 5a, 5b werden beide einem Energiepegelvergleicher 8a zugeführt, der so eingerichtet ist, dass er die beiden Signale 5a, 5b vergleicht, um einen Energiepegelkontrast der beiden Signale zu erhalten. Wenn die Energie der beiden Signale unterschiedlich ist, kann dies im Allgemeinen durch den Energiepegelkontrast angezeigt werden. Die genauen Details hängen von der Art des Filters ab und davon, wie genau der Energiepegelkontrast berechnet wird, welche zwischen verschiedenen Ausführungsformen variieren.
  • In dieser Ausführungsform wird das Verhältnis der beiden Analyseaudiosignale 5a, 5b erzeugt, und ein RMS-Mittelwert des resultierenden Verhältnisses wird gemessen.
  • Der erhaltene Energiepegelkontrast 9a wird einer Frequenzabbildungseinheit 10a zugeführt. Hier wird der Energiepegelkontrast 9a über eine Kontrast-zu-Frequenz-Abbildungsfunktion in eine Darstellung des markanten Tons 11, z.B. eine Frequenzdarstellung des markanten Tons, umgewandelt. Die Kontrast-zu-Frequenz-Abbildungsfunktion kann typischerweise vorprogrammiert sein und auf der Wahl der Filter für die Ausführungsform basieren. Sie kann z. B. auf einem Diagramm ähnlich dem in 1b dargestellten basieren. Sie sollte vorzugsweise in der Lage sein, einen zugeführten Kontrast in eine entsprechende Frequenz umzuwandeln, z. B. über eine Lookup-Tabelle oder eine mathematische Funktion.
  • Die Ausführungsform ist also in der Lage, ein zugeführtes Eingangsaudiosignal in eine Darstellung des markanten Tons 11 zu analysieren.
  • Wenn z.B. ein Eingangsaudiosignal 3 von einem markanten Ton bei einer Frequenz von ca. 100 Hz dominiert wird, wird das erste Analyseaudiosignal 5a um ca. 6 dB gegenüber dem Eingangsaudiosignal 3 abgeschwächt. Das zweite Analyseaudiosignal 5b wird nicht gedämpft, und seine Differenz zum Eingangsaudiosignal ist daher 0 dB. Der Energiepegelvergleicher 8a vergleicht die Energiepegel der beiden Signale 5a, 5b und erhält einen Energiepegelkontrast 9a von ca. 6 dB. Dieser Energiepegelkontrast 9a wird der Frequenzabbildungseinheit 10a zugeführt, die den Kontrast 9a über eine Lookup-Tabelle in eine Frequenzdarstellung des markanten Tons umwandelt. Diese Lookup-Tabelle zeigt an, dass ein Energiepegelkontrast von ca. 6 dB einer Frequenz des markanten Tons von ca. 100 Hz entsprechen muss. Die Darstellung des markanten Tons 11 kann also z. B. eine digitale oder analoge Darstellung von 100 Hz sein, die einem Benutzer oder einer weiteren Audioanalyse zugeführt wird. Zu beachten ist, dass in diesem Fall, wenn die Lautstärke des Eingangsaudiosignals geändert wird, der erhaltene Energiepegelkontrast und damit die Darstellung des markanten Tons weitgehend unbeeinflusst bleibt.
  • Wird ein Eingangsaudiosignal beispielsweise von einem markanten Ton bei einer Frequenz von ca. 200 Hz dominiert, so ist der Analysevorgang ähnlich, nur mit einem Unterschied der Energiepegel von ca. 17 dB, den die Frequenzabbildungseinheit in eine Darstellung von ca. 200 Hz umsetzen kann.
  • Es ist zu beachten, dass diese konkrete Ausführungsform insofern eingeschränkt ist, als dass Frequenzen unterhalb von ca. 50 Hz in etwa die gleiche Dämpfung erfahren und dementsprechend diese Dämpfung nicht genau in eine Frequenz abgebildet werden kann. Darüber hinaus kann bei ausreichend hohen Frequenzen und ausreichend geringer Lautstärke des Eingangsaudiosignals das Eingangsaudiosignal 3 durch die Filtereinheit 4a so stark gedämpft werden, dass es aufgrund eines schlechten Signal-zu-Rausch-Verhältnisses des Analyseaudiosignals nicht möglich ist, einen Energiepegelkontrast 9a zu erhalten, der die Frequenz korrekt wiedergibt. Diese Ausführungsform ist daher in erster Linie genau für markante Töne von ca. 50 Hz bis ca. 500 Hz, abhängig von der Lautstärke des Eingangsaudiosignals 3. Es ist jedoch zu beachten, dass Filtertypen und - konfigurationen im Rahmen der Erfindung variiert werden können, was beispielsweise zu anderen Frequenzgrenzen oder sogar keinen Frequenzgrenzen führen kann (z. B. durch die Implementierung einer großen Anzahl von eindeutigen Filtern, die alle Frequenzen abdecken). Somit ist die Erfindung nicht auf bestimmte Frequenzbereiche beschränkt.
  • 2 zeigt eine Ausführungsform der Erfindung, basierend auf zwei Analyseaudiofiltern 4a, 4b. Im Vergleich zu der in 1a dargestellten Ausführungsform umfasst die in 2 dargestellte Ausführungsform zusätzlich eine zweite Filtereinheit 4b, so dass der erste Analyseaudiokanal 14a eine erste Filtereinheit 4a und der zweite Analyseaudiokanal 14b eine zweite Filtereinheit 14b aufweist. Ferner weist die Ausführungsform einen ersten Pegeldetektor 6a zwischen der ersten Filtereinheit 4a und dem Energiepegelvergleicher 8a als Teil des ersten Analyseaudiokanals 14a und einen zweiten Pegeldetektor 6b zwischen der zweiten Filtereinheit 4b und dem Energiepegelvergleicher 8a als Teil des zweiten Analyseaudiokanals 14b auf. Weiterhin verfügt die Ausführungsform über einen expliziten Audiosignaleingang 2 zur Bereitstellung des Eingangsaudiosignals 3. Im Allgemeinen kann der Audiosignaleingang 2 zum Beispiel eine drahtgebundene Verbindung, eine drahtlose Verbindung, ein Mikrofon oder ein Datenspeicher sein. In dieser Ausführungsform basiert der Eingang 2 auf einem Mikrofon.
  • In dieser Ausführungsform wird das Eingangsaudiosignal 3 also separat durch eine erste Filtereinheit 4a und eine zweite Filtereinheit 4b gefiltert. Die beiden Filtereinheiten 4a, 4b unterscheiden sich in dem Sinne, dass sie unterschiedliche Analyseaudiofilter anwenden. Sie können z. B. beide Bandpassfilter mit demselben Gütefaktor (Q), aber mit unterschiedlichen Filtermittenfrequenzen anwenden.
  • Die Anwendung von zwei separaten Filtern auf das Eingangsaudiosignal 3 erweitert die Flexibilität des Verfahrens. Zum Beispiel können zwei separate Filter implementiert werden, um die Präzision, die Genauigkeit oder einen Frequenzbereich, in dem das Verfahren eine genaue Darstellung des markanten Tons liefern kann, zu verbessern.
  • Zuführen des Eingangsaudiosignals 3 zur ersten Filtereinheit 4a erzeugt das erste Analyseaudiosignal 5a, und auf ähnliche Weise wird durch Zuführen des Eingangsaudiosignals 3 zur zweiten Filtereinheit 4b das zweite Analyseaudiosignal 5b erzeugt. Das erste und das zweite Analyse-Audiosignal 5a, 5b werden jeweils einem ersten Pegeldetektor 6a und einem zweiten Pegeldetektor 6b zugeführt. Jeder dieser Pegeldetektoren 6a, 6b ist in der Lage, ein zugeführtes Analyseaudiosignal zu messen, um einen Energiepegel dieses Signals zu erfassen. Somit messen die beiden Pegeldetektoren 6a, 6b die Analyse-Audiosignale 5a, 5b, um zwei separate Energiepegel 7a, 7b zu liefern.
  • Die beiden Energiepegel 7a, 7b werden dem Energiepegelvergleicher zugeführt, der die Pegel 7a, 7b vergleicht, um einen Energiepegelkontrast 9a zu erhalten. Wenn zum Beispiel der erste Energiepegel ungefähr -7 dB und der zweite Energiepegel ungefähr -15 dB beträgt, kann der Energiepegelkontrast ungefähr 8 dB betragen.
  • Wie zuvor erläutert, wenn ein Energiepegelkontrast 9a erhalten wurde, kann er durch eine Frequenzabbildungseinheit 10a umgewandelt werden, um eine Darstellung des markanten Tons 11 festzulegen.
  • 3 zeigt eine visuelle Darstellung von Verfahrensschritten gemäß einer Ausführungsform der Erfindung. Diese Ausführungsform der Erfindung ist in der Lage, einen markanten Ton eines Eingangsaudiosignals zu erkennen und umfasst vier Verfahrensschritte S1-S4. Es ist jedoch zu beachten, dass Ausführungsformen der Erfindung nicht auf diese speziellen Verfahrensschritte beschränkt sind.
  • In einem ersten Schritt S1 wird ein erstes Analyseaudiosignal basierend auf dem Eingangsaudiosignal erstellt.
  • In einem nächsten Schritt S2 wird ein zweites Analyseaudiosignal basierend auf dem Eingangsaudiosignal erstellt. Ein Signal des ersten Analysesignals und des zweiten Analysesignals wird durch Anwendung eines Analyseaudiofilters auf das Eingangsaudiosignal erstellt. Das andere Signal kann z. B. das Eingangsaudiosignal sein. Zum Beispiel kann das erste Analyseaudiosignal durch Anwenden des Analyseaudiofilters auf das Eingangsaudiosignal erstellt werden, während das zweite Analyseaudiosignal das Eingangsaudiosignal ist. Oder zum Beispiel kann das zweite Analyseaudiosignal durch Anwenden des Analyseaudiofilters auf das Eingangsaudiosignal erstellt werden, während das erste Analyseaudiosignal das Eingangsaudiosignal ist.
  • Auch wenn die beiden Schritte S1, S2 des Erstellens des ersten und zweiten Analyseaudiosignals als separate Schritte dargestellt sind, können sie beispielsweise parallel ausgeführt werden.
  • Als ein nächster Schritt werden das erste Analyseaudiosignal und das zweite Analyseaudiosignal verglichen, um einen Energiepegelkontrast zu erhalten.
  • Als ein nächster Schritt wird eine Darstellung des markanten Tons festgelegt, indem der Energiepegelkontrast durch eine Kontrast-zu-Frequenz-AbbildungsFunktion umgewandelt wird.
  • In einigen Ausführungsformen der Erfindung wird das Verfahren auf einer Schaltung oder einem Prozessor implementiert, der die Schritte des Verfahrens kontinuierlich wiederholt durchführt. Jeder der Schritte kann, zumindest teilweise, parallel ausgeführt werden.
  • 4 zeigt eine Ausführungsform der Erfindung basierend auf zwei Analyseaudiofiltern 4a, 4c und drei Analyseaudiokanälen 14a, 14b, 14c.
  • Ein Eingangsaudiosignal 3 von einem Audiosignaleingang 2 wird allen drei Analyseaudiokanälen 14a, 14b, 14c zugeführt. Ein erster Analyseaudiokanal 14a hat eine erste Filtereinheit 4a, die das Eingangsaudiosignal 3 filtert, um ein erstes Analyseaudiosignal 5a zu erzeugen. In einem zweiten Analyseaudiokanal 14b dient das Eingangsaudiosignal als zweites Analyseaudiosignal 5b. Schließlich weist ein dritter Analyseaudiokanal 14c eine dritte Filtereinheit 4c auf, die das Eingangsaudiosignal filtert, um ein drittes Analyseaudiosignal 5c zu erzeugen.
  • Eine bestimmte Filtereinheit kann auch als Filtereinheit eines bestimmten Analyse-Audiokanals oder eines bestimmten Audiosignals bezeichnet werden. Zum Beispiel kann die dritte Filtereinheit 5c auch als Filtereinheit des dritten Analyse-Audiokanals 14c oder als Filtereinheit des dritten Analyseaudiosignals 5c bezeichnet werden.
  • In der Ausführungsform werden das erste Analyseaudiosignal 5a und das zweite Analyseaudiosignal einem ersten Energiepegelvergleicher 8a zugeführt, der die Signale vergleicht, um einen ersten Energiepegelkontrast 9a zu erhalten. Zusätzlich werden das zweite Analyseaudiosignal und das dritte Analyseaudiosignal einem zweiten Energiepegelvergleicher 8b zugeführt, der die Signale vergleicht, um einen zweiten Energiepegelkontrast 9b zu erhalten. Das Erhalten eines zweiten Energiepegelkontrasts 9b kann das Erhalten eines ersten Energiepegelkontrasts 9a ergänzen. Der zweite Energiepegelkontrast kann z.B. einen anderen Frequenzbereich haben, in dem er zur Bestimmung einer Darstellung des dominanten Tons geeignet ist.
  • Sowohl der erste Energiepegelkontrast 9a als auch der zweite Energiepegelkontrast 9b werden einer Frequenzabbildungseinheit 10a zugeführt, die in der Lage ist, auf Basis der Kontraste 9a, 9b eine Darstellung des markanten Tons 11 zu bestimmen. Die Frequenzabbildungseinheit kann z.B. eine höherdimensionale Lookup-Tabelle anwenden, um die Kontraste 9a, 9b in eine Darstellung des markanten Tons 11 umzuwandeln.
  • 5 zeigt eine Ausführungsform der Erfindung basierend auf drei Analysefiltern 4a, 4b, 4c und zwei Energiepegelkontrasten. Diese Ausführungsform ist der Ausführungsform von 4 im Wesentlichen ähnlich. Allerdings umfasst die Ausführungsform von 5 zusätzlich eine zweite Filtereinheit. So umfasst der zweite Analyseaudiokanal 14b die zweite Filtereinheit 4b, die das Eingangsaudiosignal 3 filtert, um ein zweites Analyseaudiosignal 5b zu erzeugen. Nachdem das erste Analyseaudiosignal 5a, das zweite Analyseaudiosignal 5b und das dritte Analyseaudiosignal 5c gebildet worden sind, werden diese Signale von zwei Energiepegelvergleichern 8a, 8b verarbeitet, um zwei Energiepegelkontraste 9a, 9b zu erhalten, die wiederum einer Frequenzabbildungseinheit zugeführt werden, um eine Darstellung des markanten Tons 11 zu bestimmen.
  • 6 zeigt eine Ausführungsform der Erfindung basierend auf drei Analysefiltern 4a, 4b, 4c, drei Energiepegelkontrasten 9a, 9b, 9c und einer Einheit zur Bildung eines gewichteten Mittelwerts 13.
  • Drei Analyse-Audiosignale 5a, 5b, 5c werden gebildet durch Zuführen des Eingangsaudiosignal 3 zu drei separaten Filtereinheiten 4a, 4b, 4c. Anschließend werden das erste Analyseaudiosignal 5a, das zweite Analyseaudiosignal 5b und das dritte Analyseaudiosignal 5c jeweils einem ersten Pegeldetektor 6a, einem zweiten Pegeldetektor 6b und einem dritten Pegeldetektor 6c zugeführt, um jeweils einen ersten Energiepegel 7a, einen zweiten Energiepegel 7b und einen dritten Energiepegel 7c zu erfassen.
  • Der erste Energiepegel 7a und der zweite Energiepegel 7b werden in einem ersten Energiepegelvergleicher 8a verglichen, um einen ersten Energiepegelkontrast 9a zu erhalten, der zweite Energiepegel 7b und der dritte Energiepegel 7c werden in einem zweiten Energiepegelvergleicher 8b verglichen, um einen zweiten Energiepegelkontrast 9b zu erhalten, und der erste Energiepegel 7a und der dritte Energiepegel 7c werden in einem dritten Energiepegelvergleicher 8c verglichen, um einen dritten Energiepegelkontrast 9c zu erhalten.
  • Jeder der drei separaten Energiepegelkontraste 9a, 9b, 9c wird an eine separate Frequenzabbildungseinheit 10a, 10b, 10c geliefert. Folglich wird der erste Energiepegelkontrast 9a durch eine erste Frequenzabbildungseinheit 10a in eine erste vorläufige Frequenz 12a umgewandelt, der zweite Energiepegelkontrast 9b wird durch eine zweite Frequenzabbildungseinheit 10b in eine zweite vorläufige Frequenz 12b umgewandelt, und der dritte Energiepegelkontrast 9c wird durch eine dritte Frequenzabbildungseinheit 10c in eine dritte vorläufige Frequenz 12c umgewandelt.
  • Jede der drei Frequenzabbildungseinheiten 10a, 10b, 10c kann zum Beispiel eine Kontrast-zu-Frequenz-Abbildungsfunktion anwenden. Vorzugsweise kann eine gegebene Kontrast-zu-Frequenz-Abbildungsfunktion zumindest teilweise mit der kombinierten Frequenzabhängigkeit der Filtereinheiten übereinstimmen, auf der ihre Eingabe basiert.
  • Die drei vorläufigen Frequenzen 12a, 12b, 12c werden alle einer Einheit zur Bildung eines gewichteten Mittelwerts zugeführt, die so eingerichtet ist, dass sie einen gewichteten Mittelwert der drei vorläufigen Frequenzen bestimmt. Die Wichtungen des gewichteten Mittelwertes können z.B. von den eingegebenen vorläufigen Frequenzen 12a, 12b, 12c abhängen. Die Darstellung des markanten Tons 11 kann dann auf der Grundlage des gewichteten Mittelwerts erstellt werden.
  • Durch die Verwendung von drei vorläufigen Frequenzen und einem gewichteten Mittelwert kann es möglich sein, Präzision, Genauigkeit oder einen Frequenzbereich, in dem das Verfahren anwendbar ist, zu verbessern.
  • 7a-b zeigen eine visuelle Darstellung von zwei Analyseaudiofiltern und eine zugehörige Darstellung einer relativen Dämpfung. Wie in 1b sind die horizontalen Achsen Frequenzachsen in Einheiten von Hz, während die vertikalen Achsen Energiepegelachsen in Einheiten von dB sind. Im Gegensatz zu 1b entspricht die visuelle Darstellung in 7a zwei (nicht einem) Analyseaudiofiltern, wie sie z. B. als erste und zweite Filtereinheit in der in 2 dargestellten Ausführungsform realisiert sind. In 7a entsprechen die beiden Frequenzdarstellungen der Energiepegelabschwächung 15a, 15b Bandpassfiltern mit jeweiligen Mittenfilterfrequenzen von etwa 41 Hz und 82 Hz.
  • Die relative Dämpfung, die die beiden Filter auf ein Eingangsaudiosignal mit einem markanten Ton anwenden können, ist als Frequenzdarstellung 15c in 7b dargestellt. Unterhalb von etwa 58 Hz ist die relative Dämpfung größer als 0, und oberhalb davon liegt die relative Dämpfung unter 0 dB. Dies spiegelt wider, dass die erste Frequenzdarstellung 15a höher auf der Dämpfungsachse liegt als die zweite 15b unterhalb dieser Frequenz und umgekehrt.
  • Die relative Dämpfung kann typischerweise für verschiedene Ausführungsformen z.B. Grundlage für den Energiepegelkontrast sein. In einem ungefähren durch die Mittenfilterfrequenzen bestimmten Frequenzbereich, weist die Frequenzdarstellung 15c eine lineare Steigung auf. Diese lineare Steigung kann verwendet werden, um einen Energiepegelkontrast in eine Darstellung des markanten Tons umzuwandeln, indem eine Kontrast-zu-Frequenz-AbbildungsFunktion 16 verwendet wird. In dieser beispielhaften Darstellung ist die Abbildungsfunktion 16 einfach eine Gerade (allerdings auf einer nichtlinearen Skala). So kann z. B. eine relative Dämpfung von etwa 8 dB durch die Abbildungsfunktion 16 in eine Frequenz von 50 Hz umgewandelt werden.
  • Zu beachten ist, dass diese beispielhafte Abbildungsfunktion 16 keine genaue Darstellung der Frequenzdarstellung der relativen Energiepegeldämpfung 15c außerhalb der Filtermittenfrequenzen ist. Der ungefähre Bereich, der durch die beiden Filtermittenfrequenzen bestimmt wird, stellt somit ein zulässiges Frequenzband dar.
  • In anderen Ausführungsformen können eine oder mehrere Abbildungsfunktionen verwendet werden, um auch eine genaue Darstellung des markanten Tons außerhalb der Filtermittenfrequenzen der Filtereinheiten/Analyse-Audiofilter zu erhalten.
  • 8a-b zeigen eine visuelle Darstellung von drei Analyseaudiofiltern und zwei Darstellungen einer relativen Dämpfung. 8a ist ähnlich wie 7a, abgesehen davon, dass die visuelle Darstellung von 8a drei Filtereinheiten entspricht, wie sie z. B. als erste, zweite und dritte Filtereinheit in der in 5 dargestellten Ausführungsform implementiert sind. In 8a entsprechen die drei Frequenzdarstellungen der Energiepegeldämpfung 15a, 15b, 15c Bandpassfiltern mit jeweiligen Filtermittenfrequenzen von etwa 41 Hz, 82 Hz und 165 Hz.
  • In 8b ist eine erste relative Dämpfung 15d dargestellt, die der Dämpfungsdifferenz entspricht, die die erste und zweite Frequenzdarstellung der Energiepegeldämpfung 15a, 15b anwendet. Weiterhin ist eine zweite relative Dämpfung 15e dargestellt, die der Dämpfungsdifferenz entspricht, die die zweite und dritte Frequenzdarstellung der Energiepegeldämpfung 15a, 15b anwendet. Die erste 15d und zweite Darstellung 15e in 8b haben jeweils eine steile Flanke in einem separaten Frequenzbereich. So kann ein erstes Filterpaar, das der ersten 15a und zweiten Darstellung 15b in 8a entspricht, ein genaues Maß für die Frequenz des markanten Tons in einem ersten Frequenzbereich liefern, während ein zweites Filterpaar, das der zweiten 15b und dritten Darstellung 15c in 8a entspricht, ein genaues Maß für die Frequenz des markanten Tons in einem zweiten Frequenzbereich liefern kann. Diese verschiedenen optimalen Frequenzbereiche können kombiniert werden, z. B. durch die Frequenzabbildungseinheit oder durch einen gewichteten Mittelwert.
  • 8a-8b können auch zur Erläuterung eines Ansatzes zur Auswahl von Audioanalysesignalen für die weitere Verarbeitung verwendet werden, um eine Darstellung der markanten Frequenz zu erhalten. Basierend auf den beispielhaften Frequenzdarstellungen 15a-e sind zum Beispiel nur die erste und die zweite Frequenzdarstellung der Energiepegelabschwächung 15a, 15b notwendig, um einen markanten Ton im Frequenzbereich von etwa 41 Hz bis 82 Hz zu erhalten, während die dritte Frequenzdarstellung 15c weggelassen werden kann. Ebenso sind nur die zweite und die dritte Frequenzdarstellung der Energiepegelabschwächung 15b, 15c notwendig, um einen markanten Ton im Frequenzbereich von ca. 42 Hz bis 165 Hz zu erhalten, während die erste Frequenzdarstellung 15a weggelassen werden kann. Die Bestimmung welcher Frequenzbereich richtig ist und damit welche Analyseaudiosignale und Energiepegelkontrast zu verwenden, kann einfach durch einen Vergleich der Energiepegel der Analyseaudiosignale erfolgen. Wenn z. B. der Energiepegel des ersten Analyseaudiosignals, das durch die erste Frequenzdarstellung 15a visualisiert wird, größer ist als der Energiepegel des dritten Analyseaudiosignals, das durch die dritte Frequenzdarstellung 15c visualisiert wird, dann liegt der relevante Frequenzbereich unterhalb von 82 Hz, und die Verarbeitung kann entsprechend durchgeführt werden. Ähnlich, wenn der Energiepegel des ersten Analyseaudiosignals kleiner ist als der Energiepegel des ersten Analyseaudiosignals, dann liegt der Frequenzbereich über 82 Hz.
  • 9a-c illustrieren visuelle Darstellungen verschiedener anderer Analyseaudiofilterkombinationen. Jede der Teilfiguren veranschaulicht die Darstellungen auf einer horizontalen Achse, die eine beliebige Frequenzachse ist, und einer vertikalen Achse, die eine beliebige Energiepegelachse ist.
  • 9a illustriert die Verwendung einer Vielzahl von Tiefpassfiltern in Ausführungsformen der Erfindung. Jeder einzelne Filter kann in Kombination mit einem anderen Filter mit höherer Grenzfrequenz verwendet werden, um eine Darstellung eines markanten Tons in einem Frequenzbereich zu bestimmen. Zum Beispiel in einer ähnlichen Weise, wie sie in Bezug auf 1a-b beschrieben ist. Durch eine Vielzahl von Tiefpassfiltern anstelle eines einzigen ist es möglich, die einzelnen Frequenzbereiche zu kombinieren, so dass ein beliebiger Frequenzbereich abgedeckt wird. So kann z. B. ein erster Filter, dargestellt als die ganz linke Darstellung 15a, in Kombination mit einem der anderen Filter, dargestellt als die Darstellungen 15b-15e mit höherer Grenzfrequenz, einen ersten Frequenzbereich abdecken. Dann kann ein zweiter Filter, der als nächste Darstellung 15b dargestellt ist, in Kombination mit einem der anderen Filter, die als Darstellungen 15c-15e mit höherer Grenzfrequenz dargestellt sind, einen nächsten Frequenzbereich abdecken, usw.
  • In einer Ausführungsform der Erfindung sind beispielsweise mindestens fünf separate Tiefpassfilter mit Grenzfrequenzen von 20 Hz, 100 Hz, 500 Hz, 2500 Hz und 12500 Hz implementiert. Solche Filter können z. B. Frequenzabhängigkeiten aufweisen, wie sie in 9a durch die Darstellungen 15a, 15b, 15c, 15d und 15e visualisiert sind. Der erste Filter, dargestellt durch die erste Darstellung 15a, kann in Kombination mit dem dritten Filter, dargestellt durch die dritte Darstellung 15c, verwendet werden, um einen Frequenzbereich von 20 Hz bis 100 Hz abzudecken. Der zweite Filter, dargestellt durch die zweite Darstellung 15b, kann in Kombination mit dem vierten Filter, dargestellt durch die dritte Darstellung 15d, verwendet werden, um den Frequenzbereich von 100 Hz bis 500 Hz abzudecken, usw. Solche Ausführungsformen können optional auch auf einem ungefilterten Eingangsaudiosignal basieren, zur Verwendung für einen Vergleich von Analyseaudiosignalen.
  • In anderen Ausführungsformen kann ein ähnliches Prinzip unter Verwendung von Hochpassfiltern anstelle von Tiefpassfiltern implementiert werden.
  • 9b zeigt, dass Tiefpass- 15a, Bandpass- 15b und Hochpassfilter 15c in Ausführungsformen der Erfindung kombiniert werden können.
  • 9c veranschaulicht, wie eine Vielzahl von Bandpassfiltern auch kombiniert werden kann, um einen beliebigen Frequenzbereich abzudecken.
  • Im Folgenden werden verschiedene Ausführungsformen der Erfindung ohne Bezugnahme auf bestimmte Figuren dargestellt.
  • In einer Ausführungsform der Erfindung wird das erste Analyseaudiosignal durch Anwenden des Analyseaudiofilters auf das Eingangsaudiosignal erzeugt.
  • In einer Ausführungsform der Erfindung ist das zweite Analyseaudiosignal das Eingangsaudiosignal.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Aufzeichnens des Eingangsaudiosignals über ein Eingangsmikrofon.
  • Die Aufzeichnung des Eingangsaudiosignals über ein Eingangsmikrofon ermöglicht eine Live-Analyse, was vorteilhaft ist.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Bereitstellens des Eingangsaudiosignals.
  • Das Bereitstellen des Eingangsaudiosignals ist nicht auf ein bestimmtes Mittel beschränkt. Es kann zum Beispiel über einen Datenspeicher, eine drahtgebundene Verbindung, eine drahtlose Verbindung, ein Eingangsmikrofon usw. bereitgestellt werden.
  • In einer Ausführungsform der Erfindung ist das Eingangsaudiosignal zumindest teilweise von dem markanten Ton dominiert.
  • Ein Eingangsaudiosignal zu haben, das zumindest teilweise von dem markanten Ton dominiert wird, kann Präzision oder Genauigkeit der Darstellung des markanten Tons verbessern, was vorteilhaft ist.
  • In einer Ausführungsform der Erfindung hat der markante Ton einen Leistungspegel, der größer ist als ein Leistungspegel-Schwellenwert im Vergleich zu einem Leistungspegel des Eingangsaudiosignals.
  • In einer Ausführungsform der Erfindung beträgt der Leistungspegel-Schwellenwert mindestens 1 dB, beispielsweise mindestens 3 dB, beispielsweise mindestens 6 dB, beispielsweise mindestens 10 dB, wie zum Beispiel mindestens 20 dB.
  • Ein Leistungspegel-Schwellenwert kann als ein minimaler Leistungspegel verstanden werden, den der markante Ton haben sollte, bevor das Verfahren, bei einigen Ausführungsformen, erfolgreich angewendet werden kann. Der Leistungspegel-Schwellenwert kann in Bezug auf den Leistungspegel des Eingangsaudiosignals definiert werden, z. B. einen durchschnittlichen Leistungspegel des Eingangsaudiosignals oder den Leistungspegel bestimmter Frequenzkomponenten des Eingangsaudiosignals. Solche besonderen Frequenzkomponenten können z. B. Frequenzkomponenten innerhalb eines bestimmten Frequenzanalysefensters sein, in dem das Verfahren angewendet wird.
  • In einer Ausführungsform der Erfindung beträgt der Leistungspegel-Schwellenwert beispielsweise 6 dB. Wenn das Eingangsaudiosignal einen Leistungspegel von -10 dB hat, sollte der markante Ton einen Leistungspegel von -4 dB oder größer haben, bevor das Verfahren erfolgreich eine genaue Darstellung der markanten Frequenz finden kann.
  • Die Beschränkung des markanten Tons auf einen bestimmten Leistungspegel ist vorteilhaft, da dadurch das Risiko einer ungenauen Darstellung der bestimmten markanten Frequenz minimiert wird.
  • In einer Ausführungsform der Erfindung ist die Darstellung des markanten Tons eine Frequenzdarstellung des markanten Tons.
  • Eine Frequenzdarstellung ermöglicht es, die Frequenz des markanten Tons in weiterer Analyse zu verwenden oder einem Benutzer zur Verfügung zu stellen, was vorteilhaft ist.
  • In einer Ausführungsform der Erfindung ist der Analyseaudiofilter ein erster Analyseaudiofilter, wobei das erste Analyseaudiosignal durch Anwenden des ersten Analyseaudiofilters auf das Eingangsaudiosignal erstellt wird, wobei das zweite Analyseaudiosignal durch Anwenden eines zweiten Analyseaudiofilters auf das Eingangsaudiosignal erstellt wird, wobei der erste Analysefilter und der zweite Analysefilter unterschiedlich sind.
  • Die Verwendung von zwei verschiedenen Filtern ermöglicht es, die Analyse im Detail anzupassen, was vorteilhaft ist. Beispielsweise kann die Ausdehnung eines optimalen Frequenzbereichs vergrößert werden, oder die Präzision oder Genauigkeit kann verbessert werden.
  • In einer Ausführungsform der Erfindung wird die Darstellung des markanten Tons einem Benutzer zur Verfügung gestellt.
  • Die Darstellung kann dem Benutzer beispielsweise visuell zur Verfügung gestellt werden, z.B. über eine elektronische visuelle Anzeige, eine oder mehrere LEDs oder eine oder mehrere Siebensegment- oder andere Anzeigen. Dies ermöglicht es dem Benutzer, auf die ermittelte Darstellung einzuwirken, was vorteilhaft ist. Die Darstellung kann in Echtzeit oder mit Verzögerung erfolgen.
  • In einer Ausführungsform der Erfindung basiert das Audioeingangssignal auf dem Klang eines Musikinstruments, wobei der markante Ton mit einer Musiknote des Instruments verknüpft ist.
  • Das Erkennen eines markanten mit einer Musiknote verbundenen Tons kann beispielsweise Teil des Vorgangs des Stimmens eines Musikinstruments oder des Analysierens eines Audiosignals sein.
  • In einer Ausführungsform der Erfindung ist der markante Ton mit einer Audio-Rückkopplung verbunden.
  • Eine Audio-Rückkopplung kann beispielsweise auftreten, wenn eine Tonausgabe eines Lautsprechers von einem Ton abhängt, der von einem nahegelegenen Mikrofon aufgenommen wurde. Hier kann ein vom Mikrofon empfangenes Signal verstärkt und an den Lautsprecher weitergeleitet werden, der wiederum einen verstärkten Laut ausgibt, den das Mikrofon wieder empfangen kann, wodurch eine Rückkopplungsschleife entsteht. Eine solche Audio-Rückkopplung kann typischerweise von einem einzigen markanten Ton dominiert werden, für dessen Identifizierung das Verfahren der Erfindung geeignet sein kann.
  • In einer Ausführungsform der Erfindung umfasst der Schritt des Vergleichens des ersten Analyseaudiosignals und des zweiten Analyseaudiosignals das Vergleichen eines ersten Energiepegels und eines zweiten Energiepegels, um den Energiepegelkontrast zu erhalten, wobei der erste Energiepegel auf dem ersten Analyseaudiosignal basiert und der zweite Energiepegel auf dem zweiten Analyseaudiosignal basiert.
  • Basieren des Vergleichs auf Energiepegeln kann den Vergleich verbessern oder vereinfachen, was vorteilhaft ist.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Messens des ersten Analyseaudiosignals zum Erfassen des ersten Energiepegels und einen Schritt des Messens des zweiten Analyseaudiosignals zum Erfassen des zweiten Energiepegels.
  • Messen eines Analyseaudiosignals zum Erfassen seines Energiepegels ist ein gradliniger Ansatz zum Bestimmen des Energiepegels und ist daher aufgrund von Einfachheit vorteilhaft. Eine solche Messung kann z. B. durch einen separaten Prozess oder Einheit, z. B. einen Pegeldetektor, durchgeführt werden. Eine Messung kann auch als integrierter Teil des Vergleichs des ersten und des zweiten Analyseaudiosignals durchgeführt werden.
  • In einer Ausführungsform der Erfindung umfasst der Schritt des Vergleichens des ersten Energiepegels und des zweiten Energiepegels das Subtrahieren des ersten Energiepegels von dem zweiten Energiepegel, um den Energiepegelkontrast zu erhalten.
  • In einer Ausführungsform der Erfindung umfasst der Schritt des Vergleichens des ersten Energiepegels und des zweiten Energiepegels das Berechnen eines Verhältnisses zwischen dem ersten Energiepegel und dem zweiten Energiepegel, um den Energiepegelkontrast zu erhalten.
  • Subtraktion und Berechnung eines Verhältnisses sind zwei beispielhafte Ansätze zum Vergleich von Energiepegeln, die aufgrund ihrer Einfachheit vorteilhaft sind.
  • In einer Ausführungsform der Erfindung wandelt die Kontrast-zu-Frequenz-Abbildungsfunktion den Energiepegelkontrast durch die Kontrast-zu-Frequenz-Abbildungsfunktion in den markanten Ton um.
  • In einer Ausführungsform der Erfindung ist die Kontrast-zu-Frequenz-Abbildungsfunktion eine Lookup-Tabelle.
  • In einer Ausführungsform der Erfindung ist die Kontrast-zu-Frequenz-Abbildungsfunktion eine mathematische Funktion.
  • Sowohl eine Lookup-Tabelle als auch eine mathematische Funktion sind einfach zu implementieren und erfordern eine begrenzte Rechenleistung, was vorteilhaft ist.
  • Andere Kontrast-zu-Frequenz-Abbildungsfunktionen, z. B. eine zweite oder eine dritte Kontrast-zu-Frequenz-Abbildungsfunktion, können beispielsweise auch auf Lookup-Tabellen und/oder mathematischen Funktionen basieren.
  • Eine mathematische Funktion kann zum Beispiel eine lineare Funktion oder eine nichtlineare Funktion sein. Sie kann eine stückweise mathematische Funktion sein.
  • In einer Ausführungsform der Erfindung hat der Analyseaudiofilter eine Filtermittenfrequenz.
  • Bei einem Bandpassfilter kann die Filtermittenfrequenz beispielsweise als die Frequenz der Mitte des Bandpassfilters und/oder die Frequenz, bei der die Dämpfung/Verstärkung des Filters einen Extrempunkt hat, verstanden werden. Bei einem Tiefpass- und Hochpassfilter kann die Filtermittenfrequenz z. B. als die Grenzfrequenz des Filters verstanden werden. Eine Grenzfrequenz kann z. B. als die Frequenz definiert werden, bei der der Filter ein Eingangssignal um 3 dB abschwächt.
  • In einer Ausführungsform der Erfindung weist der Analyseaudiofilter einen Gütefaktor auf.
  • In einer Ausführungsform der Erfindung weist der erste Analyseaudiofilter und der zweite Analyseaudiofilter jeweils eine Filtermittenfrequenz auf, wobei ein Frequenzverhältnis der Filtermittenfrequenz des zweiten Analyseaudiofilters und der Filtermittenfrequenz des ersten Analyseaudiofilters von 1 bis 1000, beispielsweise von 1,1 bis 100, beispielsweise von 1,5 bis 50, beispielsweise von 2 bis 20, wie zum Beispiel 10, beträgt.
  • Eine Filtermittenfrequenz kann zum Beispiel eine Mittenfrequenz eines Bandpassfilters oder eine Grenzfrequenz eines Hochpass- oder Tiefpassfilters sein.
  • Das Vorhandensein unterschiedlicher Filtermittenfrequenzen ermöglicht eine Audioanalyse auf der Grundlage dieser Frequenzen, was vorteilhaft ist.
  • In einer beispielhaften Ausführungsform der Erfindung hat der erste Analysefilter eine Filtermittenfrequenz von 20,60 Hz, und der zweite Analysefilter hat eine Filtermittenfrequenz von 164,8 Hz. Das Frequenzverhältnis beträgt somit 8.
  • Ein vorliegendes bestimmtes Frequenzverhältnis der Filtermittenfrequenzen der Analyse-Audiofilter kann einen bestimmten optimalen Frequenzbereich für das Verfahren bereitstellen, was vorteilhaft ist.
  • Alternativ können in einigen Ausführungsformen der Erfindung der erste und der zweite Analyse-Audiofilter die gleiche Filtermittenfrequenz, aber unterschiedliche Gütefaktoren aufweisen, oder sie können verschiedene Arten von Filtern sein.
  • In einer Ausführungsform der Erfindung haben der erste Analyseaudiofilter und der zweite Analyseaudiofilter jeweils einen Filtergütefaktor.
  • Die Filtergütefaktoren verschiedener Analyseaudiofilter können gleich sein, oder sie können unterschiedlich sein.
  • In einer Ausführungsform der Erfindung beträgt der Gütefaktor von einem von dem ersten Analyseaudiofilter und dem zweiten Analyseaudiofilter von 0,01 bis 100, beispielsweise von 0,1 bis 10, wie zum Beispiel 2 oder 5.
  • In einer Ausführungsform der Erfindung ist das Verfahren mit einem gültigen Frequenzband verbunden, wobei ein Frequenzfehler der Darstellung des markanten Tons innerhalb des gültigen Frequenzbandes kleiner ist als außerhalb des gültigen Frequenzbandes.
  • Ein Frequenzfehler kann zum Beispiel zu einer Genauigkeit und/oder einer Präzision der Frequenz umgekehrt in Beziehung stehen. Zum Beispiel kann eine Frequenzdarstellung eines markanten Tons von der tatsächlichen Frequenz des markanten Tons abweichen, was durch einen Frequenzfehler parametrisiert werden kann.
  • Ein Frequenzband mit einem kleineren Frequenzfehler zu haben ist vorteilhaft, um eine präzise und/oder genaue Darstellung des markanten Tons zur Verfügung zu stellen.
  • In einer Ausführungsform der Erfindung basiert das gültige Frequenzband auf der Filtermittenfrequenz des ersten Analyseaudiofilters und der Filtermittenfrequenz des zweiten Analyseaudiofilters.
  • Basieren eines gültigen Frequenzbandes auf den Filtern ist vorteilhaft, da die Eigenschaften der Filter dann ausgewählt werden können, um den Frequenzfehler zu bestimmen.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren mindestens einen Hilfsaudiofilter, der Audiofrequenzen des Eingangsaudiosignals außerhalb des gültigen Frequenzbandes zumindest teilweise abschwächt.
  • Einige Ausführungsformen haben ein gültiges Frequenzband, in dem ein Frequenzfehler reduziert ist. Im Gegensatz dazu kann außerhalb dieses gültigen Frequenzbandes der Frequenzfehler größer sein. Daher kann es in einigen Ausführungsformen sein, dass das Verfahren nicht für die Erkennung eines markanten Tons außerhalb des gültigen Frequenzbandes anwendbar ist. Daher kann die Implementierung mindestens eines Hilfsaudiofilters zur Dämpfung von Audiofrequenzen außerhalb des gültigen Frequenzbandes unerwünschtes Rauschen reduzieren, was vorteilhaft ist. Solche Hilfsaudiofilter können beispielsweise Hochpass- oder Tiefpassfilter sein.
  • In einer Ausführungsform der Erfindung ist der Analyseaudiofilter ein Bandpassfilter.
  • In einigen Ausführungsformen ist der zweite Analyseaudiofilter ein Bandpassfilter.
  • In einer Ausführungsform der Erfindung ist der Analyseaudiofilter ein Hochpassfilter.
  • In einer Ausführungsform der Erfindung ist der Analyseaudiofilter ein Tiefpassfilter.
  • In einigen Ausführungsformen der Erfindung ist der zweite AnalyseaudioFilter ein Hochpass- oder ein Tiefpassfilter.
  • In einigen Ausführungsformen der Erfindung ist der erste Analyseaudiofilter ein Hochpassfilter und der zweite Analyseaudiofilter ein Tiefpassfilter oder umgekehrt. In einigen Ausführungsformen der Erfindung ist der erste Analyseaudiofilter ein Bandpassfilter und der zweite Analyseaudiofilter ein Hochpass- oder Tiefpassfilter oder umgekehrt.
  • In einer Ausführungsform der Erfindung ist der Analyseaudiofilter ein Allpassfilter.
  • In einigen Ausführungsformen der Erfindung ist der zweite Analyseaudiofilter ein Allpassfilter.
  • Ein Allpassfilter kann als ein Filter verstanden werden, der eine frequenzabhängige Phasenverschiebung anwendet. In Ausführungsformen mit einem Allpassfilter kann der Vergleich des ersten und des zweiten Analyseaudiosignals daher die Schätzung einer relativen Phasenverschiebung zwischen den beiden Audiosignalen beinhalten, und dementsprechend ist der Energiepegelkontrast indikativ für diese relative Phasenverschiebung.
  • In einer Ausführungsform der Erfindung ist der Energiepegelkontrast ein erster Energiepegelkontrast, wobei das Verfahren ferner die folgenden Schritte umfasst:
    • Erstellen eines dritten Analyseaudiosignals basierend auf dem Eingangsaudiosignal; und
    • Vergleichen des zweiten Analyseaudiosignals und des dritten Analyseaudiosignals, um einen zweiten Energiepegelkontrast zu erhalten, wobei die Darstellung des markanten Tons weiter auf dem zweiten Energiepegelkontrast basiert.
  • Einführen eines dritten Analyseaudiosignals kann ein gültiges Frequenzband erweitern, Präzision verbessern oder Genauigkeit verbessern, was vorteilhaft ist.
  • In einigen Ausführungsformen der Erfindung können der erste und der zweite Energiepegelkontrast gleichzeitig ermittelt werden. In einigen Ausführungsformen der Erfindung, wird nur einer der ersten und der zweiten Energiepegelkontraste zu einem Zeitpunkt erhalten. Z.B. wird in einem Fall der Durchführung des Verfahrens der erste Energiepegelkontrast ermittelt, um die Darstellung des markanten Tons basierend auf diesem ersten Energiepegelkontrast zu bestimmen. Bei einer späteren Ausführung des Verfahrens wird der zweite Energiepegelkontrast ermittelt, um die Darstellung des markanten Tons basierend auf diesem zweiten Energiepegelkontrast zu bestimmen. Dies kann beispielsweise vorkommen, wenn die verschiedenen Energiepegelkontraste verwendet werden, um die Darstellung des markanten Tons in verschiedenen Frequenzbereichen zu bestimmen, während sich die tatsächliche Frequenz des markanten Tons ändert.
  • In einer Ausführungsform der Erfindung wird das dritte Analyseaudiosignal durch Anwendung eines dritten Analyseaudiofilters auf das Eingangsaudiosignal erzeugt.
  • Das dritte Analyseaudiosignal kann zum Beispiel durch Filtern des Eingangsaudiosignals erstellt werden, oder es kann zum Beispiel das Eingangsaudiosignal sein. Anwenden eines Filters erlaubt Flexibilität bei der Analyse des Eingangsaudiosignals und bei der Bestimmung der Darstellung des markanten Tons, was vorteilhaft ist.
  • In einer Ausführungsform der Erfindung ist die Kontrast-zu-Frequenz-Abbildungsfunktion eine erste Kontrast-zu-Frequenz-Abbildungsfunktion, wobei die erste Kontrast-zu-Frequenz-Abbildungsfunktion den ersten Energiepegelkontrast in eine erste vorläufige Frequenz umwandelt, wobei eine zweite Kontrast-zu-Frequenz-Abbildungsfunktion den zweiten Energiepegelkontrast in eine zweite vorläufige Frequenz umwandelt, wobei die Darstellung des markanten Tons auf der ersten vorläufigen Frequenz und der zweiten vorläufigen Frequenz basiert.
  • Bereitstellung von zwei Abbildungsfunktionen kann Präzision, Genauigkeit oder ein gültiges Frequenzband verbessern, was vorteilhaft ist.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren ferner einen Schritt des Vergleichens des ersten Analyseaudiosignals und des dritten Analyseaudiosignals, um einen dritten Energiepegelkontrast zu erhalten, wobei die Darstellung des markanten Tons auf dem dritten Energiepegelkontrast basiert.
  • Erhalten mehrerer Energiepegelkontraste kann Präzision, Genauigkeit oder ein gültiges Frequenzband verbessern, was vorteilhaft ist.
  • In einer Ausführungsform der Erfindung wandelt eine dritte Kontrast-zu-Frequenz-Abbildungsfunktion den dritten Energiepegelkontrast in eine dritte vorläufige Frequenz um, wobei die Darstellung des markanten Tons auf der dritten vorläufigen Frequenz basiert.
  • Vorsehen von drei oder mehr Abbildungsfunktionen kann Präzision, Genauigkeit oder ein gültiges Frequenzband verbessern, was vorteilhaft ist.
  • In einer Ausführungsform der Erfindung umfasst der Schritt des Vergleichens des zweiten Analyseaudiosignals und des dritten Analyseaudiosignals das Vergleichen des zweiten Energiepegels und eines dritten Energiepegels, um den zweiten Energiepegelkontrast zu erhalten, wobei der dritte Energiepegel auf dem dritten Analyseaudiosignal basiert.
  • In einer Ausführungsform der Erfindung umfasst der Schritt des Vergleichens des ersten Analyseaudiosignals und des dritten Analyseaudiosignals das Vergleichen des ersten Energiepegels und des dritten Energiepegels, um den dritten Energiepegelkontrast zu erhalten.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren ferner einen Schritt zum Messen des dritten Analyseaudiosignals, um den dritten Energiepegel zu ermitteln.
  • In einer Ausführungsform der Erfindung basiert die Darstellung des markanten Tons auf einem gewichteten Mittelwert aus der ersten vorläufigen Frequenz und der zweiten vorläufigen Frequenz.
  • In einer Ausführungsform der Erfindung basiert die Darstellung des markanten Tons auf einem gewichteten Mittelwert aus der ersten vorläufigen Frequenz, der zweiten vorläufigen Frequenz und der dritten vorläufigen Frequenz.
  • Ein gewichteter Mittelwert erlaubt es, mehrere vorläufige Frequenzen zu einer einzigen Darstellung eines markanten Tons zu kombinieren, was Präzision, Genauigkeit oder ein gültiges Frequenzband verbessern kann, was vorteilhaft ist.
  • Ein gewichteter Mittelwert kann auf zwei, drei oder mehr als drei vorläufigen Frequenzen basieren.
  • Die Wichtungen, die vom gewichteten Mittelwert verwendet werden, können flach sein oder vom Frequenz- oder Energiepegelkontrast abhängen. Eine solche Abhängigkeit kann z. B. kontinuierlich und/oder stufenweise variieren. Die Wichtungen können z. B. stückweise mathematische Funktionen oder Lookup-Tabellen sein.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Erzeugens einer Vielzahl von Analyseaudiosignalen durch separates Anwenden einer Vielzahl von Analyseaudiofiltern auf das Eingangsaudiosignal, wobei die Vielzahl von Analyseaudiosignalen das erste Analyseaudiosignal und das zweite Analyseaudiosignal umfasst, wobei die Vielzahl von Analyseaudiofiltern den Analyseaudiofilter umfasst, wobei der Schritt des Bestimmens der Darstellung des markanten Tons auf der Vielzahl von Analyseaudiosignalen basiert.
  • Zum Beispiel kann ein Analyseaudiosignal der Vielzahl von Analyseaudiosignalen durch Anwenden eines Analyseaudiofilters der Vielzahl von Analyseaudiofiltern auf das Eingangsaudiosignal erzeugt werden. Jeder Analyseaudiofilter kann somit zur Erzeugung eines separaten Analyseaudiosignals verwendet werden.
  • Ausführungsformen der Erfindung können beispielsweise mindestens drei Analyseaudiosignale, beispielsweise mindestens vier Analyseaudiosignale, beispielsweise mindestens fünf Analyseaudiosignale, wie zum Beispiel mindestens sechs Analyseaudiosignale umfassen.
  • Ausführungsformen der Erfindung können beispielsweise mindestens drei Analyseaudiofilter, beispielsweise mindestens vier Analyseaudiofilter, beispielsweise mindestens fünf Analyseaudiofilter, wie zum Beispiel mindestens sechs Analyseaudiofilter umfassen.
  • Die Anzahl der Analyseaudiofilter und Analyseaudiosignale kann gleich oder verschieden sein.
  • Die erzeugte Vielzahl von Analyseaudiosignalen kann zur Bestimmung einer Darstellung des markanten Tons verwendet werden. Beispielsweise können ein oder mehrere Energiepegelkontraste durch den Vergleich beliebiger Energiepegel der Analyseaudiosignale ermittelt werden, und die Darstellung des markanten Tons kann dann auf der Umwandlung eines oder mehrerer dieser ein oder mehreren Energiepegelkontraste in eine oder mehrere vorläufige Frequenzen basieren, auf denen die Darstellung des markanten Tons beruht.
  • Erzeugen einer Vielzahl von Analyseaudiosignalen durch separates Anwenden einer Vielzahl von Analyseaudiofiltern auf das Eingangsaudiosignal ist vorteilhaft, da es Präzision, Genauigkeit oder den Bereich eines gültigen Frequenzbandes verbessern kann.
  • Ein Aspekt der Erfindung bezieht sich auf eine Audioverarbeitungseinheit zum Erkennen eines markanten Tons eines Eingangsaudiosignals, wobei die Audioverarbeitungseinheit umfasst:
    • einen Audiosignaleingang zum Bereitstellen des Eingangsaudiosignals;
    • eine kommunizierend mit dem Audiosignaleingang gekoppelte Filtereinheit, um einen Audioanalysefilter auf das Eingangsaudiosignal anzuwenden;
    • einen Energiepegelvergleicher, der kommunizierend mit dem Audiosignaleingang über einen ersten Analyseaudiokanal und einen zweiten Analyseaudiokanal gekoppelt ist, wobei ein Analyseaudiokanal des ersten Analyseaudiokanals und des zweiten Analyseaudiokanals die Filtereinheit umfasst, wobei der Energiepegelvergleicher angeordnet ist, um einen Energiepegelkontrast auszugeben; und
    • eine Frequenzabbildungseinheit, die kommunizierend mit dem Energiepegelvergleicher gekoppelt und so eingerichtet ist, dass sie eine Darstellung des markanten Tons ausgibt, indem sie den Energiepegelkontrast durch eine Kontrast-zu-Frequenz-Abbildungsfunktion umwandelt.
  • Ein Audiosignaleingang kann jede Art von Eingang sein, z. B. basierend auf einer verdrahteten Verbindung, einer drahtlosen Verbindung, einem Mikrofon oder einem Datenspeicher zur Bereitstellung des Eingangsaudiosignals. Als solcher hat der Audiosignaleingang nicht notwendigerweise einen physischen Anschluss.
  • In einer Ausführungsform der Erfindung basiert der Energiepegelkontrast auf der Eingabe von dem ersten Analyseaudiokanal und dem zweiten Analyseaudiokanal.
  • In einer Ausführungsform der Erfindung ist die Filtereinheit eine erste Filtereinheit, wobei der erste Analyseaudiokanal die erste Filtereinheit umfasst, wobei der zweite Analyseaudiokanal eine zweite Filtereinheit umfasst, wobei die erste Filtereinheit und die zweite Filtereinheit unterschiedlich sind.
  • In einer Ausführungsform der Erfindung ist der Energiepegelvergleicher eingerichtet, um einen Energiepegel eines ersten Analyseaudiosignals des ersten Analyseaudiokanals und einen Energiepegel eines zweiten Analyseaudiosignals des zweiten Analyseaudiokanals zu vergleichen, um den Energiepegelkontrast zu erhalten.
  • In einer Ausführungsform der Erfindung ist die Filtereinheit eingerichtet, um einen ersten Audiofilter auf das Eingangsaudiosignal anzuwenden, um ein erstes Analyseaudiosignal zu erzeugen.
  • In einer Ausführungsform der Erfindung ist die zweite Filtereinheit eingerichtet, um einen zweiten Audiofilter auf das Eingangsaudiosignal anzuwenden, um ein zweites Analyseaudiosignal zu erzeugen.
  • In einer Ausführungsform der Erfindung ist der Energiepegelvergleicher kommunizierend mit der ersten Filtereinheit durch einen ersten Pegeldetektor gekoppelt, wobei der Energiepegelvergleicher kommunizierend mit der zweiten Filtereinheit durch einen zweiten Pegeldetektor gekoppelt ist.
  • In einer Ausführungsform der Erfindung ist der erste Pegeldetektor eingerichtet, um das erste Analyseaudiosignal zu messen, um einen ersten Energiepegel zu erfassen, und der zweite Pegeldetektor ist eingerichtet, um das zweite Analyseaudiosignal zu messen, um einen zweiten Energiepegel zu erfassen.
  • In einer Ausführungsform der Erfindung ist die Frequenzabbildungseinheit eingerichtet, um eine Kontrast-zu-Frequenz-Abbildungsfunktion auf den Energiepegelkontrast anzuwenden, um die Darstellung des markanten Tons auszugeben.
  • In einer Ausführungsform der Erfindung basiert die Audiosignalverarbeitungseinheit zumindest teilweise auf einem digitalen Signalprozessor, wobei der digitale Signalprozessor einen von Audiosignaleingang, Filtereinheit, Energiepegelvergleicher und Frequenzabbildungseinheit umfasst.
  • In einigen Ausführungsformen kann der digitale Signalprozessor ferner einen von zweiter Filtereinheit, erstem Pegeldetektor und zweitem Pegeldetektor umfassen.
  • Ein Aspekt der Erfindung bezieht sich auf die Verwendung der Audioverarbeitungseinheit zum Erkennen von Audiofeedback, wobei der markante Ton mit dem Audiofeedback verbunden ist.
  • Wann immer eine Audio-Rückkopplung auftritt, kann sie typischerweise als markanter Ton eines Eingangsaudiosignals betrachtet werden. Daher kann eine Audioverarbeitungseinheit der Erfindung vorteilhaft verwendet werden, um Audiofeedback zu erkennen.
  • Ein Aspekt der Erfindung bezieht sich auf die Verwendung der Audioverarbeitungseinheit zum Erkennen eines Musiktons eines Musikinstruments, wobei der markante Ton mit dem Musikton verbunden ist.
  • Das Erkennen eines Musiktons kann beispielsweise Teil des Vorgangs des Stimmens eines Musikinstruments oder des Analysierens eines Audiosignals sein.
  • Wann immer ein Musikinstrument gestimmt wird, kann ein Musikton des Instruments beispielsweise Basis für ein Eingangsaudiosignal sein, und der Musikton kann beispielsweise eine Grundfrequenz haben, die gestimmt werden soll, während er als markanter Ton des Eingangsaudiosignals dient.
  • Somit kann eine Audioverarbeitungseinheit der Erfindung vorteilhaft zur Erkennung eines Musiktons verwendet werden.
  • Stimmen kann beispielsweise ein Prozess der Anpassung der Tonhöhe eines oder mehrerer Töne von Musikinstrumenten sein, um bestimmte Frequenzen der Töne oder bestimmte Frequenzintervalle zwischen diesen Tönen festzulegen.
  • Ein Musikinstrument kann ein Saiteninstrument sein, wie z. B. eine Gitarre oder ein Klavier.
  • Bei der Verwendung zur Erkennung eines Musiktons kann das Eingangsaudiosignal zum Beispiel auf dem Klang des Musikinstruments basieren. Der Klang kann zum Beispiel über ein Eingangsmikrofon aufgenommen werden.
  • Aus dem Vorstehenden geht hervor, dass die Erfindung sich auf ein Verfahren und eine Vorrichtung zum Erkennen eines markanten Tons eines Eingangsaudiosignals und zum Bereitstellen einer Darstellung dieses Tons, z. B. seiner Frequenz als digitale oder analoge Darstellung, bezieht. Die Erfindung basiert auf der Anwendung eines oder mehrerer frequenzabhängiger Filter auf das Eingangsaudiosignal, um Analyseaudiosignale zu erzeugen. Die Energie der Analyseaudiosignale ist aufgrund der Frequenzabhängigkeit des einen oder der mehreren angewandten Audiofilter frequenzabhängig. Die relative Energie zwischen den Analyseaudiosignalen kann daher direkt mit der Frequenz des markanten Tons in Beziehung gesetzt werden. Die Analyseaudiosignale werden verglichen, um einen Energiepegelkontrast zu erhalten, der die relative Energie der Signale angibt. Dieser Energiepegelkontrast kann dann durch eine Kontrast-zu-Frequenz-Abbildungsfunktion in eine Darstellung des markanten Tons übersetzt werden. Die Erfindung stellt somit einfache und allgemein anwendbare Mittel zur Analyse eines Audiosignals zur Verfügung, um eine Darstellung eines markanten Tons eines Eingangsaudiosignals bereitzustellen.
  • Die Erfindung wurde oben mit dem Zweck der Veranschaulichung und nicht der Einschränkung unter Bezugnahme auf spezifische Beispiele von Verfahren und Ausführungsformen erläutert. Details, wie z. B. ein spezifisches Verfahren und Systemstrukturen, wurden zum Verständnis von Ausführungsformen der Erfindung bereitgestellt. Es ist zu beachten, dass detaillierte Beschreibungen bekannter Systeme, Geräte, Schaltungen und Verfahren weggelassen wurden, um die Beschreibung der Erfindung nicht mit unnötigen Details zu vernebeln. Es sollte verstanden werden, dass die Erfindung nicht auf die oben beschriebenen besonderen Beispiele beschränkt ist und ein Fachmann die Erfindung auch in anderen Ausführungsformen ohne diese spezifischen Details umsetzen kann. Als solche kann die Erfindung in einer Vielzahl von Varianten innerhalb des Umfangs der Erfindung, wie in den Ansprüchen angegeben, gestaltet und geändert werden.
  • Bezugszeichenliste
  • 1
    Audioverarbeitungseinheit
    2
    Audiosignaleingang
    3
    Eingangsaudiosignal
    4a-c
    Filtereinheit
    5a-c
    Analyseaudiosignal
    6a-c
    Pegeldetektor
    7a-c
    Energiepegel
    8a-c
    Energiepegelvergleicher
    9a-c
    Energiepegelkontrast
    10a-c
    Frequenzabbildungseinheit
    11
    Darstellung des markanten Tons
    12a-c
    vorläufige Frequenz
    13
    Einheit zur Bildung eines gewichteten Mittelwerts
    14a-c
    Analyseaudiokanal
    15a-e
    Frequenzdarstellung der Energiepegelabschwächung
    16
    Kontrast-zu-Frequenz-Abbildungsfunktion
    S1-S4
    Verfahrensschritte

Claims (20)

  1. Verfahren zum Erkennen eines markanten Tons eines Eingangsaudiosignals, wobei das Verfahren die folgenden Schritte umfasst: Erzeugen eines ersten Analyseaudiosignals basierend auf dem Eingangsaudiosignal; Erzeugen eines zweiten Analyseaudiosignals basierend auf dem Eingangsaudiosignal, wobei ein Analyseaudiosignal des ersten Analyseaudiosignals und des zweiten Analyseaudiosignals durch Anwenden eines Analyseaudiofilters auf das Eingangsaudiosignal erzeugt wird; Vergleichen des ersten Analyseaudiosignals und des zweiten Analyseaudiosignals, um einen Energiepegelkontrast zu erhalten; und Bestimmen einer Darstellung des markanten Tons durch Umwandeln des Energiepegelkontrasts durch eine Kontrast-zu-Frequenz-Abbildungsfunktion.
  2. Verfahren nach Anspruch 1, wobei das Verfahren einen Schritt des Eingebens oder Aufzeichnens des Eingangsaudiosignals über ein Eingangsmikrofon umfasst.
  3. Verfahren nach Anspruch 1 oder 2, wobei der Analyseaudiofilter ein erster Analyseaudiofilter ist, wobei das erste Analyseaudiosignal durch Anwenden des ersten Analyseaudiofilters auf das Eingangsaudiosignal erzeugt wird, wobei das zweite Analyseaudiosignal durch Anwenden eines zweiten Analyseaudiofilters auf das Eingangsaudiosignal erzeugt wird, wobei der erste Analysefilter und der zweite Analysefilter unterschiedlich sind.
  4. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Darstellung des markanten Tons einem Benutzer zur Verfügung gestellt wird.
  5. Verfahren nach einem der vorhergehenden Ansprüche, wobei der Schritt des Vergleichens des ersten Analyseaudiosignals und des zweiten Analyseaudiosignals das Vergleichen eines ersten Energiepegels und eines zweiten Energiepegels umfasst, um den Energiepegelkontrast zu erhalten, wobei der erste Energiepegel auf dem ersten Analyseaudiosignal basiert und der zweite Energiepegel auf dem zweiten Analyseaudiosignal basiert.
  6. Verfahren nach Anspruch 5, wobei das Verfahren einen Schritt des Messens des ersten Analyseaudiosignals zur Erfassung des ersten Energiepegels und einen Schritt des Messens des zweiten Analyseaudiosignals zur Erfassung des zweiten Energiepegels umfasst.
  7. Verfahren nach Anspruch 3 oder nach einem der Ansprüche 4 bis 6, wenn sie von Anspruch 3 abhängen, wobei der erste Analyseaudiofilter und der zweite Analyseaudiofilter beide eine Filtermittenfrequenz aufweisen, wobei ein Frequenzverhältnis der Filtermittenfrequenz des zweiten Analyseaudiofilters und der Filtermittenfrequenz des ersten Analyseaudiofilters von 1 bis 1000, beispielsweise von 1,1 bis 100, beispielsweise von 1,5 bis 50, beispielsweise von 2 bis 20, wie zum Beispiel 10, beträgt.
  8. Verfahren nach Anspruch 7, wobei das Verfahren mit einem gültigen Frequenzband verknüpft ist, wobei ein Frequenzfehler der Darstellung des markanten Tons innerhalb des gültigen Frequenzbandes kleiner ist als außerhalb des gültigen Frequenzbandes.
  9. Verfahren nach Anspruch 8, wobei das gültige Frequenzband auf der Filtermittenfrequenz des ersten Analyseaudiofilters und der Filtermittenfrequenz des zweiten Analyseaudiofilters basiert.
  10. Verfahren nach Anspruch 8 oder 9, wobei das Verfahren mindestens einen Hilfsaudiofilter umfasst, der Audiofrequenzen des Eingangsaudiosignals außerhalb des gültigen Frequenzbandes zumindest teilweise abschwächt.
  11. Verfahren nach einem der vorhergehenden Ansprüche, wobei der Energiepegelkontrast ein erster Energiepegelkontrast ist, wobei das Verfahren ferner die folgenden Schritte umfasst: Erzeugen eines dritten Analyseaudiosignals basierend auf dem Eingangsaudiosignal; und Vergleichen des zweiten Analyseaudiosignals und des dritten Analyseaudiosignals, um einen zweiten Energiepegelkontrast zu erhalten, wobei die Darstellung des markanten Tons ferner auf dem zweiten Energiepegelkontrast basiert.
  12. Verfahren nach Anspruch 11, wobei das dritte Analyseaudiosignal durch Anwenden eines dritten Analyseaudiofilters auf das Eingangsaudiosignal erzeugt wird.
  13. Verfahren nach Anspruch 11 oder 12, wobei die Kontrast-zu-Frequenz-Abbildungsfunktion eine erste Kontrast-zu-Frequenz-Abbildungsfunktion ist, wobei die erste Kontrast-zu-Frequenz-Abbildungsfunktion den ersten Energiepegelkontrast in eine erste vorläufige Frequenz umwandelt, wobei eine zweite Kontrast-zu-Frequenz-Abbildungsfunktion den zweiten Energiepegelkontrast in eine zweite vorläufige Frequenz umwandelt, und wobei die Darstellung des markanten Tons auf der ersten vorläufigen Frequenz und der zweiten vorläufigen Frequenz basiert.
  14. Verfahren nach einem der Ansprüche 11 bis 13, wobei das Verfahren ferner einen Schritt des Vergleichens des ersten Analyseaudiosignals und des dritten Analyseaudiosignals umfasst, um einen dritten Energiepegelkontrast zu erhalten, wobei die Darstellung des markanten Tons auf dem dritten Energiepegelkontrast basiert.
  15. Verfahren nach Anspruch 14, wobei eine dritte Kontrast-zu-Frequenz-Abbildungsfunktion den dritten Energiepegelkontrast in eine dritte vorläufige Frequenz umwandelt, wobei die Darstellung des markanten Tons auf der dritten vorläufigen Frequenz basiert.
  16. Verfahren nach Anspruch 13, oder Anspruch 14 oder Anspruch 15, wenn sie von Anspruch 13 abhängen, wobei die Darstellung des markanten Tons auf einem gewichteten Mittelwert der ersten vorläufigen Frequenz und der zweiten vorläufigen Frequenz basiert.
  17. Verfahren nach Anspruch 1, wobei das Verfahren einen Schritt des Erzeugens einer Vielzahl von Analyseaudiosignalen durch getrenntes Anwenden einer Vielzahl von Analyseaudiofiltern auf das Eingangsaudiosignal umfasst, wobei die Vielzahl von Analyseaudiosignalen das erste Analyseaudiosignal und das zweite Analyseaudiosignal umfasst, wobei die Vielzahl von Analyseaudiofiltern den Analyseaudiofilter umfasst, wobei der Schritt des Bestimmens der Darstellung des markanten Tons auf der Vielzahl von Analyseaudiosignalen basiert.
  18. Audioverarbeitungseinheit zum Erkennen eines markanten Tons eines Eingangsaudiosignals, wobei die Audioverarbeitungseinheit umfasst: einen Audiosignaleingang zum Bereitstellen des Eingangsaudiosignals; eine Filtereinheit, die kommunizierend mit dem Audiosignaleingang gekoppelt ist, um einen Audioanalysefilter auf das Eingangsaudiosignal anzuwenden; einen Energiepegelvergleicher, der kommunizierend mit dem Audiosignaleingang über einen ersten Analyseaudiokanal und einen zweiten Analyseaudiokanal gekoppelt ist, wobei ein Analyseaudiokanal des ersten Analyseaudiokanals und des zweiten Analyseaudiokanals die Filtereinheit umfasst, wobei der Energiepegelvergleicher eingerichtet ist, um einen Energiepegelkontrast auszugeben; und eine Frequenzabbildungseinheit, die kommunizierend mit dem Energiepegelvergleicher gekoppelt und so eingerichtet ist, dass sie eine Darstellung des markanten Tons ausgibt, indem sie den Energiepegelkontrast durch eine Kontrast-zu-Frequenz-Abbildungsfunktion umwandelt.
  19. Verwendung der Audioverarbeitungseinheit nach Anspruch 18 zum Erkennen einer Audio-Rückkopplung, wobei der markante Ton mit der Audio-Rückkopplung verbunden ist.
  20. Verwendung der Audioverarbeitungseinheit nach Anspruch 18 zum Erkennen eines Musiktons eines Musikinstruments, wobei der markante Ton mit dem Musikton verbunden ist.
DE102021103175.3A 2020-02-11 2021-02-11 Verfahren und audioverarbeitungseinheit zur erfassung eines tons Pending DE102021103175A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202062972894P 2020-02-11 2020-02-11
US62/972,894 2020-02-11

Publications (1)

Publication Number Publication Date
DE102021103175A1 true DE102021103175A1 (de) 2021-08-12

Family

ID=74859021

Family Applications (2)

Application Number Title Priority Date Filing Date
DE102021103179.6A Pending DE102021103179A1 (de) 2020-02-11 2021-02-11 Erkennung und unterdrückung von audio-rückkopplungen
DE102021103175.3A Pending DE102021103175A1 (de) 2020-02-11 2021-02-11 Verfahren und audioverarbeitungseinheit zur erfassung eines tons

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE102021103179.6A Pending DE102021103179A1 (de) 2020-02-11 2021-02-11 Erkennung und unterdrückung von audio-rückkopplungen

Country Status (4)

Country Link
US (2) US11528558B2 (de)
CN (2) CN113259811B (de)
DE (2) DE102021103179A1 (de)
GB (2) GB2596169B (de)

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5214708A (en) * 1991-12-16 1993-05-25 Mceachern Robert H Speech information extractor
US5442712A (en) * 1992-11-25 1995-08-15 Matsushita Electric Industrial Co., Ltd. Sound amplifying apparatus with automatic howl-suppressing function
JP3235925B2 (ja) * 1993-11-19 2001-12-04 松下電器産業株式会社 ハウリング抑制装置
US6831986B2 (en) * 2000-12-21 2004-12-14 Gn Resound A/S Feedback cancellation in a hearing aid with reduced sensitivity to low-frequency tonal inputs
US7715447B2 (en) * 2003-12-23 2010-05-11 Intel Corporation Method and system for tone detection
DE602004020765D1 (de) * 2004-09-17 2009-06-04 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten Tonsignalen
US7315264B2 (en) * 2006-01-17 2008-01-01 D2Audio Corporation Systems and methods for controlling transient response in the output of a noise shaper
US8483384B2 (en) * 2006-03-06 2013-07-09 Freescale Semiconductor, Inc. Enhanced tone detector including adaptive multi-bandpass filter for tone detection and enhancement
CN102165792A (zh) * 2008-09-24 2011-08-24 雅马哈株式会社 环路增益推定装置以及啸叫防止装置
EP2425426B1 (de) * 2009-04-30 2013-03-13 Dolby Laboratories Licensing Corporation Gehör-ereignis-grenzdetektion mit geringer komplexität
CN102176313B (zh) * 2009-10-10 2012-07-25 北京理工大学 基于共振峰频率的汉语普通话单韵母语音可视化方法
EP2362376A3 (de) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Gerät und verfahren zur¨änderung eines audiosignals durch hüllkurvenenformung
US8756061B2 (en) * 2011-04-01 2014-06-17 Sony Computer Entertainment Inc. Speech syllable/vowel/phone boundary detection using auditory attention cues
KR102006734B1 (ko) * 2012-09-21 2019-08-02 삼성전자 주식회사 음성 신호의 처리 방법 및 무선 통신 단말
US9749021B2 (en) * 2012-12-18 2017-08-29 Motorola Solutions, Inc. Method and apparatus for mitigating feedback in a digital radio receiver
FR3030983B1 (fr) * 2014-12-19 2018-02-16 STMicroelectronics (Alps) SAS Systeme et procede de protection de haut-parleur audio
CA2908891A1 (en) * 2015-10-15 2017-04-15 Clearwater Clinical Limited A computer-implemented method for reducing crosstalk in a computer-based audiometer
US9747887B2 (en) * 2016-01-12 2017-08-29 Bose Corporation Systems and methods of active noise reduction in headphones
US11277518B2 (en) * 2017-09-29 2022-03-15 Dolby Laboratories Licensing Corporation Howl detection in conference systems
CN108088582B (zh) * 2017-12-29 2019-12-31 广东电网有限责任公司东莞供电局 一种声表面波快速测量开关柜温度的方法
CN108461087B (zh) * 2018-02-07 2020-06-30 河南芯盾网安科技发展有限公司 数字信号穿过声码器的装置及方法

Also Published As

Publication number Publication date
GB2596169B (en) 2022-04-27
CN113259814B (zh) 2023-02-17
US11528558B2 (en) 2022-12-13
GB2595949B (en) 2022-08-03
US11722822B2 (en) 2023-08-08
GB2596169A (en) 2021-12-22
GB2595949A (en) 2021-12-15
CN113259811A (zh) 2021-08-13
CN113259811B (zh) 2022-08-26
DE102021103179A1 (de) 2021-08-12
CN113259814A (zh) 2021-08-13
US20210250691A1 (en) 2021-08-12
GB202100981D0 (en) 2021-03-10
US20210249028A1 (en) 2021-08-12
GB202101040D0 (en) 2021-03-10

Similar Documents

Publication Publication Date Title
DE69417445T2 (de) Verfahren und system zur detektion und erzeugung von übergangsbedingungen in tonsignalen
EP1853089B1 (de) Verfahren zum Unterdrücken von Rückkopplungen und zur Spektralerweiterung bei Hörvorrichtungen
DE69901894T2 (de) Verfahren und vorrichtung zur objektiven qualitätsmessung von audiosignalen
DE102019119776B4 (de) Zeitverschachtelte digital-analog-wandler-korrektur
DE10214407C1 (de) Anordnung und Verfahren zur Messung, Bewertung und Störungserkennung von Systemen
DE3332979A1 (de) Verfahren und einrichtung zur erzeugung eines spektrums zufaelliger vibrationen
DE69317802T2 (de) Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern
DE2636032B2 (de) Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal
DE19505435C1 (de) Verfahren und Vorrichtung zum Bestimmen der Tonalität eines Audiosignals
EP3281021A1 (de) Verfahren zur analyse eines signals sowie vorrichtung zur durchführung des verfahrens
DE102014118674A1 (de) Vorrichtung und Verfahren zur Ermittlung der Frequenz von mindestens einem dominanten Ton eines Ohrgeräuschs
WO2005093950A1 (de) Schaltkreis-anordnung und signalverarbeitungs-vorrichtung
DE3709556C2 (de)
DE102021103175A1 (de) Verfahren und audioverarbeitungseinheit zur erfassung eines tons
DE69904453T2 (de) Signalverarbeitungsverfahren zur analyse von sprachsignal-transienten
EP1458216A2 (de) Vorrichtung und Verfahren zur Adaption von Hörgerätemikrofonen
DE4419819A1 (de) Tonfrequenzfilter und Verfahren zur Bestimmung der Filterfunktion eines Tonfrequenzfilters
DE69614829T2 (de) Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll
DE3039907A1 (de) Einrichtung zur kontrolle von niederfrequenzverstaerkern
DE102017200320A1 (de) Verfahren zur Frequenzverzerrung eines Audiosignals
EP0794687A1 (de) Verfahren und Vorrichtung zur Bestimmung der Funktion und Übertragungscharakteristik von Hörgeräten
DE3112243C2 (de) Klirrfaktormeßgerät
DE102018128644A1 (de) Verfahren und Messgerät zum Entfernen von einem ungewollten Signalanteil aus einem Messsignal
DE3129308A1 (de) "verfahren und vorrichtung zur automatischen auswertung von stoerueberlagerten messwerten"
DE3026363C2 (de) Einrichtung zum automatischen Prüfen von Überlagerungsempfängern

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0019020000

Ipc: G10L0025030000

R081 Change of applicant/patentee

Owner name: TYMPHANY ACOUSTIC TECHNOLOGY (HUIZHOU) CO., LT, CN

Free format text: FORMER OWNER: TYMPHANY ACOUSTIC TECHNOLOGY (HUIZHOU) CO., LTD., HUIZHOU, GUANGDONG, CN

R081 Change of applicant/patentee

Owner name: TYMPHANY ACOUSTIC TECHNOLOGY (HUIZHOU) CO., LT, CN

Free format text: FORMER OWNER: TYMPHANY ACOUSTIC TECHNOLOGY LIMITED, TAIPEI, TW

R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0025030000

Ipc: G10L0025210000

R016 Response to examination communication