DE102014006997A1

DE102014006997A1 - Verfahren, Vorrichtung und Erzeugnis für drahtlose immersive Audioübertragung

Info

Publication number: DE102014006997A1
Application number: DE102014006997.4A
Authority: DE
Inventors: Raja Banerjea; David Trainor
Original assignee: CSR Technology Inc
Current assignee: CSR Technology Inc
Priority date: 2013-06-20
Filing date: 2014-05-13
Publication date: 2014-12-31
Also published as: GB2515375A; US20140376754A1; GB201405419D0

Abstract

Es werden ein Verfahren, eine Vorrichtung und ein Erzeugnis für Audioübertragung bereitgestellt. Ein Profil von Außenohrübertragungsfunktionen (HRTF), das am genauesten auf einen Benutzer zutrifft, wird aus mehreren HRTF-Profilen ausgewählt. Die HRTF wird ausgewählt durch: drahtloses Übertragen von Testsignalen an einen binauralen Kopfhörer, dann Empfangen einer Rückmeldung vom Benutzer und dann Auswählen des HRTF-Profils auf der Basis der Rückmeldung. Anschließend wird das ausgewählte HRTF-Profil dazu eingesetzt, ein Multikanal-Audiosignal in ein Stereosignal umzuwandeln, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt. Als Nächstes wird das Stereosignal drahtlos an den binauralen Kopfhörer übertragen.

Description

Technisches Gebiet
Die Erfindung betrifft die Signalverarbeitung und Signalübertragung und insbesondere – jedoch nicht ausschließlich – ein Verfahren, eine Vorrichtung und ein Erzeugnis zum Umwandeln eines Mehrkanal-Audiosignals in ein Stereosignal und zum drahtlosen Übertragen des Stereosignals an einen binauralen Kopfhörer.
Hintergrund
Mehr Audioinhalte, insbesondere Film- und Spielinhalte, sind in Mehrkanal-Audioformaten erhältlich. Aufgrund der Verfügbarkeit von günstigeren Heimkinoanlagen verwenden Verbraucher mehrere Lautsprecher und Soundbars, um Audio zuhause wiederzugeben.
Kurze Beschreibung der Zeichnungen
Nicht einschränkende und nicht erschöpfende Ausführungsformen der vorliegenden Erfindung werden unter Bezugnahme auf die folgenden Zeichnungen beschrieben, in denen:
1 ein Blockschaltbild einer Ausführungsform eines Systems darstellt;
2 ein Flussdiagramm einer Ausführungsform eines Vorgangs zeigt, der von einer Ausführungsform des Systems von 1 eingesetzt werden kann;
3 ein Blockschaltbild einer Ausführungsform des Systems von 1 darstellt und
4 ein Funktionsblockschaltbild einer Ausführungsform des Systems von 1 zeigt, das gemäß Aspekten der Erfindung ausgelegt ist.
Ausführliche Beschreibung
Verschiedene Ausführungsformen der vorliegenden Erfindung werden ausführlich unter Bezugnahme auf die Zeichnungen beschrieben, wobei gleiche Bezugsziffern überall in den mehreren Ansichten gleiche Teile und Einheiten darstellen. Die Bezugnahme auf verschiedene Ausführungsform schränkt den Schutzbereich der Erfindung nicht ein, der nur vom Schutzbereich der hieran angefügten Ansprüche eingeschränkt wird. Darüber hinaus sollen jegliche in dieser Beschreibung dargelegten Beispiele nicht einschränkend sein und lediglich einige der vielen möglichen Ausführungsformen für die beanspruchte Erfindung darlegen.
Überall in der Beschreibung und den Ansprüchen nehmen die folgenden Begriffe wenigstens die hier ausdrücklich damit in Verbindung gebrachten Bedeutungen an, sofern der Zusammenhang nicht etwas anderes vorschreibt. Die im Folgenden identifizierten Bedeutungen schränken die Begriffe nicht notwendigerweise ein, sondern stellen lediglich veranschaulichende Beispiele für die Begriffe bereit. Die Bedeutung von „ein/eine/einer” und „der/die/das” umfasst einen Bezug auf den Plural und die Bedeutung von „in” umfasst „in” und „an”. Der Ausdruck „in einer Ausführungsform”, wie hier verwendet, bezieht sich nicht unbedingt auf dieselbe Ausführungsform, obwohl dies der Fall sein kann. Auf ähnliche Weise bezieht sich der Ausdruck „in einigen Ausführungsformen”, wie hier verwendet, wenn er mehrere Male verwendet wird, nicht unbedingt auf dieselben Ausführungsformen, obwohl dies der Fall sein kann. Wie hier verwendet, ist der Begriff „oder” ein inklusiver „Oder”-Operator und entspricht dem Begriff „und/oder”, sofern der Zusammenhang nicht deutlich etwas anderes vorschreibt. Der Begriff „zum Teil auf der Basis von”, „wenigstens zum Teil auf der Basis von” oder „auf der Basis von” ist nicht ausschließlich und lässt zu, auf zusätzlichen, auf der Basis von nicht beschriebenen Faktoren zu sein, sofern der Zusammenhang nicht deutlich etwas anderes vorschreibt. Der Begriff „Signal” bedeutet wenigstens ein Strom-, Spannungs-, Ladungs-, Temperatur-, Daten- oder anderes Signal.
Kurz dargestellt, betrifft die Erfindung ein Verfahren, eine Vorrichtung und ein Erzeugnis zur Audioübertragung, wobei ein Profil von Außenohrübertragungsfunktionen (engt. head-related transfer functions, HRTF), das am genauesten auf einen Benutzer zutrifft, aus mehreren HRTF-Profilen ausgewählt wird. Das HRTF-Profil wird ausgewählt durch: drahtloses Übertragen von Testsignalen an einen binauralen Kopfhörer, dann Empfangen einer Rückmeldung vom Benutzer und dann Auswählen des HRTF-Profils auf der Basis der Rückmeldung. Anschließend wird das ausgewählte HRTF-Profil dazu eingesetzt, ein Multikanal-Audiosignal in ein Stereosignal umzuwandeln, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt. Als Nächstes wird das Stereosignal drahtlos an den binauralen Kopfhörer übertragen.
1 zeigt ein Blockschaltbild einer Ausführungsform eines Systems 100. Das System 100 umfasst einen Prozessor 104, einen Speicher 105, einen drahtlosen Sender 110, einen binauralen Kopfhörer 120 und einen drahtlosen Empfänger 130.
Während eines Konfigurationsvorgangs kann ein Benutzer eine Konfiguration initiieren. Beispielsweise kann eine Konfigurationsanforderung vom drahtlosen Empfänger 130 empfangen werden, der die Konfigurationsanforderung dem Prozessor 104 bereitstellt. In anderen Ausführungsformen kann die Konfiguration auf eine beliebige andere Weise initiiert werden; beispielsweise kann der Prozessor 104 die Konfiguration initiieren. Der Prozessor 104 kann eine CPU oder eine andere Art von Prozessor umfassen und kann in einigen Ausführungsformen mehrere Prozessoren umfassen. In einigen Ausführungsformen kann der Prozessor 104 einen Signalprozessor umfassen, der mittels Hardware, Software und/oder einer Kombination von Hardware und Software umgesetzt ist.
Der Speicher 105 kann ein prozessorlesbares Medium umfassen, das prozessorausführbaren Code speichert, der auf dem prozessorlesbaren Medium codiert ist, wobei der prozessorausführbare Code bei Ausführung durch den Prozessor 104 Aktionen ermöglicht, die gemäß dem prozessorausführbaren Code durchgeführt werden sollen. Der prozessorausführbare Code kann Aktionen ermöglichen, um Verfahren wie die im Folgenden detaillierter erörterten durchzuführen, wie beispielsweise den in Bezug auf 2 im Folgenden erörterten Vorgang. Der Speicher 105 speichert auch eine Sammlung von Außenohrübertragungsfunktionen (HRTF).
Der Vorgang der Konfiguration ermöglicht dem Prozessor 104, ein Profil von Außenohrübertragungsfunktionen (HRTF), das am genauesten auf einen Benutzer zutrifft, aus mehreren HRTF-Profilen auszuwählen. Jedes HRTF-Profil umfasst eine oder mehrere HRTF, die im Speicher 105 gespeichert sind. Das HRTF-Profil wird ausgewählt durch: drahtloses Übertragen von Testsignalen mittels des drahtlosen Senders 110 an den binauralen Kopfhörer 120 (der von einem Benutzer getragen werden kann), dann Empfangen einer Rückmeldung vom Benutzer (z. B. mittels des drahtlosen Empfängers 130 oder eines anderen Mittels) und dann Auswählen des HRTF-Profils auf der Basis der Rückmeldung. Das ausgewählte HRTF-Profil für den Benutzer kann im Speicher 105 gespeichert werden.
Im Normalbetrieb setzt der Prozessor 104 das ausgewählte HRTF-Profil für den Benutzer dazu ein, ein Multikanal-Audiosignal in ein Stereosignal umzuwandeln, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt. Als Nächstes wird das Stereosignal mittels des drahtlosen Senders 110 drahtlos an den binauralen Kopfhörer 120 übertragen. In einigen Ausführungsformen kann der binaurale Kopfhörer 120 Teil eines Headsets sein. In anderen Ausführungsformen ist der binaurale Kopfhörer 120 nicht Teil eines Headsets.
Der drahtlose Sender 110 ist eine Vorrichtung, die ein Audiosignal drahtlos übertragen kann. In einigen Ausführungsformen wird die Übertragung mittels Bluetooth-Konnektivität und der A2DP-Bluetooth-Profile durchgeführt. In anderen Ausführungsformen können andere Formen der drahtlosen Übertragung vom drahtlosen Sender 110 eingesetzt werden. Der drahtlose Empfänger 130 ist eine Vorrichtung, die Befehle von einem Benutzer drahtlos empfangen kann. In einigen Ausführungsformen wird der Empfang mittels Bluetooth-Konnektivität und der AVRCP-Bluetooth-Profile durchgeführt. In anderen Ausführungsformen können andere Formen des drahtlosen Empfangs vom drahtlosen Empfänger 130 eingesetzt werden.
Obwohl ein bestimmtes Schaltbild des Systems 100, das eine bestimmte Ausführungsform des Systems 100 zeigt, in 1 gezeigt ist, können viele zusätzliche Komponenten, die nicht in 1 gezeigt sind, ebenfalls im System 100 vorhanden sein. Des Weiteren, obwohl 1 den drahtlosen Empfänger 130 darstellt und erörtert, ist der drahtlose Empfänger 130 eine fakultative Komponente, die nicht in allen Ausführungsformen von 1 enthalten ist. In einigen Ausführungsformen kann der Benutzer beispielsweise eine Rückmeldung auf der Basis der Testsignale durch ein Mittel zur Eingabe, bei der es sich nicht um eine drahtlose Übertragung handelt, bereitstellen. Diese Ausführungsformen und andere liegen innerhalb des Schutzbereichs und des Wesens der Erfindung.
2 zeigt ein Flussdiagramm einer Ausführungsform eines Vorgangs 250, der von einer Ausführungsform des Prozessors 104 von 1 eingesetzt werden kann.
Nach einem Startblock fährt der Vorgang mit Block 251 fort, in dem ein Profil von Außenohrübertragungsfunktionen (HRTF), das am genauesten auf einen Benutzer zutrifft, aus mehreren HRTF-Profilen ausgewählt wird. Anschließend fährt der Vorgang mit Block 252 fort, in dem das ausgewählte HRTF-Profil dazu eingesetzt wird, ein Multikanal-Audiosignal in ein Stereosignal umzuwandeln, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt. Der Vorgang schreitet dann zu Block 253 vor, in dem die drahtlose Übertragung des Stereosignals an den binauralen Kopfhörer ermöglicht wird. Der Vorgang fährt dann mit einem Rückkehrblock fort, in dem eine andere Verarbeitung fortgesetzt wird.
In einigen Ausführungsformen kann die Handlung in Block 251 durch drahtloses Übertragen von Testsignalen an den binauralen Kopfhörer, dann Empfangen einer Rückmeldung vom Benutzer und dann Auswählen des HRTF-Profils auf der Basis der Rückmeldung durchgeführt werden.
3 stellt ein Blockschaltbild einer Ausführungsform eines Systems 300 dar, das als eine Ausführungsform des Systems 100 von 1 eingesetzt werden kann. Das System 300 umfasst einen Signalprozessor 304, ein HRTF- und Benutzer-Mapping-Repository 305, eine Steuerschnittstelleneinheit 306, einen drahtlosen Empfänger 330 und einen drahtlosen Audiosender 310. Der Signalprozessor 304 kann als eine Ausführungsform des Prozessors 104 von 1 eingesetzt werden. Das HRTF- und Benutzer-Mapping-Repository 305 kann als eine Ausführungsform des Speichers 105 von 1 eingesetzt werden. Der drahtlose Empfänger 330 kann als eine Ausführungsform des drahtlosen Empfängers 130 von 1 eingesetzt werden. Der drahtlose Audiosender 310 kann als eine Ausführungsform des drahtlosen Senders 110 von 1 eingesetzt werden.
In einigen Ausführungsformen kann das System 300 auf ähnliche Weise wie oben für das System 100 von 1 beschrieben arbeiten. Die Steuerschnittstelleneinheit 306 kann ausgelegt sein, empfangene Steuerbefehle zu interpretieren und justierbare Parameter des Betriebs des Signalprozessors 304 mittels einer geeigneten Schnittstelle mit dem Signalprozessor 304 zu konfigurieren.
In einigen Ausführungsformen kann das System 300 dazu eingesetzt werden, einen bestechenden immersiven Audioeffekt zu ermöglichen, der unter Einsatz eines herkömmlichen drahtlosen Stereokopfhörers und drahtloser Stereo-Audiokonnektivität erzielt werden soll. Audioinhalte sind zunehmend in Multikanal-Audioformaten verfügbar und Verbraucher verwenden mehrere Lautsprecher und Soundbars, um Audio zuhause wiederzugeben. Audiosysteme mit mehreren Lautsprechern werden auch in den Kraftfahrzeugmärkten zunehmend verfeinert. Um Ungestörtheit und Schallisolation zu erzielen, möchten Verbraucher möglicherweise einen Kopfhörer tragen und dem Multikanal-Audio lauschen, während sie sich das Video auf einer Anzeige ansehen. Mit der zunehmenden Beliebtheit von 3D-Video tragen Benutzer zudem 3D-Videobrillen, um sich Inhalte auf 3D-Fernsehgeräten und -Anzeigen anzusehen.
Das System 300 kann dazu eingesetzt werden, den immersiven Audioeffekt auf dem Fernsehgerät, einem Blu-ray-Player, einem AV-Empfänger, einem Laptop, einem Mobilfunkgerät, einem Computer, einem Digitalempfänger und/oder dergleichen zu erzeugen und den immersiven Audioeffekt drahtlos an den Kopfhörer zu übertragen. Durch Verwendung des Systems 300 müssen die drahtlose Verbindung zum Kopfhörer und die Kopfhörerverarbeitung nur auf herkömmlichen Stereo-Audiostreams arbeiten, der Verbraucher, der den Kopfhörer trägt, nimmt jedoch immer noch den immersiven Audioeffekt wahr. Der drahtlose Kopfhörer kann somit entsprechend für einen effizienten Stereobetrieb, das Verlängern der Batteriebetriebszeit und das Minimieren der Bandbreite des drahtlosen Netzes entworfen werden. Das System 300 arbeitet als ein drahtloses immersives Audioübertragungssystem, das die Verarbeitung anwendet und konfiguriert, um einen immersiven Audioeffekt hoher Qualität aus einem Stereo-Audiostream zu erzeugen.
Der Signalprozessor 304 empfängt ein immersives Multikanal-Audiosignal MCAS und mischt das Signal MCAS zu einem Stereo-Audiosignal (2-Kanal-Audiosignal) herunter, während die immersiven und räumlichen Audiocharakteristika des Audiosignals bewahrt werden. In verschiedenen Ausführungsformen kann der Signalprozessor 304 als Hardware, Software und/oder eine beliebige geeignete Kombination von Hardware und Software umgesetzt sein.
Das HRTF- und Benutzer-Mapping-Repository 305 umfasst mehrere Datensätze, auf die der Signalprozessor 304 zugreifen kann, wobei jeder Satz mehrere Datenwerte enthält, die eine jeweils andere Außenohrübertragungsfunktion (HRTF) darstellen. Das HRTF- und Benutzer-Mapping-Repository 305 umfasst außerdem mehrere Datensätze, wobei jeder Satz ein Mapping zwischen einem autorisierten Benutzer des Systems und einem Teilsatz bzw. Teilmenge der gespeicherten HRTFs, die für diesen Benutzer die genauesten immersiven Effekte ergeben, enthält.
Der drahtlose Audiosender 310 ist zu einer zuverlässigen Übertragung eines Stereo-Audiosignals hoher Qualität SAS in der Lage. In einigen Ausführungsformen wird diese Übertragung unter Verwendung von Bluetooth-Konnektivität und des A2DP-Bluetooth-Profils erzielt.
Der drahtlose Empfänger 330 ist zu einem zuverlässigen Empfang von Fernsteuerbefehlen WRRC vom Verbraucher zum Zwecke des Konfigurierens und Justierens der immersiven Audioübertragung in der Lage. In einigen Ausführungsformen wird dieser Empfang unter Verwendung von Bluetooth-Konnektivität und des AVRCP-Bluetooth-Profils erzielt.
Die Steuerschnittstelleneinheit 306 ist ausgelegt, die drahtlos empfangenen Fernsteuerbefehle WRRC zu interpretieren und Parameter des Betriebs des Signalprozessors 304 mittels einer geeigneten Schnittstelle mit dem Signalprozessor 304 zu justieren.
Eine Außenohrübertragungsfunktion (HRTF) beschreibt die Filtercharakteristika, die auf ein eingegebenes Audiosignal von der Physiologie des Ohrs (Ohrmuschelform, Gehörgangform) und der Kopfform eines gegebenen Zuhörers angewendet werden, die alle die Frequenz und den Phasenverlauf des eingegebenen Signals verändern. Aufgrund der räumlichen Trennung der Ohren, des Verschlusses durch den Kopf und der Schallumgebung (z. B. Reflexionen) werden interaurale Laufzeit-, Pegel- und Intensitätsdifferenzen eingeführt. Im Grunde kann eine HRTF als ein Filter betrachtet werden und unterschiedliche HRTF und folglich unterschiedliche Raumeffekte können von unterschiedlichen Sätzen von Filterkoeffizienten dargestellt werden.
4 zeigt ein Funktionsblockschaltbild einer Ausführungsform eines Systems 400, das als eine Ausführungsform des Systems 100 von 1 eingesetzt werden kann. Das System 400 umfasst eine Audioquelle 440, eine Soundbar 404, virtuelle Lautsprecherpositionen 460, einen binauralen Kopfhörer 420 und physische Soundbar-Lautsprecher 421. Die Soundbar 404 umfasst einen Multikanaldecodierungsblock 463, linke Filter 461, rechte Filter 462, einen Soundbar-3D-Verarbeitungsblock 464 und Addierer 465.
Das System 400 ist ausgelegt, Surround-/3D-/immersives Audio bzw. Hörschall bereitzustellen. Eine traditionelle Heimkinotopologie kann beispielsweise 5.1- oder 7.1-Lautsprecherlayouts einsetzen. Durch Anwenden der korrekten HRTF für das linke und das rechte Ohr über jeden Audiokanal ist es möglich, das Schallfeld von mehreren Lautsprechern (einer traditionellen Heimkinotopologie) mittels des vom Kopfhörer 420 gelieferten Stereosignals nachzubilden. Die Signalverarbeitung in der Fernsehgerät-Soundbar 404 kann dazu eingesetzt werden, Surround-/3D-/immersives Audio aus einem Multikanal-Audioeingang unter Verwendung von Signalverarbeitung und Treibern von mehreren Lautsprechern zu liefern, um den Effekt von vielen „virtuellen” Lautsprechern an den „virtuellen” Lautsprecherpositionen 460 zu erzeugen. Wiederum ist es durch Anwenden der passenden HRTF für das linke und das rechte Ohr über jeden Audiokanal möglich, das Schallfeld von mehreren „virtuellen” Lautsprechern mittels des vom Kopfhörer 420 gelieferten Stereosignals nachzubilden, wie in 4 gezeigt.
Die Audioquelle 440 stellt der Soundbar 404 ein Multikanal-Audiosignal bereit. In verschiedenen Ausführungsformen kann die Audioquelle 440 ein Fernsehgerät, einen Blu-ray-Player, einen AV-Empfänger, einen Laptop, ein Mobilfunkgerät, einen Computer, einen Digitalempfänger und/oder dergleichen umfassen. Der Multikanaldecodierungsblock 463, die linken Filter 461, die rechten Filter 462 und die Addierer 465 arbeiten zusammen, um das Multikanal-Audiosignal in ein Stereosignal umzuwandeln, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt, und das Stereosignal wird dann drahtlos an den Kopfhörer 420 übertragen.
Während dieser Verarbeitung wird jeder Kanal des Multikanal-Audiosignals, wie jeder der fünf Kanäle eines 5.1-Multikanal-Audiosignals, von linken und rechten Digitalfiltern auf der Basis der Koeffizienten, die von der geladenen HRTF bereitgestellt werden, gefiltert und die gefilterten Kanäle werden kombiniert, um das Stereosignal bereitzustellen. Ein Benutzer, der dem Kopfhörer lauscht, wird ein Klangbild derart hören, dass das Klangbild von den „virtuellen” Lautsprecherpositionen 460 zu kommen scheint. Die Soundbar-3D-Verarbeitung 464 wandelt das Multikanal-Audiosignal in ein Stereosignal um, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt, wenn es von den physischen Soundbar-Lautsprechern 421 ausgegeben wird, und stellt dann das Signal den physischen Soundbar-Lautsprechern 421 zum Ausgeben von Audio bereit, so dass das Audio von den „virtuellen” Lautsprecherpositionen 460 zu kommen scheint.
Nun wieder unter Bezugnahme auf 3 wird zum Zeitpunkt der Vorrichtungsherstellung eine kleine Datenbank unterschiedlicher HRTF in den permanenten Speicher des HRTF- und Benutzer-Mapping-Repositorys 305 geladen. In einigen Ausführungsformen wird dieser Satz von HRTF unter Verwendung von Clustertechniken abgeleitet, wie den im Bericht „Improved Localisation and Externalisation of Non-individualised HRTFs by Cluster Analysis” von Robert Tame beschriebenen, der hiermit durch Bezugnahme aufgenommen ist, so dass die HRTF-Datenbank die Anwendbarkeits- und die Leistungsniveaus maximieren kann, die mit einer konfigurierten HRTF-Datenbank einer gegebenen Größe erzielbar sind.
In einigen Ausführungsformen nimmt ein Verbraucher, wenn der Verbraucher zum ersten Mal das System 300 verwendet, an einer kurzen Erstkonfigurationstätigkeit teil. In einigen Ausführungsformen wird außerdem während dieser Erstkonfigurationstätigkeit dem Verbraucher eine vorher definierte Abfolge von Testsignalen, die mit jeder der gespeicherten HRTF durch den Signalprozessor 304 verarbeitet werden, über den angeschlossenen drahtlosen Kopfhörer 320 unter Verwendung des drahtlosen Audiosenders 310 präsentiert. In diesen Ausführungsformen gibt der Verbraucher unter Verwendung der Produktfernsteuerung zum Angeben einer wahrgenommenen räumlichen Position auf einer Grafik auf der Produktanzeige die wahrgenommene Richtung und Externalisierung jedes Testsignals an.
Diese Angaben vom Verbraucher werden an den drahtlosen Empfänger 330 und vom drahtlosen Empfänger 330 an die Steuerschnittstelleneinheit 306 und von der Steuerschnittstelleneinheit 306 an den Signalprozessor 304 von 3 gesendet. Der Signalprozessor 304 berechnet den Teilsatz von HRTF in der Datenbank, die die genauesten Richtungs- und Externalisierungsniveaus für diesen bestimmten Verbraucher angeben, indem die tatsächliche Richtung und die tatsächliche Externalisierung jedes Testsignals mit den wahrgenommenen Werten, die vom Verbraucher angegeben wurden, verglichen werden. Der beste Teilsatz von HRTF im HRTF- und Benutzer-Mapping-Repository 305 für diesen bestimmten Verbraucher ist das „HRTF-Profil” für den Verbraucher und wird im Repository 305 für einen künftigen Abruf gespeichert, um eine Wiederholung der Konfigurationstätigkeit für diesen Verbraucher zu vermeiden.
In einigen Ausführungsformen speichert das HRTF- und Benutzer-Mapping-Repository 305 eine verhältnismäßig kleine Sammlung von sorgfältig ausgewählten Profilen oder Einstellungen, die das HRTF- und Benutzer-Mapping-Repository 305 auf unterschiedliche Weisen anwenden kann, um ein effektvolles Erlebnis für unterschiedliche Personen bereitzustellen. Die gespeicherte Sammlung von Profilen wird sorgfältig ausgewählt, um die Wahrscheinlichkeit zu maximieren, dass mindestens eines davon so vielen Benutzern wie möglich ein gutes Erlebnis verschaffen wird. In einigen Ausführungsformen werden unterschiedliche Klassen von Benutzern unter jedem HRTF-Datenblock in Cluster verpackt und die Sammlung von HRTF-Datenblöcken wird ausgewählt, um eine so komplette Abdeckung für die gesamte Benutzerbasis wie möglich zu erreichen, während eine minimale Überschneidung und Redundanz zwischen zwei beliebigen HRTF-Profilen besteht. Jede HRTF ist im Grunde genommen ein Satz numerischer Parameter, die Digitalfiltern bereitgestellt werden sollen, wenn das Multikanal-Audiosignal in das Stereosignal umgewandelt wird.
Wie oben erörtert kann der Satz von HRTFs in einigen Ausführungsformen unter Verwendung von Clustertechniken abgeleitet werden, wie den im Bericht „Improved Localisation and Externalisation of Non-individualised HRTFs by Cluster Analysis” von Robert Tarne beschriebenen. Es kann jedoch eine Vielfalt unterschiedlicher Techniken zum Erzeugen des Satzes von HRTFs in verschiedenen Ausführungsformen eingesetzt werden, einschließlich beispielsweise K-Mittel-Clustern, Linde-Buzo-Gray-Clustern, Frequenzskalierung einer Basis-HRTF, Zusammensetzung von HRTF aus Antworten von Strukturkomponenten und/oder multiple Regressionsanalyse. Diese Ausführungsformen und andere liegen innerhalb des Schutzbereichs und des Wesens der Erfindung.
Die Sammlung von Profilen, die im HRTF- und Benutzer-Mapping-Repository 305 gespeichert werden soll, wird während des Designs des HRTF- und Benutzer-Mapping-Repositorys 305 ausgewählt und gespeichert. Dann wird während der Erstkonfiguration für den Verbraucher eines dieser HRTF-Profile für den Verbraucher ausgewählt. Jeder Benutzer kann einen separaten Erstkonfigurationsprozess durchlaufen, wobei eine separate Auswahl eines der HRTF-Profile für jeden Benutzer vorgenommen wird.
Wenn ein Verbraucher immersivem Audio auf seinem drahtlosen Kopfhörer lauschen möchte, kann er den Kopfhörer anschließen und das HRTF-Profil des Verbrauchers mittels Befehlen von der Produktfernsteuerung laden, falls es nicht bereits geladen ist. Das Multikanal-Audio wird dann in einzelne uncodierte Audiokanäle decodiert (falls erforderlich). In einigen Ausführungsformen werden die passenden HRTFs auf der Basis des bestimmten Verbrauchers unter Verwendung des Produkts und der gewünschten Topologie mit mehreren Lautsprechern (ob nun physische oder „virtuelle” Lautsprecher) angewendet und die linken und die rechten Kanäle von jedem HRTF-Filter werden kombiniert, wie in 4 dargestellt. Diese Verarbeitung wird vom Signalprozessor 304 durchgeführt. Der resultierende Stereo-Audiostream wird an den drahtlosen Audiosender 310 und vom drahtlosen Audiosender 310 an den drahtlosen Kopfhörer gesendet, wo der resultierende Stereo-Audiostream für den Verbraucher wiedergegeben wird.
In einigen Ausführungsformen kann ein Verbraucher, der Audio auf dem Kopfhörer lauscht, einen zusätzlichen immersiven Audioeffekt anwenden, beispielsweise die Externalisierung oder das Wahrnehmen von „Breite” oder „Höhe” steigern. Mittels geeigneter Befehle von der Produktfernsteuerung, die vom drahtlosen Empfänger 330, der Steuerschnittstelleneinheit 306 und dem Signalprozessor 304 empfangen und verarbeitet werden, werden überarbeitete oder modifizierte HRTFs aus dem HRTF- und Benutzer-Mapping-Repository 305 ausgewählt, um den modifizierten immersiven Effekt zu erzeugen.
Das System 300 stellt räumliche Multikanal-Audio-Verarbeitung auf der Übertragungsseite der drahtlosen Audioverbindung bereit, die die Optimierung der Leistung des drahtlosen Kommunikationsnetzes und der batteriebetriebenen Audioempfangsvorrichtung ermöglichen kann, während die Fähigkeit des Endbenutzers, das System von der Audioempfangsvorrichtung zu personalisieren und zu steuern, bewahrt wird. Das System 300 ermöglicht das Erzielen eines bestechenden immersiven Audioeffekts unter Verwendung eines herkömmlichen drahtlosen Stereokopfhörers und drahtloser Stereo-Audiokonnektivität.
Dementsprechend können Verbraucher immersives Audio unter Verwendung von kostengünstigen Peripheriegeräten erleben. Die komplexe räumliche Audioverarbeitung erfolgt in netzabhängigen elektronischen Verbrauchergeräten, die bereits eine viel höhere Investition als Kopfhörer darstellen und folglich die verhältnismäßig geringen Mehrkosten und Verarbeitungsgemeinkosten leichter auffangen können. Das System 300 ermöglicht dem Verbraucher außerdem ein beträchtliches Ausmaß an Optimierung und Kontrolle über den immersiven Effekt, ohne dass ein komplexer und umständlicher Konfigurationsvorgang erforderlich ist.
Die obige Beschreibung, die obigen Beispiele und die obigen Daten stellen eine Beschreibung der Herstellung und Verwendung der Zusammensetzung der Erfindung bereit. Da viele Ausführungsformen der Erfindung vorgenommen werden können, ohne vom Wesen und Schutzbereich der Erfindung abzuweichen, liegt die Erfindung auch in den hier im Folgenden angefügten Ansprüchen begründet.

Claims

Verfahren, das umfasst: Auswählen eines Außenohrübertragungsfunktionsprofils, das genau auf einen Benutzer zutrifft, aus mehreren Außenohrübertragungsfunktionsprofilen durch: Einsetzen eines drahtlosen Senders zum drahtlosen Übertragen von Testsignalen an einen binauralen Kopfhörer; nach dem Einsetzen des drahtlosen Senders zum drahtlosen Übertragen der Testsignale an den binauralen Kopfhörer, Empfangen einer Rückmeldung vom Benutzer und Auswählen des Außenohrübertragungsfunktionsprofils aus den mehreren Außenohrübertragungsfunktionsprofilen auf der Basis der Rückmeldung, wobei jedes Außenohrübertragungsfunktionsprofil mindestens eine Außenohrübertragungsfunktion umfasst; Einsetzen des ausgewählten Außenohrübertragungsfunktionsprofils zum Umwandeln eines Multikanal-Audiosignals mit immersiven und räumlichen Audiocharakteristika in ein Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt; und nach dem Umwandeln des Multikanal-Audiosignals in das Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt, Einsetzen des drahtlosen Senders zum drahtlosen Übertragen des Stereosignals an den binauralen Kopfhörer.
Verfahren nach Anspruch 1, wobei das Einsetzen des drahtlosen Senders zum drahtlosen Übertragen des Stereosignals an den binauralen Kopfhörer mittels Bluetooth-Konnektivität durchgeführt wird.
Verfahren nach Anspruch 1, das ferner ein Ändern mindestens einer der Außenohrübertragungsfunktionen im ausgewählten Außenohrübertragungsfunktionsprofil auf der Basis eines empfangenen Befehls vom Benutzer umfasst.
Verfahren nach Anspruch 1, das ferner umfasst: Speichern mehrerer vorherbestimmter Außenohrübertragungsfunktionen, die die mindestens eine Außenohrübertragungsfunktion umfassen, wobei jedes Außenohrübertragungsfunktionsprofil der mehreren Außenohrübertragungsfunktionsprofile einen Teilsatz der mehreren vorherbestimmten Außenohrübertragungsfunktionen umfasst; und Verarbeiten mehrerer vorher definierter unverarbeiteter Testsignale mit jeder der mehreren vorherbestimmten Außenohrübertragungsfunktionen, um die Testsignale zu erzeugen, die drahtlos an den binauralen Kopfhörer übertragen werden sollen.
Verfahren nach Anspruch 4, wobei jede vorherbestimmte Außenohrübertragungsfunktion der mehreren vorherbestimmten Außenohrübertragungsfunktionen mehrere numerische Parameter zur Audiofilterung umfasst und wobei das Umwandeln des Multikanal-Audiosignals in das Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt, ein Filtern des Multikanal-Audiosignals unter Verwendung jedes der mehreren numerischen Parameter zur Audiofilterung jeder Außenohrübertragungsfunktion im ausgewählten Außenohrübertragungsfunktionsprofil umfasst.
Verfahren nach Anspruch 4, wobei die mehreren vorherbestimmten Außenohrübertragungsfunktionen auf der Basis von K-Mittel-Clustern, Linde-Buzo-Gray-Clustern, Frequenzskalierung einer Basis-Außenohrübertragungsfunktion, Zusammensetzung von Außenohrübertragungsfunktionen aus Antworten von Strukturkomponenten und/oder multipler Regressionsanalyse vorherbestimmt werden.
Verfahren nach Anspruch 4, wobei die Rückmeldung vom Benutzer eine Angabe einer wahrgenommenen Richtung und Externalisierung jedes der Testsignale durch den Benutzer umfasst und wobei das Auswählen des Außenohrübertragungsfunktionsprofils aus den mehreren Außenohrübertragungsfunktionsprofilen auf der Basis der Rückmeldung durch Auswählen des Außenohrübertragungsfunktionsprofils durchgeführt wird, für das die wahrgenommene Richtung und Externalisierung für jedes der Testsignale am nächsten mit der tatsächlichen Richtung und Externalisierung der Testsignale übereinstimmt.
Vorrichtung, die umfasst: einen Speicher, der ausgelegt ist, mehrere Außenohrübertragungsfunktionsprofile zu speichern, wobei jedes Außenohrübertragungsfunktionsprofil mindestens eine Außenohrübertragungsfunktion umfasst; und einen Prozessor, der ausgelegt ist, Code auszuführen, der Aktionen ermöglicht, die umfassen: Auswählen eines Außenohrübertragungsfunktionsprofils, das genau auf einen Benutzer zutrifft, aus den mehreren Außenohrübertragungsfunktionsprofilen durch: Steuern eines drahtlosen Senders zum drahtlosen Übertragen von Testsignalen an einen binauralen Kopfhörer; nach dem Steuern des drahtlosen Senders zum drahtlosen Übertragen der Testsignale an den binauralen Kopfhörer, Empfangen einer Rückmeldung vom Benutzer und Auswählen des Außenohrübertragungsfunktionsprofils aus den mehreren Außenohrübertragungsfunktionsprofilen auf der Basis der Rückmeldung; Einsetzen des ausgewählten Außenohrübertragungsfunktionsprofils zum Umwandeln eines Multikanal-Audiosignals mit immersiven und räumlichen Audiocharakteristika in ein Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt; und nach dem Umwandeln des Multikanal-Audiosignals in das Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt, Steuern des drahtlosen Senders zum drahtlosen Übertragen des Stereosignals an den binauralen Kopfhörer.
Vorrichtung nach Anspruch 8, wobei der Prozessor einen Signalprozessor umfasst.
Vorrichtung nach Anspruch 8, die ferner einen drahtlosen Empfänger umfasst, der ausgelegt ist, die Rückmeldung drahtlos vom Benutzer zu empfangen und die Rückmeldung dem Prozessor bereitzustellen.
Vorrichtung nach Anspruch 8, die ferner den drahtlosen Sender umfasst.
Vorrichtung nach Anspruch 11, wobei der drahtlose Sender ausgelegt ist, das Stereosignal drahtlos an den binauralen Kopfhörer mittels Bluetooth-Konnektivität zu übertragen.
Vorrichtung nach Anspruch 8, wobei der Speicher ferner ausgelegt ist, mehrere vorherbestimmte Außenohrübertragungsfunktionen, die die mindestens eine Außenohrübertragungsfunktion umfassen, zu speichern, und wobei der Speicher ferner derart ausgelegt ist, dass jedes Außenohrübertragungsfunktionsprofil der mehreren Außenohrübertragungsfunktionsprofile einen Teilsatz der mehreren vorherbestimmten Außenohrübertragungsfunktionen umfasst.
Vorrichtung nach Anspruch 13, wobei der Prozessor ferner ausgelegt ist, mehrere vorher definierte unverarbeitete Testsignale mit jeder der mehreren vorherbestimmten Außenohrübertragungsfunktionen zu verarbeiten, um die Testsignale zu erzeugen, die drahtlos an den binauralen Kopfhörer übertragen werden sollen.
Vorrichtung nach Anspruch 14, wobei der Speicher ferner derart ausgelegt ist, dass jede vorherbestimmte Außenohrübertragungsfunktion der mehreren vorherbestimmten Außenohrübertragungsfunktionen mehrere numerische Parameter zur Audiofilterung umfasst und wobei der Prozessor ferner ausgelegt ist, das Multikanal-Audiosignal in das Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt, durch Filtern des Multikanal-Audiosignals unter Verwendung jedes der mehreren numerischen Parameter zur Audiofilterung jeder Außenohrübertragungsfunktion im ausgewählten Außenohrübertragungsfunktionsprofil umzuwandeln.
Vorrichtung nach Anspruch 14, wobei die Rückmeldung vom Benutzer eine Angabe einer wahrgenommenen Richtung und Externalisierung jedes der Testsignale durch den Benutzer umfasst und wobei der Prozessor ferner ausgelegt ist, das Außenohrübertragungsfunktionsprofil aus den mehreren Außenohrübertragungsfunktionsprofilen auf der Basis der Rückmeldung durch Auswählen des Außenohrübertragungsfunktionsprofils auszuwählen, für das die wahrgenommene Richtung und Externalisierung für jedes der Testsignale am nächsten mit der tatsächlichen Richtung und Externalisierung der Testsignale übereinstimmt.
Berührbares prozessorlesbares Speichermedium, das ausgelegt ist, prozessorlesbaren Code zu codieren, der bei Ausführung durch einen oder mehrere Prozessoren Aktionen ermöglicht, die umfassen: Auswählen eines Außenohrübertragungsfunktionsprofils, das genau auf einen Benutzer zutrifft, aus mehreren Außenohrübertragungsfunktionsprofilen durch: Steuern eines drahtlosen Senders zum drahtlosen Übertragen von Testsignalen an einen binauralen Kopfhörer; nach dem Steuern des drahtlosen Senders zum drahtlosen Übertragen der Testsignale an den binauralen Kopfhörer, Empfangen einer Rückmeldung vom Benutzer und Auswählen des Außenohrübertragungsfunktionsprofils aus den mehreren Außenohrübertragungsfunktionsprofilen auf der Basis der Rückmeldung, wobei jedes Außenohrübertragungsfunktionsprofil mindestens eine Außenohrübertragungsfunktion umfasst; Einsetzen des ausgewählten Außenohrübertragungsfunktionsprofils zum Umwandeln eines Multikanal-Audiosignals mit immersiven und räumlichen Audiocharakteristika in ein Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt; und nach dem Umwandeln des Multikanal-Audiosignals in das Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt, Steuern des drahtlosen Senders zum drahtlosen Übertragen des Stereosignals an den binauralen Kopfhörer.
Berührbares prozessorlesbares Speichermedium nach Anspruch 17, wobei die Aktionen ferner umfassen: Speichern mehrerer vorherbestimmter Außenohrübertragungsfunktionen, die die mindestens eine Außenohrübertragungsfunktion umfassen, wobei jedes Außenohrübertragungsfunktionsprofil der mehreren Außenohrübertragungsfunktionsprofile einen Teilsatz der mehreren vorherbestimmten Außenohrübertragungsfunktionen umfasst; und Verarbeiten mehrerer vorher definierter unverarbeiteter Testsignale mit jeder der mehreren vorherbestimmten Außenohrübertragungsfunktionen, um die Testsignale zu erzeugen, die drahtlos an den binauralen Kopfhörer übertragen werden sollen.
System, das umfasst: einen drahtlosen Sender; einen binauralen Kopfhörer; eine Benutzervorrichtung, die ausgelegt ist, Steuerbefehle bereitzustellen; und eine Vorrichtung, die ausgelegt ist, Aktionen durchzuführen, die umfassen: Auswählen eines Außenohrübertragungsfunktionsprofils, das genau auf einen Benutzer zutrifft, aus mehreren Außenohrübertragungsfunktionsprofilen durch: Steuern des drahtlosen Senders zum drahtlosen Übertragen von Testsignalen an den binauralen Kopfhörer; nach dem Steuern des drahtlosen Senders zum drahtlosen Übertragen der Testsignale an den binauralen Kopfhörer, Empfangen der Steuerbefehle, die eine Rückmeldung umfassen, von der Benutzervorrichtung und Auswählen des Außenohrübertragungsfunktionsprofils aus den mehreren Außenohrübertragungsfunktionsprofilen auf der Basis der Rückmeldung, wobei jedes Außenohrübertragungsfunktionsprofil mindestens eine Außenohrübertragungsfunktion umfasst; Einsetzen des ausgewählten Außenohrübertragungsfunktionsprofils zum Umwandeln eines Multikanal-Audiosignals mit immersiven und räumlichen Audiocharakteristika in ein Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt; und nach dem Umwandeln des Multikanal-Audiosignals in das Stereosignal, so dass das Stereosignal die immersiven und räumlichen Audiocharakteristika des Multikanal-Audiosignals bewahrt, Steuern des drahtlosen Senders zum drahtlosen Übertragen des Stereosignals an den binauralen Kopfhörer.
System nach Anspruch 19, wobei die Vorrichtung ausgelegt ist, weitere Aktionen durchzuführen, die umfassen: Speichern mehrerer vorherbestimmter Außenohrübertragungsfunktionen, die die mindestens eine Außenohrübertragungsfunktion umfassen, wobei jedes Außenohrübertragungsfunktionsprofil der mehreren Außenohrübertragungsfunktionsprofile einen Teilsatz der mehreren vorherbestimmten Außenohrübertragungsfunktionen umfasst; und Verarbeiten mehrerer vorher definierter unverarbeiteter Testsignale mit jeder der mehreren vorherbestimmten Außenohrübertragungsfunktionen, um die Testsignale zu erzeugen, die drahtlos an den binauralen Kopfhörer übertragen werden sollen.