DE69637203T2

DE69637203T2 - Mikrofonauswahlverfahren zur Anwendung in einem sprachgesteuerten Mehrmikrofonvermittlungssystem

Info

Publication number: DE69637203T2
Application number: DE69637203T
Authority: DE
Inventors: Donald John Madison Bowen; Gregory Jr. Somerset Ciupita
Original assignee: AT&T Corp; AT&T IPM Corp
Current assignee: AT&T Corp
Priority date: 1995-05-08
Filing date: 1996-05-01
Publication date: 2008-05-08
Anticipated expiration: 2016-05-02
Also published as: DE69637203D1; EP0742679B1; TW311324B; AU5205796A; US5625697A; EP0742679A3; CA2174271A1; SG42399A1; EP0742679A2; JP3025194B2; KR100405099B1; MX9601658A; KR960043968A; JPH08317491A; AU702907B2; CA2174271C

Description

Hintergrund der Erfindung
1. Technisches Gebiet
Die vorliegende Erfindung bezieht sich auf Audiosysteme und spezieller auf Systeme zum selektiven Verbinden von Sprachschaltungen mit einer Audioleitung unter Ansprechen auf Sprachsignale.
2. Beschreibung des Standes der Technik
Viele Unternehmen betrachten derzeit eine Telekonferenzschaltung als die kostengünstigste Möglichkeit zum Kommunizieren von Personal an verstreuten Standorten untereinander und dadurch zum Reduzieren der Notwendigkeit von Geschäftsreisen. Bei einer Audio-Telekonferenzanordnung wird eine Kommunikation zwischen einer Anzahl von Konferenzteilnehmern an einem Standort und einer Anzahl von Konferenzteilnehmern an einem oder mehreren abgesetzten Standorten über eine Telefonverbindung vermitteltt. Die Qualität der Übertragung zwischen den getrennten Gruppen von Konferenzteilnehmern hängt im Allgemeinen von der Position des jeweiligen Konferenzteilnehmers in Bezug auf ein Mikrofon sowie die Lautsprechereinrichtung an jedem Standort ab. Mit einem einzigen Mikrofon und einer einzigen Lautsprechereinrichtung in einem Raum an einem Konferenzstandort ist bei der Übertragung ein Qualitätsverlust zu verzeichnen, da sich einige der Konferenzteilnehmer im Allgemeinen in einem größeren als dem optimalen Abstand von dem Mikrofon und der Lautsprechereinrichtung befinden.
Es ist allgemein bekannt, eine Mehrzahl von Mikrofonen zu nutzen, die an jedem Konferenzstandort in geeignetem Abstand zueinander angeordnet sind, um die Qualität des Konferenzsystems zu verbessern. Die Mikrofonausgangssignale werden aufsummiert, und das aufsummierte Ausgangssignal wird an eine Kommunikationsverbindung angelegt, die danach zwischen den Standorten aufgebaut wird. Bei einer solchen Anordnung kann sich jeder Konferenzteilnehmer innerhalb eines akzeptablen Abstands von einem der Mikrofone befinden, wodurch die Sprachaufnahme eine relativ gute Qualität aufweist. Wenn jedoch sämtliche Mikrofone gleichzeitig angeschaltet sind, treten einige unerwünschte Effekte auf. Die Gesamtaufnahme von Rauschen ist viel größer als für ein einzelnes Mikrofon. Die künstlichen Nachhalleffekte, die gelegentlich durch die verzögerte Signalaufnahme von den weiter entfernten Mikrofonen bewirkt werden, vermindern die Qualität der Konferenzübertragung stark. Ferner kann durch die mehreren ständig angeschalteten Mikrofone leicht eine elektroakustische Instabilität entstehen. Es ist daher wünschenswert und auch im Fachgebiet bekannt, eine Umschaltanordnung zur Verfügung zu stellen, welche es möglich macht, dass nur das dem sprechenden Konferenzteilnehmer nächstliegende Mikrofon aktiv ist, sodass Nachhalleffekte und die Aufnahme von Rauschen minimiert werden.
Eine solche Anordnung wird üblicherweise als "Auswahlschaltung" bezeichnet. Bei der "Auswahlschaltungs"-Anordnung kann der lauteste Sprecher die Kontrolle übernehmen und die anderen Konferenzteilnehmer an seinem Standort ausschalten. Diese automatische Umschaltung zwischen Mikrofonen unter Ansprechen auf den höchsten Sprachpegeleingang, der abwechselnd an unterschiedlichen Mikrofonen erscheint, kann jedoch auch zu Übertragungsunterbrechungen führen, welche die Verständlichkeit negativ beeinflussen, und kann zu einer unerwünschten Störung führen, die durch kurzzeitige Geräusche im Raum bewirkt werden. Beispielsweise kann durch ein lautes Geräusch an einem der Konferenzstandorte das steuernde Mikrofon vollständig abgeschaltet werden. Da ferner zu einem bestimmten Zeitpunkt nur ein einziges Mikrofon in Betrieb ist, kann die Übertragung der Steuerung von einem Mikrofon auf ein anderes, wie sie beispielsweise bewirkt wird, wenn sich der sprechende Konferenzteilnehmer an einem Standort in einem Raum von einer Position zu einer anderen bewegt, zu einer Sprachübertragung mit veränderlicher Qualität, zu Unterbrechungen in der Übertragung sowie zu Nachhalleffekten führen, die mit der Position des sprechenden Konferenzteilnehmers variieren.
Es sind bisher verschiedene Telekonferenzanordnungen vorgeschlagen und genutzt worden, um ein einzelnes Mikrofon aus einer Mehrzahl von Mikrofonen für Konferenzteilnehmer auszuwählen und um das Signal von nur dem ausgewählten Mikrofon zu übertragen. Solche Anordnungen sind zum Beispiel beschrieben in US-Patent 3,730,995 , am 01. Mai 1973 an M.V. Matthews erteilt, in US-Patent 3,755,625 , am 28. August 1973 an D.J. Maston erteilt, in US-Patent 4,449,238 , am 15. Mai 1984 an B.H. Lee et al. erteilt, und in US-Patent 4,658,425 , am 14. April 1987 an S.D. Julstrom erteilt.
Ein weiteres Beispiel für eine Telekonferenzanordnung ist in der gleichzeitig anhängigen US-Patentanmeldung mit dem Aktenzeichen 08/239771 offenbarten, das am 09. Mai 1994 für D.J. Bowen eingereicht worden ist und gemeinsam mit der vorliegenden Anmeldung an denselben Abtretungsempfänger übertragen worden ist. Bei dieser gleichzeitig anhängigen Anmeldung ermöglicht eine sprachaktivierte Umschaltanordnung die Auswahl eines oder mehrerer Mikrofone entsprechend den Ausgangssignalpegeln von jedem der Mikrofone.
Außerdem werden bei der in der gleichzeitig anhängigen Anmeldung beschriebenen sprachaktivierten Umschaltanordnung Richtmikrofone genutzt, um die Qualitätsminderung der Sprachsignale aufgrund von Nachhall und Rauschaufnahme zu reduzieren. Diese Richtmikrofone sind in einem gemeinsamen runden Gehäuse angeordnet und weisen Empfindlichkeitsansprechmuster auf, die sich vom Mittelpunkt des Gehäuses nach außen erstrecken. Die sprachaktivierte Umschaltanordnung nutzt außerdem einen Auswahlalgorithmus oder -prozess, um die entsprechende Anzahl dieser Mikrofone zur Aktivierung auszuwählen, um effektiv jede Person, die in einem Raum spricht, abzuhören.
Die vorstehend beschriebene sprachaktivierte Umschaltanordnung ist zufrieden stellend hinsichtlich der Minimierung der Qualitätsverschlechterung von Sprachsignalen aufgrund von Nachhall und der Aufnahme von Rauschen. Sie ist gleichermaßen zufrieden stellend im Hinblick auf das Bewirken, dass das Mikrofonauswahlverfahren in ganz normaler Weise zu erfolgen scheint, beispielsweise ohne das Abschneiden von Silben, wenn Mikrofone aus dem Abschaltzustand angeschaltet werden. Es ist dennoch wünschenswert, die Ausführung des Mikrofonauswahlverfahrens in solcher Weise zu vereinfachen, dass dieses Verfahren in einer begrenzten Verarbeitungszeit ausgeführt werden kann. Durch eine solche Vereinfachung würde ein Prozessor regelmäßiger für andere notwendige Berechnungen frei werden oder es wäre die Nutzung eines leistungsärmeren und kostengünstigeren Prozessors in der Umschaltanordnung möglich.
Zusammenfassung der Erfindung
Entsprechend der vorliegenden Erfindung wird ein Mikrofonauswahlprozess relativ konstant gestaltet, was die Verarbeitungsanforderungen betrifft, und zwar durch die Nutzung von Kombinationswerten, welche ein Maß für die Qualität des Sprachsignals bieten, das an jedem Mikrofon einer Mehrzahl von Mikrofonen empfangen wird. Solche Kombinationswerte werden in einer Weise abgeleitet, die eine Feststellung desjenigen Mikrofons ermöglicht, welches das Sprachsignal am besten empfängt. Jedes der Mikrofone weist ein Supernieren-Ansprechmuster auf, und die Mikrofone sind insgesamt derart angeordnet, dass für einen typischen Konferenzraum eine Abdeckung der gesamten Fläche bereit gestellt wird.
Entsprechend einem Aspekt der Erfindung wählt der Mikrofonauswahlprozess dasjenige Mikrofon aus, welches das Sprachsignal am besten empfängt, indem er einen Energiewert des Signals, das an einem jeweiligen der Mikrofone empfangen wird, mit dem an jedem der anderen Mikrofone empfangenen vergleicht. Spezieller werden Paare von Mikrofonen untersucht, um die Ursprungsrichtung für die Sprache festzustellen, indem ein Mikrofonpaar gesucht wird, bei dem die Sprache in dem nach vorn gewandten Mikrofon, d. h. dem zu der Quelle der Sprache hin gerichteten Mikrofon, stark ist und in dem zugehörigen nach hinten gerichteten Mikrofon, d. h. dem von der Quelle der Sprache weg gerichteten Mikrofon, schwach ist. Da ein Nullstrahlmuster, welches an der Rückseite jedes Mikrofons liegt, schmaler als ein Hauptstrahl- oder -empfindlichkeitsmuster ist, welches an der Vorderseite jedes Mikrofons liegt, stellt dieser Nullstrahl einen empfindlicheren und daher besseren Indikator für die Richtung des Ursprungs der Sprache dar als der Hauptstrahl. Die Kombination der Energiewerte des Signals für ein nach vorn gewandtes Mikrofon und das diesem jeweils zugeordnete, nach hinten gewandte Mikrofon liefert vorteilhafterweise einen spezifischen Kombinationswert, der mit jedem der anderen Mikrofonpaare in der Umschaltanordnung verglichen wird. Das Mikrofonpaar mit dem besten Kombinationswert lässt sich dann in einfacher Weise bestimmen, um dasjenige Mikrofon zu identifizieren und auszuwählen, welches das Sprachsignal am besten empfängt.
Kurze Beschreibung der Zeichnungen
Die Erfindung und die Art und Weise ihrer Ausführung wird anhand der folgenden detaillierten Beschreibung eindeutiger verständlich werden, wenn diese zusammen mit den anhängenden Zeichnungen gelesen wird, wobei:
1 ein Blockdiagramm einer Konferenzanlagen-Mikrofonschaltung darstellt, die entsprechend der vorliegenden Erfindung ausgelegt ist;
2 eine Draufsicht eines Konferenzanlagengehäuses zum Umschließen der in 1 gezeigten Mikrofonschaltung darstellt;
3 eine Vorderansicht des in 2 gezeigten Konferenzanlagengehäuses darstellt;
4 ein Telekonferenzsystem darstellt, in welchem die vorliegende Erfindung zur Anwendung kommen kann;
5 ein Ablaufdiagramm für einen Prozess darstellt, der zur Integration in den in 1 gezeigten digitalen Signalprozessor geeignet ist, und zwar entsprechend der Erfindung;
6 ein Ablaufdiagramm für einen Prozess darstellt, welcher einen Teil des in 5 gezeigten Prozesses detaillierter zeigt; und
7 ein Ablaufdiagramm für einen Prozess darstellt, der einen Teil des in 5 gezeigten Prozesses detaillierter zeigt.
In sämtlichen Zeichnungen sind die gleichen Elemente, wenn sie in mehr als einer Figur gezeigt sind, mit den gleichen Bezugszeichen bezeichnet.
Detaillierte Beschreibung
Nehmen wir nun auf 1 Bezug, so ist in dieser ein Blockdiagramm einer Konferenzanlagenmikrofon(CAM)-Schaltung 100 gezeigt. Die CAM-Schaltung 100 umfasst einen digitalen Signalprozessor (DSP) 110, fünf separate Eingangsschaltungen, die aus Verstärkern 121 bis 125 und jeweils zugeordneten linearen CODECs 131 bis 135 bestehen. Jeder einzelnen dieser. Eingangsschaltungen ist ein jeweiliges Gradientenmikrofon erster Ordnung zugeordnet, das in einem CAM-Gehäuse 200 enthalten ist, wie es in 2 gezeigt ist und später beschrieben wird. Die CAM-Schaltung 100 umfasst außerdem eine Auswahllogikschaltung 140 zum Auswählen einer jeweiligen der fünf Eingangsschaltungen zum jeweiligen Bereitstellen ihres Mikrofonsignals für den DSP 110 über fünf Seriell-ein-parallel-aus-(SIPO-) oder Seriell-zu-parallel-Konverter 141 bis 145. Das Ausgangssignal des DSP 110 wird einer Ausgangsschaltung bereitgestellt, die einen linearen CODEC 150 sowie einen Ausgangsverstärker 151 umfasst. Der DSP 110 sowie die linearen CODECs 131 bis 135 sowie 150 und die Auswahllogik 140 empfangen alle Taktungsinformationen von einer Taktungsschaltung 153. Fünf Lichtemitterdioden (LEDs) 152-1, -2, -3, -4, -5 sind in der CAM-Schaltung 100 umfasst, um eine optische Anzeige für eine Anfangskalibrierung der CAM-Schaltung 100 bereitzustellen und auch eine allgemeine optische Anzeige für Personen, die in dem Konferenzraum anwesend sind, im Hinblick darauf bereitzustellen, welcher allgemeine Bereich des Raums durch das Mikrofon oder die Mikrofone, das/die von der CAM-Schaltung 100 ausgewählt ist/sind, abgedeckt wird.
Beim Betrieb wird jedes analoge Eingangssignal von jedem Mikrofon, das in die CAM-Schaltung 100 eingegeben wird, jeweils von einem der linearen Verstärker 121 bis 125 verstärkt. Verstärker, die zur Verwendung als Verstärker 121 bis 125 geeignet sind, sind kommerziell erhältlich. Ein solcher Verstärker ist die Einheit MC34074, die beispielsweise von Motorola erhältlich ist. Von jedem Verstärker 121 bis 125 wird das zugehörige analoge Signal jeweils in die linearen 16-Bit-CODECs 131 bis 135 eingekoppelt, wobei jedes analoge Signal digitalisiert wird. CODECs, die zur Verwendung als CODECs 131 bis 135 geeignet sind, sind kommerziell erhältlich. Ein solcher CODEC ist beispielsweise die Einheit AT&T7525, die bei der AT&T Corp. erhältlich ist. Kostengünstige μ-LAW-CODECs sind ebenfalls erhältlich und werden geeigneterweise die gewünschten Funktionen bereitstellen, die von den CODECs 131 bis 135 sowie 150 gefordert werden.
Von den CODECs 131 bis 135 wird jedes digitalisierte 16-Bit-Signal seriell in zwei kaskadierte Seriell-zu-parallel-18-Bit-Register geladen. Fünf Paare dieser kaskadierten Register umfassen jeweils die Seriell-zu-parallel-Konverter (SIPO) 141 bis 145. Seriell-zu-parallel-Konverter, die zur Verwendung als Konverter 141 bis 145 geeignet sind, sind im Fachgebiet bekannt und sind beispielsweise bei Motorola unter der Teilenummer MC74299 erhältlich.
Die Mikrofon-Eingangssignale werden von dem DSP 110 gewichtet und aufsummiert, um das gewünschte einheitliche Mikrofonausgangssignal zu bilden. Der DSP 110 kann beispielshalber solche digitale Signalprozessorhardware wie den DSP16 oder den DSP32C von der AT&T Corp. zusammen mit einem Nur-Lese-Speicher (ROM) zum Speichern der Software, welche die hier nachfolgend beschriebenen Verarbeitungsvorgänge ausführt, und mit einem Direktzugriffspeicher (RAM) zum Speichern der Ergebnisse des DSP 110 umfassen.
Über die Nutzung der Auswahllogikschaltung 140 wählt der DSP 110 sequentiell jedes der zehn kaskadierten Seriell-zu-parallel-Register in den Konvertern 141 bis 145 aus und liest diese Daten ein, und zwar jeweils 8 Bit über die unteren 8 Bit seines Parallelports. Der DSP 110 liefert ein Steuersignal an die Auswahllogikschaltung 140 über die Leitung 101 zum richtigen Zeitpunkt, um der Auswahllogikschaltung zu ermöglichen, das entsprechende der Register zu aktivieren und dadurch das richtige 8-Bit-Datensignal für den DSP 110 bereitzustellen. Decoderschaltungen, die zur Nutzung als Auswahllogikschaltung 140 geeignet sind, sind im Fachgebiet bekannt und sind beispielsweise bei National Semiconductor unter der Teilenummer 74154 erhältlich.
Nachdem die Dateneingangssignale von den fünf Mikrofonen in dem DSP 110 empfangen und verarbeitet worden sind, wie später detaillierter beschrieben wird, wird ein digitales 16-Bit-Ausgangssignal von dem DSP 110 seriell an den linearen CODEC 150 in der Mikrofon-Ausgangsschaltung übermittelt. Das CODEC-Ausgangssignal wird dann verstärkt und durch den Verstärker 151 konditioniert, um ein standardmäßiges analoges Mikrofon-Ausgangssignal bereitzustellen.
Das Mikrofon-Ausgangssignal ist nicht auf nur ein oder zwei Mikrofon-Eingangssignale beschränkt, sondern stellt vielmehr die gewichtete Summe sämtlicher Mikrofon-Eingangssignale dar. Jedem Mikrofon wird ein variabler Wichtungsfaktor zugeordnet und wird zum sukzessiven An- oder Abschalten des Signals von einem jeweils ausgewählten oder aktivierten Mikrofon, das an die Audioleitung angeschlossen ist, genutzt. Der Wichtungsfaktor ist für das/die ausgewählte(n) Mikrofon(e) typischerweise groß und ist für die nicht ausgewählten Mikrofone Null. Da diese Wichtungsfaktoren sukzessiv angepasst werden, sind die Auswahl eines Mikrofons sowie Änderungen im Pegel des Hintergrundrauschens daher für die Nutzer weniger auffällig. Während Übergangsintervallen der Konversation kann der Wichtungsfaktor für verschiedene Mikrofone gleichzeitig relativ groß sein.
Ein linearer CODEC, der zur Nutzung als CODEC 150 geeignet ist, ist beispielsweise bei der AT&T Corp. unter der Teilenummer AT&T7525 erhältlich. Ein Verstärker, der zur Nutzung als Verstärker 151 geeignet ist, ist beispielsweise bei Motorola unter der Teilenummer MC34074 erhältlich. Die Taktungsschaltung 153 umfasst einen 26-MHz-Quarzoszillator für den DSP 110 sowie für ein Signal mit 2,048 MHz, das von den CODECs zur Synchronisation und Datenübertragung genutzt wird.
In 2 stellt eine Draufsicht eines CAM-Gehäuses 200 dar, das einen nach oben gerichteten Lautsprecher 210, Mikrofone 220-1, -2, -3, -4, -5 und LEDs 152-1, -2, -3, -4, -5 in dieses Gehäuse eingebettet umfasst. Bei der offenbarten Ausführungsform ist das CAM-Gehäuse 200 mit einer Mehrzahl von Gradientenrichtungsmikrofonen erster Ordnung des Typs konfiguriert, der in US-Patent 5,121,426 beschrieben ist, das am 09. Juni 1992 erteilt wurde. Diese Mikrofone sind in einem fünfeckig geformten Gehäuse montiert, das durch das US-Geschmacksmuster 327,479 dargestellt wird. Die Mehrzahl der Gradientenmikrofone erster Ordnung, beispielshalber sind fünf gezeigt, sind in dem fünfeckig oder allgemein rund geformten Gehäuse derart angeordnet, dass sie von dem Mittelpunkt des Gehäuses nach außen gewandt sind und Supernieren-Ansprechmuster bilden. Die Mikrofonanordnung liefert eine vollständige Flächenabdeckung für einen Raum, was bei einer Telefonkonferenzanwendung am sinnvollsten ist. Da zu einem gegebenen Zeitpunkt während des normalen Betriebs nur eine Person spricht, werden Hintergrundrauschen und Nachhall minimiert, indem nur dasjenige Mikrofon aktiviert wird, das die Sprache dieser Person am besten empfängt.
Entsprechend der offenbarten Ausführungsform sind die in 1 gezeigten Schaltungen in dem CAM-Gehäuse 200 untergebracht und sind dafür ausgelegt, die Ausgangssignale von jedem der Mikrofone 220-1, -2, -3, -4, -5 zu vergleichen, um festzustellen, welches eine oder welche mehreren dieser Mikrofone die stärkeren Sprachsignale bereitstellen. Unter Ansprechen darauf werden die Signale von dem/den ausgewählten Mikrofon oder Mikrofonen an einen Konferenzteilnehmer an einem abgesetzten Standort übertragen, und zwar ohne Nachhall, der sich normalerweise ergibt, wenn mehr als ein Mikrofon aktiviert ist.
Der Lautsprecher 210 ist in der Null des polaren Ansprechmusters jedes der in dem Gehäuse 200 eingebetteten Mikrofone angeordnet. Die Null des polaren Ansprechmusters liegt zwischen der Hauptkeule und einer benachbarten Seitenkeule. Diese spezielle Null liegt bei 125°, was die spezielle Anordnung der Mikrofone um den Umfang des Gehäuses 200 herum bedingt. Dieses Funktionsverhalten wird erreicht, indem ein Mikrofonelement wie in dem US-Patent 5,121,426 offenbart in dem Gehäuse platziert wird, sodass ein polares Supernieren-Ansprechmuster gebildet wird. Wenngleich in 2 nur das einem einzigen Mikrofon 220-4 zugeordnete polare Ansprech muster gezeigt ist, sind die Ansprechmuster für jedes der Mikrofone in dem Gehäuse identisch. Es sei erwähnt, dass das Gehäuse und die in diesem enthaltenen Telefone zusammenwirkend die Form des Ansprechmusters bestimmen.
Eine Vorderansicht des CAM-Gehäuses 200 ist in 3 gezeigt, um die relative Anordnung dreier Mikrofone 220-2, 220-3 und 220-4 zu veranschaulichen und um darzustellen, dass solche Einheiten attraktiv als Produkt mit niedrigem Profil hergestellt werden können.
In 4 ist eine Ausführungsform eines Telekonferenzsystems gezeigt, welches das CAM-Gehäuse 200 umfasst, das in der Mitte eines Konferenztisches 405 angeordnet ist. Die CAM-Schaltung 100, die in das CAM-Gehäuse 200 integriert ist, ist mit einer Steuereinheit 410 in dem System durch ein Kabel 401 verbunden, das entweder durch den Tisch 405 hindurch, über ein in diesen gebohrtes Loch, geführt werden kann oder das auf der Oberfläche des Tischs aufliegen kann. Dieses Kabel enthält eine geeignete Verdrahtung zum Übermitteln sowohl des Mikrofonausgangssignal von dem CAM-Gehäuse 200 an die Steuereinheit als auch des Eingangssignals für den Lautsprecher 210 von der Steuereinheit 410. Das Kabel umfasst außerdem Verdrahtung zum Heranführen von Energie für eine herkömmliche Stromversorgung (nicht gezeigt) in der CAM-Schaltung 100, welche die Betriebsleistung für die in 1 gezeigte Schaltung liefert.
Die Steuereinheit 410 ist über die Leitung 402 mit einer (nicht gezeigten) a/b-Telefonleitung verbunden, um herkömmlichen Telefondienst für das Telekonferenzsystem bereitzustellen. Die Steuereinheit empfängt das Mikrofonausgangssignal von dem Verstärker 151, wie in 1 gezeigt ist, und stellt außerdem direkt ein Eingangssignal für den Lautsprecher 210 bereit, der in den beiden 2 und 3 gezeigt ist. Eine zur Verwendung als Steuereinheit 410 geeignete Steuereinheit ist in US-Patent 5,007,046 mit dem Titel "Computer Controlled Adaptive Speakerphone" beschrieben.
Diese Steuereinheit ermöglicht ein adaptives Lautsprechertelefon mit verbessertem Umschaltverlust, welches seine Umschaltschwellwerte und weitere Leistungsparameter basierend auf einer Analyse der akustischen Umgebung und der Zustände der Telefonleitung dynamisch anpasst. Die in dem bezeichneten Patent offenbarte Steuereinheit erhält ein Ausgangssignal von einem Mikrofon und liefert ein Eingangssignal für einen Lautsprecher, um eine Lautsprechertelefonanordnung bereitzustellen. Das Mikrofon-Ausgangssignal, das von dem Verstärker 151 bereitgestellt wird, kann in einfacher Weise für das in der offenbarten Lautsprechertelefonanordnung gezeigte Mikrofon eingesetzt werden. Eine alternative Steueranordnung, die zur Verwendung als Steuereinheit 410 geeignet ist, ist in US-Patent 5,016,271 mit dem Titel "Echo Canceler-Suppressor Speakerphone" beschrieben. Mit dieser alternativen Steueranordnung wird regelmäßig ein Betrieb mit nahezu Vollduplex und ein Vollduplexbetrieb erzielt, da der Empfangspfad ständig offen bleibt und die Verstärkung des Sendepfads lediglich auf den Pegel reduziert wird, der notwendig ist, um übermäßige Rückechos durch Nachhall zu unterdrücken.
Wenngleich die Steuereinheit 410 getrennt von der CAM-Schaltung 100 gezeigt ist, sollte verstanden werden, dass eine solche Steuereinheit auch in die Elektronik im Inneren des CAM-Gehäuses 200 integriert sein kann. Weiterhin sollte auch noch verstanden werden, dass, wenn für die CAM-Schaltung 100 allgemein bekannte Funktelefonschaltung genutzt wird, beispielsweise das drahtlose Telefongerät 5500HT der AT&T Corp., diese auch derart montiert werden kann, dass sich die Notwendigkeit irgendwelcher Verkabelung zwischen dieser und einer Basiseinheit oder Steuereinheit, welche diese mit der a/b-Telefonleitung verbindet, erübrigt. Eine solche geeignete Funktelefonschaltung ist ebenfalls in US-Patent 4,736,404 offenbart. Für diese Funktelefonschaltung wie auch für die CAM-Schaltung 100 kann eine Batterie genutzt werden, um eine geeignete Betriebsspannungsquelle bereitzustellen.
Nehmen wir als nächstes auf 5 Bezug, so ist in dieser ein Ablaufdiagramm gezeigt, welches die Funktionsweise des DSP 110 bei der Ausführung des Mikrofonauswahlvorgangs veranschaulicht. Die durch den DSP 110 bereitgestellten Funktionen werden in vorteilhafter Weise durch einen Prozess oder ein Programm bestimmt, das in einem (nicht gezeigten) zugeordneten Nur-Lese-Speicher gespeichert ist.
Der Prozesseintritt erfolgt bei Schritt 501, in welchem die Initialisierungsparameter eingestellt werden. Als Teil dieser Parameter wird der Wichtungsfaktor, der hier später beschrieben wird, eines beliebigen der fünf Mikrofone, beispielsweise 220-1, auf 1 gesetzt, wodurch dieses Mikrofon effektiv angeschaltet wird. Wenn dieses Mikrofon AN ist, wird von den Konferenzteilnehmern vorteilhafterweise keine Abschneidung erster Silben wahrgenommen, da ein gewisses Sprachsignal immer übertragen wird, selbst wenn dieses aufgrund der relativen Position des auf AN geschalteten Mikrofons zu der sprechenden Person gedämpft ist. Bestimmte andere Initialisierungsparameter werden entsprechend dem US-Patent 5,007,046 ausgeführt. Sobald diese Initialisierung ausgeführt ist und im Entscheidungsblock 502 verifiziert ist, ist die Schaltung bereit für eine Signaldateneingabe, und der Prozess geht zu Schritt 503 über.
In Schritt 503 wird während jeder Abtastperiode oder alle 125 μs jeder der Mikrofoneingänge abgetastet, um absolute Spitzenwerte im Sprachenergieeingang festzustellen. Außerdem wird in jeder Abtastperiode der Eingangswert für jedes Mikrofon entsprechend dem ihm zugeordneten Wichtungsfaktor angepasst, und danach werden die gewichteten Ausgangssignale sämtlicher Mikrofone auf einer gemeinsamen Audioleitung aufsummiert. Die absoluten Spitzenwerte für die Mikrofone werden aus 16 Stichproben über eine Zyklusperiode von 2 Millisekunden (ms) hin erfasst, um den höchsten absoluten Spitzwert zu erhalten, der innerhalb dieser Zeitperiode für jedes Mikrofon auftritt. Wenn während dieser Zyklusperiode von 2 ms ein nachfolgend gemessener Spitzenwert größer als ein zuvor gemessener und gespeicherter Spitzwert ist, wird der zuvor gespeicherte Spitzenwert durch den danach gemessenen Spitzenwert ersetzt. Wenn der zuvor gemessene Spitzenwert größer als der nachfolgend gemessene Spitzenwert ist, wird jedoch der zuvor gemessene Spitzenwert in dem Speicher beibehalten. Der absolute Spitzenwert für jeden der fünf Mikrofoneingänge wird dadurch in Schritt 503 während jeder Zyklusperiode bestimmt. Die 16 während jeder Zyklusperiode erfassten Stichproben ermöglichen eine Verfolgung der Signalhüllkurve für jedes Mikrofon bei 300 Hz, der niedrigsten interessierenden Frequenz.
Wenn in Schritt 503 keine 16 Stichproben der Sprachenergie für jedes Mikrofon gemessen worden sind, wie in Entscheidungsblock 504 festgestellt wird, rückt der Prozess zu Schritt 505 vor, in welchem das gewichtete Ausgangssignal für jedes Mikrofon berechnet wird. Diese Berechnung erfolgt entsprechend der Datenverarbeitungsrate oder alle 125 μs. Wenn die CAM-Schaltung 100 gerade aktiviert worden ist, bestimmen die Initialisierungsparameter, wie sie in Schritt 501 bereitgestellt werden, das gewichtete Ausgangssignal, und somit ist an dieser Stelle im Prozess nur das Eingangssignal von dem anfangs ausgewählten Mikrofon mit der analogen Ausgangsleitung gekoppelt. Sobald die Initialisierung jedoch abgeschlossen ist, sind die Mikrofone in der CAM-Schaltung 100 entweder auf den Zustand AN oder AUS konfiguriert oder befinden sich im Übergang zwischen diesen beiden Zuständen, entsprechend der im Raum vorliegenden Akustik.
Nachdem 16 Spitzeneingangssignalwerte der Sprachenergie für jedes Mikrofon gemessen worden sind, wie durch Entscheidungsblock 504 bestimmt wird, wird der ausgewählte Spitzeneingangssignalwert genutzt, um einen logarithmischen Wert zu berechnen, beispielsweise eine log₁₀- oder Dezibelberechnung des Signals für jedes der fünf Mikrofon eingangssignale, und zwar in Schritt 506. Diese logarithmischen Werte, welche die Berechnungen der relativen Signalstärken vereinfachen, werden danach in Schritt 507 genutzt, um relativ langzeitig und kurzzeitig die Hüllkurvenenergie für jedes der fünf Spitzenmikrofoneingangssignale zu bestimmen, wobei die Bestimmung der Langzeit- und Kurzzeit-Hüllkurvenenergie hier noch später detaillierter mit Bezugnahme auf 6 beschrieben wird.
Die in Schritt 507 bestimmte Hüllkurvenenergie wird von einem Auswahlalgorithmus oder -Prozess in Schritt 508 genutzt, um auszuwählen, welche(s) Mikrofoneingangssignal(e) zu dem Ausgang durchgelassen werden soll(en). Bei der Durchführung des Auswahlprozesses führt der Auswahlalgorithmus bei einer offenbarten Ausführungsform Vergleiche basierend auf dem maximalen Mikrofonsignal aus, wobei er entweder 1) das momentane Mikrofon; 2) ein entgegengesetztes Mikrofon; oder 3) sowohl das momentane als auch ein entgegengesetztes Mikrofon, wenn deren Sprachsignalpegel relativ stark sind; oder 4) unter weniger restriktiven Kriterien das Mikrofon mit dem stärksten Signal auswählt. In der angegebenen Reihenfolge ausgeführt erfolgt jeder der vorstehenden Vergleiche in einer weniger restriktiven Weise als der ihm vorausgehende. Wenn die Sprachsignalpegel des momentanen sowie eines entgegengesetzten Mikrofons nicht ausreichend stark sind, kann der Wahlalgorithmus basierend auf weniger restriktiven Schwellwerten ein beliebiges Telefon auswählen. Wenn die Sprachsignalpegel nahe dem Pegel des Hintergrundrauschens liegen, führt der Auswahlalgorithmus Vergleiche nur zwischen dem momentan ausgewählten und zwei entgegengesetzten Mikrofonen aus, wobei er bei dem ausgewählten Mikrofon bleibt, wenn die Vergleiche ergebnislos sind.
Sobald das/die Mikrofoneingangssignal(e) in Schritt 508 zur Aktivierung oder Deaktivierung ausgewählt sind, wird in Schritt 509 der variable Wichtungsfaktor für jedes Mikrofon aktualisiert, und zwar während jeder Zyklusperiode von 2 ms, und diese Wichtungsfaktoren werden danach beim Bestimmen des Pegels des Signals für jedes Mikrofon genutzt, das an den Ausgang gekoppelt wird. Somit bleibt der Ausgang eines Mikrofons entsprechend seiner Auswahl oder Nicht-Auswahl entweder AN, AUS, oder es wird ein Übergang zu dem einen oder anderen dieser beiden Zustände bei der in Schritt 505 ausgeführten Berechnung bewirkt.
Wie erwähnt stellt das Ausgangssignal von der CAM-Schaltung 100 ein gewichtetes Signal dar, das von sämtlichen Mikrofonen abgeleitet wird, nicht einfach von denjenigen, für die der Auswahlalgorithmus ausgewählt hat, dass sie aktiv sein sollen, oder die durch diesen Algorithmus auf AN konfiguriert werden. Wenn also von dem Auswahlalgorithmus ein Mikrofon ausgewählt wird, aktiv zu sein, wird dessen Eingangssignal allmählich zu dem Ausgangssignal hinzu addiert oder macht einen größeren prozentualen Anteil desselben aus. Analog wird, wenn ein Mikrofon nicht mehr ausgewählt wird oder auf AUS konfiguriert wird, nachdem es durch den Auswahlalgorithmus ausgewählt worden ist, dessen Eingangssignal allmählich von dem Ausgangssignal entfernt. Eine Abschneidung der ersten Silbe wird vorteilhafterweise auch nicht wahrgenommen, weil immer zumindest ein Mikrofon an gelassen wird und Sprache, die irgendwo in dem Raum erzeugt wird, sofort erkannt und übertragen wird, wenn auch gedämpft.
Der Wichtungsfaktor für die Aktivierung und Deaktivierung für ein Mikrofon wird dargestellt durch:
und
wobei:
W_i der Wichtungsfaktor für das Mikrofon i mit einem Bereich zwischen 0 und 1,0 ist;
I_i einer der fünf Mikrofoneingänge ist; und
O der Ausgangswert für die Summe der gewichteten Signale jedes Mikrofons ist:
Somit wird ein Mikrofon, das angeschaltet ist, fünfmal schneller aktiviert als ein Mikrofon, das ausgeschaltet ist. Ein Hauptvorteil dieser Aktivierungs- und Deaktivierungsanordnung besteht darin, dass etwaiges Hintergrundrauschen, das sich nicht durch den hier noch später beschriebenen Entfernungsprozess für Rauschen entfernen lässt, weniger auffällig ist, wenn es zusammen mit dem Mikrofonsignal addiert und entfernt wird. Diese Anordnung macht es außerdem möglich, dass mehrere Mikrofone zugleich AN sind, und zwar wegen der Differenzen in den Verzögerungen bei den Wichtungsfaktoren zum Aktivieren und Deaktivieren der Mikrofone. Somit werden jegliche unerwünschten Nebeneffekte davon, dass der Auswahlmechanismus schnell zwischen den Mikrofonen umschaltet, wie sie beim harten Umschalten verursacht werden (sofortiges vollständiges An- oder vollständiges Ausschalten eines Mikrofons), unterbunden. Somit können tatsächlich viele Personen gleichzeitig in jeweils unterschiedliche Mikrofone sprechen und diese aktivieren. In dem Maße, in dem eine jeweilige Person weiterspricht, wird ihr Mikrofon AN oder aktiviert bleiben.
Nehmen wir nun auf 6 Bezug, so ist in dieser ein Ablaufdiagramm gezeigt, welches die Schritte veranschaulicht, die beim Erhalt der Messwerte für die relativen Signalstärken für jedes der Mikrofone durch die CAM-Schaltung 100 beteiligt sind. Diese Schritte 601 bis 604 sind alle Bestandteil des in 5 ausgeführten Schritts 507. Da der Auswahlalgorithmus feststellt, wann eine Person oder mehrere Personen sprechen und danach das Mikrofon oder die Mikrofone aktiviert, das/die am besten diese Sprachsignale empfängt/empfangen, besteht eine kritische Komponente dieser Berechnung darin, korrekt festzustellen, wann es sich bei dem Eingangssignal von einem Mikrofon um Sprache und nicht nur um Rauschen handelt. Die durch das Ablaufdiagramm aus 6 ausgeführten Schritte liefern vorteilhafterweise diese Information zur Verwendung für den Auswahlalgorithmus.
Die empfangene Signalstärke wird wie in Schritt 601 durch Mitteln des absoluten Spitzenwertes, der für jeden Mikrofoneingang ausgewählt wird, berechnet, wobei jeder absolute Spitzenwert von denjenigen Werten ausgewählt wird, die über eine Zyklusperiode von 2 ms hin auftreten. Es wird sowohl ein Kurz- als auch ein Langzeit-Energiemittelwert generiert, welcher die Sprachsignalstärke bzw. Rauschsignalstärke repräsentiert. Unterschiedliche Mittelungsfaktoren werden in Abhängigkeit davon ausgewählt, ob der Anstieg der Eingangswerte positiv oder negativ ist. Wenn der Anstieg positiv ist, nimmt die Stärke der Eingangswerte zu, und wenn der Anstieg negativ ist, vermindert sich die Stärke der Eingangswerte oder fällt ab. Beide Mittelwerte werden berechnet als
wobei:
rec_s und rec_l den Kurzzeit- bzw. Langzeit-Signalmittelwert darstellen;
I_n der Signalspitzenwert für den jeweiligen Eingang während der momentanen Zyklusperiode ist; und
I_n-1 den Signalspitzenwert für den jeweiligen Eingang während der vorausgegangenen Zyklusperiode darstellt. Beide Größen
und
werden bei der Berechnung der Sprachsignalstärke genutzt. Die Größe
stellt ein Maß für das Hintergrundrauschen dar. Die Größe
stellt ein Maß für intermittierende Signale wie beispielsweise Sprache oder ein etwaiges anderes scharfes Geräusch, zusammen mit etwaigem Hintergrundrauschen, dar. Wie in Schritt 602 angegeben, wird die Sprachsignalstärke oder der Energiewert für das verfolgte Signal
für jedes Mikrofon berechnet, indem der Langzeit-Mittelwert
von dem Kurzzeit-Mittelwert
subtrahiert wird, also:
oder SPRACHE = (SPRACHE + Rauschen) – RAUSCHEN.
Da dies logarithmische Werte sind, entspricht die Größe
nicht der Differenz des Betrages zwischen dem Kurz- und dem Langzeit-Signalmittelwert sondern vielmehr dem Verhältnis der Beträge dieser zwei Werte.
Die Werte für das verfolgte Signal jedes Mikrofons werden dann wie in Schritt 603 sortiert, um einen maximalen und einen minimalen Energiewert der verfolgten Signale, RECMAX bzw. RECMIN, von sämtlichen Telefonen zu bestimmen. Als nächstes wird eine SPREIZUNG, welche die Differenz zwischen RECMAX und RECMIN darstellt, in Schritt 604 berechnet. Da der Pegel des Hintergrundrauschens von jedem Mikrofoneingangssignal effektiv entfernt wird, sollte SPREIZUNG bei oder nahe Null liegen, wenn keine intermittierenden Signale vorhanden sind. Wenn SPREIZUNG um einen gewissen Schwellwert größer als Null ist, interpretiert der Auswahlalgorithmus dies daher als eine Anzeige dafür, dass ein Sprachsignal vorhanden ist, und schaut sich danach den jeweiligen Wert für die verfolgte Signalstärke für jedes Mikrofon an, um die Quelle des Sprachsignals zu bestimmen. SPREIZUNG stellt ein Maß dar, das genutzt wird um anzuzeigen, dass ein intermittierendes Signal wie beispielsweise ein Sprachsignal vorhanden ist.
In Reaktion auf die angebotenen Eingangsparameter wählt der Auswahlprozess dasjenige Mikrofon aus, welches den Sprachklang oder das Sprachsignal am besten aufnimmt. Bei der Auswahl dieses Mikrofons werden die Werte für die verfolgte Signalstärke für die Mikrofone miteinander verglichen. Spezieller werden Paare von Mikrofonen untersucht, um die Ursprungsrichtung der Sprache festzustellen, indem ein Mikrofonpaar gesucht wird, bei welchem die Sprache bei dem nach vorn gewandten Mikrofon, d. h. dem zu der Quelle der Sprache hin gerichteten Mikrofon, stark ist und bei dem rückwärts gewandten Mikrofon, d. h. dem von der Quelle der Sprache weg gerichteten Mikrofon, schwach ist. Es wird angenommen, dass die Sprache in der Null des rückwärts gewandten Mikrofons vorliegt. Der Nullstrahl jedes Mikrofons ist schmaler und daher richtungsempfindlicher als dessen Hauptstrahl. Die Kombination der beiden Mikrofone liefert ein besseres Maß für die Direktionalität des Sprachsignals.
Nehmen wir nun Bezug auf 7, so ist in dieser entsprechend einer Ausführungsform der Erfindung ein Ablaufdiagramm gezeigt, welches zusätzliche Schritte zeigt, die in Schritt 508 aus 5 verkörpert sind, bei welchen die Werte SPREIZUNG, RECMIN und RECMAX bei der Auswahl des geeigneten Mikrofons oder der geeigneten Mikrofone, die aktiv sein sollen, genutzt werden.
Wie bereits angegeben, stellt der Auswahlmechanismus fest, ob ein Sprachsignal vorhanden ist, und wählt das/die Mikrofon(e) oder den/die Strahl(en) aus, das/die am optimalsten oder besten das/die Sprachsignal(e) empfangen. Er nutzt die Werte der verfolgten Signale für jedes Mikrofon oder jeden Strahl, wobei das Strahlmuster für ein spezielles Mikrofon kennzeichnend ist, sowie die Werte RECMAX, RECMIN und SPREIZUNG, um Entscheidungen zu treffen. Wie vorliegend ebenfalls bereits angegeben worden ist, sind die Mikrofone 220-1, -2, -3, -4, -5 in einem fünfeckig geformten Gehäuse montiert, wie deutlich in 2 dargestellt ist. Somit ist für jedes der Mehrzahl von Mikrofonen in Betracht zu ziehen, dass es zwei gegenüberliegende Mikrofone aufweist. Zum Beispiel weist das Mikrofon 220-1 zwei allgemein gegenüberliegende Mikrofone auf, das Mikrofon 220-3 und das Mikrofon 220-4. Wenn sich die CAM-Schaltung 100 in ihrem aktiven Zustand befindet oder AN ist, werden die relativen Eingangsenergiepegel für jeden Mikrofoneingang festgestellt und es wird/werden entweder ein einzelnes oder zwei Mikrofone ausgewählt und bleiben an.
Entsprechend der offenbarten Ausführungsform wird die Berechnung von SPREIZUNG verwendet, um zu bestimmen, ob in dem Raum ein intermittierendes Signal, beispielsweise Sprache, vorhanden ist. Da die Werte RECMIN und RECMAX relativ zu den Pegel des Hintergrundrauschens sind, werden sie beide Null sein, wenn keine Sprache vorhanden ist. Selbst in sehr geräuschvollen Umgebungen stellt der Wert von RECMAX auch eine Anzeige dafür dar, dass Sprache vorhanden ist, jedoch ist es in einer solchen Umgebung weniger wahrscheinlich, dass diese Sprache von einer einzigen Quelle stammt.
Bei der Ausführung des Auswahlalgorithmus entscheidet der Mikrofonauswahlprozess, wie allgemein in Schritt 507 aus 5 gezeigt ist, ob irgendwelche Mikrofone, die auf AN konfiguriert sind, auf AUS umkonfiguriert werden sollen, oder ob irgendwelche Mikrofon von AUS auf AN umkonfiguriert werden sollen. Wie vorliegend bereits angegeben, wird diese Auswahl-Prozedur niemals sämtliche Mikrofone auf AUS schalten.
In Reaktion auf die Werte SPREIZUNG, RECMAX und RECMIN wählt der Mikrofonauswahlprozess dasjenige Mikrofon aus, welches das Sprachsignal am besten aufnimmt. Bei der Auswahl dieses Mikrofons werden die Energiewerte der verfolgten Signale für sämtliche Mikrofone miteinander verglichen. Spezieller werden Paare von Mikrofonen untersucht, um die Ursprungsrichtung der Sprache zu bestimmen, indem ein Mikrofonpaar gesucht wird, bei welchem die Sprache in dem nach vorn gewandten Mikrofon, d. h. dem Mikrofon, das in Richtung der Quelle der Sprache gerichtet ist, stark ist und in dem nach hinten gewandten Mikrofon, d. h. dem Mikrofon, das von der Quelle der Sprache weg gerichtet ist, schwach ist. Da der Nullstrahl jedes Mikrofons schmaler als der Hauptstrahl ist, ist dieser Nullstrahl empfindlicher und stellt daher einen besseren Indikator für die Herkunftsrichtung der Sprache als der Hauptstrahl dar. Somit liefert die Kombination der Signalenergie von den beiden Mikrofonen ein vereinfachtes, aber vollständig geeignetes Maß zur Bestimmung der Ursprungsrichtung der Sprache.
Bei der gleichzeitig anhängigen US-Patentanmeldung 08/239771 werden beim Ausführen eines Mikrofonauswahlprozesses zahlreiche Vergleiche durchgeführt, mit welchen das Mikrofon oder die Mikrofone festgestellt werden, die in Richtung der Quelle des Sprachsignals gerichtet sind. Da die zahlreichen Vergleiche für jeden möglichen Zustand der CAM-Schaltung 100 erfolgen, gibt es eine beträchtliche Menge an redundanten Berechnungen. Wie beispielsweise in der gleichzeitig anhängigen Patentanmeldung 08/239771 für den typischen Fall beschrieben ist, bei dem ein Mikrofon oder Strahl momentan dazu ausgewählt ist, AN zu sein, und die SPREIZUNG groß ist, durchläuft der Prozess kontinuierlich die dort beschriebenen Verarbeitungsschritte, um zu bestimmen, ob 1) dasselbe Mikrofon weiterhin AN sein sollte; 2) stattdessen ein entgegengesetztes Mikrofon ausgewählt werden sollte; oder 3) dasselbe Mikrofon und das entgegengesetzte Mikrofon beide AN sein sollten. Wenn sich keiner dieser drei Tests als zufriedenstellend erweist, ein ungünstigster Zustand, überprüft der Prozess danach jedes Eingangssignal und wählt das erste Eingangssignal aus, das einen minimalen Schwellwert übersteigt, welcher für das Vorhandensein eines Sprachsignals mit geringem Pegel kennzeichnend ist. Ansonsten trifft er die Wahl, bei dem momentan ausgewählten Mikrofon zu bleiben.
Wenngleich möglicherweise der ungünstigste Fall nicht zu häufig auftritt, ist es dieser, der die meiste Verarbeitungszeit erfordert. Oft kann in Softwaresystemen eine begrenzte Menge an Verarbeitungszeit auf periodischer Basis garantiert werden, aber kaum jemals sind große Mengen bedarfsweise verfügbar. Es ist typischerweise besser, wenn es erforderlich ist, eine begrenzte Menge an Verarbeitung in einer zugeordneten Menge an Verarbeitungszeit auszuführen. Und akzeptable Ergebnisse können mit dem Mikrofonauswahlprozess erreicht werden, bei welchem die Analyse, die das beste Leistungsverhalten für den schlimmsten Fall liefert, beschränkt wird, und zwar zu Lasten einer geringfügigen Verschlechterung des möglichen Leistungsverhaltens für den besten Fall.
Um den Mikrofonauswahlprozess, der von dem Auswahlalgorithmus ausgeführt wird, relativ konstant zu gestalten, was die Verarbeitungsanforderungen betrifft, werden Kombinationswerte, die ein Maß für die "Güte" oder ein Bewertungskriterium für jedes Mikrofon angegeben, über einen fünfschrittigen Prozess berechnet, der hier nachstehend beschrieben wird. Durch die Nutzung dieser Kombinationswerte kann vorteilhafterweise ein Vergleich mit einer einzigen Zahl erfolgen, anstatt dass eine Reihe von Berechnungen und Vergleichen erfolgt. Ein Referenzkombinationswert von Null wird als Indikator für ein Maß für den besten akustischen Zustand ausgewählt, und jeder andere Wert als Null stellt ein Maß dafür dar, wie weit der gemessene Kombinationswert von dem besten akustischen Zustand entfernt ist.
Wenn sich beispielsweise der Energiewert der verfolgten Signale für jedes der Mikrofone 220-1 bis 220-5, die beispielsweise in 2 gezeigt sind, folgendermaßen darstellt:
wobei in diesem Beispiel RECMAX = 5, RECMIN = 1 und SPREIZUNG = 4 ist,stellt RECMAX den maximalen Energiewert für die verfolgten Signale dar, der in einem Mikrofon auftritt, wobei dieser den Energiewert der verfolgten Signale übersteigt, der in jedem anderen der Mikrofone auftritt. RECMIN stellt den minimalen Energiewert der verfolgten Signale dar, der in einem Mikrofon auftritt, wobei dieser kleiner als der Energiewert der verfolgten Signale ist, der in jedem der anderen Mikrofone auftritt. Außerdem stellt SPREIZUNG die Differenz zwischen RECMAX und RECMIN dar. Der erste Schritt bei der Bestimmung des Kombinationswertes, wie in Schritt 701 aus 7 dargestellt, besteht darin, die Differenz zwischen dem Wert von
für jedes Mikrofon und RECMAX zu bestimmen:
Der nächste Schritt, der in 7 als Schritt 702 gezeigt ist, besteht darin, dasjenige gegenüberliegende Mikrofon (ggüblg. Mikro) zu identifizieren und zuzuordnen, das den geringeren oder kleineren Energiewert
für die verfolgten Signale aufweist. Bei der offenbarten Ausführungsform, bei der ein fünfeckig geformtes Gehäuse zur Anwendung kommt, kann das gegenüberliegende Mikrofon entweder das als zweites oder drittes auf ein Mikrofon folgende Mikrofon sein (d. h. 220-3 hat die gegenüberliegenden Mikrofone 220-5 und 220-1). Wegen der beispielhaft zugeordneten Energiewerte für die verfolgten Signale werden die Mikrofone also folgendermaßen gepaart:

3) Mikrofon 220-1 220-2 220-3 220-4 220-5

ggüblg. Mikro 220-3 220-4 220-1 220-1 220-2
Sobald für jedes Mikrofon das entgegengesetzte Mikrofon festgestellt ist, wird die Differenz zwischen jedem Wert
des gegenüberliegenden Mikrofons und RECMIN berechnet, und dieser Wert wird dann unter dem ihm zugeordneten Mikrofon gezeigt, also:
Schließlich wird aus der Summe der in den Schritten 2 und 4 für das Mikrofonpaar erhaltenen Mikrofonwerte der Kombinationswert für jedes Mikrofonpaar berechnet, also:

5) Mikrofon 220-1 220-2 220-3 220-4 220-5

Kombinationswert 6 6 2 1 1
Die Ergebnisse, wie sie in diesem veranschaulichenden Beispiel geliefert werden, zeigen, dass entweder das Mikrofon 220-4 oder das Mikrofon 220-5 eine gute Wahl darstellen würden, und entweder eines oder beide werden durch den Prozess ausgewählt, da sie Kombinationswerte aufweisen, die lediglich um 1 von dem idealen Wert Null entfernt sind. Solche Ergebnisse, wie sie anhand dieses Beispiels erhalten werden, sind nicht unerwartet, da als Anfangswerte für
den jeweiligen Energiewert der verfolgten Signale für jedes Mikrofon, der Deutlichkeit und des einfachen Verständnisses halber einfach eine Abfolge ganzer Zahlen gewählt wurde. Genauere Darstellungen bei
lassen sich erreichen und können in einfacher Weise selbst in dem einfachsten Mikroprozessor angewandt werden, und solche Varianten werden in Betracht gezogen. Wenn solche Darstellungen verwendet werden, wird in der Praxis recht häufig der idealste Fall oder die beste Abstimmung zwischen der Quelle der Sprache und einem Mikrofon auftreten.

Claims

Verfahren zum Auswählen eines Mikrofons aus einer Mehrzahl von Mikrofonen zum Übertragen von Sprachsignalen von dem Mikrofon an eine Ausgangsleitung, wobei das Verfahren folgende Schritte umfasst: Messen eines Pegels von Sprachsignalen, der in jedem der Mehrzahl von Mikrofonen unter Ansprechen auf Sprachklänge erscheint, wobei der Pegel der Sprachsignale in jedem der Mehrzahl von Mikrofonen durch eine Ursprungsrichtung für die Quelle der Sprachklänge bestimmt wird; Anordnen der Mehrzahl von Mikrofonen als Mikrofonpaare, wobei ein erstes Mikrofon in jedem Mikrofonpaar ein Hauptstrahl-Empfindlichkeitsmuster aufweist, das sich in einer ersten Richtung erstreckt, und ein zweites Mikrofon in jedem Mikrofonpaar ein Nullmuster aufweist, das sich allgemein in der ersten Richtung erstreckt; Kombinieren der Pegel der Sprachsignale, die in dem ersten und dem zweiten Mikrofon erscheinen, bei jedem einzelnen der Mikrofonpaare, um Kombinationswerte für die Mikrofonpaare zu erhalten; und Vergleichen jedes Mikrofonpaar-Kombinationswertes zum Identifizieren eines Mikrofonpaars, bei welchem das erste Mikrofon die Sprachklänge am besten empfängt.
Verfahren nach Anspruch 1, welches ferner den Schritt umfasst, die Mehrzahl von Mikrofonen derart auf dem Umfang eines kreisförmigen Gehäuses zu montieren, dass sie von dem Mittelpunkt des Gehäuses nach außen gewandt sind und Supernieren-Ansprechmuster bilden.
Verfahren nach Anspruch 2, bei welchem die Mehrzahl der Mikrofone Gradientenmikrofone erster Ordnung sind.
Verfahren nach Anspruch 3, bei welchem die Mehrzahl der Mikrofone in dem Montageschritt in solcher Weise in dem Gehäuse angeordnet werden, dass eine Flächenabdeckung für Sprachklänge, die in einem Raum entspringen, bereitgestellt wird.
Verfahren nach Anspruch 1, bei welchem der Vergleichsschritt ferner den Schritt umfasst, jeden Mikrofonpaar-Kombinationswert mit einem Referenz-Kombinationswert zu vergleichen, wobei der Referenz-Kombinationswert ein Maß für einen besten akustischen Zustand für das erste Mikrofon zum Empfang der Sprachklänge liefert.
Verfahren nach Anspruch 5, bei welchem der Vergleichsschritt ferner den Schritt umfasst, einen Mikrofonpaar-Kombinationswert auszuwählen, welcher dem Referenz-Kombinationswert am nächsten liegt.
Verfahren nach Anspruch 1, bei welchem die Sprachsignale gemessene Energiewerte der verfolgten Signale darstellen.
Verfahren nach Anspruch 7, bei welchem der Messschritt ferner den Schritt umfasst, eine Differenz zwischen dem Energiewert der verfolgten Signale in jedem der Mehrzahl von Mikrofonen und einem maximalen Energiewert der verfolgten Signale in einem beliebigen der Mehrzahl von Mikrofonen festzustellen.
Verfahren nach Anspruch 8, bei welchem der Schritt des Anordnens ferner den Schritt umfasst, das zweite Mikrofon für jedes Mikrofonpaar zu identifizieren, wobei das zweite Mikrofon eines von zumindest zwei Mikrofonen darstellt, bei welchem sich die Hauptstrahl- Empfindlichkeitsmuster in einer zweiten Richtung erstrecken, welche im Allgemeinen der ersten Richtung entgegengesetzt ist, und wobei das zweite Mikrofon dasjenige der zumindest zwei Mikrofone darstellt, welches einen kleineren Energiewert für die verfolgten Signale aufweist.
Verfahren nach Anspruch 9, bei welchem in dem Bestimmungsschritt unter Ansprechen auf den Identifizierungsschritt ferner eine Differenz zwischen dem Energiewert der verfolgten Signale in dem zweiten Mikrofon und einem minimalen Energiewert der verfolgten Signale in einem beliebigen der Mehrzahl von Mikrofonen festgestellt wird.
Verfahren nach Anspruch 10, bei welchem der Vergleichsschritt ferner den Schritt umfasst, jeden Mikrofonpaar-Kombinationswert mit einem Referenz-Kombinationswert zu vergleichen, wobei der Referenz-Kombinationswert ein Maß für einen besten akustischen Zustand für das erste Mikrofon zum Empfang der Sprachklänge liefert.
Verfahren nach Anspruch 11, bei welchem der Vergleichsschritt ferner den Schritt umfasst, einen Mikrofonpaar-Kombinationswert auszuwählen, welcher dem Referenz-Kombinationswert am nächsten liegt.
Verfahren nach Anspruch 12, welches ferner den Schritt umfasst, das erste Mikrofon in dem Mikrofonpaar, mit dem Mikrofonpaar-Kombinationswert, welcher dem Referenz-Kombinationswert am nächsten liegt, mit der außenseitigen Leitung zu verbinden.
Sprachgesteuerte Umschaltvorrichtung zum Auswählen eines Mikrofons aus einer Mehrzahl von Mikrofonen zum Übertragen von Sprachsignalen von dem Mikrofon an eine Ausgangsleitung, wobei die Vorrichtung umfasst: Mittel zum Messen eines Pegels von Sprachsignalen, der in jedem der Mehrzahl von Mikrofonen unter Ansprechen auf Sprachklänge erscheint, wobei der Pegel der Sprachsignale in jedem der Mehrzahl von Mikrofonen durch eine Ursprungsrichtung für die Quelle der Sprachklänge bestimmt wird; Mittel zum Anordnen der Mehrzahl von Mikrofonen als Mikrofonpaare, wobei ein erstes Mikrofon in jedem Mikrofonpaar ein Hauptstrahl-Empfindlichkeitsmuster aufweist, das sich in einer ersten Richtung erstreckt, und ein zweites Mikrofon in jedem Mikrofonpaar ein Nullmuster aufweist, das sich allgemein in der ersten Richtung erstreckt; Mittel zum Kombinieren der Pegel der Sprachsignale, die in dem ersten und dem zweiten Mikrofon erscheinen, bei jedem einzelnen der Mikrofonpaare, um Kombinationswerte für die Mikrofonpaare zu erhalten; und Mittel zum Vergleichen jedes Mikrofonpaar-Kombinationswertes, um ein Mikrofonpaar zu identifizieren, bei welchem das erste Mikrofon die Sprachklänge am besten empfängt.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 14, welche ferner Mittel umfasst, um die Mehrzahl von Mikrofonen derart auf dem Umfang eines kreisförmigen Gehäuses zu montieren, dass sie von dem Mittelpunkt des Gehäuses nach außen gewandt sind und Supernieren-Ansprechmuster bilden.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 14, bei welcher das Mittel zum Vergleichen ferner Mittel umfasst, um jeden Mikrofonpaar-Kombinationswert mit einem Referenz-Kombinationswert zu vergleichen, wobei der Referenz-Kombinationswert ein Maß für einen besten akustischen Zustand für das erste Mikrofon zum Empfang der Sprachklänge liefert.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 16, bei welcher das Mittel zum Vergleichen ferner Mittel umfasst, um einen Mikrofonpaar-Kombinationswert auszuwählen, der dem Referenz-Kombinationswert am nächsten liegt.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 14, bei welcher die Sprachsignale gemessene Energiewerte von verfolgten Signalen darstellen.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 18, bei welcher das Mittel zum Messen ferner Mittel umfasst, um eine Differenz zwischen dem Energiewert der verfolgten Signale in jedem der Mehrzahl von Mikrofonen und einem maximalen Energiewert der verfolgten Signale in einem beliebigen der Mehrzahl von Mikrofonen festzustellen.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 19, bei welcher das Mittel zum Anordnen ferner Mittel zum Identifizieren des zweiten Mikrofons für jedes Mikrofonpaar umfasst, wobei das zweite Mikrofon eines von zumindest zwei Mikrofonen darstellt, bei welchem sich die Hauptstrahl-Empfindlichkeitsmuster in einer zweiten Richtung erstrecken, die im Allgemeinen der ersten Richtung entgegengesetzt ist, und wobei das zweite Mikrofon dasjenige der zumindest zwei Mikrofone darstellt, welches einen kleineren Energiewert für die verfolgten Signale aufweist.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 20, bei welcher das Bestimmungsmittel unter Ansprechen auf das Identifizierungsmittel ferner eine Differenz zwischen dem Energiewert der verfolgten Signale in dem zweiten Mikrofon und einem minimalen Energiewert der verfolgten Signale in einem beliebigen der Mehrzahl von Mikrofonen feststellt.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 21, bei welcher das Vergleichsmittel ferner Mittel umfasst, um jeden Mikrofonpaar-Kombinationswert mit einem Referenz-Kombinationswert zu vergleichen, wobei der Referenz-Kombinationswert ein Maß für einen besten akustischen Zustand für das erste Mikrofon zum Empfang der Sprachklänge liefert.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 22, bei welcher das Vergleichsmittel ferner Mittel umfasst, um einen Mikrofonpaar-Kombinationswert auszuwählen, der dem Referenz-Kombinationswert am nächsten liegt.
Sprachgesteuerte Umschaltvorrichtung nach Anspruch 23, welche ferner Mittel umfasst, um das erste Mikrofon des ausgewählten Mikrofonpaars mit der außenseitigen Leitung zu verbinden.