DE10052992C2 - Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokonferenzen - Google Patents

Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokonferenzen

Info

Publication number
DE10052992C2
DE10052992C2 DE2000152992 DE10052992A DE10052992C2 DE 10052992 C2 DE10052992 C2 DE 10052992C2 DE 2000152992 DE2000152992 DE 2000152992 DE 10052992 A DE10052992 A DE 10052992A DE 10052992 C2 DE10052992 C2 DE 10052992C2
Authority
DE
Germany
Prior art keywords
signals
signal
room
useful
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE2000152992
Other languages
English (en)
Other versions
DE10052992A1 (de
Inventor
Peter Fels
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Original Assignee
Deutsche Telekom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom AG filed Critical Deutsche Telekom AG
Priority to DE2000152992 priority Critical patent/DE10052992C2/de
Publication of DE10052992A1 publication Critical patent/DE10052992A1/de
Application granted granted Critical
Publication of DE10052992C2 publication Critical patent/DE10052992C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

Die Erfindung bezieht sich auf das Gebiet der Wiedergabe von Toninformationen im Rahmen von Videokonferenzsystemen, die insbesondere auf eine größere Anzahl von Konferenzteilnehmern ausgerichtet sind.
Bei der Wiedergabe von Toninformationen im Rahmen der bekannten Videokonferenz­ einrichtungen ist zumeist festzustellen, dass die Tonqualität auf der jeweiligen Emp­ fangsseite mangelhaft bzw. instabil ist. Vor allem sind die optischen und die akusti­ schen Eindrücke in keiner Weise aufeinander abgestimmt, so dass eine Dissonanz zwi­ schen dem visuellen Eindruck und den Toninformationen festzustellen ist. Siehe bei­ spielsweise Arbeitskreis der bayrischen Rechenzentrumsleiter BRZL "Gruppenkonfe­ renz im virtuellen Raum" unter http://www.rrze.uni-erlangen.
Die bekannten Verfahren und Anordnungen für Videokonferenzen arbeiten überwie­ gend in einem für die Sprachübermittlung eingeschränkten Frequenzbereich, da die Sprache Priorität hat. Zur Anwendung kommen fast immer Konferenzsysteme, die auf eine einkanalige Tonübertragung beschränkt sind. Die gegenseitige Bildinformation erfolgt über spezielle Kameras und Monitore. Siehe Produktbeschreibung VCON Raumsysteme Media Connect 6000/8000 Serie VTEL TC 1000/XX Galaxy Modell 775 unter http://www.bachert.de
Für die Verbesserung der Tonqualität bei Konferenzsystemen sind eine Vielzahl von Lösungen bekannt.
Beispielsweise wird mittels Methoden der Echokompensation versucht, den störenden Einfluss des Echo-Signals zu verringern. Das vom fernen Teilnehmer eintreffende Emp­ fangssignal, das zumeist ein Sprachsignal ist, durchläuft den Echopfad (Lautsprecher- Raum-Mikrofon-System) und gelangt als unerwünschtes Echo in den Sendekanal zu­ rück. Um das Auftreten des unerwünschten Echos zu minimieren bzw. zu verhindern, wird beispielsweise ein adaptives Transversalfilter zur Echokompensation eingesetzt. Das adaptive Transversalfilter bildet den Echopfad nach und liefert an seinem Ausgang eine Echosignalnachbildung. Die Echosignalnachbildung wird im Sendesignalpfad vom wahren Echosignal subtrahiert. Bei einer guten Nachbildung verschwindet dadurch das Echo aus dem Sendepfad. Der Einfluss des Echopfades ist damit kompensiert. Siehe Heitkämper, Peter; Dissertation TH Darmstadt 1995 "Freisprechen mit Verstärkungs­ steuerung und Echokompensation".
Eine weitere Lösung für die Verbesserung bei der Wiedergabe von Toninformationen im Rahmen von Videokonferenzeinrichtungen beruht auf der getrennten Aufschaltung der jeweiligen signalgebenden Stelle (sprechende Stelle.) Diese Lösung wird durch eine Pegelwaage realisiert, deren Regelvorgänge sich nach der Auswertung der erzeugten Signale richten. Die Regelvorgänge mittels Pegelwaage sind äußerst diffizil und führen in vielen Fällen dazu, dass Signalteile bei nicht diszipliniertem Sprechen (gleichzeitiges Sprechen der Teilnehmer beider Gegenstellen) verloren gehen. Weiterhin können diese Regelvorgänge auch durch unbewusste Schallerzeugungsvorgänge provoziert werden, welche die Stabilität des gesamten Systems gefährden. Siehe Segschneider, Stephan: Diplomarbeit Fachhochschule Wiesbaden 1996 "Konzeption der Audiokomponenten zur Ausstattung eines Multiservice-Videokonferenzstudios unter den Möglichkeiten zweikanaliger Tonkommunikation mit Freisprech-Einrichtung".
Dynamikprozessoren, adaptive Filter, etc. werden ebenfalls für die Verbesserung der Tonqualität bei Videokonferenzsystemen eingesetzt. Derartige Lösungen führen jedoch auch nicht zu einem ausreichend befriedigendem Ergebnis. Wenn überhaupt, wird ein befriedigendes Ergebnis nur bei einzelnen Gegenstellen des Systems erreicht. Für das Gesamtsystem bleibt die Tonqualität nach wie vor unbefriedigend.
Bei einer anderen bekannten Lösung wird mit Hilfe spezieller Mikrofon- und Lautspre­ cherlösungen und anderer aufeinander abgestimmter Aufnahme- und Wiedergabeein­ richtungen versucht, unliebsame Raumsignalanteile durch die Möglichkeit der unmittel­ baren Sprachaufnahme und der unmittelbaren Wiedergabe an die entsprechenden menschlichen Sinnesorgane zu vermeiden (z. B. Headset-Technologie). Siehe Bera­ tungszentrum für Videokonferenzsysteme 1. Workshop des BZVD; Videoübertragung im Multiservice-ATM-Netz der Charite Berlin (Dr. j. Stock, Bernd Haage - DeTeCon GmbH); Die Videokonferenzsysteme COVIS und OCTOPUS (Prof. Dr. H. König, M. Zühlke - BTU Cottbus, Lehrstuhl Rechnernetze und Kommunikati­ onssysteme; http:/ /bzvd.urz.tu-dresden.de
Aus DE 34 13 181 ist ein Großraumbeschallungssystem für die Beschallung beliebig großer Räume bekannt, bei dem die prinzipielle Funktion auf einer näherungsweisen Zeit- und soweit erforderlich Lautstärke getreuen Unterstützung bzw. Simulation der sich von der Quelle über den Aktionsbereich bis in den Rezeptionsbereich hinein aus­ breitenden Schallfelder mit einer zeitlichen Quellenpriorität erfolgt. Das bedeutet, dass die Schallstrahler jeweils erst nach dem Vorbeiziehen der Wellenfronten der Original­ schallquelle bzw. des diese simulierenden Schallstrahlers und der quellennäheren Schallstrahler abstrahlen, und dass die Zeitabstände bzw. Verstärkungen nach Leistung und Art der Quellen differenziert sind. Mittels dieser Lösung werden die Widersprüche zwischen der Laufzeit- und der Amplitudenlokalisation, auch in Übergangsgebieten, wo beim Vergleich meistens der zuerst hörbare Schallstrahler statt der Originalschallquelle geortet wurde, gelöst. Diese mit Deltastereophonie bezeichnete Lösung bezieht sich auf die Schallquelle, den Aktionsbereich und die Schallstrahlerorte und berücksichtigt die Schallquellenleistung.
Weiterhin ist in http/[email protected] von France Telecom Branche Developpment Leclere 1999 in La communication de ce document est soumise a l' au­ torisation du CNET unter " La visioconference VARESE"; eine Lösung beschrieben, die auf einer Dreiteilung der Signalzuordnung beruht. Dabei erfolgt jedoch eine strikte Zuordnung des linken, des mittleren und des rechten Kanals. Bei dieser Lösung muss das System sehr genau eingemessen werden. Da außerdem auch die Lautstärke begrenzt ist, ist diese Lösung für die Versorgung und Einbeziehung eines größeren Personenkrei­ ses unzureichend umsetzbar.
Zusammenfassend ist festzustellen, dass für Videokonferenzen, bei denen die Gegen­ stellen aus größeren Räumen bestehen, überwiegend herkömmliche Videokonferenz­ systeme eingesetzt werden. Diese Videokonferenzsysteme werden dabei in bereits in diesen Räumen bestehende Schallversorgungsanlagen mit unterschiedlicher Qualität integriert.
Die technische Aufgabe ist auf ein Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokonferenzen ausgerichtet, bei dem sowohl auf der/den Auf­ nahmeseite/n als auch auf der/den Wiedergabeseiten eine größtmögliche räumliche Übereinstimmung zwischen Bildinformationen, Sprachinformationen und Raumgeräu­ schen erreicht werden soll. Das Verfahren soll sich insbesondere für Videokonferenzen eignen, bei denen die Gegenstellen örtlich verteilt angeordnet sind, und bei denen min­ destens eine Gegenstelle ein größerer Raum ist, in dem sich räumlich verteilt ein größe­ rer, überwiegend aktiv an der Konferenz beteiligter Teilnehmerkreis befindet.
Ausgangspunkt ist ein Videokonferenzsystem mit mindestens zwei miteinander kom­ munizierenden Gegenstellen, wobei jeder Gegenstelle ein Aufnahmesystem und ein Wiedergabesystem zugeordnet ist. Die Informationsübertragung zwischen den Gegen­ stellen erfolgt mittels geeigneter Übertragungsverfahren, beispielsweise über Kabel, Satellit, via ISDN, ATM, XDSL o. a.
Erfindungsgemäß wird in jeder an der Videokonferenz beteiligten Gegenstelle vorzugs­ weise jedem Teilnehmerplatz mindestens ein Mikrofon mit Richtcharakteristik SM1-­ SMn zugeordnet. Diese Anordnung beinhaltet jedoch auch, dass beispielsweise ein Mik­ rofon mehr als einem Teilnehmer zugeordnet sein kann, und dass es auch Mikrofon­ standorte im Raum der betreffenden Gegenstelle gibt, die für wechselnde Diskussions­ redner vorgesehen sind.
Jedes Mikrofon mit Richtcharakteristik zur Aufnahme der Sprachsignale SM1-SMn wird dabei in Bezug auf den konkreten Standort bzw. Teilnehmerplatz so angeordnet, dass es nur die Nutzsignale des/der betreffenden Teilnehmers, jedoch keine Raumsig­ nale und Nutzsignale anderer Teilnehmer aufnimmt. Durch die Anwendung von Mikro­ fonen mit Richtcharakteristik, wie beispielsweise Nahbesprechungsmikrofonen, welche jeweils an den für die Signalaufnahme günstigsten Plätzen im Raum angeordnet sind, wird damit bei der Aufnahme von Sprachsignalen eine quasi Ausschaltung des Raumes und damit der Raumgeräusche erreicht.
Die aufgenommenen Nutzsignale/Sprachsignale werden über mindestens zwei Übertra­ gungskanäle PK1-PKn zu allen an der Videokonferenz beteiligten Gegenstellen über­ tragen und dort über die Lautsprecher für die Wiedergabe der Sprachsignale LSP1-­ LSPn wieder ausgegeben.
Gleichzeitig zu den Sprachsignalen werden durch die in den einzelnen Gegenstellen getrennt angeordneten Mikrofone zur Aufnahme der Raumsignale RM1-RMn die Raumsignale der jeweiligen Gegenstelle aufgenommen. Die Raumsignale werden mit­ tels Signalsplitting getrennt von den Sprachsignalen über mindestens 2 Signalkanäle SK1-SKn übertragen. In den Gegenstellen werden die Raumsignale ebenfalls getrennt von den Nutzsignalen/Sprachsignalen über die Lautsprecher für die Wiedergabe von Raumsignalen LSr1-LSrn wieder ausgegeben.
Die getrennte Aufnahme und Wiedergabe von Sprachsignalen und Raumsignalen er­ folgt dabei in jeder Gegenstelle separat. Das heißt, dass in jeder Gegenstelle die aktuel­ len Sprachsignale und die aktuellen Raumsignale aller anderen Gegenstellen synchron wieder ausgegeben werden können.
Damit ist es möglich, eine Optimierung und Anpassung aller Gegenstellen in Bezug auf Bildinformationen, Sprachinformationen und Raumsignalen im Rahmen eines gemein­ samen virtuellen Raumes vorzunehmen. Damit entspricht die akustische Raumsituation weitestgehend der optischen Raumsituation des gemeinsamen virtuellen Raumes. Die erfindungsgemäße Lösung beinhaltet jedoch auch die Möglichkeit, für jede Gegenstelle eine individuelle Optimierung und Anpassung der raumakustischen Situation an die visuelle Raumsituation vorzunehmen. Ziel ist dabei immer die bestmögliche Überein­ stimmung zwischen visuellem und akustischem Eindruck des Sprechenden in Bezug auf den konkreten Raum zu erreichen.
Wenn die Gegenstelle ein größerer Raum ist, ist es außerdem möglich, durch die direkte Signalaufnahme und -zuordnung auch im größeren Raum mit der verteilten Wiedergabe des eigenen Nutzsignals/Sprachsignals über die eigenen Lautsprecher für die Wiederga­ be der Sprachsignale LSp1-LSpn eine ausreichende Sprachverständlichkeit zu errei­ chen.
Das erfindungsgemäße Verfahren wird anhand eines Ausführungsbeispiels näher erläu­ tert.
Fig. 1 zeigt das Wirkprinzip der Lösung anhand von zwei an der Konferenz beteiligten Gegenstellen.
Fig. 2 zeigt anhand der prinzipiellen Darstellung der elektroakustisch eingespielten Sig­ nale die Insertmöglichkeit für die Echokompensation.
Fig. 3 zeigt die prinzipielle Darstellung der Signalfolge für einen Hörerplatz mit der Signalfolge der Gegenseite mit Raumsignalen.
In Fig. 1 ist das Wirkprinzip des Verfahrens abgebildet. Dabei ist von der sendenden Stelle sowohl das Aufnahmesystem als auch das Wiedergabesystem abgebildet. In der Praxis verfügt jedoch jede Gegenstelle bzw. jeder Raum einer Gegenstelle sowohl über ein Aufnahmesystem als auch über ein Wiedergabesystem. Der Informationsaustausch zwischen den einzelnen, an der Konferenz beteiligten Gegenstellen, erfolgt dabei ent­ weder über das konventionelle Telekommunikationsnetz oder via Satellit. Sowohl im Aufnahmesystem als auch im Wiedergabesystem erfolgt eine strikte Trennung bei der Aufnahme und bei der Wiedergabe von Sprachsignalen und von Raumsignalen. Jede Gegenstelle verfügt
  • a) über ein Aufnahmesystem mit einer separaten Anordnung von Mikrofonen mit Richt­ charakteristik für die Aufnahme der Sprachsignale SM1-SMn und eine separate An­ ordnung von Mikrofonen zur Aufnahme der Raumsignale RM1-RMn und
  • b) über ein Wiedergabesystem mit einer separaten Anordnung von Lautsprechern für die Ausgabe von Sprachsignalen LSp1-LSpn und einer separaten Anordnung von Lautsprechern für die Ausgabe von Raumsignalen LSr1-LSrn.
Die Mikrofonanordnung zur Aufnahme von Sprachsignalen SM1-SMn ist dabei im Idealfall so ausgebildet, dass jedem Teilnehmerplatz mindestens ein Mikrofon mit Richtcharakteristik SM1-SMn (nachfolgend nur mit Mikrofon bezeichnet) zugeordnet wird. Jedes Mikrofon zur Aufnahme der Sprachsignale SM1-SMn ist dabei in Bezug auf den konkreten Teilnehmerplatz so angeordnet, dass es nur die Nutzsignale/Sprach­ signale des betreffenden Teilnehmers aufnehmen kann. Durch die platzverteilte Auf­ nahme der Nutzsignale/Sprachsignale ist gewährleistet, dass auf der Wiedergabeseite die Möglichkeit der raumgerechten Wiedergabe der Nutzsignale/Sprachsignale gegeben ist.
Über die Mikrofone zur Aufnahme der Sprachsignale SM1-SMn werden die Nutzsig­ nale/Sprachsignale jedes einzelnen Teilnehmers getrennt aufgenommen und mindestens 2 Übertragungskanälen PK1-PKn zugeordnet. Die Pegelanpassung erfolgt über eine an sich bekannte Aufnahmestufe 1. Die Zuordnung zu den Übertragungskanälen erfolgt da­ bei nach den örtlichen Gegebenheiten jeder einzelnen Gegenstelle immer aus der Sicht der Kamera.
Im Gegensatz dazu ist die Zuordnung der Nutzsignale zu den Wiedergabekanälen im eigenen Raum aus der Sicht der aktiven Teilnehmer in diesem Raum vorzunehmen.
Gleichzeitig zu den Nutzsignalen/Sprachsignalen werden die Raumsignale durch ge­ trennt zu den Mikrofonen zur Aufnahme der Sprachsignale SM1-SMn angeordnete Mikrofone zur Aufnahme der Raumsignale RM1-RMn aufgenommen und getrennt von den Nutzsignalen/Sprachsignalen über mindestens zwei Signalkanäle SK1-SKn an die betreffende Gegenstelle bzw. die betreffenden Gegenstellen gesendet. Die getrennte Bearbeitung von Nutzsignalen/Sprachsignalen und Raumsignalen wird durch Signal­ splitting in der Aufnahmestufe 1 erreicht.
Nach der Übertragung über Kabel oder Satellit werden die gemeinsam übertragenen Signale durch Signalsplitting wieder in Nutzsignale/Sprachsignale und Raumsignale ge­ trennt. Die Nutzsignale/Sprachsignale werden über die Empfangsstufe für Sprachsignale 2, die Summierstufe 4 und die Matrix 5 zur Wiedergabestufe 6 übertragen. Die Raum­ signale werden von der Empfangsstufe für Raumsignale 3 über die Matrix 5 ebenfalls zur Wiedergabestufe 6 übertragen. Dabei werden die Raumsignale in der Matrix 5 einer Signalbearbeitung unterzogen, die entsprechend der Wiedergabeanordnung mit den an­ geschlossenen Lautsprechern für die Wiedergabe der Raumsignale LSr1-LSrn die Raumsignale im Pegel variiert und verzögert. Von der Wiedergabestufe 6 werden die Sprachsignale über die Lautsprecher für die Wiedergabe der Sprachsignale LSp1-LSpn und die Raumsignale über die Lautsprecher für die Wiedergabe der Raumsignale LSr1-­ LSrn ausgegeben.
In der Summierstufe für Signalinsert 4 werden die empfangenen Nutzsignale/Sprach­ signale zusätzlich mit den eigenen aufgenommenen Signalen (abgehende Signale zur Gegenstelle), die ebenfalls im Pegel und in der Laufzeit bearbeitet sind, summiert. Die­ se Signalbearbeitung ist einerseits von der mit dem ankommenden Nutzsignal auftre­ tenden Echostörung durch das Einspiel auf der Gegenseite und andererseits von der Notwendigkeit, das eigene Nutzsignal/Sprachsignal, insbesondere bei großen Räumen, wieder zu verstärken und im eigenen Raum zur Verständigung der Mithörenden und beteiligten Personen über die Lautsprecher raumgerecht zu verteilen, abhängig.
In Fig. 2 ist durch eine prinzipielle Darstellung der elektroakustisch eingespielten Sig­ nale die Insertmöglichkeit in Form eines Diagramms abgebildet.
Das Einspielen des eigenen Nutzsignals/Sprachsignals in den eigenen Raum ermöglicht eine ausreichende Versorgung aller Beteiligten, die sich nicht in unmittelbarer Nähe des Sprechenden befinden.
Des Weiteren kann durch die Aufnahme des auf der Gegenstelle eingespielten eigenen Nutzsignals/Sprachsignals über die Mikrofone zur Aufnahme der Sprachsignale SM1-­ SMn der Gegenstelle dieses auf der eigenen Wiedergabeseite als störendes Echosignal auftreten. Dieses Signal ist aber immer mit einem Zeitversatz, geringem aber störendem Pegel und Klangfarbenänderungen verbunden. Um diese zeitliche Lücke zwischen dem eigenen Original Nutzsignal/Sprachsignal und dem störenden Echosignal zu verringern, wird das eigene Original Nutzsignal/Sprachsignal mit einem Zeitversatz und einer Pe­ geländerung noch einmal über die Lautsprecher LSp1-LSpn im eigenen Raum einge­ spielt.
Eine zweckmäßige Ausgestaltung beruht darauf, die Funktion des Signalinsert alternativ in die Matrix 5 zu integrieren.
In Fig. 3 sind anhand eines Diagrammes Reflexionsfolgen dargestellt, die an den ein­ zelnen Plätzen der aktiven Teilnehmer der Videokonferenz als auch der weiteren Zuhö­ rer in dem jeweiligen Raum wahrgenommen werden und die sich zusammensetzen aus dem eigenen Originalsignal (gepunktete Linie), externen Signalen der Gegenstelle (durchgezogene dünne Linien), dem störenden Echosignal (gestrichelte Linie) als Rück­ antwort aus der Gegenstelle und in die zeitlichen Lücken eingefügten eigenen Nutzsig­ nalen (dicke Linien), die einmal zur Verringerung der Lücken zwischen dem eigenen Nutzsignal/Sprachsignal und Echosignal zeitlich dazwischen eingefügt werden, und die zum anderen als Nutzsignal/Sprachsignal zur Versorgung eigener Hörzonen dienen sollen, sowie den Raumsignalen, die gesondert in das Reflektogramm eingepasst wer­ den.
In der Wiedergabestufe 6 erfolgt entsprechend der konkreten Anordnung der Lautspre­ cher für die Wiedergabe der Sprachsignale LSp1-LSpn bzw. der Lautsprecher für die Wiedergabe der Raumgeräusche LSr1-LSrn unter Berücksichtigung der räumlichen Ge­ gebenheiten der betreffenden Gegenstelle eine Anpassung der auszugebenden Sprachsignale und Raumsignale an die jeweilige Situation. Dabei wird die Mehrkanalität der Übertragung für die raumgerechte Wiedergabe ausgenutzt, so dass das Klangbild auf der Wiedergabeseite mit dem Klangbild auf der Aufnahmeseite übereinstimmt.
Eine zweckmäßige Ausgestaltung besteht darin, die voneinander getrennten Sprachsig­ nale und die Raumsignale nach den bereits bekannten Prinzipien der Deltastereophonie über die Lautsprecher auszugeben. Dadurch wird gewährleistet, dass eine weitestgehen­ de Übereinstimmung in Bezug auf die Signalzuordnung der Wiedergabekanäle zu den Aufnahmekanälen erfolgt und gleichzeitig die Signale mehrfach, jedoch mit unter­ schiedlichem Pegel und Laufzeit, den Wiedergabekanälen, entsprechend der Wiederga­ beanordnung, zugeordnet werden. Die Signalverteilung und Signalbearbeitung erfolgt dabei so, dass eine Rückkopplungssicherheit erreicht wird, ohne dass die einzelnen Mikrofonwege auf- und zugeregelt werden müssen.
Die über die Empfangsstufe für Raumsignale 3 empfangenen Raumsignale werden in der Wiedergabestufe 6 mittels Deltastereophonie ebenfalls so angepasst und modifiziert, dass in Bezug auf die Raumsituation ebenfalls eine Übereinstimmung mit der räumli­ chen Situation auf der Aufnahmeseite erreicht wird.
Zusätzliche externe Toninformationen können gezielt über eine der Matrix 5 vorgeord­ nete Summier- und Verteilstufe 7 eingespielt werden. Die Verteilung der zusätzlichen Toninformationen und die Zuordnung zu den einzelnen Lautsprechern erfolgt ebenfalls über die Wiedergabestufe 6.
Die erfindungsgemäße Lösung ist vorzugsweise für Videokonferenzeinrichtungen vor­ gesehen, die vorteilhaft über eine größere Übertragungsbandbreite verfügen, die für einen mittleren bis größeren Personenkreis ausgelegt und mit einer großflächigen Bild­ wiedergabe gekoppelt sind. Die Videokonferenzeinrichtungen können dabei auch über mehrere, an verschiedenen Orten stationierte Gegenstellen verfügen. Einzelne Gegen­ stellen können dabei als große Räume für einen dementsprechend größeren Teilnehmer­ kreis konzipiert sein.
Bezugszeichenaufstellung
SM1-SMn Mirofone/Mikrofonanordnung zur Aufnahme der Sprach- Signale (Mikrofone mit Richtcharakteristik)
RM1-RMn Mikrofone/Mikrofonanordnung zur Aufnahme der Raum­ signale
PK1-PKn Übertragungskanäle
SK1-SKn Signalkanäle
LSp1-LSpn Lautsprecher für die Wiedergabe der Sprachsignale
LSr1-LSrn Lautsprecher für die Wiedergabe der Raumsignale
1
Aufnahmestufe
2
Empfangsstufe für Sprachsignale
3
Empfangsstufe für Raumsignale
4
Summierstufe für Signalinsert
5
Matrix
6
Wiedergabestufe
7
Summier- und Verteilstufe für externe Signale

Claims (4)

1. Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokon­ ferenzen mit mindestens zwei Gegenstellen, wobei jeder Gegenstelle ein Aufnah­ mesystem und ein Wiedergabesystem zugeordnet ist, dadurch gekennzeichnet,
dass in jeder Gegenstelle die Nutzsignale/Sprachsignale der Konferenzteilnehmer getrennt von den Raumgeräuschen aufgenommen werden, wobei die Nutzsigna­ le/Sprachsignale über Mikrofone mit Richtcharakteristik zur Aufnahme der Sprach­ signale (SM1-SMn) und die Raumsignale über in der Gegenstelle angeordnete Mikrofone zur Aufnahme der Raumsignale (RM1-RMn) aufgenommen werden,
dass die von einer Gegenstelle aufgenommenen Nutzsignale/Sprachsignale jeweils über mindestens zwei Übertragungskanäle (PK1-n) und die aufgenommenen Raumsignale über jeweils mindestens 2 Signalkanäle (SK1-n) zu den anderen an der Videokonferenz beteiligten Gegenstellen übertragen werden,
dass die Nutzsignale/Sprachsignale und die Raumsignale in jeder Gegenstelle an die in der Gegenstelle ausgegebene optische Bildinformation angepasst und eben­ falls getrennt ausgegeben werden, wobei die empfangenen Nutzsignale/Sprach­ signale über die Lautsprecher für die Wiedergabe der Sprachsignale (LSp1-LSpn) und die empfangenen Raumsignale über die Lautsprecher für die Wiedergabe der Raumsignale (LSr1-LSrn) ausgegeben werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die in den Gegenstellen getrennt empfangenen Nutzsignale/Sprachsignale und Raumsignale nach den Prin­ zipien der Deltasterophonie an den bildlich in der jeweiligen Gegenstelle erzeugten virtuellen Konferenzraum angepasst werden, und dass die Nutzsignale/Sprachsig­ nale und die Raumsignale voneinander getrennt über die nach den Prinzipien der Deltastereophonie angeordneten Lautsprecher für die Wiedergabe von Sprachsig­ nalen (LSp1-LSpn) bzw. über die Lautsprecher für die Wiedergabe von Raumsig­ nalen (LSr1-LSrn) ausgegeben werden.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die in der Summierstufe für Signalinsert (4) von den Gegenstellen empfangenen Nutzsignale/Sprachsignale mit den eigenen originalen Nutzsignalen/Sprachsignalen summiert werden und durch eine Pegelreduzierung und Laufzeitkorrektur so in das Summensignal inte­ griert werden, dass eine Lücke geschlossen wird, die durch ein beim Empfang und der Wiedergabe des Nuzsignals/Sprachsignals der Gegenseite auftretendes Echo bedingt ist.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass in der Summierstufe für Signalinsert (4) das eigene Nutzsignal/Sprachsignal mit dem Nutzsinal/Sprachsig­ nal der Gegenstelle summiert und im eigenen Raum über die Lautsprecher für die Wiedergabe der Sprachsignale (LSp1-n) wieder ausgegeben wird, wobei im eige­ nen Raum eine Sprachverstärkung und raumbezogene Signalverteilung auch des eigenen erzeugten Signals erfolgt, so dass für alle im eigenen Raum anwesenden Teilnehmer eine gute Sprachverständlichkeit gewährleistet ist.
DE2000152992 2000-10-19 2000-10-19 Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokonferenzen Expired - Fee Related DE10052992C2 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE2000152992 DE10052992C2 (de) 2000-10-19 2000-10-19 Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokonferenzen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2000152992 DE10052992C2 (de) 2000-10-19 2000-10-19 Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokonferenzen

Publications (2)

Publication Number Publication Date
DE10052992A1 DE10052992A1 (de) 2002-05-08
DE10052992C2 true DE10052992C2 (de) 2002-11-07

Family

ID=7661067

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2000152992 Expired - Fee Related DE10052992C2 (de) 2000-10-19 2000-10-19 Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokonferenzen

Country Status (1)

Country Link
DE (1) DE10052992C2 (de)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2616665A1 (de) * 1976-04-15 1977-10-20 Paul Dipl Ing Dr Ing Scherer Verfahren zur uebertragung raeumlicher schallereignisse unter trennung der basis- und rauminformation
DE3413181A1 (de) * 1983-12-14 1985-06-27 Deutsche Post Rundfunk- und Fernsehtechnisches Zentralamt, DDR 1199 Berlin Grossraumbeschallungssystem
US4890314A (en) * 1988-08-26 1989-12-26 Bell Communications Research, Inc. Teleconference facility with high resolution video display
DE4440014A1 (de) * 1994-11-09 1996-05-15 Deutsche Telekom Ag Verfahren und Vorrichtung zur mehrkanaligen Tonwiedergabe
DE19503515A1 (de) * 1994-06-04 1996-08-08 Deutsche Telekom Ag Übertragungssystem für gleichzeitige Mehrfachübertragung von mehreren Bild- und Tonsignalen
DE19645867A1 (de) * 1996-11-07 1998-05-14 Deutsche Telekom Ag Verfahren zur mehrkanaligen Tonübertragung

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2616665A1 (de) * 1976-04-15 1977-10-20 Paul Dipl Ing Dr Ing Scherer Verfahren zur uebertragung raeumlicher schallereignisse unter trennung der basis- und rauminformation
DE3413181A1 (de) * 1983-12-14 1985-06-27 Deutsche Post Rundfunk- und Fernsehtechnisches Zentralamt, DDR 1199 Berlin Grossraumbeschallungssystem
US4890314A (en) * 1988-08-26 1989-12-26 Bell Communications Research, Inc. Teleconference facility with high resolution video display
DE19503515A1 (de) * 1994-06-04 1996-08-08 Deutsche Telekom Ag Übertragungssystem für gleichzeitige Mehrfachübertragung von mehreren Bild- und Tonsignalen
DE4440014A1 (de) * 1994-11-09 1996-05-15 Deutsche Telekom Ag Verfahren und Vorrichtung zur mehrkanaligen Tonwiedergabe
DE19645867A1 (de) * 1996-11-07 1998-05-14 Deutsche Telekom Ag Verfahren zur mehrkanaligen Tonübertragung

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SEGSCHNEIDER, S.: Konzeption der Audio- Komponenten zur Ausstattung eines Multiservice- Videokonferenzstudios unter besonderer Berücksichtigung der Möglichkeiten zweikanaliger Tonkommunikation mit Freisprech- einrichtung, Diplomarbeit, Fachhochschule Wiesbaden, 1996, S. 49-53, La visio conference VARESE, France Telecom 1999, FT/BD/CNET/DSE/SGV/421 *
STEINKE,G.: "Surround-Sound". In: FKT - Fernseh- u. Kino-Technik, 50.Jg., Nr.10, 1996, S.591-598 *
STEINKE,G.: "Surround-Sound". In: FKT - Fernseh- u. Kino-Technik, 50.Jg., Nr.11, 1996, S.668-674 *

Also Published As

Publication number Publication date
DE10052992A1 (de) 2002-05-08

Similar Documents

Publication Publication Date Title
DE69903012T2 (de) Echokompensation
US6408327B1 (en) Synthetic stereo conferencing over LAN/WAN
CN100484177C (zh) 用于电信会议的立体声话筒处理
EP2158752B1 (de) Verfahren und anordnungen für akustische gruppentelekommunikation
DE2646924C3 (de) Fernsprech-Konferenzanlage
DE69803168T2 (de) Videokonferenzsystem
DE69634023T2 (de) Audiokommunikationssteuereinheit für Telekonferenzsysteme
EP2084937B1 (de) Verfahren und vorrichtung zur aufnahme, übertragung und wiedergabe von schallereignissen für kommunikationsanwendungen
DE10013387A1 (de) Vorrichtung und Verfahren zum Zuführen von Klingel- und Sprachanrufen über eine Arbeitsstation
DE10330808B4 (de) Konferenzeinrichtung und Verfahren zur Mehrpunktkommunikation
DE60037298T2 (de) Verwaltung von sprachgruppenrufen in einem telekommunikationssystem
DE10052992C2 (de) Verfahren für die raumgerechte Wiedergabe von Toninformationen bei Videokonferenzen
Hardman et al. Enhanced reality audio in interactive networked environments
DE19818925C2 (de) Kommunikationsanordnung mit Gegenschall
DE4420212A1 (de) Übertragungssystem für gleichzeitige Mehrfachübertragung von mehreren Bild- und Tonsignalen
EP1472906A2 (de) Virtueller assistent, der einem benutzer einer datenendeinrichtung hörbare informationen mittels mindestens zwei elektroakustischen wandlern ausgibt, und verfahren zur darbietung von hörbaren informationen eines virtuellen assistenten
DE102005004974A1 (de) Verfahren und System zum Durchführen von Telefonkonferenzen
DE102016112609B4 (de) Verfahren zur Erzeugung eines an einen realen Endpunkt zu übermittelnden Gesamtraumklangs, Verwendung des Verfahrens sowie Telekonferenzsystem
EP1519628A2 (de) Verfahren und Vorrichtung zur Wiedergabe eines aus einem monauralen Eingangssignal erzeugten binauralen Ausgangssignals
DE102023127310A1 (de) IP-basiertes Remote-Videokonferenzsystem
KR20060081966A (ko) 원격회의를 위한 음상 정위 시스템
JPS61224550A (ja) 音声会議装置における音質劣化防止方式
DE19938778A1 (de) Erzeugung akustischer Signale in einem Telekommunikationssystem
Fels Multichannel and" SOR" principles for conferencing and teleconferencing systems
DE102005036734A1 (de) Telekommunikationsgerät mit einer drahtlosen Schnittstelle und Verfahren zum Betrieb eines Telekommunikationsgerätes

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee