WO2003049389A1 - Verfahren und vorrichtung zum übertragen von klang- und/oder sprachdaten in einem paketorientierten kommunikationssystem - Google Patents

Verfahren und vorrichtung zum übertragen von klang- und/oder sprachdaten in einem paketorientierten kommunikationssystem Download PDF

Info

Publication number
WO2003049389A1
WO2003049389A1 PCT/EP2001/014359 EP0114359W WO03049389A1 WO 2003049389 A1 WO2003049389 A1 WO 2003049389A1 EP 0114359 W EP0114359 W EP 0114359W WO 03049389 A1 WO03049389 A1 WO 03049389A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
sound
speech
packet
data packets
Prior art date
Application number
PCT/EP2001/014359
Other languages
English (en)
French (fr)
Inventor
Klaus Huenlich
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Priority to PCT/EP2001/014359 priority Critical patent/WO2003049389A1/de
Priority to AU2002219159A priority patent/AU2002219159A1/en
Publication of WO2003049389A1 publication Critical patent/WO2003049389A1/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • H04L2012/6481Speech, voice
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • H04L2012/6494Silence suppression

Definitions

  • the invention relates to a method for transmitting sound and / or voice data in a packet-oriented communication system with the generic features of claim 1 and an apparatus for performing such a method.
  • GSM Global System for Mobile Communication
  • GPRS General Packet Radio System
  • recorded speech is digitized. Regardless of the information in the data stream, the digitization is carried out continuously in equidistant steps, with an equivalent digital value being assigned to every instantaneous analog value at every sampling time of the speech signal.
  • the digital values obtained in this way can be additionally compressed in a subsequent processing step. Subsequently, the information or values obtained in this way are packed in the usual way, always the same size data packets, as can also be seen from FIG. 3.
  • the individual data are then transmitted to the receiver via the communication network with the aid of transmission devices.
  • the information from the data packets is reconstructed both in terms of content and with regard to the temporal behavior during the subsequent playback.
  • the reconstruction of the speech signal is very sensitive to fluctuations in the transmission duration, that is to say to transmission delays. Ultimately, this leads to a deteriorated or incomplete speech quality during playback.
  • the object of the invention is to improve a method and a device for transmitting sound and / or voice data in a packet-oriented communication system.
  • This object is achieved by a method for transmitting sound and / or speech data with the features of claim 1 or a transmission and / or
  • An advantageous method for reproducing such speech or sound data is the subject of claim 8 with independent inventive significance.
  • Word parts e.g. single syllables, and if possible not to separate whole words individually.
  • the division of words into data packets should take place in such a way that the beginning of a word or part of a word coincides with the beginning of the data packet or its useful data section, while there may be free spaces towards the end of the data packet. Such free spaces can expediently be filled with blank data or other information data.
  • a speech recognition By using such a speech recognition, it is particularly easy to make it possible to recognize speech structures, in particular words or syllables, in order to carry out the distribution on individual data packets accordingly.
  • a memory or memory section can expediently also be stored with a type of dictionary, as is also known per se for speech recognition programs, so that a further refinement of the analysis of the speech structure can be carried out with the aid of stored sample words.
  • Fig. 1 shows an arrangement for recording, digitizing, and send data, and to receive, reconstruct and reproducing data in a communication system
  • Fig. 2 shows an analog speech diagram with a temporal
  • Amplitude distribution and marking of boundaries for packing individual speech parts into different data packets and 3 shows such a diagram to illustrate the assignment of the voice information to individual data packets according to the prior art.
  • an exemplary transmission device SE can consist of a large number of individual components, but these can also be partially omitted and / or incorporated in other devices.
  • a microphone MIC which is connected to an analog / digital converter A / D, is used to record speech or other sound sequences.
  • the analog / digital converter A / D converts the analog voice signal into a digital signal. Digitization usually takes place without
  • the digitized data values are input from the analog / digital converter A / D into a processor, in particular microprocessor ⁇ PS.
  • the processor ⁇ PS can also have a further input for entering existing digital data values.
  • the processor ⁇ PS forwards the processed data values to a transmitting device, which in the preferred embodiment is designed as a transmitting / receiving device S / R.
  • the transceiver prepares the received data values for transmission via an interface. As an interface for outputting the
  • an antenna A is connected to the transmitting / receiving device S / R, wherein any other transmission paths, in particular line-bound interfaces, can also be used instead of a radio interface V shown.
  • a receiving device RE has a large number of corresponding components. About one
  • the signal sent or transmitted by the transmitting device SE via the interface V is received with the data values and received and preprocessed to a receiving device, in the preferred exemplary embodiment shown a transmitting / receiving device S / R.
  • the transmitting / receiving device S / R forwards the corresponding preprocessed signal or the corresponding preprocessed data values to a processor, in the exemplary embodiment shown a microprocessor ⁇ PR.
  • the received data values are processed or processed in the processor ⁇ PR and then output to a digital / analog converter D / A, which converts them into an analog signal.
  • the analog signal output by the digital / analog converter D / A is then output via an amplifier to a loudspeaker Sp which outputs the originally spoken language for a listener. Additionally or alternatively, an interface for a digital output of the voice data can be provided at the receiving device RE.
  • independent transmitter devices SE and independent receiver devices RE can be provided, but combined transmitter / receiver devices that have both the modules and functions of the transmitter devices SE and the modules and functions of the receiver device RE.
  • Digitized data values are input into the processor ⁇ PS in the transmission device SE and ultimately represent the course shown in FIG. 3 as a continuous signal.
  • the corresponding amplitudes are around the dynamic zero value “0 *” over the time axis t of the signal or the digital formed therefrom after sampling.
  • the digital data is currently packaged by packing a fixed number of data values into the user data block of a packet (packet 1, packet 2, ..., packet 5, ). These data packets transmitted via the interface V are then unpacked in the receiving device by the processor ⁇ PR and reconstructed into a data sequence again.
  • the individual packets are reproduced on the receiver side in the receiving device RE, for example in accordance with a chronological sequence, in such a way that data values of a packet arriving too late are unpacked after a corresponding, artificially generated speech pause and reproduced via the loudspeaker Sp. If the subsequent data packet arrives punctually at the receiving device RE via a shorter data path or via an undelayed path, it is unpacked and the data values are reproduced directly via the loudspeaker Sp in accordance with the specification of the smallest possible time delay. The reproduction of data values of packet 1 that have not yet been sent is suppressed for this purpose.
  • Such a procedure creates unnatural language gaps in the middle of a word or even in the middle of a phoneme, i.e. a sound or a natural sequence of sounds.
  • parts of words, words or phonemes are left out, also in places where they interfere with speech or even understanding.
  • a structure recognition is connected upstream for the packaging of speech data or sound data, that is to say also music data.
  • the natural speech structure is analyzed, the criteria for the analysis being the search for language breaks between words, the search for syllables or the search for phonemes.
  • the sensible limits shown in FIG. 2 for separating speech, sound or corresponding data values that belong to each other due to the structure are located, for example, in areas in which the amplitudes d of the data values do not move out of a predetermined differential dynamic range ⁇ d over a certain period of time ⁇ t.
  • Such amplitude values over a corresponding time period ⁇ t are, for example, a sign of a pause between two words.
  • all those positions that are mathematically characterized in that the first derivative of the function that describes the language is at zero over a longer, optionally predeterminable duration or a possibly predeterminable interval around the zero line are particularly suitable for packet boundaries exceeds.
  • a first data packet packet 1 is filled with only a small number of data values, while in the second data packet packet 2 a longer speech or Sound sequence or their data values are used.
  • the second data packet is followed by a longer speech pause or language gap, the data of which are preferably packaged in no packet at all in order to reduce the data and signaling load on the communication network.
  • the third data packet packet 3 also again has a longer sequence of data values before there is another speech pause.
  • a compulsory limit can of course also be set, so that in such a case faults such as in the prior art are necessarily accepted.
  • any other criteria can of course also be used.
  • the basic dynamic level may be above this limit ⁇ d, for example, which is why it can be useful not only to analyze limit values around the zero range, but also to generally investigate whether the speech or sound data are within a certain period of time with regard to their amplitude values of a certain dynamic range.
  • a large number of conventional phonemes are stored in a table or a memory M, which is expediently connected to the processor ⁇ PS.
  • Spoken and digitized data values that arrive at the microprocessor ⁇ PS are then compared as a data value sequence with a corresponding data value sequence of the phonemes stored in the memory M.
  • a phoneme is recognized, its end is marked or registered as a possible limit.
  • the actual packaging can then be used to search for limits determined in this way in order to enable the data value sequences to be optimally packaged in the data packages.
  • the number of data values to be packed per data packet is kept low.
  • the usual packet sizes are 1500, 9800 or 64000 bytes.
  • voice data at the usual sampling rates of e.g. 8 kHz and a typical phoneme duration of the order of a few tenths of a second only use data volumes of approx. 500 bytes per data packet.
  • the data packets are unpacked immediately after receipt and the reproduction of the sound or speech structure is effected via the loudspeaker Sp.
  • a first speech packet with a longer natural speech or sound pause arrives at the receiver, such as packet 2 from FIG. 2, and then the subsequent packet, ie packet 3 from FIG. 2, arrives late, then the natural speech or sound pause at the end of package 2 can be artificially extended without any problems.
  • the sound sensation or speech sensation is only slightly or not at all disturbed by the packaging of the data in the package 2 with a speech or sound pause at the end in such a reproduction.
  • the data processing ⁇ PR can be carried out in the receiving device RE in accordance with the extension of sound gaps in such a way that the last sound or tone is doubled, tripled, ... reproduced, which is like a sound reproduction prolonged stretching appears and also has only a negligible or negligible effect on the sensation of sound or speech.
  • the duration of the data values to be packed into the data packets is expediently chosen to be so long that a sufficient number of data values can be used to insert a sufficient number of phonemes, syllables and / or words, depending on the requirement of the separation criterion can, so that ideally there is always a number of unoccupied data values after the useful data values used, which are overwritten by the first data values when the next data packet arrives during playback in the receiving device RE.
  • the method can of course also be used for the preservation of speech documents, for example in order to be able to store a historically important speech in the meantime in packets in a memory in order to be able to store it later To enable playback.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

Die Erfindung bezieht sich auf ein Verfahren zum Einteilen von Klang- und/oder Sprachdaten in Datenpakete für eine Übertragung über paketvermittelte Kommunikationsnetze. Um das Klang- bzw. Sprachempfinden bei der Wiedergabe der rekonstruierten Sprach- bzw. Klangdaten möglichst wenig zu stören, wird vorgeschlagen, vor der Verpackung von Datenwerten in die Datenpakete eine Analyse der Klang- bzw. Sprachstruktur vorzunehmen und die Entscheidung für jeweils in ein Datenpaket einzusetzende Datenwertfolgen anhand der Analyse vorzunehmen. Insbesondere ist es zweckmäßig, die Datenpakete derart mit Datenwerten zu füllen, dass am Ende möglichst eines jeden Datenpaketes eine Sprach- bzw. Klangpause, Phonemgrenze, Wortteilgrenze oder Wortgrenze liegt.

Description

Beschreibung
Verfahren und Vorrichtung zum Übertragen von Klang- und/oder Sprachdaten in einem paketorientierten Kommunikationssystem
Die Erfindung bezieht sich auf ein Verfahren zum Übertragen von Klang- und/oder Sprachdaten in einem paketorientierten Kommunikationssystem mit den oberbegrifflichen Merkmalen des Patentanspruchs 1 bzw. eine Vorrichtung zum Durchführen eines solchen Verfahrens.
Es gibt eine Vielzahl verschiedenartiger Kommunikationssysteme, bei denen Daten in Datenpaketen verpackt transportiert werden. Diese Kommunikationssysteme können rein paketorientierte Übertragung von Daten ermöglichen oder, ausgehend von z.B. Mobilfunk- Kommunikationssystemen gemäß z.B. dem GSM-Standard (GSM: Global System for Mobile Communication) , Daten über spezielle Paketdatendienste gemäß dem GPRS (General Packet Radio System) übertragen. Bei diesen Systemen werden zu übertragende Daten in einzelne Datenpakete gepackt und nacheinander über das Kommunikationsnetz übertragen. Empfängerseitig werden die empfangenen Datenpakete entpackt und gegebenenfalls dekodiert, um die ursprünglichen Daten letztendlich in der richtigen Reihenfolge zu rekonstruieren. Bei derartigen Systemen kann es vorkommen, dass Datenpakete zeitlich versetzt eintreffen, beispielsweise weil eigentlich hintereinander abgesendete Datenpakete über verschiedene Verbindungsstrecken geleitet wurden oder in zwischengeschalteten Zentralstellen nachrangig mit einem Zeitversatz weitergeleitet wurden. Die dadurch entstehende Schwankungsbreite von Übertragungsverzögerungen, sogenannten Delayschwankungen, sind in paketvermittelnden Netzen für die meisten Datenübertragungen unkritisch. Bei der Übertragung von Sprachdaten ist es jedoch wichtig, einerseits eine möglichst schnelle Übermittlung der Datenpakete zu ermöglichen, so dass der Empfänger gesprochene Worte unmittelbar nach dem Aussprechen auf der Senderseite hören kann. Außerdem sind Übertragungsverzögerungen einzelner Pakete zueinander auch kritisch, weil es zu Störungen der Sprache kommen kann, wenn ein Paket mit Verzögerung eintrifft und dadurch bei der Wiedergabe der rekonstruierten Daten eine Lücke entsteht. Bei zu großen Verzögerungen müssen verspätet eintreffende Datenpakete unter Umständen sogar ausgelassen werden, um zumindest die Wiedergabe später abgesandter, aber auf schnellerem Weg eingetroffener Datenpaketinhalte möglichst unverzögert ermöglichen zu können.
Während bei der Übertragung von Informationsdaten ausreichend Zeit gegeben ist, diese zu kodieren und zur besseren und fehlerfreien Rekonstruierbarkeit über eine Vielzahl von Datenpaketen zu verteilen, ist es bei der Übertragung von Sprache bei der Paketbildung üblich, die zu übertragenden Informationen unstrukturiert in die Datenpakete einzusetzen. In einem ersten Schritt wird aufgezeichnete Sprache digitalisiert. Die Digitalisierung erfolgt dabei ohne Rücksicht auf die Information im Datenstrom kontinuierlich in äquidistanten Schritten, wobei jedem momentanen Analogwert zu jedem Abtastzeitpunkt des Sprachsignals ein äquivalenter digitaler Wert zugeordnet wird. Die auf diese Art und Weise gewonnenen digitalen Werte können in einem nachfolgenden Verarbeitungsschritt zusätzlich komprimiert werden. Anschließend werden die derart gewonnen Informationen bzw. Werte in üblicher Weise immer gleich große Datenpakete gepackt, wie dies auch aus Fig. 3 ersichtlich ist. Die einzelnen Daten werden dann mit Hilfe von Übertragungseinrichtungen über das Kommunikationsnetz zum Empfänger übertragen. Empfängerseitig wird die Information aus den Datenpaketen sowohl inhaltlich als auch hinsichtlich des zeitlichen Verhaltens bei der anschließenden Wiedergabe rekonstruiert . Mit Blick auf die Anforderungen einer zum Aussprechen eines Wortes möglichst zeitnahen Wiedergabe des empfängerseitig rekonstruierten Wortes besteht das Problem, dass die Rekonstruktion des Sprachsignals sehr empfindlich auf Schwankungen bei der Übertragungsdauer, dass heißt auf Übertragungsverzögerungen reagiert. Letztendlich führt dies zu einer verschlechterten oder lückenhaften Sprachqualität bei der Wiedergabe.
Die Aufgabe der Erfindung besteht darin, ein Verfahren und eine Vorrichtung zum Übertragen von Klang- und/oder Sprachdaten in einem paketorientierten Kommunikationssystem zu verbessern.
Diese Aufgabe wird durch ein Verfahren zum Übertragen von Klang- und/oder Sprachdaten mit den Merkmalen des Patentanspruchs 1 bzw. eine Sende- und/oder
Empfangseinrichtung zum Durchführen eines solchen Verfahrens mit den Merkmalen des Patentanspruchs 9 gelöst. Ein vorteilhaftes Verfahren zur Wiedergabe solcher Sprach- bzw. Klangdaten ist Gegenstand von Patentanspruch 8 mit eigenständiger erfinderischer Bedeutung.
Bei dem Verpacken von Sprachdaten in einzelne Datenpakete die Sprachstruktur zu berücksichtigen, ermöglicht eine verbesserte Wiedergabequalität, da die Sprachdaten derart in Pakete eingesetzt werden können, dass bei einer Verzögerung des Eintreffens eines späteren Paketes beispielsweise nicht ein Wort als solches mitten im Wort verzerrt oder unterbrochen wird sondern Unterbrechungen, Aussetzer und Verzögerungen in sprachliche Lücken verlagert werden können. Anstelle der Verlagerung in sprachliche Lücken kann natürlich auch eine Verlagerung in sprachliche Bereiche mit z.B. einer sehr geringen Dynamik verlagert werden, in denen Störungen möglichst wenig das Hörempfinden bei der Wiedergabe beeinträchtige . Vorteilhafte Ausgestaltungen sind Gegenstand von abhängigen Ansprüchen.
Besonders vorteilhaft ist es, nicht nur eine allgemeine Sprachstruktur sondern die natürliche Sprachstruktur zu berücksichtigen, da Störungen in dem gewohnten Sprachfluss stärker empfunden werden als Störungen in Randbereichen und insbesondere Endbereichen eines natürlichen Sprachflusses. Als besonders markante Elemente der Sprachstruktur sind dabei Wortteile, z.B. einzelne Silben, und ganze Worte für sich genommen möglichst nicht zu trennen. Entsprechend sollte die Aufteilung von Worten jeweils in Datenpakete derart erfolgen, dass mit dem Beginn des Datenpaketes bzw. dessen Nutzdatenabschnitt der Beginn eines Wortes oder Wortteils zusammenf llt, während zum Ende des Datenpaketes hin Freiräume bestehen bleiben dürfen. Derartige Freiräume sind zweckmäßigerweise mit Leerdaten oder sonstigen Informationsdaten auffüllbar.
Um die Sprachstruktur besonders effizient untersuchen zu können, kann dabei auf für sich bekannte Programme zur Sprach'erkennung, insbesondere Worterkennung zurückgegriffen werden, welche Sprachsignale mit Blick auf Worte und Wortbestandteile analysieren, um beispielsweise in ein
Mikrofon gesprochene Worte als Text in einem Textdokument wiedergeben zu können. Durch die Anwendung einer derartigen Spracherkennung ist es besonders einfach möglich, Sprachstrukturen, insbesondere Worte oder Silben erkennbar zu machen, um die Verteilung auf einzelnen Datenpakete entsprechend vorzunehmen. Zweckmäßigerweise kann bei Bereitstellung einer derartigen Spracherkennung auch ein Speicher oder Speicherabschnitt mit einer Art Wörterbuch hinterlegt werden, wie dies für Spracherkennungsprogramme ebenfalls für sich genommen bekannt ist, so dass mit Hilfe hinterlegter Musterworte eine weitere Verfeinerung der Analyse der Sprachstruktur vorgenommen werden kann. Besonders zweckmäßig ist es auch, Datenpakete nur teilweise mit Sprachdaten zu füllen, um einerseits zu verhindern, dass bei einer Aneinanderreihung einer Vielzahl von Worten letztendlich doch ein abschließendes Wort durchtrennt wird und andererseits ein schnellstmögliches Versenden der einzelnen Datenpakete ermöglichen zu können, wenn feststeht, dass der verbleibende Speicherraum nicht mehr zum Auffüllen mit einem Wort oder einer Wortsilbe ausreicht, das bzw. die eine festsetzbare Durchschnittslänge aufweist.
Bei der Aufteilung von Sprachdaten auf die einzelnen Datenpakete ist bei der Berechnung des verfügbaren Speicherraums in einem Datenpaket oder auch bei der Anwendung von Komprimierungsalgorithmen auch vorteilhaft berücksichtigbar, wie schnell eine Person spricht, da langsam gesprochene Worte unter Umständen stärker komprimierbar sind, als schnell und hektisch gesprochene Worte. Insbesondere benötigt ein langsam gesprochenes Wort ohne eine stärkere Komprimierung mehr Speicherraum innerhalb eines einzelnen Datenpaketes als das selbe Wort bei schneller Aussprache.
Ein Ausführungsbeispiel der Erfindung wird nachfolgend anhand der Zeichnung näher erläutert. Es zeigen:
Fig. 1 eine Anordnung zum Aufzeichnen, Digitalisieren und Versenden von Daten sowie zum Empfangen, Rekonstruieren und Wiedergeben von Daten in einem KommunikationsSystem,
Fig. 2 ein analoges Sprachdiagramm mit einer zeitlichen
Amplitudenverteilung und Kennzeichnung von Grenzen zum Verpacken einzelner Sprachanteile in verschiedene Datenpakete und Fig. 3 ein solches Diagramm zur Veranschaulichung der Zuordnung der Sprachinformationen zu einzelnen Datenpaketen gemäß dem Stand der Technik.
Wie aus Fig. 1 ersichtlich, kann eine beispielhafte Sendeeinrichtung SE aus einer Vielzahl von Einzelkomponenten bestehen, welche aber auch teilweise weggelassen und/oder in anderen Einrichtungen aufgenommen werden können.
Zur Aufnahme von Sprache oder sonstigen Lautfolgen dient ein Mikrofon MIC, welches an einem Analog-/Digitalwandler A/D angeschlossen ist. In dem Analog-/Digitalwandler A/D erfolgt eine Umsetzung des analogen Sprachsignals in ein digitales Signal. Üblicherweise erfolgt die Digitalisierung ohne
Rücksicht auf die Sprache bzw. Information im Datenstrom kontinuierlich mit äquidistanten Schritten, wobei zu jedem AbtastZeitpunkt jedem Analogwert ein äquivalenter digitaler Datenwert zugeordnet wird. Die digitalisierten Datenwerte werden vom Analog-/ Digital-Wandler A/D aus in einen Prozessor, insbesondere Mikroprozessor μPS eingegeben. Optional kann der Prozessor μPS auch einen weiteren Eingang zur Eingabe bereits vorliegender digitaler Datenwerte aufweisen. Nach einer Datenverarbeitung bzw. Datenaufbereitung leitet der Prozessor μPS die aufbereiteten Datenwerte zu einer Sendeeinrichtung, die hier im bevorzugten Ausführungsfall als Sende-/Empfangseinrichtung S/R ausgebildet ist. Die Sende-/Empfangseinrichtung bereitet die empfangenen Datenwerte für eine Übertragung über eine Schnittstelle vor. Als Schnittstelle zum Ausgeben der
Datenwerte ist beim dargestellten Ausführungsbeispiels eine Antenne A an die Sende-/Empfangseinrichtung S/R angeschlossen, wobei auch beliebige andere Übertragungswege, insbesondere leitungsgebundene Schnittstellen, anstelle einer dargestellten Funkschnittstelle V verwendet werden können. Eine Empfangseinrichtung RE weist eine Vielzahl von entsprechenden Komponenten auf. Über einen
Schnittstelleneingang, im dargestellten Ausführungsbeispiel eine Antenne A, wird das von der Sendeeinrichtung SE über die Schnittstelle V gesendete bzw. übertragene Signal mit den Datenwerten empfangen und zu einer Empfangseinrichtung, im dargestellten bevorzugten Ausführungsbeispiel eine Sende- /Empfangseinrichtung S/R empfangen und vorverarbeitet. Die Sende-/Empfangseinrichtung S/R leitet das entsprechende vorverarbeitete Signal bzw. die entsprechend vorverarbeiteten Datenwerte an einen Prozessor weiter, im dargestellten Ausführungsbeispiel einen Mikroprozessor μPR. In dem Prozessor μPR werden die empfangenen Datenwerte verarbeitet bzw. aufbereitet und dann an einen Digital/ Analog-Wandler D/A ausgegeben, der eine Umsetzung in ein analoges Signal bewirkt. Über einen Verstärker wird dann das vom Digital- /Analog-Wandler D/A ausgegebene Analogsignal zu einem Lautsprecher Sp ausgegeben, der die ursprünglich gesprochene Sprache für einen Hörer ausgibt. Zusätzlich oder alternativ kann bei der Empfangseinrichtung RE eine Schnittstelle für eine digitale Ausgabe der Sprachdaten bereitgestellt sein.
Wie aus den Darstellungen entnehmbar ist, können nicht nur eigenständige Sendeeinrichtungen SE und eigenständige Empfangseinrichtungen RE bereitgestellt werden, sondern kombinierte Sende-/Empfangseinrichtungen, die sowohl die Baugruppen und Funktionen der Sendeeinrichtungen SE als auch die Baugruppen und Funktionen der Empfangseinrichtung RE aufweisen.
Ausgehend von dem Stand der Technik, der in Fig. 3 dargestellt ist, wird nun die Verteilung von Sprachdaten auf Datenpakete beschrieben. In der Sendeeinrichtung SE werden in den Prozessor μPS digitalisierte Datenwerte eingegeben, die letztendlich den in Fig. 3 als kontinuierliches Signal dargestellten Verlauf, wiedergeben. Über der Zeitachse t sind um den dynamischen Nullwert „0* die entsprechenden Amplituden des Signals bzw. der nach dem Abtasten daraus gebildeten digitalen. Datenwerte abgebildet. Die Verpackung der digitalen Daten erfolgt derzeit, indem eine feste Anzahl von Datenwerten jeweils in den Nutzdatenblock eines Paketes (Paket 1, Paket 2, ..., Paket 5, ...) gepackt werden. Diese über die Schnittstelle V übertragenen Datenpakete werden dann in der Empfangseinrichtung vom Prozessor μPR entpackt und wieder zu einer Datenfolge rekonstruiert. Dabei werden die einzelnen Pakete empfängerseitig in der Empfangseinrichtung RE z.B. entsprechend einer zeitlichen Abfolge derart wiedergegeben, dass Datenwerte eines zu spät eintreffenden Paketes nach einer entsprechenden, dadurch künstlich erzeugten Sprachpause entpackt und über den Lautsprecher Sp wiedergegeben werden. Trifft das nachfolgende Datenpaket über einen kürzeren Datenweg oder über einen unverzögerten Weg pünktlich bei der Empfangseinrichtung RE ein, so wird es entpackt und die Datenwerte werden entsprechend der Vorgabe einer möglichst geringen Zeitverzögerung unmittelbar über den Lautsprecher Sp wiedergegeben. Die Wiedergabe eventuell noch nicht gesendeter Datenwerte des Paketes 1 wird dazu unterdrückt. Durch eine derartige Vorgehensweise entstehen unnatürliche Sprachlücken mitten in einem Wort oder gar mitten in einem Phonem, also einem Laut oder einer natürlichen Lautfolge. Außerdem werden Wortteile, Worte oder Phoneme ausgelassen, dies ebenfalls an Stellen, wo sie das Sprachempfinden oder gar das Verständnis stören.
Wie dies aus Fig. 2 ersichtlich ist, wird für die Verpackung von Sprachdaten oder Klangdaten, also beispielsweise auch Musikdaten, eine Strukturerkennung vorgeschaltet. Anhand des Beispiels von Sprachdaten wird dazu die natürliche Sprachstruktur analysiert, wobei als Kriterien für die Analyse die Suche nach Sprachpausen zwischen Worten, die Suche nach Silben oder die Suche nach Phonemen besonders bevorzugt verstanden wird. Die in Fig. 2 dargestellten sinnvollen Grenzen zum Trennen von jeweils strukturbedingt zusammengehörenden Sprach-, Klang- bzw. entsprechenden Datenwerten befinden sich z.B. in Bereichen, in denen sich die Amplituden d der Datenwerte über eine gewisse Zeitspanne Δt nicht aus einem vorgegebenen Differenzdynamikbereich Δd herausbewegen. Derartige Amplitudenwerte über eine entsprechende Zeitspanne Δt sind beispielsweise ein Zeichen für eine Sprechpause zwischen zwei Worten. Prinzipiell kommen für Paketgrenzen insbesondere alle die Stellen in Frage, welche sich mathematisch dadurch auszeichnen, dass sich die erste Ableitung der Funktion, welche die Sprache beschreibt, über eine längere, gegebenenfalls vorgebbare Dauer auf Null befindet oder ein gegebenenfalls vorgebbares Intervall um die Nulllinie herum nicht überschreitet.
Entsprechend ist bei dem dargestellten Ausführungsbeispiel einer Sprach- bzw. Klangfolge ein erstes Datenpaket Paket 1 mit nur einer geringen Anzahl von Datenwerten gefüllt, während in das zweite Datenpaket Paket 2 eine längere Sprachbzw. Klangfolge bzw. deren Datenwerte eingesetzt werden. Nach dem zweiten Datenpaket folgt eine längere Sprachpause bzw. Sprachlücke, deren Daten vorzugsweise in gar kein Paket verpackt werden, um die Daten- und Signalisierungslast auf dem Kommunikationsnetz zu reduzieren. Das dritte Datenpaket Paket 3 weist ebenfalls wieder eine längere Folge von Datenwerten auf, bevor eine erneute Sprachpause kommt. Für den Fall, dass über eine maximal mögliche Dauer oder eine maximal sinnvolle Dauer keine Sprachlücke detektierbar ist, kann natürlich auch eine zwangsweise Grenze gesetzt werden, so dass in einem solchen Fall Störungen wie beim Stand der Technik notgedrungen in Kauf genommen werden.
Neben der beschriebenen Erkennung von Sprachlücken oder Klanglücken, bei denen ein gewisser Dynamikbereich um den Nullwert nicht verlassen wird, können natürlich auch beliebige andere Kriterien herangezogen werden. Im Fall eines allgemeinen Hintergrundstörgeräusches kann der Grunddynamikpegel beispielsweise über dieser Grenze Δd liegen, weshalb es sinnvoll sein kann, nicht nur Grenzwerte um den Null-Bereich herum zu analysieren, sondern generell zu untersuchen, ob die Sprach- bzw. Klangdaten hinsichtlich ihrer Amplitudenwerte über einen gewissen Zeitraum innerhalb eines gewissen Dynamikbereiches verharren. Auch unabhängig von derartigen Situationen mit Hintergrundgeräuschen ist es möglich, als sinnvolle Grenze Klangbereiche zu wählen, bei denen eine möglichst geringfügige zeitliche Veränderung des Frequenzspektrums und/oder des Dynamikspektrums auftritt, da bei beispielsweise einem lang gesprochenen Vokal Übertragungsfehler bei einer Verkürzung oder Verlängerung der Wiedergabe nicht so sehr das Sprachempfinden oder Verständnis stören, wie beispielsweise eine Trennung zwischen zwei kurz gesprochenen Vokalen oder zwei Konsonanten.
Besonders bevorzugt wird eine Festlegung von Grenzen zur Einteilung in Pakete anhand von der Erkennung bestimmter Phoneme. Dazu wird in einer Tabelle bzw. einem Speicher M, der zweckmäßigerweise mit dem Prozessor μPS verbunden ist, eine Vielzahl üblicher Phoneme hinterlegt. Gesprochene und digitalisierte Datenwerte, die beim Mikroprozessor μPS eintreffen, werden dann als Datenwertfolge mit einer entsprechenden Datenwertfolge der im Speicher M hinterlegten Phoneme verglichen. Sobald ein Phonem erkannt wird, wird dessen Ende als mögliche Grenze markiert oder registriert. Je nach gewünschter Anzahl von Phonemen oder Datenwerten, die jeweils in ein Paket gepackt werden sollen, kann dann bei dem eigentlichen Verpacken nach derart ermittelten Grenzen gesucht werden, um eine optimale Verpackung der Datenwertfolgen in die Datenpakete zu ermöglichen.
Für den Fall, dass die Vielzahl der im Speicher M hinterlegten Phoneme zur Erkennung nicht ausreichen, beispielsweise weil die in die Sendeeinrichtung eingegebene Sprachfolge einen ausgefallen Dialekt hat oder in einer klanglich besondersartigen Sprache gesprochen wird, können natürlich parallel oder zusätzlich auch andere Kriterien als Sprachgrenzen bzw. Klanggrenzen verwendet werden. In besonders bevorzugter Ausführungsform findet somit eine Koppelung von Mustererkennung zum Erkennen vorgegebener Phoneme, Silben oder Worte und einer Spachlückenerkennung usw. statt.
Um eine möglichst zeitnahe und unverzerrte Wiedergabe von Sprach- bzw. Klangdaten in der Empfängereinrichtung RE zu ermöglichen, wird die Anzahl der pro Datenpaket zu verpackenden Datenwerte gering gehalten. Bei Kommunikationssystemen mit Datenpaketversand gemäß dem Internetprotokoll IP betragen derzeit übliche Paketgrößen 1500, 9800 oder 64000 Byte. Für die Verpackung von
Sprachdaten erscheint es jedoch zweckmäßig, bei üblichen Abtastraten von z.B. 8 kHz und einer typischen Phonemdauer in der Größenordnung von wenigen Zehntelsekunden nur jeweils Datenmengen von ca. 500 Byte pro Datenpaket einzusetzen. Empfängerseitig werden entsprechend die Datenpakete direkt nach dem Empfang entpackt und die Wiedergabe der Klang- bzw. Sprachstruktur wird über den Lautsprecher Sp bewirkt.
Während gemäß den Vorgaben der Dienstegüte (QoS: Quality of Service) gemäß IP Daten bzw. Datenwerte derart zu übertragen sind, dass keinerlei Verluste auftreten und auch keinerlei Verdoppelungen auftreten, kann bei der Rekonstruktion von Sprachdaten ein gerade gegenläufiges Prinzip vorteilhaft sein, welches bei dem hier beschriebenen Verfahren vorteilhaft ausgenutzt wird.
Trifft beispielsweise ein erstes Sprachpaket mit einer längeren natürlichen Sprach- bzw. Klangpause beim Empfänger ein, wie beispielsweise das Paket 2 aus Fig. 2, und trifft danach aber das nachfolgende Paket, d.h. Paket 3 aus Fig. 2, verspätet ein, so kann die natürliche Sprach- bzw. Klangpause am Ende des Paketes 2 problemlos künstlich verlängert werden. Das Klangempfinden bzw. Sprachempfinden wird durch die Verpackung der Daten in das Paket 2 mit einer Sprach- bzw. Klangpause am Ende bei einer derartigen Wiedergabe nur geringfügig oder gar nicht gestört.
Für den Fall, dass eine Paketgrenze derart gewählt wurde, dass z.B. ein lang gedehnter Vokal durch die Datenpaketgrenze getrennt wurde, kann in der Empfangseinrichtung RE die Datenverarbeitung μPR entsprechend der Verlängerung von Klanglücken derart erfolgen, dass der letzte Klang bzw. Ton verdoppelt, verdreifacht, ... wiedergegeben wird, was bei der klanglichen Wiedergabe wie eine verlängerte Dehnung erscheint und sich ebenfalls nur in geringfügigem oder vernachlässigbarem Umfang negativ auf das Klang- bzw. Sprachempfinden auswirkt.
Während vorstehend die Versendung von Datenpaketen mit unterschiedlicher Anzahl von Datenwerten bzw. unterschiedlicher Datenpaketlänge beschrieben ist, ist es natürlich auch möglich, Datenpakete mit jeweils gleicher
Dauer zu erstellen und zu übertragen. In einem solchen Fall wird die Dauer der in die Datenpakete zu packenden Datenwerte zweckmäßigerweise so lang gewählt, dass eine ausreichende Anzahl von Datenwerten eingesetzt werden kann, um eine genügende Anzahl von Phonemen, Silben und/oder Worten, je nach Wunsch des Trennkriteriums, einsetzen zu können, so dass idealerweise nach den eingesetzten Nutz-Datenwerten stets noch eine Anzahl unbelegter Datenwerte folgt, die bei der Wiedergabe in der Empfangseinrichtung RE bei Eintreffen des nächsten Datenpaketes mit dessen ersten Datenwerten überschrieben werden.
Während vorstehend einfache Möglichkeiten zur Umsetzung eines solchen Verfahrens beschrieben wurden, können natürlich bereits bestehende Programme soft- oder hardwaremäßig in die Verfahrensweise bei der Strukturanalyse eingehender Klangbzw. Sprachdaten und bei der Rekonstruktion auszugebender Sprach- bzw. Klangdaten verwendet werden, die für sich genommen aus beispielsweise dem Bereich der Spracherkennung bekannt sind, wobei diese Programme dazu dienen, gesprochene Sprache in geschriebenen Text bzw. geschriebenen Text in gesprochene Sprache umzusetzen. Letztendlich beruht eine Vielzahl dieser Programme auf Algorithmen, die auch als solche im vorstehend beschriebenen Verfahren vorteilhaft eingesetzt werden können.
Während vorstehend die direkte Übertragung von Sprachdaten oder Klangdaten zu einem Empfänger und die unmittelbare dortige Wiedergabe beschrieben sind, kann das Verfahren natürlich auch zum konservieren von Sprachdokumenten verwendet werden, beispielsweise um eine historisch bedeutende Rede zwischenzeitlich in einem Speicher paketweise hinterlegen zu können, um eine spätere Wiedergabe ermöglichen zu können.

Claims

Patentansprüche
1.. Verfahren zum Bereitstellen von Klang- und/oder
Sprachdaten für eine Übertragung in einem paketorientierten Komrαunikationssystem, bei dem
- digitalisierte Klang-Datenwerte und/oder Sprach-Datenwerte in zeitlicher Abfolge in aufeinanderfolgende Datenpakete gepackt werden, dadurch g e k e n n z e i c h n e t , dass die Einteilung aufeinanderfolgender Datenwerte auf die aufeinanderfolgenden Datenpakete (Paket 1, Paket 2,...) unter Berücksichtigung der Klang- bzw. Sprachstruktur durchgeführt wird.
2. Verfahren nach Anspruch 1, bei dem als Klang- bzw. Sprachstruktur eine natürliche Klang- bzw. Sprachstruktur für die Analyse zur Einteilung in die Datenpakete verwendet wird.
3. Verfahren nach Anspruch 1 oder 2, bei dem bei der Berücksichtigung der Klang- bzw. Sprachstruktur Phoneme, Worte, Silben und/oder Wortteile als Merkmale der Sprachstruktur bei der Einteilung in die Datenpakete verwendet werden.
4. Verfahren nach einem vorstehenden Anspruch, bei dem bei der Berücksichtigung der Sprachstruktur in einem Speicher (M) hinterlegte Phonemmuster, Wortteilmuster und/oder Wortmuster für einen Vergleich mit in die Datenpakete einzuteilenden Datenwerten bzw. Datenwertfolgen verwendet werden.
5. Verfahren nach einem vorstehenden Anspruch, bei dem als Klang- bzw. Sprachgrenzen für die Einteilung von Datenwerten in eines der Datenpakete über eine Dauer (Δt) anhaltende Klang- und/oder Sprechpausen in Randbereiche, insbesondere an das Ende des Nutzdatenbereichs des Datenpakets gelegt werden.
6. Verfahren nach einem vorstehenden Anspruch, bei dem als Klang- bzw. Sprachgrenzen für die Einteilung von Datenwerten in eines der Datenpakete über eine Dauer (Δt) gedehnte Laute oder Klänge in Randbereiche, insbesondere an das Ende des Nutzdatenbereichs des Datenpakets gelegt werden.
7. Verfahren nach einem vorstehend Anspruch, bei dem die Datenpakete mit einer unterschiedlichen Anzahl von Datenwerten gefüllt werden.
8. Verfahren zum Wiedergeben von insbesondere nach einem vorstehenden Verfahren in Datenpakete gepackten Klang- bzw. Sprach-Datenwerten, bei dem bei der Wiedergabe im Fall eines zu spät eintreffenden nachfolgenden Datenpaketes über eine Dauer (Δt) anhaltende Klangpausen und/oder zuletzt wiederzugebende Klänge bis zum Eintreffen eines nächsten Datenpaketes oder einer vorgegebenen maximalen Dauer ununterbrochen wiederholt oder kontinuierlich gedehnt wiedergegeben werden.
9. Sende- und/oder Empfangseinrichtung (SE, RE) zum Durchführen eines Verfahrens nach einem vorstehenden Anspruch.
10. Sende- und/oder Empfangseinrichtung (SE, RE) nach Anspruch 9, mit einem Speicher (M) zum Speichern von Klangmustern, Sprachmustern, Lauten, Wortteilen, Phonemen und/oder Worten zum Vergleich mit zu untersuchenden und in Datenpakete (Paket 1, Paket 2,...) einzuteilenden Klang- bzw. Sprach- Datenwertfolgen und einem Prozessor (μPS) zum Durchführen des Vergleichs und zum Einteilen der Datenwerte auf die Datenpakete .
PCT/EP2001/014359 2001-12-06 2001-12-06 Verfahren und vorrichtung zum übertragen von klang- und/oder sprachdaten in einem paketorientierten kommunikationssystem WO2003049389A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/EP2001/014359 WO2003049389A1 (de) 2001-12-06 2001-12-06 Verfahren und vorrichtung zum übertragen von klang- und/oder sprachdaten in einem paketorientierten kommunikationssystem
AU2002219159A AU2002219159A1 (en) 2001-12-06 2001-12-06 Method and device for transferring sound and/or voice data in a packet-oriented communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2001/014359 WO2003049389A1 (de) 2001-12-06 2001-12-06 Verfahren und vorrichtung zum übertragen von klang- und/oder sprachdaten in einem paketorientierten kommunikationssystem

Publications (1)

Publication Number Publication Date
WO2003049389A1 true WO2003049389A1 (de) 2003-06-12

Family

ID=8164717

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2001/014359 WO2003049389A1 (de) 2001-12-06 2001-12-06 Verfahren und vorrichtung zum übertragen von klang- und/oder sprachdaten in einem paketorientierten kommunikationssystem

Country Status (2)

Country Link
AU (1) AU2002219159A1 (de)
WO (1) WO2003049389A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107924610A (zh) * 2015-06-24 2018-04-17 大众汽车有限公司 用于提高在远程触发时的安全性的方法和设备,机动车

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0859353A2 (de) * 1997-02-13 1998-08-19 Siemens Business Communication Systems, Inc. Verfahren und Vorrichtung zur Signalverarbeitung mittels logischer Sprachgrenzen

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0859353A2 (de) * 1997-02-13 1998-08-19 Siemens Business Communication Systems, Inc. Verfahren und Vorrichtung zur Signalverarbeitung mittels logischer Sprachgrenzen

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BOCCI P ET AL: "DYNAMIC DATA PACKET SIZING BASED ON REAL TIME MONITORING OF SYSTEM VOICE ACTIVITY", MOTOROLA TECHNICAL DEVELOPMENTS, MOTOROLA INC. SCHAUMBURG, ILLINOIS, US, vol. 31, 1 June 1997 (1997-06-01), pages 172, XP000741064, ISSN: 0887-5286 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107924610A (zh) * 2015-06-24 2018-04-17 大众汽车有限公司 用于提高在远程触发时的安全性的方法和设备,机动车

Also Published As

Publication number Publication date
AU2002219159A1 (en) 2003-06-17

Similar Documents

Publication Publication Date Title
DE60223131T2 (de) Verfahren und vorrichtung zum codieren und decodieren von pauseninformationen
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69735097T2 (de) Verfahren und vorrichtung zur verbesserung der sprachqualität in tandem-sprachkodierern
DE60034484T2 (de) Verfahren und vorrichtung in einem kommunikationssystem
DE69839312T2 (de) Kodierverfahren für vibrationswellen
DE69910240T2 (de) Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE60126513T2 (de) Verfahren zum ändern der grösse eines zitlerpuffers zur zeitausrichtung, kommunikationssystem, empfängerseite und transcoder
DE69431622T2 (de) Verfahren und gerät zum kodieren von mit mehreren bits kodiertem digitalem ton durch subtraktion eines adaptiven zittersignals, einfügen von versteckten kanalbits und filtrierung, sowie kodiergerät zur verwendung bei diesem verfahren
DE69310990T2 (de) Verfahren zum Einfügen digitaler Daten in ein Audiosignal vor der Kanalkodierung
DE69910837T2 (de) Beseitigung von tonerkennung
DE69613611T2 (de) System zur Speicherung von und zum Zugriff auf Sprachinformation
EP2245621B1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
EP0978172B1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
EP1051701B1 (de) Verfahren zum übermitteln von sprachdaten
DE60118922T2 (de) Messung der wahrgenommenen sprachqualität während des betriebs durch messen von objektiver fehlerparamter
DE69815562T2 (de) Verfahren und Vorrichtung zur Signalverarbeitung mittels logischer Sprachgrenzen
DE69828849T2 (de) Signalverarbeitungsgerät und -verfahren sowie Informationsaufzeichnungsgerät
WO2003049389A1 (de) Verfahren und vorrichtung zum übertragen von klang- und/oder sprachdaten in einem paketorientierten kommunikationssystem
EP0658874A1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
EP1062487B1 (de) Mikrophonanordnung für die spracherkennung unter variablen räumlichen bedingungen
DE2303497C2 (de) Verfahren zur Übertragung von Sprachsignalen
DE102013005844B3 (de) Verfahren und Vorrichtung zum Messen der Qualität eines Sprachsignals
DE2233976B2 (de) Schaltungsanordnung zum Erkennen und Weiterschalten einer Information
EP1390946B1 (de) Verfahren zur schätzung eines codecparameters

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP