JP2008039826A - Voice guidance apparatus - Google Patents
Voice guidance apparatus Download PDFInfo
- Publication number
- JP2008039826A JP2008039826A JP2006209838A JP2006209838A JP2008039826A JP 2008039826 A JP2008039826 A JP 2008039826A JP 2006209838 A JP2006209838 A JP 2006209838A JP 2006209838 A JP2006209838 A JP 2006209838A JP 2008039826 A JP2008039826 A JP 2008039826A
- Authority
- JP
- Japan
- Prior art keywords
- place name
- name information
- data
- voice
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
本発明は、音声出力装置に関し、より詳しくは、複数の異なる言語による音声案内を行うために使用される音声出力装置に関する。 The present invention relates to a voice output device, and more particularly to a voice output device used for voice guidance in a plurality of different languages.
例えば、外国から日本に来る観光客は、必ずしも、日本語が得意ではない。そこで、例えば彼らが日本で各地に所在する観光地を観光する際に、彼らの母国語で観光案内されるのであれば、現在の場所や次に移動する地名などの情報が分かりやすい。
このため、例えば外国人用の観光バスでは、現在の場所や次の観光地の情報などが複数の言語で案内されている。この場合、一般的には、例えば録音テープなどを用いて、同じ内容の案内を複数の言語で順次、つまり時間的に続けて行う構成が用いられている。
For this reason, for example, on a tourist bus for foreigners, information on the current location and the next sightseeing spot is provided in a plurality of languages. In this case, generally, for example, a recording tape or the like is used to sequentially guide the same contents in a plurality of languages, that is, continuously in time.
しかしながら、上記のように複数の言語で同じ内容を順次案内する方法の場合には、各国語による案内説明が順番に行われるため、1つの外国語での説明が終わるまでに時間がかかってしまい、特定の言語を母国語とする人には必要な案内を聞くタイミングがずれてしまうという問題がある。 However, in the case of the method of sequentially guiding the same contents in a plurality of languages as described above, it takes time to complete the explanation in one foreign language because guidance explanations in each language are performed in order. There is a problem that a person who speaks a specific language has a different timing to listen to necessary guidance.
また、観光案内する情報の内容に追加や変更がある場合には、追加や変更の内容を各言語毎に録音する必要がある。その場合、一般的には、各言語の数に対応した数の人(あるいは複数の言語を話せる人)を用意する必要があり、その分、人件費などの費用が嵩むという問題がある。 In addition, when there is an addition or change in the content of the information for sightseeing guidance, it is necessary to record the content of the addition or change for each language. In that case, in general, it is necessary to prepare a number of people (or a person who can speak a plurality of languages) corresponding to the number of each language, and there is a problem that labor costs and the like increase accordingly.
本発明の音声出力装置は、使用言語の異なる複数の音声データが保存されたデータ記憶部と、前記複数の音声データを読み出すと共に、読み出した複数の音声データに所定の言語による地名情報の音声データをそれぞれ合成して出力する音声合成部と、前記合成された複数の音声データを音声出力する音声出力部とを有してなることを特徴とする。
前記音声合成部は、前記地名情報の音声デ−タを複数回繰り返す態様で合成を行うことを特徴とし、さらに、前記地名情報の音声データが日本語の音声データであることを特徴とする。
また、本発明の別の音声出力装置は、使用言語が異なる複数の音声データが保存されたデータ記憶部と、前記複数の音声データにおける地名情報をそれぞれ検出する地名情報検出部と、前記検出した地名情報を所定の言語による音声データにそれぞれ置換する地名情報置換部と、前記地名情報を置換した複数の音声データのうちの所定のものを多重に音声出力する音声出力部とを有してなることを特徴とする。
好ましい実施形態において、前記音声合成部は、前記地名情報の音声データを複数回繰り返す態様で合成を行う。同じく、前記音声出力部は、前記地名情報の音声データを複数回繰り返す態様で前記音声出力を行う。また、前記地名情報の音声データは、例えば日本語の音声データである。
An audio output device according to the present invention includes a data storage unit storing a plurality of audio data in different languages, and reading the plurality of audio data. The audio data of place name information in a predetermined language is read from the plurality of read audio data. And a voice output unit for outputting the plurality of synthesized voice data as voices.
The speech synthesis unit synthesizes the speech data of the place name information in a manner that is repeated a plurality of times, and the speech data of the place name information is Japanese speech data.
Another audio output device according to the present invention includes a data storage unit storing a plurality of audio data in different languages, a place name information detecting unit for detecting place name information in each of the plurality of audio data, and the detection A place name information replacing unit that replaces place name information with audio data in a predetermined language; and an audio output unit that outputs a plurality of pieces of audio data in which the place name information is replaced. It is characterized by that.
In a preferred embodiment, the speech synthesizer synthesizes speech data of the place name information a plurality of times. Similarly, the voice output unit performs the voice output in such a manner that the voice data of the place name information is repeated a plurality of times. Moreover, the voice data of the place name information is, for example, Japanese voice data.
この音声出力装置において、前記音声出力部は、例えば、ワイヤレス通信で前記音声出力するワイヤレス通信部を有して構成される。ワイヤレス通信部は、具体的には例えばAM・FMデジタル通信装置が用いられる。 In this audio output device, the audio output unit includes, for example, a wireless communication unit that outputs the audio by wireless communication. Specifically, for example, an AM / FM digital communication device is used as the wireless communication unit.
本発明では、観光地における所定内容の案内を行うための音声データを、地名情報と、その他の部分(共通情報)とに分けて設ける。そして、共通情報については、複数の言語(例えば、日本語、英語、中国語、韓国語など)でそれぞれ発音した、使用言語の異なる複数の共通情報用音声データを作成する。一方、地名情報については、特定の言語(例えば日本語)で発音した地名情報用音声デーを作成する。そして、この地名情報用音声データを、上記の複数の共通情報用音声データのそれぞれと所定の順序で合成することで、地名情報用の発音データが共通で且つ共通情報における使用言語の異なる複数の音声データをそれぞれ作成する。
あるいは、所定内容の案内を行うための音声を複数の言語(例えば、日本語、英語、中国語、韓国語など)でそれぞれ発音した複数の音声データを作り、これら音声データを記憶装置に保存しておく。一方、特定の言語(例えば日本語)で所定の地名を発音した地名情報用音声データを別途作成し、同様に記憶装置に保存しておく。そして、使用の際には、上記保存された複数の音声データにおける地名情報を検出すると共にこの検出した地名情報を上記地名情報用音声データと置換する。このように地名情報を置換した複数の音声データの内の所定のものが音声出力される。
In the present invention, voice data for guiding predetermined contents in a sightseeing spot is provided separately for place name information and other parts (common information). For the common information, a plurality of pieces of common information sound data that are pronounced in a plurality of languages (for example, Japanese, English, Chinese, Korean, etc.) and used in different languages are created. On the other hand, for place name information, place name information voice data that is pronounced in a specific language (for example, Japanese) is created. Then, by synthesizing the place name information voice data with each of the plurality of common information voice data in a predetermined order, the place name information pronunciation data is common and the plurality of languages used in the common information are different. Create each audio data.
Alternatively, a plurality of voice data, each of which is produced by uttering voices for guiding predetermined contents in a plurality of languages (for example, Japanese, English, Chinese, Korean, etc.), are stored in a storage device. Keep it. On the other hand, place name information voice data in which a predetermined place name is pronounced in a specific language (for example, Japanese) is separately created and similarly stored in a storage device. In use, the place name information in the plurality of stored voice data is detected and the detected place name information is replaced with the place name information voice data. In this way, a predetermined one of the plurality of audio data in which the place name information is replaced is output as audio.
また、複数の音声データは、音声出力部から多重に(つまり同時に)音声出力される。音声出力は好ましくはワイヤレス通信で出力される。具体的には、例えばAM・FMデジタル通信装置が用いられる。
例えば、この装置でFM通信する場合は、使用言語毎に異なる周波数帯でこれら複数の音声データを同時にFM通信により音声出力することで多重出力を行う。そして、例えば、利用者側に対応するFM受信装置を持たせておき、利用者は必要な言語に割り当てられた周波数帯での音声出力をFM受信装置で受信することで、当該言語での音声出力を聞くことができる。
In addition, a plurality of audio data is output in multiple (that is, simultaneously) audio from the audio output unit. The audio output is preferably output by wireless communication. Specifically, for example, an AM / FM digital communication device is used.
For example, when FM communication is performed using this apparatus, multiple outputs are performed by simultaneously outputting a plurality of audio data in different frequency bands for each language used by FM communication. For example, an FM receiver corresponding to the user side is provided, and the user receives the voice output in the frequency band assigned to the necessary language by the FM receiver so that the voice in the language is received. You can hear the output.
本発明によれば、上記のように複数の異なる言語での同時的な音声出力を行うことができ、従来のような案内のタイミングのずれを回避することができる。
一方、地名情報に変更があった場合、あるいは地名情報に使用する言語を変更する場合には、地名情報用音声データだけを変更すれば良い。変更する地名情報用音声データの作成は、例えば地名情報用音声データが日本語であれば日本人一人で作成することができるため、1人分の人件費ですみ、低コストで行うことができる。
また、地名だけを特定の言語(例えば、案内を行っている国の言語)で行うことで、次の効果もある。即ち、例えば英語の案内の中に地名だけを英語とはイントネーションやアクセントなどが異なる日本語(日本語の発音)で複数回音声出力することで、その地名に意識がいき、しかも複数回、好ましくは2、3回繰り返して音声出力することにより、注意を喚起することができる。この地名情報は、観光案内の中でも特に重要であることから、このように意識を高めることで、記憶に残り易くなるという利点がある。
According to the present invention, as described above, simultaneous voice output in a plurality of different languages can be performed, and a conventional shift in the timing of guidance can be avoided.
On the other hand, when the place name information is changed, or when the language used for the place name information is changed, only the place name information audio data is changed. For example, if the place name information voice data is in Japanese, it can be created by a Japanese person, so it can be done at a low cost. .
Further, by performing only the place name in a specific language (for example, the language of the country where guidance is provided), the following effects are also obtained. That is, for example, by outputting the place name only in Japanese (Japanese pronunciation) with different intonations and accents from English in the English guidance, the place name becomes more conscious, and more than once, preferably Can be alerted by repeating voice output a few times. Since this place name information is particularly important in tourist information, there is an advantage that it becomes easy to remain in memory by raising the consciousness in this way.
以下に、本発明の実施例を説明する。
図1に本発明の実施例の音声出力装置を示した。この音声出力装置は、データサーバ1と、FM出力装置2とから構成されている。データサーバ1は、音声データ記憶部11、地名情報検出部12、地名情報置換部13、音声データ合成部14などから構成される。
Examples of the present invention will be described below.
FIG. 1 shows an audio output apparatus according to an embodiment of the present invention. This audio output device is composed of a data server 1 and an FM output device 2. The data server 1 includes a voice
音声データ記憶部11は、例えばRAMやHD(ハードディスク)などの記憶装置で構成されており、所定の案内に対応する、複数の異なる言語(例えば、日本語、英語、中国語、韓国語)での音声出力を行うための音声データ(例えばMP3形式、WMP形式などのデジタルデータ)が記憶されている。これら音声データは、少なくとも、地名情報に対応する地名情報用音声データが検出および置換可能な態様で保存されている。より具体的には、地名情報用音声データは、その他の情報(共通情報)のための音声データ(共通情報用音声データ)とデータ的に分離された状態で保存されている。
The audio
ここで、本実施例においては、地名情報は全て日本語の情報であり、一方、共通情報は例えば上記した日本語、英語、中国語、韓国語の各言語による情報である。そして、各言語の共通情報に、日本語による音声出力により地名情報がそれぞれ所定の態様で組み合わせることで、所定の案内が行われる。 Here, in this embodiment, the place name information is all Japanese information, while the common information is information in, for example, Japanese, English, Chinese, and Korean languages. Then, predetermined information is provided by combining the common information of each language with the place name information in a predetermined manner by voice output in Japanese.
地名情報検出部12は、例えば、CPUや所要のコンピュータプログラムなどから構成される機能実現手段であり、音声データ記憶部11に記憶された音声データから地名情報用音声データを検出する。この検出は、例えば、各地名情報用音声データに特定のヘッダを付けておき、このヘッダの有無を検知することで行う。
The place name
地名情報置換部13は、上記と同様に例えばCPUや所要のコンピュータプログラムなどから構成される機能実現手段であり、地名情報検出部12において検出された地名情報用音声データを、別の地名情報用音声データに置換するものである。置換により、元のデータは削除され、新たなデータが保存される。
The place name
音声データ合成部14は、上記と同様に例えばCPUや所要のコンピュータプログラムなどから構成される機能実現手段であり、音声データ記憶部11に記憶された音声データを所要の順序で読み出し、且つ、合成して出力する機能を有する。
なお、以上は地名情報検出部12と地名情報置換部13とを組み合わせることで、音声データ中の地名情報用音声データを所定の地名情報用音声データに置換した例であるが、これに代えて、これら地名情報検出部12と地名情報置換部13とを用いずに、次の方法とすることもできる。
即ち、音声データ記憶部11に保存された音声データを、音声データ合成部14により呼び出す際において、音声データ合成部14が上記共通情報用音声データに所定の地名情報用音声データを合成して出力する構成とすることもできる。
The voice
The above is an example in which the place name
That is, when the voice data stored in the voice
一方、FM出力装置2は、音声データ変換部211から214、AM・FMデジタル通信装置221から224、FM送信機231から234などから構成される。音声データ変換部211から214は、データサーバ1の音声データ合成部14から送信された4つの異なる言語による音声データを、FM送信用に音声、例えばアナログ化した音声にそれぞれ変換する。AM・FAデジタル通信装置221から224は、変換された音声を、AMまたはFAM用の信号に変換する。この実施例では、FM用の信号に変換する。また、FM送信機231から234は、これら変換された信号を所定の互いに異なる周波数のFM電波に乗せて送信する。
On the other hand, the FM output device 2 includes audio data converters 211 to 214, AM / FM
ここで、本実施例の装置は、例えば、外国人が乗車する観光バスに設置して使用される。この場合、案内を必要とする外国人は、自らが所持するFM受信機を用い、このFM受信機で必要とする言語に対応する周波数を受信することで、当該言語での案内を聞くことができる。また、必要に応じてFM受信機を貸与ないし販売することで、必要な言語での音声情報を聞くことができる。 Here, the apparatus of the present embodiment is used by being installed on a sightseeing bus on which a foreigner gets on, for example. In this case, a foreigner who needs guidance can listen to guidance in that language by using the FM receiver that he / she owns and receiving the frequency corresponding to the language required by this FM receiver. it can. Also, by lending or selling FM receivers as necessary, it is possible to listen to voice information in a necessary language.
図3(a)から(d)は、4つの異なる言語で案内を行う一例を示したもので、上から日本語、英語、中国語、韓国語による案内の例である。この案内では、地名に相当する「東京」の部分だけが共通であり、その他の部分は前記した各国の言語に対応した文章となっている。 FIGS. 3A to 3D show examples of guidance in four different languages, and are examples of guidance in Japanese, English, Chinese, and Korean from the top. In this guide, only the part of “Tokyo” corresponding to the place name is common, and the other part is a sentence corresponding to the language of each country described above.
また、この例では、「東京」を日本語の発音のままそれぞれ2回づつ発音する構成としている。このように連続して2回発音することで、1回だけの場合に比べて、聞き手が地名に対する認識を確実に行うことができる。つまり、1回目は聞き漏らした場合でも、同じ地名の発音が2回続くことから、その地名を確実に認識することができるようになる。また、3回繰り返す構成としても良いが、4回以上繰り返すとくどくなるので好ましくない。。 Further, in this example, “Tokyo” is pronounced twice each with Japanese pronunciation. In this way, the pronunciation is performed twice in succession, so that the listener can surely recognize the place name as compared with the case where the pronunciation is performed only once. That is, even if the first time is missed, the place name is pronounced twice, so that the place name can be reliably recognized. Moreover, although it is good also as a structure repeated 3 times, since it becomes difficult when it repeats 4 times or more, it is not preferable. .
1 データサーバ
2 FM出力装置
11 音声データ記憶部
12 地名情報置換部
13 地名情報置換部
DESCRIPTION OF SYMBOLS 1 Data server 2
Claims (8)
前記複数の音声データを読み出すと共に、読み出した複数の音声データに所定の言語による地名情報の音声データをそれぞれ合成して出力する音声合成部と、
前記合成された複数の音声データを音声出力する音声出力部とを有してなる、
ことを特徴とする音声出力装置。 A data storage unit storing a plurality of audio data in different languages;
A voice synthesis unit that reads out the plurality of voice data, and synthesizes and outputs voice data of place name information in a predetermined language to the plurality of read voice data;
An audio output unit that outputs the synthesized plurality of audio data as audio,
An audio output device characterized by that.
前記複数の音声データにおける地名情報をそれぞれ検出する地名情報検出部と、
前記検出した地名情報を所定の言語による音声データにそれぞれ置換する地名情報置換部と、
前記地名情報を置換した複数の音声データのうちの所定のものを多重に音声出力する音声出力部とを有してなる、
ことを特徴とする音声出力装置。 A data storage unit storing a plurality of audio data in different languages;
A place name information detecting unit for detecting place name information in each of the plurality of audio data;
A place name information replacement unit for replacing the detected place name information with audio data in a predetermined language;
An audio output unit that outputs a plurality of audio data obtained by replacing the place name information with a plurality of audio data.
An audio output device characterized by that.
8. The audio output device according to claim 7, wherein the wireless communication unit is an AM / FM digital communication device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006209838A JP2008039826A (en) | 2006-08-01 | 2006-08-01 | Voice guidance apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006209838A JP2008039826A (en) | 2006-08-01 | 2006-08-01 | Voice guidance apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008039826A true JP2008039826A (en) | 2008-02-21 |
Family
ID=39174954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006209838A Pending JP2008039826A (en) | 2006-08-01 | 2006-08-01 | Voice guidance apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008039826A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016084616A (en) * | 2014-10-24 | 2016-05-19 | 千蔵工業株式会社 | Automatic door system for toilet |
JP2021001541A (en) * | 2020-09-14 | 2021-01-07 | 千蔵工業株式会社 | Automatic door system for rest room, audio guidance device, and audio guidance method |
-
2006
- 2006-08-01 JP JP2006209838A patent/JP2008039826A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016084616A (en) * | 2014-10-24 | 2016-05-19 | 千蔵工業株式会社 | Automatic door system for toilet |
JP2021001541A (en) * | 2020-09-14 | 2021-01-07 | 千蔵工業株式会社 | Automatic door system for rest room, audio guidance device, and audio guidance method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10720145B2 (en) | Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system | |
AU2015297648B2 (en) | Terminal device, information providing system, information presentation method, and information providing method | |
US8719028B2 (en) | Information processing apparatus and text-to-speech method | |
AU2015297647B2 (en) | Information management system and information management method | |
JPWO2018051570A1 (en) | Voice presentation method, voice presentation program, voice presentation system, and terminal device | |
WO2014141413A1 (en) | Information processing device, output method, and program | |
CN105280206A (en) | Audio playing method and device | |
JP2008039826A (en) | Voice guidance apparatus | |
JP6596903B2 (en) | Information providing system and information providing method | |
CN101242440A (en) | A mobile phone with voice repeating function | |
JPH02196373A (en) | Voice transmission/reception device | |
KR100812770B1 (en) | Method and Apparatus for Providing Double-Speed Narration Voice-Signal by Using White Noise | |
KR100329589B1 (en) | Method and apparatus for playing back of digital audio by syllables | |
KR100807778B1 (en) | Supplementary apparatus to learning | |
JP6897132B2 (en) | Speech processing methods, audio processors and programs | |
JP2005241393A (en) | Language-setting method and language-setting device | |
JPH03214983A (en) | Teletext receiver | |
JP5097007B2 (en) | Audio processing apparatus and method | |
KR20040062317A (en) | Method for guiding additional information for audio data file | |
JP2008292762A (en) | Sound generation device and its control method, and program for sound generation device | |
JPH03214197A (en) | Voice synthesizer | |
JP5609541B2 (en) | Acoustic system | |
JPH05173586A (en) | Speech synthesizer | |
KR100538111B1 (en) | A Portable MP3 Changer | |
JPH0685704A (en) | Voice reception display device |