JP2005202884A - 送信装置、受信装置、中継装置、および送受信システム - Google Patents

送信装置、受信装置、中継装置、および送受信システム Download PDF

Info

Publication number
JP2005202884A
JP2005202884A JP2004011014A JP2004011014A JP2005202884A JP 2005202884 A JP2005202884 A JP 2005202884A JP 2004011014 A JP2004011014 A JP 2004011014A JP 2004011014 A JP2004011014 A JP 2004011014A JP 2005202884 A JP2005202884 A JP 2005202884A
Authority
JP
Japan
Prior art keywords
language
unit
text information
information
delimiter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004011014A
Other languages
English (en)
Other versions
JP2005202884A5 (ja
Inventor
Yuichiro Aso
裕一郎 麻生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004011014A priority Critical patent/JP2005202884A/ja
Priority to PCT/JP2005/000185 priority patent/WO2005069160A1/ja
Priority to US10/586,140 priority patent/US20080255824A1/en
Publication of JP2005202884A publication Critical patent/JP2005202884A/ja
Publication of JP2005202884A5 publication Critical patent/JP2005202884A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

【課題】ネットワークを介して翻訳を行う際に、ユーザの意図する翻訳結果を円滑に得ることが容易な送受信システムを提供する。
【解決手段】送受信システムが、音声認識部により得られた第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部を有する。区切り記号検出部により区切り記号が検出された場合には、第1の言語のテキスト情報を第2の言語のテキスト情報に翻訳する。この結果、より円滑にユーザの意図する翻訳結果を得ることが可能になる。
【選択図】図1

Description

本発明は、ネットワークを介して翻訳を行う送信装置、受信装置、中継装置、および送受信システムに関する。
音声入力を翻訳して音声出力する翻訳装置が用いられる。ここで、一定時間の無音区間の検出によって翻訳を行うことで、ユーザがボタンなどのマンマシンインターフェースを用いることなく円滑に翻訳結果を音声で得ることができる技術が開示されている(特許文献1参照)。
特公平2−7107号公報
しかしながら、上述の手法では、ユーザが翻訳開始のため意図的に無音を入力したのか、言いよどみや思考中で無音を入力したのか装置側で判断がつかず、ユーザの意図しないタイミングで翻訳が開始されてしまうことがあり得る。このような翻訳結果はユーザの意図しない結果となる。
また、ネットワークを介して翻訳を行えれば遠隔地間での異言語間対話が容易となる。
本発明は上記の事情を考慮してなされたもので、ネットワークを介して翻訳を行う際に、ユーザの意図する翻訳結果を円滑に得ることが容易な送信装置、受信装置、中継装置、および送受信システムを提供することを目的とする。
A.上記課題を達成するために、本発明に係る送信装置は、第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、前記音声認識部によって変換された前記第1の言語の前記テキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、前記区切り記号検出部により区切り記号が検出された場合に、前記音声認識部で変換された前記第1の言語の前記テキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、前記翻訳部によって翻訳された前記第2の言語のテキスト情報を送信する送信部と、を具備することを特徴とする。
送信装置が、音声認識部により得られた第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部を有する。区切り記号検出部により区切り記号が検出された場合には、第1の言語のテキスト情報を第2の言語のテキスト情報に翻訳する。よって、翻訳を開始させるのにボタンなどのマンマシンインターフェースを必要としないばかりではなく、不適切なタイミングで翻訳が開始されることもなくなる。したがって、より円滑にユーザの意図する翻訳結果を得ることが可能になる。
なお、「区切り記号」は、第1の言語に即して決めることができるが、例えば「。」、「.」、「?」、「!」などを例示することができる。これは以下でも同様である。
(1)ここで、前記音声認識部が、前記第1の言語の音声情報中の明示的な区切りを前記第1の言語の前記テキスト情報中の明示的な区切り記号に変換してもよい。
「明示的な区切り」とは、例えば「。」であれば、「まる」あるいは「くてん」などの音声であり、このような音声入力を区切り記号のテキスト情報に変換することができる。
(2)前記音声認識部が、前記第1の言語の音声情報中の黙示的な区切りを前記第1の言語の前記テキスト情報中の明示的な区切り記号に変換してもよい。
「黙示的な区切り」とは、例えば、文章の前後関係の解析等から区切りとして用いられると判断できる文章表現をいう。その言語としてそこに区切り記号が入るべきか否かを各様の言語解析を適用して判断し、この判断結果に基づき自動的に区切り記号を付加、挿入することができる。
B.本発明に係る受信装置は、A.に記載の送信装置から送信された前記第2の言語のテキスト情報を受信する受信部と、前記受信部で受信された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、を具備することを特徴とする。
送信装置から適切な翻訳結果を受信し音声情報に変換できる。
C.本発明に係る送受信システムは、第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、前記音声認識部で変換された前記第1の言語の前記テキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、前記区切り記号検出部により区切り記号が検出された場合に、前記音声認識部で変換された前記第1の言語の前記テキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、前記翻訳部によって翻訳された前記第2の言語のテキスト情報を送信する送信部と、前記送信部から送信された前記第2の言語のテキスト情報を受信する受信部と、前記受信部で受信された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、を具備することを特徴とする。
送受信システムが、音声認識部により得られた第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部を有する。その結果、ネットワークを介する翻訳処理の際に、より円滑にユーザの意図する翻訳結果を得ることが可能になる。
本発明によれば、ネットワークを介して翻訳を行う際に、ユーザの意図する翻訳結果を円滑に得ることが容易な送信装置、受信装置、中継装置、および送受信システムを提供することができる。
以下、本発明の実施形態を図面を参照しながら説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る送受信システム10の構成を示すブロック図である。
送受信システム10は送信装置11と受信装置12とがネットワーク15を介して接続されている。
送信装置11は、音声入力部21、音声認識部22、音声認識用辞書23、区切り記号検出部24、翻訳部25、翻訳用辞書26、入力部31、表示部32、送信部33を有する。
受信装置12は、音声合成部27、音声合成用辞書28、音声出力部29、入力部41、表示部42、受信部43を有する。
送信装置11および受信装置12はそれぞれマイクロプロセッサやメモリなどからなる、コンピュータなどの情報処理装置のハードウエアと、このハードウエア上で動作するOS(オペレーティングシステム)やアプリケーションプログラムなどのソフトウエアとから構成することができる。
ただし、コンピュータのような汎用の情報処理装置を用いることなく全体を構成することも可能であり、すなわち専用の音声入力翻訳装置としてもよい。なお、コンピュータには、パーソナルコンピュータやPDA(汎用の携帯端末)が含まれうる。
音声入力部21は、第1の言語(例えば、日本語)の入力音声を電気信号に変換するものであり、例えばマイクロフォンである。変換で得られた電気信号は音声認識部22に送られる。
音声認識部22は、入力音声に対応する電気信号を音声認識し、第1の言語のテキスト情報(日本語)に変換する一連の処理を行うものである。ここでテキスト情報に変換するのに適宜、音声認識用辞書23を用いる。音声認識部22で得られたテキスト情報は、区切り記号検出部24に逐次送られる。
音声認識用辞書23は、音声信号としての特徴量と各テキスト形式の情報とが対応付けられている一種のデータベースであり、コンピュータのメモリ上に構成することができる。
なお、音声認識部22は、入力された第1の言語を解析して、明示的または黙示的な区切りを第1の言語のテキスト情報に挿入する。この詳細は後述する。
区切り記号検出部24は、送られてきたテキスト情報に区切り記号があるか否かを検出するものである。ここで区切り記号は例えば「。」「?」「!」の3つとすることができる。区切り記号が検出された場合には、そこまでのテキスト情報を翻訳部25に送る。
翻訳部25は、送られてきた第1の言語のテキスト情報を第2の言語(例えば、英語)のテキスト情報に翻訳・変換する一連の処理を行うものである。ここで第2の言語のテキスト情報に変換するのに適宜、翻訳用辞書26を用いる。翻訳部25で得られた英語テキスト情報は、送信部33に送られる。
翻訳用辞書26は、第1の言語のテキストと第2の言語のテキストとの対応付けのデータなどが収められた一種のデータベースであり、コンピュータのメモリ上に構成することができる。
入力部31は、キーボード、マウス等の入力機器である。
表示部32は、LCD、CRT等の表示機器である。
送信部33は、翻訳部25で翻訳された第2の言語のテキスト情報をネットワーク15経由で受信装置12に送信する。
音声合成部27は、第2の言語のテキスト情報に基づき音声合成を行うものである。ここで音声合成するのに適宜、音声合成用辞書28が用いられる。音声合成部27で得られた第2の言語の音声信号は音声出力部29に送られる。
音声合成用辞書28は、第2の言語のテキスト形式の情報と第2の言語の音声信号データとが対応付けられている一種のデータベースであり、コンピュータのメモリ上に構成することができる。
音声出力部29は、送られてきた音声信号を音声に変換するものであり、例えばスピーカである。
入力部41は、キーボード、マウス等の入力機器である。
表示部42は、LCD、CRT等の表示機器である。
受信部43は、ネットワーク15経由で第2の言語のテキスト情報を送信装置11から受信する。
(送受信システム10の動作)
次に、上記説明した送受信システム10の動作を説明する。
図2は、図1に示した送受信システム10の動作手順を示す流れ図である。
まず、音声入力部21より第1の言語(例えば、日本語)の音声の入力を行う(ステップ11)。
音声認識部22は、第1の言語の音声信号をテキスト情報に逐次、変換する(ステップ12)。ここで、テキスト情報への変換において、ひとつの方法として、明示的な区切りを音声で入力してこれをテキストとしての区切り記号に変換する方法を採用することができる。たとえば、「。」であれば「まる」や「くてん」などと、「?」であれば「クエスチョンマーク」や「はてなマーク」などと、「!」であれば「エクスクラメーションマーク」や「びっくりマーク」などと音声で入力し、この音声信号をテキスト情報としての「。」「?」「!」に変換するものである。
または、テキスト情報への変換における別の方法として、音声をそのままテキストとした情報を解析することにより、テキスト情報としてそこに「。」のような区切り記号が挿入されるべきか否かを判断して自動的に挿入する方法を採用することもできる。この方法では、明示的に区切りを音声で入力する必要がないのでユーザにとっての使い勝手はさらに向上する。具体的には、文末に用いられる文末表現の後に音声の空白(無音性期間)があったときに区切り記号を挿入する。例えば、文末の「です」や「ます」の後に音声の空白があったときに、「です。」や「ます。」のように、「。」を挿入する。
なお、このようなテキスト解析を行うとソフトウエア処理の負担が大きくなるので、区切り記号のうち一部のみをこの方法にすることや、あるいはすべて音声入力にして処理負担を軽減してもよい。
上記のようにして区切り記号を含んでテキストに変換された情報は、区切り記号検出部24に送られる。
区切り記号検出部24では、送られたテキスト情報に区切り記号が存在するか否かを逐次、検出する(ステップS13)。
区切り記号が検出されない間はもう一度上記ステップ11に戻って上記の処理を行う。区切り記号が検出されたら、そこまでに送られてきている第1の言語のテキスト情報を翻訳部25に転送する。即ち、翻訳部25での翻訳は、区切り毎に区分された文章に基づいて行われる。
翻訳部25では、送られてきたテキスト情報を第2の言語のテキスト情報に翻訳・変換する(ステップS14)。
以上のような処理によって翻訳および表示までを行えば、ユーザは、装置に対するインターフェースとしてボタンやマウスの操作なしに音声(声)のみで、自動的に適切な区切りで音声の第1の言語を第2の言語のテキスト情報に変換することができる。
翻訳がされた第2の言語のテキスト情報は送信部33からネットワーク15に送信される(ステップS15)。
受信装置12の受信部43はネットワーク15から第2の言語のテキスト情報を受信する(ステップS16)。
音声合成部27では、受信部43で受信された第2の言語のテキスト情報を第2の言語の音声情報に変換する(ステップS17)。
また、音声情報に変換された第2の言語の音声情報は音声出力部29に送られ、第2の言語の音声出力を得ることができる。
以上説明のように、この実施形態によれば、文章終端の記号の検出により文末までの表現を考慮して自動的に翻訳が開始されるので、翻訳を開始させるのにボタンなどのマンマシンインターフェースを必要としないばかりではなく、不適切なタイミングで翻訳が開始されることもなくなる。したがって、より円滑にユーザの意図する翻訳結果(テキスト情報または音声)を得ることが可能になる。
図3〜5は、図1で説明した送信装置11、受信装置12としてコンピュータを利用した場合の表示画面の一例を示す図である。
図3は、送信装置11の表示画面50の一例を表す。
表示画面50には、編集ウィンドウ51、ログウィンドウ52、自動転送チェックボックス53、音声認識開始ボタン54、音声認識終了ボタン55、設定ボタン56、転送ボタン57が表されている。
編集ウィンドウ51は、音声認識部22で変換された第1の言語のテキスト情報が表される。ここには、翻訳前のテキストが示され、入力部31を用いて音声入力の誤りを訂正することもできる。
ログウィンドウ52には、翻訳前後のテキストが表され、かつ音声認識が開始されてから終了するまでのテキストが示される。
自動転送チェックボックス53は、自動転送を行う場合にチェック入力を行う領域である。図3では自動転送を行う状態となっている。
「自動転送」とは区切り記号が検出された場合に、翻訳、翻訳結果の転送が自動的に行われることをいう。即ち、「自動転送」では第1の言語のテキスト情報に区切りが含まれれば、その区切り毎に翻訳、転送が自動的に行われ、翻訳や転送をユーザが指示する必要がない。
自動転送チェックボックス53にチェックがされない場合は「手動転送」であり、転送ボタン57によって、翻訳、転送が行われる。
音声認識開始ボタン54、音声認識終了ボタン55はそれぞれ音声認識を開始、終了するためのボタンである。
設定ボタン56は、各種の設定を行うためのボタンである。
このボタンをマウスでクリックすると設定用ウィンドウが表れる。なお、設定用ウィンドウは後述する。
転送ボタン57は、「手動転送」の場合に、翻訳、転送を指示するためのボタンである。このボタンをクリックすると、編集ウィンドウ51に示されたテキストが翻訳、転送される。この場合、編集ウィンドウ51で入力内容を編集した後に翻訳、転送を行うことができ、音声入力、認識の誤りを訂正できる。
図4は、設定用ウィンドウ60の一例を表す図である。
この設定用ウィンドウ60には、確認ボタン61、転送元言語入力ボックス62、転送先言語入力ボックス63が示されている。
確認ボタン61は、転送元言語入力ボックス62、転送先言語入力ボックス63への入力内容を確認、設定するためのボタンである。
転送元言語入力ボックス62は、転送元言語(第1の言語)を表す情報を入力するための入力領域である。ここでは、第1の言語が日本語であることを表す「JP」が入力されている。
転送先言語入力ボックス63は、転送先言語(第2の言語)を表す情報を入力するための入力領域である。ここでは、第2の言語が英語であることを表す「US」が入力されている。
図5は、受信装置12の表示画面70の一例を表す。
表示画面70には、ログウィンドウ72が表されている。
このログウィンドウ72は、ログウィンドウ52に対応する。即ち、ここでは送信装置11から受信装置12に翻訳前後の第1、第2の言語のテキスト情報が送信される。
(第2の実施形態)
図6は、本発明の第2の実施形態に係る送受信システム10aの構成を示すブロック図である。
送受信システム10aは送信装置11aと受信装置12aとがネットワーク15を介して接続されている。
送信装置11aは、音声入力部21、音声認識部22、音声認識用辞書23、入力部31、表示部32、送信部33を有する。
受信装置12aは、区切り記号検出部24、翻訳部25、翻訳用辞書26、音声合成部27、音声合成用辞書28、音声出力部29、入力部41、表示部42、受信部43を有する。
図7は、図6に示した送受信システム10aの動作手順を示す流れ図である。
送受信システム10aは、送受信システム10と送信側、受信側の分担が異なっており、翻訳機能が受信側に配置されている。但し、送受信システム10aは、送受信システム10とシステム全体としての動作が本質的に異なる訳ではないので、詳細な説明を省略する。
図8〜10は、図6で説明した送信装置11a、受信装置12aとしてコンピュータを利用した場合の表示画面の一例を示す図である。
図8は、送信装置11aの表示画面50aを表す。
図9は、受信装置12aの表示画面70aを表す。
図10は、受信装置12aの設定ボタン76aをクリックしたときに表れる設定ウィンドウ806aを表す。
図8〜10に示すように、送信装置11a、受信装置12aの分担の関係で表示内容の一部が図3〜5と異なっている。
即ち、編集ウィンドウ51a、71aが送信装置11a、受信装置12aの双方に表れ、ログウィンドウ72a、設定ボタン76aは受信装置12aにのみ表れる。また、自動転送チェックボックス53a、自動翻訳チェックボックス73aがそれぞれ送信装置11a、受信装置12aに表れる。これらは翻訳機能が受信装置12a側に移行したことと対応する。
自動転送チェックボックス53aは、自動転送を行う場合にチェック入力を行う領域である。図8では自動転送を行う状態となっている。
但し、ここでは「自動転送」とは音声認識部22で変換された翻訳前のテキストの転送が自動的に行われることをいう。自動転送チェックボックス53aにチェックがされない場合は「手動転送」であり、転送ボタン57aによって、転送が行われ、転送に先立って編集ウィンドウ51aでの編集が可能である。
なお、区切り記号が検出される度に転送を行うことも可能である。
自動翻訳チェックボックス73aは、自動翻訳を行う場合にチェック入力を行う領域である。図9では自動翻訳を行う状態となっている。
「自動翻訳」とは区切り記号が検出された場合に、テキストの翻訳が自動的に行われることをいう。自動翻訳チェックボックス73aにチェックがされない場合は「手動翻訳」であり、翻訳ボタン77aによって、翻訳が行われる。
(第3の実施形態)
図11は、本発明の第3の実施形態に係る送受信システム10bの構成を示すブロック図である。
送受信システム10bは送信装置11bと受信装置12bとがネットワーク15を介して接続されている。
送信装置11bは、音声入力部21、入力部31、表示部32、送信部33を有する。
受信装置12bは、音声認識部22、音声認識用辞書23、区切り記号検出部24、翻訳部25、翻訳用辞書26、音声合成部27、音声合成用辞書28、音声出力部29、入力部41、表示部42、受信部43を有する。
図12は、図11に示した送受信システム10bの動作手順を示す流れ図である。
送受信システム10bは、送受信システム10、10aと送信側、受信側の分担が異なっており、受信側に音声認識部22が配置されている。但し、送受信システム10bは、送受信システム10、10aとシステム全体としての動作が本質的に異なる訳ではないので、詳細な説明を省略する。
図13〜15は、図11で説明した送信装置11b、受信装置12bとしてコンピュータを利用した場合の表示画面の一例を示す図である。
図13は、送信装置11bの表示画面50bを表す。
図14は、受信装置12bの表示画面70bを表す。
図15は、受信装置12bの設定ボタン76bをクリックしたときに表れる設定ウィンドウ80bを表す。
図8〜10に示すように、送信装置11b、受信装置12bの分担の関係で表示内容の一部が図3〜5、8〜10と異なっている。
即ち、送信装置11bの表示画面50bには、送信の開始、終了を指示する送信開始ボタン54b、送信終了ボタン55bのみが現れる。これは、受信装置12b側が事実上音声入力・送信機能のみを有していることと対応する。
(第4の実施形態)
図16は、本発明の第4の実施形態に係る送受信システム10cの構成を示すブロック図である。
送受信システム10cは送信装置11cと受信装置12cとがネットワーク15を介して接続されている。
送信装置11cは、音声入力部21、音声認識部22、音声認識用辞書23、区切り記号検出部24、翻訳部25、翻訳用辞書26、音声合成部27、音声合成用辞書28、入力部31、表示部32、送信部33を有する。
受信装置12cは、音声出力部29、入力部41、表示部42、受信部43を有する。
図17は、図16に示した送受信システム10cの動作手順を示す流れ図である。
送受信システム10cは、送受信システム10、10a、10bと送信側、受信側の分担が異なっている。但し、送受信システム10cは、送受信システム10、10a、10bとシステム全体としての動作が本質的に異なる訳ではないので、詳細な説明を省略する。
(第5の実施形態)
図18は、本発明の第5の実施形態に係る送受信システム10dの構成を示すブロック図である。
送受信システム10dは送信装置11d、中継装置13d、および受信装置12dがネットワーク16,17を介して接続されている。
送信装置11dは、音声入力部21、音声認識部22、音声認識用辞書23、入力部31、表示部32、送信部33を有する。
中継装置13dは、区切り記号検出部24、翻訳部25、翻訳用辞書26、入力部91、出力部92、受信部93、送信部94を有する。
受信装置12aは、音声合成部27、音声合成用辞書28、音声出力部29、入力部41、表示部42、受信部43を有する。
本実施形態では、中継装置13dが送受信システム10dの一部を構成し、翻訳を行っている。この中継装置13dは、マイクロプロセッサやメモリなどからなる、コンピュータなどの情報処理装置のハードウエアと、このハードウエア上で動作するOS(オペレーティングシステム)やアプリケーションプログラムなどのソフトウエアとから構成することができる。ただし、コンピュータのような汎用の情報処理装置を用いることなく全体を構成することも可能であり、専用の翻訳装置としてもよい。
図19は、図18に示した送受信システム10dの動作手順を示す流れ図である。
(第6の実施形態)
図20は、本発明の第6の実施形態に係る送受信システム10eの構成を示すブロック図である。
送受信システム10eは送信装置11e、中継装置13e、および受信装置12eがネットワーク16,17を介して接続されている。
送信装置11eは、音声入力部21、入力部31、表示部32、送信部33を有する。
中継装置13eは、音声認識部22、音声認識用辞書23、区切り記号検出部24、翻訳部25、翻訳用辞書26、音声合成部27、音声合成用辞書28、入力部91、出力部92、受信部93、送信部94を有する。
受信装置12eは、音声出力部29、入力部41、表示部42、受信部43を有する。
本実施形態では、送信装置11e及び受信装置12eは簡易な構成となり、送信装置11eまたは受信装置12eに一般の携帯電話機などを適用することができる。
図21は、図20に示した送受信システム10eの動作手順を示す流れ図である。
(その他の実施形態)
本発明の実施形態は上記の実施形態に限られず拡張、変更可能であり、拡張、変更した実施形態も本発明の技術的範囲に含まれる。
上記実施形態では、送受信は送信装置から受信装置への一方向に行われているが、これら送信装置、受信装置を送信、受信のいずれをも行える送受信装置とすることができる。このようにすると、双方向の通信が行え、例えば、電話システムを実現することが可能である。この場合、送受信装置の設定はいずれも図3のような同一の画面表示とすることが可能となる。
本発明の第1の実施形態に係る送受信システムの構成を示すブロック図である。 図1に示した送受信システムの動作手順を示す流れ図である。 図1に示した送信装置の表示画面の一例を表す図である。 設定用ウィンドウの一例を示す図である。 図1に示した受信装置の表示画面の一例を表す図である。 本発明の第2の実施形態に係る送受信システムの構成を示すブロック図である。 図6に示した送受信システムの動作手順を示す流れ図である。 図6に示した送信装置の表示画面の一例を表す図である。 図6に示した受信装置の表示画面の一例を表す図である。 設定用ウィンドウの一例を示す図である。 本発明の第3の実施形態に係る送受信システムの構成を示すブロック図である。 図11に示した送受信システムの動作手順を示す流れ図である。 図11に示した送信装置の表示画面の一例を表す図である。 図11に示した受信装置の表示画面の一例を表す図である。 設定用ウィンドウの一例を示す図である。 本発明の第4の実施形態に係る送受信システムの構成を示すブロック図である。 図16に示した送受信システムの動作手順を示す流れ図である。 本発明の第54の実施形態に係る送受信システムの構成を示すブロック図である。 図18に示した送受信システムの動作手順を示す流れ図である。 本発明の第54の実施形態に係る送受信システムの構成を示すブロック図である。 図20に示した送受信システムの動作手順を示す流れ図である。
符号の説明
10…送受信システム、11…送信装置、12…受信装置、15…ネットワーク、21…音声入力部、22…音声認識部、23…音声認識用辞書、23…送信部、24…区切り記号検出部、25…翻訳部、26…翻訳用辞書、27…音声合成部、28…音声合成用辞書、29…音声出力部、31…入力部、32…表示部、33…送信部、41…入力部、42…表示部、43…受信部

Claims (18)

  1. 第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記音声認識部によって変換された前記第1の言語の前記テキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記音声認識部で変換された前記第1の言語の前記テキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部によって翻訳された前記第2の言語のテキスト情報を送信する送信部と、
    を具備することを特徴とする送信装置。
  2. 前記音声認識部が、前記第1の言語の音声情報中の明示的な区切りを前記第1の言語の前記テキスト情報中の明示的な区切り記号に変換することを特徴とする請求項1記載の送信装置。
  3. 前記音声認識部が、前記第1の言語の音声情報中の黙示的な区切りを前記第1の言語の前記テキスト情報中の明示的な区切り記号に変換することを特徴とする請求項1記載の送信装置。
  4. 請求項1記載の送信装置から送信された前記第2の言語のテキスト情報を受信する受信部と、
    前記受信部で受信された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    を具備することを特徴とする受信装置。
  5. 第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記音声認識部で変換された前記第1の言語の前記テキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記音声認識部で変換された前記第1の言語の前記テキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部によって翻訳された前記第2の言語のテキスト情報を送信する送信部と、
    前記送信部から送信された前記第2の言語のテキスト情報を受信する受信部と、
    前記受信部で受信された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    を具備することを特徴とする送受信システム。
  6. 第1の言語のテキスト情報を受信する受信部と、
    前記受信部で受信された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    を具備することを特徴とする受信装置。
  7. 第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記音声認識部で変換された前記第1の言語の前記テキスト情報を送信する送信部と、
    第1の言語のテキスト情報を受信する受信部と、
    前記受信部で受信された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    を具備することを特徴とする送受信システム。
  8. 第1の言語の音声情報を受信する受信部と、
    前記受信部で受信された前記第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記音声認識部で変換された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    を具備することを特徴とする受信装置。
  9. 第1の言語の音声情報を入力する音声入力部と、
    前記音声入力部で入力された前記第1の言語の音声情報を送信する送信部と、
    前記送信部で送信された前記第1の言語の音声情報を受信する受信部と、
    前記受信部で受信された第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記音声認識部で変換された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    を具備することを特徴とする送受信システム。
  10. 第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記音声認識部で変換された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    前記音声合成部で変換された第2の言語の音声情報を送信する送信部と、
    を具備することを特徴とする送信装置。
  11. 請求項10記載の送信装置から送信された前記第2の言語の音声情報を受信する受信部と、
    前記受信部で受信された前記第2の言語の音声情報を出力する音声出力部と、
    を具備することを特徴とする受信装置。
  12. 第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記音声認識部で変換された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    前記音声合成部で変換された第2の言語の音声情報を送信する送信部と、
    前記送信装置から送信された前記第2の言語の音声情報を受信する受信部と、
    前記受信部で受信された前記第2の言語の音声情報を出力する音声出力部と、
    を具備することを特徴とする送受信システム。
  13. 第1の言語のテキスト情報を受信する受信部と、
    前記受信部で受信された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の言語の前記テキスト情報を送信する送信部と、
    を具備することを特徴とする中継装置。
  14. 前記請求項13記載の中継装置から送信された前記第2の言語の前記テキスト情報を受信する受信部と、
    前記受信部で受信された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    を具備することを特徴とする受信装置。
  15. 第1の言語の音声情報を入力する音声入力部と、
    前記音声入力部で入力された前記第1の言語の音声情報を送信する第1の送信部と、
    前記第1の送信部で送信された前記第1の言語の音声情報を受信する第1の受信部と、
    前記第1の受信部で受信された第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記音声認識部で変換された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の第2の言語のテキスト情報を送信する第2の送信部と、
    前記第2の送信部から送信された前記第2の言語のテキスト情報を受信する第2の受信部と、
    前記第2の受信部で受信された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    を具備することを特徴とする送受信システム。
  16. 第1の言語の音声情報を受信する受信部と、
    前記受信部で受信された第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記受信部で受信された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の言語の前記テキスト情報を音声情報に変換する音声合成部と、
    前記音声合成部で変換された前記第2の言語の前記音声情報を送信する送信部と、
    を具備することを特徴とする中継装置。
  17. 前記請求項16記載の中継装置から送信された前記第2の言語の前記音声情報を受信する受信部と、
    前記受信部で受信された前記第2の言語の前記音声情報を出力する音声出力部と、
    を具備することを特徴とする受信装置。
  18. 第1の言語の音声情報を入力する音声入力部と、
    前記音声入力部で入力された前記第1の言語の音声情報を送信する第1の送信部と、
    前記第1の送信部で送信された前記第1の言語の音声情報を受信する第1の受信部と、
    前記第1の受信部で受信された第1の言語の音声情報を前記第1の言語のテキスト情報に変換する音声認識部と、
    前記音声認識部で変換された前記第1の言語のテキスト情報に所定の区切り記号があるか否かを検出する区切り記号検出部と、
    前記区切り記号検出部により区切り記号が検出された場合に、前記第1の言語のテキスト情報を前記第1の言語とは異なる第2の言語のテキスト情報に翻訳する翻訳部と、
    前記翻訳部で翻訳された前記第2の言語のテキスト情報を音声情報に変換する音声合成部と、
    前記音声合成部で変換された前記第2の言語のテキスト情報を送信する第2の送信部と、
    前記第2の送信部から送信された前記第2の言語の前記音声情報を受信する第2の受信部と、
    前記第2の受信部で受信された前記第2の言語の前記音声情報を出力する音声出力部と、
    を具備することを特徴とする送受信システム。
JP2004011014A 2004-01-19 2004-01-19 送信装置、受信装置、中継装置、および送受信システム Pending JP2005202884A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004011014A JP2005202884A (ja) 2004-01-19 2004-01-19 送信装置、受信装置、中継装置、および送受信システム
PCT/JP2005/000185 WO2005069160A1 (ja) 2004-01-19 2005-01-11 翻訳装置
US10/586,140 US20080255824A1 (en) 2004-01-19 2005-01-11 Translation Apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004011014A JP2005202884A (ja) 2004-01-19 2004-01-19 送信装置、受信装置、中継装置、および送受信システム

Publications (2)

Publication Number Publication Date
JP2005202884A true JP2005202884A (ja) 2005-07-28
JP2005202884A5 JP2005202884A5 (ja) 2006-06-01

Family

ID=34792318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004011014A Pending JP2005202884A (ja) 2004-01-19 2004-01-19 送信装置、受信装置、中継装置、および送受信システム

Country Status (3)

Country Link
US (1) US20080255824A1 (ja)
JP (1) JP2005202884A (ja)
WO (1) WO2005069160A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011022813A (ja) * 2009-07-16 2011-02-03 National Institute Of Information & Communication Technology 音声翻訳システム、辞書サーバ装置、およびプログラム
KR20120086287A (ko) * 2009-10-02 2012-08-02 독립행정법인정보통신연구기구 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치
KR20120107933A (ko) * 2009-10-21 2012-10-04 독립행정법인정보통신연구기구 음성번역 시스템, 제어장치, 및 제어방법
JP6243071B1 (ja) * 2017-04-03 2017-12-06 旋造 田代 通信内容翻訳処理方法、通信内容翻訳処理プログラム、及び、記録媒体

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7653531B2 (en) * 2005-08-25 2010-01-26 Multiling Corporation Translation quality quantifying apparatus and method
US20080003551A1 (en) * 2006-05-16 2008-01-03 University Of Southern California Teaching Language Through Interactive Translation
US8706471B2 (en) * 2006-05-18 2014-04-22 University Of Southern California Communication system using mixed translating while in multilingual communication
US8032355B2 (en) * 2006-05-22 2011-10-04 University Of Southern California Socially cognizant translation by detecting and transforming elements of politeness and respect
US8032356B2 (en) * 2006-05-25 2011-10-04 University Of Southern California Spoken translation system using meta information strings
KR20150145109A (ko) * 2014-06-18 2015-12-29 삼성전자주식회사 자동 번역을 위한 장치 및 방법
EP3542360A4 (en) * 2016-11-21 2020-04-29 Microsoft Technology Licensing, LLC METHOD AND DEVICE FOR AUTOMATIC SYNCHRONIZATION
CN107679033B (zh) * 2017-09-11 2021-12-14 百度在线网络技术(北京)有限公司 文本断句位置识别方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2758851B2 (ja) * 1995-03-28 1998-05-28 株式会社エイ・ティ・アール音声翻訳通信研究所 自動翻訳装置及び自動通訳装置
JP2002512717A (ja) * 1997-06-09 2002-04-23 ロゴヴィスタ株式会社 自動翻訳および再翻訳システム
US6463404B1 (en) * 1997-08-08 2002-10-08 British Telecommunications Public Limited Company Translation
CN1159662C (zh) * 1998-05-13 2004-07-28 国际商业机器公司 连续语音识别中的标点符号自动生成装置及方法
US6816468B1 (en) * 1999-12-16 2004-11-09 Nortel Networks Limited Captioning for tele-conferences
US20020091509A1 (en) * 2001-01-02 2002-07-11 Yacov Zoarez Method and system for translating text
US6785647B2 (en) * 2001-04-20 2004-08-31 William R. Hutchison Speech recognition system with network accessible speech processing resources

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011022813A (ja) * 2009-07-16 2011-02-03 National Institute Of Information & Communication Technology 音声翻訳システム、辞書サーバ装置、およびプログラム
KR20120040190A (ko) * 2009-07-16 2012-04-26 독립행정법인정보통신연구기구 음성번역시스템, 사전서버장치, 및 프로그램
KR101626887B1 (ko) * 2009-07-16 2016-06-13 코쿠리츠켄큐카이하츠호진 죠호츠신켄큐키코 음성번역시스템, 사전서버장치, 및 프로그램
US9442920B2 (en) 2009-07-16 2016-09-13 National Institute Of Information And Communications Technology Speech translation system, dictionary server, and program
KR20120086287A (ko) * 2009-10-02 2012-08-02 독립행정법인정보통신연구기구 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치
KR101683943B1 (ko) * 2009-10-02 2016-12-07 코쿠리츠켄큐카이하츠호진 죠호츠신켄큐키코 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치
KR20120107933A (ko) * 2009-10-21 2012-10-04 독립행정법인정보통신연구기구 음성번역 시스템, 제어장치, 및 제어방법
KR101683944B1 (ko) * 2009-10-21 2016-12-20 코쿠리츠켄큐카이하츠호진 죠호츠신켄큐키코 음성번역 시스템, 제어장치, 및 제어방법
JP6243071B1 (ja) * 2017-04-03 2017-12-06 旋造 田代 通信内容翻訳処理方法、通信内容翻訳処理プログラム、及び、記録媒体
JP2018180590A (ja) * 2017-04-03 2018-11-15 旋造 田代 通信内容翻訳処理方法、通信内容翻訳処理プログラム、及び、記録媒体

Also Published As

Publication number Publication date
WO2005069160A1 (ja) 2005-07-28
US20080255824A1 (en) 2008-10-16

Similar Documents

Publication Publication Date Title
US20080255824A1 (en) Translation Apparatus
JP4481972B2 (ja) 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
EP2770445A2 (en) Method and system for supporting a translation-based communication service and terminal supporting the service
US7848926B2 (en) System, method, and program for correcting misrecognized spoken words by selecting appropriate correction word from one or more competitive words
RU2352979C2 (ru) Синхронное понимание семантических объектов для высокоинтерактивного интерфейса
JP4902617B2 (ja) 音声認識システム、音声認識方法、音声認識クライアントおよびプログラム
JP4960596B2 (ja) 音声認識の方法およびシステム
US20090204392A1 (en) Communication terminal having speech recognition function, update support device for speech recognition dictionary thereof, and update method
JP2002528804A (ja) サービスアプリケーションに対するユーザインタフェースの音声制御
KR20120086287A (ko) 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치
WO2003079328A1 (fr) Appareil, procede et programme de conversion audio video
KR20060050966A (ko) 음성 인식에 있어서 동사 에러 복원
JP2005310129A (ja) 端末機のメッセージ表示方法
US8798985B2 (en) Interpretation terminals and method for interpretation through communication between interpretation terminals
KR20050045817A (ko) 순차 멀티모달 입력
KR20140058127A (ko) 음성인식장치 및 음성인식방법
EP1899955B1 (en) Speech dialog method and system
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP2009122989A (ja) 翻訳装置
CN111524508A (zh) 语音对话***以及语音对话实现方法
JP2003029779A (ja) 自動通訳システム及びその方法並びにプログラム
US20020077814A1 (en) Voice recognition system method and apparatus
JP2005149042A (ja) 音声入力翻訳装置、翻訳プログラム
KR102496398B1 (ko) 사용자 디바이스에 페어링되어 음성-텍스트를 변환하는 장치 및 그 방법
JP7152454B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060412

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070529