JPH0916602A - 翻訳装置および翻訳方法 - Google Patents

翻訳装置および翻訳方法

Info

Publication number
JPH0916602A
JPH0916602A JP7160345A JP16034595A JPH0916602A JP H0916602 A JPH0916602 A JP H0916602A JP 7160345 A JP7160345 A JP 7160345A JP 16034595 A JP16034595 A JP 16034595A JP H0916602 A JPH0916602 A JP H0916602A
Authority
JP
Japan
Prior art keywords
sentence
language
voice
output
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7160345A
Other languages
English (en)
Inventor
Miyuki Tanaka
幸 田中
Hiroaki Ogawa
浩明 小川
Yasuhiko Kato
靖彦 加藤
Tetsuya Kagami
徹也 加賀美
Masao Watari
雅男 渡
Makoto Akaha
誠 赤羽
Kazuo Ishii
和夫 石井
Koji Asano
康治 浅野
Hiroshi Tsunoda
弘史 角田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7160345A priority Critical patent/JPH0916602A/ja
Priority to KR1019960023744A priority patent/KR970002705A/ko
Priority to US08/670,291 priority patent/US5963892A/en
Priority to EP96110405A priority patent/EP0751467A3/en
Priority to CN96110450A priority patent/CN1098500C/zh
Publication of JPH0916602A publication Critical patent/JPH0916602A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 入力が容易で、誤りのない翻訳文を得ること
ができるようにする。 【構成】 マイク1に日本語の単語音声が入力される
と、音声認識部2において音声認識され、その音声を構
成する1以上の単語が、システム制御部4に出力され
る。システム制御部4では、第1言語文記憶部5に記憶
されている日本語による文章のうち、音声認識部2から
出力された1以上の単語の組み合わせと最も類似するも
のが検索され、出力部7において出力される。そして、
その日本語文が正しい場合、ユーザによってコントロー
ルキー群3が操作される。すると、システム制御部4
は、第2言語文記憶部6に記憶されている英語による文
章のうち、検索結果として出力された日本語による文章
の翻訳文に対応するものを検索し、出力部7に出力させ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、翻訳装置および翻訳方
法に関する。特に、所定の言語で入力された音声を音声
認識し、その音声を構成する1以上の単語の組み合わせ
と類似する、所定の言語による文章を出力し、その後、
その文章の翻訳文を出力するようにすることにより、入
力が容易で、誤りのない翻訳文を得ることができるよう
にした翻訳装置および翻訳方法に関する。
【0002】
【従来の技術】近年、様々な分野における文書の自動翻
訳装置の開発が行われている。この種の装置では、所定
の言語の文章構造を解析し、その解析結果にしたがっ
て、目的とする他の言語の文章を作成するようになされ
ている。しかしながら、このような方式では、その演算
処理量が大きくなることは避けられず、また、所定の言
語による文章を、すべてを入力する必要があるため、文
章が長い場合には、入力そのものが、ユーザの負担とな
ることがあった。また、翻訳が正確に行われるという保
証は必ずしもなく、さらに、ユーザは、他の言語に堪能
でないがために翻訳装置を利用するのが一般的であり、
そのようなユーザは、正確に翻訳がなされているかどう
かを確認することが困難な問題もあった。また、このよ
うな装置は、一般的に大型で、携帯には不便であった。
【0003】一方、携帯に便利なように小型で、かつ簡
易的な翻訳装置(以下、適宜、携帯型翻訳装置という)
も開発されている。携帯型翻訳装置では、例えばキーボ
ードなどから所定の言語による単語を構成する文字列を
入力すると、その入力単語に対応する、目的とする他の
言語による訳語を出力するようになされている。即ち、
このような携帯型翻訳装置は、所定の言語の単語と、他
の言語の単語とを1対1に対応付けた辞書を有してお
り、例えば日本語から英語へ翻訳が行われる場合には、
例えば単語「辞書」(または、「じしょ」や「ジショ」
など)が入力されると、これに対応する訳語「dictiona
ry」が辞書から検索されて出力される。
【0004】携帯型翻訳装置では、所定の言語の単語
と、他の言語の単語とがあらかじめ対応付けられている
ため、誤訳がなされることはほとんどなく、また、入力
も単語だけで良いので容易である。しかしながら、翻訳
結果として得られるのは単語であるため、翻訳結果とし
て文章を得たい場合には不便であった。
【0005】そこで、例えば特開昭62−229473
号公報には、所定の言語で入力された単語音声を音声認
識し、その結果得られる単語の組み合わせに対応した、
他の言語による文章を出力する翻訳装置が開示されてい
る。この翻訳装置によれば、入力は、音声で、しかも単
語で良いので、ユーザに負担をかけることはなく、ま
た、翻訳結果も文章で得られるので、外国語に堪能でな
いユーザでも、例えば海外旅行などにおいて、外国人と
のコミニュケーションを容易に図ることができる。
【0006】
【発明が解決しようとする課題】ところで、このような
翻訳装置では、単語音声が入力されるたびに、その音声
認識結果が、その入力された音声の言語で出力されるよ
うになされており、ユーザは、その出力が正しいかどう
かを確認するようになされている。そして、入力された
単語の音声認識結果がすべて正しいと確認された後、そ
の翻訳が行われるようになされている。このため、翻訳
結果として得られる文章が正しいかどうかが不明であっ
た。
【0007】即ち、入力された単語の音声認識結果がす
べて正しい場合であっても、それらの組み合わせに対応
した翻訳結果が正しいとは限らず、従って、翻訳結果の
言語に堪能でないユーザは、やはり、その翻訳結果が正
しいかどうかが分からなかった。
【0008】本発明は、このような状況に鑑みてなされ
たものであり、入力が容易で、誤りのない翻訳文を得る
ことができるようにするものである。
【0009】
【課題を解決するための手段】本発明の翻訳装置は、音
声を音声認識し、その音声を構成する1以上の単語を出
力する音声認識手段と、所定の言語による文章を記憶し
ている第1の文章記憶手段と、他の言語による文章を記
憶している第2の文章記憶手段と、第1の文章記憶手段
に記憶されている所定の言語による文章のうち、音声認
識手段より出力される1以上の単語の組み合わせと類似
するものを検索する第1の検索手段と、第2の文章記憶
手段に記憶されている他の言語による文章のうち、第1
の検索手段により検索された所定の言語による文章の翻
訳文に対応するものを検索する第2の検索手段と、第1
および第2の検索手段の検索結果を出力する出力手段と
を備えることを特徴とする。
【0010】この翻訳装置においては、第1の文章記憶
手段に記憶されている所定の言語による文章と、第2の
文章記憶手段に記憶されている他の言語による文章と
を、1対1に対応させることができ、この場合、第2の
検索手段には、第2の文章記憶手段に記憶されている他
の言語による文章のうち、第1の検索手段により検索さ
れた所定の言語による文章と対応しているものを検索さ
せることができる。また、この翻訳装置は、所定の入力
を行うときに操作される操作手段をさらに備えることが
でき、この場合、第2の検索手段には、操作手段が操作
されることにより所定の入力があったとき、第2の文章
記憶手段に記憶されている他の言語による文章のうち、
第1の検索手段により検索された所定の言語による文章
の翻訳文に対応するものを検索させることができる。
【0011】本発明の翻訳方法は、所定の言語による文
章を記憶している第1の文章記憶手段と、他の言語によ
る文章を記憶している第2の文章記憶手段とを備え、所
定の言語で入力された音声を、他の言語に翻訳する翻訳
装置の翻訳方法であって、音声を音声認識し、その音声
を構成する1以上の単語を出力し、第1の文章記憶手段
に記憶されている所定の言語による文章のうち、音声認
識結果として出力された1以上の単語の組み合わせと類
似するものを検索して出力し、所定の入力があったと
き、第2の文章記憶手段に記憶されている他の言語によ
る文章のうち、検索結果として出力された所定の言語に
よる文章の翻訳文に対応するものを検索して出力するこ
とを特徴とする。
【0012】
【作用】本発明の翻訳装置においては、音声認識手段
は、音声を音声認識し、その音声を構成する1以上の単
語を出力するようになされている。第1の文章記憶手段
は、所定の言語による文章を記憶しており、第2の文章
記憶手段は、他の言語による文章を記憶している。第1
の検索手段は、第1の文章記憶手段に記憶されている所
定の言語による文章のうち、音声認識手段より出力され
る1以上の単語の組み合わせと類似するものを検索し、
第2の検索手段は、第2の文章記憶手段に記憶されてい
る他の言語による文章のうち、第1の検索手段により検
索された所定の言語による文章の翻訳文に対応するもの
を検索するようになされている。出力手段は、第1およ
び第2の検索手段の検索結果を出力するようになされて
いる。
【0013】本発明の翻訳方法においては、音声を音声
認識し、その音声を構成する1以上の単語を出力し、第
1の文章記憶手段に記憶されている所定の言語による文
章のうち、音声認識結果として出力された1以上の単語
の組み合わせと類似するものを検索して出力するように
なされている。そして、所定の入力があったとき、第2
の文章記憶手段に記憶されている他の言語による文章の
うち、検索結果として出力された所定の言語による文章
の翻訳文に対応するものを検索して出力するようになさ
れている。
【0014】
【実施例】以下に、本発明の実施例を説明するが、その
前に、特許請求の範囲に記載の発明の各手段と以下の実
施例との対応関係を明らかにするために、各手段の後の
括弧内に、対応する実施例(但し、一例)を付加して、
本発明の特徴を記述すると、次のようになる。
【0015】即ち、請求項1に記載の翻訳装置は、所定
の言語で入力された音声を、他の言語に翻訳する翻訳装
置であって、音声を音声認識し、その音声を構成する1
以上の単語を出力する音声認識手段(例えば、図1に示
す音声認識部2など)と、所定の言語による文章を記憶
している第1の文章記憶手段(例えば、図1に示す第1
言語文記憶部5など)と、他の言語による文章を記憶し
ている第2の文章記憶手段(例えば、図1に示す第2言
語文記憶部6など)と、第1の文章記憶手段に記憶され
ている所定の言語による文章のうち、音声認識手段より
出力される1以上の単語の組み合わせと類似するものを
検索する第1の検索手段(例えば、図3に示すプログラ
ムの処理ステップS3など)と、第2の文章記憶手段に
記憶されている他の言語による文章のうち、第1の検索
手段により検索された所定の言語による文章の翻訳文に
対応するものを検索する第2の検索手段(例えば、図3
に示すプログラムの処理ステップS6など)と、第1お
よび第2の検索手段の検索結果を出力する出力手段(例
えば、図1に示す出力部7など)とを備えることを特徴
とする。
【0016】請求項3に記載の翻訳装置は、所定の入力
を行うときに操作される操作手段(例えば、図1に示す
コントロールキー群3など)をさらに備え、第2の検索
手段は、操作手段が操作されることにより所定の入力が
あったとき、第2の文章記憶手段に記憶されている他の
言語による文章のうち、第1の検索手段により検索され
た所定の言語による文章の翻訳文に対応するものを検索
することを特徴とする。
【0017】請求項4に記載の翻訳方法は、所定の言語
による文章を記憶している第1の文章記憶手段(例え
ば、図1に示す第1言語文記憶部5など)と、他の言語
による文章を記憶している第2の文章記憶手段(例え
ば、図1に示す第2言語文記憶部6など)とを備え、所
定の言語で入力された音声を、他の言語に翻訳する翻訳
装置の翻訳方法であって、音声を音声認識し、その音声
を構成する1以上の単語を出力し、第1の文章記憶手段
に記憶されている所定の言語による文章のうち、音声認
識結果として出力された1以上の単語の組み合わせと類
似するものを検索して出力し、所定の入力があったと
き、第2の文章記憶手段に記憶されている他の言語によ
る文章のうち、検索結果として出力された所定の言語に
よる文章の翻訳文に対応するものを検索して出力するこ
とを特徴とする。
【0018】なお、勿論この記載は、各手段を上記した
ものに限定することを意味するものではない。
【0019】図1は、本発明を適用した翻訳装置(音声
翻訳装置)の一実施例の構成を示している。この翻訳装
置は、例えば日本語などで入力された音声を、英語など
に翻訳するようになされている。
【0020】即ち、マイク1は、そこに入力された音声
を、電気信号としての音声信号に変換して、音声認識部
2に出力するようになされている。音声認識部2は、マ
イク1に入力された音声を単語認識するようになされて
いる。即ち、音声認識部2は、例えば図2に示すよう
に、A/D変換器12、音響分析部13、認識処理部1
4、および大規模単語辞書15で構成されている。
【0021】A/D変換器12は、マイク1から出力さ
れるアナログの音声信号を、所定のクロックのタイミン
グでサンプリングして量子化し、ディジタルの音声信号
(ディジタルデータ)に変換するようになされている。
音響分析部13は、A/D変換器12より出力される音
声信号を音響分析し、これにより、例えば所定の帯域ご
との音声のパワーや、線形予測係数(LPC)、ケプス
トラム係数などの音声の特徴パラメータを抽出するよう
になされている。即ち、音響分析部13は、例えばフィ
ルタバンクにより、音声信号を所定の帯域ごとにフィル
タリングし、そのフィルタリング結果を整流平滑化する
ことで、所定の帯域ごとの音声のパワーを求めるように
なされている。あるいは、音響分析部13は、入力され
た音声に対し、例えば線形予測分析処理を施すことで、
線形予測係数を求め、またその線形予測係数からケプス
トラム係数を求めるようになされている。
【0022】音響分析部3で求められた特徴パラメータ
は、そのまま、あるいは、そこで必要に応じてベクトル
量子化されて、認識処理部14に出力されるようになさ
れている。
【0023】認識部処理14は、音響分析部13からの
特徴パラメータ(あるいは、特徴パラメータをベクトル
量子化して得られるシンボル)に基づき、例えばダイナ
ミックプログラミング(DP)マッチング法や、隠れマ
ルコフモデル(HMM)などの音声認識アルゴリズムに
したがい、後述する大規模単語辞書15を参照して、例
えば音声認識を行い、マイク1に入力された音声に含ま
れる1以上の単語を、音声認識結果として出力するよう
になされている。
【0024】大規模単語辞書15には、音声認識の対象
とする単語(従って、本実施例では、日本語の単語)の
標準パターン(あるいはモデルなど)が記憶されてい
る。認識処理部14では、この大規模単語辞書15に記
憶されている単語を対象として、音声認識が行われるよ
うになされている。
【0025】コントロールキー群3は、種々のキーから
構成され、システム制御部4に対し、所定の入力を与え
るときに操作される。即ち、コントロールキー群3は、
後述する出力部7から出力された文章が正しいか、また
は誤っているかをシステム制御部4に認識させるための
確認/変換キー、再検索/不変換キー、出力部7の出力
状態(表示状態)をクリアするためのクリアキーなどで
構成されている。
【0026】システム制御部4は、装置を構成する各ブ
ロックを制御する他、後述する第1言語文記憶部5また
は第2言語文記憶部6に記憶されている文章の検索処
理、出力部7への文章の出力処理などを行うようになさ
れている。
【0027】第1言語文記憶部5は、マイク1に入力さ
れる音声の言語による文章、即ち、本実施例においては
日本語の文章を数多く記憶している。第2言語文記憶部
6は、第1言語文記憶部5に記憶されている日本語の文
章を、目的とする言語に翻訳した文章、即ち、本実施例
においては、英語の文章を記憶している。従って、第1
言語文記憶部5に記憶されている日本語の文章と、第2
言語文記憶部6に記憶されている英語の文章とは、1対
1に対応している。なお、例えば、第1言語文記憶部5
には、日本語の文章とともに、その文章に対応する英語
の文章が記憶されている第2言語文記憶部6のアドレス
が記憶されており、これにより、第1言語文記憶部5に
記憶されている日本語の文章に対応する英語の文章は、
第2言語文記憶部6から即座に検索することができるよ
うになされている。
【0028】出力部7は、例えば音声合成装置およびス
ピーカや、モニタなどでなり、システム制御部4の制御
にしたがい、第1言語文記憶部5に記憶された日本語の
文章、および第2言語文記憶部6に記憶された英語の文
章を出力する(合成音で出力し、あるいは表示する)よ
うになされている。
【0029】次に、図3のフローチャートを参照して、
その動作について説明する。この音声認識装置において
は、英訳したい日本語の文章を、音声により、例えば自
立語などの単語の羅列で入力すると、その単語の羅列が
音声認識された後、日本語のまま文章化されるようにな
されている。そして、この日本語の文章が、一旦、ユー
ザに提示され、それが正しいことが確認されると、その
日本語の文章が英訳されるようになされている。
【0030】即ち、まず最初に、ステップS1におい
て、マイク1に対し、音声の入力があると、その音声
は、電気信号としての音声信号に変換され、音声認識部
2に出力される。ここで、音声の入力は、上述したよう
に、文章ではなく、単語の羅列でよい。即ち、例えば
「あなたの好きなレストランを教えて下さい」などとい
うような文章の英訳を得たい場合には、単語列「あな
た、好き、レストラン、教える」などを入力すれば良
い。従って、ユーザは、音声の入力にそれほど負担を感
じることはない。なお、入力する単語の順番は、文章中
に表れる単語の順番と一致している必要はない。即ち、
上述の例でいえば、例えば「教える、あなた、好き、レ
ストラン」などという単語列を入力することもできる。
【0031】音声認識部2(図2)では、ステップS2
において、マイク1に音声で入力された単語列を構成す
る各単語の音声認識が行われる。即ち、マイク1からの
音声信号は、A/D変換器12、さらには、音響分析部
13を介することにより特徴パラメータ(あるいはシン
ボル)とされて、認識処理部14に出力される。認識処
理部14では、音響分析部13の出力に基づいて、大規
模単語辞書15に記憶されている単語を音声認識対象と
して音声認識が行われる。
【0032】ここで、入力音声は、上述したように、自
立語の単語列であるから、一般的に、単語と単語との間
には、短い期間ではあるが無音が挿入される。そこで、
認識処理部14では、その無音部分を検出し、そこを、
単語と単語の切れ目と認識して、入力された単語列を構
成する各単語それぞれを音声認識するようになされてい
る。従って、認識処理部14は、連続音声認識ではな
く、それより簡易な孤立単語音声認識を行うことができ
るものであれば良いので、その大型化および高コスト化
を防止することができる。その結果、翻訳装置について
も、大型化および高コスト化を防止することができる。
【0033】音声認識の結果得られた1以上の単語列
は、システム制御部4に出力される。システム制御部4
は、音声認識部2(認識処理部14)から、音声認識結
果としての1以上の単語を受信すると、ステップS3に
おいて、その単語の組み合わせと最も類似する文章を、
第1言語文記憶部5に記憶されている日本語の文章(以
下、適宜、日本語文という)の中から検索する。
【0034】ここで、ステップS3における検索は、次
のようにして行われる。即ち、例えば、システム制御部
4は、音声認識の結果得られた単語(以下、適宜、認識
単語という)すべてを含む日本語文を、第1言語文記憶
部5から検索する。そのような日本語文が存在する場
合、システム制御部4は、その日本語文を、認識単語の
組み合わせに最も類似するものとして、第1言語文記憶
部5から読み出す。また、第1言語文記憶部5に記憶さ
れている日本語文の中に、認識単語をすべて含むものが
存在しない場合、システム制御部4は、そのうちのいず
れか1単語を除いた単語をすべて含む日本語文を検索す
る。そのような日本語文が存在する場合、システム制御
部4は、その日本語文を、認識単語の組み合わせに最も
類似するものとして、第1言語文記憶部5から読み出
す。また、そのような日本語文が存在しない場合、シス
テム制御部4は、認識単語のうちのいずれか2単語を除
いた単語をすべて含む日本語文を検索する。以下、同様
にして、認識単語の組み合わせに最も類似する日本語文
が検索される。
【0035】ステップS3において、認識単語の組み合
わせに最も類似する日本語文が検索された後、ステップ
S4に進み、その日本語文が、システム制御部7から出
力部7に供給されて出力される。即ち、第1言語文記憶
部5に記憶されている日本語文には、例えば、その日本
語文を構成する文字の文字コード、またはその日本語文
の音韻情報および韻律情報が付加されており、これらの
データが出力部7に供給される。出力部7では、文字コ
ードに対応する文字がモニタに表示される。あるいはま
た、出力部7では、音声合成装置によって、音韻情報お
よび韻律情報に基づいて合成音が生成され、スピーカか
ら出力される。即ち、出力部7においては、日本語文が
モニタに表示され、あるいはまた、日本語文が合成音で
出力される(本明細書中においては、表示を行う場合、
および合成音の出力を行う場合のいずれの場合も、適
宜、出力という)。
【0036】出力部7において、日本語文が出力された
後、それが正しいものかどうかがユーザによって確認さ
れる。即ち、ユーザは、出力部7から出力された日本語
文が正しい場合、コントロールキー群3の確認/変換キ
ーを操作する。また、ユーザは、出力部7から出力され
た日本語文が誤っている場合、コントロールキー群3の
再検索/不変換キーを操作する。いずれのキーが操作さ
れたかは、ステップS5において、システム制御部4に
よって判定される。
【0037】ステップS5において、再検索/不変換キ
ーが操作されたと判定された場合、即ち、ステップS4
で出力された日本語文が誤っている場合、ステップS1
に戻る。従って、この場合、再び、ユーザによって音声
の入力がなされ、以下、上述した処理が行われることに
なる。
【0038】なお、ステップS5において、再検索/不
変換キーが操作されたと判定された場合には、ステップ
S1ではなく、図3において点線で示すように、ステッ
プS2またはS3に戻るようにすることも可能である。
ステップS2に戻るようにした場合、音声認識部2から
は、ステップS1で入力された音声の音声認識処理にお
いて得られた音声認識結果候補のうち、次に尤度の高い
ものが、音声認識結果として出力される。即ち、音声認
識部2では、認識処理部14において、大規模単語辞書
15に記憶されている各単語が、入力音声にどれだけ近
いかを表す尤度が計算され、通常は、その尤度が最も高
い単語が、音声認識結果として出力される。従って、ス
テップS4で出力された日本語文が誤っているというこ
とは、音声認識結果として出力した、最も尤度が高い単
語が誤っていた可能性があるから、その次に尤度の高い
単語が、音声認識結果として出力され、以下、ステップ
S3以降の処理が繰り返される。
【0039】また、ステップS3に戻るようにした場
合、いままで出力された日本語文以外が検索対象とされ
て、日本語文の検索が行われる。即ち、ステップS4で
出力された日本語文が誤っているということは、ステッ
プS3における検索処理が誤っていた可能性があるか
ら、そのような検索処理により得られた日本語文以外を
対象として、再度検索が行われる。
【0040】一方、ステップS5において、確認/変換
キーが操作されたと判定された場合、即ちステップS4
で出力された日本語文が正しい場合(ステップS4で出
力された日本語文の意味と、ステップS1で入力された
音声の意味とが合っている場合)ステップS6に進み、
システム制御部4によって、第2言語文記憶部6から、
ステップS4で出力された日本語文を英語に翻訳した翻
訳文(以下、適宜、英語文という)が検索される。即
ち、システム制御部4は、確認/変換キーが操作された
ときに、出力部7から出力されていた日本語文と対応す
る英語文を、第2言語文記憶部6から読み出す。
【0041】そして、ステップS7に進み、その英語文
が出力部7に供給されて出力され、処理を終了する。即
ち、第2言語文記憶部6には、例えば第1言語文記憶部
5における場合と同様に、英語文が、その英語文を構成
する文字の文字コード、またはその英語文の音韻情報お
よび韻律情報とともに記憶されており、これらのデータ
が出力部7に供給される。従って、ステップS7では、
ステップS4における場合と同様に、英語文がモニタに
表示され、あるいはまた、英語文が合成音で出力され
る。
【0042】以上のように、日本語で入力された音声
が、日本語文で出力され、その確認がなされた後に、そ
の日本語文を英訳した英語文が出力されるので、ユーザ
は、英語文が正しいものかどうかを容易に確認すること
ができる。さらに、本実施例では、日本語文と英語文と
を対応付けておくようにしたので、翻訳を誤ることもな
い。
【0043】以上、本発明を、日本語から英語に翻訳す
る翻訳装置に適用した場合について説明したが、本発明
は、この他、例えば日本語以外の言語を英語に翻訳した
り、また日本語を、英語以外の言語に翻訳する翻訳装置
に適用可能である。
【0044】なお、本実施例においては、自立語のみを
音声認識対象としたが、自立語以外の単語も音声認識対
象に含めることが可能である。
【0045】また、音声認識部2における音声認識アル
ゴリズム、出力部7で合成音を生成する手法、および認
識単語と類似する日本語文を検索する手法は、特に限定
されるものではない。
【0046】さらに、本実施例では、音声認識部2にお
いて、孤立単語音声認識を行うようにしたが、音声認識
部2には、この他、例えば連続音声認識やワードスポッ
ティングなどを行わせるようにすることも可能である。
【0047】また、本実施例では、コントロールキー群
3を操作することで、ステップS4で出力された日本語
文が正しいかどうかを確認するようにしたが、この確認
は、この他、例えばマイク1に音声を入力することで行
うようにすることも可能である。
【0048】さらに、本実施例においては、日本語文の
確認のみを行うようにしたが、この他、例えば音声認識
部2で音声認識された各単語の確認なども行うようにす
ることが可能である。
【0049】また、本実施例では、第1言語文記憶部5
と第2言語文記憶部6とを別々に構成するようにした
が、これらは、一体的に構成することも可能である。
【0050】
【発明の効果】以上の如く、本発明の翻訳装置および翻
訳方法によれば、音声が音声認識され、その音声を構成
する1以上の単語が出力される。そして、第1の文章記
憶手段に記憶されている所定の言語による文章のうち、
音声認識結果として出力された1以上の単語の組み合わ
せと類似するものが検索されて出力される。さらに、そ
の後、第2の文章記憶手段に記憶されている他の言語に
よる文章のうち、検索結果として出力された所定の言語
による文章の翻訳文に対応するものが検索されて出力さ
れる。従って、入力を容易に行うことができ、さらに誤
りのない翻訳文を得ることが可能となる。
【図面の簡単な説明】
【図1】本発明を適用した翻訳装置の一実施例の構成を
示すブロック図である。
【図2】図1の音声認識部2の詳細構成例を示すブロッ
ク図である。
【図3】図1の翻訳装置の動作を説明するためのフロー
チャートである。
【符号の説明】
1 マイク(マイクロフォン) 2 音声認識部 3 コントロールキー群 4 システム制御部 5 第1言語文記憶部 6 第2言語文記憶部 7 出力部 12 A/D変換器 13 音響分析部 14 認識処理部 15 大規模単語辞書
フロントページの続き (72)発明者 加賀美 徹也 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 渡 雅男 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 赤羽 誠 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 石井 和夫 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 浅野 康治 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 角田 弘史 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 所定の言語で入力された音声を、他の言
    語に翻訳する翻訳装置であって、 前記音声を音声認識し、その音声を構成する1以上の単
    語を出力する音声認識手段と、 前記所定の言語による文章を記憶している第1の文章記
    憶手段と、 前記他の言語による文章を記憶している第2の文章記憶
    手段と、 前記第1の文章記憶手段に記憶されている前記所定の言
    語による文章のうち、前記音声認識手段より出力される
    1以上の単語の組み合わせと類似するものを検索する第
    1の検索手段と、 前記第2の文章記憶手段に記憶されている前記他の言語
    による文章のうち、前記第1の検索手段により検索され
    た前記所定の言語による文章の翻訳文に対応するものを
    検索する第2の検索手段と、 前記第1および第2の検索手段の検索結果を出力する出
    力手段とを備えることを特徴とする翻訳装置。
  2. 【請求項2】 前記第1の文章記憶手段に記憶されてい
    る前記所定の言語による文章と、前記第2の文章記憶手
    段に記憶されている前記他の言語による文章とは、1対
    1に対応しており、 前記第2の検索手段は、前記第2の文章記憶手段に記憶
    されている前記他の言語による文章のうち、前記第1の
    検索手段により検索された前記所定の言語による文章と
    対応しているものを検索することを特徴とする請求項1
    に記載の翻訳装置。
  3. 【請求項3】 所定の入力を行うときに操作される操作
    手段をさらに備え、 前記第2の検索手段は、前記操作手段が操作されること
    により前記所定の入力があったとき、前記第2の文章記
    憶手段に記憶されている前記他の言語による文章のう
    ち、前記第1の検索手段により検索された前記所定の言
    語による文章の翻訳文に対応するものを検索することを
    特徴とする請求項1に記載の翻訳装置。
  4. 【請求項4】 所定の言語による文章を記憶している第
    1の文章記憶手段と、 他の言語による文章を記憶している第2の文章記憶手段
    とを備え、 前記所定の言語で入力された音声を、前記他の言語に翻
    訳する翻訳装置の翻訳方法であって、 前記音声を音声認識し、その音声を構成する1以上の単
    語を出力し、 前記第1の文章記憶手段に記憶されている前記所定の言
    語による文章のうち、音声認識結果として出力された前
    記1以上の単語の組み合わせと類似するものを検索して
    出力し、 所定の入力があったとき、前記第2の文章記憶手段に記
    憶されている前記他の言語による文章のうち、検索結果
    として出力された前記所定の言語による文章の翻訳文に
    対応するものを検索して出力することを特徴とする翻訳
    方法。
JP7160345A 1995-06-27 1995-06-27 翻訳装置および翻訳方法 Withdrawn JPH0916602A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP7160345A JPH0916602A (ja) 1995-06-27 1995-06-27 翻訳装置および翻訳方法
KR1019960023744A KR970002705A (ko) 1995-06-27 1996-06-26 번역 장치 및 번역 방법
US08/670,291 US5963892A (en) 1995-06-27 1996-06-26 Translation apparatus and method for facilitating speech input operation and obtaining correct translation thereof
EP96110405A EP0751467A3 (en) 1995-06-27 1996-06-27 Translation apparatus and translation method
CN96110450A CN1098500C (zh) 1995-06-27 1996-06-27 翻译装置和翻译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7160345A JPH0916602A (ja) 1995-06-27 1995-06-27 翻訳装置および翻訳方法

Publications (1)

Publication Number Publication Date
JPH0916602A true JPH0916602A (ja) 1997-01-17

Family

ID=15712982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7160345A Withdrawn JPH0916602A (ja) 1995-06-27 1995-06-27 翻訳装置および翻訳方法

Country Status (5)

Country Link
US (1) US5963892A (ja)
EP (1) EP0751467A3 (ja)
JP (1) JPH0916602A (ja)
KR (1) KR970002705A (ja)
CN (1) CN1098500C (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011027979A (ja) * 2009-07-24 2011-02-10 Fujitsu Ltd 音声翻訳装置及び音声翻訳方法
WO2011033834A1 (ja) * 2009-09-18 2011-03-24 日本電気株式会社 音声翻訳システム、音声翻訳方法および記録媒体
JP6238181B1 (ja) * 2016-10-05 2017-11-29 パナソニックIpマネジメント株式会社 拡声装置およびその制御方法
JPWO2019016985A1 (ja) * 2017-07-20 2020-06-25 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法及びプログラム

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6564321B2 (en) 1995-04-28 2003-05-13 Bobo Ii Charles R Systems and methods for storing, delivering, and managing messages
DE19721982C2 (de) * 1997-05-26 2001-08-02 Siemens Audiologische Technik Kommunikationssystem für Benutzer einer tragbaren Hörhilfe
US6597688B2 (en) 1998-06-12 2003-07-22 J2 Global Communications, Inc. Scalable architecture for transmission of messages over a network
US6085160A (en) * 1998-07-10 2000-07-04 Lernout & Hauspie Speech Products N.V. Language independent speech recognition
KR100681989B1 (ko) * 1998-08-31 2007-02-15 소니 가부시끼 가이샤 자연 언어 처리 장치 및 방법
US6223150B1 (en) 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6243669B1 (en) 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6282507B1 (en) * 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6266642B1 (en) * 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US6278968B1 (en) * 1999-01-29 2001-08-21 Sony Corporation Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6356865B1 (en) * 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
US6442524B1 (en) 1999-01-29 2002-08-27 Sony Corporation Analyzing inflectional morphology in a spoken language translation system
US6374224B1 (en) 1999-03-10 2002-04-16 Sony Corporation Method and apparatus for style control in natural language generation
US6438524B1 (en) * 1999-11-23 2002-08-20 Qualcomm, Incorporated Method and apparatus for a voice controlled foreign language translation device
US6990439B2 (en) * 2001-01-10 2006-01-24 Microsoft Corporation Method and apparatus for performing machine translation using a unified language model and translation model
JP3933449B2 (ja) * 2001-11-22 2007-06-20 株式会社東芝 コミュニケーション支援装置
US20030200088A1 (en) * 2002-04-18 2003-10-23 Intecs International, Inc. Electronic bookmark dictionary
US7369998B2 (en) 2003-08-14 2008-05-06 Voxtec International, Inc. Context based language translation devices and methods
US20050091060A1 (en) * 2003-10-23 2005-04-28 Wing Thomas W. Hearing aid for increasing voice recognition through voice frequency downshift and/or voice substitution
JP3890326B2 (ja) * 2003-11-07 2007-03-07 キヤノン株式会社 情報処理装置、情報処理方法ならびに記録媒体、プログラム
US8036893B2 (en) * 2004-07-22 2011-10-11 Nuance Communications, Inc. Method and system for identifying and correcting accent-induced speech recognition difficulties
US7865353B2 (en) * 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium
JP4058071B2 (ja) * 2005-11-22 2008-03-05 株式会社東芝 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US20070118372A1 (en) * 2005-11-23 2007-05-24 General Electric Company System and method for generating closed captions
US20070129946A1 (en) * 2005-12-06 2007-06-07 Ma Changxue C High quality speech reconstruction for a dialog method and system
US20080189098A1 (en) * 2007-02-01 2008-08-07 Peter Joseph Mravetz Language Translator Communicator (LTC)
JP4974704B2 (ja) * 2007-02-22 2012-07-11 パナソニック株式会社 撮像装置
CN101271452B (zh) * 2007-03-21 2010-07-28 株式会社东芝 生成译文和机器翻译的方法及装置
US8032384B2 (en) * 2008-03-14 2011-10-04 Jay S Rylander Hand held language translation and learning device
US8897432B2 (en) 2010-07-01 2014-11-25 Etherfax, Llc System and method of remote fax interconnect technology
US9160967B2 (en) * 2012-11-13 2015-10-13 Cisco Technology, Inc. Simultaneous language interpretation during ongoing video conferencing
JP2015129672A (ja) * 2014-01-07 2015-07-16 アルパイン株式会社 施設検索装置および方法
USD798265S1 (en) 2015-08-31 2017-09-26 Anthony Juarez Handheld language translator
US9678954B1 (en) 2015-10-29 2017-06-13 Google Inc. Techniques for providing lexicon data for translation of a single word speech input

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3587009T2 (de) * 1984-09-18 1993-05-06 Sharp Kk Uebersetzungssystem.
US4800522A (en) * 1985-05-14 1989-01-24 Sharp Kabushiki Kaisha Bilingual translation system capable of memorizing learned words
JPS62229473A (ja) * 1986-03-31 1987-10-08 Toshiba Corp 翻訳装置
US5384701A (en) * 1986-10-03 1995-01-24 British Telecommunications Public Limited Company Language translation system
GB2199170A (en) * 1986-11-28 1988-06-29 Sharp Kk Translation apparatus
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
JP3114181B2 (ja) * 1990-03-27 2000-12-04 株式会社日立製作所 異言語交信用翻訳方法およびシステム
EP0472193A3 (en) * 1990-08-23 1993-10-20 Oki Electric Ind Co Ltd Translation device based on voice recognition and voice synthesis
JPH05197389A (ja) * 1991-08-13 1993-08-06 Toshiba Corp 音声認識装置
JPH05120324A (ja) * 1991-10-30 1993-05-18 Sharp Corp 言語処理方式
US5293584A (en) * 1992-05-21 1994-03-08 International Business Machines Corporation Speech recognition system for natural language translation
US5704013A (en) * 1994-09-16 1997-12-30 Sony Corporation Map determination method and apparatus
US5615301A (en) * 1994-09-28 1997-03-25 Rivers; W. L. Automated language translation system
JPH08123462A (ja) * 1994-10-27 1996-05-17 Sony Corp 音声認識装置
US5796921A (en) * 1994-10-28 1998-08-18 Sony Corporation Mapping determination methods and data discrimination methods using the same

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011027979A (ja) * 2009-07-24 2011-02-10 Fujitsu Ltd 音声翻訳装置及び音声翻訳方法
WO2011033834A1 (ja) * 2009-09-18 2011-03-24 日本電気株式会社 音声翻訳システム、音声翻訳方法および記録媒体
JP6238181B1 (ja) * 2016-10-05 2017-11-29 パナソニックIpマネジメント株式会社 拡声装置およびその制御方法
JP2018060043A (ja) * 2016-10-05 2018-04-12 パナソニックIpマネジメント株式会社 拡声装置およびその制御方法
JPWO2019016985A1 (ja) * 2017-07-20 2020-06-25 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法及びプログラム

Also Published As

Publication number Publication date
CN1098500C (zh) 2003-01-08
KR970002705A (ko) 1997-01-28
EP0751467A2 (en) 1997-01-02
US5963892A (en) 1999-10-05
CN1146582A (zh) 1997-04-02
EP0751467A3 (en) 1998-10-14

Similar Documents

Publication Publication Date Title
JPH0916602A (ja) 翻訳装置および翻訳方法
US6823309B1 (en) Speech synthesizing system and method for modifying prosody based on match to database
JP2848458B2 (ja) 言語翻訳システム
JP4734155B2 (ja) 音声認識装置、音声認識方法および音声認識プログラム
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US7983912B2 (en) Apparatus, method, and computer program product for correcting a misrecognized utterance using a whole or a partial re-utterance
US10163436B1 (en) Training a speech processing system using spoken utterances
US7873508B2 (en) Apparatus, method, and computer program product for supporting communication through translation between languages
US20100057435A1 (en) System and method for speech-to-speech translation
WO2005034082A1 (en) Method for synthesizing speech
US20090204401A1 (en) Speech processing system, speech processing method, and speech processing program
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JP2001188781A (ja) 会話処理装置および方法、並びに記録媒体
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
US20020087317A1 (en) Computer-implemented dynamic pronunciation method and system
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
KR20150014235A (ko) 자동 통역 장치 및 방법
JP3911178B2 (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
JP3576066B2 (ja) 音声合成システム、および音声合成方法
JP3366253B2 (ja) 音声合成装置
JPH09258776A (ja) 音声認識方法および音声認識装置、並びに翻訳方法および翻訳装置
GB2568902A (en) System for speech evaluation
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体
US20240153486A1 (en) Operation method of speech synthesis system

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020903