JPH02257363A

JPH02257363A - 自動翻訳装置

Info

Publication number: JPH02257363A
Application number: JP1079918A
Authority: JP
Inventors: Naoki Mizutani; 直樹水谷
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1989-03-30
Filing date: 1989-03-30
Publication date: 1990-10-18

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〈産業上の利用分野〉この発明は、ソース言語の文章をターゲット言語の文章
へ変換する自動翻訳装置に関する。

〈従来の技術〉一般に、自動翻訳装置における翻訳過程は、辞書引き形
態素解析、構文解析、意味解析、構文生成および形態素
生成等を経て実行される。ここで、上記辞書引き形態素
解析においては、辞書を引いて、入力された文章を各形
態素（単語列）に分割し、この各単語に対する品詞など
の文法情報および訳語等を得る。また、上記構文解析に
おいては、単語の懸かり受は等の文章の構造を決定する
。さらに、上記意味解析においては、複数の構文解析の
結果から、意味的に正しいものとそうでないものとに判
別する。そして、構文解析結果に基づいて、入力された
ソース言語における文章の構文をターゲット言語におけ
る構文に変換し、この変換したターゲット言語の構文に
対応したターゲット言語の形態素列を生成するのである
。

従来、自動翻訳装置において辞書引き形態素解析を行う
場合、まず入力文章の字面情報である綴りに基づいて辞
書引きを行う。そして、得られた形態素が隣合う形態素
と文法的に接続可能か否かをチエツクし、接続可能な場
合にその形態素を目的とする形態素として確定するので
ある。また、文節は、得られた形態素のパターンに基づ
いて決定している。

〈発明が解決しようとする課題〉しかしながら、上記辞書引き形態素解析においては、一
般に複数の解が生成され、形態素解析の段階では妥当な
解（すなわち、正しい単語）が決定できない場合が多い
。すなわち、構文解析や意味解析の段階でようやく解が
決定され、そのため翻訳処理が大変複雑になるという問
題がある。また、解の決定に失敗して、使用者の意図す
るものとは異なる翻訳結果が生成されることが多いとい
う問題もある。

すなわち、例えば１つの単語に対して複数の異なる意味
がある同音異義語の意味を形態素解析段階で決定できな
いため、意味解析による文脈的情報を利用して意味候補
を決定する必要があり、複雑な処理を必要とする。また
、日本語の場合、単語間に切れ目を置かずにべた書きす
るため、辞書引きによって得られる単語の候補が多数存
在して形態素解析の解が増えるため、特に形態素解析後
の処理に大きな負担が掛かる。

そこで、この発明の目的は、得られた形態素候補の数を
少数の正解に近い形態素候補に絞ることによって、形態
素同定精度を向上すると共に形態素解析後の処理を容易
にする自動翻訳装置を提供することにある。

〈課題を解決するための手段〉・上記目的を達成するため、第１の発明は、入力された
文章の形態素解析を行い、この形態素解析の結果得られ
た形態素列の構文を解析して目標言語におけ・る構文構
造を求め、得られた目標言語の構文構造に従って翻訳文
を生成する自動翻訳装置において、上記形態素解析の際
に、辞書を用いて入力文章を形態素に分割し、文法的に
接続可能な形態素候補を出力する形態素解析部と、上記
入力文章の朗読音声が入力されて、この朗読音声の音声
情報を出力する音声入力部と、上記音声入力部からの音
声情報を分析して音素を求めて、音素候補を出力する音
響分析部と、上記音響分析部によって求められた音素候
補を参照して、上記形態素解析部によって求められた形
態素候補の中から上記音素候補を組合せた音素列から成
る形態素候補を選択する形態素候補選択部を備えたこと
を特徴としている。

また、この発明の自動翻訳装置は、入力された文章の文
節区切りを抽出する文節区切り抽出部を備えて、上記音
響分析部は、音素候補を出力すると共に上記音声情報の
無音区間を抽出するようにし、上記文節区切り抽出部は
、上記音響分析部によって抽出された無音区間の長さに
基づいて、上記形態素候補および音素候補を参照して上
記無音区間の中から文節区切りを抽出するようにし、上
記形態素候補選択部は、上記音素候補と上記文節区切り
抽出部によって抽出された文節区切りの位置を参照して
、上記形態素解析部によって求められた形態素候補の中
から、上記音素候補を組合せた音素列から成り、かつ、
文節区切りが存在しない形態素候補を選択するようにす
るのが望ま（２い。

また、第２の発明は、入力された文章の形態素解析を行
い、この形態素解析の結果得られた形態素列の構文を解
析して目標言語における構文構造を求め、得られた目標
言語の構文構造に従って翻訳文を生成する自動翻訳装置
において、上記形態素解析の際に、辞書を用いて入力文
章を形態素に分割し、文法的に接続可能な形態素候補を
出力する形態素解析部と、上記入力文章の朗読音声が入
力されて、この朗読音声の音声情報を出力する音声入力
部と、上記音声入力部からの音声情報を分析して音素候
補を出力すると共に、上記音声情報の無音区間を抽出す
る音響分析部と、上記音響分析部によって抽出された無
音区間の長さに基づいて、上記形態素候補および音素候
補を参照して上記無音区間の中から文節区切りを抽出す
る文節区切り抽出部と、上記文節区切り抽出部によって
抽出された文節区切りの位置を参照して、上記形態素解
析部によって求められた形態素候補の中から上記文節区
切りが存在しない形態素候補を選択する形態素候補選択
部を備えたことを特徴としている。

く作用〉第１の発明において、形態素解析部に文章が入力される
と、上記形態素解析部によって入力文章が形態素に分割
され、文法的に接続可能な形態素候補が出力される。一
方、上記入力文章の朗読音声が音声入力部に入力され、
この朗読音声の音声情報が出力される。そして、音響分
析部によって上記音声入力部からの音声情報が分析され
て音素候補が出力される。そうすると、形態素候補選択
部は、上記音響分析部によって求められた音素候補を参
照して、上記形態素解析部によって求められた形態素候
補の中から上記音素候補を組合せた音素列から成る形態
素候補を選択する。したがって、入力文章の朗読音声の
音声情報に基づいて、上記形態素解析によって得られた
形態素候補をより正解に近い少数の形態素候補に絞り込
むことができる。

また、上記自動翻訳装置は、入力された文章の文節区切
りを抽出する文節区切り抽出部を備えて、上記音響分析
部は、音素候補を出力すると共に上記音声情報の無音区
間を抽出するようにし、上記文節区切り抽出部は、上記
音響分析部によって抽出された無音区間の長さに基づい
て、上記形態素候補および音素候補を参照して上記無音
区間の中から文節区切りを抽出するようにし、上記形態
素候補選択部は、上記音素候補と上記文節区切り抽出部
によって抽出された文節区切りの位置を参照して、上記
形態素解析部によって求められた形態素候補の中から、
上記音素候補を組合せた音素列から成り、かつ、文節区
切りが存在しない形態素候補を選択するようにすれば、
更に正解に近い少数の形態素候補に絞り込むことができ
る。

また、第２の発明において、形態素解析部に文章が入力
されると、上記形態素解析部によって入力文章が形態素
に分割され、文法的に接続可能な形態素候補が出力され
る。一方、上記入力文章の朗読音声が音声入力部に入力
され、この朗読音声の音声情報が出力される。そして、
音響分析部によって上記音声入力部からの音声情報が分
析されて音素候補が出力されると共に、上記音声情報の
無音区間が抽出される。さらに、上記音響分析部によっ
て抽出された無音区間の長さに基づいて、上記形態素候
補および音素候補を参照して、文節区切りが文節区切り
抽出部によって抽出される。

そうすると、形態素候補選択部は、上記文節区切り抽出
部によって抽出された文節区切りの位置を参照して、上
記形態素解析部によって求められた形態素候補の中から
上記文節区切りが存在しない形態素候補を選択する。し
たがって、入力文章の朗読音声の音声情報に基づいて、
上記形態素解析によって得られた形態素候補をより正解
に近い少数の形態素候補に絞り込むことができる。

〈実施例〉以下、この発明を図示の実施例により詳細に説明する。

第１図は第１の発明における一実施例のブロック図であ
る。文章入力部ｌにソース言語による文章（例えば、日
本語漢字仮名混じり文）が入力される。そうすると、入
力文章は文章表示部２に表示される一方、形態素解析部
３に入力される。形態素解析部３における辞書検索部４
では、辞書１５を検索して入力文がどのような形態素か
ら構成されているかを調べ、形態素候補が総て抽出され
る。

そして、接続チエツク部５において、辞書引きの結果得
られた形態素の文法情報に基づいて接続表１６を参照し
て形態素の文法的な接続のチエツクが行われる。その結
果、文法的に接続可能な形態素候補を総て並べた単語ラ
チスが生成される。

第２図は入力文章「表から行って上手に断った」に対応
する単語ラチスの一例を示す。単語ラチスには、辞書１
５から検索された情報である読みや意味に関する情報等
も含まれている。第２図においては、入力単語「表」に
対しては“ひょう”と“おちて°の２通りの形態素候補
が得られる。同様にして、入力単語「行っ」および「断
つ」に対しても２通りの形態素候補が得られ、入力単語
「上手」に対しては３通りの形態素候補が得られる。そ
の結果、文全体としては各形態素候補の組み合わせによ
って２４通りの解釈が得られる。

上述のような、入力文章からの解析の他に、文章表示部
２に表示された文章を使用者が朗読し、その音声が音声
入力部６に入力される。そうすると、音声入力部６は入
力音声を電気信号に変換して音響分析部７に出力する。

音響分析部７では、入力された音声信号の一定区間に対
して１以上のの音素候補が割り当てられて、正解率の高
い音素類に並べた音素ラチスが生成される。第３図は入
力音声「おもてからいってじょうずにことわった」に対
応する音素ラチスの一例を示す。

形態素候補選択部８は、第２図に示すような単語ラチス
の形態素候補の中から、単語ラチスに記述された形態素
候補の読みに基づいて、その形態素候補の読みをたどる
ことができる音素列が音素ラチスの音素候補中に存在す
るか否かを調べる。

その結果、形態素候補の読みをたどることができる音素
列が音素ラチスの音素候補の中に存在するような形態素
候補、あるいは、形態素候補の読みをたどることができ
る音素列が音素ラチスに存在する可能性が高い形態素候
補のみを残し、他の形態素候補を単語ラチスから除去す
る。すなわち、第２図において、最初の形態素候補「表
」の読み／ひょう／をたどることができる音素列が、第
３図の音素ラチスの音素候補をどのように組み合わせて
も得られないので、形態素候補「表（ひょう）」を単語
ラチスから除去する。同様に、形態素候補「行っ」の読
み／おこなっ／をたどることができる音素列が３図の音
素ラチスから得られないので、形態素候補「行っ（おこ
なっ）」を単語ラチスから除去するのである。一方、形
態素候補「表」の読み／おもて／をたどることができる
音素列１０ｍｏｔｅ／が、第３図の音素ラチスの音素候
補の組み合わせの中に存在するので、形態素候補「表（
おして）」を単語ラチスに残すのである。こうすること
によって、単語ラチスの形態素候補を正解に近い候補に
絞ることができ、各形態素候補の組み合わせが大幅に減
少され、形態素解析に続く処理における計算量を低減で
きるのである。

その後、文節決定部９で、「自立語＋付属語」等の形態
素パターンに基づいて、形態素候補選択部８によって修
正された単語ラチスから文節が生成される。そうすると
、構文解析部１０で、文節決定部９によって生成された
文節を構成する単語の文法情報に基づいて、文節間の修
飾関係が求められる。そして、意味解析部１１で、辞書
検索部４によって得られた単語の意味や構文解析部１０
によって得られた構文情報に基づいて、ソース言語にお
ける文章の意味が求められる。

そうすると、構文生成部１２は、意味解析部１１によっ
て求められたソース言語における文章の意味情報に基づ
いて、ターゲット言語に則した構文情報を生成する。そ
して、形態素生成部１３は、構文生成部１２によって生
成されたターゲット言語における構文情報に、辞書検索
部４による辞書引きによって得られたターゲット言語の
給電情報を当て嵌めて、ターゲット言語による文章を生
成し、翻訳文出力部１４から出力する。

このように、本実施例では、翻訳処理過程における辞書
引き形態素解析において、入力されたソース言語の文章
から形態素解析部３によって単語ラチスを求める。一方
、上記ソース言語の入力文章を朗読した音声を音声入力
部６に入力し、さらに音響分析部７で音響分析して音素
ラチスを求める。そして、形態素候補選択部８によって
、上記単語ラチスの形態素候補の中から、その読みをた
どることができる音素列が音素ラチスの音素候補の中に
存在するような形態素候補、あるいは、その読みをたど
ることかできる音素列が音素ラチスに存在する可能性が
高い形態素候補のみを選択して残（２、他の形態素候補
を単語ラチスから除去する。こうすることによって、単
語ラチスの形態素候補数を減らして各形態素候補の組合
せ数（すなわち、得られる文節候補数）を大幅に減少す
ることができる。したがって、形態素解析に続く構文解
析、意味解析、構文生成および形態素生成等における計
算中を低減できるのである。

また、本実施例においては、形態素解析部３によって得
られた多くの形態素候補を、音声情報に基づいて正解に
近い形態素候補に絞ることができ、より正確に形態素を
同定することができる。したがって、この発明によれば
音（おと）は“５ｏｕｎｄ”に翻訳することができ、音
（ね）は“ｔｏｎｅ”に翻訳することができ、適確な翻
訳文を得ることができるのである。

第４図は第２の発明における一実施例のブロック図であ
る。文章入力部２１にソース言語による文章（例えば、
日本語漢字仮名混じり文）が入力される。そうすると、
入力文章は文章表示部２２に表示される一方、形態素解
析部２３に入力される。

形態素解析部２３における辞書検索部２４では、辞書３
６を検索して入力文がどのような形態素から構成されて
いるかを調べ、形態素候補が総て抽出される。そして、
接続チエツク部２５において、辞書引きの結果得られた
形態素の文法情報に基づいて接続表３７を参照して形態
素の文法的な接続のチエツクが行われる。その結果、文
法的に接続可能な形態素候補を総て並べた単語ラチスが
生成される。

第５図は入力文章「ここではきものをぬげ」に対応する
単語ラチスの一例を示す。単語ラチスには、辞書３６か
ら検索された情報である読みや意味に関する情報等も含
まれている。第５図においては、「ではきもの」に対し
て［ではｊ＋「きものｊと「で」＋「はきもの」との２
通りの解釈が得られる。

上述のような、入力文章からの解析の他に、文章表示部
２２に表示された文章を使用者が朗読し、その音声が音
声入力部２６に入力される。そうすると、音声入力部２
６は入力音声を電気信号に変換して音響分析部２７に出
力する。音響分析部２７では、入力された音声信号の一
定区間に対して１以上の音素候補が割り当てられて、正
解率の高い音素類に並べた音素ラチスが生成される。第
６図は入力音声「ここではきものをぬげ」に対応する音
素ラチスの一例を示す。図中、“＊”印は無音区間を示
す。

ここで、第６図の音素ラチスの音素候補においては、「
はきもの」の「は」の音素候補として／ｗａ／ら候補に
なっている。そのため、第１の発明の場合のように、そ
の読みをたどることができる音素列が音素ラチスの音素
候補の中に存在するような形態素候補を単語ラチスに残
すと、形態素候補「では」、「きもの」、「で」および
「はきもの」が総て残ってしまう。したがって、この場
合は、第１の発明の場合のように音素ラチスの音素候補
のみを参照して単語ラチスの形態素候補を同定するのは
有効ではないと言える。そこで、第２の発明においては
、音素ラチスの音素候補の中に無音情報があることに注
目して。音素候補の無音情報を用いて形態素候補の同定
を行うのである。

文節区切り抽出部２８は、音響分析部２７から入力され
る音素候補情報に基づいて、無音区間長を調べる。そし
て、無音区間長が音素区間長に比べて十分に長い（例え
ば、標準音素区間長の３倍以上）無音区間があり、かつ
、単語ラチス中に、この無音区間の直前の音素で終わる
形態素候補あるいは上記無音区間の直後の音素で始まる
形態素候補がある場合に、上記無音区間の位置を文節の
区切りと確定するのである。すなわち、第６図において
は、無音区間（イ）が標準音素区間長の３倍有り、この
無音区間（イ）の直前の音素／ｅ／で終わる形態素候補
「で」と無音区間（イ）の直後の音素／ｈ／で始まる形
態素候補「はきもの」が存在する。

そのため、上記無音区間（イ）を文節区切りと確定する
のである。

形態素候補選択部２９は一つの形態素中においては文節
区切りは起こり得ないとして、音素ラチスを参照して単
語ラチスの形態素候補の中から、形態素中に文節区切り
がある形態素候補を除去する。すなわち、第５図および
第６図においては、音素ラチスから／ｋｏｋｏｄｅ／の
後に文節区切りが検出されているので、形態素中に文節
区切りがある形態素候補「では」が単語ラチスから除去
されるのである。一方、形態素候補「で」および「はき
もの」は形態素中に文節区切りがないので単語ラチスに
残すのである。こうすることによって、単語ラチスの形
態素候補を正解に近い候補に絞ることができ、各形態素
候補の組合せが大幅に減少され、形態素解析に続く処理
における計算量を低減できるのである。

その後、文節決定部３０で、形態素パターンおよび文節
区切り抽出部２８で抽出された文節区切りに基づいて、
形態素候補選択部２９によって修正された単語ラチスか
ら文節が生成される。上記形態素パターンとしては「自
立語＋付属語」等があり、文節区切り抽出部２８で抽出
された文節区切りを手掛かりとして、文節を構成する形
態素パターンを探していき、得られた形態素パターンに
対応する形態素を選択して文節を得るのである。そうす
ると、構文解析部３１で、文節決定部３０によって生成
された文節を構成する単語の文法情報に基づいて、文節
間の修飾関係が求められる。そして、意味解析部３２で
、辞書検索部２４によって得られた単語の意味や構文解
析部３１によって得られた構文情報に基づいて、ソース
言語における文章の意味が求められる。

構文生成部３３は、意味解析部３２によって求められた
ソース言語における文章の意味情報に基づいて、ターゲ
ット言語に則した構文情報を生成する。モしてζ形態素
生成部３４は、構文生成部３３によって生成されたター
ゲット言語における構文情報に、辞書検索部２４による
辞書引きによって得られたターゲット言語の給量情報を
当て嵌めて、ターゲット言語による文章を生成し、翻訳
文出力部３５から出力する。

このように、本実施例では、翻訳処理過程における辞書
引き形態素解析において、入力されたソース言語の文章
から形態素解析部２３によって単語ラチスを求める。一
方、上記ソース言語の入力文章を朗読した音声を音声入
力部２６に入力し、さらに音響分析部２７で音響分析し
て音素ラチスを求める。そして、得られた音素ラチスと
単語ラチスとを参照して、音素ラチスにおけろ無音区間
から文節区切りの位置を確定する。そして、形態素候補
選択部２９によって、上記単語ラチスの形態素候補の中
から、文節区切りが存在する形態素候補を除去し、文節
区切りが存在しない形態素候補のみを選択１、て単語ラ
チスに残すのである。こうすることによって、単語ラチ
スの形態素候補数を減らして各形態素候補の組合せ数を
大幅に減少することができる。したがって、形態素解析
に続く構文解析、意味解析、構文生成および形態素生成
における計算量を低減できるのである。

また、本実施例によれば、形態素解析部２３によって得
られた多くの形態素候補を、音声情報に基づいて正解に
近い形態素候補に絞ることができ、より正確に形態素を
同定することゆくできる。

上記各実施例においては、単語ラチスの形態素候補の中
から、その読みをたどることができる音素列が音素ラチ
スの音素候補中に存在する（あるいは、存在する可能性
が高い）形態素候補のみを選出する（以下、第１単語ラ
チス修正と言う）か、あるいは、上記単語ラチスの形態
素候補の中から、文節区切りが存在しない形態素候補の
みを選出する（以下、第２単語ラチス修正と言う）かの
いずれかを実施するようにしている。しかじから、この
発明はこれに限定されるものではなく、第１単語ラチス
修正と第２単語ラチス修正とを併用すれば、更に形態素
の同定を精度良く行うことができるのである。その際に
、通常の場合は第１単語ラチス修正を実行し、文節区切
り情報を必要とする場合（例えば、日本語文章における
仮名連鎖部の場合や上記第１単語ラチス修正を行った後
において、一つの入力単語に対してまだ所定数以上の形
態素候補が存在する場合等）にのみ、第２単語ラチス修
正を実行するようにしてもよい。

〈発明の効果〉以上より明らかなように、第１の発明の自動翻訳装置は
、形態素解析部、音声入力部、音響分析部および形態素
候補選択部を備えて、上記形態素解析部によって入力文
章を形態素に分割して形態素候補を出力する一方、上記
音声入力部によって上記入力文章の朗読音声の音声情報
を出力し、上記音響分析部によって上記音声情報を分析
して音素候補を出力し、上記形態素候補選択部によって
、上記音素候補を参照して上記形態素候補の中から音素
候補を組合せた音素列から成る形態素候補を選択するよ
うにしたので、上記形態素候補の数を減らして形態素解
析後の処理を容易にすることができる。また、上記形態
素解析部によって得られた形態素候補の中から、入力文
章の朗読音声の音声情報に基づいてより正解に近い形態
素候補を選択することができ、形態素同定精度を向上で
きる。

また、この発明の自動翻訳装置は、文節区切り抽出部を
備えて、上記音響分析部は、音素候補を出力すると共に
上記音声情報の無音区間を抽出し、上記文節区切り抽出
部は、上記形態素候補および音素候補を参照しつつ無音
区間長に基づいて文節区切りを抽出し、上記形態素候補
選択部は、上記音素候補および文節区切りの位置を参照
して、上記形態素解析部によって求められた形態素候補
の中から、上記音素候補を組合せた音素列から成り、か
つ、文節区切りが存在しない形態素候補を選択するよう
にしたので、更に形態素解析後の処理を容易にして形態
素同定精度を向上できる。

また、第２の発明の自動翻訳装置は、形態素解析部、音
声入力部、音響分析部９文節区切り抽出部および形態素
候補選択部を備えて、上記形態素解析部によって入力文
章を形態素に分割して形態素候補を出力する一方、上記
音声入力部によって上記入力文章の朗読音声の音声情報
を出力し、上記音響分析部によって音素候補を出力する
と共に上記音声情報の無音区間を抽出し、上記文節区切
り抽出部によって上記無音区間の長さに基づいて文節区
切りを抽出し、上記形態素候補選択部によって、上記文
節区切りの位置を参照して上記形態素候補の中から文節
区切りが存在しない形態素候補を選択するようにしたの
で、上記形態素候補の数を減らして形態素解析後の処理
を容易にすることができる。また、上記形態素解析部に
よって得られた形態素候補の中から、入力文章の朗読音
声の音声情報に基づいてより正解に近い形態素候補を選
択することができ、形態素同定精度を向上できる。

【図面の簡単な説明】

第１図は第１の発明における一実施例のブロック図、第
２図は第１図の形態素解析部によって得られた単語ラチ
スの一例を示す図、第３図は第１図の音響分析部によっ
て得られた音素ラチスの一例を示す図、第４図は第２の
発明における一実施例のブロック図、第５図は第４図の
形態素解析部によって得られた単語ラチスの一例を示す
図、第６図は第４図の音響分析部によって得られた音素
ラチスの一例を示す図である。１．２１・・・文章入力部、２．２２・・・文章表示部
、３．２３・・・形態素解析部、４．２４・・・辞書検
索部、５．２５・・・接続チエツク部、６．２６・・・音声入力部、７，２７・・・音響分析部
、８．２９・・・形態素候補選択部、９．３０・・・文節決定部、１０．３１・・・構文解析
部、１１．３２・・・意味解析部、１２．３３・・・構
文生成部、１３．３４・・・形態素生成部、１４．３５・・・翻訳文出力部、１５．３６・・・辞書
、１６．３７・・・接続表、　　２８・・・文節区切り
抽出部。

Claims

【特許請求の範囲】

（１）入力された文章の形態素解析を行い、この形態素
解析の結果得られた形態素列の構文を解析して目標言語
における構文構造を求め、得られた目標言語の構文構造
に従って翻訳文を生成する自動翻訳装置において、上記形態素解析の際に、辞書を用いて入力文章を形態素
に分割し、文法的に接続可能な形態素候補を出力する形
態素解析部と、上記入力文章の朗読音声が入力されて、この朗読音声の
音声情報を出力する音声入力部と、上記音声入力部から
の音声情報を分析して音素を求めて、音素候補を出力す
る音響分析部と、上記音響分析部によって求められた音
素候補を参照して、上記形態素解析部によって求められ
た形態素候補の中から上記音素候補を組合せた音素列か
ら成る形態素候補を選択する形態素候補選択部を備えた
ことを特徴とする自動翻訳装置。
（２）請求項１に記載の自動翻訳装置において、入力さ
れた文章の文節区切りを抽出する文節区切り抽出部を備
え、上記音響分析部は、音素候補を出力すると共に、上記音
声情報の無音区間を抽出するようにし、上記文節区切り
抽出部は、上記音響分析部によって抽出された無音区間
の長さに基づいて、上記形態素候補および音素候補を参
照して上記無音区間の中から文節区切りを抽出するよう
にし、上記形態素候補選択部は、上記音素候補と上記文節区切
り抽出部によって抽出された文節区切りの位置を参照し
て、上記形態素解析部によって求められた形態素候補の
中から、上記音素候補を組合せた音素列から成り、かつ
、文節区切りが存在しない形態素候補を選択するように
したことを特徴とする自動翻訳装置。
（３）入力された文章の形態素解析を行い、この形態素
解析の結果得られた形態素列の構文を解析して目標言語
における構文構造を求め、得られた目標言語の構文構造
に従って翻訳文を生成する自動翻訳装置において、上記形態素解析の際に、辞書を用いて入力文章を形態素
に分割し、文法的に接続可能な形態素候補を出力する形
態素解析部と、上記入力文章の朗読音声が入力されて、この朗読音声の
音声情報を出力する音声入力部と、上記音声入力部から
の音声情報を分析して音素候補を出力すると共に、上記
音声情報の無音区間を抽出する音響分析部と、上記音響分析部によって抽出された無音区間の長さに基
づいて、上記形態素候補および音素候補を参照して上記
無音区間の中から文節区切りを抽出する文節区切り抽出
部と、上記文節区切り抽出部によって抽出された文節区切りの
位置を参照して、上記形態素解析部によって求められた
形態素候補の中から上記文節区切りが存在しない形態素
候補を選択する形態素候補選択部を備えたことを特徴と
する自動翻訳装置。