JPH02257363A - 自動翻訳装置 - Google Patents

自動翻訳装置

Info

Publication number
JPH02257363A
JPH02257363A JP1079918A JP7991889A JPH02257363A JP H02257363 A JPH02257363 A JP H02257363A JP 1079918 A JP1079918 A JP 1079918A JP 7991889 A JP7991889 A JP 7991889A JP H02257363 A JPH02257363 A JP H02257363A
Authority
JP
Japan
Prior art keywords
morpheme
candidates
phoneme
unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1079918A
Other languages
English (en)
Inventor
Naoki Mizutani
直樹 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1079918A priority Critical patent/JPH02257363A/ja
Publication of JPH02257363A publication Critical patent/JPH02257363A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、ソース言語の文章をターゲット言語の文章
へ変換する自動翻訳装置に関する。
〈従来の技術〉 一般に、自動翻訳装置における翻訳過程は、辞書引き形
態素解析、構文解析、意味解析、構文生成および形態素
生成等を経て実行される。ここで、上記辞書引き形態素
解析においては、辞書を引いて、入力された文章を各形
態素(単語列)に分割し、この各単語に対する品詞など
の文法情報および訳語等を得る。また、上記構文解析に
おいては、単語の懸かり受は等の文章の構造を決定する
。さらに、上記意味解析においては、複数の構文解析の
結果から、意味的に正しいものとそうでないものとに判
別する。そして、構文解析結果に基づいて、入力された
ソース言語における文章の構文をターゲット言語におけ
る構文に変換し、この変換したターゲット言語の構文に
対応したターゲット言語の形態素列を生成するのである
従来、自動翻訳装置において辞書引き形態素解析を行う
場合、まず入力文章の字面情報である綴りに基づいて辞
書引きを行う。そして、得られた形態素が隣合う形態素
と文法的に接続可能か否かをチエツクし、接続可能な場
合にその形態素を目的とする形態素として確定するので
ある。また、文節は、得られた形態素のパターンに基づ
いて決定している。
〈発明が解決しようとする課題〉 しかしながら、上記辞書引き形態素解析においては、一
般に複数の解が生成され、形態素解析の段階では妥当な
解(すなわち、正しい単語)が決定できない場合が多い
。すなわち、構文解析や意味解析の段階でようやく解が
決定され、そのため翻訳処理が大変複雑になるという問
題がある。また、解の決定に失敗して、使用者の意図す
るものとは異なる翻訳結果が生成されることが多いとい
う問題もある。
すなわち、例えば1つの単語に対して複数の異なる意味
がある同音異義語の意味を形態素解析段階で決定できな
いため、意味解析による文脈的情報を利用して意味候補
を決定する必要があり、複雑な処理を必要とする。また
、日本語の場合、単語間に切れ目を置かずにべた書きす
るため、辞書引きによって得られる単語の候補が多数存
在して形態素解析の解が増えるため、特に形態素解析後
の処理に大きな負担が掛かる。
そこで、この発明の目的は、得られた形態素候補の数を
少数の正解に近い形態素候補に絞ることによって、形態
素同定精度を向上すると共に形態素解析後の処理を容易
にする自動翻訳装置を提供することにある。
〈課題を解決するための手段〉 ・上記目的を達成するため、第1の発明は、入力された
文章の形態素解析を行い、この形態素解析の結果得られ
た形態素列の構文を解析して目標言語におけ・る構文構
造を求め、得られた目標言語の構文構造に従って翻訳文
を生成する自動翻訳装置において、上記形態素解析の際
に、辞書を用いて入力文章を形態素に分割し、文法的に
接続可能な形態素候補を出力する形態素解析部と、上記
入力文章の朗読音声が入力されて、この朗読音声の音声
情報を出力する音声入力部と、上記音声入力部からの音
声情報を分析して音素を求めて、音素候補を出力する音
響分析部と、上記音響分析部によって求められた音素候
補を参照して、上記形態素解析部によって求められた形
態素候補の中から上記音素候補を組合せた音素列から成
る形態素候補を選択する形態素候補選択部を備えたこと
を特徴としている。
また、この発明の自動翻訳装置は、入力された文章の文
節区切りを抽出する文節区切り抽出部を備えて、上記音
響分析部は、音素候補を出力すると共に上記音声情報の
無音区間を抽出するようにし、上記文節区切り抽出部は
、上記音響分析部によって抽出された無音区間の長さに
基づいて、上記形態素候補および音素候補を参照して上
記無音区間の中から文節区切りを抽出するようにし、上
記形態素候補選択部は、上記音素候補と上記文節区切り
抽出部によって抽出された文節区切りの位置を参照して
、上記形態素解析部によって求められた形態素候補の中
から、上記音素候補を組合せた音素列から成り、かつ、
文節区切りが存在しない形態素候補を選択するようにす
るのが望ま(2い。
また、第2の発明は、入力された文章の形態素解析を行
い、この形態素解析の結果得られた形態素列の構文を解
析して目標言語における構文構造を求め、得られた目標
言語の構文構造に従って翻訳文を生成する自動翻訳装置
において、上記形態素解析の際に、辞書を用いて入力文
章を形態素に分割し、文法的に接続可能な形態素候補を
出力する形態素解析部と、上記入力文章の朗読音声が入
力されて、この朗読音声の音声情報を出力する音声入力
部と、上記音声入力部からの音声情報を分析して音素候
補を出力すると共に、上記音声情報の無音区間を抽出す
る音響分析部と、上記音響分析部によって抽出された無
音区間の長さに基づいて、上記形態素候補および音素候
補を参照して上記無音区間の中から文節区切りを抽出す
る文節区切り抽出部と、上記文節区切り抽出部によって
抽出された文節区切りの位置を参照して、上記形態素解
析部によって求められた形態素候補の中から上記文節区
切りが存在しない形態素候補を選択する形態素候補選択
部を備えたことを特徴としている。
く作用〉 第1の発明において、形態素解析部に文章が入力される
と、上記形態素解析部によって入力文章が形態素に分割
され、文法的に接続可能な形態素候補が出力される。一
方、上記入力文章の朗読音声が音声入力部に入力され、
この朗読音声の音声情報が出力される。そして、音響分
析部によって上記音声入力部からの音声情報が分析され
て音素候補が出力される。そうすると、形態素候補選択
部は、上記音響分析部によって求められた音素候補を参
照して、上記形態素解析部によって求められた形態素候
補の中から上記音素候補を組合せた音素列から成る形態
素候補を選択する。したがって、入力文章の朗読音声の
音声情報に基づいて、上記形態素解析によって得られた
形態素候補をより正解に近い少数の形態素候補に絞り込
むことができる。
また、上記自動翻訳装置は、入力された文章の文節区切
りを抽出する文節区切り抽出部を備えて、上記音響分析
部は、音素候補を出力すると共に上記音声情報の無音区
間を抽出するようにし、上記文節区切り抽出部は、上記
音響分析部によって抽出された無音区間の長さに基づい
て、上記形態素候補および音素候補を参照して上記無音
区間の中から文節区切りを抽出するようにし、上記形態
素候補選択部は、上記音素候補と上記文節区切り抽出部
によって抽出された文節区切りの位置を参照して、上記
形態素解析部によって求められた形態素候補の中から、
上記音素候補を組合せた音素列から成り、かつ、文節区
切りが存在しない形態素候補を選択するようにすれば、
更に正解に近い少数の形態素候補に絞り込むことができ
る。
また、第2の発明において、形態素解析部に文章が入力
されると、上記形態素解析部によって入力文章が形態素
に分割され、文法的に接続可能な形態素候補が出力され
る。一方、上記入力文章の朗読音声が音声入力部に入力
され、この朗読音声の音声情報が出力される。そして、
音響分析部によって上記音声入力部からの音声情報が分
析されて音素候補が出力されると共に、上記音声情報の
無音区間が抽出される。さらに、上記音響分析部によっ
て抽出された無音区間の長さに基づいて、上記形態素候
補および音素候補を参照して、文節区切りが文節区切り
抽出部によって抽出される。
そうすると、形態素候補選択部は、上記文節区切り抽出
部によって抽出された文節区切りの位置を参照して、上
記形態素解析部によって求められた形態素候補の中から
上記文節区切りが存在しない形態素候補を選択する。し
たがって、入力文章の朗読音声の音声情報に基づいて、
上記形態素解析によって得られた形態素候補をより正解
に近い少数の形態素候補に絞り込むことができる。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図は第1の発明における一実施例のブロック図であ
る。文章入力部lにソース言語による文章(例えば、日
本語漢字仮名混じり文)が入力される。そうすると、入
力文章は文章表示部2に表示される一方、形態素解析部
3に入力される。形態素解析部3における辞書検索部4
では、辞書15を検索して入力文がどのような形態素か
ら構成されているかを調べ、形態素候補が総て抽出され
る。
そして、接続チエツク部5において、辞書引きの結果得
られた形態素の文法情報に基づいて接続表16を参照し
て形態素の文法的な接続のチエツクが行われる。その結
果、文法的に接続可能な形態素候補を総て並べた単語ラ
チスが生成される。
第2図は入力文章「表から行って上手に断った」に対応
する単語ラチスの一例を示す。単語ラチスには、辞書1
5から検索された情報である読みや意味に関する情報等
も含まれている。第2図においては、入力単語「表」に
対しては“ひょう”と“おちて°の2通りの形態素候補
が得られる。同様にして、入力単語「行っ」および「断
つ」に対しても2通りの形態素候補が得られ、入力単語
「上手」に対しては3通りの形態素候補が得られる。そ
の結果、文全体としては各形態素候補の組み合わせによ
って24通りの解釈が得られる。
上述のような、入力文章からの解析の他に、文章表示部
2に表示された文章を使用者が朗読し、その音声が音声
入力部6に入力される。そうすると、音声入力部6は入
力音声を電気信号に変換して音響分析部7に出力する。
音響分析部7では、入力された音声信号の一定区間に対
して1以上のの音素候補が割り当てられて、正解率の高
い音素類に並べた音素ラチスが生成される。第3図は入
力音声「おもてからいってじょうずにことわった」に対
応する音素ラチスの一例を示す。
形態素候補選択部8は、第2図に示すような単語ラチス
の形態素候補の中から、単語ラチスに記述された形態素
候補の読みに基づいて、その形態素候補の読みをたどる
ことができる音素列が音素ラチスの音素候補中に存在す
るか否かを調べる。
その結果、形態素候補の読みをたどることができる音素
列が音素ラチスの音素候補の中に存在するような形態素
候補、あるいは、形態素候補の読みをたどることができ
る音素列が音素ラチスに存在する可能性が高い形態素候
補のみを残し、他の形態素候補を単語ラチスから除去す
る。すなわち、第2図において、最初の形態素候補「表
」の読み/ひょう/をたどることができる音素列が、第
3図の音素ラチスの音素候補をどのように組み合わせて
も得られないので、形態素候補「表(ひょう)」を単語
ラチスから除去する。同様に、形態素候補「行っ」の読
み/おこなっ/をたどることができる音素列が3図の音
素ラチスから得られないので、形態素候補「行っ(おこ
なっ)」を単語ラチスから除去するのである。一方、形
態素候補「表」の読み/おもて/をたどることができる
音素列10mote/が、第3図の音素ラチスの音素候
補の組み合わせの中に存在するので、形態素候補「表(
おして)」を単語ラチスに残すのである。こうすること
によって、単語ラチスの形態素候補を正解に近い候補に
絞ることができ、各形態素候補の組み合わせが大幅に減
少され、形態素解析に続く処理における計算量を低減で
きるのである。
その後、文節決定部9で、「自立語+付属語」等の形態
素パターンに基づいて、形態素候補選択部8によって修
正された単語ラチスから文節が生成される。そうすると
、構文解析部10で、文節決定部9によって生成された
文節を構成する単語の文法情報に基づいて、文節間の修
飾関係が求められる。そして、意味解析部11で、辞書
検索部4によって得られた単語の意味や構文解析部10
によって得られた構文情報に基づいて、ソース言語にお
ける文章の意味が求められる。
そうすると、構文生成部12は、意味解析部11によっ
て求められたソース言語における文章の意味情報に基づ
いて、ターゲット言語に則した構文情報を生成する。そ
して、形態素生成部13は、構文生成部12によって生
成されたターゲット言語における構文情報に、辞書検索
部4による辞書引きによって得られたターゲット言語の
給電情報を当て嵌めて、ターゲット言語による文章を生
成し、翻訳文出力部14から出力する。
このように、本実施例では、翻訳処理過程における辞書
引き形態素解析において、入力されたソース言語の文章
から形態素解析部3によって単語ラチスを求める。一方
、上記ソース言語の入力文章を朗読した音声を音声入力
部6に入力し、さらに音響分析部7で音響分析して音素
ラチスを求める。そして、形態素候補選択部8によって
、上記単語ラチスの形態素候補の中から、その読みをた
どることができる音素列が音素ラチスの音素候補の中に
存在するような形態素候補、あるいは、その読みをたど
ることかできる音素列が音素ラチスに存在する可能性が
高い形態素候補のみを選択して残(2、他の形態素候補
を単語ラチスから除去する。こうすることによって、単
語ラチスの形態素候補数を減らして各形態素候補の組合
せ数(すなわち、得られる文節候補数)を大幅に減少す
ることができる。したがって、形態素解析に続く構文解
析、意味解析、構文生成および形態素生成等における計
算中を低減できるのである。
また、本実施例においては、形態素解析部3によって得
られた多くの形態素候補を、音声情報に基づいて正解に
近い形態素候補に絞ることができ、より正確に形態素を
同定することができる。したがって、この発明によれば
音(おと)は“5ound”に翻訳することができ、音
(ね)は“tone”に翻訳することができ、適確な翻
訳文を得ることができるのである。
第4図は第2の発明における一実施例のブロック図であ
る。文章入力部21にソース言語による文章(例えば、
日本語漢字仮名混じり文)が入力される。そうすると、
入力文章は文章表示部22に表示される一方、形態素解
析部23に入力される。
形態素解析部23における辞書検索部24では、辞書3
6を検索して入力文がどのような形態素から構成されて
いるかを調べ、形態素候補が総て抽出される。そして、
接続チエツク部25において、辞書引きの結果得られた
形態素の文法情報に基づいて接続表37を参照して形態
素の文法的な接続のチエツクが行われる。その結果、文
法的に接続可能な形態素候補を総て並べた単語ラチスが
生成される。
第5図は入力文章「ここではきものをぬげ」に対応する
単語ラチスの一例を示す。単語ラチスには、辞書36か
ら検索された情報である読みや意味に関する情報等も含
まれている。第5図においては、「ではきもの」に対し
て[ではj+「きものjと「で」+「はきもの」との2
通りの解釈が得られる。
上述のような、入力文章からの解析の他に、文章表示部
22に表示された文章を使用者が朗読し、その音声が音
声入力部26に入力される。そうすると、音声入力部2
6は入力音声を電気信号に変換して音響分析部27に出
力する。音響分析部27では、入力された音声信号の一
定区間に対して1以上の音素候補が割り当てられて、正
解率の高い音素類に並べた音素ラチスが生成される。第
6図は入力音声「ここではきものをぬげ」に対応する音
素ラチスの一例を示す。図中、“*”印は無音区間を示
す。
ここで、第6図の音素ラチスの音素候補においては、「
はきもの」の「は」の音素候補として/wa/ら候補に
なっている。そのため、第1の発明の場合のように、そ
の読みをたどることができる音素列が音素ラチスの音素
候補の中に存在するような形態素候補を単語ラチスに残
すと、形態素候補「では」、「きもの」、「で」および
「はきもの」が総て残ってしまう。したがって、この場
合は、第1の発明の場合のように音素ラチスの音素候補
のみを参照して単語ラチスの形態素候補を同定するのは
有効ではないと言える。そこで、第2の発明においては
、音素ラチスの音素候補の中に無音情報があることに注
目して。音素候補の無音情報を用いて形態素候補の同定
を行うのである。
文節区切り抽出部28は、音響分析部27から入力され
る音素候補情報に基づいて、無音区間長を調べる。そし
て、無音区間長が音素区間長に比べて十分に長い(例え
ば、標準音素区間長の3倍以上)無音区間があり、かつ
、単語ラチス中に、この無音区間の直前の音素で終わる
形態素候補あるいは上記無音区間の直後の音素で始まる
形態素候補がある場合に、上記無音区間の位置を文節の
区切りと確定するのである。すなわち、第6図において
は、無音区間(イ)が標準音素区間長の3倍有り、この
無音区間(イ)の直前の音素/e/で終わる形態素候補
「で」と無音区間(イ)の直後の音素/h/で始まる形
態素候補「はきもの」が存在する。
そのため、上記無音区間(イ)を文節区切りと確定する
のである。
形態素候補選択部29は一つの形態素中においては文節
区切りは起こり得ないとして、音素ラチスを参照して単
語ラチスの形態素候補の中から、形態素中に文節区切り
がある形態素候補を除去する。すなわち、第5図および
第6図においては、音素ラチスから/kokode/の
後に文節区切りが検出されているので、形態素中に文節
区切りがある形態素候補「では」が単語ラチスから除去
されるのである。一方、形態素候補「で」および「はき
もの」は形態素中に文節区切りがないので単語ラチスに
残すのである。こうすることによって、単語ラチスの形
態素候補を正解に近い候補に絞ることができ、各形態素
候補の組合せが大幅に減少され、形態素解析に続く処理
における計算量を低減できるのである。
その後、文節決定部30で、形態素パターンおよび文節
区切り抽出部28で抽出された文節区切りに基づいて、
形態素候補選択部29によって修正された単語ラチスか
ら文節が生成される。上記形態素パターンとしては「自
立語+付属語」等があり、文節区切り抽出部28で抽出
された文節区切りを手掛かりとして、文節を構成する形
態素パターンを探していき、得られた形態素パターンに
対応する形態素を選択して文節を得るのである。そうす
ると、構文解析部31で、文節決定部30によって生成
された文節を構成する単語の文法情報に基づいて、文節
間の修飾関係が求められる。そして、意味解析部32で
、辞書検索部24によって得られた単語の意味や構文解
析部31によって得られた構文情報に基づいて、ソース
言語における文章の意味が求められる。
構文生成部33は、意味解析部32によって求められた
ソース言語における文章の意味情報に基づいて、ターゲ
ット言語に則した構文情報を生成する。モしてζ形態素
生成部34は、構文生成部33によって生成されたター
ゲット言語における構文情報に、辞書検索部24による
辞書引きによって得られたターゲット言語の給量情報を
当て嵌めて、ターゲット言語による文章を生成し、翻訳
文出力部35から出力する。
このように、本実施例では、翻訳処理過程における辞書
引き形態素解析において、入力されたソース言語の文章
から形態素解析部23によって単語ラチスを求める。一
方、上記ソース言語の入力文章を朗読した音声を音声入
力部26に入力し、さらに音響分析部27で音響分析し
て音素ラチスを求める。そして、得られた音素ラチスと
単語ラチスとを参照して、音素ラチスにおけろ無音区間
から文節区切りの位置を確定する。そして、形態素候補
選択部29によって、上記単語ラチスの形態素候補の中
から、文節区切りが存在する形態素候補を除去し、文節
区切りが存在しない形態素候補のみを選択1、て単語ラ
チスに残すのである。こうすることによって、単語ラチ
スの形態素候補数を減らして各形態素候補の組合せ数を
大幅に減少することができる。したがって、形態素解析
に続く構文解析、意味解析、構文生成および形態素生成
における計算量を低減できるのである。
また、本実施例によれば、形態素解析部23によって得
られた多くの形態素候補を、音声情報に基づいて正解に
近い形態素候補に絞ることができ、より正確に形態素を
同定することゆくできる。
上記各実施例においては、単語ラチスの形態素候補の中
から、その読みをたどることができる音素列が音素ラチ
スの音素候補中に存在する(あるいは、存在する可能性
が高い)形態素候補のみを選出する(以下、第1単語ラ
チス修正と言う)か、あるいは、上記単語ラチスの形態
素候補の中から、文節区切りが存在しない形態素候補の
みを選出する(以下、第2単語ラチス修正と言う)かの
いずれかを実施するようにしている。しかじから、この
発明はこれに限定されるものではなく、第1単語ラチス
修正と第2単語ラチス修正とを併用すれば、更に形態素
の同定を精度良く行うことができるのである。その際に
、通常の場合は第1単語ラチス修正を実行し、文節区切
り情報を必要とする場合(例えば、日本語文章における
仮名連鎖部の場合や上記第1単語ラチス修正を行った後
において、一つの入力単語に対してまだ所定数以上の形
態素候補が存在する場合等)にのみ、第2単語ラチス修
正を実行するようにしてもよい。
〈発明の効果〉 以上より明らかなように、第1の発明の自動翻訳装置は
、形態素解析部、音声入力部、音響分析部および形態素
候補選択部を備えて、上記形態素解析部によって入力文
章を形態素に分割して形態素候補を出力する一方、上記
音声入力部によって上記入力文章の朗読音声の音声情報
を出力し、上記音響分析部によって上記音声情報を分析
して音素候補を出力し、上記形態素候補選択部によって
、上記音素候補を参照して上記形態素候補の中から音素
候補を組合せた音素列から成る形態素候補を選択するよ
うにしたので、上記形態素候補の数を減らして形態素解
析後の処理を容易にすることができる。また、上記形態
素解析部によって得られた形態素候補の中から、入力文
章の朗読音声の音声情報に基づいてより正解に近い形態
素候補を選択することができ、形態素同定精度を向上で
きる。
また、この発明の自動翻訳装置は、文節区切り抽出部を
備えて、上記音響分析部は、音素候補を出力すると共に
上記音声情報の無音区間を抽出し、上記文節区切り抽出
部は、上記形態素候補および音素候補を参照しつつ無音
区間長に基づいて文節区切りを抽出し、上記形態素候補
選択部は、上記音素候補および文節区切りの位置を参照
して、上記形態素解析部によって求められた形態素候補
の中から、上記音素候補を組合せた音素列から成り、か
つ、文節区切りが存在しない形態素候補を選択するよう
にしたので、更に形態素解析後の処理を容易にして形態
素同定精度を向上できる。
また、第2の発明の自動翻訳装置は、形態素解析部、音
声入力部、音響分析部9文節区切り抽出部および形態素
候補選択部を備えて、上記形態素解析部によって入力文
章を形態素に分割して形態素候補を出力する一方、上記
音声入力部によって上記入力文章の朗読音声の音声情報
を出力し、上記音響分析部によって音素候補を出力する
と共に上記音声情報の無音区間を抽出し、上記文節区切
り抽出部によって上記無音区間の長さに基づいて文節区
切りを抽出し、上記形態素候補選択部によって、上記文
節区切りの位置を参照して上記形態素候補の中から文節
区切りが存在しない形態素候補を選択するようにしたの
で、上記形態素候補の数を減らして形態素解析後の処理
を容易にすることができる。また、上記形態素解析部に
よって得られた形態素候補の中から、入力文章の朗読音
声の音声情報に基づいてより正解に近い形態素候補を選
択することができ、形態素同定精度を向上できる。
【図面の簡単な説明】
第1図は第1の発明における一実施例のブロック図、第
2図は第1図の形態素解析部によって得られた単語ラチ
スの一例を示す図、第3図は第1図の音響分析部によっ
て得られた音素ラチスの一例を示す図、第4図は第2の
発明における一実施例のブロック図、第5図は第4図の
形態素解析部によって得られた単語ラチスの一例を示す
図、第6図は第4図の音響分析部によって得られた音素
ラチスの一例を示す図である。 1.21・・・文章入力部、2.22・・・文章表示部
、3.23・・・形態素解析部、4.24・・・辞書検
索部、5.25・・・接続チエツク部、 6.26・・・音声入力部、7,27・・・音響分析部
、8.29・・・形態素候補選択部、 9.30・・・文節決定部、10.31・・・構文解析
部、11.32・・・意味解析部、12.33・・・構
文生成部、13.34・・・形態素生成部、 14.35・・・翻訳文出力部、15.36・・・辞書
、16.37・・・接続表、  28・・・文節区切り
抽出部。

Claims (3)

    【特許請求の範囲】
  1. (1)入力された文章の形態素解析を行い、この形態素
    解析の結果得られた形態素列の構文を解析して目標言語
    における構文構造を求め、得られた目標言語の構文構造
    に従って翻訳文を生成する自動翻訳装置において、 上記形態素解析の際に、辞書を用いて入力文章を形態素
    に分割し、文法的に接続可能な形態素候補を出力する形
    態素解析部と、 上記入力文章の朗読音声が入力されて、この朗読音声の
    音声情報を出力する音声入力部と、上記音声入力部から
    の音声情報を分析して音素を求めて、音素候補を出力す
    る音響分析部と、上記音響分析部によって求められた音
    素候補を参照して、上記形態素解析部によって求められ
    た形態素候補の中から上記音素候補を組合せた音素列か
    ら成る形態素候補を選択する形態素候補選択部を備えた
    ことを特徴とする自動翻訳装置。
  2. (2)請求項1に記載の自動翻訳装置において、入力さ
    れた文章の文節区切りを抽出する文節区切り抽出部を備
    え、 上記音響分析部は、音素候補を出力すると共に、上記音
    声情報の無音区間を抽出するようにし、上記文節区切り
    抽出部は、上記音響分析部によって抽出された無音区間
    の長さに基づいて、上記形態素候補および音素候補を参
    照して上記無音区間の中から文節区切りを抽出するよう
    にし、 上記形態素候補選択部は、上記音素候補と上記文節区切
    り抽出部によって抽出された文節区切りの位置を参照し
    て、上記形態素解析部によって求められた形態素候補の
    中から、上記音素候補を組合せた音素列から成り、かつ
    、文節区切りが存在しない形態素候補を選択するように
    したことを特徴とする自動翻訳装置。
  3. (3)入力された文章の形態素解析を行い、この形態素
    解析の結果得られた形態素列の構文を解析して目標言語
    における構文構造を求め、得られた目標言語の構文構造
    に従って翻訳文を生成する自動翻訳装置において、 上記形態素解析の際に、辞書を用いて入力文章を形態素
    に分割し、文法的に接続可能な形態素候補を出力する形
    態素解析部と、 上記入力文章の朗読音声が入力されて、この朗読音声の
    音声情報を出力する音声入力部と、上記音声入力部から
    の音声情報を分析して音素候補を出力すると共に、上記
    音声情報の無音区間を抽出する音響分析部と、 上記音響分析部によって抽出された無音区間の長さに基
    づいて、上記形態素候補および音素候補を参照して上記
    無音区間の中から文節区切りを抽出する文節区切り抽出
    部と、 上記文節区切り抽出部によって抽出された文節区切りの
    位置を参照して、上記形態素解析部によって求められた
    形態素候補の中から上記文節区切りが存在しない形態素
    候補を選択する形態素候補選択部を備えたことを特徴と
    する自動翻訳装置。
JP1079918A 1989-03-30 1989-03-30 自動翻訳装置 Pending JPH02257363A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1079918A JPH02257363A (ja) 1989-03-30 1989-03-30 自動翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1079918A JPH02257363A (ja) 1989-03-30 1989-03-30 自動翻訳装置

Publications (1)

Publication Number Publication Date
JPH02257363A true JPH02257363A (ja) 1990-10-18

Family

ID=13703677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1079918A Pending JPH02257363A (ja) 1989-03-30 1989-03-30 自動翻訳装置

Country Status (1)

Country Link
JP (1) JPH02257363A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0561905A (ja) * 1991-08-30 1993-03-12 Agency Of Ind Science & Technol 文章解析装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0561905A (ja) * 1991-08-30 1993-03-12 Agency Of Ind Science & Technol 文章解析装置

Similar Documents

Publication Publication Date Title
US7263488B2 (en) Method and apparatus for identifying prosodic word boundaries
KR20080045413A (ko) 정적 특성과 동적 특성이 반영된 끊어읽기 예측 방법 및이를 기반으로 하는 음성합성 방법 및 시스템
KR100669241B1 (ko) 화행 정보를 이용한 대화체 음성합성 시스템 및 방법
CN105895076B (zh) 一种语音合成方法及***
JPH06282290A (ja) 自然言語処理装置およびその方法
JPH02257363A (ja) 自動翻訳装置
Akinwonmi Development of a prosodic read speech syllabic corpus of the Yoruba language
KR100304654B1 (ko) 한국어문서해석방법및장치
KR19980047177A (ko) 한국어 문서 음성 변환 시스템을 위한 문서 분석기
JPH07262191A (ja) 単語分割方法、および音声合成装置
Zervas et al. Development and evaluation of a prosodic database for Greek speech synthesis and research∗
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
KR0180650B1 (ko) 음성합성기의 한국어 문장분석방법
JPS60188995A (ja) 文章発声方法
KR940022312A (ko) 기계번역장치 및 방법
Külekci Statistical morphological disambiguation with application to disambiguation of pronunciations in Turkish
JPH07110807A (ja) 文書読み上げ装置
Guirao et al. A “toolbox” for tagging the Spanish C-ORAL-ROM corpus
Wang et al. The broad study of homograph disambiguity for mandarin speech synthesis
KR0136423B1 (ko) 발음 제어 기호의 유효성 판정을 이용한 음운 변동 처리 방법
Fang A Prototype Text Analyzer for Mandarin Chinese TTS system
JP3084864B2 (ja) 文章入力装置
JPH09281993A (ja) 発音記号生成装置
KR20050006936A (ko) 한국어 대화체 음성합성시스템의 특정 형태에 대한 선택적운율 구현 방법
Campbell et al. Prosodic encoding of syntactic structure for speech synthesis