JP3267168B2 - 自然言語変換システム - Google Patents

自然言語変換システム

Info

Publication number
JP3267168B2
JP3267168B2 JP23595496A JP23595496A JP3267168B2 JP 3267168 B2 JP3267168 B2 JP 3267168B2 JP 23595496 A JP23595496 A JP 23595496A JP 23595496 A JP23595496 A JP 23595496A JP 3267168 B2 JP3267168 B2 JP 3267168B2
Authority
JP
Japan
Prior art keywords
target language
language
vocabulary
speech
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23595496A
Other languages
English (en)
Other versions
JPH1063668A (ja
Inventor
真子 田村
伸一 土井
真一郎 亀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP23595496A priority Critical patent/JP3267168B2/ja
Publication of JPH1063668A publication Critical patent/JPH1063668A/ja
Application granted granted Critical
Publication of JP3267168B2 publication Critical patent/JP3267168B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ある自然言語(原
言語)から他の自然言語(目的言語)への変換を行う自
然言語変換システムに関し、特に複数言語混じり文であ
る原文(主として原言語によって記述された文)を訳文
(目的言語によって記述された文。目的言語文とも表記
する)に変換する自然言語変換システムに関する。な
お、「複数言語混じり文である原文」とは、原言語によ
る語彙と共に目的言語による語彙(目的言語語彙)を含
む原文を意味する。
【0002】
【従来の技術】従来より、複数言語混じり文である原文
を目的言語文に変換する自然言語変換システムは、原文
に目的言語語彙が混じっている際にも目的言語の変換結
果(目的言語文)の質が落ちないようにすることを目的
として採用・開発されている。
【0003】例えば、特開平3−63764号公報で
は、原文に直接入力された目的言語語彙(原則として原
言語による語彙で構成された原文に挿入されている目的
言語語彙)に対して目的言語辞書を引き、その目的言語
語彙が未登録語として扱われることを防ぐことにより、
正しい目的言語文への変換を実現できるシステムが、提
案されている。
【0004】
【発明が解決しようとする課題】上記のように、従来技
術では、自然言語の変換用辞書の他に目的言語辞書を備
えて、原文に目的言語語彙が直接入力された際に目的言
語辞書を引くことで原文中の該目的言語語彙が未登録語
として扱われることを防ぎ、適切な目的言語文への変換
を可能ならしめていた。
【0005】しかし、従来技術では、原文に直接入力さ
れた目的言語語彙が、その直前または直後の原言語の語
彙(機能語)と組み合わさって句をなすことが推定され
た場合に、その句全体から見て該目的言語語彙の実際の
品詞が適切であるかどうかの判断は行われていなかっ
た。
【0006】例えば、日本語から英語への変換を行う自
然言語変換システムにおいて、「frequentに起
こる」という入力があった場合を考える。この場合に、
「frequent」の英語としての品詞は形容詞であ
るが、「frequentに」全体は機能語の「に」の
存在によって日本語としての副詞句となるので、英語の
訳文においては「frequentに」を「frequ
ently」という副詞で訳出する必要がある。しかし
ながら、上記の従来技術では、このような必要性に対応
することができなかった。
【0007】本発明の目的は、上述の点に鑑み、複数言
語混じり文である原文を目的言語文に変換する場合にお
いて、原文中に直接入力された目的言語語彙がそれを含
む句の単位といったより広範な範囲から見て目的言語文
で求められる品詞であるかどうかの判断を行い、該目的
言語語彙が目的言語文で求められる品詞でない場合には
求められる(適正な)品詞の目的言語語彙に置き換えて
目的言語文を生成することができる自然言語変換システ
ムを提供することにある。なお、ここでいう「品詞」と
は、日本語における「サ変(サ行変格活用)語幹」のよ
うな屈折形に関する種別を示す情報を含むものとする。
【0008】
【課題を解決するための手段】本発明の自然言語変換シ
ステムは、原言語を目的言語に翻訳するための情報を保
持する翻訳辞書部と、目的言語の情報を保持する目的言
語辞書部と、原言語句構成情報と目的言語語彙品詞情報
と原言語句対応目的言語品詞情報との対応を格納する対
訳知識ベース部と、前記翻訳辞書部の原言語部分を参照
して原文を形態素に分割し、該原文に直接入力された目
的言語語彙を該原文から切り出し、前記翻訳辞書部の原
言語部分を用いて該目的言語語彙を含む句を認識し、該
句の機能語の内容に基づいて該目的言語語彙の原言語に
おける品詞を推定する原文解析部と、前記原文解析部か
ら原文に直接入力された目的言語語彙を受け取り、前記
目的言語辞書部を検索して該目的言語語彙の目的言語に
おける品詞を取得する目的言語語彙保持部と、前記原文
解析部から原文中の目的言語語彙の品詞推定結果を受け
取り、前記目的言語語彙保持部から該原文中の該目的言
語語彙の辞書検索結果を受け取り、該品詞推定結果と該
辞書検索結果とを合わせた情報によって前記対訳知識ベ
ース部を検索して該目的言語語彙の適正品詞を取得し、
該目的言語語彙の表層と該適正品詞とをキーにして前記
目的言語辞書部を検索して該目的言語語彙と同語源の該
適正品詞の目的言語表現を取得し、該目的言語表現を使
用して訳文を生成する訳文生成部とを有する。
【0009】また、本発明の自然言語変換システムは、
上記の自然言語変換システムにおける前記訳文生成部
に、「前記対訳知識ベース部の検索結果として得られた
適正品詞をキーとする前記目的言語辞書部の検索におい
て原文中の目的言語語彙と同語源の該適正品詞の目的言
語表現が得られなかった場合に、前記翻訳辞書部を検索
して訳文に使用する目的言語表現を取得する」という機
能を持たせることも可能である。
【0010】さらに、本発明の自然言語変換システム
は、上記の自然言語変換システムにおいて、原言語での
目的言語を起源とする外来語とその外来語に対応する目
的言語表現とを格納する外来語目的言語対応知識ベース
部を加え、前記原文解析部に「原文中に入力された原言
語表記の目的言語起源の語彙を切り出し、該語彙をキー
にして前記外来語目的言語対応知識ベース部を検索して
該語彙に対応する目的言語表現を取得し、該目的言語表
現によって目的言語起源の該語彙を置き換えて該目的言
語表現を目的言語語彙として該原文の解析を行う」とい
う機能を持たせることも可能である。
【0011】
【発明の実施の形態】次に、本発明について図面を参照
して説明する。
【0012】(1) 第1の実施の形態 図1は、本発明の自然言語変換システムの第1の実施の
形態の構成を示すブロック図である。
【0013】本形態の自然言語変換システムは、原文解
析部1と、翻訳辞書部2と、目的言語語彙保持部3と、
目的言語辞書部4と、訳文生成部5と、対訳知識ベース
部6とを含んで構成されている(構成要素間にはデータ
線12,13,15,34,35,52,54,および
56が存在する)。
【0014】図2(a)〜(g)は、本形態の自然言語
変換システムの具体的な動作を説明するための図であ
る。
【0015】図3は、対訳知識ベース部6の構成と具体
的な内容とを示す図である。この図に示すように、対訳
知識ベース部6は、原言語における「機能語と該機能語
と共に句を構成する語(日本語においては一般的に「自
立語」と呼ばれる)の原言語における品詞との組み合わ
せ」を示す原言語句構成情報60(該機能語を示す情報
を機能語情報62といい、該句を構成する機能語以外の
語(日本語では自立語)の品詞を示す情報を品詞情報6
1という)と、該句中の機能語以外の語が目的言語語彙
である場合の該目的言語語彙の目的言語における品詞を
示す目的言語語彙品詞情報63と、該句に対応する目的
言語表現の目的言語における品詞を示す原言語句対応目
的言語品詞情報64とを、対応させて格納している知識
ベースである。
【0016】図4は、本形態の自然言語変換システムの
処理を示す流れ図である。この処理は、形態素単位分割
ステップ401と、目的言語語彙切出しステップ402
と、品詞推定ステップ403と、目的言語辞書部検索ス
テップ404と、目的言語品詞辞書検索結果設定ステッ
プ405と、不存在印辞書検索結果設定ステップ406
と、適正品詞取得ステップ407と、適正品詞目的言語
表現取得ステップ408と、該目的言語表現使用訳文生
成ステップ409とからなる。
【0017】次に、図1〜図4を参照して、具体例を挙
げながら本実施例の自然言語変換システムの動作を説明
する。
【0018】この例では、原言語が日本語で目的言語が
英語である場合について説明する。しかし、他の言語対
(原言語と目的言語との対)においても全く同じ構成で
同じ効果を持つ自然言語変換システムを実現できること
はいうまでもない。
【0019】原文解析部1は、自然言語変換における原
文(目的言語語彙を含む原文)を入力すると、以下の
〜に示すような処理を行う。
【0020】 まず、原言語を目的言語に翻訳するた
めの情報を保持する翻訳辞書部2の原言語部分をデータ
線12を介して参照して形態素解析を行い、該原文を翻
訳辞書部2の原言語部分を用いて形態素の単位に分割す
る(ステップ401)。
【0021】 次に、該原文に直接入力された目的言
語語彙を該原文から切り出し(ステップ402)、翻訳
辞書部2の原言語部分を用いて該目的言語語彙の原言語
における品詞を推定する(ステップ403)。すなわ
ち、該目的言語語彙を機能語以外の語(日本語であれば
自立語)として含む句(該目的言語語彙とそれに隣接す
る(直前または直後に存在する)機能語とからなる句)
を抽出し、該句中の機能語の解析に基づいて該目的言語
語彙の原言語における品詞(該目的言語語彙を原言語の
語彙として取り扱う際の品詞)を推定する。
【0022】 該原文から切り出した該目的言語語彙
をデータ線13を介して目的言語語彙保持部3に送信す
る。
【0023】 また、該目的言語語彙の品詞推定結果
を該原文の形態素分割結果に付与して、その解析結果
(該品詞推定結果が付与された形態素分割結果)をデー
タ線15を介して訳文生成部5に送信する。
【0024】図2(a)は、目的言語語彙を含む原文の
例を示す図である。
【0025】図2(b)は、原文解析部1により図2
(a)の原文が形態素分割された結果を示す図である。
【0026】図2(c)は、原文解析部1により原文
(図2(a)の原文)中に直接入力された目的言語語彙
として検出されたデータ(目的言語語彙に該当するf
requent)を示す図である。
【0027】図2(b)では、図2(a)の「地震がf
requentに起こる。」が、「地震」,「が」,
「目的言語語彙(frequent)」,「に」,
「起こる」,および「。」と形態素単位に分割されてい
る。このうち、図2(c)に示すような「freque
nt」が、目的言語語彙として抽出される。このデータ
(目的言語語彙)は、データ線13を介して、目的言語
語彙保持部3に送信される。
【0028】図2(d)は、データ線15を介して訳文
生成部5に送信されるデータ(解析結果)の例を示す図
である。このデータは、図2(c)の目的言語語彙(f
requent)を含む句(frequentに)の機
能語に該当する「に」をキーにして翻訳辞書部2が検索
され、「に」の直前に接続し得る語(該句を構成する機
能語以外の語(日本語では自立語))の原言語(ここで
は日本語)における品詞が推定され、該推定品詞の情報
が「に」の直前に現れている目的言語語彙に付与された
ものである。図2(d)の例においては、原文中の「f
requent」の品詞は、助詞または形容動詞語尾の
「に」の直前にあることから、名詞,サ変語幹,および
形容動詞語幹のいずれかであると推定されている。
【0029】目的言語語彙保持部3は、原文解析部1か
ら目的言語語彙を受け取り、以下の〜に示す処理を
行う。
【0030】 原文解析部1から受け取った目的言語
語彙をキーにして、データ線34を介し目的言語辞書部
4(目的言語の情報を保持する辞書部)を検索する(ス
テップ404)。
【0031】 の検索で目的言語辞書部4に該目的
言語語彙が存在した場合には、該目的言語語彙の目的言
語における品詞を示す辞書検索結果を該目的言語語彙に
付与する(ステップ405)。
【0032】 一方、の検索で目的言語辞書部4に
該目的言語語彙が存在しなかった場合には、「存在しな
いという印」を示す辞書検索結果を該目的言語語彙に付
与する(ステップ406)。
【0033】 またはの辞書検索結果が付与され
た該目的言語語彙をデータ線35を介して訳文生成部5
に送信する。
【0034】図2(e)は、図2(a)の原文中の目的
言語語彙の「frequent」が目的言語辞書部4に
存在する場合に、データ線35を介して訳文生成部5に
送信されるデータを示す図である。ここで、「品詞:形
容詞」が辞書検索結果に該当する。
【0035】訳文生成部5は、原文解析部1から該原文
の解析結果(該原文中の該目的言語語彙の品詞推定結果
を含む解析結果)を受け取り、目的言語語彙保持部3か
ら該原文中の目的言語語彙の辞書検索結果を受け取り、
以下の〜に示す処理を行う。なお、辞書検索結果が
「存在しないという印」である場合(ステップ406参
照)には、以下の処理は行われず、該目的言語語彙を未
登録語とする処理(従来と同様の処理)が行われる。
【0036】 該品詞推定結果と該辞書検索結果とを
合わせて、その合成情報に基づいてデータ線56を介し
て対訳知識ベース部6を検索し、該目的言語語彙を含む
該句を目的言語に訳出する際の品詞(原言語句対応目的
言語品詞情報64によって示される品詞)をデータ線5
6を介して取得する(ステップ407)。なお、このよ
うにして取得された品詞を該目的言語語彙の「適正品
詞」と呼ぶ。
【0037】すなわち、図3に示すような対訳知識ベー
ス部6に対して、まず原文解析部1で推定された原文中
の該目的言語語彙の品詞をキーにして品詞情報61を検
索する。続いて、該目的言語語彙と共に句を構成する機
能語をキーにして機能語情報62を検索する。さらに、
目的言語語彙保持部3で得られた原文中の目的言語語彙
の目的言語における品詞をキーにして目的言語語彙品詞
情報63を検索する。そして、これら全ての検索結果の
組み合わせにより特定される原言語句対応目的言語品詞
情報64の品詞によって、該目的言語語彙と該機能語と
の組み合わせ(句)に対応する目的言語表現(語または
句)の品詞(適正品詞)を得る。
【0038】 ここで、の検索結果の適正品詞が目
的言語語彙保持部3から受けとった原文中の該目的言語
語彙の実際の品詞(目的言語における品詞)と異なって
いる場合には、該目的言語語彙の表層と該適正品詞とを
キーにして目的言語辞書部4を検索し、該目的言語語彙
と同語源の語彙のうちで該適正品詞に該当する品詞の目
的言語表現をデータ線54を介して取得する(ステップ
408)。なお、適正品詞と実際の品詞とが同一である
場合には、該目的言語語彙を「目的言語表現」として以
下のステップ409の処理を行う。
【0039】 最後に、原言語から目的言語への単語
変換の後に、でデータ線54を介して得た目的言語表
現を原文中の元の該目的言語語彙と置き換え、原言語か
ら目的言語への構文変換や、主語と述語との数素性の調
整等を行って訳文を生成する(適正品詞の目的言語表現
を使用して訳文を生成する)(ステップ409)。
【0040】図2(d)で示すように、図2(a)の原
文中の目的言語語彙の「frequent」はその直後
の語彙が助詞または形容動詞語尾の「に」であることか
ら「名詞」,「サ変語幹」,および「形容動詞語幹」の
いずれかである。
【0041】また、図2(e)で示すように、該目的言
語語彙を目的言語辞書部4で辞書引きした結果(辞書検
索結果)として得られた品詞は「形容詞」である。
【0042】これらの組み合わせによって、図3に示す
ような対訳知識ベース部6を検索すると、該組み合わせ
に対応する目的言語の品詞(適正品詞)は「副詞」であ
ることが分かる。
【0043】すなわち、図3に示す対訳知識ベース部6
の具体的な内容を参照すると、品詞情報61における
「形容動詞語幹」と機能語情報62における「に」と目
的言語語彙品詞情報63における「形容詞」とに対応す
る原言語句対応目的言語品詞情報64は「副詞」である
ことが分かる(図3中の◎を付したエントリを参照のこ
と)。
【0044】そこで、訳文生成部5は、原言語から目的
言語への単語変換の後に、データ線54を介して目的言
語辞書部4を検索し、「frequent」と同語源の
「frequently」という副詞を得て、これを元
の「frequent」と置き換えて、原言語から目的
言語への構文変換や主語と述語との数素性の調整等を行
って訳文の生成を完成させる。
【0045】図2(f)は、図2(a)の原文の自立語
部分を目的言語の単語(語彙)に変換した直後のデータ
を示す図である。
【0046】図2(f)において、鍵括弧『』は、その
中の語彙が未確定であることを示しており、該語彙をそ
の直後の丸括弧()内の品詞(適正品詞)の語彙(目的
言語表現)に置き換えることを指示するという意味を持
つ。
【0047】図2(g)は、未確定であった「freq
uent」を副詞形の「frequently」に置き
換え、さらに構文変換や主語と述語との数素性の調整等
を行って完成させた訳文を示す図である。
【0048】このように、本発明によると、原文中に目
的言語語彙が現れた場合に、その目的言語語彙を含む句
全体から目的言語文で生成すべき該目的言語語彙の品詞
が推定されるので、従来技術の自然言語変換システム
(複数言語混じり文である原文から目的言語文への言語
変換を行う自然言語変換システム)に比べて翻訳結果
(訳文)の質が向上する。
【0049】(2) 第2の実施の形態 図1は、本発明の自然言語変換システムの第2の実施の
形態の構成を示すブロック図でもある。このように、第
2の実施の形態も第1の実施の形態と同様の構成によっ
て実現される。ただし、第2の実施の形態の自然言語変
換システムにおける訳文生成部5は、対訳知識ベース部
6の検索結果として得られた適正品詞をキーとする目的
言語辞書部4の検索において原文中の目的言語語彙と同
語源の該適正品詞の目的言語表現が得られなかった場合
に、翻訳辞書部2を検索して訳文に使用する目的言語表
現を取得する。
【0050】図5(a)〜(g)および図6は、本形態
の自然言語変換システムの具体的な動作を説明するため
の図である。
【0051】次に、以上のような特徴を有する第2の実
施の形態の自然言語変換システムの動作(主として本形
態に特有の動作)について説明する。
【0052】ここでは、訳文生成部5が対訳知識ベース
部6の検索結果として得られた適正品詞をキーとして目
的言語辞書部4を検索した結果、原文中の目的言語語彙
と同語源の該適正品詞の語彙(目的言語表現)が得られ
なかった場合の動作について、具体例を挙げて説明す
る。
【0053】例えば、図5(a)のような「空港にac
cessする。」という原文の入力があった場合には、
図2に示す例に対する処理と同様に、原文解析部1によ
って、図5(b)で示すように「空港」,「に」,「目
的言語語彙(access)」,「する」,およ
び「。」に形態素分割され、図5(c)で示すように
「access」が目的言語語彙として切り出される。
【0054】原文解析部1は、図5(d)で示すよう
に、図5(a)の原文を解析する。この場合には、目的
言語語彙「access」の品詞としてはその直後の機
能語「する」から「サ変語幹」であることが推定され、
このデータ(目的言語語彙「access」の品詞推定
結果「サ変語幹」)は訳文生成部5に送信される。
【0055】一方、図5(e)で示すように、目的言語
語彙保持部3による目的言語辞書部4の検索によって、
目的言語語彙「access」の目的言語としての品詞
は名詞であることが分かり、そのデータ(辞書検索結
果)は訳文生成部5に送信される。
【0056】訳文生成部5は、目的言語語彙「acce
ss」の品詞推定結果である「サ変語幹」と、該目的言
語語彙の直後の機能語の「する」と、目的言語語彙保持
部3で得られた「access」の辞書検索結果の「名
詞」との組み合わせをキーにして、対訳知識ベース部6
を検索する。そして、その検索結果として、対訳知識ベ
ース部6内の原言語句対応目的言語品詞情報64から
「access」を動詞句として訳出すべきというデー
タ(適正品詞が「動詞」であること)を得る(図3中の
○を付したエントリを参照のこと)。
【0057】図5(f)は、図5(a)の原文の自立語
部分を目的言語の単語(語彙)に変換したデータを示す
図である。図5(f)中の鍵括弧『』は、図2に示す例
と同様に、その中の語彙が未確定であることを表し、該
語彙をその直後の丸括弧()内の品詞(適正品詞)の語
彙(目的言語表現)に置き換えることを指示している。
【0058】そこで、訳文生成部5は、「acces
s」の動詞形を得るために、目的言語辞書部4を検索す
る。このとき、「access」と同語源の動詞の語彙
が目的言語辞書部4からは得られなかったとする。この
場合に、訳文生成部5はデータ線52を介して翻訳辞書
部2を検索する。
【0059】この例の場合には、訳文生成部5は、名詞
の「access」を翻訳辞書部2の目的言語部分で検
索し、次に、それに繋がっている原言語見出しのうち品
詞がサ変語幹のものを検索する。さらに、該原言語見出
しに繋がっている目的言語のうち動詞句である「get
access」を検出し、その動詞句を適正品詞の目
的言語表現として、図5(g)に示すような訳文を生成
する。
【0060】図6は、翻訳辞書部2の論理的構造の一例
を示す図である。
【0061】図6で、矢印は訳文生成部5の検索の過程
を辿っていることを表す。また、「*」は任意の文字列
を示しており、この場合には、品詞がサ変語幹である任
意の見出しという意味で用いられている。
【0062】このように、本発明によると、原文中で目
的言語語彙として検出された語彙に対して、適正品詞の
目的言語表現が目的言語辞書部4で検出できない場合に
も、翻訳辞書部2を目的言語部分から辿って検索するこ
とにより、適正品詞の目的言語表現を検出することがで
きる。
【0063】(3) 第3の実施の形態 図7は、本発明の自然言語変換システムの第3の実施の
形態の構成を示すブロック図である。
【0064】本形態の自然言語変換システムは、図1に
示す自然言語変換システムの構成に加えて、外来語目的
言語対応知識ベース部7およびデータ線17を含んで構
成されている。
【0065】図8は、外来語目的言語対応知識ベース部
7の構成および具体的な内容を示す図である。
【0066】外来語目的言語対応知識ベース部7は、原
言語での目的言語を起源とする外来語とその外来語に対
応する目的言語表現とを格納する知識ベースである。例
えば、図8に示すように、日本語における英語起源のカ
タカナ語(外来語)とそれに対応する英語表現との対応
を記述したもの等が該当する。
【0067】このような外来語目的言語対応知識ベース
部7には、言語Aに言語Bの読みを付与し、それを言語
Bから言語Aの方向で検索できるように加工したものが
ある。例えば、日本語の外来語とそれに対応する英語表
現とを例にとると、英語の「computer」をカタ
カナ読みした「コンピュータ」と「コンピューター」
は、図8で示しているように、外来語目的言語対応知識
ベース部7の上では、「コンピュータ」および「コンピ
ューター」のそれぞれから「computer」が検索
できるように加工してある。
【0068】図9(a)〜(g)は、本形態の自然言語
変換システムの具体的な動作を説明するための図であ
る。
【0069】次に、本形態の自然言語変換システムの動
作(主として本形態に特有の動作)について、図7〜図
9を用いて例を挙げながら具体的に説明する。
【0070】ここでも、第1の実施の形態での説明と同
様に、原言語が日本語で目的言語が英語である場合を例
にとって説明する。
【0071】図9(a)に示すような「システムをイン
ストールする。」という原文の入力があったとする。
【0072】原文解析部1は、第1の実施の形態につい
て説明した場合と同様に、翻訳辞書部2をデータ線12
を介して参照し該原文を形態素単位に分割する。
【0073】原文解析部1は、この分割後の形態素解析
において未登録語(翻訳辞書部2の原言語部分に存在し
ない語彙)を検出した場合には、その未登録語が目的言
語起源の外来語(原言語表記の目的言語起源の語彙)で
あるか否かを何らかの基準(例えば、日本語が原文であ
る場合にはカタカナ表記であること)によって判定す
る。
【0074】さらに、原文解析部1は、その未登録語が
目的言語起源の外来語であると判断すると、その未登録
語を目的言語起源の外来語として切り出し、この外来語
をキーとして外来語目的言語対応知識ベース部7を検索
し、該外来語に対応する目的言語表現を取得し、その目
的言語表現で該未登録語(該外来語)を置き換える。
【0075】その上で、原文解析部1は、該目的言語表
現を目的言語語彙として、第1の実施の形態で説明した
と同様に、該原文の解析を行う。
【0076】図9に示す例では、原文解析部1は、図9
(a)の原文中の「インストール」が翻訳辞書部2に見
出しとして登録されていなかった場合に、「インストー
ル」がカタカナ表記であることから「インストール」を
目的言語起源の外来語(原言語表記の目的言語起源の語
彙)として切り出し、これをキーとして外来語目的言語
対応知識ベース部7を検索し、「インストール」に対応
する目的言語表現として「install」を得て、図
9(a)の原文中の「インストール」を「instal
l」に置き換える。
【0077】したがって、原文解析部1による形態素分
割の分割結果は、図9(b)で示しているような結果と
なる。
【0078】後は、第1の実施の形態における処理と同
様に、図9(c)で示すように「install」が目
的言語語彙として切り出され、図9(d)に示すように
該目的言語語彙の品詞が推定される。
【0079】目的言語語彙保持部3および訳文生成部5
は、第1の実施の形態で説明したと同様の処理を行う。
【0080】すなわち、図9の例では、目的言語語彙保
持部3は、原文解析部1から図9(c)のデータをデー
タ線13を介して受け取り、目的言語辞書部4を検索し
て図9(e)の辞書検索結果を得る。
【0081】また、訳文生成部5は、原文解析部1から
図9(d)のデータを受け取り、目的言語語彙保持部3
から図9(e)のデータを受け取り、両データを基にし
て対訳知識ベース部6を検索して、「installす
る」を動詞句として訳出すべきというデータを得て、図
9(f)に示すように原文中の自立語部分を目的言語の
単語に変換する。
【0082】さらに、訳文生成部5は、該原文中の目的
言語語彙である「install」が図9(e)で示す
ように動詞であるので、構文変換等を行って図9(g)
に示すような訳文を生成する。
【0083】このように、本発明によると、原文中に原
言語で表記された目的言語起源の未登録語が入力された
場合にも、原言語表記の目的言語起源の語彙に対応する
目的言語表現を格納した外来語目的言語対応知識ベース
部7を参照して、該未登録語と対応する目的言語表現を
得て、原文中に直接入力された目的言語語彙と同様に該
未登録語(該目的言語表現に置き換えられた未登録語)
を扱うことができる。
【0084】
【実施例】次に、本発明の自然言語変換システムを実施
する際の具体的なコンピュータシステムのハードウェア
構成の例について説明する。
【0085】(1) 第1の実施例 第1の実施例として、先に述べた本発明の第1の実施の
形態および第2の実施の形態に対応する実施例について
説明する。
【0086】図10は、上述した第1の実施の形態およ
び第2の実施の形態の自然言語変換システムを実施する
際の具体的なコンピュータシステムのハードウェア構成
の一例を示すブロック図である。
【0087】このコンピュータシステムは、CPU(C
entral Processing Unit)10
1と、メモリ102と、自然言語変換メモリ103と、
入力装置104と、翻訳辞書部105と、目的言語辞書
部106と、対訳知識ベース部107と、表示装置10
8とを含んで構成されている。また、各構成要素は、C
PU101によって制御されるバス109に接続されて
いる。
【0088】入力装置104は、キーボードやマウス等
の装置で実現される。この入力装置104による入力
は、図1における原文解析部1に対して外部から流入し
ている矢線に対応している。
【0089】表示装置108は、CRT(Cathod
e Ray Tube)ディスプレイ等の装置で実現さ
れる。この表示装置108による出力(表示)は、図1
における訳文生成部5から外部に流出している矢線に対
応している。
【0090】翻訳辞書部105,目的言語辞書部10
6,および対訳知識ベース部107は、それぞれ、図1
中の翻訳辞書部2,目的言語辞書部4,および対訳知識
ベース部6に対応している。これらの各部の内容は、磁
気ディスク装置等に格納されている。
【0091】メモリ102は、オペレーティング・シス
テム等のシステムプログラムを格納すると共に、ワーク
エリアとしても使用される。
【0092】自然言語変換メモリ103は、本コンピュ
ータシステムを本発明の自然言語変換システムとして機
能させるためのプログラムを記憶するメモリであり、フ
ロッピィディスク媒体やRAM(Random Acc
ess Memory)カードや磁気ディスク装置等で
構成されている。
【0093】この自然言語変換メモリ103には、図1
中の原文解析部1,目的言語語彙保持部3,および訳文
生成部5に相当する機能を果たすプログラムが、CPU
101によって読取り可能なコードとして記憶されてい
る。
【0094】CPU101は、このようなプログラムを
バス109を介して読み取り、先に説明した図1中の原
文解析部1,目的言語語彙保持部3,および訳文生成部
5による所定の処理を実行する。
【0095】(2) 第2の実施例 第2の実施例として、先に述べた本発明の第3の実施の
形態に対応する実施例について説明する。
【0096】図11は、上述した第3の実施の形態の自
然言語変換システムを実施する際の具体的なコンピュー
タシステムのハードウェア構成の一例を示すブロック図
である。
【0097】このコンピュータシステムは、CPU10
1と、メモリ102と、自然言語変換メモリ103と、
入力装置104と、翻訳辞書部105と、目的言語辞書
部106と、対訳知識ベース部107と、表示装置10
8と、外来語目的言語対応知識ベース部110とを含ん
で構成されている。また、各構成要素は、CPU101
によって制御されるバス109に接続されている。
【0098】入力装置104は、キーボードやマウス等
の装置で実現される。この入力装置104による入力
は、図7における原文解析部1に対して外部から流入し
ている矢線に対応している。
【0099】表示装置108は、CRTディスプレイ等
の装置で実現される。この表示装置108による出力
(表示)は、図7における訳文生成部5から外部に流出
している矢線に対応している。
【0100】翻訳辞書部105,目的言語辞書部10
6,対訳知識ベース部107,および外来語目的言語対
応知識ベース部110は、それぞれ、図7中の翻訳辞書
部2,目的言語辞書部4,対訳知識ベース部6,および
外来語目的言語対応知識ベース部7に対応している。こ
れらの各部の内容は、磁気ディスク装置等に格納されて
いる。
【0101】メモリ102は、オペレーティング・シス
テム等のシステムプログラムを格納すると共に、ワーク
エリアとしても使用される。
【0102】自然言語変換メモリ103は、本コンピュ
ータシステムを本発明の自然言語変換システムとして機
能させるためのプログラムを記憶するメモリであり、フ
ロッピィディスク媒体やRAMカードや磁気ディスク装
置等で構成されている。
【0103】この自然言語変換メモリ103には、図7
中の原文解析部1,目的言語語彙保持部3,および訳文
生成部5に相当する機能を果たすプログラムが、CPU
101によって読取り可能なコードとして記憶されてい
る。
【0104】CPU101は、このようなプログラムを
バス109を介して読み取り、先に説明した図7中の原
文解析部1,目的言語語彙保持部3,および訳文生成部
5による所定の処理を実行する。
【0105】
【発明の効果】以上説明したように、本発明の自然言語
変換システムは、対訳知識ベース部を備え、原文に直接
入力された目的言語語彙が出現する場合に該目的言語語
彙とそれに隣接する原言語の機能語との組み合わせ
(句)といったより広範な単位を考慮して変換を行うこ
とにより、該目的言語語彙が最終の目的言語文において
期待される品詞と異なっている場合にも、該目的言語語
彙を求められる(適正な)品詞に変換して訳文を生成す
ることができ、複数言語混じり文である原文の目的言語
文への変換結果の質を向上させることができるという効
果を有する。
【0106】また、本発明の自然言語の変換システムで
は、外来語目的言語対応知識ベース部を備え、原文中に
原言語表記の目的言語起源の語彙が入力された場合に、
該語彙をキーにした外来語目的言語対応知識ベース部の
検索によって該語彙に対応する目的言語表現を取得する
ことにより、原文中に入力された原言語表記の目的言語
起源の語彙が未登録語として扱われることを回避する可
能性が高くなり、「原言語で表記された目的言語起源の
語彙が翻訳辞書部の原言語見出しと登録されていない場
合に正しい翻訳結果が得られない」という問題点を解決
することができるという効果がある。
【図面の簡単な説明】
【図1】本発明の自然言語変換システムの第1または第
2の実施の形態の構成を示すブロック図である。
【図2】本発明の自然言語変換システムの第1の実施の
形態の動作を説明するための図である。
【図3】図1中の対訳知識ベース部の構成および具体的
な内容を示す図である。
【図4】本発明の自然言語変換システムの第1の実施の
形態の処理を示す流れ図である。
【図5】本発明の自然言語変換システムの第2の実施の
形態の動作を説明するための図である。
【図6】本発明の自然言語変換システムの第2の実施の
形態の動作を説明するための図である。
【図7】本発明の自然言語変換システムの第3の実施の
形態の構成を示すブロック図である。
【図8】本発明の自然言語変換システムの第3の実施の
形態の動作を説明するための図である。
【図9】本発明の自然言語変換システムの第3の実施の
形態の動作を説明するための図である。
【図10】本発明の自然言語変換システムの第1の実施
例を説明するためのブロック図である。
【図11】本発明の自然言語変換システムの第2の実施
例を説明するためのブロック図である。
【符号の説明】
1 原文解析部 2 翻訳辞書部 3 目的言語語彙保持部 4 目的言語辞書部 5 訳文生成部 6 対訳知識ベース部 7 外来語目的言語対応知識ベース部 12,13,15,17,34,35,52,54,5
6 データ線 60 原言語句構成情報 61 品詞情報 62 機能語情報 63 目的言語語彙品詞情報 64 原言語句対応目的言語品詞情報 101 CPU 102 メモリ 103 自然言語変換メモリ 104 入力装置 105 翻訳辞書部 106 目的言語辞書部 107 対訳知識ベース部 108 表示装置 109 バス 110 外来語目的言語対応知識ベース部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平8−137886(JP,A) 特開 昭61−33577(JP,A) 特開 平8−171564(JP,A) 特開 平3−211669(JP,A) 特開 平3−265972(JP,A) 特開 昭63−300359(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/20 - 17/28 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 原言語を目的言語に翻訳するための情報
    を保持する翻訳辞書部と、 目的言語の情報を保持する目的言語辞書部と、 原言語句構成情報と目的言語語彙品詞情報と原言語句対
    応目的言語品詞情報との対応を格納する対訳知識ベース
    部と、 前記翻訳辞書部の原言語部分を参照して原文を形態素に
    分割し、該原文に直接入力された目的言語語彙を該原文
    から切り出し、前記翻訳辞書部の原言語部分を用いて該
    目的言語語彙を含む句を認識し、該句の機能語の内容に
    基づいて該目的言語語彙の原言語における品詞を推定す
    る原文解析部と、 前記原文解析部から原文に直接入力された目的言語語彙
    を受け取り、前記目的言語辞書部を検索して該目的言語
    語彙の目的言語における品詞を取得する目的言語語彙保
    持部と、 前記原文解析部から原文中の目的言語語彙の品詞推定結
    果を受け取り、前記目的言語語彙保持部から該原文中の
    該目的言語語彙の辞書検索結果を受け取り、該品詞推定
    結果と該辞書検索結果とを合わせた情報によって前記対
    訳知識ベース部を検索して該目的言語語彙の適正品詞を
    取得し、該目的言語語彙の表層と該適正品詞とをキーに
    して前記目的言語辞書部を検索して該目的言語語彙と同
    語源の該適正品詞の目的言語表現を取得し、該目的言語
    表現を使用して訳文を生成する訳文生成部とを有し、前記訳文生成部は 前記対訳知識ベース部の検索結果とし
    て得られた適正品詞をキーとする前記目的言語辞書部の
    検索において原文中の目的言語語彙と同語源の該適正品
    詞の目的言語表現が得られなかった場合に、前記翻訳辞
    書部の目的言語部分を検索して前記目的言語語彙に翻訳
    される原言語見出しを得て、前記原言語見出しで再度前
    記翻訳辞書部を検索して得られる目的言語訳語の中で、
    品詞が前記適正品詞と一致するものを訳文に使用する目
    的言語表現とすることを特徴とする自然言語変換システ
    ム。
  2. 【請求項2】 原言語での目的言語を起源とする外来語
    とその外来語に対応する目的言語表現とを格納する外来
    語目的言語対応知識ベース部と、 原文中に入力された原言語表記の目的言語起源の語彙を
    切り出し、該語彙をキーにして前記外来語目的言語対応
    知識ベース部を検索して該語彙に対応する目的言語表現
    を取得し、該目的言語表現によって目的言語起源の該語
    彙を置き換えて該目的言語表現を目的言語語彙として該
    原文の解析を行う前記原文解析部とを有することを特徴
    とする請求項1記載の自然言語変換システム。
JP23595496A 1996-08-19 1996-08-19 自然言語変換システム Expired - Fee Related JP3267168B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23595496A JP3267168B2 (ja) 1996-08-19 1996-08-19 自然言語変換システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23595496A JP3267168B2 (ja) 1996-08-19 1996-08-19 自然言語変換システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2001351637A Division JP4313967B2 (ja) 2001-11-16 2001-11-16 自然言語変換システム

Publications (2)

Publication Number Publication Date
JPH1063668A JPH1063668A (ja) 1998-03-06
JP3267168B2 true JP3267168B2 (ja) 2002-03-18

Family

ID=16993679

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23595496A Expired - Fee Related JP3267168B2 (ja) 1996-08-19 1996-08-19 自然言語変換システム

Country Status (1)

Country Link
JP (1) JP3267168B2 (ja)

Also Published As

Publication number Publication date
JPH1063668A (ja) 1998-03-06

Similar Documents

Publication Publication Date Title
US9002695B2 (en) Machine translation device, method of processing data, and program
US7630880B2 (en) Japanese virtual dictionary
EP1482414B1 (en) Translating method for emphasised words
JP3272288B2 (ja) 機械翻訳装置および機械翻訳方法
US20020123877A1 (en) Method and apparatus for performing machine translation using a unified language model and translation model
JP2004355625A (ja) 機械トランスレータをトレーニングする方法およびそのシステム
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JP2008108209A (ja) 機械翻訳の精度を向上させる技術
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JP3267168B2 (ja) 自然言語変換システム
JP4313967B2 (ja) 自然言語変換システム
JP3236027B2 (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置
JP2947554B2 (ja) 機械翻訳装置
JP2742059B2 (ja) 翻訳用辞書編集装置
JP3244286B2 (ja) 翻訳処理装置
JP2938897B2 (ja) 文書作成処理装置
JP3329371B2 (ja) 機械翻訳用ルール装置、および機械翻訳用ルール生成プログラムを記録した記録媒体
JP3353873B2 (ja) 機械翻訳装置
JP2009009583A (ja) 構文パースを用いてセグメント化されていないテキストをセグメント化する方法
JPH05120332A (ja) 機械翻訳装置
JPH0785057A (ja) 構文解析方法及び装置
JPH04296969A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080111

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090111

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100111

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees