JP3244286B2 - 翻訳処理装置 - Google Patents

翻訳処理装置

Info

Publication number
JP3244286B2
JP3244286B2 JP16446391A JP16446391A JP3244286B2 JP 3244286 B2 JP3244286 B2 JP 3244286B2 JP 16446391 A JP16446391 A JP 16446391A JP 16446391 A JP16446391 A JP 16446391A JP 3244286 B2 JP3244286 B2 JP 3244286B2
Authority
JP
Japan
Prior art keywords
translation
word
compound word
translated
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP16446391A
Other languages
English (en)
Other versions
JPH0512332A (ja
Inventor
武 湯村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP16446391A priority Critical patent/JP3244286B2/ja
Publication of JPH0512332A publication Critical patent/JPH0512332A/ja
Application granted granted Critical
Publication of JP3244286B2 publication Critical patent/JP3244286B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、翻訳処理装置に関する
ものである。
【0002】
【従来の技術】近年、日本語から英語へ、あるいは英語
から日本語へと文章をコンピュータで翻訳する機械翻訳
システムの研究開発が活発になっている。このような機
械翻訳システムは一般に解析、変換、生成の3つの処理
で構成されており、まず解析処理で統語関係、及び意味
関係が解析され、その結果として概念(意味)構造が求
められ、変換処理でその概念構造に対して、目的言語の
概念構造に変換する。更に生成処理でその概念構造に基
ずいて訳文を生成するものである。
【0003】従来のこの種の装置は、入力文章から切り
出した1文章単位で、その文章の前後の文章に含まれる
情報を考慮せずに、その文章に関する情報だけで上述の
解析、変換、生成処理を行っていたので、最適な訳語の
自動選択が困難となる不都合があった。
【0004】例えば、以下のような、英文が与えられた
場合、 These accounts are very misleading ... 文中の「accounts」は、一般的な訳語として「計算書」
「説明」「記事」「理由」などの訳語の可能性がある
が、この文章からだけでは、これらの候補のうちのどの
訳語がふさわしいかを判断することは非常に困難であっ
た。
【0005】
【発明が解決しようとする課題】本発明は、上述の実情
を考慮してなされたものであり、原言語から目標言語へ
の変換の際の名詞の訳語決定に、変換対象の前後の該名
詞を含む複合語の変換結果を利用することにより、効率
的な翻訳処理を実現できる翻訳処理装置を提供するもの
である。
【0006】本発明の翻訳処理装置は、入力手段で入力
された文字集合を単語単位に分割する単語分割手段と、
該単語分割手段で分割された単語の中で、名詞で複合語
の単語を検出する検出手段と、該検出手段で検出された
複合語に対応する目標言語の訳語、及び上記複合語を構
成している要素についての訳語を求める変換手段と、該
変換手段で上記複合語を構成している各要素に対応する
訳語が複数得られたときには、複数の該訳語のうち上記
複合語の訳語に完全に含まれるものを最適な訳語として
選出する選出手段と、該選出手段で選出された最適な訳
語を記憶する記憶手段とを備え、上記複合語以降に、上
記各要素が単独で出現した場合に、その訳語を上記記憶
手段で記憶している該要素に対応する訳語に設定する設
定手段を備えたものである。
【0007】
【作用】本発明の翻訳処理装置によれば、入力手段で入
力された文字集合を単語分割手段で単語単位に分割す
る。次に検出手段でその単語分割手段で分割された単語
の中で、名詞で複合語の単語を検出する。更に、変換手
段でその検出手段で検出された複合語に対応する目標言
語の訳語、及び上記複合語を構成している各要素につい
ての訳語を求める。そのとき上記各要素に対応する訳語
が複数得られたときには、選出手段で、複数の該訳語の
うち上記複合語の訳語に完全に含まれるものを最適な訳
語として選出し、記憶手段に記憶する。しかる後、上記
複合語以降に、上記各要素が単独で出現した場合に、設
定手段でその訳語を上記記憶手段で記憶しているその要
素に対応する訳語に設定する。
【0008】
【実施例】図1は本発明の一実施例の翻訳処理装置のシ
ステム構成図である。
【0009】同図において、原文入力部11は、キーボ
ード等の入力手段によって実現されるものである。1文
切り出し部12は、入力文章の句読点等を検出すること
により入力文章を1文づつ切り出し翻訳メイン処理部1
3に送出するものである。この翻訳メイン処理部13
は、原文解析部131、変換処理部132、訳文生成部
133、最適訳語選択処理134で構成されており、上
記1文切り出し部12を含めてCPU等からなるデータ
ー処理プロセッサで構成される。訳文出力部14は、上
記翻訳メイン処理部13で生成された訳文を外部に出力
するものであって、RAMからなる文章メモリやこのメ
モリ内容を表示するCRT等を備える。
【0010】又、原文解析辞書15は図4の如く、見出
し、品詞、活用を対応して管理している形態素解析辞
書、及び文型等の規則が管理されている構文解析辞書か
らなり、翻訳変換辞書16は図5の如く、見出し、品
詞、訳語が対応して管理されている。また、訳文生成用
辞書17は語尾、活用等の規則が管理されており、上記
各辞書はそれぞれ上記翻訳メイン処理部13の翻訳処理
を実行するための辞書メモリであり、RAMやROM等
で構成される。
【0011】ここで、翻訳メイン処理部13について、
その構成を詳述する。
【0012】特に、上記原文解析部131は、形態素解
析機能、構文解析機能、及び意味解析機能から成る3機
能を備えており、それぞれの処理を以下に解説する。
【0013】1.形態素解析機能:入力手段で入力され
た文字集合を単語単位に分割する単語分割手段として働
く。即ち、原文解析辞書15の形態素解析辞書で管理し
ている上記情報を参照して処理する。更に、単語毎の品
詞設定処理によって、分割された単語の中から名詞の複
合語単語を検出する検出手段としても動作するものであ
る。そしてこの他にも、品詞、活用形等の検出などの解
析処理を実行するものである。
【0014】2.構文解析機能:上記形態素解析機能に
よって得られた情報に基づいて、係り受け関係等の構造
規則を原文解析辞書15の構文解析辞書で管理している
上記情報を参照することにより解析するものである。
【0015】3.意味解析機能:上記構文解析機能の結
果に基づいて、入力文の(言語固有の)意味構造を解析
するものである。
【0016】一方、変換処理部132は、上記形態素解
析機能で検出された複合語に対応する目標言語の訳語、
及び上記複合語を構成している要素についての訳語を求
める変換手段として働く、即ち、翻訳変換辞書16で管
理している上記情報を参照して処理する。更に、上記複
合語以降に、上記各要素が単独で出現した場合に、その
訳語を上記翻訳変換辞書16で記憶している該要素に対
応する訳語に設定する設定手段としても動作するもので
ある。
【0017】また、訳文生成部133は、上記原文解析
部131の解析結果に基づいて、上記変換処理部132
で得た訳語の語尾、活用等を変換することにより適切な
訳文を生成する。即ち、訳文生成用辞書17で管理して
いる上記情報を参照することにより実行するものであ
る。
【0018】最適訳語選択処理部134は、上記原文解
析部131の形態素解析機能で得た複合語の訳語に基づ
いて該複合語の各構成要素に対応する訳語の中から最適
な訳語を選出する選出手段として動作するものである。
【0019】以上の構成を要約すると、キーボ−ド等で
入力された文字集合を原文解析部131の形態素解析機
能で単語単位に分割し、この分割された単語の中で、名
詞で複合語の単語を検出する。更に、変換処理部132
で上記形態素解析機能で検出された複合語に対応する目
標言語の訳語、及び上記複合語を構成している各要素に
ついての訳語を求める。そのとき上記各要素に対応する
訳語が複数得られたときには、最適訳語選択処理134
で、上記複合語の訳語に基づいてその各要素に対応する
訳語の中から最適な訳語を選出し、翻訳変換辞書16等
に記憶する。しかる後、上記複合語以降に、上記各要素
が単独で出現した場合に、変換処理部132でその訳語
を上記翻訳変換辞書16等で記憶しているその要素に対
応する訳語に設定する。
【0020】以下に図2の入力英文テキストが原文入力
部11から入力された場合について図1の本発明装置の
動作について解説する。
【0021】まず、1文切り出し部12によってこのテ
キストファイルから1文づつ切り出され、翻訳メイン処
理部に送出される。例えば文「He has been described
insome news accounts ...」 21が切り出された場
合には、翻訳メイン処理部13では、まずシステムが内
蔵している原文解析辞書15の形態素解析辞書で管理さ
れている上記情報との照合を行って、それぞれの単語の
認識(品詞と活用形)が行われる。
【0022】この形態素解析辞書には、図3に示すよう
に見出し(原形)の他に、品詞や活用に関する情報がテ
ーブル形式で格納されており、辞書引きの場合、辞書に
登録されている、より長い単位で一致する単語を優先し
て、辞書引き結果とする。
【0023】上記文21が入力されると、図4のように
それぞれの単語の辞書引き結果が求められ、配列に格納
される。このとき、この形態素解析辞書に「news accou
nt」という単語が見出しとして登録されている時には、
「news accounts」という部分が1語として解析され
る。
【0024】即ち、同図の如く、見出し「he」は、品詞
「代名詞」、活用「原形」に対応し、また、見出し「ha
ve」は、品詞「助動詞」、活用「3人称」に対応してい
る。同様に、「be」 、「describe」、「in」、「som
e」、「news account」についても同図に示す品詞、及
び活用との対応関係が得られる。
【0025】この形態素解析で認識された、それぞれの
単語(名詞、動詞等の内容語)は、図5に示すように翻
訳変換辞書(訳語選択用の辞書)16と対応づけされて
おり、この翻訳変換辞書には、複数の訳語が考えられる
場合には、複数の訳語候補が並べられている。
【0026】本発明の翻訳処理装置においては、上述の
形態素解析が行われた段階で、このような複数の単語か
ら構成される複合語について、該複合語の構成要素につ
いても以下に例示する如く、辞書引きを行い、それぞれ
の構成要素の訳語の対応関係を求めて最適訳語選択処理
を行うのである。即ち、例えば上述の「news account」
については複合語として辞書引きすると共に、その構成
要素である「news」、「account」についても辞書引き
を行い、訳語に関する情報を求める。即ち図6に示す如
く、「news account」61を辞書引きすることにより日
本語訳「ニュース記事」62を得ると共に、その複合語
を構成する「news」63、及び「account」64につい
ても辞書引きし、それぞれの日本語訳として「news」に
ついては「ニュース」、「たより」、「account」につ
いては「計算書」、「説明」、「記事」、「理由」の候
補が辞書引きされる。
【0027】次に、図7は本発明の一実施例の翻訳処理
装置の訳語の絞り込みのフロー図である。
【0028】同図において、複合語の見出しをXeと
し、その訳語をXjとする。また、その複合語の構成要
素の見出しをXe[m](m>0)とした時、その訳語
をXj[m,n](n>1)とする。更に、Xe[1]
に対応する訳語が複数の可能性をもつ時、訳語は、Xj
[1,1]、Xj[1,2]、Xj[1,3]...と
なる。
【0029】このとき、Xj[m,n](m>0、n>
0)がXjに(部分的にでも)含まれれば、見出しXe
[m]が単独に使われる場合でも、このテキストにおい
ては、その訳語は、Xj[m,n]がふさわしいと言え
る。
【0030】即ち、同図のフローにおいては、ステップ
S1で、Xj[m,n](m>0、n>0)がXjに
(部分的にでも)含まれるか否かの判定をし、含まれる
と判定された場合には、ステップS2でXe[m]の訳
語としてXj[m,n]を優先させる情報を格納する。
【0031】次に、上述の複合語「news account」につ
いての処理を例にとって、上述の訳語の絞り込み処理を
更に詳述する。
【0032】複合語「news account」の訳語「ニュース
記事」は、「news」の訳語候補(「ニュース」「たよ
り」)5のうち、「ニュース」を含んでおり、図2のテ
キストでは、「news」の訳としては、「ニュース」がふ
さわしいと判断される。同様に、複合語「news accoun
t」の訳語「ニュース記事」は、「account」の訳語候補
(「計算書」、「説明」、「記事」、「理由」)のう
ち、「記事」を含んでいるので、このテキストにおいて
は、「account」の訳語として「記事」がふさわしいと
判断される。(この例では、要素の訳語が複合語の訳語
に完全に含まれる場合を示したが、完全に一致しなけれ
ば部分一致でもよい。)即ち、この判定結果(図2のテ
キストにおいては、「news」の訳としては、「ニュー
ス」がふさわしく、「account」の訳語として「記事」
がふさわしい)は、翻訳変換辞書16に学習データとし
て格納される。この学習データの格納の方法としては、
以下の2例が考えられる。
【0033】(1)翻訳変換辞書16に優先順位を記述
できる枠組を設けておき、該当する訳語の優先順位を上
げて、格納する。
【0034】(2)翻訳変換辞書16の他に、翻訳学習
辞書を設けて、そこに該当する単語の訳語情報を記述す
る。
【0035】以上の最適翻訳選択処理を行った上で、構
文、意味解析を行い変換処理を行う。変換処理で訳語を
もとめる場合、これ以降、最適化判断された「news」及
び「account」については、この処理で選択された訳語
が優先され、それ以外の最適化判断されていない単語に
ついては、一般的な訳語が与えられる。この変換結果を
もとに概念構造から訳文を生成して、訳文出力部14の
CRTに表示出力する。
【0036】以上の操作を1文単位で行ないながら、翻
訳処理を進めていく。ここで図2の入力テキストのうち
文22「these account are very mislcanding」が
切り出され、翻訳メイン処理に渡されると図8のような
形態素解析結果となる。ここで「account」の訳語につ
いては、文21を処理する際に適用された最適訳語選択
処理によって翻訳変換辞書は更新されており、その格納
された学習データを参照することによって、「記事」と
訳すことができる。
【0037】
【発明の効果】本発明によれば、入力テキスト中に出現
する複合語の情報を利用することによって、テキスト
(場面)に応じて適切に単語の訳し分けを行うことがで
き翻訳精度を向上させることができる。
【図面の簡単な説明】
【図1】本発明の一実施例の翻訳処理装置の機能構成図
【図2】本発明の一実施例の翻訳処理装置の入力英文テ
キスト例を示す図
【図3】本発明の一実施例の翻訳処理装置の形態素解析
用辞書を示す図
【図4】本発明の一実施例の翻訳処理装置の形態素解析
辞書引き結果の一例を示す図
【図5】本発明の一実施例の翻訳処理装置の英語、日本
語の翻訳変換辞書を示す図
【図6】本発明の一実施例の翻訳処理装置の複合語と構
成要素の訳語の対応関係を示す図
【図7】本発明の一実施例の翻訳処理装置の訳語の絞り
込みのフロー図
【図8】本発明の一実施例の翻訳処理装置の形態素解析
辞書引き結果の他の例を示す図
【符号の説明】
11 原文入力部 12 1文切り出し部 13 翻訳メイン処理部 14 翻訳出力部 15 原文解析辞書 16 翻訳変換辞書 17 訳文生成用辞書 131 原文解析部 132 変換処理部 133 訳文生成部 134 最適訳語選択処理

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力手段で入力された文字集合を単語単位
    に分割する単語分割手段と、該単語分割手段で分割され
    た単語の中で、名詞で複合語の単語を検出する検出手段
    と、該検出手段で検出された複合語に対応する目標言語
    の訳語、及び上記複合語を構成している要素についての
    訳語を求める変換手段と、該変換手段で上記複合語を構
    成している各要素に対応する訳語が複数得られたときに
    は、複数の該訳語のうち上記複合語の訳語に完全に含ま
    れるものを最適な訳語として選出する選出手段と、該選
    出手段で選出された最適な訳語を記憶する記憶手段とを
    備え、上記複合語以降に、上記各要素が単独で出現した
    場合に、その訳語を上記記憶手段で記憶している該要素
    に対応する訳語に設定する設定手段を備えたことを特徴
    とする翻訳処理装置。
  2. 【請求項2】上記変換手段で上記複合語を構成している
    各要素に対応する訳語が複数得られたときには、複数の
    該訳語のうち上記複合語の訳語に完全に含まれるものが
    あればそれを最適な訳語として選出し、完全に含まれる
    ものがなければ上記複合語の訳語と部分一致するものを
    最適な訳語として選出する選出手段を備えたことを特徴
    とする請求項1記載の翻訳処理装置。
JP16446391A 1991-07-04 1991-07-04 翻訳処理装置 Expired - Fee Related JP3244286B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16446391A JP3244286B2 (ja) 1991-07-04 1991-07-04 翻訳処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16446391A JP3244286B2 (ja) 1991-07-04 1991-07-04 翻訳処理装置

Publications (2)

Publication Number Publication Date
JPH0512332A JPH0512332A (ja) 1993-01-22
JP3244286B2 true JP3244286B2 (ja) 2002-01-07

Family

ID=15793656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16446391A Expired - Fee Related JP3244286B2 (ja) 1991-07-04 1991-07-04 翻訳処理装置

Country Status (1)

Country Link
JP (1) JP3244286B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5185343B2 (ja) * 2010-09-03 2013-04-17 株式会社東芝 機械翻訳装置及び機械翻訳プログラム

Also Published As

Publication number Publication date
JPH0512332A (ja) 1993-01-22

Similar Documents

Publication Publication Date Title
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
US4831529A (en) Machine translation system
JP2732563B2 (ja) 機械翻訳方法及び装置
JP3244286B2 (ja) 翻訳処理装置
JP2838984B2 (ja) 汎用参照装置
JPS61260366A (ja) 学習機能付機械翻訳システム
JP2011175306A (ja) 情報処理装置
JP3257264B2 (ja) 未知語登録装置
JPS62203266A (ja) 機械翻訳システム
JP2715875B2 (ja) 多言語要約生成装置
JP5032453B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP3353873B2 (ja) 機械翻訳装置
JP3255294B2 (ja) 機械翻訳装置
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JP3884001B2 (ja) 言語解析システムおよび方法
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH10171804A (ja) 機械翻訳装置
JPH07122876B2 (ja) 機械翻訳装置
JP2004199519A (ja) 機械翻訳方法、機械翻訳装置、および機械翻訳プログラム
JP2901977B2 (ja) 翻訳装置
JPH05197752A (ja) 機械翻訳装置
JPH10320391A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0635964A (ja) 機械翻訳装置
JPH04296969A (ja) 機械翻訳装置
JPH04130577A (ja) 自然言語処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees