JP2880600B2 - 単語列翻訳装置 - Google Patents

単語列翻訳装置

Info

Publication number
JP2880600B2
JP2880600B2 JP4008297A JP829792A JP2880600B2 JP 2880600 B2 JP2880600 B2 JP 2880600B2 JP 4008297 A JP4008297 A JP 4008297A JP 829792 A JP829792 A JP 829792A JP 2880600 B2 JP2880600 B2 JP 2880600B2
Authority
JP
Japan
Prior art keywords
word
language
dictionary
string
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4008297A
Other languages
English (en)
Other versions
JPH05197745A (ja
Inventor
規 廣嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP4008297A priority Critical patent/JP2880600B2/ja
Publication of JPH05197745A publication Critical patent/JPH05197745A/ja
Application granted granted Critical
Publication of JP2880600B2 publication Critical patent/JP2880600B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は自動翻訳装置に関し、
特に、熟語や、数詞+単位という形式のように、一般的
な形式で代表させることができる単語列を翻訳するため
の装置に関する。
【0002】
【従来の技術】従来、“as soon as possible ”、“as
fast as possible ”といった熟語や、“ 20 yards ”
のように単位を伴う数詞、あるいは日付(たとえばAug.
5, 1991)のように形式が決められている表現は、構文
解析処理によって一旦より細い単位に分解した後、再度
その意味を解釈することによって翻訳したり、あるいは
個々の具体的な表現を単語辞書または熟語辞書に1つ1
つの登録しておき、入力される文章に含まれる文字列が
この単語または熟語辞書の見出しと完全に一致するとき
に、対応する他の言語に置換えることによって翻訳処理
がされていた。
【0003】
【発明が解決しようとする課題】しかし、このように個
々の具体的な熟語を単語辞書あるいは専用の熟語辞書に
登録する場合、場合によっては熟語のすべての出現パタ
ーンを登録する必要がある。あるいは単位を付けて書か
れる数詞や年号、日付など、その文字列を構成する各単
語のみでは完全な意味をなさないものであっても辞書に
登録する必要がある。また、翻訳装置を提供するために
熟語辞書を作成する場合、熟語辞書による変換の結果
が、その前段で行なわれる構文解析の結果に左右される
ことがあり、そのために熟語辞書の内容を、直観的に理
解できるような形で準備することが困難であった。
【0004】こうした問題の結果、辞書の容量が不必要
に増大したり、必要な熟語を登録し忘れるなど、管理効
率が低下したりし、それに伴って翻訳の際の辞書の検索
効率が低下するという問題点があった。
【0005】それゆえにこの発明の目的は、少ない辞書
容量で、効率よく単語列の翻訳を行なうことができる単
語列翻訳装置を提供することである。
【0006】
【課題を解決するための手段】本発明に係る単語列翻訳
装置は、第1の言語の単語列と、第1の言語の単語列と
類似の意味を表わすものとして選択された、第2の言語
の単語列とからなる対を多数格納する第1の辞書、およ
び第1の言語の単語を、第1の言語の単語と類似の意味
を表わすものとして予め選択された第2の言語の単語に
関連付けて多数格納するための第2の辞書を含む。各第
1の言語の単語列は、第1の言語の単語のうちの複数の
単語と一致関係が成立するように予め定められた単語位
置マークを含む。各第2の言語の単語列は、第1の言語
の単語列に含まれる単語位置マークに対応する位置に挿
入された単語置換位置マークを含む。本発明に係る単語
列翻訳装置はさらに、入力される第1の言語の文章に、
第1の辞書および第2の辞書を参照することによって、
第1の言語の単語列のうちの1つと一致する入力単語列
が存在するか否かを検出するための一致検出手段と、一
致検出手段により第1の言語の単語列のいずれかと一致
することが検出された入力単語列のうち、単語位置マー
クと一致関係が成立した単語に対応する第2の言語の単
語を第2の辞書から取出し、第1の言語の単語列と対を
なす第2の言語の単語列の単語置換位置マークと置換す
ることにより、第1の言語の入力単語列を第2の言語の
単語列に変換する単語列置換手段とを含む。
【0007】
【作用】本発明に係る単語列翻訳装置においては、入力
される第1の言語の文章に、第1の辞書に含まれる第1
の言語の単語列のうちの1つと一致する入力単語列が存
在するか否かが検出され、存在する場合には、その入力
単語列と一致することが検出された、第1の辞書の第1
の言語の単語列に含まれる単語位置マークと一致関係が
成立した、入力単語列内の単語に対応する第2の言語の
単語が第2の辞書から取出される。取出された第2の言
語の単語は、一致が検出された第1の言語の単語列と対
をなす第2の言語の単語列に含まれる単語置換位置マー
クと置換され、第2の言語の単語列が作り出される。こ
の装置においては、単語位置マークで示される単語のみ
が異なり、他の単語は共通の単語からなる、複数個の第
1の言語の単語列が、第1の辞書に1つの一般的な形式
として格納される。個々の単語列を全て予め登録してお
く必要はない。
【0008】
【実施例】図1は、本発明に係る単語列翻訳装置を含む
自動翻訳装置として機能するコンピュータを用いたシス
テムのブロック図である。図1を参照してこの装置は、
所定の翻訳プロセスに従って、入力される第1の言語
(本実施例の場合には英語)の原文を第2の言語(本実
施例の場合には日本語)の文章に翻訳する処理を行なう
ためのCPU10と、CPU10に接続されたバス20
と、バス20を介してCPU10に接続され、CPU1
0で実行される翻訳プログラムを格納するための翻訳プ
ログラムメモリ12と、バス20を介してCPU10に
接続され、利用者がCPU10と対話によって処理を進
めるために指令を入力したり、データを入力したりする
ためのキーボード16と、処理結果を表示したりするた
めのCRT14と、バス20を介してCPU10に接続
され、CPU10で実行される翻訳処理の際に参照され
る、言語の解析ルールや、語法知識や、変換ルールや、
生成ルールなどを予め格納しておくデータベース18
と、バス20に接続され、入力原文を格納するためのバ
ッファA22と、バッファA22に格納された原文に含
まれる各単語に関する情報を格納するためのバッファB
24と、バッファB24に含まれる各単語のうち、所定
の単語の日本語の意味等を格納するためのバッファC2
6と、英単語と、その英単語に対応する日本語の単語と
の対を多数格納するための単語辞書28と、バス20に
接続され、一般的な形式で記載された熟語や数詞+単位
などの表現を、対応する日本語表現と関連付けて格納す
るための熟語辞書30とを含む。これら単語辞書28お
よび熟語辞書30は、コンピュータシステムのメモリに
格納されている。
【0009】単語辞書28には、多数の英単語が、その
品詞とその英単語の訳語として予め選択された日本語の
単語とに関連付けて多数記憶されている。単語辞書28
にはまた、後述する一般的な形式の熟語ではなく、具体
的な形式の熟語が格納されてもよい。
【0010】図2を参照して、バッファBは、入力され
る英語の原文に含まれる各単語を、各単語の品詞ととも
に格納するための領域が、各々単語位置が割当てられて
設けられている。バッファBには、対応するポインタQ
が設けられており、ポインタQの値に対応する単語位置
に格納された単語(見出し語)が処理の対象となる。
【0011】図3を参照して、本発明に係る単語列翻訳
装置の特徴的な点である熟語辞書30は、互いに項目区
切り記号で区切られた複数の項目(項目1、項目2、
…)を格納している。各項目は、一般的な形式で記述さ
れる熟語あるいは数詞+単位などの表現(以下単に熟語
と呼ぶ)を表わす単語シーケンスと、この単語シーケン
スの後ろに、見出し区切り記号によって単語シーケンス
と区分されて格納される、対応する日本語の単語列(文
字列)とを含む。単語シーケンスの各単語には、その単
語の品詞(副詞、形容詞、名詞、数詞、…)などが関連
付けられている。この熟語辞書30が従来の熟語辞書あ
るいは単語辞書と異なるのは、各項目が具体的な個々の
熟語を表わすのではなく、共通の一般的形式を有する熟
語のうち、各熟語で互いに異なる部分のみを、所定の単
語位置マーク(“***”)によって置換することによ
り、複数の熟語を1つの一般的形式として格納している
ことである。単語位置マーク“***”には、その単語
位置マークと置換されるべき単語の品詞が他の単語と同
様に関連付けて記憶されている。また、この単語シーケ
ンスによって表わされる一般的形式の熟語を日本語に訳
した場合の文字列内には、この単語位置マークと対応す
る位置に挿入された単語置換位置マーク“***”が同
様に含まれている。
【0012】このような各項目の記憶形式は、熟語に限
らず、「数詞+単位」のような表現(*** yards の
ような表現)についても同様である。
【0013】図3に示されるように、熟語辞書30に
は、対応するポインタRが設けられている。ポインタR
は、本実施例の場合には各項目ごとにその先頭に位置付
けることが可能であり、各項目内では、ポインタRは各
見出し語、見出し区切り記号、対応日本語などを、0か
ら1ずつインクリメントしながら順次指し示すことにな
る。
【0014】図4を参照して、バッファCは、入力され
た原文のうち、単語位置マークを除いて熟語辞書に含ま
れる文字列と一致する文字列が発見された場合に、入力
原文中の単語位置マークの位置にある単語と、その単語
の品詞と、その単語に割当てられた日本語の単語とを、
辞書28を参照して格納するためのものである。
【0015】図1〜図4に示される、本発明の一実施例
に係る単語列翻訳装置を含む自動翻訳装置の動作を以下
説明する。図5は、自動翻訳装置の処理の流れの全体を
示す。図5を参照して、処理対象となる英文が入力され
ると、ステップS(以下単にSと呼ぶ)001で、単語
辞書28を参照しながら、原文に対する形態素解析が行
なわれる。続いてS002で、形態素解析された各単語
について、単語辞書28を参照してその品詞についての
情報などの単語情報が取込まれる。
【0016】続くS003において、本発明に係る構成
を有する熟語辞書30を参照して、入力された原文に含
まれる熟語を、対応の日本語の言い回しに変換するため
の熟語辞書引き処理が行なわれる。
【0017】S004では、単語辞書28と、データベ
ース18に格納されている英文法知識に基づいた解析ル
ールに従って、構文解析の処理が行なわれ、入力された
原文を、たとえばツリー構造のような内部構造形式に表
わす処理が行なわれる。
【0018】続くS005以下では、このツリー構造に
よって表わされた原文の意味を、データベース18に含
まれる語法知識、変換ルール、日本語の文法知識に基づ
く生成ルールなどに従って日本語の文章に変換していく
処理が行なわれる。まずS005では、ツリー構造とし
て表わされた内部構造の意味を、データベース18の解
析ルールおよび語法知識を用いて解析する処理が行なわ
れる。S006では、データベース18に格納された語
法知識および変換ルールに従って、S004およびS0
05によって得られたツリー構造を、日本語の変換ルー
ルに従って所定の構文を表わすツリーに直すとともに、
各語に適切な訳語を引当てていく処理が行なわれる。最
後にS007で、S006の処理によって得られた変換
後のツリー構造を、データベース18に含まれる日本語
文法知識に基づく生成ルールに従って日本語文章に変換
する処理が行なわれる。
【0019】図6は、図5のS003において行なわれ
る、本発明に係る単語列翻訳装置によって行なわれる処
理のフローチャートである。まずS310において、入
力された英語の原文をバッファA22に格納する処理が
行なわれる。続いてS320で、バッファA22に格納
された英語原文に基づき、バッファB24の内容を作成
する処理が行なわれる。この処理は図7を参照して後述
する。
【0020】S330では、バッファBに格納されたデ
ータに、熟語辞書30に格納された一般的な形式で表現
された熟語の、1つの具体的な表現となりうる可能のあ
る単語があるか否かを調べ、あればその先頭まで処理対
象位置を移動させる処理が行なわれる。この処理は後述
するS340において行なわれる、熟語辞書引き処理の
本体処理の前準備の処理に相当する。この処理について
は、図8を参照して後に述べる。
【0021】さらにS340では、バッファB24に格
納された単語列が、実際に熟語辞書30に格納された、
一般的形式で表現された熟語と一致した形式の熟語であ
るか否かを判定し、一致している場合には一定の手順に
従って日本語の単語列(文字列)に変換する処理が行な
われる。この処理については図9を参照して後に詳しく
述べる。
【0022】図7を参照して、S320で行なわれるバ
ッファB作成処理は次のように実行される。まずS32
1において、バッファA22の単語位置を指し示すポイ
ンタPの値が0で初期化される。続いてS322におい
て、現在のポインタPの値によって指し示されている、
バッファA22内の単語を、バッファBに格納する処理
が行なわれる。続いてS323で、バッファA22内
に、次の単語が存在するか否かについての判断が行なわ
れる。判断の答えがYESであれば制御はS234に進
み、それ以外の場合にはS325に進む。
【0023】S324では、バッファA22のポインタ
Pを1インクリメントする処理が行なわれる。これによ
り、バッファA22内でポインタPによって指し示され
る単語の位置は1つ後方に移動する。S324の後処理
はS322に戻る。S322〜S324の処理が繰り返
し行なわれることにより、バッファA22内の単語列
が、図2に示されるようにバッファB内の単語位置に順
に格納されていくことになる。
【0024】S323における判断の結果バッファA2
2内に次の単語が存在しないと判断された場合、すなわ
ちバッファA22内に格納された単語列の最後まで処理
が到達したと判断された場合にはS325に処理が進
む。S325では、図5のS002において行なわれた
辞書引きの結果を参照して、バッファBに格納された各
見出し語の品詞情報がバッファB内の各見出し語の対応
する品詞情報のフィールドに格納され、バッファBを完
成する処理が行なわれる。S325の処理が終了するこ
とにより、バッファB作成処理は終了する。
【0025】図8を参照して、図6のS330で行なわ
れる熟語辞書引き準備処理は次のように実行される。ま
ずS331で、図2、図3に示されるような、バッファ
B内の単語位置および熟語辞書30の各項目内の見出し
語位置をそれぞれ示すポインタQ、Rの内容が、0でそ
れぞれ初期化される。続いてS332で、ポインタQの
指すバッファB内の見出し語と、熟語辞書30内の所定
の項目内においてポインタRが指す見出し語とを比較す
る処理が行なわれる。S333で、S332の比較の処
理の結果、ポインタQの指すバッファBの見出し語と、
ポインタRの指す熟語辞書30の見出し語とが一致する
か否かについての判断が行なわれる。判断の答えがNO
であれば制御はS334に進み、ポインタQを1インク
リメントする処理が行なわれ、S335に制御が進む。
S335では、インクリメントされたポインタQによっ
て指し示される単語位置のバッファBに格納された見出
し語が、終止記号であるか否かについての判断が行われ
る。終止記号とは、文の終了を示す記号として予め定め
られたものである。英語の場合には終止記号としてはピ
リオド(.)、クエスチョンマーク(?)およびエクス
クラメーションマーク(!)の3つが終止記号として定
められている。S335の判断の結果ポインタQによっ
て指し示される見出し語が終止記号であると判断された
場合には、バッファBに格納されている単語列の最終位
置まで達し、しかも熟語辞書30に格納されている各項
目の先頭見出しと一致する語が見出されなかったという
ことであるから、原文内に、熟語辞書30に一般的形式
として格納されている熟語に相当する表現がなかったと
いうことであるから、熟語辞書引きの処理そのものが終
了する。終止記号でない場合には再び処理S332に戻
り、S332〜S335の処理が、ポインタQの指す見
出し語とポインタRの指す見出し語とが一致するまで、
あるいはバッファB内の見出し語の最後まで処理対象が
到達するまで行なわれる。ポインタQの指す見出し語と
ポインタRの指す見出し語とが一致した場合、熟語辞書
引き準備処理は終了し、次の熟語辞書引き処理が行なわ
れることになる。
【0026】図9を参照して、S340(図6参照)で
行なわれる熟語辞書引き処理は次のように実行される。
まずS341で、図8によって説明された処理において
使用されていたポインタQ、Rの内容をそれぞれ1ずつ
インクリメントする処理が行なわれる。続いてS34に
おいて、インクリメントされた結果ポインタQによって
指し示されるバッファB内の見出し語が、終止記号であ
るか否かについての判断が行なわれる。終止記号である
場合には前述と同様に原文内に熟語が存在しないという
ことであるから熟語辞書引き処理は終了する。終止記号
でない場合には処理はS343に進む。S343では、
ポインタRによって指し示される、熟語辞書30内の所
定の項目の見出し語が見出し語区切り記号であるか否か
の判断が行なわれる。見出し語区切り記号でない場合に
は、バッファB内に格納されている単語列と現在判断の
対象となっている熟語辞書30内の項目の各見出し語列
とをさらに比較する必要があるため、処理はS344に
進む。見出し語区切り記号である場合には処理はS34
9以下に進むが、その内容については後述する。
【0027】S344においては、ポインタQによって
指し示される、バッファB24内の見出し語と、ポイン
タRによって指し示される、熟語辞書30内の現在処理
対象となっている項目の見出し語とを比較する処理が行
なわれる。比較の結果一致していればこの項目について
後続する見出し語の比較をする必要があるため処理はS
341に戻る。不一致の場合には処理はS345に進
む。
【0028】S345に処理が進んだ場合には、ポイン
タRによって指し示される見出し語が単語位置マーク
(***)となっている。この場合、バッファB内に格
納されている単語列が、熟語辞書30に格納されている
一般的表現形式の熟語の1つの例であるためには、単語
位置マーク(***)の品詞と、それに対応するバッフ
ァB内の見出し語との品詞が一致している必要がある。
そこでS345では、ポインタQで指し示されるバッフ
ァB内の見出し語の品詞と、ポインタRによって指し示
される熟語辞書30内の見出し語の品詞とが一致するか
否かの判断が行なわれる。一致している場合にはここま
での処理の結果バッファB内に格納されている単語列
が、現在処理対象となっている熟語辞書30内の項目の
具体的表現である可能性がある。そのためS346に処
理が進み、S346で、ポインタQによって指し示され
ているバッファB内の見出し語の辞書引き処理が行なわ
れ、この見出し語と、その品詞と、その見出し語に対応
する日本語の単語とが図4に示されるバッファC26内
に格納される。S346の後、単語位置マーク(**
*)に続く単語が両者で一致しているか否かをさらに判
断する必要があるため処理はS341に戻る。
【0029】S345の判断の結果ポインタQ、ポイン
タRで指し示される見出し語の品詞が不一致であると判
断された場合には処理はS347に進む。S347で
は、バッファB内に格納された単語列が、現在処理中の
熟語辞書30内の項目の具体的表現ではないと判断され
るため、処理を次の項目に移すための処理が行なわれ
る。すなわち、S347では、熟語辞書に次の項目が存
在するか否かについての判断が行なわれる。判断の結果
次の項目が存在しない場合には熟語辞書30の最終の項
目まで処理が到達したということであるからこの熟語辞
書引き処理は終了する。次の項目があると判断された場
合には処理はS348に進み、熟語辞書の次の項目へポ
インタRを移動させるとともに、ポインタRを0で初期
化して、その項目内の最初の位置にポインタRを移動さ
せる。S348の後処理はS341に戻る。
【0030】仮にS341〜S346の処理が繰り返し
て実行され、その結果バッファB内に格納された単語列
と、熟語辞書30内のある項目の見出し語列とが、単語
位置マーク(***)を除いてすべて一致しかつ単語位
置マーク(***)の品詞と、単語位置マークに対応す
る位置のバッファB内の見出し語との品詞が一致してい
る場合、バッファB内の単語列は、その項目の具体的表
現(すなわち、単語位置マーク(***)を、バッファ
B内の該当単語で置換えた表現)であると判断される。
したがってS343で見出し語区切り記号まで比較が進
んでなおかつ単語位置マークを除くすべての見出し語が
その項目の見出し語列と一致している場合には、S34
9に処理が進み、最終の処理が行なわれる。
【0031】S349では、見出し語区切り記号の後に
存在している日本語の表現と、バッファC内に格納され
ている単語の内容とをマージし、その結果バッファBに
格納されている英語の単語列(熟語)に対応する日本語
の単語列が最終結果として得らることになる。S349
の後、バッファB内に格納されている見出し語列のう
ち、後続するものについてもさらに熟語が存在するか否
かを判断する必要があるため、処理はS348に進み、
さらにS341以下の処理が繰り返し行なわれることに
なる。
【0032】図2〜図4に示される例に従って、より具
体的に上述の処理を以下で説明する。バッファBには、
“Come as soon as possible. ”が格納されているもの
とする。そして、ポインタRが現在図3に示される項目
1を指し示しているものとする。図3の項目1は、“as
+副詞+as+possible”という熟語の一般的形式を表わ
したものである。そして、この2つを比較すれば明らか
なように、バッファBに格納されている“as soon as p
ossible ”という表現は、図3の項目1の“***”を
“soon”で置換えたものとなっている。この場合の熟語
辞書引き処理は次のようにして行なわれることになる。
【0033】まず、バッファB内の“Come”という語
と、項目1の最初の見出し語“as”との比較が行なわれ
る。この場合両者は一致しない。したがってこの場合、
図8のS334の処理が行なわれ、ポインタQが次の
“as”に移動する。
【0034】ポインタQをインクリメントした後に行な
われる比較は、“as”と“as”との間で行なわれ、これ
は明らかに一致している。したがって図8のS333に
おける判断の結果がYESとなり、処理は図9のS34
0に移る。
【0035】S341以下の処理は次のようになる。ポ
インタQ、ポインタRがそれぞれインクリメントされる
結果、次の比較は“soon”と“***”との間で行なわ
れる。この場合、熟語辞書側の見出し語“***”が単
語位置マークであるために、本来は両者は一致しない。
しかし、この場合には単語位置マークの品詞と、バッフ
ァB内の比較対象の見出し語の品詞とが一致するかどう
かの判断がS345で行なわれる。そしてもし一致して
いる時には、仮にこの両単語が一致しているものとして
処理される。この場合には両者ともその品詞は副詞とな
っているため、S345における判断の答えは「一致」
となり、S346に処理が進むことになる。そして、S
346では、ポインタ9によって指し示されるバッファ
Bの見出し語、すなわち単語“soon”についての処理が
行なわれて図4に示されるようなバッファCが作成され
ることになる。
【0036】以下、S341〜S344の処理が二度繰
り返されることによって、バッファB内の見出し語列の
“as”“possible”が、図3の項目1の後続する2つの
単語と一致することが確認される。そして、ポインタR
が4となった時点でS343における判断の結果がYE
Sとなり、S349の処理が行なわれる。すなわちS3
49においては、項目1の訳語として割当てられた「で
きるだけ***」という語の「***」の部分に、バッ
ファC(図4参照)に格納されている単語“soon”の訳
語「早く」が代入(置換)され、「できるだけ早く」と
いう文字列が生成されることになる。
【0037】そして続くS341の処理でポインタQが
インクリメントされた結果S342の判断の答えがYE
Sとなり、熟語辞書引処理は終了することになる。
【0038】上述の説明中では、「 as 副詞 as possib
le」というような熟語を、“ as *** as possible”
という一般的表現形式にして熟語辞書に格納しておく方
式を示した。しかし、このような熟語辞書の格納方式お
よび英語から日本語への変換公式は、熟語のみには限定
されず、たとえば前述のように数詞+名詞についても、
たとえば 0 *** 数詞 1 yards 名詞 2 見出し語区切り記号 4 ***ヤード のような形式で登録しておけば、数詞+単位などの表現
についての処理も同様に可能である。
【0039】以上のようにこの発明に係る単語列翻訳装
置によれば、熟語辞書には、個々の熟語や数値+単位と
いった具体的な表現ではなく、それらの一般的表現のみ
を登録しておくだけで、多数の具体的な熟語や数値+単
位といった表現を英語から日本語に翻訳することができ
る。そのため辞書の容量を削減することが可能となり、
また多数の熟語などを登録する必要がないため、登録忘
れや保守などの際の作業量が減少し、管理効率が向上す
る。また、辞書に格納される項目数が少なくて済むた
め、熟語辞書を参照する場合の検索効率が改善される。
【0040】
【発明の効果】以上のようにこの発明によれば、第1の
辞書に格納しておく第1の言語単語列としては、個々の
具体的な表現ではなく、相違する部分のみを単語位置マ
ークで表現した一般的表現形式として格納しておけばよ
い。翻訳の際には、対応する第2の言語の単語列内の単
語置換位置マークを、対応する第1の言語の単語列内の
単語位置マークと一致が検出された単語に対応する第2
の言語の単語で置換えることにより、具体的な熟語や他
の特殊な表現を翻訳することができる。第1の辞書に格
納しておく単語列の対の数は、個々の具体的な熟語など
を登録しておく場合と比べてはるかに少なくて済む。そ
のため第1の辞書の容量を削減することができるととも
に、登録数が少ないために第1の辞書の管理効率が向上
し、またその検索効率も改善される。
【図面の簡単な説明】
【図1】図1は、本発明に係る単語列翻訳装置を含む自
動翻訳装置を実現するためのシステムのブロック図であ
る。
【図2】図2は、バッファBの構成を示す模式図であ
る。
【図3】図3は、熟語辞書30の構成を示す模式図であ
る。
【図4】図4は、バッファCの内容を示す模式図であ
る。
【図5】図5は、自動翻訳処理の全体の流れを示すフロ
ーチャートである。
【図6】図6は、熟語辞書引き処理の全体の概略フロー
チャートである。
【図7】図7は、バッファB作成処理のフローチャート
である。
【図8】図8は、熟語辞書引き準備処理のフローチャー
トである。
【図9】図9は、熟語辞書引き処理の本体処理を表わす
フローチャートである。
【符号の説明】
10 CPU 12 翻訳プログラムメモリ 14 CRT 16 キーボード 18 データベース 22 バッファA 24 バッファB 26 バッファC 28 単語辞書 30 熟語辞書

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1の言語の単語列と、前記第1の言語
    の単語列と類似の意味を表わすものとして選択された、
    第2の言語の単語列とからなる対を多数格納するための
    第1の辞書、および 前記第1の言語の単語を、前記第1
    の言語の単語と類似の意味を表わすものとして予め選択
    された前記第2の言語の単語に関連付けて多数格納する
    ための第2の辞書とを格納するためのメモリを含み、 各前記第1の言語の単語列は、前記第1の言語の単語の
    うちの複数の単語と一致関係が成立するように予め定め
    られた単語位置マークを含み、 各前記第2の言語の単語列は、前記第1の言語の単語列
    に含まれる前記単語位置マークに対応する位置に挿入さ
    れた単語置換位置マークを含み、 さらに、入力される前記第1の言語の文章に、前記第1
    の辞書および前記第2の辞書を参照することによって、
    前記第1の言語の単語列のうちの1つと一致する入力単
    語列が存在するか否かを検出するための一致検出手段
    と、 前記一致検出手段により前記第1の言語の単語列のいず
    れかと一致することが検出された入力単語列のうち、前
    記単語位置マークと一致関係が成立した単語に対応する
    前記第2の言語の単語を前記第2の辞書から取出し、前
    記第1の言語の単語列と対をなす前記第2の言語の単語
    列の前記単語置換位置マークと置換することにより、前
    記第1の言語の入力単語列を前記第2の言語の単語列に
    変換するための単語列変換手段とを含む、単語列翻訳装
    置。
JP4008297A 1992-01-21 1992-01-21 単語列翻訳装置 Expired - Lifetime JP2880600B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4008297A JP2880600B2 (ja) 1992-01-21 1992-01-21 単語列翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4008297A JP2880600B2 (ja) 1992-01-21 1992-01-21 単語列翻訳装置

Publications (2)

Publication Number Publication Date
JPH05197745A JPH05197745A (ja) 1993-08-06
JP2880600B2 true JP2880600B2 (ja) 1999-04-12

Family

ID=11689226

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4008297A Expired - Lifetime JP2880600B2 (ja) 1992-01-21 1992-01-21 単語列翻訳装置

Country Status (1)

Country Link
JP (1) JP2880600B2 (ja)

Also Published As

Publication number Publication date
JPH05197745A (ja) 1993-08-06

Similar Documents

Publication Publication Date Title
US4502128A (en) Translation between natural languages
EP0180888B1 (en) Method and apparatus for natural language processing
US4831529A (en) Machine translation system
EP0399533B1 (en) Machine translation system and method of machine translation
EP0244871B1 (en) Machine translation system
JP3960562B2 (ja) 機械翻訳の学習方法
US5640575A (en) Method and apparatus of translation based on patterns
EP0370774B1 (en) Machine translation system
JPH0351020B2 (ja)
JPH0567144A (ja) 前編集支援方法およびその装置
GB2192077A (en) A machine translation system
EP0403057B1 (en) Method of translating sentence including adverb phrase by using translating apparatus
JPH0351022B2 (ja)
JP2880600B2 (ja) 単語列翻訳装置
KR900008402B1 (ko) 기계번역장치
JP2632806B2 (ja) 言語解析装置
JPH0561902A (ja) 機械翻訳システム
Ying et al. A hybrid approach to Chinese-English machine translation
JP2719453B2 (ja) 機械翻訳装置
JPH09160920A (ja) 機械翻訳装置
JPH10198676A (ja) 日本語形態素解析装置及び日本語形態素解析方法
JPH11259473A (ja) 機械翻訳装置及び機械翻訳方法
JPH03191472A (ja) 文解析装置及びこれを用いた機械翻訳装置
JPS63136264A (ja) 機械翻訳装置
JPS62140165A (ja) 仮名漢字変換方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990119