JPH02208775A - 機械翻訳方式 - Google Patents

機械翻訳方式

Info

Publication number
JPH02208775A
JPH02208775A JP1030750A JP3075089A JPH02208775A JP H02208775 A JPH02208775 A JP H02208775A JP 1030750 A JP1030750 A JP 1030750A JP 3075089 A JP3075089 A JP 3075089A JP H02208775 A JPH02208775 A JP H02208775A
Authority
JP
Japan
Prior art keywords
sentence
extra
translation
machine translation
textual information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1030750A
Other languages
English (en)
Inventor
Shigeya Senda
滋也 千田
Minoru Sakai
稔 境井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1030750A priority Critical patent/JPH02208775A/ja
Publication of JPH02208775A publication Critical patent/JPH02208775A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 肢立分団 本発明は、機械翻訳方式に関する。
炙未庄挫 本発明に係る従来技術としては、特開昭58−1750
74号公報及び特開昭60−181973号公報などに
記載されたものがある。特開昭58−175074号公
報に記載されたものは、辞書を検索して与えられた原文
を構成する各単語にそれぞれ属性を与えるとともに、辞
書に未登録な上記原文中の単語についてはその属性を推
定し、上記原文を構成する各単語に対してそれぞれ与え
られた属性からその構文解析を行うものである。
また、特開昭60−181973号公報に記載されたも
のは、入力された文章の構文解析に係る単語の分割に際
し、辞書に存在しない単語が出現したときに、これを単
に固有名詞として扱うのではなく、該単語についての文
法的性質を出力して構文解析の精度を高めるようにした
未定義単語認定方式に関するものである。
我々が一般に読み書きしている文には、しばしば数式や
箇条書きなどの表現を使用する場合がある。これらの文
に従来の機械翻訳システムでは対応しておらず十分な訳
文が得られない場合がほとんどであった。たとえば、箇
条書きの部分を未知語として処理したとしても、訳出の
とき箇条書きの順序がくるってしまうなどの不都合な面
がでてきてしまう場合がある。又、数式に関してもユー
ザの手によって数式全体を未知語として扱うなどの方式
によって従来対応することが出来たが、数式の後ろに単
位などが付いている場合、たとえば、” a + b 
Km”といった表現に対して数式部分が数を表わすこと
を表現できないために不十分な訳しか得られず、又、ユ
ーザにとって前編集の手間が必要であった。
このように従来の機械翻訳システムでは、形態素解析部
において辞書引き、活用形の認定、未知語の発見、それ
に対しての適切な品詞の付与などの処理を行なっていた
目    的 本発明は、上述のごとき実情に鑑みてなされたもので、
形態素解析部においての未知語発見部分を拡張すること
によって、箇条書き、数式等の文章外情報を得、すなわ
ち、従来これらの表現が入力されたとき、未知語となる
か他の単語と混同されたりしたが5文章外情報発見部を
形態素解析部に導入し文章外情報を得て箇条書きとして
含まれる文の部分などを認定するようにすることを目的
とし、また、構文解析部では形態素解析部で得られた文
章外情報を利用して構文解析を行ない、その情報を処理
出力中に保持すること、変換生成部では文章外情報を保
持、利用しながら処理を行なって、出力文を出力するこ
と、これらの文章外情報の処理には、構文木や意味表現
中で文章外情報を保持するようにすることによって行な
うこと、文中の箇条書きでは訳出される場合に箇条書き
の順序が保持されないと不都合であるので、これを解決
するために内部表現に部分的な訳出順序を制御するため
の順序を順序リンクと呼ばれるもので示すことによって
行なう機械翻訳方式を提供することを目的としてなされ
たものである。
鼻−一戒 本発明は、上記目的を達成するために、自然言語の文を
入力するための入力装置と、該入力装置からの原文を他
言語へ翻訳する機械翻訳装置において、辞書を用いて単
語を認定する形態素解析部と1文章の構造を解析する構
文解析部と、他言語の構造訳文を原文の構造から作り出
す変換生成部と、原文訳文を表示する表示装置とからな
り、前記形態素解析部が、解析すべき文章自体と関係を
有するが翻訳処理を行なうための文章外情報である箇条
書き、数式、表題などを検索して該文章外情報を処理し
、前記構文解析部が、前記形態素解析部からの文章外情
報を処理し、前記変換生成部が、前記文章外情報を処理
して、それを利用した訳文を生成すること、更に、構文
木や意味表現などの内部表現において、その対応する部
分に文章外情報を特別に付加すること、更に、箇条書き
、表題等を処理すること、更に、数式を処理することを
特徴とすること、更に、前記箇条書き、表題等を処理す
るに際し、入力文の形態素から得られる訳出項を出力に
反映させるために内部表現に訳出順を部分的に指定する
ことを特徴としたものである。以下1本発明の実施例に
基づいて説明する。
第1図は1本発明による機械翻訳方式の一実施例を説明
するための構成図で、第2図は、第1図における形態素
解析部の構成図である0図中、1は原文人力部、2は形
態素解析部、3は前編集部、4は構文解析部、5は変換
生成部、6は出力部、7は後編集部、8は辞書引き単位
切り出し部、9は辞書引き部、10は辞書、11は数字
・固有名詞・派生語等処理部、12は派生語処理部、1
3は未知語処理部、14は文章分情報処理部、15は文
末処理部、16はテンポラリ辞書である0文章外情報処
理部14以外は従来から行なわれている処理を行なうが
、それと平行して箇条書き、数式などの認定を文章分情
報処理部14で行なう。
この部分では、パターンマツチングデータと入力データ
をくらべ、評価を行なって文章情報を認定する。
第1表にパターンマツチングデータの例を示す。
箪工点 又、箇条書きの中は文・句・節などの単位となっている
ので箇条書き部分を一つのブロックとして解析するよう
に指定して構文解析部4にデータを出力する。構文解析
部4に送られる形態素解析部2の出力は入力テキストの
先頭からの単語および品詞・活用などのデータとともに
、文章外情報のデータである。
構文解析部4では構文解析を行ない構文解析木・意味表
現を作る。これらの内部表現は一般にノードとリンクを
持つグラフ又は木として表現されるが、さらにここでは
文章外情報を処理するためにこれらの情報も含めた形で
内部表現とする。
第3図に英日機械翻訳の英語解析すなわち“l1eca
n pick out two considerat
J、on (1) ’de wantto do th
at and (2) we don’t want 
to do that、’の結果の例を示す、これは箇
条書きの例で文中に箇条書きがうめこまれている場合で
ある。この場合、数式や文の箇条書きとちがい、単に箇
条書きの゛(1)”といった表現を形態素解析で発見し
、品詞を設定するだけでなく、第3図に示すように順序
リンクという訳出順序を制御するための情報が構文解析
によって与えられる。
変換生成部5では第3図であたえられた箇条書きなどの
情報を保存しながら他言語の生成を行ない、順序リンク
を参照することにより箇条書きに対応した訳出を行なう
ことができる。第4図にその訳出例、すなわち“我々は
2つの考え(1)我々はそれをしたいと(2)我々はそ
れをしたくないをとり上げることができる。′を示すも
のである。
ここでは構文トランスファ方式についての例を示したが
、それ以外の方式についても本発明は容易に適用可能で
あることは明らかである。
紘−一員 以上の説明から明らかなように、本発明によると、形態
素解析部において未知語発見部分を拡張することによっ
て、箇条書きや数式等の文章外情報を得ることができ、
箇条書きとして含まれる文の部分などを認定することが
可能であり、複雑な入力文に対応でき、翻訳率を向上す
ることができる。また、形態素解析部からの語順情報を
訳文に反映でき翻訳率を向上することができる。
【図面の簡単な説明】
第1図は1本発明による機械翻訳方式の一実施例を説明
するための構成図、第2図は、第1図における形態素解
析部の構成図、第3図は、英日機械翻訳の英語の構文解
析の例を示す図、第4図は、その訳出例を示す図である
。 1・・・原文人力部、2・・・形態素解析部、3・・・
前編集部、4・・・構文解析部、5・・・変換生成部、
6・・・出力部、7・・・後編集部、8・・・辞書引き
単位切り出し部、9・・・辞書引き部、10・・・辞書
、11・・・数字・固有名詞・派生語等処理部、12・
・・派生語処理部。 13・・・未知語処理部、14・・・文章分情報処理部
、15・・・文末処理部、16・・・テンポラリ辞書。 特許出願人  株式会社 リコー

Claims (1)

  1. 【特許請求の範囲】 1、自然言語の文を入力するための入力装置と、該入力
    装置からの原文を他言語へ翻訳する機械翻訳装置におい
    て、辞書を用いて単語を認定する形態素解析部と、文章
    の構造を解析する構文解析部と、他言語の構造訳文を原
    文の構造から作り出す変換生成部と、原文訳文を表示す
    る表示装置とからなり、前記形態素解析部が、解析すべ
    き文章自体と関係を有するが翻訳処理を行なうための文
    章外情報である箇条書き、数式、表題などを検索して該
    文章外情報を処理し、前記構文解析部が、さらに前記形
    態素解析部からの文章外情報を処理し、前記変換生成部
    が、前記文章外情報を処理してそれを利用した訳文を生
    成することを特徴とする機械翻訳方式。 2、構文木や意味表現などの内部表現において、その対
    応する部分に文章外情報を特別に付加することを特徴と
    する請求項1記載の機械翻訳方式。 3、箇条書き、表題等を処理することを特徴とする請求
    項1又は請求項2記載の機械翻訳方式。 4、数式を処理することを特徴とする請求項1又は請求
    項2記載の機械翻訳方式。 5、前記箇条書き、表題等を処理するに際し、入力文の
    形態素から得られる訳出項を出力に反映させるために内
    部表現に訳出順を部分的に指定することを特徴とする請
    求項3記載の機械翻訳方式。
JP1030750A 1989-02-08 1989-02-08 機械翻訳方式 Pending JPH02208775A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1030750A JPH02208775A (ja) 1989-02-08 1989-02-08 機械翻訳方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1030750A JPH02208775A (ja) 1989-02-08 1989-02-08 機械翻訳方式

Publications (1)

Publication Number Publication Date
JPH02208775A true JPH02208775A (ja) 1990-08-20

Family

ID=12312363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1030750A Pending JPH02208775A (ja) 1989-02-08 1989-02-08 機械翻訳方式

Country Status (1)

Country Link
JP (1) JPH02208775A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713970A (ja) * 1993-05-28 1995-01-17 Nec Corp 機械翻訳装置
US6081773A (en) * 1997-09-03 2000-06-27 Sharp Kabushiki Kaisha Translation apparatus and storage medium therefor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713970A (ja) * 1993-05-28 1995-01-17 Nec Corp 機械翻訳装置
US6081773A (en) * 1997-09-03 2000-06-27 Sharp Kabushiki Kaisha Translation apparatus and storage medium therefor

Similar Documents

Publication Publication Date Title
US7447623B2 (en) Machine translation
US7565281B2 (en) Machine translation
US6473729B1 (en) Word phrase translation using a phrase index
JP4694121B2 (ja) 句の間の翻訳関係を学習するための統計的な方法および装置
KR101099177B1 (ko) 기계 번역기를 훈련하기 위한 방법 및 시스템
EP1349079A1 (en) Machine translation
EP1351158A1 (en) Machine translation
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
WO2003056450A1 (fr) Procede et appareil d'analyse syntaxique
JPH02208775A (ja) 機械翻訳方式
JPH0561902A (ja) 機械翻訳システム
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
JPH0421167A (ja) 機械翻訳装置
JPH0320866A (ja) テキストベース検索方式
JP3055690B2 (ja) 日本語同格名詞句翻訳方式
EP1306773A1 (en) Machine translation
EP1306774A1 (en) Machine translation
Reinke Towards a closer integration of termbases, translation memories, and parallel corpora-a translation-oriented view
JPH0887504A (ja) 前編集支援方法および装置
JPH10105552A (ja) 機械翻訳システム
JPH0749871A (ja) 定型文翻訳方式
JPH09146959A (ja) 機械翻訳システム
JPH02110771A (ja) 電訳機
JPS63136268A (ja) 機械翻訳装置
JPH0481971A (ja) 機械翻訳機