JP2521435B2 - 日本語生成装置 - Google Patents

日本語生成装置

Info

Publication number
JP2521435B2
JP2521435B2 JP61107670A JP10767086A JP2521435B2 JP 2521435 B2 JP2521435 B2 JP 2521435B2 JP 61107670 A JP61107670 A JP 61107670A JP 10767086 A JP10767086 A JP 10767086A JP 2521435 B2 JP2521435 B2 JP 2521435B2
Authority
JP
Japan
Prior art keywords
node
japanese
sentence
noun
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61107670A
Other languages
English (en)
Other versions
JPS62264367A (ja
Inventor
壽彦 横川
泰之 沼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61107670A priority Critical patent/JP2521435B2/ja
Publication of JPS62264367A publication Critical patent/JPS62264367A/ja
Application granted granted Critical
Publication of JP2521435B2 publication Critical patent/JP2521435B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は日本語生成装置、とくに自動翻訳装置に有用
な日本語生成装置に関する。
従来技術 たとえば英語などの外国語の文からそれに対応する日
本語の文を作成する場合、入力された英文の形態素を解
析し、その構文を解析し、その文構造を変換し、そのの
ち日本語の訳文を生成する。
周知のように日本語では、名詞の数を表わす場合、複
数形の名詞をとることはごく稀れであり、通常は助数詞
を使用する。たとえば「三匹の犬」「犬が三匹」などと
いうように名詞に「匹」などの助数詞をとることが多
い。しかし従来の機能翻訳装置では、名詞の数が助数詞
を使用して適切に訳出されていなかった。
たとえば英文“I saw three dogs."は、従来の機械翻
訳方式では、「私は三の犬を見た。」か「私は三犬を見
た。」程度の訳文しか得られなかった。これらの訳文
は、意味は理解できるとしても、日本語の表現として自
然さを欠くことは否めない。
目 的 本発明はこのような従来技術の欠点を解消し、数の表
現に関してより自然な日本語が生成される日本語生成装
置を提供することを目的とする。
構 成 本発明は上記の目的を達成させるため、外国語の単語
についてそれに対応する日本語の単語、および名詞につ
いては名詞のとり得る助数詞に関する辞書データを格納
した辞書手段と、形態素および構文が解析された外国語
の文について辞書手段を索引して対応する日本語の文を
生成する日本語生成手段とを有し、日本語生成手段は、
外国語の文に数詞を含む名詞句があると、辞書手段より
得られた数詞に関連する名詞の辞書データに従って助数
詞を名詞に付加して日本語の文を生成する日本語生成装
置を特徴としたものである。以下、本発明の一実施例に
基づいて具体的に説明する。
第1図を参照すると、本発明による自動翻訳装置の訳
文生成方式を英日自動翻訳装置に適用した実施例の全体
構成が示されている。なお本発明は、英語を日本語に翻
訳する英日自動翻訳装置のみならず、他の外国語を日本
語に翻訳する自動翻訳装置にも効果的に適用されること
は、言うまでもない。
同実施例は入力部10を有し、日本語に翻訳すべき英文
テキスト12がこれにより入力される。入力部10はたとえ
ば、英数字キーなどの文字キーや機能キーなどを有する
キーボード、紙に記録された英文テキストを読み取る光
学的文字読取装置(OCR),および(または)磁気ディ
スクなどの記憶媒体に記録された英文テキストを読み込
むファイル記憶装置などを含んでよい。
入力部10により入力された英文テキストは、前編集部
14に読み込まれ、翻訳の前処理が行なわれる。ここで
は、主として文の認定と未知語の処理を行なう。これは
形態素解析の一部として機能する。
前編集された英文データは、前編集で得られた情報と
ともに形態素解析部16に転送される。形態素解析部16で
は、単語辞書18を索引して文に分割し、英文の形態素を
解析し、未知語の処理、固有名詞、時の表現、数の表現
などの各種のまとめあげを行ない、付化疑問、同格の認
定などの文全体の処理を行なう。その形態素解析ルール
は解析ルールファイル36に格納されている。
こうして形態素解析された英文データは、形態素解析
で得られた辞書情報とともに構文解析I部20に転送され
る。構文解析I部20は、本実施例ではcfg文法(context
−free grammar:文脈自由文法)ルールを英文データに
適用して文についてbottom−up,right−to−leftに表層
構造の解析を行ない、すべての構文的可能性を見つけ出
す機能部である。
構文解析I部20で構文解析(パーズ)された英文デー
タは、その解析情報とともに構文解析II部22に送られ
る。ここでは、構文解析Iによる表層的なパーズ結果か
ら、構造記述を適用して解を選択する。これによって英
語文の確からしい解析木を作成し、その構造を作る。こ
れらの構文解析ルールはやはり、解析ルールファイル36
に格納されている。
構文解析された英文データは、解析木のデータとして
構造変換部24に転送される。構造変換部24では、英語文
の中間的構造である構文木から対応する日本語文の構文
木を作成し、日本語文を訳出しやすい日本語基底構造に
変換する。
こうして構造変換された日本語の構文木を示す構文木
データは訳文生成部26に送出され、後者にて訳文の生成
が行なわれる。これは、日本語の構文木の木構造から日
本語の文を生成する機能である。まず、語順を日本語の
それに一致させるため、順序の入換えを行なって木構造
を変更する構文生成を行ない、次に形態素生成を行なっ
て構文木においてtop−down,left−to−rightに訳文を
生成する。
訳文生成された日本語文データ、すなわち訳文データ
は、後編集部30に送られる。後編集部30では、翻訳処理
に利用した情報を使用し、辞書18を索引して訳文データ
を修正し、より自然な日本語文を完成する。この日本語
文データは出力部32に転送され、翻訳された日本語文34
として出力部32から出力される。出力部32は、たとえば
プリンタ、ディスプレイ、および(または)磁気ディス
クなどのファイル記憶装置を含む。
これらの一連の翻訳処理の流れは、本装置全体の制御
を統括する制御部38によって制御される。単語辞書18に
は、本実施例では英語および日本語の単語についての辞
書データが格納され、解析ルールファイル36には、形態
素解析および構文解析のルールデータが格納されてい
る。
制御部38には、操作表示部40が接続されている。操作
表示部38は、操作者から本装置に様々な指示を与える、
たとえば翻訳指示キー、カーソルキーなどの操作キー
や、入力英語文デキスト、翻訳結果の日本語文、辞書情
報などの中間データ、操作者に対する様々な指示などを
可視表示するディスプレイやインジケータを有する。な
お、それらの操作表示機能の多くは、入力部10にキーボ
ードを備えている場合はそのキーボードに、または出力
部32にディスプレイを備えている場合はそのディスプレ
イに含まれるように構成してよい。
ところで構文解析I部20では、形態素解析された英文
データについて、ファイル記憶装置36に格納されている
cfg文法ルールを英文にright−to−leftに適用してその
文について可能性のあるすべての構文解を導出する。こ
の解は一般に構造木の形で理解される。これは、1つの
文ごとにそれに含まれる単語または句が修飾関係および
格関係などの従属ないしは共起関係によって相互に関連
づけられ、たとえば親、子、孫といった相互の従属関係
を示すものである。各単語または句は、構造木の節点す
なわちノードの位置を占める。
こうして構文上のまとまりと従属関係を規定するデー
タが得られると、これは構文解析II部24に送られる。こ
のデータは、前述した構文木の形で容易に理解される。
これは、さらに構造変換部24で日本語文の構造に変換さ
れ、訳文生成部26では、それに含まれる各ノードごとに
訳文を生成してゆく。構造木におけるノードの処理は、
top−down,left−to−rightで行なう。
本実施例における訳文生成部26では、日本語の名詞に
附随する助数詞について次のような処理を行なう。すな
わち、名詞の内在素性から助数詞情報を取り込み、その
助数詞を数字ないしは数詞の後に付加し、助数詞の後に
は助詞の「の」を付加する。この手法によれば、たとえ
ば名詞に対する形容部が長いときなどは生成した日本語
に若干の不自然さが残ることがあるものの、複雑で特殊
な処理を行なわなくても自然な日本語文の表現が得られ
る長所がある。
助数詞情報は、各可算名詞について単語辞書18に登録
されている。単語辞書18には、英語の単語や熟語につい
ての辞書情報が格納されているが、たとえば第2図に示
すように、本実施例では各語の変化形ごとにエントリが
形成され、そのすべての情報が展開されている。勿論、
英語の単語に対応する日本語の単語についてのデータも
登録されている。
たとえば品詞情報については、同図に示すように複数
の品詞の情報を持つことができる。名詞のうち可算名詞
は、日本語における助数詞に関してどのような助数詞、
たとえば「匹」「頭」「人」「名」「者」「台」「個」
「つ」などをとるかが内在素性として登録されている。
たとえば英単語“dogs"のエントリには、可算名詞の複
数形であり、助数詞として「匹」をとることが登録され
ている。なお辞書18の構成の仕方は、この例に限定され
ないことは明らかであろう。
名詞の数の処理については、構文木を構成する各ノー
ドに対して第3図に示すような処理フローにて日本語の
助数詞を生成してゆく。たとえば前述の英文“I saw th
ree dogs."が入力部10から入力されると、形態素解析部
16による形態素解析、構文解析I部20および同II部22に
よる構文解析、ついで構造変換部24による構造変換など
の諸解析の結果、第4図に示すような構文木が形成され
る。これからわかるように、数字ないしは数詞ノード
“THREE"は名詞ノード“DOGS"に従属し、両者で名詞句
を形成している。
訳文生成部26では、この構文木についてtop−down,le
ft−to−rightに生成処理を行なう。つまり、ノード
“I"“THREE"“DOGS"“SAW"なる順に制御が進行し、そ
れぞれのノードについて第3図の生成処理が実行され
る。
1つのノードについて、まず、数字ノードか否かを判
定し(100),それが数字ノードであればその親ノード
が名詞か否かを調べる(102)。たとえばノード“THRE
E"の場合、これは数詞であり、その親ノード“DOGS"
は、辞書18の情報によれは可算名詞の複数形で、助数詞
として「匹」をとることがわかる。そのノードが数字ノ
ードでなく、しかも名詞の親ノードをもっていないとき
は、そのノードの訳語を生成して次のノードに移行する
(108)。たとえばノード“I"“DOGS"および“SAW"につ
いてはそのまま処理108が行なわれ、それぞれ「私は」
「犬を」および「見た。」なる訳語が生成される。
親ノードが名詞であれば、自己のノード、すなわちそ
の数字ノードの数を訳出する(104)。その際、親ノー
ド、すなわちこの場合は名詞ノードであるが、これにつ
いての辞書情報を参照してその助数詞情報から助数詞に
対する訳語を生成する(106)。この例では、助数詞情
報によれば、助数詞として「匹」をとることがわかるか
ら、日本語の助数詞「匹」が生成され、その後に助詞
「の」が付加される。したがってこの部分の訳語は、
「三匹の」となる。
こうして訳文生成部26では、この例では「私は三匹の
犬を見た。」なる訳文が出力される。たとえば“I saw
three men."なる英文が入力されれば、「私は三人の男
を見た。」なる訳文が生成される。こうして生成された
訳文は、後編集部30で後処理が行なわれ、操作表示部40
に可視表示されるとともに、出力部32にて日本文34とし
てたとえば印字出力される。
効 果 本発明によれば、日本語の生成において、名詞の辞書
情報から助数詞情報を取り込み、これに従って日本語の
助数詞を数字の後に付加し、助数詞の後には助詞の
「の」を付加する。この方式によれば、比較的簡単な処
理で日本語の自然さを失うことなく名詞の数を表現する
ことができる。したがって数の表現に関してより自然な
日本語が生成される。
【図面の簡単な説明】 第1図は、本発明による日本語生成装置を英日自動翻訳
装置に適用した実施例の全体構成を示す機能ブロック
図、 第2図は、第1図に示す実施例における単語辞書に格納
されている英語の単語についての辞書情報の例を示す説
明図、 第3図は、同実施例の日本語生成処理における助数詞を
中心とした処理の例を示すフロー図、 第4図は、同実施例の動作説明に使用する入力英文例の
構文木構造の例を示す説明図である。 主要部分の符号の説明 10……入力部 16……形態素解析部 18……単語辞書 20,22……構文解析部 24……構造変換部 26……訳文生成部 32……出力部 36……解析ルール 38……制御部 40……操作表示部

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】外国語の単語についてそれに対応する日本
    語の単語、および名詞については該名詞のとり得る助数
    詞に関する辞書情報を格納した辞書手段と、 形態素および構文が解析された外国語の文について該辞
    書手段を索引して対応する日本語の文を生成する日本語
    生成手段とを有し、 該日本語生成手段は、前記外国語の文に対して形態素お
    よび構文解析を行なってノードからなる構文木を形成
    し、形成した構文木において、1つのノードについて、
    該ノードが数字ノードか否かを判定し、該ノードが数字
    ノードであり、かつ、該数字ノードの親ノードが名詞で
    ある場合には、該数字ノードの数の訳語を生成するとと
    もに、前記辞書手段の辞書情報を参照して、該数字ノー
    ドの親ノードである名詞のとりうる助数詞に対する訳語
    を生成し、数字の訳語の後に助数詞の訳語を付加して日
    本語の文を生成する一方、1つのノードについて、これ
    が数字ノードでないか、または、数字ノードであるがそ
    の親ノードが名詞ではない場合には、該ノードの訳語の
    みを生成して、次のノードに移行することを特徴とする
    日本語生成装置。
  2. 【請求項2】特許請求の範囲第1項記載の装置におい
    て、前記日本語生成手段は、数字の訳語の後に助数詞の
    訳語を付加する場合、助数詞の訳語の後にさらに助詞
    「の」を付加して日本語の文を生成することを特徴とす
    る日本語生成装置。
JP61107670A 1986-05-13 1986-05-13 日本語生成装置 Expired - Lifetime JP2521435B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61107670A JP2521435B2 (ja) 1986-05-13 1986-05-13 日本語生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61107670A JP2521435B2 (ja) 1986-05-13 1986-05-13 日本語生成装置

Publications (2)

Publication Number Publication Date
JPS62264367A JPS62264367A (ja) 1987-11-17
JP2521435B2 true JP2521435B2 (ja) 1996-08-07

Family

ID=14465023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61107670A Expired - Lifetime JP2521435B2 (ja) 1986-05-13 1986-05-13 日本語生成装置

Country Status (1)

Country Link
JP (1) JP2521435B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01209571A (ja) * 1988-02-17 1989-08-23 Ricoh Co Ltd 日本語生成方法
CN111191440B (zh) * 2019-12-13 2024-02-20 语联网(武汉)信息技术有限公司 翻译中针对译文的量词纠错方法及***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6180359A (ja) * 1984-09-26 1986-04-23 Sharp Corp 翻訳装置
JPS6177970A (ja) * 1984-09-22 1986-04-21 Sharp Corp 翻訳の表示方式

Also Published As

Publication number Publication date
JPS62264367A (ja) 1987-11-17

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
US5528491A (en) Apparatus and method for automated natural language translation
JPS62163173A (ja) 機械翻訳方法
JPH0682377B2 (ja) 感情情報抽出装置
JP2521435B2 (ja) 日本語生成装置
JPH02112068A (ja) テキスト簡略表示方式
JP2626722B2 (ja) 日本語生成装置
JP2632806B2 (ja) 言語解析装置
JP2688020B2 (ja) 派生語処理方式
JP2938897B2 (ja) 文書作成処理装置
KR940022312A (ko) 기계번역장치 및 방법
JP3313810B2 (ja) アスペクト処理装置
JP3921904B2 (ja) 翻訳文検索装置
JPS63180172A (ja) 機械翻訳装置
JPH0816910B2 (ja) 言語解析装置
Turcato et al. Creating high-quality, large-scale bilingual knowledge bases using minimal resources
JPH04130577A (ja) 自然言語処理装置
JPS62271054A (ja) 翻訳装置における形態素解析結果修正方式
JPH02140869A (ja) 文章の構造解析方法
JPH04257061A (ja) 機械翻訳処理方式
JPH0258162A (ja) 機械翻訳装置および機械翻訳方法
JP2000163419A (ja) 和訳装置及び和訳方法、並びに和訳用プログラムを記録した記録媒体
JPH07249044A (ja) 機械翻訳装置
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH04107674A (ja) 言語処理装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term