JPH04257061A - 機械翻訳処理方式 - Google Patents

機械翻訳処理方式

Info

Publication number
JPH04257061A
JPH04257061A JP3039342A JP3934291A JPH04257061A JP H04257061 A JPH04257061 A JP H04257061A JP 3039342 A JP3039342 A JP 3039342A JP 3934291 A JP3934291 A JP 3934291A JP H04257061 A JPH04257061 A JP H04257061A
Authority
JP
Japan
Prior art keywords
quantitative expression
sentence
internal structure
quantitative
numerical expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3039342A
Other languages
English (en)
Inventor
Yasuhiro Takayama
泰博 高山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP3039342A priority Critical patent/JPH04257061A/ja
Publication of JPH04257061A publication Critical patent/JPH04257061A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、入力された原文を目
的言語の文に訳文して出力する機械翻訳処理装置におい
て、特に複雑な構造を持つ数量表現を含む文の機械翻訳
処理方式に関するものである。
【0002】
【従来の技術】計算機を利用して、ある言語を他の言語
に翻訳する種々の機械翻訳処理方式が開発されてきてお
り、これらの機械翻訳処理方式においては、文中におけ
る数量表現を含む言語現象を解析し処理するための対策
がなされている。図6は、例えば「英語数量表現の解析
」(情報処理学会第38回全国大会講演論文集6E−6
、飯野ほか著)に示された数量表現の解析方式を示す図
である。図6において42は原言語の形態素解析を行う
形態素解析手段、43は数量表現のまとめ上げなどを行
う構文解析前処理手段、44は構文解析を行う構文解析
手段、45は意味解析を行う意味解析手段である。また
、図7は、例えば「日本語の数量詞の意味処理について
」(情報処理学会自然言語処理研究会資料78−17、
旭岡ほか著)に示された従来の数量表現処理に関する助
数詞46と属性の名称を表す関数名詞47との対応表で
あり、図8は前記文献に示された個々の事象名詞48と
関数名詞49との対応表である。
【0003】次に動作について説明する。図6に示すよ
うに、従来の機械翻訳処理方式における数量表現の処理
では、形態素解析手段42と構文解析手段44との間に
構文解析前処理手段43を設け、入力文中に出現した数
量表現に対し、一箇所で局所的な解析のみを行うことに
より、数量表現に関する処理を行っている。また、数量
表現の解析に用いる情報としては、従来は図7に示すよ
うな助数詞46とその助数詞が表す属性の名称である関
数名詞47との対応表と、図8に示すような個々の事象
名詞48と前記関数名詞49との対応表とを用いて文中
の名詞と数量表現との関係に関して局所的な解析を行っ
ている。
【0004】
【発明が解決しようとする課題】実際に使用されている
文書中の文においては、複数の数量表現が名詞を修飾し
たり、数量詞や名詞が複合構造をなす場合があり、従来
の機械翻訳処理方式では図6の構文解析前処理手段43
のように数量表現を一箇所のモジュールだけで処理する
ので、前記のような複合構造を持つ要素に関する処理が
困難となり、また、図8のように個々の名詞に対して、
その名詞が取り得る属性を表す名詞を記述するのは膨大
な辞書項目に対する作業上の困難を伴い、前記属性が記
述されていない名詞に対しては処理が行われないことに
なり、図7および図8においては、名詞の数量に関する
情報を表す数量数量詞と名詞の属性に関する情報を表す
属性数量詞の区別を設けてないので、複数の数量詞が名
詞を修飾している場合の上記区別の判断処理は効率が悪
いなどの問題点があった。
【0005】この発明は上記のような問題点を解決する
ためになされたもので、原言語の文中における数量表現
が複雑な形態や意味を持っていても、原言語の文を正確
に解析し的確に変換して目的言語の文を生成することが
できる機械翻訳処理方式を提供することを目的とする。
【0006】
【課題を解決するための手段】この発明に係る機械翻訳
処理方式は、原言語辞書4を用いて入力原文を構成要素
ごとの内部構造に置き換える形態素解析手段3と、上記
入力原文中に数量表現が含まれている場合に上記原言語
辞書4に記述された数量表現情報及び数量詞とその意味
分類との対応表を用いて数量表現に関して構成要素ごと
の内部構造から部分的な構造を作成する数量表現解析手
段5と、上記数量表現を考慮しながら上記入力原文中の
並列句や名詞修飾句などの部分的な解析を行う構文解析
前処理手段6と、上記入力原文の文の構成要素ごとの内
部構造の間の関係を解析する構文解析手段7と、上記解
析された原文の内部構造に対して変換辞書9を参照して
訳文の内部構造に変換する変換処理手段8と、この変換
処理の副処理過程として上記原文の原言語の数量表現に
対する上記部分的な解析による内部構造を目的言語の数
量表現の内部構造に変換する数量表現変換手段10と、
上記訳文の内部構造から目的言語の文法規則を満たす構
造の構文を生成する構文生成手段13と、この構文生成
の副処理過程として変換された数量表現に対する内部構
造から目的言語の数量表現を生成する数量表現生成手段
14とを備え、数量表現を含む原文を目的言語の数量表
現を含む訳文に翻訳するものである。
【0007】
【作用】形態素解析手段3は原言語辞書4を用いて入力
原文を構成要素ごとの内部構造に置き換え、数量表現解
析手段5は入力原文中に数量表現が含まれている場合に
原言語辞書4に記述された数量表現情報及び数量詞とそ
の意味分類との対応表を用いて数量表現に関して構成要
素ごとの内部構造から部分的な構造を作成する。構文解
析前処理手段6は数量表現を考慮しながら入力原文中の
並列句や名詞修飾句などの部分的な解析を行い、構文解
析手段7は入力原文の文の構成要素ごとの内部構造の間
の関係を解析する。変換処理手段8は解析された原文の
内部構造に対して変換辞書9を参照して訳文の内部構造
に変換し、数量表現変換手段10は数量表現に対する内
部構造を目的言語の数量表現の内部構造に変換する。構
文生成手段13は訳文の内部構造から目的言語の文法規
則を満たす構造の構文を生成し、数量表現生成手段14
は変換された数量表現に対する内部構造から目的言語の
数量表現を生成する。したがって数量表現を含む原文は
目的言語の数量表現を含む訳文に翻訳される。
【0008】
【実施例】図1はこの発明の一実施例に係る機械翻訳処
理方式の処理の流れを示すブロック図である。図1にお
いて、1は入力原文を構成する文字の種類に関する情報
を解析して入力原文に文字の種類に関する情報を設定す
る字種情報解析手段、2は原言語辞書4中に存在しない
上記入力原文中の記号列を解析する記号列解析手段、3
は上記解析された記号列と原言語辞書4を用いて入力原
文を構成要素ごとの内部構造に置き換える形態素解析手
段、5は入力原文中に数量表現が含まれている場合に原
言語辞書4に記述された数量表現情報及び数量詞とその
意味分類との対応表を用いて数量表現に関して構成要素
ごとの内部構造から部分的な構造を作成する数量表現解
析手段、6は数量表現を考慮しながら入力原文中の並列
句や名詞修飾句などの部分的な解析を行う構文解析前処
理手段、7は入力原文の文の構成要素ごとの内部構造の
間の関係を解析する構文解析手段、8は上記解析された
原文の内部構造に対して変換辞書9を参照して訳文の内
部構造に変換する変換処理手段、10はその変換処理の
副処理過程として原文の原言語の数量表現に対する上記
部分的な解析による内部構造を目的言語の数量表現の内
部構造に変換する数量表現変換手段、11は変換された
訳文の内部構造から数量表現に類する程度表現の目的言
語での修飾関係を決定する変換後処理手段、12は内部
構造に設定された意味的な情報を利用して目的言語での
語順に関する情報などを設定する生成前処理手段、13
は訳文の内部構造から目的言語の文法規則を満たす構造
の構文を生成する構文生成手段、14はその構文生成の
副処理過程として変換された数量表現に対する内部構造
から目的言語の数量表現を生成する数量表現生成手段、
15は目的言語辞書16を参照しながら数量表現の情報
に応じた冠詞生成や複数変化を伴う訳語生成を行う形態
素生成手段、17は出力文に関する最終的な整形処理を
施す生成後処理手段である。
【0009】図2はこの実施例に用いる名詞と数量数量
詞との対応表を示す図であり、18は名詞の意味分類、
19は助数詞である。図3はこの実施例に用いる名詞と
属性数量詞との対応表を示す図であり、20は名詞の意
味分類、21は助数詞である。
【0010】図4はこの実施例に用いる数量詞情報を持
つ辞書項目の例であり、22は見出し、23は見出しに
対する読み情報、24は見出しに対する品詞情報、25
は見出しに対する意味分類、26は見出しに対する訳語
情報、27は見出しに対する詳細な情報を格納するため
の拡張項目、28は数量数量詞情報、29は属性数量詞
情報である。
【0011】図5はこの実施例の機械翻訳方式を採用し
た機械翻訳処理装置の一構成例を示すブロック図である
。図5に示すように、この機械翻訳処理装置は、キーボ
ード、マウス、OCR(光学文字読取装置)等の入力手
段としての入力装置30と、この入力装置30を制御す
る入力制御部31と、翻訳作業全体を管理し、原文や訳
文の編集処理を制御する編集制御部32と、原文や訳文
等の表示を制御する表示制御部33と、この表示制御部
33から指示された内容を表示する表示装置34と、翻
訳処理を行う翻訳手段としての翻訳系35と、原文を記
憶する原文記憶部36と、原文と訳文の対訳を記憶する
対訳文記憶部37と、訳文を記憶する訳文記憶部38と
、原文や訳文などの印刷を制御する印刷制御部39と、
この印刷制御部39から指示された内容を印刷する印刷
装置40と、翻訳処理に必要な辞書情報が格納してあり
、その辞書情報を検索する機能を有する辞書システム4
1とから構成されている。
【0012】図1に示す原言語辞書4と変換辞書9と目
的言語辞書16は図5に示す辞書システム41に格納さ
れる。また、図1に示す各手段は図5に示す編集制御部
32を中心として実行される。
【0013】次に図1〜図5を参照してこの実施例の動
作について説明する。原文が入力装置30から入力され
ると字種情報解析手段1によって原文に文字の種類に関
する情報を設定し、記号列処理手段2において原言語辞
書4中に存在しない原文中の記号列を解析し、形態素解
析手段3において原言語辞書4を利用しながら文を構成
要素ごとに内部構造に置き換える。このとき辞書情報に
図4に示すような数量表現情報がある場合には内部構造
に保持しておく。数量表現解析手段5において図2およ
び図3に示した情報と内部構造に格納された図4に示す
情報を利用して数量表現の内部構造と名詞の修飾関係を
解析し、構文解析前処理手段6において数量表現やその
数量表現が修飾する名詞句が並列句や複合名詞などの複
合構造である場合にも内部構造をまとめあげる処理を行
い、構文解析手段7で残りの構成要素ごとの内部構造の
並びから一つの構造を作成する。
【0014】次に、変換処理手段8では原言語と目的言
語との構造の違いに関する情報を保有する変換辞書9を
参照して構造変換処理を行うとともに、副処理として数
量表現変換手段10を呼び出して数量表現解析手段5で
内部構造に設定した数量表現の情報に基づく数量変換処
理を適用し、変換後処理手段11では「少し」、「たく
さん」などの数量表現に類する程度表現の目的言語での
修飾関係を決定する。
【0015】更に、生成前処理手段12では内部構造に
設定された意味的な情報を利用し目的言語での語順に関
する情報などを設定し、構文生成手段13では目的言語
の文法規則を満たす構造を作成し、副処理である数量表
現生成手段14では数量表現に関わる構文を決定し、形
態素生成手段15では、目的言語辞書16を参照しなが
ら数量表現の情報に応じた冠詞生成や複数変化を伴う訳
語生成を行い、生成後処理手段17では出力文に関する
最終的な整形処理を施すことになる。そして整形処理を
施された訳文は表示装置34又は印刷装置40に出力さ
れる。
【0016】以上説明したように上記実施例では、数量
表現を含む原文が入力されると、数量表現と名詞との解
析が行われ、次いで複合構造を持つ数量表現や名詞句と
の関係の解析が行われ、その後それらの数量表現の目的
言語への変換が行われ、そして目的言語の文法を満足す
る形式の数量表現を含む文字列が生成される。従って上
記実施例は、辞書中に記述された名詞の意味分類と数量
数量詞、前記名詞の意味分類と属性数量詞との関係を記
述し、更に個々の辞書項目に数量数量詞と属性数量詞の
情報を記述するので、効率良くかつ詳細な数量表現情報
の記述が可能になるとともに複数の数量表現が一つの名
詞を修飾している場合にも適切に処理できる。また、上
記実施例においては、名詞の意味分類と数量数量詞の対
応と、名詞の意味分類と属性数量詞との対応に関する情
報を記述できるようにするとともに、個々の辞書項目の
辞書情報として数量数量詞と属性数量詞に関する情報を
記述できるようにしたので、辞書情報を効率よく詳細に
作成できる。
【0017】なお、上記実施例では、図4においてPr
olog項形式の辞書による例を示したが、辞書項目の
形式が上記と異なる場合でも、同様の動作が期待できる
。また、上記実施例では、図1において原言語が日本語
、目的言語が英語である場合について述べたが、本発明
はその他の言語間の翻訳にも利用できることは言うまで
もない。
【0018】
【発明の効果】以上のように本発明によれば、数量表現
を含む原文が入力されると、数量表現に関して構成要素
ごとの内部構造から部分的な構造を作成し、数量表現を
考慮しながら原文中の並列句や名詞修飾句などの部分的
な解析を行い、文の構成要素ごとの内部構造の間の関係
を解析し、訳文の内部構造及び目的言語の数量表現の内
部構造に変換し、その後、訳文の内部構造から目的言語
の文法規則を満たす構文を生成するとともに数量表現の
内部構造から目的言語の数量表現を生成するようにした
ので、原言語の文中における数量表現が複雑な形態や意
味を持っていても、例えば複数の数量表現が一つの名詞
句を修飾する場合や数量表現やその数量表現が修飾して
いる名詞句が複合構造である場合でも、原言語の文を正
確に解析し的確に変換し目的言語の文を生成できるとい
う効果が得られる。
【図面の簡単な説明】
【図1】この発明の一実施例に係る機械翻訳処理方式の
処理の流れを示すブロック図である。
【図2】この実施例において意味分類と数量数量詞とな
る助数詞との対応表を示す図である。
【図3】この実施例において意味分類と属性数量詞とな
る助数詞との対応表を示す図である。
【図4】この実施例において辞書項目中の数量詞情報を
示す図である。
【図5】この実施例の機械翻訳処理方式を採用した機械
翻訳処理装置の構成を示すブロック図である。
【図6】従来の機械翻訳処理方式における解析部の処理
の流れを示すブロック図である。
【図7】この従来例において助数詞と関数名詞との関係
を示す図である。
【図8】この従来例において事象名詞と関数名詞との関
係を示す図である。
【符号の説明】
3  形態素解析手段 4  原言語辞書 5  数量表現解析手段 6  構文解析前処理手段 7  構文解析手段 8  変換処理手段 9  変換辞書 10  数量表現変換手段 13  構文生成手段 14  数量表現生成手段

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  入力された原文を目的言語の訳文に翻
    訳して出力する機械翻訳処理装置において、原言語辞書
    を用いて入力原文を構成要素ごとの内部構造に置き換え
    る形態素解析手段と、上記入力原文中に数量表現が含ま
    れている場合に上記原言語辞書に記述された数量表現情
    報及び数量詞とその意味分類との対応表を用いて数量表
    現に関して構成要素ごとの内部構造から部分的な構造を
    作成する数量表現解析手段と、上記数量表現を考慮しな
    がら上記入力原文中の並列句や名詞修飾句などの部分的
    な解析を行う構文解析前処理手段と、上記入力原文の文
    の構成要素ごとの内部構造の間の関係を解析する構文解
    析手段と、上記解析された原文の内部構造に対して変換
    辞書を参照して訳文の内部構造に変換する変換処理手段
    と、この変換処理の副処理過程として上記原文の原言語
    の数量表現に対する上記部分的な解析による内部構造を
    目的言語の数量表現の内部構造に変換する数量表現変換
    手段と、上記訳文の内部構造から目的言語の文法規則を
    満たす構造の構文を生成する構文生成手段と、この構文
    生成の副処理過程として変換された数量表現に対する内
    部構造から目的言語の数量表現を生成する数量表現生成
    手段とを設け、数量表現を含む原文を目的言語の数量表
    現を含む訳文に翻訳することを特徴とする機械翻訳処理
    方式。
JP3039342A 1991-02-08 1991-02-08 機械翻訳処理方式 Pending JPH04257061A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3039342A JPH04257061A (ja) 1991-02-08 1991-02-08 機械翻訳処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3039342A JPH04257061A (ja) 1991-02-08 1991-02-08 機械翻訳処理方式

Publications (1)

Publication Number Publication Date
JPH04257061A true JPH04257061A (ja) 1992-09-11

Family

ID=12550414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3039342A Pending JPH04257061A (ja) 1991-02-08 1991-02-08 機械翻訳処理方式

Country Status (1)

Country Link
JP (1) JPH04257061A (ja)

Similar Documents

Publication Publication Date Title
US6470306B1 (en) Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
JP3220560B2 (ja) 機械翻訳装置
US20040254783A1 (en) Third language text generating algorithm by multi-lingual text inputting and device and program therefor
Sornlertlamvanich et al. Thai Part-of-Speech Tagged Corpus: ORCHID
JPH0344764A (ja) 機械翻訳装置
JPH02112068A (ja) テキスト簡略表示方式
Papageorgiou et al. Multi-level XML-based Corpus Annotation.
JP2001503540A (ja) アノテートされたテキストの自動翻訳
WO1997048058A9 (en) Automated translation of annotated text
JP2632806B2 (ja) 言語解析装置
JP2626722B2 (ja) 日本語生成装置
JPH04257061A (ja) 機械翻訳処理方式
JP2521435B2 (ja) 日本語生成装置
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2938897B2 (ja) 文書作成処理装置
JPH0561902A (ja) 機械翻訳システム
Chan et al. LFG-Based English-Filipino Translator
JP2901977B2 (ja) 翻訳装置
JP4023384B2 (ja) 自然言語翻訳方法及び装置及び自然言語翻訳プログラム
Kovrigina Computer morphology for investigations of a variable text
Singh et al. Hindi to English Transfer Based Machine Translation System
JP3313810B2 (ja) アスペクト処理装置
JP4092861B2 (ja) 自然言語パターン作成装置及び方法
JP2687334B2 (ja) 機械翻訳装置
JP2947554B2 (ja) 機械翻訳装置