JPH06325073A - 特殊共起処理方法およびその特殊共起処理方法を用いた装置 - Google Patents

特殊共起処理方法およびその特殊共起処理方法を用いた装置

Info

Publication number
JPH06325073A
JPH06325073A JP5113412A JP11341293A JPH06325073A JP H06325073 A JPH06325073 A JP H06325073A JP 5113412 A JP5113412 A JP 5113412A JP 11341293 A JP11341293 A JP 11341293A JP H06325073 A JPH06325073 A JP H06325073A
Authority
JP
Japan
Prior art keywords
word
occurrence
special
headword
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5113412A
Other languages
English (en)
Other versions
JP3015223B2 (ja
Inventor
Ichiko Sada
いち子 佐田
Youji Fukumochi
陽士 福持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP5113412A priority Critical patent/JP3015223B2/ja
Priority to US08/242,670 priority patent/US5608623A/en
Publication of JPH06325073A publication Critical patent/JPH06325073A/ja
Application granted granted Critical
Publication of JP3015223B2 publication Critical patent/JP3015223B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 共起関係の処理効果を十分に発揮して翻訳処
理を実施する。 【構成】 メモリ3の辞書11における依存関係にある
見出し語の領域に単独特殊共起コードあるいは集合特殊
共起コードを書き込む。翻訳モジュール2の訳語選択部
9は、辞書11を引いて、辞書引き形態素解析部6,構
文解析部7,木構造変換部8によって求めた格構造木の
ヘッドあるいは修飾語の〔見出し語:訳語〕ペアと同じ
単独特殊共起コードあるいは集合特殊共起コードを有す
る〔見出し語:訳語〕ペアを検索して共起訳語を決定す
る。翻訳文生成部10は、格構造木と訳語選択部9によ
って決定された共起訳語とに基づいて翻訳文を生成す
る。このように、依存関係に在る〔見出し語:訳語〕ペ
アと〔見出し語:訳語〕ペアとをコードで関連付けて見
出し語と訳語とをペアにして取り扱うことによって、共
起関係の処理効果を十分に発揮して翻訳処理を実施でき
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、第1言語において係
り受け関係にある2以上の単語が共起した際にこの単語
を第2言語による訳語に変換すると特殊な訳語になる特
殊共起、または上記第1言語において係り受け関係にあ
る2以上の単語が共起した際にこの単語を第2言語によ
る訳語に変換すると訳語間の共起が発生する特殊共起を
処理する特殊共起処理方法、および、その特殊共起処理
方法を用いた装置に関する。
【0002】
【従来の技術】従来より、見出し語,見出し語の品詞,形
態素情報,訳語,訳語の品詞および格要素情報等の各種情
報を格納する電子化辞書(以下、単に辞書と言う)や、上
記辞書やこれに類する情報記憶部を有して特定のキーワ
ードを入力するとそのキーワードに対応する情報を出力
する情報検索装置や、上記辞書やこれに類する情報記憶
部を有して第1言語を入力するとこの入力された第1言
語を第2言語に変換して出力する機械翻訳装置がある。
【0003】上述のような情報検索装置あるいは機械翻
訳装置においては、次のような問題が生ずることがあ
る。すなわち、上記情報検索装置におけるキーワードあ
るいは機械翻訳装置における第1言語等の単語(以下、
ソース単語と言う)を上記情報検索装置における情報あ
るいは機械翻訳装置における第2言語等の単語(以下、
ターゲット単語と言う)に変換する際に、単語間の共起
関係を考慮しないと、ソース単語が複数の対応するター
ゲット単語を有する場合には単に使用頻度の高いターゲ
ット単語が採択されることになり、その結果得られる情
報が意味を成さなかったり不自然になったりすることが
ある。
【0004】そこで、上述のような情報検索装置や機械
翻訳装置では、単語間の共起関係を処理するために、以
下のような共起処理を行うのが一般的である。 (1) 単語間の意味的な共起を扱うために、各単語の意
味概念を体系的に分類した“意味属性"を利用して、辞
書またはそれに類した他の情報記憶部に登録された特定
の〔ソース単語:ターゲット単語〕のペアと係り受けの
関係にある相手先の情報として“共起単語の意味属性"
を指定する。
【0005】(2) 特定単語と特定単語との共起関係を
扱うために、共起した単語列を“複合語見出し"として
辞書またはそれに類した他の情報記憶部に登録する。 (3) 特定単語と特定単語との共起関係を扱うために、
辞書またはそれに類した情報記憶部に登録された特定の
〔ソース単語:ターゲット単語〕のペアと係り受けの関
係にある相手先の情報として“共起単語の見出し"を指
定する。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の共起処理には次のような問題がある。 (イ) (1)の“意味属性"を利用する方法では、総ての
単語の意味概念を矛盾なく完全に分類できるような意味
概念体系を構築することは非常に難しいうえに、個々の
“意味属性"は人間が付与するものであるために構築者
によって意味概念の捕らえ方に揺れも生ずる。したがっ
て、この“意味属性"を用いた意味共起処理は、一般的
な意味的共起を大枠で処理する場合にはかなり有効であ
るが、特定単語に係る特殊な共起をその特定単語に係る
他の共起関係等に悪影響を及ぼすことなく扱うには不十
分である。
【0007】(ロ) (2)の“複合語見出し"を登録する
方法では、共起関係にある総てのソース単語の組み合わ
せを個別に“複合語見出し"として扱って訳語等の情報
を付与して登録することは作業者に多大な負担を強いる
ことになる。そして、上記情報のメンテナンスを困難に
し、更には計算資源を無駄に消費することにもなる。ま
た、共起関係にある単語を“複合語見出し"として扱う
と共起関係にある単語が固定されてしまい、共起する単
語間に修飾語句が割り込む場合には効果を発揮できな
い。あるいは、本来動詞句である“複合語見出し"であ
る場合には、態(VOICE)が変わると効果を発揮できな
い。
【0008】(ハ) (3)の係り受けの相手先情報として
“共起単語の見出し"を指定する方法の場合は、特定の
〔ソース単語:ターゲット単語〕のペアと係り受けの関
係にある相手先の情報として“共起単語の見出し"を指
定しただけでは、“共起単語のターゲット単語"までは
保証されない。したがって、共起関係の処理としては不
十分である。
【0009】そこで、この発明の目的は、より十分に共
起関係の処理効果を発揮できる特殊共起処理方法および
その特殊共起処理方法を用いた装置を提供することにあ
る。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に係る発明は、第1言語において係り受け
関係にある2以上の単語が共起した際にこの単語を第2
言語による訳語に変換すると特殊な訳語になる特殊共
起、または、上記第1言語において係り受け関係にある
2以上の単語が共起した際にこの単語を第2言語による
訳語に変換すると訳語間の共起が発生する特殊共起を処
理する特殊共起処理方法であって、上記第1言語による
見出し語とこの見出し語の上記第2言語による訳語とを
対応付け、係り受け関係における係り側の〔見出し語:
訳語〕ペアと受け側の〔見出し語:訳語〕ペアとが1対
1で特殊共起する際には,この係り側の〔見出し語:訳
語〕ペアと受け側の〔見出し語:訳語〕ペアとを単独特
殊共起コードで1対1に対応付け、上記係り受け関係に
ある係り側の見出し語または受け側の見出し語の何れか
一方が指定されると,この指定された見出し語に係る
〔見出し語:訳語〕ペアに上記単独特殊共起コードを介
して対応付けられている〔見出し語:訳語〕ペアを上記
単独特殊共起コードに基づいて求めることによって,当
該係り側の〔見出し語:訳語〕ペアと当該受け側の〔見
出し語:訳語〕ペアとの特殊共起関係を処理することを
特徴としている。
【0011】また、請求項2に係る発明は、第1言語に
おいて係り受け関係にある2以上の単語が共起した際に
この単語を第2言語による訳語に変換すると特殊な訳語
になる特殊共起、または、上記第1言語において係り受
け関係にある2以上の単語が共起した際にこの単語を第
2言語による訳語に変換すると訳語間の共起が発生する
特殊共起を処理する特殊共起処理方法であって、上記第
1言語による見出し語とこの見出し語の上記第2言語に
よる訳語とを対応付け、係り受け関係における係り側の
〔見出し語:訳語〕ペアと受け側の複数の〔見出し語:
訳語〕ペアとが1対多で特殊共起する際には,この係り
側の〔見出し語:訳語〕ペアと受け側の〔見出し語:訳
語〕ペアとを集合特殊共起コードで1対多に対応付け、
上記係り受け関係にある係り側の見出し語あるいは受け
側の見出し語の何れか一方が指定されると,この指定さ
れた見出し語に係る〔見出し語:訳語〕ペアに上記集合
特殊共起コードを介して対応付けられている〔見出し
語:訳語〕ペアを上記集合特殊共起コードに基づいて求
めることによって,当該係り側の〔見出し語:訳語〕ペ
アと当該受け側の〔見出し語:訳語〕ペアとの特殊共起
関係を処理することを特徴としている。
【0012】また、請求項3に係る発明は、第1言語に
おいて係り受け関係にある2以上の単語が共起した際に
この単語を第2言語による訳語に変換すると特殊な訳語
になる特殊共起、あるいは、上記第1言語において係り
受け関係にある2以上の単語が共起した際にこの単語を
第2言語による訳語に変換すると訳語間の共起が発生す
る特殊共起を処理する電子化辞書装置であって、上記第
1言語による見出し語とこの見出し語の上記第2言語に
よる訳語とが対応付けられて記憶された言語情報格納部
と、上記言語情報格納部における各〔見出し語:訳語〕
ペアが記憶されている領域内に設けられると共に,係り
受け関係における係り側の〔見出し語:訳語〕ペアと受
け側の〔見出し語:訳語〕ペアとが1対1で特殊共起す
るような〔見出し語:訳語〕ペアの場合には当該各〔見
出し語:訳語〕ペアが1対1の特殊共起関係にあること
を表す単独特殊共起コードが書き込まれる共起コードエ
リアと、上記係り受け関係にある係り側の見出し語また
は受け側の見出し語の何れか一方が入力されると,この
入力された見出し語に基づいて上記言語情報格納部を検
索して,上記入力された見出し語に係る〔見出し語:訳
語〕ペアに上記単独特殊共起コードを介して対応付けら
れている〔見出し語:訳語〕ペアを上記単独特殊共起コ
ードを用いて求める共起情報選出部を備えたことを特徴
としている。
【0013】また、請求項4に係る発明は、第1言語に
おいて係り受け関係にある2以上の単語が共起した際に
この単語を第2言語による訳語に変換すると特殊な訳語
になる特殊共起、あるいは、上記第1言語において係り
受け関係にある2以上の単語が共起した際にこの単語を
第2言語による訳語に変換すると訳語間の共起が発生す
る特殊共起を処理する電子化辞書装置であって、上記第
1言語による見出し語とこの見出し語の上記第2言語に
よる訳語とが対応付けられて記憶された言語情報格納部
と、上記言語情報格納部における各〔見出し語:訳語〕
ペアが記憶されている領域内に設けられると共に,係り
受け関係における係り側の〔見出し語:訳語〕ペアと受
け側の複数の〔見出し語:訳語〕ペアとが1対多で特殊
共起するような〔見出し語:訳語〕ペアの場合には当該
各〔見出し語:訳語〕ペアが1対多の特殊共起関係にあ
ることを表す集合特殊共起コードが書き込まれる共起コ
ードエリアと、上記係り受け関係にある係り側の見出し
語あるいは受け側の見出し語の何れか一方が入力される
と,この入力された見出し語に基づいて上記言語情報格
納部を検索して,上記入力された見出し語に係る〔見出
し語:訳語〕ペアに上記集合特殊共起コードを介して対
応付けられている〔見出し語:訳語〕ペアを上記集合特
殊共起コードを用いて求める共起情報選出部を備えたこ
とを特徴としている。
【0014】また、請求項5に係る発明は、第1言語に
おいて係り受け関係にある2以上の単語が共起した際に
この単語を第2言語による訳語に変換すると特殊な訳語
になる特殊共起、または、上記第1言語において係り受
け関係にある2以上の単語が共起した際にこの単語を第
2言語による訳語に変換すると訳語間の共起が発生する
特殊共起を処理する機械翻訳装置であって、上記第1言
語において係り受け関係にある係り側の〔見出し語:訳
語〕ペアと受け側の〔見出し語:訳語〕ペアとが単独特
殊共起コードで1対1に対応付けられて記憶された言語
情報格納部と、入力文中の係り受け関係における係り側
の見出し語または受け側の見出し語の何れか一方に基づ
いて上記言語情報格納部を検索して、当該見出し語に係
る〔見出し語:訳語〕ペアに対応付けられて特殊共起関
係にある〔見出し語:訳語〕ペアを上記単独特殊共起コ
ードを用いて求める共起情報選出部と、当該見出し語に
係る〔見出し語:訳語〕ペアと上記共起情報選出部によ
って求められた上記特殊共起関係にある〔見出し語:訳
語〕ペアとに基づいて,上記第1言語による係り受け関
係にある2以上の単語が共起した際における第2言語に
よる共起訳語を生成する翻訳文生成部を備えたことを特
徴としている。
【0015】また、請求項6に係る発明は、第1言語に
おいて係り受け関係にある2以上の単語が共起した際に
この単語を第2言語による訳語に変換すると特殊な訳語
になる特殊共起、または、上記第1言語において係り受
け関係にある2以上の単語が共起した際にこの単語を第
2言語による訳語に変換すると訳語間の共起が発生する
特殊共起を処理する機械翻訳装置であって、上記第1言
語において係り受け関係にある係り側の〔見出し語:訳
語〕ペアと受け側の複数の〔見出し語:訳語〕ペアとが
集合特殊共起コードで1対多に対応付けられて記憶され
た言語情報格納部と、入力文中の係り受け関係における
係り側の見出し語あるいは受け側の見出し語の何れか一
方に基づいて上記言語情報格納部を検索して、当該見出
し語に係る〔見出し語:訳語〕ペアに対応付けられて特
殊共起関係にある〔見出し語:訳語〕ペアを上記集合特
殊共起コードを用いて求める共起情報選出部と、当該見
出し語に係る〔見出し語:訳語〕ペアと上記共起情報選
出部によって求められた上記特殊共起関係にある〔見出
し語:訳語〕ペアとに基づいて,上記第1言語による係
り受け関係にある2以上の単語が共起した際における第
2言語による共起訳語を生成する翻訳文生成部を備えた
ことを特徴としている。
【0016】また、請求項7に係る発明は、第1言語に
おいて係り受け関係にある2以上の単語が共起した際に
この単語を第2言語による訳語に変換すると特殊な訳語
になる特殊共起、または、上記第1言語において係り受
け関係にある2以上の単語が共起した際にこの単語を第
2言語による訳語に変換すると訳語間の共起が発生する
特殊共起を処理する情報検索装置であって、上記第1言
語において係り受け関係にある係り側の〔見出し語:訳
語〕ペアと受け側の〔見出し語:訳語〕ペアとが単独特
殊共起コードで1対1に対応付けられて記憶された言語
情報格納部と、入力部から入力された上記第1言語によ
るキーワードに基づいて上記言語情報格納部を検索し
て、上記キーワードで表される見出し語に係る〔見出し
語:訳語〕ペアに対応付けられて特殊共起関係にある
〔見出し語:訳語〕ペアを上記単独特殊共起コードを用
いて求める共起情報選出部と、上記キーワードに係る
〔見出し語:訳語〕ペアと上記共起情報選出部によって
求められた上記特殊共起関係にある〔見出し語:訳語〕
ペアとに基づいて所定の手順で共起情報を生成する共起
情報生成部を備えたことを特徴としている。
【0017】また、請求項8に係る発明は、第1言語に
おいて係り受け関係にある2以上の単語が共起した際に
この単語を第2言語による訳語に変換すると特殊な訳語
になる特殊共起、または、上記第1言語において係り受
け関係にある2以上の単語が共起した際にこの単語を第
2言語による訳語に変換すると訳語間の共起が発生する
特殊共起を処理する情報検索装置であって、上記第1言
語において係り受け関係にある係り側の〔見出し語:訳
語〕ペアと受け側の複数の〔見出し語:訳語〕ペアが集
合特殊共起コードで1対多に対応付けられて記憶された
言語情報格納部と、入力部から入力された上記第1言語
によるキーワードに基づいて上記言語情報格納部を検索
して、上記キーワードで表される見出し語に係る〔見出
し語:訳語〕ペアに対応付けられて特殊共起関係にある
〔見出し語:訳語〕ペアを上記集合特殊共起コードを用
いて求める共起情報選出部と、上記キーワードに係る
〔見出し語:訳語〕ペアと上記共起情報選出部によって
求められた上記特殊共起関係にある〔見出し語:訳語〕
ペアとに基づいて所定の手順で共起情報を生成する共起
情報生成部を備えたことを特徴としている。
【0018】
【作用】請求項3に係る発明の電子化辞書装置では、第
1言語において係り受け関係にある係り側の見出し語あ
るいは受け側の見出し語の何れか一方が共起情報選出部
に入力されると、この入力された見出し語に基づいて言
語情報格納部が検索される。そして、上記入力された見
出し語に係る〔見出し語:訳語〕ペアが記憶されている
領域内の共起コードエリアに単独特殊共起コードが書き
込まれている場合には、当該〔見出し語:訳語〕ペアと
1対1の特殊共起関係にある〔見出し語:訳語〕ペアが
上記単独特殊共起コードを用いて求められる。こうし
て、係り受け関係にある係り側の見出し語または受け側
の見出し語の何れか一方に基づいて、何れか他方の情報
が容易に求められる。
【0019】また、請求項4に係る発明の電子化辞書装
置では、第1言語において係り受け関係にある係り側の
見出し語または受け側の見出し語の何れか一方が共起情
報選出部に入力されると、請求項3に係る発明の電子化
辞書装置と同様にして、当該〔見出し語:訳語〕ペアと
1対多の特殊共起関係にある〔見出し語:訳語〕ペアが
集合特殊共起コードに基づいて求められる。
【0020】また、請求項5に係る発明の機械翻訳装置
では、入力文中において係り受け関係にある係り側の見
出し語または受け側の見出し語の何れか一方に基づい
て、共起情報選出部によって、言語情報格納部が検索さ
れる。そして、当該見出し語に係る〔見出し語:訳語〕
ペアと1対1の上記特殊共起関係にある〔見出し語:訳
語〕ペアが単独特殊共起コードを用いて求められる。そ
うすると、当該見出し語に係る〔見出し語:訳語〕ペア
と上記共起情報選出部によって求められた上記特殊共起
関係にある〔見出し語:訳語〕ペアとに基づいて、翻訳
文生成部によって、上記第1言語による係り受け関係に
ある2以上の単語が共起した際における第2言語による
共起訳語が生成される。
【0021】こうして、意味属性を用いたり、複合語見
出しを登録することなく、上記第1言語による係り受け
関係にある単語が共起した際における翻訳処理が容易に
実施される。
【0022】また、請求項6に係る発明の機械翻訳装置
では、入力文中において係り受け関係にある係り側の見
出し語または受け側の見出し語の何れか一方に基づい
て、請求項5に係る発明の機械翻訳装置と同様にして、
共起情報選出部によって、当該〔見出し語:訳語〕ペア
と1対多の特殊共起関係にある〔見出し語:訳語〕ペア
が集合特殊共起コードを用いて求められる。
【0023】そして、当該見出し語に係る〔見出し語:
訳語〕ペアと上記共起情報選出部によって求められた上
記特殊共起関係にある〔見出し語:訳語〕ペアに基づい
て、翻訳文生成部によって、上記第1言語による係り受
け関係にある2以上の単語が共起した際における第2言
語による共起訳語が生成される。
【0024】また、請求項7に係る発明の情報検索装置
では、入力部から第1言語によるキーワードが共起情報
選出部に入力されると、この入力されたキーワードに基
づいて言語情報格納部が検索されて、上記キーワードで
表される見出し語に係る〔見出し語:訳語〕ペアと1対
1の上記特殊共起関係にある〔見出し語:訳語〕ペアが
単独特殊共起コードを用いて求められる。そして、上記
キーワードに係る〔見出し語:訳語〕ペアと上記共起情
報選出部によって求められた上記特殊共起関係にある
〔見出し語:訳語〕ペアとに基づいて、共起情報生成部
によって所定の手順で共起情報が生成される。
【0025】こうして、上記第1言語によるキーワード
に基づいて、係り受け関係にある係り側の〔見出し語:
訳語〕ペアと受け側の〔見出し語:訳語〕ペアとの共起
情報が容易に求められる。
【0026】また、請求項8に係る発明の情報検索装置
では、入力部から第1言語によるキーワードが共起情報
選出部に入力されると、請求項7に係る発明の情報検索
装置と同様にして、上記キーワードで表される見出し語
に係る〔見出し語:訳語〕ペアとこの〔見出し語:訳
語〕ペアに集合特殊共起コードを介して1対多に対応付
けられて上記特殊共起関係にある〔見出し語:訳語〕ペ
アとに基づく共起情報が生成される。
【0027】
【実施例】以下、この発明を図示の実施例により詳細に
説明する。 [第1実施例]本実施例では、この発明の特殊共起処理
方法を用いて翻訳処理を実施する機械翻訳装置の例につ
いて説明する。図1は本実施例の機械翻訳機におけるブ
ロック図である。
【0028】入力部1はキーボードやOCR(光学文字
読取装置)等からなり、翻訳の対象となるソース言語に
よる入力文等が入力される。翻訳モジュール2は、辞書
引き形態素解析部6,構文解析部7,木構造変換部8,訳
語選択部9,翻訳文生成部10を有して、入力部1から
入力された文に対して翻訳処理を実施する。メモリ3
は、辞書11,文法規則格納部12,木構造変換規則格納
部13,訳語選択規則格納部14を有すると共に、翻訳
処理を実施するに際して得られた情報を一旦格納する各
種バッファを有している。出力部4はCRT(カソード・
レイ・チューブ)やプリンタ等からなり、翻訳モジュール
2によって得られたターゲット言語による翻訳文等を出
力する。翻訳制御部5は、上記入力部1,翻訳モジュー
ル2,メモリ3および出力部4を制御して翻訳処理を実
施する。
【0029】上記メモリ3における文法規則格納部12
に格納される文法規則は、例えば、 のように表される規則であり、1番目の文法規則は「文
は主部と述部とからできている」ことを表している。
【0030】また、上記翻訳モジュール2で実施される
翻訳処理には一般に図2に示すようなレベルがある。図
中左側はソース言語の解析レベルであり、右側はターゲ
ット言語の生成レベルである。今、ソース言語による文
が入力されると、解析レベルL1での辞書引き,解析レベ
ルL2での形態素解析,解析レベルL3での構文解析…と
解析が進められる。
【0031】機械翻訳は、上記解析レベルによって大き
く次の2つに分けられる。その1つは、解析レベルL6
のソース言語またはターゲット言語の何れにも依存しな
い概念(中間言語と呼ぶ)まで解析し、そこから生成レベ
ルL7での文脈生成,生成レベルL8での意味生成,生成レ
ベルL9での構文生成,生成レベルL10での形態素生成と
生成を進めて、ターゲット言語による文を生成していく
ピボット方式である。もう一つは、上記解析レベルL2
での形態素解析,解析レベルL3での構文解析,解析レベ
ルL4での意味解析,解析レベルL5での文脈解析の何れ
かまで解析を行ってソース言語の内部構造を得る。次
に、この得られたソース言語の内部構造をそれと同じレ
ベルのターゲット言語の内部構造に変換した後、ターゲ
ット言語の文を生成するトランスファー方式である。本
実施例における翻訳モジュール2は、少なくとも解析レ
ベルL3の構文解析までの解析を行うものとする。
【0032】上記構成の機械翻訳機は、次のように動作
してソース言語による入力文をターゲット言語による翻
訳文に変換する。上記入力部1からソース言語による入
力文(以下、原文という)が入力されて翻訳処理開始の指
示が出されると翻訳処理がスタートする。そして、入力
された原文はメモリ3の原文バッファ15に図3に示す
ように格納される。
【0033】そして、上記翻訳制御部5の制御の下に、
翻訳モジュール2の辞書引き形態素解析部6によって、
メモリ3の辞書11の情報を用いて原文バッファ15に
格納された原文を各形態素(単語:以下、単に単語と言
う)に分割し、各単語の品詞や訳語等の情報が得られ
る。こうして得られた情報は辞書引きバッファ16に図
4に示すように格納される。
【0034】次に、上記翻訳モジュール2の構文解析部
7によって、メモリ3の辞書引きバッファ16に格納さ
れた情報と文法規則格納部12に格納された文法規則と
に基づいて、各単語間の係り受け関係を表す構造解析木
が決定されて、構文構造バッファ17に図5に示すよう
に格納される。続いて、木構造変換部8によって、メモ
リ3の木構造変換規則格納部13に格納された木構造変
換規則に基づいて、上記構文構造バッファ17に格納さ
れた原文の構文解析木の構造が格構造木に変換され、得
られた格構造木が変換木構造バッファ18に図6に示す
ように格納される。
【0035】次に、上記翻訳モジュール2の訳語選択部
9によって、後に詳述するように辞書11を検索して格
構造木の各要素の訳語が決定される(尚、図6には既に
格構造木に訳語が付加されている状態が示されてい
る)。そして、翻訳文生成部10によって上記格構造木
とその各要素の訳語とに基づいて翻訳文が生成され、メ
モリ3の出力文バッファ19に図7に示すように格納さ
れる。こうして生成された原文の翻訳文は出力部4によ
って出力される。
【0036】次に、上記メモリ3における辞書11の構
成および翻訳モジュール2における訳語選択部9の動作
について詳細に説明する。尚、この辞書11および訳語
選択部9で上記言語情報格納部および共起情報選出部を
構成する。図8〜図11は上記辞書11の構成の一例を
示す図である。辞書11には、各見出し語毎に訳語番
号,訳語,意味属性コード,表層格パターン番号,優先度,
格要素番号,格要素表層名,格要素前置詞語,格要素意味
条件,係り先番号,係り先表層名,係り先意味条件,その他
条件等が格納されている。図8(a)〜図11(l)には各見
出し語とその品詞と各項目の内容の例の一部が示されて
いる。
【0037】上記辞書11は、ソース言語において依存
関係にある2以上の単語が共起した際にこの依存関係に
ある単語をターゲット言語に変換すると特殊な訳語にな
る場合や、ソース言語において依存関係にある2以上の
単語をターゲット言語に変換すると各々の訳語間の共起
が発生する場合に、特定の〔単語:訳語〕ペアと特定の
〔単語:訳語〕ペアとの共起関係を処理できるような構
成を有している。そして、上記両〔単語:訳語〕ペアを
関係付けるための“単独特殊共起コード"または“集合
特殊共起コード"を設定して、ソース言語を上記依存関
係を保った状態で扱い得るようにしている。尚、ここで
言うところの依存関係とは、「ヘッド(head)とその格要
素」あるいは「修飾語(modifier)とその係り先のヘッド」
のようなものである。
【0038】上記単独特殊共起コードとは、共起処理を
目的とした特殊なコードであり、特定の〔単語:訳語〕
ペアと共起関係に在る特定の〔単語:訳語〕ペアとを1
つの意味コードで関連付けたものである。つまり、単独
特殊共起コードは特定の〔単語:訳語〕ペアのインデッ
クスに相当し、“係り受けの相手先を指定する側"と
“相手先として指定される側"との共起関係が1対1の
場合に使用する。厳密に言えば、特定の〔単語:訳語〕
ペアの共起相手として指定された特定の〔単語:訳語〕
ペアを別の特定の〔単語:訳語〕ペアの共起相手として
指定することも可能であるため、“係り受けの相手先を
指定する側"と“相手先として指定される側"との共起関
係は1対1あるいは多対1となる。しかしながら、本実
施例においては、“係り受けの相手先を指定する側"の
〔単語:訳語〕ペアを中心(“1")と考えて、上述のよ
うな多対1の共起関係であっても便宜上1対1の共起関
係と呼ぶことにする。
【0039】一方、上記集合特殊共起コードも共起処理
を目的とした特殊なコードであり、特定の〔単語:訳
語〕ペアと共起関係にある多数の〔単語:訳語〕ペアの
集合とを1つのコードで関連付けたものである。これ
は、特定の〔単語:訳語〕ペアの集合のインデックスに
相当し、“係り受けの相手先を指定する側"と“相手先
として指定される側"との共起関係が1対多の場合に使
用する。
【0040】尚、ここで言う“単語"とは辞書11にお
いて“見出し語"として取り扱っているもののことであ
り、その見出し語の構成要素は必ずしも1つの単語に限
定されるものではない。
【0041】また、上記辞書11は、以下のことを前提
として構成されている。 (a) ヘッドに当たる単語は、その単語の係り受けの相
手先として格要素を指定することができる。すなわち、
ヘッドに格要素を制御する権利がある。 (b) 修飾語の単語は、その単語の係り受けの相手先と
してヘッドを指定することができる。すなわち、修飾語
にヘッドを制御する権利がある。 (c) 意味コードは“意味属性コード"の欄に4桁の数
字で記述され、その種別は次のように先頭桁の数字によ
って表示する。 ・ 一般意味コード → 先頭桁が0〜7の数字 ・ 単独特殊共起コード → 先頭桁が8の数字 ・ 集合特殊共起コード → 先頭桁が9の数字
【0042】以下、具体例を上げて上記辞書11の構成
及び機能について詳細に説明する。 <意味コードが単独特殊共起コードである場合>今、ソ
ース言語における動詞「give」と名詞「attention」が共
起し、それをターゲット言語に変換すると「注意(attent
ion)を払う(give)」という共起訳語が得られるものとす
る。このような1対1の共起関係を処理するために、単
独特殊共起コードを設定するのである。
【0043】先ず、図8(b)に示すように、「見出し語:
attention」(名詞)の訳語番号“000"の「訳語:注
意」の列における訳語自身の意味属性を書き込む“意味
属性コード"の欄に、〔attention:注意〕ペア固有の単
独特殊共起コード“8000"を書き込む。次に、図8
(a)に示すように、「見出し語:give」(動詞)の訳語番号
“060"の「訳語:(〜を)払う」の列における“格要素
意味条件"の欄に、共起相手の〔attention:注意〕のペ
アを指定する単独特殊共起コード“8000"を書き込
む。尚、図8(a)における表層格パターン番号“01"
は、パターン“主語+動詞+名詞句+前置詞句"を表
す。また、図8(b)における表層格パターン番号“00"
は、パターン“名詞型なし(格を持たない)"を表す。
【0044】このように上記単独特殊共起コードを設定
することによって、〔attention:注意〕ペア固有の単
独特殊共起コード“8000”を介して、〔give:(〜
を)払う〕ペアと〔attention:注意〕ペアとの1対1の
共起関係を示すのである。
【0045】<意味コードが集合特殊共起コードである
場合(その1)>今、ソース言語による文の1つの動詞
「make」と複数個の名詞「adjustment」,「analysis」,「as
sumption」,「preparation」が共起し、それをターゲット
言語に変換すると以下に示すような訳語が得られるもの
とする。
【0046】(i) 能動態で、且つ、名詞が何れも修飾
語句を伴っていない場合「 調整(adjustment)する(make)」「 分析(analysis)する(make)」「 仮定(assumption)する(make)」「 準備(preparation)する(make)」 (ii) 能動態で、且つ、名詞が修飾語句を伴った場合「 調整(adjustment)をする(make)」「 分析(analysis)をする(make)」「 仮定(assumption)をする(make)」「 準備(preparation)をする(make)」 (iii) 受動態である場合「 調整(adjustment)が行われる(make)」「 分析(analysis)が行われる(make)」「 仮定(assumption)が行われる(make)」「 準備(preparation)が行われる(make)」 このような動詞「make」を中心とした1対多の共起関係を
処理するために、集合特殊共起コードを設定するのであ
る。
【0047】先ず、図9(d)に示すように、「見出し語:
adjustment」(名詞)の訳語番号“000"の「訳語:調
整」の列における訳語自身の意味属性を書き込む“意味
属性コード"の欄に、 〔make:(〜)する〕ペアと共起する複数の〔見出し
語:訳語〕ペアの集合を表す集合特殊共起コード“90
00"を書き込む。 〔make:(〜を)する〕ペアと共起する複数の〔見出
し語:訳語〕ペアの集合を表す集合特殊共起コード“9
001"を書き込む。 〔make:(〜が)行われる〕ペアと共起する複数の
〔見出し語:訳語〕ペアの集合を表す集合特殊共起コー
ド“9002"を書き込む。但し、この場合における上
記複数の〔見出し語:訳語〕ペアの集合とは、 〔adjustment:調整〕ペア,〔analysis:分析〕ペア 〔assumption:仮定〕ペア,〔preparation:準備〕ペ
ア から成る集合である。尚、図9(d)における表層格番号
“00"は、格パターン“名詞型なし(格を持たない)"を
表す。
【0048】同様に、図9(e)〜図10(g)に示すよう
に、「見出し語:analysis」(名詞)の訳語番号“000"
の「訳語:分析」の列、「見出し語:assumption」(名詞)
の訳語番号“000"の「訳語:仮定」の列、「見出し語:
preparation」(名詞)の訳語番号“000"の「訳語:準
備」の列の各々における“意味属性コード"の欄に、上述
のにおける集合特殊共起コード“9000"、にお
ける集合特殊共起コード“9001"、および、にお
ける集合特殊共起コード“9002"を書き込む。尚、
図9(e)における表層格パターン番号“00"はパターン
“名詞型なし(格を持たない)"を表す。また、図9(f)に
おける表層格パターン番号“00"はパターン“名詞型
なし(格を持たない)”を表し、表層格パターン番号“0
1"はパターン“名詞+THAT節"を表す。また、図10
(g)における表層格パターン番号“00"はパターン“名
詞型なし(格を持たない)”を表し、表層格パターン番号
“02"はパターン“名詞+前置詞句"を表す。
【0049】次に、図8(c)に示すように、「見出し語:
make」(動詞)の上記“格要素意味条件"の欄には、以下
のように集合特殊共起コードを書き込む。 訳語番号“015"の「訳語:(〜)する」の列では、
〔make:(〜)する〕ペアと共起する上記〔見出し語:訳
語〕ペアの集合を指定する集合特殊共起意味コード“9
000"を書き込む。 訳語番号“020"の「訳語:(〜を)する」の列で
は、〔make:(〜を)する〕ペアと共起する上記〔見出し
語:訳語〕ペアの集合を指定する集合特殊共起意味コー
ド“9001"を書き込む。 訳語番号“025"の「訳語:(〜が)行われる」の列
では、〔make:(〜が)行われる〕ペアと共起する上記
〔見出し語:訳語〕ペアの集合を指定する集合特殊共起
意味コード“9002"を書き込む。尚、図8(c)におけ
る表層格パターン番号“00"はパターン“主語+動詞
+名詞句"を表す。
【0050】上述のように集合特殊共起コードを設定す
ることによって、以下のような動詞「make」を中心とした
共起関係を示すことができるのである。 上記集合特殊共起コード“9000"を介しての〔m
ake:(〜)する〕ペアと〔adjustment:調整〕ペア,〔an
alysis:分析〕ペア,〔assumption:仮定〕ペア,〔pre
paration:準備〕ペアから成る集合との1対多の共起関
係 集合特殊共起コード“9001"を介しての〔mak
e:(〜を)する〕ペアと上記〔見出し語:訳語〕ペアの
集合との1対多の共起関係 集合特殊共起コード“9002"を介しての〔mak
e:(〜が)行われる〕ペアと上記〔見出し語:訳語〕ペ
アの集合との1対多の共起関係
【0051】<意味コードが集合特殊共起コードである
場合(その2)>今、ソース言語による1つの形容詞「h
igh」と複数の名詞「coupon」,「interest」,「speed」,「tens
ion」が共起し、それをターゲット言語に変換すると以下
に示すような共起訳語が得られるものとする。「 高(high)利回り(coupon)」「 高(high)金利(interest)」「 高(high)速(speed)」「 高(high)圧(tension):分野=電気」 このような形容詞「high」を中心とした1対多の共起関係
を処理するために、集合特殊共起コードを設定するので
ある。
【0052】先ず、図10(i)に示すように、「見出し
語:coupon」(名詞)の訳語番号“020"の「訳語:利回
り」の列における訳語自身の意味属性を書き込む“意味
属性コード"の欄に、〔high:高〕ペアと共起する複数
の〔見出し語:訳語〕ペアの集合を表す集合特殊共起コ
ード“9010"を書き込む。但し、この場合における
上記複数の〔見出し語:訳語〕ペアの集合とは、 〔coupon:利回り〕ペア,〔interest:金利〕ペア 〔speed:速〕ペア, 〔tension:圧〕ペア から成る集合である。
【0053】同様に、図11(j)〜図11(l)に示すよう
に、「見出し語:interest」(名詞)の訳語番号“010"
の「訳語:金利」の列、「見出し語:speed」(名詞)の訳語
番号“020"の「訳語:速」の列、「見出し語:tensio
n」(名詞)の訳語番号“030"の「訳語:圧」の列の各々
における“意味属性コード"の欄に、上記集合特殊共起
コード“9010"を書き込む。尚、図10(i)〜図11
(l)における表層格パターン番号“00"は、パターン
“名詞型なし(格を持たない)"を表す。
【0054】次に、図10(h)に示すように、上記「見出
し語:high」(形容詞)の訳語番号“040"の「訳語:
高」の列における“格要素意味条件"の欄には、〔high:
高〕ペアと共起する上記〔見出し語:訳語〕ペアの集合
を指定する集合特殊共起コード“9010"を書き込
む。尚、図10(h)における表層格パターン番号“00"
は、パターン“形容詞型なし(格を持たない)"を表す。
【0055】上述のように集合特殊共起コード“901
0"を設定することによって、集合特殊共起コード“9
010"を介して、〔high:高〕ペアと〔coupon:利回
り〕ペア,〔interest:金利〕ペア,〔speed:速〕ペア,
〔tension:圧〕ペアから成る集合との1対多の共起関
係を示すことができるのである。
【0056】次に、上記翻訳モジュール2の訳語選択部
9によって上記構成の辞書11から訳語を選出する動作
について説明する。図12は、上記翻訳制御部5の制御
の下に訳語選択部9によって実施される訳語選択処理動
作のフローチャートである。以下、図12および図1,
図8(a),図8(b)に従って、上記単独特殊共起コードを
用いて共起訳語を選択する場合を例に訳語選択処理動作
について説明する。
【0057】図1における入力部1から入力される原文
は、 原文1 「He gave attention to it.」 であるとする。ここで、上記原文1の翻訳処理が上記翻
訳モジュール2における木構造変換部8による変換処理
まで実施されて、原文1を起源とする格構造木が得られ
て変換木構造バッファ18に格納されているものとす
る。
【0058】ステップS1で、上記辞書11における原
文1のヘッド「gave」に係る見出し語の訳語の位置を優先
度をインデックスとして指示する訳語ポインタCntに
“0"がセットされる。その結果、上記辞書11の「見出
し語:give」において、優先度の欄に“00"が書き込ま
れている訳語番号“060"の「訳語:(〜を)払う」の
列が指示される。ステップS2で、当該訳語の列におけ
る“その他条件"の欄が参照されて、意味共起以外に特
に格要素に制約を与えるようなその他の条件に適合して
いるかがチェックされる。ステップS3で、上記ステッ
プS2におけるチェックの結果が“良"である(制約を与
える条件に当て嵌まらない)か否かが判定される。その
結果“良"であればステップS5に進み、否であればステ
ップS4に進む。ここで、上記「見出し語:give」の「訳
語:(〜を)払う」の列における“その他条件"の欄は空欄
(図示せず)であり、特に格要素に制約を与える条件はな
い。したがって、原文1の場合には“良"と判定されて
ステップS5に進む。
【0059】ステップS4で、上記訳語ポインタCntの
内容がインクリメントされる。こうして、次の優先度を
有する訳語の列が指示されてステップS2に戻る。ステ
ップS5で、当該訳語の列における上記“格要素意味条
件"の欄に書き込まれている単独特殊共起コードあるい
は集合特殊共起コードと係り側の「見出し語:attentio
n」における“意味属性コード"の欄に書き込まれている
単独特殊共起コードあるいは集合特殊共起コードとがヒ
ットするかがチェックされて、意味共起の有無がチェッ
クが実施される。ステップS6で、上記ステップS5にお
けるチェックの結果が“あり"であるか否かが判定され
る。その結果、“あり"であればステップS7に進む。一
方、否であればステップS4に進んで訳語ポインタCnt
の内容がインクリメントされ、次の優先度を有する訳語
の列が指示される。
【0060】ここで、上記「見出し語:give」の「訳語:
(〜を)払う」の列における“格要素意味条件"の欄に書き
込まれている単独特殊共起コード“8000"と、「見出
し語:attention」の「訳語:注意」の列における“意味属
性コード"の欄に書き込まれている単独特殊共起コード
“8000"とが一致する。したがって、原文1の翻訳
処理の場合には意味共起が“あり"と判定されてステッ
プS7に進む。
【0061】ステップS7で、係り受け関係における受
け側の〔give:(〜を)払う〕ペアと係り側の〔attentio
n:注意〕ペアとが同じ単独特殊共起コード“8000"
で対応付けられているので、上記「見出し語:give」(動
詞)の「訳語:(〜を)払う」と共起する「見出し語:atten
tion」の訳語として「訳語:注意」が確定される。こうし
て、「単語:give」と「単語:attention」とが1対1で共
起した際の共起訳語「注意を払う」が決定されて、訳語選
択処理動作を終了する。
【0062】上述のようにして、上記変換木構造バッフ
ァ18に格納されている上記原文を起源とする格構造木
の要素となっている全単語の訳語が得られると、翻訳モ
ジュール2の翻訳文生成部10によって原文の翻訳文 翻訳文1 「彼は、それに注意を払った。」 が生成されてメモリ3の出力文バッファ19に格納され
ると共に、出力部4から出力される。
【0063】次に、図12および図1,図8(c)〜図11
(l)に従って、上記集合特殊共起コードを用いて共起訳
語を選択する場合について説明する。
【0064】この場合における原文は、 原文2 「He made an adjustment.」 であるとする。また、上述と同様に原文2を起源とする
格構造木が得られて変換木構造バッファ18に格納され
ているものとする。
【0065】上記訳語ポインタCntに“0”がセットさ
れて、上記辞書11の「見出し語:make」において優先
度が“00"である訳語番号“015"の「訳語:(〜)す
る」の列が指示される。
…ステップS1 引き続いて、上記その他条件チェックが実施される。当
該「見出し語:make」の「訳語:(〜)する」の列における
“その他条件"の欄には“能動態の時のみ",“格要素修
飾不可"が書き込まれている。一方、原文2は能動態の
文であり、原文2において単語「made」の格要素である単
語「adjustment」には修飾語句は付いていない。したがっ
て、その他条件チェックの結果は“良"であると判定さ
れる。…ステップS2,ステップS3
【0066】次に、上記意味共起チェックが実施され
る。当該「見出し語:make」の「訳語:(〜)する」の列に
おける“格要素意味条件"の欄に書き込まれている集合
特殊共起コード“9000"と、「見出し語:adjustmen
t」の「訳語:調整」の列における“意味属性コード"の
欄に書き込まれている集合特殊共起コード“9000”
とが一致する。したがって、原文2の翻訳処理の場合に
は意味共起があり、当該「単語:make」(動詞)の「訳語:
(〜)する」と共起する「単語:adjustment」の「訳語:調
整」が確定される。…ステップS5〜ステップS7
【0067】そして、上記翻訳モジュール2の翻訳文生
成部10によって原文2の翻訳文 翻訳文2 「彼は、調整した。」 が生成されてメモリ3の出力文バッファ19に格納され
ると共に、出力部4から出力される。
【0068】また、同様の処理によって、集合特殊共起
コード“9000"を介して、当該〔make:(〜)する〕
ペアと共起する〔analysis:分析〕ペア,〔assumptio
n:仮定〕ペア,〔preparation:準備〕ペアの何れか1つ
が原文に応じて確定できる。したがって、次のように、
能動態であり、単語「made」の格要素である名詞が修飾語
句を伴っていないような原文3〜原文5が入力された場
合にも、上述のような共起関係に基づいて夫々に対応す
る翻訳文3〜翻訳文5が生成される。 原文3 「He made an analysis carefully.」 翻訳文3 「彼は、注意深く分析した。」 原文4 「He made an assumption.」 翻訳文4 「彼は、仮定した。」 原文5 「He made preparations quickly.」 翻訳文5 「彼は、急いで準備した。」
【0069】次に、図12および図1,図8(c)〜図11
(l)に従って、上記集合特殊共起コードを用いて共起訳
語を選択する場合の他の例について説明する。
【0070】この場合における原文は、 原文6 「He made an assumption that she ate it.」 であるとする。先ず、上記訳語ポインタCntに“0"が
セットされて、上記辞書11の「見出し語:make」におい
て優先度が“00"である訳語番号“015"の「訳語:
(〜)する」の列が指示される。
…ステップS1
【0071】引き続いて、上記その他条件チェックが実
施される。この場合には、原文6は能動態の文である
が、単語「made」の格要素である単語「assumption」にはTH
AT節なる修飾語句が付いている。したがって、その他条
件チェックの結果は“否"であると判定される。そし
て、訳語ポインタCntの内容がインクリメントされて
“01"がセットされる。こうして、当該「見出し語:ma
ke」において、優先度が“01"である訳語番号“02
0"の「訳語:(〜を)する」の列が指示される。…ステッ
プS2〜ステップS4
【0072】再度、上記その他条件チェックが実施され
る。当該「見出し語:make」の「訳語:(〜を)する」の列に
おける“その他条件"の欄には“能動態の時のみ"が書き
込まれている。一方、原文6は能動態の文である。した
がって、その他条件チェックの結果は“良"であると判
定される。…ステップS2,ステップS3
【0073】次に、上記意味共起チェックが実施され
る。当該「見出し語:make」の「訳語:(〜を)する」の列
における“格要素意味条件"の欄に書き込まれている集
合特殊共起コード“9001"と、「見出し語:assumpti
on」の「訳語:仮定」の列における“意味属性コード"の欄
に書き込まれている集合特殊共起コード“9001"と
が一致し、当該「単語:make」(動詞)の「訳語:(〜
を)する」と共起する「単語:assumption」の「訳語:仮
定」が確定される。…ステップS5〜ステップS7 そうした後、上記翻訳モジュール2の翻訳文生成部10
によって、原文6の翻訳文が次のように得られる。 翻訳文6 「彼は、彼女がそれを食べたという仮定をし
。」
【0074】また、同様の処理によって、集合特殊共起
コード“9001”を介して、当該〔make:(〜を)す
る〕ペアと共起する〔adjustment:調整〕ペア,〔analy
sis:分析〕ペア,〔preparation:準備〕ペアの何れか
1つが原文に応じて確定できる。したがって、次のよう
に、能動態であり、単語「made」の格要素である名詞が修
飾語句を伴っているような原文7〜原文9が入力された
場合にも、上述のような共起関係に基づいて夫々に対応
する翻訳文7〜翻訳文9が生成される。 原文7 「He made a few minor adjustments.」 翻訳文7 「彼は、2,3のマイナな調整をした。」 原文8 「He made a careful analysis.」 翻訳文8 「彼は、注意深い分析をした。」 原文9 「He made preparations for the party.」 翻訳文9 「彼は、パーティーの準備をした。」
【0075】次に、原文が受動態である場合には、上記
その他条件チェックによって上記訳語ポインタCntの内
容が“02"になるまでインクリメントされ、当該「見出
し語:make」において“その他条件"の欄に“受動態の時
のみ"が書き込まれている訳語番号“025"の「訳語:
(〜が)行われる」の列が指示される。そして、上記集合
特殊共起コード“9000",“9001"の場合と同様
の処理によって、上記集合特殊共起コード“9002”
を介して、当該〔make:(〜が)行われる〕ペアと1対多
で共起する〔adjustment:調整〕ペア,〔analysis:分
析〕ペア,〔assumption:仮定〕,〔preparation:準
備〕ペアの何れか1つが原文に応じて確定される。
【0076】したがって、次のように、受動態である原
文10〜原文13が入力された場合には、上述のような
共起関係に基づいて夫々に対応する翻訳文10〜翻訳文
13が生成される。 原文10 「A fine adjustment
shuld be made.」 翻訳文10 「精密な調整が行われるべきである。」 原文11 「A careful analysis was made.」 翻訳文11 「注意深い分析が行われた。」 原文12 「A false assumption was made.」 翻訳文12 「間違った仮定が行われた。」 原文13 「Final preparations were made.」 翻訳文13 「最終的な準備が行われた。」
【0077】次に、形容詞を中心とした共起関係の場合
について説明する。原文が、 原文14 「high coupon」 であるとする。そうすると、上記辞書11における原文
14の修飾語「high」に係る見出し語の訳語の位置を指示
する訳語ポインタCntに“0"がセットされて、上記辞
書11の「見出し語:high」において優先度が“00"で
ある訳語番号“040"の「訳語:高」の列が指示され
る。そして、上述の「見出し語:make」の場合と同様の処
理によって、集合特殊共起コード“9010"を介して
当該〔high:高〕ペアと共起する「単語:coupon」の「訳
語:利回り」が原文14に即して則して確定される。し
たがって、上述のような原文14の翻訳文14が生成さ
れる。 翻訳文14 「高利回り
【0078】同様に、「単語(形容詞):high」を含む原文
15〜原文17が入力された場合には、上述のような共
起関係に基づいて夫々に対応する翻訳文15〜翻訳文1
7が生成される。 原文15 「high interest」 翻訳文15 「高金利」 原文16 「high speed」 翻訳文16 「高速」 原文17 「high tension」 翻訳文17 「高圧
【0079】上述のように、本実施例においては、機械
翻訳装置の上記メモリ3の辞書11における特定の〔見
出し語:訳語〕ペアの領域とこの〔見出し語:訳語〕ペ
アと依存関係にある相手の〔見出し語:訳語〕ペアの領
域に、両〔見出し語:訳語〕ペアが1対1の共起関係に
あることを表す単独特殊共起コードを書き込む。さら
に、依存関係にある相手の〔見出し語:訳語〕ペアが複
数ある場合には、各〔見出し語:訳語〕ペアの領域に1
対多の共起関係にあることを表す集合特殊共起コードを
書き込む。
【0080】そして、上記翻訳モジュール2には訳語選
択部9を設けて、特定の〔見出し語:訳語〕ペアとこの
特定ペアと依存関係にある相手の〔見出し語:訳語〕ペ
アとが共起した際には、上記辞書11における上記特定
の〔見出し語:訳語〕ペアの領域に書き込まれた単独特
殊共起コードあるいは集合特殊共起コードをインデック
スとして、上記依存関係にある相手の〔見出し語:訳
語〕ペアを検索して共起訳語を得るようにしている。
【0081】したがって、本実施例によれば、以下のよ
うな種々の効果を奏することができる。すなわち、本実
施例における辞書11では、上述のように、係り受け関
係における係り側と受け側とが共起する場合に、その係
り側の〔単語:訳語〕ペアと受け側の〔単語:訳語〕ペ
アを1つの単独特殊共起コードあるいは集合特殊共起コ
ードと言う簡便なコードで関連付けることによって、依
存関係にある単語の組の共起関係を示している。したが
って、従来のように“複合見出し"を登録するのとは異
なり、単独特殊共起コードあるいは集合特殊共起コード
の付加/削除によって共起情報の構築やそのメンテナン
スを容易に実施できる。その結果、上記構築やメンテナ
ンスに要する計算資源の節約を図ることができるのであ
る。
【0082】また、“意味属性"は意味概念の分類結果
に付与されるのに対して、上記単独特殊共起コードある
いは集合特殊共起コードは特定の〔単語:訳語〕ペア間
の共起関係に付与されるので見通しが良くて使い易い。
つまり、一般の“意味属性"のようにが複数個の〔単
語:訳語〕ペアを括る意味概念を表すために1つの“意
味属性"を付与した場合には、意味概念そのものが抽象
的なものであるために、1つの“意味属性"によって表
される総ての〔単語:訳語〕ペアの集合の内容を把握す
るのは困難である。したがって、“意味属性"をある
〔単語:訳語〕ペア間の意味条件記述として使用する際
には、他の共起関係に及ぼす悪影響の想定がしにくい。
これに対して、本実施例においては、上記単独特殊共起
コードや集合特殊共起コードは特定の〔単語:訳語〕ペ
ア間の共起関係のみを表すので、他の共起関係に悪影響
を及ぼすことがなく、細密な共起処理を可能にする。
【0083】さらに、上記辞書11では、共起関係にあ
る単語を“複合見出し"のような固定された状態で登録
してはいない。したがって、本実施例によれば、共起関
係にある単語間に修飾語句が割り込んだ場合でも、共起
関係を認識して正しく翻訳できる。さらに、単語が共起
してできた句の“態"が変化したり語順が入れ代わった
りした場合でも、共起関係を認識して正しく翻訳でき
る。又、上述のように、共起関係にある相手先単語の
“見出し語"のみならず〔見出し語:訳語〕ペアを単独
特殊共起コードあるいは集合特殊共起コードによって指
定するので、係り受け関係にある単語の訳語を保証で
き、完全な共起訳語を生成して正しい翻訳文を得ること
ができる。
【0084】[第2実施例]本実施例では、この発明の
特殊共起処理方法を用いた情報検索装置の例について説
明する。図13は本実施例の情報検索装置のブロック図
である。尚、この情報検索装置は、入力されたキーワー
ドを理解してこのキーワードに係る共起情報を検索/出
力するものである。
【0085】入力部31はキーボード等からなりキーワ
ード等が入力される。この入力部31から入力されたキ
ーワードはメモリ38のキーワードバッファ40に格納
される。第1共起テーブル検索部32は第1共起テーブ
ル33を内蔵し、上記キーワードに基づいて第1実施例
で述べた単独特殊共起コードまたは集合特殊共起コード
を検索する。そして、得られた単独特殊共起コードまた
は集合特殊共起コードをメモリ38の第1共起テーブル
検索結果バッファ41に格納する。第2共起テーブル検
索部34は第2共起テーブル35を内蔵し、第1共起テ
ーブル検索結果バッファ41に格納された単独特殊共起
コードまたは集合特殊共起コードに基づいて、上記キー
ワードと依存関係にある共起相手の単語を検索する。そ
して、得られた共起単語を上記メモリ38の第2共起テ
ーブル検索結果バッファ42に格納する。
【0086】辞書引き部36は、上記メモリ38のキー
ワードバッファ40,第1共起テーブルバッファ41,第
2共起テーブルバッファ42に格納された内容に基づい
て辞書39を引く。そして、上記キーワードと共起相手
の単語との共起訳語を得て辞書引きバッファ43に格納
する。共起情報生成部37は、辞書引きバッファ43の
内容に基づいて、キーワードと共起相手の単語とに係る
情報である共起情報を生成して共起情報バッファ44に
格納する。
【0087】出力部45はCRTやプリンタ等からな
り、共起情報生成部37によって生成された共起情報を
出力する。検索制御部46は、上記入力部31,第1共
起テーブル検索部32,第2共起テーブル検索部34,辞
書引き部36,共起情報生成部37,メモリ38および出
力部45を制御して共起情報の検索処理を実施する。
【0088】ここで、上記メモリ38における辞書39
は、第1実施例における機械翻訳装置における辞書11
と全く同じ構成を有している。また、上記第1共起テー
ブル33の構成は次のようになっている。
【0089】図14は上記第1共起テーブル33の構成
を示す図である。第1フィールドf11には、上記辞書3
9から抽出された見出し語が登録されている。また、第
2フィールドf12には、第1フィールドf11に登録された
見出し語と上記依存関係にある単語との間を関連付ける
上記単独特殊共起コード及び集合特殊共起コードが登録
されている。この単独特殊共起コードあるいは集合特殊
共起コードは、辞書39の“格要素意味条件"の欄,“係
り先意味条件"の欄あるいは“意味属性コード"の欄から
抽出される。また、第3フィールドf13には、第1フィ
ールドf11に登録された見出し語の品詞が登録されてい
る。この品詞は辞書39の見出し語に付加されている品
詞から抽出される。尚、品詞AJは形容詞であり、品詞
NNは名詞であり、品詞VBは動詞である。
【0090】また、上記第3フィールドf13に登録され
た品詞に付加されている“*"印は、その見出し語は上
記依存関係において制御権を持つ側であることを表す。
つまり、上記単独特殊共起コードまたは集合特殊共起コ
ードが辞書39の“格要素意味条件"の欄あるいは“係
り先意味条件"の欄から抽出された場合には、当該単独
特殊共起コードあるいは集合特殊共起コードに係る見出
し語は上記依存関係において制御権を持つ側である。一
方、“意味属性コード"の欄から抽出された場合には、
当該見出し語は上記依存関係において制御を受ける側で
ある。
【0091】図15は上記第2共起テーブル35の構成
を示す図である。第1フィールドf21には、上記辞書3
9の“格要素意味条件"の欄,“係り先意味条件"の欄あ
るいは“意味属性コード"の欄から抽出された上記単独
特殊共起コードおよび集合特殊共起コードが登録されて
いる。また、第2フィールドf22には、辞書39から抽
出された上記依存関係において制御権を持つ側の見出し
語が登録されている。また、第3フィールドf23には、
辞書39から抽出された上記依存関係において制御を受
ける側の見出し語が登録されている。すなわち、上記第
1共起テーブル検索部32,第1共起テーブル33,第2
共起テーブル検索部34,第2共起テーブル35,辞書3
9および辞書引き部36によって、上記言語情報格納部
および共起情報選出部を構成するのである。
【0092】上記構成の情報検索装置は、次のように動
作してキーワードの共起情報を検索/出力する。図16
は、上記検索制御部46によって実行される共起情報検
索処理動作のフローチャートである。以下、図16およ
び図13〜図15,図8(a)〜図11(l)に従って、共起
情報検索処理動作を実例を上げて説明する。
【0093】図13における入力部31からキーワード キーワード1 「attention」 が入力されて検索開始が指令される。そうすると、キー
ワード「attention」がキーワードバッファ40に格納さ
れる。ステップS11で、第1共起テーブル検索部32に
よって第1共起テーブル33の第1フィールドf11が検
索される。ステップS12で、上記ステップS11による検
索の結果キーワード「attention」にマッチした見出し語
が在るか否かが判別される。その結果在ればステップS
13に進み、なければ検索結果無しの状態で共起情報検索
処理動作を終了する。
【0094】ステップS13で、キーワード「attention」
にマッチした上記第1共起テーブル33の見出し語「att
ention」の列における第2フィールドf12から単独特殊共
起コード“8000"が抽出され、第3フィールドf13か
ら品詞“NN=名詞(上記依存関係における制御を受け
る側)"が抽出される。こうして抽出された第1共起テー
ブル情報は、第1共起テーブル検索結果バッファ41に
格納される。ステップS14で、上記第2共起テーブル検
索部34によって、第1共起テーブル検索結果バッファ
41に格納された単独特殊共起コード“8000"に基
づいて、第2共起テーブル35の第1フィールドf21が
検索される。そして、マッチした単独特殊共起コード
“8000"の列における第3フィールドf23が検索され
て、キーワード「attention」にマッチした見出し語「atte
ntion」が得られる。そして、その見出し語「attention」
の列における第2フィールドf22から共起相手の単語「gi
ve」が求められて、第2共起テーブル検索結果バッファ
42に格納される。
【0095】ここで、上記共起相手の単語を求める際
に、先ず第3フィールドf23を検索するのは次の理由に
よる。すなわち、上記ステップS13において第1共起テ
ーブル情報として抽出された品詞“NN"には“*”印
が付加されてはいないので、キーワード「attention」は
上記依存関係におけて制御を受ける側である。したがっ
て、上記依存関係において制御を受ける側の見出し語が
登録されている第3フィールドf23を検索して、単独特
殊共起コード“8000"を有する見出し語の中から見
出し語「attention」を求めるのである。但し、この場合
には、上記依存関係において制御権を持つ側と制御を受
ける側とが上記単独特殊共起コードによって1対1に対
応しているので、共起相手の単語「give」は単独特殊共起
コード“8000"から一義的に決まってしまう。
【0096】ステップS15で、上記辞書引き部36によ
って、キーワードバッファ40に格納されたキーワード
「attention」,第1共起テーブル検索結果バッファ41に
格納された単独特殊共起コード“8000"と品詞“名
詞",第2共起テーブル検索結果バッファ42に格納され
た共起相手の単語「give」に基づいて、辞書39を引いて
上記依存関係にある単語の訳語(共起訳語)が求められ
る。そして、この求められた共起訳語は辞書引きバッフ
ァ43に格納される。ステップS16で、上記共起情報生
成部37によって、上記辞書引きバッファ43に格納さ
れている共起訳語,キーワードバッファ40に格納され
ているキーワード「attention」,第2共起テーブル検索結
果バッファ42に格納されている共起相手の単語「give」
に基づいて、次のような共起情報1を生成する。 共起情報1 give <attention> to 〜 (〜に)<注
意>を払う
【0097】この生成された共起情報は、共起情報バッ
ファ44に格納されると共に、出力部45によって出力
される。こうして、キーワード「attention」を入力す
ると、上記単独特殊共起コード“8000"を介して、
〔give:(〜を)払う〕ペアと〔attention:注意〕ペア
との1対1の共起情報が検索されるのである。
【0098】次に、キーワードとして「give」を用いる場
合を例に、この情報検索装置の動作を説明する。図9に
おける入力部31からキーワード キーワード2 「give」 が入力されると第1共起テーブル33が検索されて、キ
ーワード「give」にマッチした見出し語が求められる。そ
して、キーワード「give」にマッチした見出し語「give」
の列における第2フィールドf12から単独特殊共起コー
ド“8000"が抽出され、第3フィールドf13から品詞
“VB*=動詞(上記依存関係における制御権を持つ
側)"が抽出される。…ステップS11〜ステップS13
【0099】上記単独特殊共起コード“8000"に基
づいて第2共起テーブル35の第1フィールドf21が検
索され、マッチした単独特殊共起コード“8000"の
列における第2フィールドf22が検索され、更に、マッ
チした見出し語「give」の列における第3フィールドf23
から共起相手の単語「attention」が求められる。…ステ
ップS14 さらに、上記求められたキーワード「give」,単独特殊共
起コード“8000",品詞“名詞"および共起相手の単
語「attention」に基づいて辞書39を引き、上記依存関
係にある単語の訳語(共起訳語)が求められる。そして、
共起情報生成部37によって、次のような共起情報2が
生成される。 共起情報2 give <attention> to 〜 (〜に)<注
意>を払う…ステップS15,ステップS16
【0100】こうして、上記単独特殊共起コード“80
00”を介して、〔give:(〜を)払う〕ペアと〔attent
ion:注意〕ペアとの1対1の共起情報が検索される。
つまり、上記依存関係にある単語間が単独特殊共起コー
ドで1対1に関連付けられている場合には、上記依存関
係にある単語のうち制御権を持つ側の単語をキーワード
としても制御を受ける側の単語をキーワードとしても、
同じ共起情報が得られるのである。
【0101】次に、上記集合特殊共起コードを利用して
共起情報を検索する例について説明する。上記入力部3
1からキーワード キーワード3 「high」 が入力されると第1共起テーブル33が検索されて、キ
ーワード「high」にマッチした見出し語が求められる。そ
して、キーワード「high」にマッチした見出し語「high」
の列における第2フィールドf12から集合特殊共起コー
ド“9010"が抽出され、第3フィールドf13から品詞
“VB*=形容詞(上記依存関係における制御権を持つ
側)"が抽出される。
【0102】上記集合特殊共起コード“9010"に基
づいて第2共起テーブル35の第1フィールドf21が検
索され、マッチした単独特殊共起コード“9010"の
列における第2フィールドf22が検索される。そして、
キーワード「high」にマッチした見出し語を求める。次
に、求められた見出し語「high」の列における第3フィー
ルドf23から共起相手の単語「coupon」,「interest」,「spe
ed」,「tension」が求められる。さらに、上記求められた
キーワード「high」,単独特殊共起コード“9010",品
詞“形容詞"及び共起相手の単語「coupon」,「interest」,
「speed」,「tension」に基づいて辞書39を引き、上記依
存関係にある単語の訳語(共起訳語)が求められる。
【0103】そして、上記共起情報生成部37によっ
て、次のような共起情報3が生成される。 共起情報3 high <coupon> 高利回り high <interest> 高金利 high <speed> 高速 high <tension> 高圧(分野=電気)
【0104】こうして、キーワード「high」を入力する
と、上記集合特殊共起コード“9010"を介して、〔h
igh:高〕ペアと〔coupon:利回り〕ペア,〔interest:
金利〕ペア,〔speed:速〕ペア,〔tension:圧〕ペアの
集合との1対多の共起情報が検索されるのである。
【0105】同様にして、キーワード「coupon」を入力す
ると、上記集合特殊共起コード“9010"を介して、
〔high:高〕ペアと〔coupon:利回り〕ペアとの共起情
報 high <coupon> 高利回り が得られるのである。
【0106】上述のように、本実施例においては、情報
検索装置における上記メモリ38の辞書39を第1実施
例における辞書11と同様に構成する。さらに、上記辞
書39から抽出された見出し語と単独特殊共起コードあ
るいは集合特殊共起コードと品詞とを関連付けた第1共
起テーブル33、および、辞書39から抽出された単独
特殊共起コードあるいは集合特殊共起コードとこの両特
殊共起コードを介して上記依存関係にある単語とを関連
付けた第2共起テーブル35を設ける。
【0107】そして、上記入力部31からキーワードを
入力すると、第1共起テーブル検索部32によって第1
共起テーブル33を検索してキーワードの単独特殊共起
コードまたは集合特殊共起コードと品詞とを得、第2共
起テーブル検索部34によって第2共起テーブル35を
検索してキーワードの共起相手の単語を得、辞書引き部
36によって辞書39を引いて上記共起訳語を得る。そ
して、これらの情報に基づいて共起情報生成部37によ
ってキーワードと共起相手の単語との共起情報を生成し
て出力するようにしている。
【0108】したがって、本実施例によれば、以下のよ
うな種々の効果を奏することができる。すなわち、本実
施例における辞書39においても、第1実施例の辞書1
1と同様に、係り側の〔単語:訳語〕ペアと受け側の
〔単語:訳語〕ペアを1つの単独特殊共起コードあるい
は集合特殊共起コードで関連付けることによって、依存
関係にある単語の組の共起関係を示している。したがっ
て、本実施例における辞書39でも第1実施例における
辞書11と同じ効果が得られる。
【0109】さらに、上記辞書39では、係り側の〔見
出し語:訳語〕ペアと受け側の〔見出し語:訳語〕ペア
を「複合見出し」のように固定された状態で登録しては
いない。したがって、本実施例によれば、完全な形の共
起熟語が分からなくとも、その共起熟語の一部を構成す
るキーワードを入力するだけで、共起熟語の共起情報を
検索/出力できる。また、共起関係にある特定の〔単
語:訳語〕ペア間を単独特殊共起コードあるいは集合特
殊共起コードによって指定するので、係り受け関係にあ
る単語の訳語を保証でき、完全な共起情報の検索/出力
が可能となる。
【0110】上記第2実施例における第1共起テーブル
33および第2共起テーブル35は必ずしも必要とはし
ない。しかしながら、辞書39から検索に必要な項目を
抽出してテーブル化することによって検索処理を高速に
実施可能となる。上記各実施例における訳語選択処理動
作および共起情報検索処理動作のアルゴリズムは図12
および図16のフローチャートに限定されるものではな
い。また、上記辞書11および辞書39の具体的な内容
は図8〜図11に示すような内容に限定されないことは
言うまでもない。
【0111】
【発明の効果】以上より明らかなように、請求項1およ
び請求項2に係るの発明の特殊共起処理方法は、1対1
あるいは1対多で特殊共起する係り側の〔見出し語:訳
語〕ペアと受け側の〔見出し語:訳語〕ペアとを単独特
殊共起コードで1対1に又は集合特殊共起コードで1対
多に対応付け、指定された見出し語に係る〔見出し語:
訳語〕ペアに対応付けられている〔見出し語:訳語〕ペ
アを上記単独特殊共起コードまたは集合特殊共起コード
に基づいて求めることによって共起関係を処理するよう
にしたので、簡便な上記単独特殊共起コードあるいは集
合特殊共起コードによって特定の〔見出し語:訳語〕ペ
ア間の特殊共起関係を表すことができる。
【0112】したがって、この発明によれば、他の共起
関係に悪影響を及ぼすことなく共起処理を実施できる。
さらに、特殊共起関係にある単語間に修飾語句が割り込
んだり、共起してできた句の“態"が変換したりして
も、共起関係を処理できる。すなわち、より十分に共起
関係の処理効果を発揮できるのである。
【0113】また、請求項3および請求項4に係る発明
の電子化辞書装置は、言語情報格納部に記憶されている
各〔見出し語:訳語〕ペアの領域内に設けられた共起コ
ードエリアに、係り側の〔見出し語:訳語〕ペアと受け
側の〔見出し語:訳語〕ペアとが特殊共起するような
〔見出し語:訳語〕ペアの場合には単独特殊共起コード
または集合特殊共起コードを書き込み、共起情報選出部
によって、入力された見出し語に係る〔見出し語:訳
語〕ペアに対応付けられている〔見出し語:訳語〕ペア
を上記単独特殊共起コードまたは集合特殊共起コードを
用いて求めるので、簡便な単独特殊共起コードまたは集
合特殊共起コードを用いて特定の〔見出し語:訳語〕ペ
ア間の共起情報を構築できる。
【0114】したがって、この発明によれば、従来の
“複合見出し"を用いた場合とは異なり、容易に共起情
報を構築できる。その結果、共起情報のメンテナンスも
容易となり、共起情報の構築やメンテナンスに要する計
算資源の節約が可能となる。さらに、上記単独特殊共起
コードや集合特殊共起コードは特定の〔見出し語:訳
語〕ペア間の共起関係のみを表すので、他の共起関係に
悪影響を及ぼすことなく相手先の〔見出し語:訳語〕ペ
アを得ることができる。また、特殊共起関係にある単語
間に修飾語句が割り込んだり、共起してできた句の
“態"が変換したりしても、共起関係を処理できる。す
なわち、この発明によれば、より十分に共起関係の処理
効果を発揮できるのである。
【0115】また、請求項5および請求項6に係る発明
の機械翻訳装置は、入力された見出し語に基づいて共起
情報選出部によって言語情報格納部を検索し、入力文中
の見出し語に係る〔見出し語:訳語〕ペアに対応付けら
れて特殊共起関係にある〔見出し語:訳語〕ペアを単独
特殊共起コードまたは集合特殊共起コードを用いて求
め、当該入力文中の見出し語に係る〔見出し語:訳語〕
ペアと上記共起情報選出部によって求められた共起関係
にある〔見出し語:訳語〕ペアとに基づいて、翻訳文生
成部によって共起訳語を生成するので、簡便な単独特殊
共起コードあるいは集合特殊共起コードを用いて共起関
係にある単語間の共起訳語を生成できる。
【0116】したがって、この発明によれば、特定の
〔見出し語:訳語〕ペア間の共起関係のみを表す上記単
独特殊共起コードあるいは集合特殊共起コードを用いる
ことによって、他の共起関係に悪影響を及ぼすことなく
共起関係を認識して共起訳語を生成できる。さらに、共
起関係にある単語間に修飾語句が割り込んだり、共起し
てできた句の“態"が変化したりしても、正しく共起関
係を認識して共起訳語を生成できる。さらに、特殊共起
関係にある特定の〔単語:訳語〕ペア間を単独特殊共起
コードあるいは集合特殊共起コードによって指定するの
で、係り受け関係にある単語の訳語を保証でき、完全な
共起情報の検索/出力が可能となる。つまり、この発明
によれば、より十分に共起関係の処理効果を発揮して正
しく翻訳文を生成できるのである。
【0117】また、請求項7および請求項8に係る情報
検索装置は、入力されたキーワードに基づいて共起情報
選出部によって言語情報格納部を検索し、上記キーワー
ドで表される見出し語に係る〔見出し語:訳語〕ペアに
対応付けられて特殊共起関係にある〔見出し語:訳語〕
ペアを単独特殊共起コードまたは集合特殊共起コードを
用いて求め、上記キーワードに係る〔見出し語:訳語〕
ペアと上記共起情報選出部によって求められた共起関係
にある〔見出し語:訳語〕ペアとに基づいて、共起情報
生成部によって所定の手順で共起情報を生成するので、
簡便な単独特殊共起コードあるいは集合特殊共起コード
を用いてキーワードの〔単語:訳語〕ペアと共起相手の
〔単語:訳語〕ペアとの共起情報を生成できる。
【0118】したがって、この発明によれば、係り側の
〔単語:訳語〕ペアと受け側の〔単語:訳語〕ペアとを
“複合見出し"のように固定された状態で登録する必要
がなく、完全な形の共起熟語が分からなくとも、その共
起熟語の一部を構成するキーワードを入力するだけで共
起熟語の共起情報を検索/出力できる。さらに、特殊共
起関係にある特定の〔単語:訳語〕ペア間を単独特殊共
起コードあるいは集合特殊共起コードによって指定する
ので、係り受け関係にある単語の訳語を保証でき、完全
な共起情報の検索/出力が可能となる。つまり、この発
明によれば、より十分に共起関係の処理効果を発揮して
完全な共起情報を検索できるのである。
【図面の簡単な説明】
【図1】この発明の機械翻訳装置におけるブロック図で
ある。
【図2】翻訳レベルの説明図である。
【図3】図1における原文バッファに原文が格納された
ようすを示す図である。
【図4】図1における辞書引きバッファに形態素情報の
一部が格納されたようすを示す図である。
【図5】図1における構文構造バッファに格納されてい
る構文解析木の一例を示す図である。
【図6】図1における変換木構造バッファに格納されて
いる格構造木の一例を示す図である。
【図7】図1における出力文バッファに格納された翻訳
文の一例を示す図である。
【図8】図1における辞書の構成例を示す図である。
【図9】図8に続く辞書の構成例を示す図である。
【図10】図9に続く辞書の構成例を示す図である。
【図11】図10に続く辞書の構成例を示す図である。
【図12】図1における訳語選択部による訳語選択処理
動作のフローチャートを示す図である。
【図13】この発明の情報検索装置におけるブロック図
である。
【図14】図13における第1共起テーブルの構成の一
例を示す図である。
【図15】図13における第2共起テーブルの構成の一
例を示す図である。
【図16】共起情報検索処理動作のフローチャートであ
る。
【符号の説明】
1…入力部、 2…翻訳モジュ
ール、3…メモリ、 5…翻訳
制御部、9…訳語選択部、 10…翻
訳文生成部、11…辞書、 3
1…入力部、32…第1共起テーブル検索部、 3
3…第1共起テーブル、34…第2共起テーブル検索
部、 35…第2共起テーブル、36…辞書引き
部、 37…共起情報生成部、38…
メモリ、 39…辞書、46…検
索制御部。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 第1言語において係り受け関係にある2
    以上の単語が共起した際にこの単語を第2言語による訳
    語に変換すると特殊な訳語になる特殊共起、あるいは、
    上記第1言語において係り受け関係にある2以上の単語
    が共起した際にこの単語を第2言語による訳語に変換す
    ると訳語間の共起が発生する特殊共起を処理する特殊共
    起処理方法であって、 上記第1言語による見出し語とこの見出し語の上記第2
    言語による訳語とを対応付け、 係り受け関係における係り側の〔見出し語:訳語〕ペア
    と受け側の〔見出し語:訳語〕ペアが1対1で特殊共起
    する際には、この係り側の〔見出し語:訳語〕ペアと受
    け側の〔見出し語:訳語〕ペアとを単独特殊共起コード
    で1対1に対応付け、 上記係り受け関係にある係り側の見出し語または受け側
    の見出し語の何れか一方が指定されると、この指定され
    た見出し語に係る〔見出し語:訳語〕ペアに上記単独特
    殊共起コードを介して対応付けられている〔見出し語:
    訳語〕ペアを上記単独特殊共起コードに基づいて求める
    ことによって、当該係り側の〔見出し語:訳語〕ペアと
    当該受け側の〔見出し語:訳語〕ペアとの特殊共起関係
    を処理することを特徴とする特殊共起処理方法。
  2. 【請求項2】 第1言語において係り受け関係にある2
    以上の単語が共起した際にこの単語を第2言語による訳
    語に変換すると特殊な訳語になる特殊共起、あるいは、
    上記第1言語において係り受け関係にある2以上の単語
    が共起した際にこの単語を第2言語による訳語に変換す
    ると訳語間の共起が発生する特殊共起を処理する特殊共
    起処理方法であって、 上記第1言語による見出し語とこの見出し語の上記第2
    言語による訳語とを対応付け、 係り受け関係における係り側の〔見出し語:訳語〕ペア
    と受け側の複数の〔見出し語:訳語〕ペアとが1対多で
    特殊共起する際には、この係り側の〔見出し語:訳語〕
    ペアと受け側の〔見出し語:訳語〕ペアとを集合特殊共
    起コードで1対多に対応付け、 上記係り受け関係にある係り側の見出し語または受け側
    の見出し語の何れか一方が指定されると、この指定され
    た見出し語に係る〔見出し語:訳語〕ペアに上記集合特
    殊共起コードを介して対応付けられている〔見出し語:
    訳語〕ペアを上記集合特殊共起コードに基づいて求める
    ことによって、当該係り側の〔見出し語:訳語〕ペアと
    当該受け側の〔見出し語:訳語〕ペアとの特殊共起関係
    を処理することを特徴とする特殊共起処理方法。
  3. 【請求項3】 第1言語において係り受け関係にある2
    以上の単語が共起した際にこの単語を第2言語による訳
    語に変換すると特殊な訳語になる特殊共起、あるいは、
    上記第1言語において係り受け関係にある2以上の単語
    が共起した際にこの単語を第2言語による訳語に変換す
    ると訳語間の共起が発生する特殊共起を処理する電子化
    辞書装置であって、 上記第1言語による見出し語とこの見出し語の上記第2
    言語による訳語とが対応付けられて記憶された言語情報
    格納部と、 上記言語情報格納部における各〔見出し語:訳語〕ペア
    が記憶されている領域内に設けられると共に、係り受け
    関係における係り側の〔見出し語:訳語〕ペアと受け側
    の〔見出し語:訳語〕ペアとが1対1で特殊共起するよ
    うな〔見出し語:訳語〕ペアの場合には当該各〔見出し
    語:訳語〕ペアが1対1の特殊共起関係にあることを表
    す単独特殊共起コードが書き込まれている共起コードエ
    リアと、 上記係り受け関係にある係り側の見出し語あるいは受け
    側の見出し語の何れか一方が入力されると、この入力さ
    れた見出し語に基づいて上記言語情報格納部を検索し
    て、上記入力された見出し語に係る〔見出し語:訳語〕
    ペアに上記単独特殊共起コードを介して対応付けられて
    いる〔見出し語:訳語〕ペアを上記単独特殊共起コード
    を用いて求める共起情報選出部を備えたことを特徴とす
    る電子化辞書装置。
  4. 【請求項4】 第1言語において係り受け関係にある2
    以上の単語が共起した際にこの単語を第2言語による訳
    語に変換すると特殊な訳語になる特殊共起、あるいは、
    上記第1言語において係り受け関係にある2以上の単語
    が共起した際にこの単語を第2言語による訳語に変換す
    ると訳語間の共起が発生する特殊共起を処理する電子化
    辞書装置であって、 上記第1言語による見出し語とこの見出し語の上記第2
    言語による訳語とが対応付けられて記憶された言語情報
    格納部と、 上記言語情報格納部における各〔見出し語:訳語〕ペア
    が記憶されている領域内に設けられると共に、係り受け
    関係における係り側の〔見出し語:訳語〕ペアと受け側
    の複数の〔見出し語:訳語〕ペアが1対多で特殊共起す
    るような〔見出し語:訳語〕ペアの場合には当該各〔見
    出し語:訳語〕ペアが1対多の特殊共起関係にあること
    を表す集合特殊共起コードが書き込まれている共起コー
    ドエリアと、 上記係り受け関係にある係り側の見出し語あるいは受け
    側の見出し語の何れか一方が入力されると、この入力さ
    れた見出し語に基づいて上記言語情報格納部を検索し
    て、上記入力された見出し語に係る〔見出し語:訳語〕
    ペアに上記集合特殊共起コードを介して対応付けられて
    いる〔見出し語:訳語〕ペアを上記集合特殊共起コード
    を用いて求める共起情報選出部を備えたことを特徴とす
    る電子化辞書装置。
  5. 【請求項5】 第1言語において係り受け関係にある2
    以上の単語が共起した際にこの単語を第2言語による訳
    語に変換すると特殊な訳語になる特殊共起、あるいは、
    上記第1言語において係り受け関係にある2以上の単語
    が共起した際にこの単語を第2言語による訳語に変換す
    ると訳語間の共起が発生する特殊共起を処理する機械翻
    訳装置であって、 上記第1言語において係り受け関係にある係り側の〔見
    出し語:訳語〕ペアと受け側の〔見出し語:訳語〕ペア
    とが単独特殊共起コードで1対1に対応付けられて記憶
    された言語情報格納部と、 入力文中の係り受け関係における係り側の見出し語また
    は受け側の見出し語の何れか一方に基づいて上記言語情
    報格納部を検索して、当該見出し語に係る〔見出し語:
    訳語〕ペアに対応付けられて特殊共起関係にある〔見出
    し語:訳語〕ペアを上記単独特殊共起コードを用いて求
    める共起情報選出部と、 当該見出し語に係る〔見出し語:訳語〕ペアと上記共起
    情報選出部によって求められた上記特殊共起関係にある
    〔見出し語:訳語〕ペアとに基づいて、上記第1言語に
    よる係り受け関係にある2以上の単語が共起した際にお
    ける第2言語による共起訳語を生成する翻訳文生成部を
    備えたことを特徴とする機械翻訳装置。
  6. 【請求項6】 第1言語において係り受け関係にある2
    以上の単語が共起した際にこの単語を第2言語による訳
    語に変換すると特殊な訳語になる特殊共起、あるいは、
    上記第1言語において係り受け関係にある2以上の単語
    が共起した際にこの単語を第2言語による訳語に変換す
    ると訳語間の共起が発生する特殊共起を処理する機械翻
    訳装置であって、 上記第1言語において係り受け関係にある係り側の〔見
    出し語:訳語〕ペアと受け側の複数の〔見出し語:訳
    語〕ペアとが集合特殊共起コードで1対多に対応付けら
    れて記憶された言語情報格納部と、 入力文中の係り受け関係における係り側の見出し語また
    は受け側の見出し語の何れか一方に基づいて上記言語情
    報格納部を検索して、当該見出し語に係る〔見出し語:
    訳語〕ペアに対応付けられて特殊共起関係にある〔見出
    し語:訳語〕ペアを上記集合特殊共起コードを用いて求
    める共起情報選出部と、 当該見出し語に係る〔見出し語:訳語〕ペアと上記共起
    情報選出部によって求められた上記特殊共起関係にある
    〔見出し語:訳語〕ペアとに基づいて、上記第1言語に
    よる係り受け関係にある2以上の単語が共起した際にお
    ける第2言語による共起訳語を生成する翻訳文生成部を
    備えたことを特徴とする機械翻訳装置。
  7. 【請求項7】 第1言語において係り受け関係にある2
    以上の単語が共起した際にこの単語を第2言語による訳
    語に変換すると特殊な訳語になる特殊共起、あるいは、
    上記第1言語において係り受け関係にある2以上の単語
    が共起した際にこの単語を第2言語による訳語に変換す
    ると訳語間の共起が発生する特殊共起を処理する情報検
    索装置であって、 上記第1言語において係り受け関係にある係り側の〔見
    出し語:訳語〕ペアと受け側の〔見出し語:訳語〕ペア
    とが単独特殊共起コードで1対1に対応付けられて記憶
    された言語情報格納部と、 入力部から入力された上記第1言語によるキーワードに
    基づいて上記言語情報格納部を検索し、上記キーワード
    で表される見出し語に係る〔見出し語:訳語〕ペアに対
    応付けられて特殊共起関係にある〔見出し語:訳語〕ペ
    アを上記単独特殊共起コードを用いて求める共起情報選
    出部と、 上記キーワードに係る〔見出し語:訳語〕ペアと上記共
    起情報選出部によって求められた上記特殊共起関係にあ
    る〔見出し語:訳語〕ペアに基づいて、所定の手順で共
    起情報を生成する共起情報生成部を備えたことを特徴と
    する情報検索装置。
  8. 【請求項8】 第1言語において係り受け関係にある2
    以上の単語が共起した際にこの単語を第2言語による訳
    語に変換すると特殊な訳語になる特殊共起、あるいは、
    上記第1言語において係り受け関係にある2以上の単語
    が共起した際にこの単語を第2言語による訳語に変換す
    ると訳語間の共起が発生する特殊共起を処理する情報検
    索装置であって、 上記第1言語において係り受け関係にある係り側の〔見
    出し語:訳語〕ペアと受け側の複数の〔見出し語:訳
    語〕ペアとが集合特殊共起コードで1対多に対応付けら
    れて記憶された言語情報格納部と、 入力部から入力された上記第1言語でのキーワードに基
    づいて上記言語情報格納部を検索して、上記キーワード
    で表される見出し語に係る〔見出し語:訳語〕ペアに対
    応付けられて特殊共起関係にある〔見出し語:訳語〕ペ
    アを上記集合特殊共起コードを用いて求める共起情報選
    出部と、 上記キーワードに係る〔見出し語:訳語〕ペアと上記共
    起情報選出部によって求められた共起関係にある〔見出
    し語:訳語〕ペアとに基づいて、所定の手順で共起情報
    を生成する共起情報生成部を備えたことを特徴とする情
    報検索装置。
JP5113412A 1993-05-14 1993-05-14 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置 Expired - Lifetime JP3015223B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5113412A JP3015223B2 (ja) 1993-05-14 1993-05-14 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置
US08/242,670 US5608623A (en) 1993-05-14 1994-05-13 Special cooccurrence processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5113412A JP3015223B2 (ja) 1993-05-14 1993-05-14 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置

Publications (2)

Publication Number Publication Date
JPH06325073A true JPH06325073A (ja) 1994-11-25
JP3015223B2 JP3015223B2 (ja) 2000-03-06

Family

ID=14611615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5113412A Expired - Lifetime JP3015223B2 (ja) 1993-05-14 1993-05-14 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置

Country Status (2)

Country Link
US (1) US5608623A (ja)
JP (1) JP3015223B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2817776B2 (ja) * 1995-05-25 1998-10-30 日本電気株式会社 単語変換装置
JPH08329105A (ja) * 1995-05-31 1996-12-13 Canon Inc 文書処理方法及びその装置
JPH09128396A (ja) * 1995-11-06 1997-05-16 Hitachi Ltd 対訳辞書作成方法
US6119114A (en) * 1996-09-17 2000-09-12 Smadja; Frank Method and apparatus for dynamic relevance ranking
US6173298B1 (en) 1996-09-17 2001-01-09 Asap, Ltd. Method and apparatus for implementing a dynamic collocation dictionary
JPH10318069A (ja) 1997-05-20 1998-12-02 Honda Motor Co Ltd 自動二輪車用燃料ポンプの駆動装置
JP3765801B2 (ja) * 2003-05-28 2006-04-12 沖電気工業株式会社 対訳表現抽出装置、対訳表現抽出方法、および対訳表現抽出プログラム
JP3790825B2 (ja) * 2004-01-30 2006-06-28 独立行政法人情報通信研究機構 他言語のテキスト生成装置
US20080221868A1 (en) * 2005-09-05 2008-09-11 Melnick Einat H Digital universal language
JP4997966B2 (ja) * 2006-12-28 2012-08-15 富士通株式会社 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法
JP5121252B2 (ja) * 2007-02-26 2013-01-16 株式会社東芝 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
JPWO2008123081A1 (ja) * 2007-03-27 2010-07-15 日本電気株式会社 文字データ処理方法、コンピュータプログラム及び文字データ処理システム
JP4398992B2 (ja) * 2007-03-29 2010-01-13 株式会社東芝 情報検索装置、情報検索方法及び情報検索プログラム
CN101960451A (zh) * 2008-02-29 2011-01-26 夏普株式会社 信息处理装置、方法、以及程序
CN102012900B (zh) * 2009-09-04 2013-01-30 阿里巴巴集团控股有限公司 信息检索方法和***
US11481599B2 (en) * 2019-09-04 2022-10-25 Tencent America LLC Understanding a query intention for medical artificial intelligence systems using semi-supervised deep learning

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH083815B2 (ja) * 1985-10-25 1996-01-17 株式会社日立製作所 自然言語の共起関係辞書保守方法
JPS638864A (ja) * 1986-06-27 1988-01-14 Sharp Corp 翻訳装置
US4916614A (en) * 1986-11-25 1990-04-10 Hitachi, Ltd. Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
US5257187A (en) * 1986-11-28 1993-10-26 Sharp Kabushiki Kaisha Translation machine system
GB2198565A (en) * 1986-11-28 1988-06-15 Sharp Kk Translation apparatus
GB2199680A (en) * 1986-11-28 1988-07-13 Sharp Kk Translating apparatus
US5195032A (en) * 1987-12-24 1993-03-16 Sharp Kabushiki Kaisha Device for designating a processing area for use in a translation machine
JPH0417064A (ja) * 1990-05-11 1992-01-21 Hitachi Ltd 共起辞書保守方式
JP2892548B2 (ja) * 1992-05-25 1999-05-17 シャープ株式会社 自動翻訳装置

Also Published As

Publication number Publication date
JP3015223B2 (ja) 2000-03-06
US5608623A (en) 1997-03-04

Similar Documents

Publication Publication Date Title
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
JP4306894B2 (ja) 自然言語処理装置及びその方法、及び自然言語認識装置
US5541838A (en) Translation machine having capability of registering idioms
US20020111792A1 (en) Document storage, retrieval and search systems and methods
JP3015223B2 (ja) 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置
JPH0242572A (ja) 共起関係辞書生成保守方法
US5475586A (en) Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words
MXPA04002816A (es) Modelos estadisticos informados linguisticamente de una estructura compuesta para ordenar la comprension de una oracion para un sistema de generacion de lenguaje natural.
JP2005165958A (ja) 情報検索システム、情報検索支援システム及びその方法並びにプログラム
JP2609173B2 (ja) 用例主導型機械翻訳方法
JP2000514214A (ja) 自動自然言語翻訳
JPH0261763A (ja) 機械翻訳装置
JP2007087157A (ja) 翻訳システム、翻訳装置、翻訳方法及びプログラム
JP4024137B2 (ja) 数量表現検索装置
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
JP4007630B2 (ja) 対訳例文登録装置
JPH1074207A (ja) 情報検索装置及び情報検索方法
JPH03148765A (ja) 文書検索装置
JP3176750B2 (ja) 自然言語の翻訳装置
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2752025B2 (ja) 機械翻訳装置
JPH0561902A (ja) 機械翻訳システム
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH02294779A (ja) 機械翻訳システム
JPH0320866A (ja) テキストベース検索方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071217

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081217

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091217

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091217

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101217

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101217

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111217

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111217

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121217

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121217

Year of fee payment: 13

EXPY Cancellation because of completion of term