JPH07334503A - 自然言語処理システム - Google Patents

自然言語処理システム

Info

Publication number
JPH07334503A
JPH07334503A JP6122901A JP12290194A JPH07334503A JP H07334503 A JPH07334503 A JP H07334503A JP 6122901 A JP6122901 A JP 6122901A JP 12290194 A JP12290194 A JP 12290194A JP H07334503 A JPH07334503 A JP H07334503A
Authority
JP
Japan
Prior art keywords
data
analysis
noun
compound noun
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6122901A
Other languages
English (en)
Inventor
Takesuke Hiraoka
丈介 平岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP6122901A priority Critical patent/JPH07334503A/ja
Publication of JPH07334503A publication Critical patent/JPH07334503A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 構文解析に必要な単語の係受け及び意味解析
に必要な単語の意味情報を持たせた複合名詞を受け渡し
でき、比較的簡単なデータ構造にもする。 【構成】 入力文を形態素解析し、この解析結果から構
文解析と意味解析を行う自然言語処理システムにおい
て、形態素解析で得るデータは、入力文を単語単位に分
割し、それぞれの単語に付随した属性的データを記述し
た単語データと、該単語のうち複合名詞を構成する各名
詞の意味情報を記述した複合名詞データとし、複合名詞
の意味解析には複合名詞データを参照することで複合名
詞を構成する各名詞の意味情報を得る。同一表記の複合
名詞には共通の複合名詞データを検索・参照対象とす
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然言語処理システム
に係り、特に形態素解析処理で得る複合名詞データを構
文・意味解析処理に受け渡すためのデータ処理に関す
る。
【0002】
【従来の技術】ワードプロセッサや機械翻訳、ドキュメ
ントデータベース、ハイパーテキストといったコンピュ
ータを使った自然言語処理が実用化されている。
【0003】このための自然言語解析は、まず解析対象
となる文章を形態素単位(語構成の最小単位)に区切
り、それぞれの形態素がもつ性質を明らかにする形態素
解析を行う。この後、自然言語の統語規則から解析する
構文解析、続いて曖昧性や漠然性を取り除く意味解析、
文脈解析を行う。
【0004】構文解析には、形態素解析された文を文法
を用いて正しい文であるか否かを判定し、正しい文のと
きはその構文解析結果として木構造(解析木)を得る。
【0005】この構文解析処理では、文法的な適合性の
みに着目しているため、構文的な曖昧性が発生し、多く
の構文木が生成されてしまう。この中から、正しい解析
木を選択するために、意味解析処理を行う。
【0006】意味解析処理では、単語の文法カテゴリ
(品詞に相当)だけでなく、その意味的な情報を利用す
るものである。
【0007】ここで、形態素解析はC言語で記述したプ
ログラムによって処理がなされ、構文・意味解析はPr
olog言語で記述したプログラムによって処理がなさ
れている。
【0008】このため、形態素解析結果で得られたデー
タを構文・意味解析処理に受け渡すためのインターフェ
ース手段を必要とする。このときの受け渡しデータは、
入力文字列を単語単位に分割し、それぞれの単語に付随
した属性的データを記述した形式のデータ(以下、”d
ictデータ”と呼ぶ)にされる。
【0009】
【発明が解決しようとする課題】入力文字列の中に複合
名詞があった場合、形態素解析では個々の名詞に分割す
るが、dictデータは複合名詞を1つの単語データと
して扱う。
【0010】これは、構文解析の段階では単語の係受け
を調べるため、複合名詞を1つの名詞として前後の単語
との係受けを調べるのが合理的であることによる。
【0011】しかし、意味解析の段階では複合名詞がど
のような名詞から構成されており、それぞれの名詞がど
のような辞書情報(意味的なものも含む)を持っていた
かということが必要となる。
【0012】現状では、複合名詞のdictデータは、
元の名詞の持っていた情報のうち、ごく限られた情報し
か受け継いでいないため、複合名詞の意味的な解析の確
度を悪くしていた。
【0013】本発明の目的は、構文解析に必要な単語の
係受け及び意味解析に必要な単語の意味情報を持たせた
複合名詞の受け渡しができる自然言語処理システムを提
供することにある。
【0014】本発明の他の目的は、比較的簡単なデータ
構造で受け渡しできる自然言語処理システムを提供する
ことにある。
【0015】
【課題を解決するための手段】本発明は、前記課題の解
決を図るため、入力文を形態素解析し、この解析結果か
ら構文解析と意味解析を行う自然言語処理システムにお
いて、前記形態素解析で得るデータは、入力文を単語単
位に分割し、それぞれの単語に付随した属性的データを
記述した単語データと、該単語のうち複合名詞を構成す
る各名詞の意味情報を記述した複合名詞データとし、前
記構文解析は、前記単語データから構文木の生成を行
い、前記意味解析は、前記単語データのうち同一表記の
複合名詞はその表記をキーとして前記複合名詞データを
検索して各名詞の意味情報を得ることを特徴とする。
【0016】
【作用】形態素解析結果のデータとして従来の単語デー
タの他に、複合名詞データを生成し、複合名詞の意味解
析には複合名詞データを参照することで複合名詞を構成
する各名詞の意味情報を得る。
【0017】同一表記の複合名詞には共通の複合名詞デ
ータを検索・参照対象とする。
【0018】
【実施例】図1は、本発明の一実施例を示し、形態素解
析処理による構文・意味解析処理への受け渡しデータの
構造を示す。
【0019】入力文に対する形態素解析結果として、単
語データとしてのdictデータの他に、複合名詞デー
タとしてのsemdictデータを生成し、構文・意味
解析のためのデータ受け渡しを行う。
【0020】dictデータは、従来と同様に、単語の
品詞と表記と文法情報及び意味情報からなるデータ構造
にされる。
【0021】semdictデータ(複合名詞データ)
は、dictデータの各単語のうち、複合名詞になる単
語の複合名詞表記と元の名詞表記及び元の名詞の意味情
報からなるデータ構造にされる。
【0022】例えば、入力文「実験結果を機械処理にか
ける」に対し、形態素に分割した結果は、 「実験/結果/を/機械/処理/に/かけ/る」 となる。この形態素の単語データになるdictデータ
は、 dict(名詞、実験結果、〜、Sem1) dict(格助詞、を、〜、〜) dict(名詞、機械処理、〜、Sem2) dict(格助詞、に、〜、〜) dict(動詞、かける、〜、〜) となる。ここで、Semは、それぞれの名詞が持つ意味
情報であり、例えば意味素性、シソーラスコードであ
る。
【0023】このときの、semdictデータは、 semdict(複合名詞、実験結果、[[実験、Se
m11]、[結果、Sem12]]) semdict(複合名詞、機械処理、[[機械、Se
m21]、[処理、Sem22]]) となる。
【0024】このようなdictデータとsemdic
tデータを受け渡された構文・意味解析処理は、構文解
析では、dictデータから単語の係受けを使って構文
木を生成する。
【0025】この生成された構文木の意味的な適合性判
断を行う意味解析では、dictデータのうち、単語
「実験結果」という語は辞書にないため、その意味情報
「Sem1」には何も記述されない。
【0026】そこで、semdictデータに複合名詞
表記があるか否かを検索し、「実験」の意味情報Sem
11と「結果」の意味情報Sem12を参照する。この
参照によって、複合名詞「実験結果」の意味解析に利用
することができる。
【0027】同様に、複合名詞「機械処理」についても
表記をキーとしてsemdictデータの検索と意味情
報を得ることができる。
【0028】したがって、本実施例によれば、dict
データのうち、複合名詞の意味情報はsemdictデ
ータの参照によって、当該複合名詞がどのような名詞か
ら構成され、それぞれの名詞がどういう意味情報を持っ
ているかを意味解析の段階で参照・利用できる。
【0029】しかも、従来の単語データ(dictデー
タ)については、何ら変更することがないため、構文解
析処理の変更を不要にする。
【0030】また、semdictデータは、同じ表記
の複合名詞に共通の意味情報として利用できる。すなわ
ち、dictデータ中に複合名詞の各単語毎の意味情報
を記述すると、1つの入力文又は複数の入力文にわたっ
て同じ表記の複合名詞が複数個出現するときにそれぞれ
のdictデータ中に同じ意味情報を記述することにな
って冗長なデータになる。この点、本実施例では、同じ
表記の複合名詞には1つのsemdictデータを受け
渡すようにしておくことで、同じ表記の複合名詞が出現
したときに同じsemdictデータを参照することに
よってその意味情報を得ることができる。
【0031】
【発明の効果】以上のとおり、本発明によれば、形態素
解析結果のデータとして、従来の単語データの他に、単
語のうち複合名詞を構成する各名詞の意味情報を記述し
た複合名詞データを生成して構文・意味解析に受け渡
し、意味解析には、複合名詞はその表記をキーとして複
合名詞データを検索して各名詞の意味情報を得るように
したため、以下の効果がある。
【0032】(1)複合名詞を含む入力文の意味解析の
確度を向上できる。
【0033】(2)複合名詞データの追加にも構文解析
処理には変更を必要としない。
【0034】(3)受け渡しデータは、従来の単語デー
タに複合名詞データを追加するのみで済み、データ量の
増加はほとんど無い。
【0035】(4)同一表記の複合名詞には共通の複合
名詞データを検索・参照対象として共通利用できる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す受け渡しデータ構造。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力文を形態素解析し、この解析結果か
    ら構文解析と意味解析を行う自然言語処理システムにお
    いて、 前記形態素解析で得るデータは、入力文を単語単位に分
    割し、それぞれの単語に付随した属性的データを記述し
    た単語データと、該単語のうち複合名詞を構成する各名
    詞の意味情報を記述した複合名詞データとし、 前記構文解析は、前記単語データから構文木の生成を行
    い、 前記意味解析は、前記単語データのうち同一表記の複合
    名詞はその表記をキーとして前記複合名詞データを検索
    して各名詞の意味情報を得ることを特徴とする自然言語
    処理システム。
JP6122901A 1994-06-06 1994-06-06 自然言語処理システム Pending JPH07334503A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6122901A JPH07334503A (ja) 1994-06-06 1994-06-06 自然言語処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6122901A JPH07334503A (ja) 1994-06-06 1994-06-06 自然言語処理システム

Publications (1)

Publication Number Publication Date
JPH07334503A true JPH07334503A (ja) 1995-12-22

Family

ID=14847427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6122901A Pending JPH07334503A (ja) 1994-06-06 1994-06-06 自然言語処理システム

Country Status (1)

Country Link
JP (1) JPH07334503A (ja)

Similar Documents

Publication Publication Date Title
US6965857B1 (en) Method and apparatus for deriving information from written text
US20050171757A1 (en) Machine translation
EP1306775A1 (en) Machine translation
EP1349079A1 (en) Machine translation
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
Hobbs et al. The automatic transformational analysis of English sentences: An implementation
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2007133905A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
JPH07334503A (ja) 自然言語処理システム
JP4039282B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPS60215282A (ja) 自然言語解析構文方式及び装置
JPH0320866A (ja) テキストベース検索方式
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH0561902A (ja) 機械翻訳システム
JP3055690B2 (ja) 日本語同格名詞句翻訳方式
JP4262529B2 (ja) 全文検索装置、方法、プログラム及び記録媒体
JP2954592B2 (ja) 言語解析装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH05189492A (ja) 検索式自動生成装置
JP2752025B2 (ja) 機械翻訳装置
JPH07334504A (ja) 日本語処理システム
JPH0540781A (ja) 日本語構文解析システム
EP1306773A1 (en) Machine translation