JPH06274540A - 自然言語解析装置 - Google Patents

自然言語解析装置

Info

Publication number
JPH06274540A
JPH06274540A JP5059179A JP5917993A JPH06274540A JP H06274540 A JPH06274540 A JP H06274540A JP 5059179 A JP5059179 A JP 5059179A JP 5917993 A JP5917993 A JP 5917993A JP H06274540 A JPH06274540 A JP H06274540A
Authority
JP
Japan
Prior art keywords
sentence
information
sentence pattern
pattern
information structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5059179A
Other languages
English (en)
Inventor
Yukari Saitou
由香梨 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5059179A priority Critical patent/JPH06274540A/ja
Publication of JPH06274540A publication Critical patent/JPH06274540A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明は、入力文の文型推定を利用した自然
言語解析装置に関し、入力文から、本当に得たい情報を
抽出する。 【構成】 自然言語に存在する複数個の文型パターン
,を登録しておき、入力された文を、予め、登録
されている文型パターン,又は、と比較し、入力文
の文型を推定する文型推定部と、推定した文型の情報
構造に対応して、文型の所定の位置から、所定の情報文
を抽出するように解析を行う情報構造解析部を備える
ように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然言語解析装置に関
する。近年、コンパクトディスク(CD ROM)に代表される
高密度の媒体が普及し始めているが、例えば、特許の公
開公報, 公告公報等の情報のような場合、情報内容は自
然言語で記述されているので、上記特許の公開公報, 公
告公報等中にある自然言語文を入力して、技術分野, 利
用分野等の情報を得て、上記特許情報の検索ができるこ
とが要求される。
【0002】
【従来の技術】図6は、従来の自然言語解析装置を説明
する図である。従来の自然言語解析装置は、例えば、図
示されているように、語彙,文法による入力文解析部 1
A と、辞書 3A を備えている。辞書 3A には、自然言語
中に存在する各単語が、属性 (動詞, 名詞, 助詞, 形容
詞, 〜等) と共に格納されている。
【0003】従って、入力文が与えられると、入力文
を単語に分解した後、上記辞書 3A を参照して、例え
ば、“「名詞+助詞 (は) 」は主語,「動詞」は述語,
述語の前後に繋がっている単語が名詞であると、上記述
語の対象を示している情報”といった解析を行う。
【0004】即ち、従来の自然言語解析装置は、単語間
の文法的な関係の解析しか行っておらず、入力文の内
容、例えば、「これは何について述べている文である」
といった解析は行っていなかった。
【0005】
【発明が解決しようとする課題】即ち、従来の自然言語
解析装置は、語彙や文法情報を使って解析を行っていた
ので、文から本当に必要な情報を抽出することができな
い場合があった。
【0006】例えば「本発明は、自然言語を入力して検
索を行うことができる情報検索装置に関する」という文
が入力されたとき、上記従来の自然言語解析装置では文
法情報を使った解析を行うので、「本発明」が主語で、
「関する」が述語であり、その述語に対応する対象は
「情報検索装置」であるというような解析を行ってい
た。
【0007】従って、この文は、「発明の利用分野」に
ついて述べた文であるのに係わらず、その「発明の利用
分野」としては“情報検索装置”である、というような
情報は得られなかった。
【0008】そのため、この文から本当に得たい情報を
抽出することができないという問題があった。本発明は
上記従来の欠点に鑑み、入力文の文型推定を利用するこ
とで、入力文から、本当に得たい情報を抽出することが
できる自然言語解析装置を提供することを目的とするも
のである。
【0009】
【課題を解決する為の手段】図1は、本発明の原理説明
図であり、図1(a) は、本発明の自然言語解析装置の構
成例を示し、図1(b) は、処理の概要を示している。上
記の問題点は下記のように構成した自然言語解析装置に
よって解決される。
【0010】(1) 自然言語に存在する複数個の文型パタ
ーンを登録しておき、入力された文を、上記、予
め、登録されている文型パターンと比較し、入力文
の文型を推定する文型推定部 1と、推定した文型に対応
して、文型の所定の位置から、所定の情報文を抽出す
るように解析を行う情報構造解析部 2を備えるように構
成する。
【0011】(2) 自然言語中の対話文に存在する複数個
の文型パターンを登録しておき、入力された文を、
上記、予め、登録されている文型パターンと比較し、
入力文の文型を推定する文型推定部 1と、推定した文
型に対応して、文型の所定の位置から、所定の情報文
を抽出するように解析を行う情報構造解析部 2を備える
ように構成する。
【0012】
【作用】即ち、本発明の自然言語解析装置では、入力文
の文型パターンから、その文の文型を推定する文型推
定部と、推定した文型に対応する情報構造に従って、解
析を行う情報構造解析部を用いることで、自然言語文か
ら必要な情報を得ることのできる解析を行うようにし
たものである。
【0013】図1(a) は、本発明による自然言語解析装
置の構成例を示している。1 は文型推定部、, は文
型パターン、2 は情報構造解析部、3 は文型パターン部
で、文型パターンと文型名の対応表を格納しており、
4 は、情報構造対応表部で、文型の情報構造の対応表
を格納しており、5 はアプリケーションプログラムであ
る。
【0014】入力文は、本発明の自然言語解析装置の
文型推定部 1において、文型パターン部 3に登録されて
いる複数個の文型, と、例えば、ストリング照合さ
れて、一致した文型, 又は、を抽出する。
【0015】上記抽出された文型, 又は、によっ
て、どのような情報構造であるか、即ち、どのような情
報文が存在するかを、情報構造対応表部 4の対応表
から認識し、その情報構造から、文型のどの部分に、ど
のような情報が存在するかを認識して、情報構造解析
部 2では、その情報構造に応じて、必要とする情報文
を抽出し、次のアプリケーション 5に渡す。
【0016】アプリケーション 5では、得られた情報を
基に、例えば、情報検索等を行う。例えば、上記の入力
文が、特許の「明細書」の一部であると、得られた情
報、例えば、技術分野を示す情報から、その技術分野
に関する出願済み特許を検索したり、検索した出願済み
特許の情報から、メーカ別出願特許件数といった統計デ
ータを出力する。
【0017】このように、本発明による自然言語解析装
置では、入力文が、予め、情報構造の分かって文型パ
ターンといずれと一致するかを推定することで、必要
とする情報を、的確に抽出することができる効果があ
る。
【0018】
【実施例】以下本発明の実施例を図面によって詳述す
る。前述の図1は、本発明の原理説明図であり、図2〜
図5は、本発明の一実施例を示した図であって、図2
(a) は、文型推定部の処理を流れ図で示し、図2(b)
は、情報構造解析部の処理を流れ図で示し、図3(a)
は、知識収集システムの場合の文型パターンと文型との
対応表を示し、図3(b) は、知識収集システムの場合
の文型と情報構造との対応表を示し、図4は、質問応
答システムの場合の文型パターンと文型との対応表を
示し、図5は、質問応答システムの場合の文型と情報構
造との対応表を示している。
【0019】本発明においては、自然言語に存在する複
数個の文型パターン,を登録しておき、入力された
文を、予め、登録されている文型パターン,又は、
と比較し、入力文の文型を推定する文型推定部 1
と、推定した文型の情報構造に対応して、文型の所定の
位置から、所定の情報文を抽出するように解析を行う
情報構造解析部 2と、文型パターン,又は、と文型
との対応表を備えた文型パターン部 3と、文型と情報
構造との対応表を備えた情報構造対応表部 4とが、本
発明を実施するのに必要な手段である。尚、全図を通し
て同じ符号は同じ対象物を示している。
【0020】以下、図1を参照しながら、図2〜図5に
よって、本発明の自然言語解析装置の構成と動作を説明
する。本発明の自然言語解析装置での全体の処理の流れ
は、図2の流れ図に示した通りである。
【0021】処理ステップ 100:文型推定部 1で、入力
文がどの文型,又は、にあたるかを判定する。 処理ステップ 101:情報構造解析部 2で、文型,又
は、と情報構造との対応表に基づいて、応答を行う
ために必要な情報を抽出し、解析を行う。
【0022】処理ステップ 102:解析結果をアプリケー
ションプログラムに渡し、実行する。 上記文型推定部 1での処理は、以下のとおりである。
{図2(a) 参照} 本発明の自然言語解析装置では、自然言語中に存在する
複数個の文型パターン,又は、と文型名の対応表
を文型パターン部 3に登録し、上記登録されている文型
パターンから決まる文型と、情報構造との対応表、即
ち、その文型には、どのような情報を持っているかの対
応表を、情報構造対応表部 4に登録しておく。
【0023】この状態で、入力文が入力されると、文
型パターン部 4に登録されている文型パターンの1つ
を取り出し、入力文を、上記取り出した文型パターン
とを、例えば、ストリーム照合によって比較し、一致
する文型パターンの文型名を取り出す。{図2(a) の
処理ステップ 200〜203 参照} 取り出された文型名を、次の情報構造解析部 2に入力す
る。
【0024】情報構造解析部 2では、入力された文型名
を基に、情報構造対応表部 4に登録されている情報構造
対応表を参照して、上記文型名に対応する情報構造、
具体的には、どのような情報構造があるかを認識し、そ
こから抽出すべき情報構造を求める。{図2(b) の処理
ステップ 300参照} 入力された文について、例えば、ストリング照合を行
い、入力文の構文解析を行い、その解析結果から、上
記情報構造に対応する部分の単語 (文) を求めること
で、必要とする情報を得る。{図2(b) の処理ステッ
プ 301,302参照} この解析が終了すると解析結果はアプリケーションプロ
グラム 4に渡される。
【0025】以下、上記の動作による自然言語の解析方
法を、図3,図4によって、具体例を基に説明する。 例1 知識収集システム:図3参照 図3に、特許文から、特許の分野やどういう問題を解決
しようとしているかなどの情報を抽出する知識収集シス
テムについての例を示す。
【0026】図3(a) は、文型パターンと文型との対応
表の例を示しており、図3(b) は、文型と情報構造と
の対応表の例を示している。入力された特許文、
「本発明は、物体の認識を行う画像認識装置に関し、特
に認識対象と背景の分離を行うための輪郭線抽出装置に
関する」という特許文が入力されると、上記文型推定部
1により、「本発明は・・・に関し、特に・・・に関す
る」という文型パターンから、これは利用分野について
の文型であることを推定する{図3(a) 参照}。
【0027】次に情報構造解析部 2で、上記利用分野に
対応する情報構造は、分野と技術要素であることを求め
る{図3(b) 参照}。文型が決まると、そのどの部分
に、必要とする情報が存在するかが、予め、定められ
ている。
【0028】即ち、上記の「利用分野」の文型では、
「この発明は(A) に関し、特に(B) に関する。」である
とすると、上記文型と情報構造との対応表で示されて
いる「技術分野」に関する情報は、「A」の部分に存在
し、「技術要素」に関する情報は「B」の部分に存在す
ると分かる。
【0029】従って、入力文を、予め、登録されてい
る文型パターンとストリング照合を行うことで、上記
「A」の部分に存在する情報と、上記「B」の部分に存
在する情報を認識することができ、上記の解析結果とし
て「画像認識装置」がこの特許の分野であり、「輪郭線
抽出」が技術要素であることを得る。
【0030】知識収集システムは、以上の手順で得られ
た情報を格納する。以下、同様にして、入力文が「課
題」「構成」「効果」であることが認識されると、入力
文の所定の部分から、図3(b) の対応表に示されて
いる情報を得ることができる。
【0031】次に、他の例について説明する。 例2 質問応答システム:図4,図5参照 図4,図5は、ユーザがシステムに質問し、システムが
それに答える質問応答システムについての例を示してい
る。
【0032】ユーザが「ニュースシステムって?」とい
う文を入力すると、文型推定部 1でその文型が定義の質
問であることを推定する{図4参照}。次に、情報構造
解析部 2で、定義の質問と情報構造との対応表を参照
する{図5参照}。ここで、定義の質問では、質問され
ている対象を抽出するための解析を行い、「ニュースシ
ステム」が質問の対象であることを解析する。
【0033】質問応答システムでは、「ニュースシステ
ム」の定義が聞かれていることを、アプリケーションで
受け取り、図示されていない辞書から、「ニュースシス
テム」の定義部分を検索し、ユーザへの回答文を生成す
る。
【0034】同様にして、入力文が、「方法」「可能
性」「原因」等の質問文であることが認識されると、図
5に示されている対応表から、所定の情報を得て、
アプリケーションに渡されることにより、ユーザへの回
答文を得ることができる。
【0035】例えば、「オアシスの使い方は?」なる入
力文が入力され、その入力文が「方法」の質問であ
ることが認識された場合、上記図5の対応表から情報
構造として、「動作主」「対象物」が求められ、上記
「動作主」は、デフォルト値として、例えば、ユーザと
認識し、対象物が「オアシス」なる日本語処理装置であ
ると認識されることにより、アプリケーションでは、所
定の辞書といったデータベースから、「オアシス」なる
日本語処理装置に関する使い方の情報を検索して、ユー
ザに対する回答文を得ることができる。
【0036】同様にして、情報構造「条件」に対して
は、対応した文型、例えば、図4の対応表の「どうし
たら・・・は使えるの?」といった文型が認識されたと
きに抽出される。
【0037】このように、本発明の自然言語解析装置
は、自然言語に存在する複数個の文型パターン,を
登録しておき、入力された文を、予め、登録されてい
る文型パターン,又は、と比較し、入力文の文型
名を推定する文型推定部と、推定した文型名の情報構造
に対応して、文型の所定の位置から、所定の情報を抽
出するように解析を行う情報構造解析部を備えるように
構成した所に特徴がある。
【0038】
【発明の効果】以上、詳細に説明したように、本発明の
自然言語解析装置によれば、入力文の文型を推定して
から、文型に対応した情報構造に従って解析を行うの
で、文の中から本当に必要な情報を得ることが可能と
なる効果がある。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明の一実施例を示した図(その1)
【図3】本発明の一実施例を示した図(その2)
【図4】本発明の一実施例を示した図(その3)
【図5】本発明の一実施例を示した図(その4)
【図6】従来の自然言語解析装置を説明する図
【符号の説明】
1 文型推定部 2 情報構造
解析部 3 文型パターン部 4 情報構造
対応表部 5 アプリケーション , 文型パターン 入力文 情報文,情報 文型パターンと文型名の対応表 文型名と情報構造との対応表,情報構造対応表 100 〜102,200 〜203,300 〜302 処理ステップ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】自然言語に存在する複数個の文型パターン
    ()を登録しておき、入力された文 () を、上記、
    予め、登録されている文型パターン () と比較し、入
    力文() の文型を推定する文型推定部(1) と、推定し
    た文型の情報構造に対応して、文型の所定の位置から、
    所定の情報文 () を抽出するように解析を行う情報構
    造解析部 (2)を備えることを特徴とする自然言語解析装
    置。
  2. 【請求項2】自然言語中の対話文に存在する複数個の文
    型パターン()を登録しておき、入力された文 ()
    を、予め、登録されている文型パターン () と比較
    し、入力文 () の文型を推定する文型推定部(1) と、
    推定した文型の情報構造に対応して、文型の所定の位置
    から、所定の情報文( ) を抽出するように解析を行う
    情報構造解析部 (2)を備えることを特徴とする自然言語
    解析装置。
JP5059179A 1993-03-19 1993-03-19 自然言語解析装置 Withdrawn JPH06274540A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5059179A JPH06274540A (ja) 1993-03-19 1993-03-19 自然言語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5059179A JPH06274540A (ja) 1993-03-19 1993-03-19 自然言語解析装置

Publications (1)

Publication Number Publication Date
JPH06274540A true JPH06274540A (ja) 1994-09-30

Family

ID=13105920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5059179A Withdrawn JPH06274540A (ja) 1993-03-19 1993-03-19 自然言語解析装置

Country Status (1)

Country Link
JP (1) JPH06274540A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000268042A (ja) * 1999-03-15 2000-09-29 Toshiba Corp 自然言語対話装置及び自然言語対話方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000268042A (ja) * 1999-03-15 2000-09-29 Toshiba Corp 自然言語対話装置及び自然言語対話方法

Similar Documents

Publication Publication Date Title
KR100446627B1 (ko) 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
CN109344231B (zh) 一种补全语义残缺的语料的方法及***
US20040204939A1 (en) Systems and methods for speaker change detection
JPH06282572A (ja) キーワード自動抽出装置
WO2020077825A1 (zh) 论坛社区应用管理方法、装置、设备及可读存储介质
JP2009042968A (ja) 情報選別システム、情報選別方法及び情報選別用プログラム
CN109800430B (zh) 一种语义理解方法及***
JPH1145274A (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4220151B2 (ja) 音声対話装置
JP3575242B2 (ja) キーワード抽出装置
JPH06274540A (ja) 自然言語解析装置
JP3350556B2 (ja) 検索システム
JP2809136B2 (ja) 自然言語対話装置
CN109446527B (zh) 一种无意义语料的分析方法及***
KR100452024B1 (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
KR100366703B1 (ko) 인간 반응형 음성인식장치
JPH0773200A (ja) キーワード抽出方法
JP2812511B2 (ja) キーワード抽出装置
JPH1173419A (ja) 電子文書の検索方法及び装置
JPH0736686A (ja) 影響検索装置
JP2006004283A (ja) テキスト情報源からのキーワード抽出・絞り込み方法およびシステム
JP3956730B2 (ja) 言語処理装置
JP2600081B2 (ja) 自然言語対話装置
JPH0520354A (ja) 日本語文章解析装置
JP3143906B2 (ja) 未知語の存在の判定装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000530