JP3322313B2 - 事象解析器 - Google Patents

事象解析器

Info

Publication number
JP3322313B2
JP3322313B2 JP26130691A JP26130691A JP3322313B2 JP 3322313 B2 JP3322313 B2 JP 3322313B2 JP 26130691 A JP26130691 A JP 26130691A JP 26130691 A JP26130691 A JP 26130691A JP 3322313 B2 JP3322313 B2 JP 3322313B2
Authority
JP
Japan
Prior art keywords
feature
event
list
input
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP26130691A
Other languages
English (en)
Other versions
JPH0573611A (ja
Inventor
博人 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP26130691A priority Critical patent/JP3322313B2/ja
Publication of JPH0573611A publication Critical patent/JPH0573611A/ja
Application granted granted Critical
Publication of JP3322313B2 publication Critical patent/JP3322313B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された文章からユ
ーザの希望する動作主体の活動に関する事象を抽出し、
さらに、その事象の構成を解析する事象解析器に関する
ものである。
【0002】
【従来の技術】従来の文章解析器(特願平3−3782
5号参照)では、入力された文章を、まず、図16のよ
うな形態素解析用辞書を用意して、図17のように文章
を分ち書きし、さらに、品詞、読み等を付与する処理を
行っている。この形態素解析では、自立語(品詞コード
でJRの語)と付属語(品詞コードでJS等)との接続
条件が規定されており、その接続条件を満たしている単
語列でなければならず、また、文章を分ち書きする際に
は、すべての単語が形態素解析用辞書に登録されていな
ければならないなどの条件がある。この段階で未登録語
が存在すると、後の構文解析等ができなくなってしま
う。
【0003】構文解析として代表的な係り受け解析で
は、図18のような係り受け解析用辞書を用いて、図1
7のように文節単位に分割された文節間の係り受けの関
係を解析する。なお、図18において、Dは動詞、1番
目のKは形容詞、Mは名詞、Sは終止形、Tは連体形、
Yは連用形、2番目のKは他の記号に付ついて仮定形を
示す記号である。したがって、例えばDSは動詞終止形
に係ることを意味し、DKは動詞仮定形、また、KSは
形容詞終止形に係ることを意味する。また、図19の
5),4)はそれぞれ5番目,4番目の文節に係る(修
飾)という意味の修飾関係を示す。図17の解析結果
は、図19のように各文節に係り先の文節番号が記述さ
れ、係り受け関係が陽に示される。図18の係り受け解
析用辞書は、文節未表現から、どのような文節に係るか
を判定するテーブルである。この構文解析も形態素解析
で適切な解が得られていないと適切な構文解析ができ
ず、また、係り受け解析用辞書もすべての係り受け関係
を網羅する辞書でなくてはならない。
【0004】意味解析としては、図20のような意味解
析用辞書を個々の動詞に対して持ち、各文節の役割を規
定する処理を行っている。意味解析では、まず、構文解
析結果の係り受け関係から動詞の係り受け関係がある文
節を抽出し、その文節が図20の意味解析用辞書と同じ
単語が記述されている場合、その単語が図20の左側に
記述されている役割を持つと判断する。この場合も、役
割になり得る単語は全ての単語を網羅していないと意味
解析することができない点が問題であった。
【0005】
【発明が解決しようとする課題】このように、従来の文
章解析で行われている形態素解析,構文解析,意味解析
では、それぞれ使用する辞書データの記述が完全でなけ
れば解析が途中で終了してしまうことが多かった。ま
た、解析に使用している辞書データにおける記述項目の
体系化が行われていなかった。
【0006】すなわち、いままで文章解析器で使用され
ていた形態素解析や係り受け解析を用いているため、正
確な辞書データを用意しなければ事象概念解析すること
ができなかった。また、形態素解析や係り受け解析は、
通常のCPUを用いた処理なため、CPUに負担がかか
り効率が悪かった。そして、解析した結果がどのような
ことを述べているのかが体系化されていなかった。
【0007】本発明は、上記問題点を解決するためにな
されたもので、解析器で用意する辞書データが小規模で
文章を解析でき、さらに、文章に記述されている事象に
ついて迅速、かつ的確に解析するのに適した事象解析器
を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明にかかる事象解析
器は、インデックス用の文字列である見出しと、その見
出しがもつ素性の名称を示す素性名、動作の主体を示す
動作主体、素性リストの適用条件を示す制約、修飾関係
を示す係属性の少なくとも5つの項目から形成される素
性リストからなる素性辞書を具備し、2つの入力パター
ンの比較を行うパターンマッチング器を具備し、前記パ
ターンマッチング器は、入力されたパターンを比較単位
となるパターン要素に分割するパターン抽出手段と、比
較される2つのパターン要素のいずれか一方が、いずれ
とも一致することを示す特殊記号であるときに、該特殊
信号と一致した文字列または値を出力する特殊パターン
処理手段と、特殊記号を含まない2つのパターン要素を
比較し一致するときは一致した文字列または値を出力
し、一致しないときは、文字列の比較であれば文字列を
結合し、値の比較であればエラーを出力するパターン比
較手段の3つの手段を備え、事象解析の対象となる文章
を入力し、該文章を形態素解析と係り受け解析により構
文解析を行う文章入力部と、ユーザからの入力を受け付
け、動作の主体を決定する動作主体決定部と、前記文章
入力部にて構文解析された文章の各単語について、素性
リストの見出しと一致したならば該当する素性リスト
付与する素性付与部と、単語に付与された素性リスト
に基づき、前記入力された文章が表す事象を前記パター
ンマッチング器により解析する事象解析部を備え、前記
事象解析部は、各単語に付与された素性リストの素性名
を利用して、予め決められた規則に基づき、文章を単一
事象単位に分割する単一事象検出手段と、前記単一事象
の文章に対して、名詞句の並列構文を解析し並列構文を
分解して個別の事象単位に文章を組み上げる個別事象生
成手段と、隣接する2つの素性リスト間で見出しを除い
た部分で素性リスト同士の比較を前記パターンマッチン
グ器にて行い、エラーでなければ見出しは比較された2
つの素性リストの見出しを連結したものであり、見出し
以外の項目はパターンマッチング器の出力となる新しい
素性リストを生成し、該素性リストの生成を繰り返すこ
とで素性リストを統合する素性リスト統合手段の3つの
手段を有するものである。
【0009】
【作用】本発明においては、文章を入力した後、その文
章をどの動作主体の活動について記述されているものか
を設定して処理を行う。その設定に基づき、解析に必要
な辞書データを準備する。そのため、解析に必要な単語
にしか素性を付与する必要がなく、すべての単語に素性
が付与されていなくても文章の解析ができるとともに、
文章の解析時における計算量、データ量、曖昧性を大幅
に減少させシステム効率を高めることができる。
【0010】
【実施例】以下、本発明の実施例について説明する。ま
ず、本発明にかかる事象解析器の全体構成について述べ
る。
【0011】図1は本発明の一実施例を示すブロック図
である。1は文章入力部で、外部から入力した文章を事
象解析器に適した入力形式に変更する。2は動作主体決
定部で、入力した文章をどの動作主体の活動に関して解
析するかを設定する。ここで、動作主体としては人工物
と自然とに大分類される。人工物では組織,加工品な
ど、組織では企業,自営,政府等がある。自然では生き
物,非生き物があり、さらに、生き物は人間,動物,植
物等がある。それらを適宜この動作主体決定部で決定す
る。3は素性付与部である。素性付与部3には素性辞書
と、入力された文字列に対して素性辞書中の素性を付与
する処理部がある。つまり、動作主体決定部2で設定し
た動作主体の解析に必要な素性についてのみ素性辞書か
ら抽出し、入力された文章の各単語に付与する。4は事
象解析部で、素性付与部3によって付与された素性情報
に基づき文章を組み立て、事象構造を解析する。
【0012】図2に本発明の事象解析器のシステム構成
ブロック図を示す。10はCRT(キャラクタディスプ
レー)、11はKB(キーボード)である。KB11に
よりユーザの入力を促し、その入力に対しての応答結果
をCRT10に表示する。20はCPU(中央演算装
置)、30はDISK(ディスク)、60はMT(マグ
ネティックテープ)、61はFD(フロッピーディス
ク)、62はCD−ROMである。MT60,FD6
1,CD−ROM62を用いて解析に必要な文章を入力
する。40はM(メモリ)で、CPU20によって使用
される。50はPM(パターンマッチング器)である。
【0013】図1と図2の対応を説明すると、文章入力
部1の処理は、まず、KB11,MT60,FD61,
CD−ROM62を用いて入力され、CRT10を用い
て入力確認が行われる。入力確認がされた後、入力文章
はM40に格納される。動作主体決定部2では、動作主
体の決定をKB11,確認をCRT10を用いて行う。
素性付与部3では、M40に格納されている素性辞書に
基づき、各単語に対して素性リストを付与する。事象解
析部4では、M40に格納された素性リストを基に、P
M50を用いて事象解析を行う。これにより事象解析計
算を高速に行う。
【0014】PM50の構成図を図3に示す。PM50
はパターン抽出器51と特殊パターン処理器52とパタ
ーン比較器53から構成されている。パターン抽出器5
1は、入力したパターンから比較すべきパターンを抽出
する。特殊パターン処理器52は、特殊パターンに対す
る処理を実現する。特殊パターンとしては、“ ”と先
頭文字が“ ”である文字列を扱う。“ ”のパターン
はどの文字列とも一致することを意味し、“ ”以外の
入力を出力Cに出す。先頭文字が“ ”である文字列の
場合も、どの文字列とも一致するが、入力の結果をM4
0上に蓄える。出力Cは“ ”付き文字列以外の入力と
なる。
【0015】図4に特殊パターン処理器52での処理の
例を示す。入力A“ ”,入力B“ ”の時、出力Cは
”となる。入力A“ ”、入力B“A”の時、出力
Cは“A”となる。入力A“ A”、入力B“Z”の場
合、出力Cは“Z”となるが、さらに、M40上に“
A”→“Z”が記憶される。パターン比較器53は、入
力される2つのビットパターンを直接ANDで比較し、
その結果を返す。パターンが一致している場合、一致し
たパターンを出力する。パターンが一致していない場
合、ERROR信号を出力する。つまり、PM50は2
入力で入力パターンを、まず、パターン抽出器51で比
較するパターンを抽出し、抽出したパターンを、まず、
特殊パターン処理器52に渡す。特殊パターン処理が終
了し、入力が両方とも特殊パターン以外であった場合、
パターン比較器52に通して比較を行う。2つの入力パ
ターンが一致している場合には、その結果が出力され、
一致しなかった場合には、ERROR信号が出力され
る。PM50によるパターンマッチングの処理例を図5
に示す。
【0016】図5の動作に付いて説明する。PM50へ
の入力は2入力で、パターン抽出器51により入力はそ
れぞれマッチング用のBOX(ボックス)に格納され
る。括弧“(”,“)”はそれぞれ1つのBOXに格納
され、他の文字はスペース毎に1つのBOXに収納され
る。BOXに収納される順序は左からである。次に、B
OXに収納された文字等の中で、特殊なパターン(“
”と“ ”付きの文字列)を特殊パターン処理器52で
処理する。例えば、2番目のBOXの中身はそれぞれ
“company ”と“ ”なので、特殊パターン処理器52
で処理され、“company ”という結果が出力される。特
殊パターン処理器52で処理されなかったBOXはパタ
ーン比較器53で処理される。1つ1つのBOXの内容
を比較して一致した場合、一致したパターンを出力す
る。例えば、1番目のBOXの内容は両方とも“(”な
ので、出力は“(”となる。このような処理を行うこと
により、入力A,Bの出力結果として(company (ag
ent ))が得られる。
【0017】図1に示す本発明の事象解析器の処理の流
れを図6に示す。この流れ図に従って、実施例を説明す
る。ステップ101は文書入力部1の処理である。ま
ず、ステップ101で文章を入力し、入力が全部終了し
た時点で次のステップ102に入力した全部の文字列を
渡す。ステップ102〜ステップ103は動作主体決定
部2の動作である。ユーザにどの動作主体に関して解析
するかを質問する。質問に対する解答がシステムの用意
している解答である場合には、その動作主体に対して処
理を行うと決定する。もし、ユーザの解答をシステムが
用意していない場合ステップ103に進み、システムが
用意している動作主体のリストを出力し、メニュー形成
で最適な動作主体を決定させる。
【0018】ステップ104からステップ105は素性
付与部3の動作である。ステップ104では、解析する
ときの動作主体を決定した後、その動作主体の活動を解
析するために使用する素性辞書をシステム上に搭載す
る。ステップ105では、ステップ104で用意した素
性辞書に記載されている辞書見出しと、ステップ101
で入力した文字列との比較を行い、一致した文字列があ
る場合、その素性を当該文字列に付与する。素性辞書の
記述形式は以下のとおりで、各文字列に対して以下のよ
うなリストが付与される(ここで、このようなリストを
素性リストと呼ぶ)。
【0019】(<見出し><素性名><動作主体><制
約><係属性>) <見出し>とは、上記素性辞書のインデックス用文字列
のことである。 <素性名>とは、素性の名称である。現実世界に存在す
る動作主体の場合、それに必要な基本的な素性は、図7
に示した6素性(individual,element,thing,action,tim
e,location) である。つまり、基本的な素性としては、
動作主体(individual)、動作主体の動作を実現する要素
(element) 、動作主体間の間で交換される個体(thing)
、動作主体が行う動作(action)、その動作が行われた
時間(time)、その動作が行われた場所(location)の6つ
の基本的な素性で現実世界の動作主体の動作における基
本要素を決定することができる。ただし、これは基本要
素であるという意味で、実際適当な動作主体の動作を記
述しようとした場合、実際に必要な素性の集合(素性の
実態)が必要となる。例えば、動作主体を企業という知
的固体の集合とすると、基本的な素性に対応する素性の
実態は図8のようになる。 <動作主体>とは、先の動作主体決定部2で設定した動
作主体である。つまり、このリストの内容がどの動作主
体に関して解析する場合、利用されるかが記述される。
どの動作主体でも、このリストの内容が適用できる場
合、“ ”が記述され、ある特定の動作主体の活動の場
合、動作主体が記述される。例えば、company、animale、
man 等である。 <制約>とは、このリストの内容がどのような構文構造
において有効であるかを示す。つまり、ある特定の構文
構造において、この素性リストが有効である場合、その
構文構造が明記される。また、どのような構文において
も適用される場合、“ ”が記述される。 <係属性>とは、構文構造を決定する属性情報が記述さ
れている。この係属性が“ ”の場合、次の文字列に係
る、すなわち修飾することができる。それ以外は、acti
onに対して係っている、すなわちactionの語を修飾して
いると判断する。
【0020】この素性辞書から各文字列に対して素性が
付与される。この場合、まだ構文が形成されていないの
で、<制約>の判断は行われない。図9に素性辞書の例
を示す。また、入力に対して素性が付与された例を図1
0に示す。
【0021】ステップ106以降では入力された文章を
事象解析を行う。事象解析では、入力された文章を事象
に適した形に直す処理を行う。事象と入力された文章と
の違いは、事象は現実世界に起きる(た)事実の単位で
あるのに対して、文章は人間の紙面上に記述した場合の
単位であるため、人間が理解しやすいように記述され構
成されている。ここでは、その人間が理解しやすいよう
に記述された文章を事象形式に変換する。事象への変換
では、まず、ステップ106で事象を分割し、ステップ
107で並列構文に対して事象の生成を行う。ステップ
106では事象の分割を行う。これは入力された文章を
1個の事象単位に分割するステップで、素性としてacti
onが付与された文字列を利用して分割が行われる。分割
の規則は以下のとおりである。 <action>+{<平仮名>+<modality>}*+<平仮
名>|<句読点> <action>=actionという素性を持つ文字列 <平仮名>=平仮名文字列 <句読点>=文字通り“、”と“。” ただし、*はその前の{}中括弧で囲んだ要素が0個以
上連続することを示している。ここで、0個以上連続と
は{}内のパターンが連続して出現することがあるが、
その連続して出現する場合の連続回数がいくつでも良い
ことを示す。特に、0個の場合は、そのパターンが省略
されていることを示す。また、|はその前後のどちらか
が出現することを示す。
【0022】このパターンに一致する文字列があった場
合、そこまでを1事象として扱う。図11に事象分割の
例を示す。
【0023】ステップ107では、事象分割後、事象で
使われている名詞句の並列構文を解析し、必要な限り事
象を生成する。例えば図11の<事象0>では<〜や〜
>型の並列構文が使われているので、この部分<〜や〜
>型の並列構文を分解して新たに事象が生成される。図
12に新たに生成された事象群の例を示す。
【0024】ステップ108では、完全に単一事象単位
に分割・生成された事象を解析する。まず、素性リスト
における<係属性>を文構造に応じて付与する。<係属
性>は文頭から1からの整数が付与されていく。文字列
として、“が”,“を”,“に”,“は”,“から”,
“まで”,“より”,“と”がきた場合と、action素性
を持つ文字列がきた場合インクリメントされ、次の素性
リストからインクリメントされた数字が付与される。次
に、各文字に付与された素性リストを統合して新たな素
性リストを作成する。つまり、各文字を素性付きの文字
として扱うのではなく、事象を表す要素として扱える単
位にする。これは、以下の規則に則り行われる。 {<素性なし文字列>}*+{<素性つき文字列>}*
+{<素性なし文字列>}* ここで、<素性つき文字列>とは、文字列に対して素性
が付与されている場合を意味する。<素性なし文字列>
とは、文字列に対して素性が全く付与されていないか、
素性の欄が“ ”であるかの2通りである。
【0025】ただし、このような文字列の統合が行われ
る場合の条件として、各文字列に付与されている素性リ
ストが一致しなければならない。そのため、その素性リ
ストが一致しないときは、そのままの状態を維持する。
素性リストが一致しているかどうかは、PM50を使用
して判定される。入力として素性リストの第2項目以降
のリストを2つ渡す。つまり、以下のようなリストがP
M50に渡される。 (<素性名><動作主体><制約><係属性>) リストのマッチングが成功したら新たな素性リストを作
成し、さらに、統合された素性リストと次の素性リスト
とのマッチングを続け、PM50からERRORの信号
が出力されたら、その時点までの素性リストの統合結果
を出力し、別のリストのマッチングを行う。
【0026】素性リストの統合は、PM50から出力さ
れる出力Cの結果を出力し、さらに、2つの素性リスト
の見出しをアペンドした文字列を統合した結果を出力す
る。つまり、 素性リストA (<見出し1><素性名1><動作主体1><制約1>
<係属性1>) 素性リストB (<見出し2><素性名2><動作主体2><制約2>
<係属性2>) とすると、PM50に対する入力A,Bは、 入力A (<素性名1><動作主体1><制約1><係属性1
>) 入力B (<素性名2><動作主体2><制約2><係属性2
>) その結果の出力が出力Cだとすると、 出力C (<素性名3><動作主体3><制約3><係属性3
>) 最終的に得られる統合された素性リストは、 (<見出し1+見出し2><素性名3><動作主体3>
<制約3><係属性3>) となる。(<見出し1+見出し2>は<見出し1>と<
見出し2>をアペンドした結果を表わす。
【0027】図13の例を使ってさらに説明する。入力
文は、まずステップ107までの処理を通り、事象単位
に分割されているとする。その下に、各文字列に対して
付与されている素性リストを示す。ここでは“自動車
用”や“新”という言葉の素性が全く記述されず、文字
列のみが素性リストに記述される。これは“自動車用”
や“新”という文字列が素性の基本要素ではないことを
示している。上記規則に従って処理を素性の統合、つま
り2つの素性リストをPM50によるパターンマッチン
グ処理により1つの素性リストの出力を得る処理を行う
と、“A社”と“は”は統合され、“A社は”という文
字列となる。同様に、“今年”“10月”“に”−>は
“今年10月に”、“自動車用”“の”“新”“ライ
ン”−>は“自動車用の新ライン”というようになる。
そして、PM50でのリストの統合結果に統合された文
字列を付与した新しい素性リストを付与される。例えば
“A社”の素性リストは(“A社”company 1)
であり、“は”の素性リストは(“は”
1)である。その場合、第1項目は文字列であるので、
両方の文字列をアペンドした文字列が出力される。第2
項目以降はPM50に入力として送られ、マッチング結
果を得る。第2項目のcompany と は一致し、一致した
結果、第1項はcompany となる。第3,4項は両方とも
なので、一致、結果も 、第5項は両方とも1なので
一致、結果も1となる。 すべての素性の統合が終了した時点で、制約を満足して
いるかどうかが調べられる。制約も統合と同じPM50
により実現される。統合時には文字列と制約を満足して
いない場合、統合された素性リストはその文字列に対し
て付与されなくなる。制約を満足した場合、統合された
素性リストが最終的にその文字列に対して付与されるこ
とになる。素性リストの<制約>の箇所が“ ”の場
合、どのような構文的条件においても当該素性リストが
有効であることを示すが、“ ”以外の記号の場合、素
性リストを全部結合されたリストと<制約>とのマッチ
ングを検査する。該リストの中の素性リストを一個づつ
取り出し、PM50の入力Aに入れる。同時に、<制約
>に記述されているリスト中からもリストを1個ずつ取
り出し、PM50の入力Bに入れ、パターンマッチング
を行う。このとき、全部のリストのマッチングが成功し
た場合、制約を満足すると判断する。1個でもマッチン
グが成功しなかった場合、制約を満足しないという判断
がされる。
【0028】通常のactionの素性を持つ単語は、この<
制約>中に格解析と同様な事象における格の条件が記述
されている。ここでは、事象が表わしている格として、
図14に示すように、6基本格(agent,object,from,to,
time,location)と6準基本格(agent/const,object/cons
t,from/const,to/const,time/const,location/const)の
計12の格を使用する。事象解析では、最終的には文で
表現されている事象がどのような格で表現されているか
を出力する。この場合、actionの<制約>の中で、12
格は“ ”付きの文字として記述され、M(メモリ)中
に対応する文字列が処理結果として登録される。図14
の例文で解析される例を説明する。
【0029】action素性を持つ文字列“建設する”の制
約には以下のリストが記述されている。 (( agent company ) ( time time ) ( object company element ) ( action action ) ( modality )) 一方、図14の結果は以下のようなリストである。 ((“A社は” company 1) (“今年10月に” time 2) (“自動車用の新ラインを” company element 3) (“建設する” action (( agent company ) ( time time ) ( object company element ) ( action action ) ( modality )) 4) (“予定” modality 5)) まず、それぞれのリストから先頭のリストを取得する。
上記の例では、最初のリストは、それぞれ 入力A:( agent company ) 入力B:(“A社は” company 1) である。PM50の出力Cは、 出力C:(“A社は” company 1) というリストであるが、 agent という文字列があるの
で、M40には agent →“A社” という結果が記録される。
【0030】第2番目のリストは、それぞれ 入力A:( time time ) 入力B:(“今年10月に” time 2) である。PM50の出力Cは、 出力C:(“今年10月に” time 2) というリストであるが、最初のリストと同様に timeと
いう“ ”付きの文字列があるので、M40には、 time→“今年10月に” という結果が記録される。
【0031】同様にすべてのリストに対して行うと、M
40は図15のような状態になる。これは、この文はag
ent は“A社は”で、timeは“今年10月に”。object
は“自動車用の新ラインを”、そして、事象のactionは
“建設する”であることを意味する。このようにして、
事象の格関係を解析するのが本発明の事象解析器であ
る。
【0032】
【発明の効果】以上説明したように、本発明は、インデ
ックス用の文字列である見出しと、その見出しがもつ素
性の名称を示す素性名、動作の主体を示す動作主体、素
性リストの適用条件を示す制約、修飾関係を示す係属性
の少なくとも5つの項目から形成される素性リストから
なる素性辞書を具備し、2つの入力パターンの比較を行
うパターンマッチング器を具備し、前記パターンマッチ
ング器は、入力されたパターンを比較単位となるパター
ン要素に分割するパターン抽出手段と、比較される2つ
のパターン要素のいずれか一方が、いずれとも一致する
ことを示す特殊記号であるときに、該特殊信号と一致し
た文字列または値を出力する特殊パターン処理手段と、
特殊記号を含まない2つのパターン要素を比較し一致す
るときは一致した文字列または値を出力し、一致しない
ときは、文字列の比較であれば文字列を結合し、値の比
較であればエラーを出力するパターン比較手段の3つの
手段を備え、事象解析の対象となる文章を入力し、該文
章を形態素解析と係り受け解析により構文解析を行う
章入力部と、ユーザからの入力を受け付け、動作の主体
を決定する動作主体決定部と、前記文章入力部にて構文
解析された文章の各単語について、素性リストの見出し
と一致したならば該当する素性リストを付与する素性付
与部と、単語に付与された素性リストに基づき、前記
入力された文章が表す事象を前記パターンマッチング器
により解析する事象解析部を備え、前記事象解析部は、
各単語に付与された素性リストの素性名を利用して、予
め決められた規則に基づき、文章を単一事象単位に分割
する単一事象検出手段と、前記単一事象の文章に対し
て、名詞句の並列構文を解析し並列構文を分解して個別
の事象単位に文章を組み上げる個別事象生成手段と、隣
接する2つの素性リスト間で見出しを除いた部分で素性
リスト同士の比較を前記パターンマッチング器にて行
い、エラーでなければ見出しは比較された2つの素性リ
ストの見出しを連結したものであり、見出し以外の項目
はパターンマッチング器の出力となる新しい素性リスト
を生成し、該素性リストの生成を繰り返すことで素性リ
ストを統合する素性リスト統合手段の3つの手段を有す
ので、コード情報で入力された文章を事象について解
析する際、パターンマッチング器を利用して、簡易に、
かつ高速に解析することができる。そして、処理には事
象の動作主体に関する事象情報しか必要とせず、辞書記
述量で計算量も少ないので、小さいシステムで構成可能
である。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】本発明による事象解析器のシステム構成例を示
すブロック図である。
【図3】本発明で用いるパターンマッチング器の構成例
を示すブロック図である。
【図4】本発明で用いる特殊パターン処理器の処理例を
示す図である。
【図5】本発明で用いるパターンマッチング器の処理例
を示す図である。
【図6】図1の実施例の処理の流れを示すフローであ
る。
【図7】本発明における素性の基本モデル図である。
【図8】本発明における企業活動における素性の基本モ
デルの例を示す図である。
【図9】本発明で用いる素性辞書一例を示す図である。
【図10】本発明における素性を付与した例を示す図で
ある。
【図11】本発明における事象を分割する例を示す図で
ある。
【図12】本発明における新たに生成された事象の例を
示す図である。
【図13】本発明における素性リストを統合する例を示
す図である。
【図14】本発明で用いる事象における6基本格と6準
基本格を示す図である。
【図15】本発明による事象解析結果におけるメモリの
状態図である。
【図16】従来の形態素解析用辞書例を示す図である。
【図17】従来の形態素解析の例を示す図である。
【図18】従来の係り受け解析用辞書例を示す図であ
る。
【図19】従来の係り受け解析の例を示す図である。
【図20】従来の意味解析用辞書例を示す図である。
【符号の説明】
1 文章入力部 2 動作主体決定部 3 素性付与部 4 事象解析部 10 CRT(キャラクタディスプレー) 11 KB(キーボード) 20 CPU(中央処理装置) 30 DISK(ディスク) 40 M(メモリ) 50 PM(パターンマッチング器) 51 パターン抽出器 52 特殊パターン処理器 53 パターン比較器 60 MT(マグネティックテープ) 61 FD(フロッピーディスク) 62 CD−ROM
フロントページの続き (56)参考文献 稲垣博人,電子情報通信学会技術研究 報告NLC−91−9,「事象解析による 要約情報の抽出」,1991年 7月18日, Vol.91,No.149,p.17−p. 24 稲垣博人 他,「簡易文章構造解析に よる文構造の決定」,第42回(平成3年 前期)全国大会講演論文集(3),日 本,情報処理学会,1991年 2月25日, 3−104〜105 稲垣博人 他,「事象解析に基づく要 約情報抽出方法の提案」,第42回(平成 3年前期)全国大会講演論文集(3), 日本,情報処理学会,1991年 2月25 日,3−57〜58 稲垣博人 他,「情報、処理の部分性 を考慮した文章解析の実現」,第43回 (平成3年後期)全国大会講演論文集 (3),日本,情報処理学会,1991年 9月24日,3−257〜258 (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 インデックス用の文字列である見出し
    と、その見出しがもつ素性の名称を示す素性名、動作の
    主体を示す動作主体、素性リストの適用条件を示す制
    約、修飾関係を示す係属性の少なくとも5つの項目から
    形成される素性リストからなる素性辞書を具備し、 2つの入力パターンの比較を行うパターンマッチング器
    を具備し、 前記パターンマッチング器は、入力されたパターンを比
    較単位となるパターン要素に分割するパターン抽出手段
    と、 比較される2つのパターン要素のいずれか一方が、いず
    れとも一致することを示す特殊記号であるときに、該特
    殊信号と一致した文字列または値を出力する特殊パター
    ン処理手段と、 特殊記号を含まない2つのパターン要素を比較し一致す
    るときは一致した文字列または値を出力し、一致しない
    ときは、文字列の比較であれば文字列を結合し、値の比
    較であればエラーを出力するパターン比較手段の3つの
    手段を備え、 事象解析の対象となる 文章を入力し、該文章を形態素解
    析と係り受け解析により構文解析を行う文章入力部と、ユーザからの入力を受け付け、 動作の主体を決定する動
    作主体決定部と、前記文章入力部にて構文解析された文章の各単語につい
    て、素性リストの見出しと一致したならば該当する 素性
    リストを付与する素性付与部と、 単語に付与された素性リストに基づき、前記入力され
    た文章が表す事象を前記パターンマッチング器により解
    析する事象解析部を備え、前記事象解析部は、各単語に付与された素性リストの素
    性名を利用して、予め決められた規則に基づき、文章を
    単一事象単位に分割する単一事象検出手段と、 前記単一事象の文章に対して、名詞句の並列構文を解析
    し並列構文を分解して個別の事象単位に文章を組み上げ
    る個別事象生成手段と、 隣接する2つの素性リスト間で見出しを除いた部分で素
    性リスト同士の比較を前記パターンマッチング器にて行
    い、エラーでなければ見出しは比較された2つの素性リ
    ストの見出しを連結したものであり、見出し以外の項目
    はパターンマッチング器の出力となる新しい素性リスト
    を生成し、該素性リストの生成を繰り返 すことで素性リ
    ストを統合する素性リスト統合手段の3つの手段を有す
    ことを特徴とする事象解析器。
JP26130691A 1991-09-13 1991-09-13 事象解析器 Expired - Lifetime JP3322313B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26130691A JP3322313B2 (ja) 1991-09-13 1991-09-13 事象解析器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26130691A JP3322313B2 (ja) 1991-09-13 1991-09-13 事象解析器

Publications (2)

Publication Number Publication Date
JPH0573611A JPH0573611A (ja) 1993-03-26
JP3322313B2 true JP3322313B2 (ja) 2002-09-09

Family

ID=17359961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26130691A Expired - Lifetime JP3322313B2 (ja) 1991-09-13 1991-09-13 事象解析器

Country Status (1)

Country Link
JP (1) JP3322313B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1558957B1 (en) 2002-11-06 2010-04-21 Sumitomo Electric Industries, Ltd. Optical fiber ribbon and optical fiber cable using the same
CN112507700A (zh) * 2020-11-26 2021-03-16 北京百度网讯科技有限公司 事件抽取方法、装置、电子设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
稲垣博人 他,「事象解析に基づく要約情報抽出方法の提案」,第42回(平成3年前期)全国大会講演論文集(3),日本,情報処理学会,1991年 2月25日,3−57〜58
稲垣博人 他,「情報、処理の部分性を考慮した文章解析の実現」,第43回(平成3年後期)全国大会講演論文集(3),日本,情報処理学会,1991年 9月24日,3−257〜258
稲垣博人 他,「簡易文章構造解析による文構造の決定」,第42回(平成3年前期)全国大会講演論文集(3),日本,情報処理学会,1991年 2月25日,3−104〜105
稲垣博人,電子情報通信学会技術研究報告NLC−91−9,「事象解析による要約情報の抽出」,1991年 7月18日,Vol.91,No.149,p.17−p.24

Also Published As

Publication number Publication date
JPH0573611A (ja) 1993-03-26

Similar Documents

Publication Publication Date Title
US4864502A (en) Sentence analyzer
JP3571408B2 (ja) 文書加工方法および装置
US6338034B2 (en) Method, apparatus, and computer program product for generating a summary of a document based on common expressions appearing in the document
JPH02165378A (ja) 機械翻訳システム
Kak The Paninian approach to natural language processing
Sharipov et al. Uzbekstemmer: Development of a rule-based stemming algorithm for uzbek language
JP3322313B2 (ja) 事象解析器
US20040133579A1 (en) Language neutral syntactic representation of text
JPS6318458A (ja) 感情情報抽出装置
Seresangtakul et al. Thai-Isarn dialect parallel corpus construction for machine translation
JPH0682376B2 (ja) 感情情報抽出装置
Boonpa et al. Relationship extraction from Thai children's tales for generating illustration
Lyon et al. Reducing the Complexity of Parsing by a Method of Decomposition.
Tsai et al. Auto-Generation of NVEF knowledge in Chinese
JP3339006B2 (ja) 機械翻訳装置における並列名詞句処理装置
JPS61221874A (ja) 自然言語のデ−タベ−ス化方式
Jenkins et al. Automated message understanding—a real-world prototype
Faleńska Ensemble dependency parsing across languages: methodological perspectives
Wee et al. Textual information extraction in the face of information deluge
JP2023150605A (ja) 情報処理装置及び情報処理方法
JP2001125898A (ja) 言語解析処理の方法、システム
CN115099217A (zh) 面向电网技术标准的依存关系评价方法、***、存储器及设备
JP2713353B2 (ja) 知識抽出装置
JPS62209659A (ja) 日本語文章校正装置
JPS63106867A (ja) 言語解析装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090628

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090628

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100628

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100628

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110628

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120628

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120628

Year of fee payment: 10