JP4005343B2 - 情報検索システム - Google Patents

情報検索システム Download PDF

Info

Publication number
JP4005343B2
JP4005343B2 JP2001369754A JP2001369754A JP4005343B2 JP 4005343 B2 JP4005343 B2 JP 4005343B2 JP 2001369754 A JP2001369754 A JP 2001369754A JP 2001369754 A JP2001369754 A JP 2001369754A JP 4005343 B2 JP4005343 B2 JP 4005343B2
Authority
JP
Japan
Prior art keywords
information
data
sentence
information unit
subtree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001369754A
Other languages
English (en)
Other versions
JP2003167898A (ja
Inventor
貞治 高井
隆光 石岡
Original Assignee
東京ソフト株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 東京ソフト株式会社 filed Critical 東京ソフト株式会社
Priority to JP2001369754A priority Critical patent/JP4005343B2/ja
Publication of JP2003167898A publication Critical patent/JP2003167898A/ja
Application granted granted Critical
Publication of JP4005343B2 publication Critical patent/JP4005343B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、入力した文章の構文を解析して、その文章に対応する情報を検索したり、または前記情報に関連する回答文や確認文などを抽出する情報検索システムに関する。
【0002】
【従来の技術】
例えば、インターネット上においてデータベースから情報を検索するとき、または、コンピュータ内で蓄積されたデータベースから情報を検索するときには、検索を指示するために入力された入力文章の単語を解読し、この単語を検索単位として、この単語が含まれている情報が前記データベースから検索されるのが一般的である。
【0003】
しかし、単語を単位とした情報検索では、検索結果となる情報の数が膨大になったり、または実際に検索しようとする情報と異なる情報が検索されることになって、必要とする情報を迅速に且つ正確に検索することが困難である。
【0004】
また、これはインターネットなどを通じて、所定の質問文や注文文などを入力し、サーバーにおいて前記質問文や注文文に対応する回答文や確認文を抽出する場合においても同様に迅速で且つ正確な回答を行うのが難しい。
【0005】
また、入力した文章に基づいて情報を検索するいわゆるデータマイニングの手法として、例えば特開2001−134575号公報には、入力される文章を単語に分割して、単語間の係り受け構造を解析した構文木を形成し、この構文木に基づいて、同じ構文木を含む情報をデータベースから迅速に検索するシステムが説明されている。
【0006】
【発明が解決しようとする課題】
前記特開2001−134575号公報に記載の構文木構造は、例えば「私は会社に行く。」という文章に対して「私→行く」「会社→行く」のような構文木を構築しているものであるため、データベースから同種の文章を迅速に検索できるようになる。
【0007】
しかし、実際の日本語の文章は、肯定と否定の表現が様々であり、また話者の意図についても多種多様な表現が用いられる。例えば「本体の交換」を主題とする文章は「本体を交換してください」「本体を交換してほしい」「本体を交換してほしくない」などきわめて微妙な言い回しが行われることが多い。
【0008】
したがって、入力された文章を形態素解析し、この解析により抽出された単語を中心とした単純な構文木データを構築するだけでは、入力された文章が持つ意味を的確に分析したことにならず、データベースからの情報の検索精度を高くするのに限界がある。
【0009】
また、インターネットを介してサーバーへ所定の質問文や注文文を送信し、その質問文や注文文を解析してその回答文や確認文などを検索するシステムにおいては、同じ内容の質問や同じ内容の注文事項であっても様々な表現の文章で入力されることが多い。そのため、個々の質問文や注文文をカテゴリー別に正確に分類するのが難しく、よって回答文や確認文などをデータベースから正確に検索するのが難しい。
【0010】
本発明は上記従来の課題を解決するものであり、データベースから情報を検索する際、または質問文や注文文などをカテゴリー別に分類する際に、正確な検索ができる情報検索システムを提供することを目的としている。
【0011】
【課題を解決するための手段】
本発明は、a)入力された文章データに辞書のデータベースを適用して、前記文章データを単語と品詞属性とに解析して形態素解析データを生成する手段
(b)前記形態素解析データに基づいて、前記単語を少なくとも1つ含む文節を解読するとともに、文節間の係り受け関係を解析する手段と、
(c)係り受け関係にある複数の文節およびこの文節ごとの述語属性と、さらに前記文節間の関係属性を付加した部分木データを生成し、さらに関係のある複数の前記部分木からなる構文木を構築して構文木データを生成する手段
(d)前記部分木データおよび前記構文木データに基づいて、抽出すべき情報が格納されたデータベースから、前記構文木データと一致する構文を含む情報、または前記構文木データに類似した構文を含む情報を抽出する手段と、
を有し、
入力された文章をS、入力された文章S内の部分木データをTi(i=1,2,3,…n)とし、被検索対象のデータベースに含まれる情報単位をCj(j=1,2,3,…m)、前記情報単位Cjが複数集まった集合をMとしたときに、
前記(d)の情報を抽出する手段が以下の手段を含むことを特徴とする情報検索システムである。
(d1)それぞれの前記情報単位Cjについて、その情報単位Cjに属する全ての部分木の数に対する、前記部分木データTiが出現する回数の比を、前記情報単位CjにおけるTiの出現確率P(j)として演算する、
(d2)前記集合Mに属する全ての部分木の数に対する、前記部分木データTiが出現する回数の比を、集合MにおけるTiの出現確率Pt(i)として演算する、
(d3)前記出現確率の比{P(j)/Pt(i)}を、情報単位Cjにおける前記部分木データTiの特異度Ps(i)とする、
(d4) 文章S内の各部分木Tiについて演算された前記特異度Ps(i)から、各情報単位Cjの尤度Pst=Σ{Ps(i)}(i=1からi=nまでの累積加算値)を求め、前記尤度Pstが所定値以上の前記情報単位Cjを検索結果とする。
【0015】
例えば、前記情報単位Cjは、同種のカテゴリーの文章の集まりであり、前記情報単位Cjが検索結果とされたときに、この情報単位Cjのカテゴリーに対する対応文がデータベースから選択されるものである。
【0016】
ただし、前記情報単位が、インターネットを介して入力された文章を含む情報などであり、文章の入力によって情報検索が行われるものであってもよい。
【0017】
【発明の実施の形態】
図1は本発明の実施の形態の情報検索システムを示す構成図、図2は入力された文章の解析手法を示す説明図、図3は情報検索の手法を示す説明図、図4は本発明の情報検索の応用範囲を示す説明図である。
【0018】
図1に示すように、この情報検索システム1は、インターネット経由でデータの授受を行うことができるシステム本体2を有している。このシステム本体2は、インターネット経由で文章データSを受け入れる読み込みインターフェース3および、前記文章データSを格納するテキストデータベース10を有している。
【0019】
またシステム本体2は情報処理部8を有している。この情報処理部8は、テキストデータベース10に格納されている前記文章データSに対して、形態素解析4、構文解析5、構文木データの生成6および検索のための演算処理7などの各種処理を行うCPUを主体として構成されている。
【0020】
被検索対象となる情報は抽出情報データベース9に格納されている。前記情報処理部8では、前記抽出情報データベース9にアクセスするとともに、後に説明する規則に基づいて演算処理7が行われて、前記抽出情報データベース9から検索データ23を抽出できるようになっている。
【0021】
前記システム本体2には、データの記憶部が設けられている。この記憶部には、基本語辞書11のデータ、ユーザ辞書12のデータ、構文解析5を行う際の解析ルール13のデータ、類語辞書14のデータ、さらに述語属性と関係属性を解析するための解析ルール15を定めたデータなどが記憶されている。
【0022】
検索者の端末からインターネット経由により検索指示を意味する文章データSが与えられ、この文章データSがインターフェース3を介してテキストデータベース10に格納される。このテキストデータベース10から読み出された文章データSが情報処理部8に与えられると、情報処理部8において、形態素解析4および構文解析5が行われ、さらに属性ルール15に基づいて述語属性と関係属性が付与されて構文木データ22が生成される。この構文木データ22と前記抽出情報データベース9に格納されたデータ(情報単位Cj)とから演算処理7が行われて検索データ23が抽出される。
【0023】
この情報検索システム1が、データベースからのデータの抽出システムとして使用されるときには、前記演算処理7に基づいて前記抽出情報データベース9から抽出された検索データ23が、インターフェースを介してインターネット経由にて検索者の端末に送り出される。そして検索者の端末のディスプレイで、前記検索データ23の内容を確認することができる。
【0024】
ただし、図1に示す実施の形態では、検索者の端末から入力される文章データSが質問文または注文文などの場合を一例として示している。情報処理部8では、前記質問文や注文文などが解析され、さらに演算処理7されて、その質問や注文などの内容が抽出情報データベース9に格納されたデータ群のどのカテゴリーに属するかが検索される。そして、その検索結果、すなわち前記質問や注文が抽出情報データベース9に格納されたデータ群のどのカテゴリーに属するかを意味するデータが検索データ23として得られる。さらに、この検索データ23が検索モジュール24に送られ、検索モジュール24では、前記質問や注文のカテゴリーに対応する回答文や確認文などが検索され、この回答文や確認文などが出力インターフェース25を介して前記検索者の端末に送り出されるようになっている。
【0025】
以下においては、前記情報検索システム1に対して前記質問文や注文文の文章データSが与えられたときに、前記検索データ23が得られるまでの処理動作を、図2および図3を用いて詳しく説明する。ただし、前述のように、本発明の情報検索システム1は、前記のような質問などの解析と回答などの検索を行うものに限られず、抽出情報データベース9から情報を検索し、その検索データを検索者に与えられるシステムとして使用する場合においても、以下と同様の処理動作を実行するものとして使用できる。
【0026】
図2では、検索者の端末からインターネット経由でシステム本体2に与えられた文章データSが注文文である場合を一例として示している。
【0027】
情報処理部8では、テキストデータベース10に格納された前記文章データSを読み出して、文章データS内に含まれる文末記号にしたがって、単文ごとに分割する。この実施の形態では、前記単文Saが「修理してもプリンターの紙詰まりが直らないので、本体を交換してもらえませんか?」である。
【0028】
前記単文Saは、情報処理部8に設定される形態素解析エンジンに取り込まれ、基本語辞書11およびユーザ辞書12に基づいて形態素解析4が行われる。なお、前記ユーザ辞書12は、システム本体2を管理する管理者において構築されるものである。図2に示す枠内は、前記単文Saを形態素解析4した解析データ31を示している。
【0029】
形態素解析4では、前記単文Saを構成している「修理」「直」「交換」「プリンター」「紙」「詰まり」「本体」などの「自立語」、および、「し」「て」「も」「の」などの「付属語」の単語綴りや、それぞれの品詞属性、すなわち「名詞」「動詞」「動詞活用語尾」「動詞接尾辞」「連用助詞」「格助詞」などの属性が解析される。
【0030】
さらに、前記形態素解析4された解析データ31に対し、解析ルール13に基づく構文解析5が行われる。
【0031】
この構文解析5では、形態素解析4により解析された「自立語」および「付属語」とから文節をまとめる。図2の例では、前記文節は「交換してもらえませんか」「本体を」「直らないので」などである。さらに前記文節間の係り受け関係を解析して、係り受け関係の文節からなる木構造をまとめる。図2の例での木構造T1´,T2´,T3´,T4´,T5´は、「本体を交換してもらえませんか」「直らないので交換してもらえませんか」「修理しても直らないので」「紙詰まりが直らないので」「プリンターの紙詰まりが」である。
【0032】
次に、係り受け関係の単位である前記木構造T1´,T2´,T3´,T4´,T5´の単語を標準形に置き換える。このとき類語については、類語辞書14を参照して、必要に応じて代表語に変換する。標準形の単語を用いた係り受け関係が部分木となり、標準形の部分木T1は「本体+交換する」、部分木T2は「治る+交換する」、部分木T3は「紙詰まり+治る」、部分木T4は「修理する+治る」、部分木T5は「プリンター+紙詰まり」である。
【0033】
さらに、それぞれの前記部分木Tiに対して、属性ルール15にしたがって属性解析を行い、それぞれの文節に述語属性が付加され、さらに文節間の関係属性が付与されて、対を成す文節および前記述語属性および関係属性とから成る部分木Tiの集合である構文木データ22が形成される。
【0034】
前記構文木データ22での部分木T1は、「本体」の単語を含む文節と、「交換」の単語を含む文節「交換する」とが対を成し、前記「交換する」の文節に意思を意味する述語属性「int」が付与され、さらに関係属性として「意図」が付与されたものとなる。
【0035】
部分木T2は、代表語に変換された「治」の単語を含む文節「治る」と、「交換」の単語を含む文節「交換する」とが対を成し、「治る」の文節に否定を意味する述語属性の「neg」が付与され、前記「交換する」の文節に述語属性の「int」(意思)が付加され、さらに関係属性として「理由」が付与されたものとなる。
【0036】
部分木T3は、「紙」の単語と「詰まり」の単語を有する文節「紙詰まり」と、「治」の単語を含む文節「治る」とが対を成し、「治る」の文節に否定を意味する述語属性の「neg」が付与され、さらに関係属性として「現象」が付与されたものとなる。
【0037】
また、部分木T4は関係属性が「状況」であり、部分木T5は関係属性が「限定」である。
【0038】
図1に示す情報検索システム1では、前記構文木データ22と抽出情報データベース9内のデータとから演算を行って、前記単文Saで述べられている意味が、抽出情報データベース9に格納された複数の情報単位のどれに該当する確率が高いかの演算が行われる。
【0039】
すなわち、入力された文章データSの単文Saが図2に示すような「修理してもプリンターの紙詰まりが直らないので、本体を交換してもらえませんか?」の質問文または注文文などの場合には、抽出情報データベース9に、同じカテゴリーの質問文または注文文が含まれた情報単位Cj(j=1,2,3…,m)が複数単位格納されている。
【0040】
ひとつの情報単位Cjには、同種の質問または注文の標準文例が複数例含まれている。そして図1に示す情報検索システム1では、図2に示す単文Sa「修理してもプリンターの紙詰まりが直らないので、本体を交換してもらえませんか?」の意味する内容のカテゴリーがどの情報単位Cjに相当するかが、演算処理7によって求められる。この演算処理7は、情報処理部8のCPUなどにより実行される。
【0041】
まず、それぞれの情報単位Cj内での部分木T1の出現確率P(j)を演算する。これは、それぞれの前記情報単位Cj(C1,C2,C3,…,Cm)ごとに演算される。前記出現確率P(j)は、その情報単位Cjに属する全ての部分木の数に対する、その情報単位Cj内で前記部分木T1が出現する回数の比である。
【0042】
次に、全ての情報単位C1,C2,C3,…,Cmの集合をMとしたときに、前記集合M内での前記部分木T1の出現確率Pt(i)を演算する。これは前記集合Mに属する全ての部分木の数に対する、前記部分木T1が出現する回数の比として求められる。
【0043】
前記出現確率の比{P(j)/Pt(i)}が、それぞれの情報単位C1,C2,C3,…,Cmにおける、前記部分木T1の特異度Ps(1)である。
【0044】
そして、入力された単文Saの構文木データ22内の各部分木T1,T2,T3,T4,T5{一般式ではTi(i=1,2,3…,n)}の全てに対して前記特異度Ps(i)(i=1,2,3…,n)を求め、これを累積して加算した値が、前記単文Saの全ての部分木T1,T2,T3,T4,T5を加味した尤度Pstである。
【0045】
すなわち、特異度Ps(i)(iは部分木の番号)から、Σ{Ps(i)}(i=1からi=nまでの累積加算値)で求められた前記尤度Pstが、前記集合M内におけるそれぞれの情報単位C1,C2,C3,…,Cmの尤度である。
【0046】
前記尤度Pstが所定値(しきい値)を越えた情報単位Cjが検索すべき検索データ23である。
【0047】
なお、いずれの情報単位C1,C2,C3,…,Cmにおいても前記尤度Pstがしきい値を超えない場合には、情報検索システム1の管理者に警告が出されるなどし、管理者が実際の単文Saを読んで解釈し、いずれの情報単位Cjが前記単文Saのカテゴリーに近いかを判断し、検索データ23として指定する。
【0048】
図1に示す検索モジュール24では、前記尤度Pstにより抽出された検索データ23のカテゴリーに対応した回答文、または注文等の確認文が選択され、インターフェース25から検索者の端末に送信される。
【0049】
図4は、前記情報検索システム1の応用範囲を示している。
図4に示すIのフローが、前記質問文や注文文が入力されたときであり、前記のようにインターネットを通じての自動回答や注文の確認などが行われる。また前記のように単文Saが情報単位C1,C2,C3...,Cmのいずれかのカテゴリーに属するべきかが判断された時点で、前記単文Saを検索された情報単位内に格納するなどのQ&Aの構築支援に利用することができる。
【0050】
または図4に示すIIのフローのように、前記尤度Pstを演算することにより、入力された単文Saを主題とする、または前記単文Saを含む、文章データの分類、文章データの検索、データベースの構築などを行うことができる。
【0051】
【発明の効果】
以上のように本発明では、文章データが入力されたときに、その文章データの文意を正確に把握して、その文章データに対応する情報の検索を行うことができる。また、文章データの構文木に基づいてどの情報単位の尤度が高いかを検索することにより、情報単位の検索精度を向上させることができる。
【図面の簡単な説明】
【図1】本発明の情報検索システムの構成例を示すブロック図、
【図2】構文木データを形成する過程を示す説明図、
【図3】データベース内の情報単位の検索手法の説明図、
【図4】本発明の情報検索システムの応用範囲を示す説明図、
【符号の説明】
1 情報検索システム
2 システム本体
3 読み込みインターフェース
4 形態素解析
5 構文解析
6 構文木データの生成
7 演算処理
8 情報処理部
9 抽出情報データベース
10 テキストデータベース
22 構文木データ
23 検索データ

Claims (2)

  1. a)入力された文章データに辞書のデータベースを適用して、前記文章データを単語と品詞属性とに解析して形態素解析データを生成する手段
    (b)前記形態素解析データに基づいて、前記単語を少なくとも1つ含む文節を解読するとともに、文節間の係り受け関係を解析する手段と、
    (c)係り受け関係にある複数の文節およびこの文節ごとの述語属性と、さらに前記文節間の関係属性を付加した部分木データを生成し、さらに関係のある複数の前記部分木からなる構文木を構築して構文木データを生成する手段
    (d)前記部分木データおよび前記構文木データに基づいて、抽出すべき情報が格納されたデータベースから、前記構文木データと一致する構文を含む情報、または前記構文木データに類似した構文を含む情報を抽出する手段と、
    を有し、
    入力された文章をS、入力された文章S内の部分木データをTi(i=1,2,3,…n)とし、被検索対象のデータベースに含まれる情報単位をCj(j=1,2,3,…m)、前記情報単位Cjが複数集まった集合をMとしたときに、
    前記(d)の情報を抽出する手段が以下の手段を含むことを特徴とする情報検索システム。
    (d1)それぞれの前記情報単位Cjについて、その情報単位Cjに属する全ての部分木の数に対する、前記部分木データTiが出現する回数の比を、前記情報単位CjにおけるTiの出現確率P(j)として演算する、
    (d2)前記集合Mに属する全ての部分木の数に対する、前記部分木データTiが出現する回数の比を、集合MにおけるTiの出現確率Pt(i)として演算する、
    (d3)前記出現確率の比{P(j)/Pt(i)}を、情報単位Cjにおける前記部分木データTiの特異度Ps(i)とする、
    (d4) 文章S内の各部分木Tiについて演算された前記特異度Ps(i)から、各情報単位Cjの尤度Pst=Σ{Ps(i)}(i=1からi=nまでの累積加算値)を求め、前記尤度Pstが所定値以上の前記情報単位Cjを検索結果とする。
  2. 前記情報単位Cjは、同種のカテゴリーの文章の集まりであり、前記情報単位Cjが検索結果とされたときに、この情報単位Cjのカテゴリーに対する対応文がデータベースから選択される請求項記載の情報検索システム。
JP2001369754A 2001-12-04 2001-12-04 情報検索システム Expired - Fee Related JP4005343B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001369754A JP4005343B2 (ja) 2001-12-04 2001-12-04 情報検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001369754A JP4005343B2 (ja) 2001-12-04 2001-12-04 情報検索システム

Publications (2)

Publication Number Publication Date
JP2003167898A JP2003167898A (ja) 2003-06-13
JP4005343B2 true JP4005343B2 (ja) 2007-11-07

Family

ID=19179093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001369754A Expired - Fee Related JP4005343B2 (ja) 2001-12-04 2001-12-04 情報検索システム

Country Status (1)

Country Link
JP (1) JP4005343B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4815934B2 (ja) * 2005-08-02 2011-11-16 日本電気株式会社 テキストマイニング装置、テキストマイニング方法、テキストマイニングプログラム
JP4740060B2 (ja) * 2006-07-31 2011-08-03 富士通株式会社 重複データ検出プログラム、重複データ検出方法および重複データ検出装置
JP5160120B2 (ja) * 2007-03-29 2013-03-13 株式会社東芝 情報検索装置、情報検索方法及び情報検索プログラム
JP5038881B2 (ja) * 2007-12-27 2012-10-03 株式会社東芝 情報検索装置
JP2009199280A (ja) * 2008-02-21 2009-09-03 Hitachi Ltd 部分構文木プロファイルを用いた類似性検索システム
JP5439028B2 (ja) * 2009-05-12 2014-03-12 株式会社エヌ・ティ・ティ・データ 情報検索装置、情報検索方法、およびプログラム
JP4499179B1 (ja) * 2009-05-12 2010-07-07 株式会社エヌ・ティ・ティ・データ 端末装置
JP4967037B2 (ja) * 2010-02-08 2012-07-04 株式会社エヌ・ティ・ティ・データ 情報検索装置、情報検索方法、端末装置、およびプログラム
JP5505234B2 (ja) 2010-09-29 2014-05-28 富士通株式会社 文字列比較プログラム、文字列比較装置及び文字列比較方法
JP5524165B2 (ja) * 2011-12-01 2014-06-18 株式会社日立システムズ テキストデータ管理方法およびテキストデータ管理システム

Also Published As

Publication number Publication date
JP2003167898A (ja) 2003-06-13

Similar Documents

Publication Publication Date Title
Tabassum et al. A survey on text pre-processing & feature extraction techniques in natural language processing
US10496928B2 (en) Non-factoid question-answering system and method
JP3266246B2 (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US20150081277A1 (en) System and Method for Automatically Classifying Text using Discourse Analysis
US20150227505A1 (en) Word meaning relationship extraction device
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
CN105760462B (zh) 基于关联数据查询的人机交互方法及装置
JP2011118689A (ja) 検索方法及びシステム
WO2008059111A2 (en) Natural language processing
CN108319583A (zh) 从中文语料库提取知识的方法与***
Şeker et al. Extending a CRF-based named entity recognition model for Turkish well formed text and user generated content 1
JP4005343B2 (ja) 情報検索システム
Tapsai Information processing and retrieval from CSV file by natural language
CN114266256A (zh) 一种领域新词的提取方法及***
JP5426292B2 (ja) 意見分類装置およびプログラム
JP2008021270A (ja) データ変換装置および方法、データベース管理装置および方法、ならびにデータベース検索システムおよび方法
Hamdi et al. Automatically building a Tunisian lexicon for deverbal nouns
Sangati et al. Multiword expression identification with recurring tree fragments and association measures
JPH1196177A (ja) 用語辞書生成方法および用語辞書生成プログラムを記録した記録媒体
Yeshambel et al. Evaluation of corpora, resources and tools for Amharic information retrieval
US20220229986A1 (en) System and method for compiling and using taxonomy lookup sources in a natural language understanding (nlu) framework
US20220229990A1 (en) System and method for lookup source segmentation scoring in a natural language understanding (nlu) framework
Hirpassa Information extraction system for Amharic text
JP2007122525A (ja) 言い換え処理方法及び装置
Krilavičius et al. News media analysis using focused crawl and natural language processing: case of Lithuanian news websites

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070823

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130831

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees