JP4051309B2 - Web評価装置及びそのプログラム - Google Patents

Web評価装置及びそのプログラム Download PDF

Info

Publication number
JP4051309B2
JP4051309B2 JP2003065298A JP2003065298A JP4051309B2 JP 4051309 B2 JP4051309 B2 JP 4051309B2 JP 2003065298 A JP2003065298 A JP 2003065298A JP 2003065298 A JP2003065298 A JP 2003065298A JP 4051309 B2 JP4051309 B2 JP 4051309B2
Authority
JP
Japan
Prior art keywords
explanation
web
term
web page
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003065298A
Other languages
English (en)
Other versions
JP2004272786A (ja
Inventor
一郎 山田
英樹 住吉
香子 牧
正啓 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2003065298A priority Critical patent/JP4051309B2/ja
Publication of JP2004272786A publication Critical patent/JP2004272786A/ja
Application granted granted Critical
Publication of JP4051309B2 publication Critical patent/JP4051309B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、Web評価装置及びそのプログラムに関し、Web検索で得られる各Webページの評価を行うWeb評価装置及びそのプログラムに関する。
【0002】
【従来の技術】
従来、Would wide Web(「Web」と略す)を対象とした検索技術では、検索キーとして入力された単語のWebページ中における出現頻度や出現位置、または、人気のあるWebページからのリンク数、人手によって付けられた分類情報などを基準として、各Webページを評価し、各Webページに対する優先順位を決めている。
【0003】
また、Webページ中の評判情報を抽出して、そのWebページを評価するものもある(例えば、特許文献1参照。)。
【0004】
【特許文献1】
特開2002−175330号公報
【0005】
【発明が解決しようとする課題】
しかし、検索キーとして入力された単語のWebページ中における出現頻度や出現位置、または、人気のWebページからのリンク数、人手によって付けられた分類情報などからは、検索キーが何であるかを的確に示す内容が検索されたWebページに存在するか否かを把握することができず、検索キーが何であるかを的確に示す内容を持つWebページに高い評価を与えることができないという問題があった。また、Webページ中の評判情報を抽出して評価するだけでは、評価の精度にバラツキが出るという問題があった。
【0006】
本発明は、上記の点に鑑みなされたもので、検索キーが何であるかを的確に示す内容を持つWebページに対して高い評価を与えることができるWeb評価装置及びそのプログラムを提供することを目的とする。
【0007】
【課題を解決するための手段】
請求項1,に記載の発明は、検索キーとして与えられた対象用語に関係が深いWebページをインターネット上で検索し獲得する検索手段と、前記検索手段で獲得した複数のWebページから、用語にリンク先が付加されたパターン、定義型リスト形式もしくはボールドタグなどにより用語が見出し化されたパターン、用語が文で説明されたパターン、用語が連体節で説明されたパターンそれぞれを、前記対象用語に関する説明部分として抽出する抽出手段と、前記抽出手段で抽出された全ての説明集合に出現する単語が前記全ての説明集合中で出現した説明の数で構成した全ての説明集合を特徴付けるベクトルと、各説明に単語が出現したか否かを判定する関数で構成した各説明を特徴付けるベクトルとの内積を正規化して各説明の信頼値を算出し、信頼値の高い説明が抽出されたWebページに高い信頼値を与えて評価する評価手段を有することにより、
検索キーが何であるかを的確に示す内容を持つWebページに対して高い評価を与えることができる。
【0008】
請求項2に記載の発明では、評価手段は、前記検索手段で獲得した複数のWebページそれぞれについて各説明の信頼値が最大の信頼値をそのWebページの信頼値とすることにより、Webページ内に複数の説明がある場合にも正しい評価を行うことができる。
【0010】
【発明の実施の形態】
以下、図面を参照して本発明の実施例について説明する。
【0011】
図1は、本発明のWeb評価装置のハードウェア構成を示す一実施例のブロック図を示す。Web評価装置は、専用の装置構成とすることもできるが、例えば、汎用のパーソナルコンピュータ、ワークステーション等を適用することができる。
【0012】
図1において、Web評価装置は、入力装置11と、出力装置12と、ドライブ装置13と、補助記憶装置14と、メモリ装置15と、演算処理装置16と、データベース17と、ネットワーク接続装置18から構成されており、これらはシステムバス20で相互に接続されている。
【0013】
入力装置11は、使用者が操作するキーボード及びマウス、音声入力用のマイクロホンを有しており、各種信号を入力する。出力装置12は、Web評価装置のプログラムを操作するのに必要な各種ウィンドウやデータ等を表示するディスプレイを有し、実行プログラムに基づいて表示される。
【0014】
ここで、本発明において、Web評価装置にインストールされる実行プログラムは、例えば、CD−ROM等の記録媒体19等により提供される。プログラムを記録した記録媒体19はドライブ装置13に装着され、記憶媒体19に格納された実行プログラムが、記録媒体19からドライブ装置13を介して補助記憶装置14にインストールされる。
【0015】
演算処理装置16は、メモリ装置15により読み出され格納されている実行プログラムに基づいて、各種演算や後述する各処理を含むWeb評価装置全体の処理を制御する。また、プログラムの実行中に必要な各種情報は、データベース17から取得することができ、また格納することもできる。ネットワーク接続装置18は、通信ネットワーク等と接続することにより、インターネット上のWebをアクセスすることができる。
【0016】
図2は、本発明のWeb評価装置の一実施例の機能構成図を示す。Web評価装置は、検索エンジン部22と、対象用語説明部分抽出部24と、Webページデータ評価部26から構成されている。
【0017】
図2において、検索エンジン部22は、一または複数の検索キーを入力され、既存の検索ロボットを利用して、インターネット上の全てのWebページをアクセスして各検索キーを含むWebページのみを抽出し、抽出したWebページアドレスを対象用語説明部分抽出部24に供給する。検索エンジン部22としてはGoogle,Yahoo,Altavista,goo等の既存の検索エンジンを利用することもできる。
【0018】
対象用語説明部分抽出部24は、検索エンジン22から供給されるWebページをアクセスし、検索キーとして入力された用語を説明している部分を抽出してWebページデータ評価部26に供給する。ここでは、以下の4つのパターンに分類して説明部分を抽出する。
(A)用語にリンク先が付加されたパターン
(B)定義型リスト形式、もしくは、ボールドタグなどにより用語が見出し化されたパターン
(C)文で説明されたパターン
(D)連体節で説明されたパターン
Webページデータ評価部26は、検索キー毎に、抽出された全ての説明の集合と個々の説明との類似性に基づいて各説明の信頼値を算出し、信頼値の高い説明が抽出されたWebページに高い信頼値を与えて評価して、信頼値に応じた優先順位を与える。複数の検索キーが検索エンジン部22に入力されている場合は、複数の検索キーの評価結果を統合し、各Webページの評価結果を出力する。このとき、優先度の高いWebページだけを出力することもできる。
【0019】
図3は、対象用語説明部分抽出部24が実行する処理のフローチャートを示す。この処理は、検索エンジン部22から全てのWebページアドレスを供給されて開始する。同図中、ステップS10では全てのWebページアドレスに対する処理を終了したか否かを判別し、処理を終わっていないWebページアドレスがあれば、ステップS12に進む。
【0020】
ステップS12では、1つのWebページアドレスを選択し、インターネットのWebページアドレスをアクセスし、そのWebページのHTML(HyperText Makeup Language)文書を読み取る。HTML文書内で、用語を説明するパターンとして、次に示す4つのパターンが考えられる。(A)用語にリンク先が付加されたパターン
例:<AHREF=”#kaden”>情報家電</A>
<ANAME=kaden>次世代の高速インターネットに対応した家電製品<A>
(B)定義型リスト形式、もしくは、ボールドタグなどにより用語が見出し化されたパターン
例:<DL>
<DT>情報家電
<DD>次世代の高速インターネットに対応した家電製品
<DL>
(C)文で説明されたパターン
例:情報家電は、次世代の高速インターネットに対応した家電製品です。
(D)連体節で説明されたパターン
例:次世代の高速インターネットに対応した情報家電は、〜
対象用語説明部分抽出部24では、(A)〜(D)の各パターンを順次処理するため、ステップS14で、HTML文書の文の区切りを抽出する。文の区切りは、</a>,</font>タグを除く全てのHTMLタグと、句点(。)を区切れ目と判断し、HTML文書内にある改行などは、区切り目と判断しない。この際、文中に出現するHTMLタグはすべて除去する。
【0021】
次に、パターン(A),(B)についての処理を行う。ステップS14では、まず、一つの文が以下の条件1が満たされているかを判別し、条件1が満たされている場合はパターン(A),(B)と判別してステップS18に進む。
【0022】
条件1は以下の条件(a)〜(e)を全て満たす。
(a)検索キーとして入力された用語を含んでいる
(b)単一の文である(<p>タグなどで複数文が囲まれていない)
(c)文中の用語以外の部分に動詞を含まない
(d)<b>,<td>,<dt>,<h[1−6]>,<a>タグのいずれかでマークされている
(e)次の文とそのまた次が<a>タグでマークされていない
条件1を満足する場合に、条件(d)でリンクタグである<a>タグでマークされているときは、ステップS18でパターン(A)と判断してステップS20に進み、それ以外の場合はパターン(B)と判断してステップS22に進む。
【0023】
パターン(A)の場合はステップS20に進み、リンク先が同じWebページ内へのジャンプであれば、ジャンプ先から例えば3文を対象用語説明部分として抽出する。リンク先が他のアドレスに存在するWebページヘのジャンプであれば、そのジャンプ先のHTML文書を獲得し、HTML文書の最初から例えば3文を対象用語説明部分として抽出する。この際、不要なHTMLタグは除去し、自然言語文と判別される部分のみを抽出する。
【0024】
ステップS18でパターン(B)と判別された場合はステップS22に進み、ステップS16の条件1を満たした文の次から例えば3文を、対象用語説明部分として抽出する。
【0025】
次に、ステップS24でパターン(C)の判別処理を行う。Webページ中の各文に、「対象用語は〜です。」「対象用語とは〜です。」「対象用語は〜で、」「対象用語とは〜で」のパターンがある場合、ステップS26で波線部分を対象用語説明部分として抽出する。
【0026】
最後に、ステップS28で文に対象用語が含まれパターン(D)であるか否かを判別する。パターン(D)と判別された場合は、ステップS30で検索キーとして入力された対象用語が存在するWebページ中の各文に対して、既存技術である構文解析を行って単語間の係り受け関係を判別する。ステップS32で、その結果を基に、対象用語を修飾する従属節(以後、連体節と呼ぶ)の有無を判別し、存在する場合は、ステップS34で連体節を対象用語説明部分として抽出する。
【0027】
ステップS34の実行後は、ステップS10に戻って処理を繰り返す。また、パターン(D)に当てはまらない場合もステップS10に戻って処理を繰り返す。ステップS10で全ての検索キーについて処理が終了している場合にはこの処理を終了する。
【0028】
図4は、Webページデータ評価部26が実行する処理のフローチャートを示す。この処理は、対象用語説明部分抽出部24から各検索キーに対する全ての対象用語説明部分を供給されて開始する。
【0029】
同図中、ステップS40で、全てのWebページに対する信頼値を1にセットする。次に、ステップS42で、全ての検索キーに対して処理が終了したか否かを判別し、全ての検索キーで処理が終了していない場合は、ステップS44で未処理の検索キーの一つを処理対象とする。
【0030】
ステップS46では、対象用語説明部分抽出部24による説明部分抽出結果を利用して、処理対象の検索キーに対する全ての説明部分を処理したか否かを判別する。処理対象の検索キーに対する全ての説明を処理していない場合は、ステップS48で未処理である説明の一つを処理対象とする。
【0031】
次に、ステップS50で、処理対象となった説明の信頼値confidenceを算出する。対象用語説明部分抽出部24で、検索キーQkにより抽出された全ての説明に共通する要素は信頼性が高いと判定する。
【0032】
ここでは、検索キーQkにより抽出された全ての説明集合と個々の説明の類似性を説明毎に算出し説明の信頼値とする。そのために、抽出された全ての説明集合を特徴付けるベクトルと、個々の説明を特徴付けるベクトルを次のように定義する。
【0033】
全ての説明集合に出現する単語をwi(i=1〜n,n:異なる単語の出現数)とし、全ての説明集合中で単語wiが出現した説明の数をdf(wi)とし、全ての説明集合の数をNとし、説明j(j=1〜N)に単語wiが出現したか否かを判定する関数をapp(j,wi)とする。
【0034】
関数app(j,wi)は、説明jに単語wiが出現している場合、app(j,wi)=1であり、説明jに単語wiが出現していない場合、app(j,wi)=0とする。
【0035】
抽出された全ての説明集合を特徴付けるベクトル=[df(w1)/N,df(w2)/N,df(w3)/N,…,df(wn)/N] …(1)
説明jを特徴付けるベクトル=[app(j,w1),app(j,w2),app(j,w3),…,app(j,wn)] …(2)
上記のベクトル表現を利用して、説明jの信頼値confidence(j)を(3)式で定義する。
【0036】
【数1】
Figure 0004051309
(3)式の分子は、抽出された全ての説明集合を特徴付けるベクトルと、説明jを特徴付けるベクトルとの内積を表している。この際、抽出された全ての説明集合を特徴付けるベクトルの各要素で説明jを特徴付けるベクトルの各要素に対する重み付けがなされる。また、分母は、抽出された全ての説明集合を特徴付けるベクトルの大きさと、説明jを特徴付けるベクトルの大きさの和であり、分子の内積を正規化している。
【0037】
ステップS50で説明jの信頼値confidence(j)を算出したのち、説明jの信頼値を利用して、説明jが出現したWebページHjの持つ検索キーQkに対する信頼値を計算する。
【0038】
このため、ステップS52で処理対象の説明jが抽出されたWebページHjから、他の説明も抽出されているか否かを判別する。WebページHjから他の説明も抽出されている場合、ステップS54で、他の説明の信頼値と、対象としている説明jの信頼値confidence(j)とを比較する。
【0039】
対象としている説明jの信頼値confidence(j)が最大の場合は、ステップS56に進み、対象としている説明jの信頼値confidence(j)で、説明jが出現したWebページHjの持つ検索キーQkに対する信頼値confidence(Hj,Qk)を更新する。
【0040】
対象としている説明jの信頼値が最大でない場合は、confidence(Hj,Qk)の更新は行わず、ステップS46に戻り、以下の処理を繰り返す。また、ステップS52で他の説明が抽出されていないと判別された場合は、対象としている説明jの信頼値で信頼値confidence(Hj,Qk)を更新する。
【0041】
上記のステップS46〜S56の処理を繰り返すことにより得られる、説明jが出現したWebページHjの持つ検索キーQkに対する信頼値confidence(Hj,Qk)は、(4)式で定義できる。
【0042】
confidence(Hj,Qk)=max[∀j∈Hj,confidence(j)] …(4)
ステップS46で処理中の検索キーに対する全ての説明を処理したと判別された場合にはステップS60に進んでWebページHjの信頼値Conf(Hj)を(5)式で算出して更新する。
【0043】
Conf(Hj)=Conf(Hj)×confidence(Hj,Qk)…(5)
また、ステップS42で、全ての検索キーについて処理が終了している場合には、ステップS62で評価された全てのWebページに対する信頼値Conf(Hj)の集合を結果として出力し、この処理を終了する。
【0044】
この信頼値Conf(Hj)が高いほど、信頼できるWebページと判断できる。ここで、「燃料電池」という1つの検索キーにより大量のWebページを検索エンジン部22で検索する。各Webページ中の「燃料電池」に対する説明を対象用語説明部分抽出部24により抽出した結果、抽出された全ての説明集合を特徴付けるベクトルを図5に示す。図5に示すベクトルのうち、例えば第1要素である「装置(20/60)」は、全ての説明集合の数が60で、そのうち20の説明に単語「装置」が出現したことを表している。
【0045】
また、図6(A),(B),(C)に各説明jの信頼値confidence(j)と、その説明の内容を示す。図6(A)に示す説明「天然ガス(都市ガスの主原料)から取り出した水素と空気中の酸素を電気化学反応させて、水の電気分解とは逆の反応で電気を作る装置」の信頼値は0.430564であり、図6(B)に示す説明「小型機器に電力を供給する装置」の信頼値は0.245034であり、図6(C)に示す説明「月まで行った装置」の信頼値は0.015220である。
【0046】
Webページデータ評価部26は、図6(A)に示す「天然ガス(都市ガスの主原料)から取り出した水素と空気中の酸素を電気化学反応させて、水の電気分解とは逆の反応で電気を作る装置」という説明が、confidence(j)=0.430564で最も信頼値が高いと判別している。入力された検索キーが1つであるので、この説明が抽出された図7に示すWebページが、最も信頼性の高いWebページと判別される。
【0047】
これに対して、図8は、一般の検索エンジンを用いて「燃料電池」という検索キーを入力した際のトップページ(最初のWebページ)を示す。図7のWebページには、的確な「燃料電池」の説明があるが、図8のトップページには、的確な「燃料電池」の説明は存在しない。
【0048】
このようにして得た検索キー毎の各Webページの信頼値Conf(Hj)は、例えば検索エンジン等において、対象用語を検索キーとして検索した場合に検索結果として得られる複数のWebページに対する優先度として与えられ、優先度の高い、つまり、信頼値Conf(Hj)の高いWebページを上位に表示するため等に利用される。これにより、インターネット上の大量のWebページから、検索キーが何であるかを的確に示す内容を持つWebページを優先して検索することが可能となる。
【0049】
なお、検索エンジン部22が請求項記載の検索手段に対応し、対象用語説明部分抽出部24が抽出手段に対応し、Webページデータ評価部26が評価手段に対応する。
【0050】
【発明の効果】
上述の如く、請求項1,に記載の発明によれば、検索キーが何であるかを的確に示す内容を持つWebページに対して高い評価を与えることができる。
【0051】
請求項2に記載の発明によれば、Webページ内に複数の説明がある場合にも正しい評価を行うことができる。
【図面の簡単な説明】
【図1】本発明のWeb評価装置のハードウェア構成を示す一実施例のブロック図である。
【図2】本発明のWeb評価装置の一実施例の機能構成図である。
【図3】対象用語説明部分抽出部が実行する処理のフローチャートである。
【図4】Webページデータ評価部が実行する処理のフローチャートである。
【図5】抽出された全ての説明集合を特徴付けるベクトルを示す図である。
【図6】各説明jの信頼値confidence(j)と、その説明の内容を示す図である。
【図7】Webページを示す図である。
【図8】Webページを示す図である。
【符号の説明】
11 入力装置
12 出力装置
13 ドライブ装置
14 補助記憶装置
15 メモリ装置
16 演算処理装置
17 データベース
18 ネットワーク接続装置
19 記録媒体
20 システムバス
22 検索エンジン部
24 対象用語説明部分抽出部
26 Webページデータ評価部

Claims (3)

  1. Web検索で得られる各Webページの評価を行うWeb評価装置において、
    検索キーとして与えられた対象用語に関係が深いWebページをインターネット上で検索し獲得する検索手段と、
    前記検索手段で獲得した複数のWebページから、用語にリンク先が付加されたパターン、定義型リスト形式もしくはボールドタグなどにより用語が見出し化されたパターン、用語が文で説明されたパターン、用語が連体節で説明されたパターンそれぞれを、前記対象用語に関する説明部分として抽出する抽出手段と、
    前記抽出手段で抽出された全ての説明集合に出現する単語が前記全ての説明集合中で出現した説明の数で構成した全ての説明集合を特徴付けるベクトルと、各説明に単語が出現したか否かを判定する関数で構成した各説明を特徴付けるベクトルとの内積を正規化して各説明の信頼値を算出し、信頼値の高い説明が抽出されたWebページに高い信頼値を与えて評価する評価手段を
    有することを特徴とするWeb評価装置。
  2. 請求項1記載のWeb評価装置において、
    前記評価手段は、前記検索手段で獲得した複数のWebページそれぞれについて各説明の信頼値が最大の信頼値をそのWebページの信頼値とすることを特徴とするWeb評価装置。
  3. Web検索で得られる各Webページの評価を行うためにコンピュータを、
    検索キーとして与えられた対象用語に関係が深いWebページをインターネット上で検索し獲得する検索手段、
    前記検索手段で獲得した複数のWebページから、用語にリンク先が付加されたパターン、定義型リスト形式もしくはボールドタグなどにより用語が見出し化されたパターン、用語が文で説明されたパターン、用語が連体節で説明されたパターンそれぞれを、前記対象用語に関する説明部分として抽出する抽出手段、
    前記抽出手段で抽出された全ての説明集合に出現する単語が前記全ての説明集合中で出現した説明の数で構成した全ての説明集合を特徴付けるベクトルと、各説明に単語が出現したか否かを判定する関数で構成した各説明を特徴付けるベクトルとの内積を正規化して各説明の信頼値を算出し、信頼値の高い説明が抽出されたWebページに高い信頼値を与えて評価する評価手段、
    として機能させるためのWeb評価プログラム。
JP2003065298A 2003-03-11 2003-03-11 Web評価装置及びそのプログラム Expired - Fee Related JP4051309B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003065298A JP4051309B2 (ja) 2003-03-11 2003-03-11 Web評価装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003065298A JP4051309B2 (ja) 2003-03-11 2003-03-11 Web評価装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2004272786A JP2004272786A (ja) 2004-09-30
JP4051309B2 true JP4051309B2 (ja) 2008-02-20

Family

ID=33126355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003065298A Expired - Fee Related JP4051309B2 (ja) 2003-03-11 2003-03-11 Web評価装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP4051309B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5625254B2 (ja) * 2009-03-31 2014-11-19 富士通株式会社 抽出条件生成プログラム、抽出条件生成装置、および抽出条件生成方法

Also Published As

Publication number Publication date
JP2004272786A (ja) 2004-09-30

Similar Documents

Publication Publication Date Title
US8412514B1 (en) Method and apparatus for compiling and querying a QA database
JP5403696B2 (ja) 言語モデル生成装置、その方法及びそのプログラム
JP4904496B2 (ja) 文書類似性導出装置及びそれを用いた回答支援システム
JP2002230021A (ja) 情報検索装置及び情報検索方法並びに記憶媒体
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP4349875B2 (ja) 文書フィルタリング装置、文書フィルタリング方法、および文書フィルタリングプログラム
US20230177362A1 (en) Risk assessment apparatus, risk assessment method, and program
CN110888946A (zh) 一种基于知识驱动的查询的实体链接方法
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
JP4754849B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2004318510A (ja) 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法
JP4051309B2 (ja) Web評価装置及びそのプログラム
CN117556811A (zh) 一种临床术语标准化方法及装置、存储介质
JP5790820B2 (ja) 不整合検出装置、プログラム及び方法、修正支援装置、プログラム及び方法
JP2008152641A (ja) 類似例文検索装置
JP3937741B2 (ja) 文書の標準化
JPH11272709A (ja) ファイル検索方式
JPH1153396A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
JP5332128B2 (ja) 情報検索装置、情報検索方法およびそのプログラム
JP5336779B2 (ja) 文字列変換を行う情報処理装置、文字列変換方法、プログラム、および情報処理システム
JP2007164462A (ja) 質問応答システム、質問応答方法及び質問応答プログラム
JP4574186B2 (ja) 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
JP3006526B2 (ja) 類似文書検索方法および類似文書検索装置
JP2019086934A (ja) 文書検索装置および方法
JP2017102976A (ja) 文献解析装置、文献解析方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070911

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071203

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111207

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121207

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131207

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees