JP2003162531A - 文書検索システムおよび文書検索方法 - Google Patents

文書検索システムおよび文書検索方法

Info

Publication number
JP2003162531A
JP2003162531A JP2001361625A JP2001361625A JP2003162531A JP 2003162531 A JP2003162531 A JP 2003162531A JP 2001361625 A JP2001361625 A JP 2001361625A JP 2001361625 A JP2001361625 A JP 2001361625A JP 2003162531 A JP2003162531 A JP 2003162531A
Authority
JP
Japan
Prior art keywords
document
search
database
sentence
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001361625A
Other languages
English (en)
Other versions
JP3915488B2 (ja
Inventor
Atsushi Hosoda
篤志 細田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP2001361625A priority Critical patent/JP3915488B2/ja
Publication of JP2003162531A publication Critical patent/JP2003162531A/ja
Application granted granted Critical
Publication of JP3915488B2 publication Critical patent/JP3915488B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】検索意図に合致する文書の抽出を容易にする。 【解決手段】文書データベースDB1には特定の複数分
野の範囲内で用いる複数の文書が格納される。検索文設
定手段11では、利用者に検索文を設定させるとともに
検索範囲の分野を指定させる。検索文設定手段11によ
り検索文が設定されると、検索処理手段12が検索文に
より指定された検索条件に合致する文書を文書データベ
ースDB1から抽出する。検索処理手段12は、抽出し
た各文書ごとに検索文設定手段11で指定された分野に
おける利用価値を評価するための評価尺度を決定し、抽
出した文書を評価尺度の大小順に並べて検索結果として
検索結果出力手段13に引き渡す。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書を蓄積した文
書データベースから所望のキーワードに関連する文書を
検索する文書検索システムおよび文書検索方法に関する
ものである。
【0002】
【従来の技術】一般に、文書を蓄積した文書データベー
スから文書を検索する技術として、キーワードとなる語
彙を与え、あらかじめ文書に付帯して設定されたキーワ
ードあるいは文書の全文とキーワードとの文字列を照合
する技術が広く採用されている。
【0003】しかしながら、文書に付帯して設定される
キーワードや文書中に使用される語彙は統一されたもの
ではなく、ほぼ同じ概念であっても語彙が異なっている
ことも多いから、与えたキーワードに一致する語彙が所
望の文書に使用されておらず、いわゆる検索漏れによっ
て適切な文書を抽出できない場合がある。キーワードを
自由語で与える場合には、関連する複数の語彙をキーワ
ードとして与えることによって検索漏れの可能性を低減
することができるものの、文書検索のたびに関連する語
彙を探し出すのは手間がかかる上に、検索しようとする
文書に関連する分野に精通していなければ適切な語彙を
探し出すことはできないという問題がある。
【0004】これに対して、特開平11−126202
号公報には、利用者が入力した簡易な検索条件を、あら
かじめテーブルに登録された検索式に変換し、検索条件
を展開することによって入力された検索条件よりも語彙
数を増やして検索漏れの可能性を低減し、しかも適正な
検索式に変換することによって不必要なノイズを排除す
る技術が記載されている。検索条件からどのような形の
検索式に展開するかは、検索条件に応じてあらかじめテ
ーブルに登録されている。つまり、検索条件に対して検
索式は固定的に決定されることになる。
【0005】また、特開平10−72107号公報で
は、与えたキーワードにより所望の文書が抽出されなか
った場合に、キーワードを複数の語彙に分解し、またキ
ーワードに含まれる語彙に関連する別の語彙を導出して
語彙数を拡張することにより、検索漏れの可能性を低減
する技術が記載されている。
【0006】さらに、特開平8−171569号公報に
おいては、キーワードを関連する複数の語彙に展開する
技術に加えて、検索意図に合わない語彙がキーワードに
含まれないようにするために、キーワードとなる語彙に
カテゴリを設定し、与えられたキーワードが複数のカテ
ゴリに分類されるときには、各カテゴリの他の語彙を利
用者に提示することによって、検索意図に合わない語彙
を展開しないようにする技術が記載されている。
【0007】
【発明が解決しようとする課題】ところで、特開平11
−126202号公報に記載された技術では、検索条件
に対して検索漏れの可能性を低減するとともに不要なノ
イズを排除することができるとはいうものの、検索条件
に対する検索式が固定的に設定されているものであり、
入力された曖昧な検索条件をより検索に適した検索条件
に置き換えているに過ぎないものである。したがって、
検索条件に対応する検索式をあらかじめ用意しなければ
ならず、適切な検索式を設定するには膨大な労力を要す
ることになる。その結果、特殊な専門用語を検索条件に
用いるような場合には検索条件に対応する検索式が設定
されていない可能性が高くなり、結果的に検索漏れが増
加し不要なノイズが多く含まれる可能性が高くなる。
【0008】特開平10−72107号公報に記載され
た技術では、キーワードを複数の語彙に分解して語彙数
を拡張するだけであるから、特殊な専門用語であっても
対応するのは比較的容易であるが、キーワードに対して
所望の文書が抽出されなかったときにキーワードを複数
の語彙に分解したり、語彙数を拡張したりするから、所
望の文書が抽出されるまでには複数回の検索処理が必要
になることが多い。つまり、所望の文書が抽出されるま
でに比較的長い時間を要することになる。また、語彙数
を拡張するだけであるから、不要なノイズを排除するこ
とは困難になる。
【0009】特開平8−171569号公報には、語彙
のカテゴリを分類するとともに、各カテゴリに分類され
る語彙を利用者に選択させることによって、検索意図に
合致するカテゴリの範囲内で語彙を展開する技術が記載
されており、この技術では、語彙の拡張によって検索漏
れは低減され、またカテゴリを制限することによって不
要なノイズは比較的少なくなると考えられる。
【0010】しかしながら、この公報に記載の技術を用
いてもノイズを排除することはできないから、検索条件
に対して複数の文書が抽出されることが多く、最終的に
は抽出された複数の文書の中から利用者が所望の文書を
探し出さなければならず、検索意図に合致する文書を探
し出すための労力は依然として大きいものである。
【0011】本発明は上記事由に鑑みて為されたもので
あり、その目的は、検索対象となる文書に分野別の評価
尺度を対応付け、この評価尺度の大きさの順に検索結果
を並べ替えて表示することにより、検索意図に合致する
文書が迅速に見つかるように並べて文書の抽出を容易に
した文書検索システムおよび文書検索方法を提供するこ
とにある。
【0012】
【課題を解決するための手段】請求項1の発明は、特定
の複数分野の範囲内で用いる複数の文書が格納された文
書データベースと、利用者に検索文を設定させるととも
に検索範囲の分野を指定させる検索文設定手段と、検索
文設定手段により設定された検索文の検索条件に合致す
る文書を文書データベースから抽出する検索処理手段
と、検索処理手段での検索結果を出力する検索結果出力
手段とを備え、検索処理手段は、文書データベースに登
録された各文書ごとに分野別に分類された評価データに
基づいて各文書の各分野における評価尺度を求める機能
と、求め方の異なる複数種類の評価尺度から所望の評価
尺度を利用者に選択させる機能と、抽出した各文書ごと
に検索文設定手段で指定された分野に関して利用者が選
択した種類の評価尺度を求めるとともに当該評価尺度の
大小順に並べて検索結果として検索結果出力手段に引き
渡す機能とを有することを特徴とする。
【0013】請求項2の発明は、請求項1の発明におい
て、前記検索文設定手段が、利用者にキーワードを含む
自然文である一次検索文を入力させる一次検索文入力手
段と、一次検索文からキーワードを抽出する検索文解析
手段と、キーワードとなる語彙に対する関連用語が前記
分野別に登録された関連用語データベースと、検索文解
析手段により抽出したキーワードを関連用語データベー
スに照合し検索文解析手段で抽出したキーワードに対す
る関連用語を用いた二次検索文を生成する機能を有した
二次検索文生成手段と、一次検索文と二次検索文とから
前記検索処理手段に与える検索文を利用者に選択させる
実行検索文選択手段とから成ることを特徴とする。
【0014】請求項3の発明は、請求項2の発明におい
て、前記関連用語データベースには、キーワードとなる
語彙の類義語に加えて各分野において特定の関連性を有
する語彙が関連用語として登録されるとともに、各関連
用語に各分野での利用価値の目安となる用語重要度が対
応付けられ、前記二次検索文生成手段では用語重要度を
関連用語とともに利用者に示して関連用語から利用者の
希望する関連用語を選択させることを特徴とする。
【0015】請求項4の発明は、請求項1ないし請求項
3の発明において、前記文書データベースに登録された
各文書ごとの各分野での利用価値を前記評価データとな
る文書重要度として登録した文書重要度データベースを
備え、前記検索処理手段では、文書重要度が前記評価尺
度の選択肢の一つとして選択されると、前記検索条件に
より抽出した文書を文書重要度データベースに照合する
ことにより文書重要度を前記評価尺度に用いて文書を並
べることを特徴とする。
【0016】請求項5の発明は、請求項1ないし請求項
3の発明において、前記文書データベースに登録された
各文書ごとの各分野別の参照頻度を前記評価データとし
て登録した参照頻度データベースを備え、前記検索処理
手段では、参照頻度が前記評価尺度の選択肢の一つとし
て選択されると、前記検索条件により抽出した文書を参
照頻度データベースに照合することにより参照頻度を前
記評価尺度に用いて文書を並べることを特徴とする。
【0017】請求項6の発明は、請求項2または請求項
3の発明において、前記文書データベースに登録された
各文書ごとの各分野での利用価値を前記評価データとな
る文書重要度として登録した文書重要度データベース
と、前記文書データベースに登録された各文書ごとの各
分野別の参照頻度を前記評価データとして登録した参照
頻度データベースとを備え、前記検索処理手段では、抽
出した各文書中でのキーワードの出現頻度と文書重要度
と参照頻度とを重み付け加算した評価ポイントが前記評
価尺度の選択肢の一つとして選択されると、前記検索条
件により抽出した文書を文書重要度データベースおよび
参照頻度データベースに照合するとともに抽出した各文
書中でのキーワードの出現頻度を求めることにより評価
ポイントを求め、この評価ポイントを前記評価尺度に用
いて文書を並べることを特徴とする。
【0018】請求項7の発明は、請求項5または請求項
6の発明において、前記検索処理手段では、前記文書デ
ータベースに登録された文書が参照されたときに、前記
参照頻度データベースに登録されている参照頻度が大き
いほど大きい値を参照頻度に加算することを特徴とす
る。
【0019】請求項8の発明は、請求項5または請求項
6の発明において、前記検索処理手段では、前記文書デ
ータベースに登録された文書が参照されたときに利用者
に利用価値に相当する投票値を入力させ、投票値の合計
を参照頻度に用いることを特徴とする。
【0020】請求項9の発明は、請求項4または請求項
6の発明において、前記検索処理手段では、前記文書デ
ータベースに登録された文書が参照されたときに利用者
に利用価値に相当する投票値を入力させ、前記文書重要
度データベースに登録された当該文書の文書重要度を投
票値が大きいほど大きくするように補正することを特徴
とする。
【0021】請求項10の発明は、特定の複数分野の範
囲内で用いる複数の文書が格納された文書データベース
から目的の文書を検索する方法であって、利用者に検索
文を設定させるとともに検索範囲の分野を指定させた
後、設定された検索文の検索条件に合致する文書を文書
データベースから抽出し、さらに各文書ごとに分野別に
分類された評価データから求められる各文書の各分野で
の評価尺度を、求め方の異なる複数種類から利用者に選
択させ、次に抽出した各文書ごとに指定された分野に関
して選択された種類の評価尺度を求めるとともに抽出し
た文書を当該評価尺度の大小順に並べて検索結果として
出力することを特徴とする。
【0022】請求項11の発明は、請求項10の発明に
おいて、利用者にキーワードを含む自然文である一次検
索文を入力させた後、一次検索文からキーワードを抽出
し、次にキーワードとなる語彙に対する関連用語が前記
分野別に登録された関連用語データベースに一次検索文
から抽出したキーワードを照合して関連用語を用いた二
次検索文を生成し、一次検索文と二次検索文とから利用
者に前記検索文を選択させることを特徴とする。
【0023】請求項12の発明は、請求項10または請
求項11の発明において、前記文書データベースに登録
されている各文書ごとの各分野での利用価値である文書
重要度と、前記文書データベースに登録されている各文
書ごとの各分野別の参照頻度と、前記文書データベース
から検索条件により抽出した各文書中でのキーワードの
出現頻度とのうちの少なくとも1つを前記評価尺度に用
いて文書を並べることを特徴とする。
【0024】請求項13の発明は、請求項12の発明に
おいて、前記文書データベースに登録された文書が参照
されたときに利用者に利用価値に相当する投票値を入力
させ、投票値の合計を参照頻度に用いることを特徴とす
る。
【0025】請求項14の発明は、請求項12の発明に
おいて、前記文書データベースに登録された文書が参照
されたときに利用者に利用価値に相当する投票値を入力
させ、当該文書の文書重要度を投票値が大きいほど大き
くするように補正することを特徴とする。
【0026】
【発明の実施の形態】本実施形態では、文書を格納した
文書データベースDB1を備えるサーバ1と、文書デー
タベースDB1に蓄積された文書を検索するために利用
者が操作する端末2とが、ローカルエリアネットワーク
NTを介して接続されている例を示すが、本発明の技術
思想は、サーバ1と端末2とはインターネットのような
広域ネットワークを介して接続する場合、あるいはネッ
トワークを用いずにサーバ1と端末2との機能を1台の
コンピュータ装置によって実現する場合にも適用可能で
ある。また、本実施形態では商品の企画から販売までの
過程、つまり商品の企画・開発・製造・販売の各業務に
おいて利用される文書を検索する場合を例として説明
し、分野としては、商品企画、商品開発、商品設計、製
造技術、品質管理、商品営業、トラブル記録を想定して
いるが、他の文書であっても複数の分野の文書を文書デ
ータベースDB1に登録し、分野別に文書を利用する場
合には、本発明の技術思想を適用することが可能であ
る。たとえば、業務による分類による分野のほか会社内
での利用者の所属部署による分類なども分野として利用
可能である。
【0027】文書データベースDB1に格納された各文
書は、全文検索が可能な場合にはキーワードを付与しな
くてもよいが、文書がイメージデータである場合のよう
に全文検索が不可能な場合には適宜にキーワードや説明
文が付与される。つまり、この種の文書はキーワードや
説明文に含まれる語彙が検索される。さらに、文書デー
タベースDB1では各文書に対して見出しも対応付けて
ある。
【0028】図1に示すように、サーバ1は、文書デー
タベースDB1に蓄積された文書を抽出するための検索
文を設定する検索文設定手段11を備え、検索文設定手
段11により設定された検索文を検索処理手段12に与
えることによって、文書データベースDB1に蓄積され
た文書と検索文により指定された検索条件とを照合す
る。検索文は後述するように自然文の形式で与えられ
る。検索処理手段12では、検索文に含まれるキーワー
ドとなる語彙を抽出し、キーワードとなる語彙が複数で
あれば語彙の論理的結合関係を抽出する。ここに、語彙
の論理的結合関係とは、論理積、論理和、否定の組合せ
を意味し、検索文の意味解析によって抽出することがで
きる。こうして検索文から語彙および語彙の論理的結合
関係を抽出することにより検索条件を設定することがで
きる。検索処理手段12は、文書データベースDB1に
登録されている文書と検索条件とを照合するだけではな
く、各文書ごと文書重要度を対応付けた文書重要度デー
タベースDB2と、各文書ごとに過去に抽出された頻度
を対応付けた参照頻度データベースDB3とを参照して
抽出する文書を決定する。ただし、この処理については
後述する。
【0029】検索処理手段12により抽出された文書に
関する情報は検索結果出力手段13に格納され、検索結
果出力手段13から端末2に提示される。端末2に設け
たディスプレイ装置の画面には、検索処理手段12によ
り抽出された文書の見出しが一覧表示され、一覧表示さ
れた見出しから利用者の検索意図にあった文書を指定す
れば、指定された文書が文書データベースDB1から読
み出されて端末2に転送される。このように、検索処理
手段12により抽出された文書の見出しを端末2に提示
し、利用者が選択した見出しに対応する文書のみを端末
2に転送するから、ローカルネットワークNTを通して
伝送される文書数は少なく、文書のデータサイズが大き
い場合でもトラフィックを大幅に増加させることなく文
書を転送することが可能になる。
【0030】ところで、検索文設定手段11は、利用者
が指定した一次検索文が自然文の形で入力される一次検
索文入力手段14と、一次検索文の形態素解析を行って
キーワードとなる語彙を抽出するとともに抽出したキー
ワードに関連する関連用語を含むように拡張したキーワ
ード(単語または複合語)を設定する検索文解析手段1
5と、検索文解析手段15において設定されたキーワー
ドを用いて自然文の二次検索文を生成する二次検索文生
成手段16と、一次検索文と二次検索文とを利用者に提
示し、文書の検索にあたって利用者が希望する検索文を
選択させる実行検索文選択手段17とを備える。また、
検索文設定手段11は、検索文解析手段15における形
態素解析の際に参照するために語彙の品詞を登録した品
詞データベースDB4と、検索文解析手段15において
関連用語を含むキーワードの設定の際に参照するために
関連用語を登録した関連用語データベースDB5とを備
える。関連用語データベースDB5に登録される関連用
語は、キーワードとなる語彙に対する類義語だけではな
く、分野ごとの専門用語や特殊用語、あるいは当該語彙
に対して類義以外の特定の関連性を有するような語彙も
関連用語として登録される。たとえば、一般に企業内で
扱う文書にはトラブルに関する語彙のように不利益を連
想する場合でも重要な語彙があるから、このような特定
の関連性を有する語彙も関連用語として関連用語データ
ベースDB5に登録される。
【0031】関連用語データベースDB5は、語彙に対
する関連用語だけではなく、各関連用語が各分野に対し
て持つ重要度(以下では、用語重要度という)が各関連
用語に対応付けて登録される。たとえば、「電気特性」
という語彙に対して、品質管理の分野では関連用語を
「漏電、短絡、過電流、電流」とし、商品企画の分野で
は関連用語を「電流、電圧、温度」とし、商品設計の分
野では関連用語を「電流、位相、リサジュ図、温度ドリ
フト」としているとすれば、表1のように分野別に関連
用語が分類され、さらに各関連用語ごとに数値による用
語重要度が対応付けられる。この例では「電気特性」に
対して「漏電、短絡、過電流、温度ドリフト」などは不
利益を連想させる語彙ではあるが重要な語彙であるか
ら、「電気特性」の関連用語として関連用語データベー
スDB5に登録される。なお、用語重要度を設定する方
法については詳しく説明しないが、各分野で当該語彙が
使用されている文書数と、1つの文書中での語彙の出現
度数とに基づいて設定する。
【0032】
【表1】
【0033】検索文解析手段15では、一次検索文入力
手段14を通して入力された一次検索文の品詞分解(形
態素解析)を行い、キーワードになる語彙(主として名
詞であるが、動詞、形容詞、副詞、形容動詞も可能)を
抽出する。また、品詞分解により抽出した語彙に複合語
があれば複合語を抽出する。たとえば、一次検索文が
「製品の電気特性について」であるときには、一次検索
部を品詞データベースDB4に照合することによって、
「製品/の/電気/特性/に/ついて」という形で品詞
分解がなされる(ただし、/は品詞の区切りを示す)。
この一次検索文には「電気特性」という複合語が含まれ
るから、一次検索文は最終的に「製品/の/電気特性/
に/ついて」という形に変換される。一次検索文がこの
ように変換されることによって、キーワードとして「製
品」と「電気特性」とが採用される。
【0034】一次検索文からキーワードとして採用する
語彙が決定されると、各キーワードは関連用語データベ
ースDB5に照合され、検索文解析手段15により抽出
されたキーワードに対して関連用語が存在するときに
は、どのキーワードに関連用語が存在するかが利用者に
提示される。関連用語は分野別に異なるから分野の指定
が可能になっており、検索文解析手段15では指定され
た分野について関連用語を照合する。ここで利用者が特
定のキーワードについて関連用語の提示を希望すれば、
そのキーワードについて関連用語の一覧が用語重要度と
ともに提示され、利用者は用語重要度を参照しながら所
望の関連用語を選択することが可能になる。二次検索文
生成手段16は、一次検索文から抽出したキーワード
と、関連データベースDB5に格納された関連用語のう
ち利用者が選択した関連用語とを用いて二次検索文を生
成する。
【0035】たとえば、上述のように1次検索文から抽
出したキーワードが「製品」と「電気特性」とであっ
て、関連用語データベースDB5には「電気特性」の関
連用語として表1の内容が登録されているものとし、か
つ利用者が分野として「品質管理」を指定したとする
と、関連用語としては「漏電、短絡、過電流、電流」が
抽出され、用語重要度とともに利用者に提示される。こ
こで、利用者が関連用語として「漏電」と「過電流」と
をしたとすると、キーワードが「製品」と「漏電」およ
び「過電流」とになるから、二次検索文生成手段16で
は「製品の漏電、過電流について」という二次検索文を
生成する。
【0036】一次検索文が入力され上述のような作業に
よって二次検索文が生成されると、実行検索文選択手段
17により一次検索文と二次検索文とが利用者に提示さ
れる。この段階で利用者は一次次検索文と二次検索文と
から検索に用いる検索文を選択することが可能になる。
ただし、本実施形態では一次検索文と二次検索文とから
1つの検索文のみを選択可能としてある。このようにし
て、一次検索文だけではなく二次検索文も利用者に提示
し、さらには二次検索文も用いて検索を可能とすること
によって、利用者が気付かなかったキーワードでの検索
が可能になるのである。
【0037】一次検索文と二次検索文とはいずれも自然
文であって、利用者がどの検索文を選択するかにかかわ
らず検索処理手段12には自然文による検索文が入力さ
れる。検索処理手段12では、上述したように自然文で
ある検索文から検索条件を抽出する。上述の例で二次検
索文を検索文として用いるとすれば、「製品の漏電、過
電流について」が検索文になるから、検索処理手段12
では「製品」「漏電」「過電流」の語彙を抽出し、「製
品」と「漏電」との論理積と、「製品」と「過電流」と
の論理積との論理和を検索条件として文書データベース
DB1に照合する。つまり、論理積の論理記号を∧、論
理和の論理記号を∨とすれば、製品∧(漏電∨過電流)
という検索条件を満たす文書を文書データベースDB1
から抽出するのである。
【0038】ところで、上述したように、検索処理手段
12は、文書データベースDB1に登録されている文書
と検索条件とを照合するだけではなく、各文書について
各分野ごとの文書重要度を対応付けた文書重要度データ
ベースDB2と、各文書ごとに過去に参照された頻度
(以下、参照頻度という)を対応付けた参照頻度データ
ベースDB3とを参照して抽出する文書を決定する。す
なわち、検索処理手段12では、検索条件として用いた
キーワードが文書中に出現する頻度(以下、出現頻度と
いう)、各文書の各分野別の文書重要度、各分野別の参
照頻度を評価データとして用いて各文書の評価尺度を求
め、検索条件を満たす文書の見出しを評価尺度の高い順
に並べて検索結果出力手段13に出力する。分野別の文
書重要度や参照頻度は、検索文設定手段11で指定され
た分野に関する文書重要度および参照頻度を用いる。文
書重要度データベースDB2と参照頻度データベースD
B3とのデータ例を表2、表3にそれぞれ示す。なお、
文書重要度データベースDB2に格納される文書重要度
は文書の登録者などによって設定される。
【0039】
【表2】
【0040】
【表3】
【0041】参照頻度としては、上述のようにして見出
しを抽出した文書の本文が要求された度数を用いてもよ
いが、本実施形態では文書が閲覧されると(文書の本文
が要求されると)、参照頻度データベースDB3に格納
されている参照頻度が大きいほど大きくなるように重み
付けした値を求め、この値を現在の参照頻度に加算す
る。また、各文書の閲覧後に利用者が入力する投票値を
集計した値を参照頻度に用いてもよい。前者の参照頻度
は本文が要求された回数の多いほど急速に大きくなり、
後者の参照頻度は各文書を閲覧した利用者に文書の利用
価値に関する投票値を複数段階で投票させるから利用者
の判断によって変化する。
【0042】評価尺度としては、次式によって求められ
る評価ポイントEPのほか、出現頻度、文書重要度、参
照頻度などが選択可能になっている。つまり、評価デー
タからの求め方の異なる複数種類の評価尺度から所望の
評価尺度を利用者が選択できるようになっている。 EP=ω1×出現頻度+ω2×文書重要度+ω3×参照
頻度 ただし、ω1,ω2,ω3は重み係数であり、出現頻
度、文書重要度、参照頻度の算出方法に応じて適宜に設
定される。たとえば、表4のように、出現頻度を文書中
の語彙数に対するキーワードの出現回数の百分率、文書
重要度を10段階の数値、参照頻度を参照回数とする場
合には、ω1=50、ω2=1、ω3=0.05などと
設定することができる。あるいはまた、出現頻度や参照
頻度が文書重要度と同程度の範囲の数値になるように正
規化している場合には、ω1=1.0、ω2=0.8、
ω3=1.2などと設定することができる。
【0043】
【表4】
【0044】上述のように評価ポイントEPの高い順に
文書を並べることは、検索文設定手段11で指定された
分野における文書重要度の順と当該分野における参照頻
度の順とを考慮し、文書重要度が高い順であってかつ参
照頻度の多い順に文書を並べたことになる。なお、評価
尺度として上式の評価ポイントの重み係数を変えた値を
用いることも可能である。出現頻度、文書重要度、参照
頻度を単独で評価尺度に用いたり、いずれか2つを組み
合わせて評価尺度に用いることは、いずれかの重み係数
を0に設定することに相当する。
【0045】検索処理手段12における処理手順を図2
に示す。検索処理手段12において検索が開始される
と、文書データベースDB1に検索条件が照合されて検
索が実行される(S1)。検索条件に合致する検索結果
は一旦メモリに格納される(S2)。また、検索処理手
段12では指定の分野を検索文設定手段11から取得し
(S3)、取得した分野について各文書に対応する文書
重要度を文書重要度データベースDB2から抽出する
(S4)とともに、参照頻度を参照頻度データベースD
B3から抽出する(S5)。このようにして求めた文書
重要度および参照頻度を用いてメモリに格納した文書を
並べ替え、結果を検索結果出力手段13に出力するので
ある(S6)。
【0046】以下では、具体的な作業手順を示して本実
施形態の動作を説明する。図3ないし図10に示す画面
はサーバ1に接続された端末2のディスプレイ装置に表
示されているものとする。文書の検索を開始する前に
は、まず図3に示す画面が端末2に表示される。この画
面には、一次検索文の入力を促すフィールドF1と、フ
ィールドF1に入力された一次検索文から抽出したキー
ワードに対する関連用語を表示するフィールドF2と、
文書の検索を行う分野を指定するフィールドF3とが設
けられる。フィールドF1の近傍には「検索実行」、
「語句拡張」、「リセット」の各ボタンB1〜B3が設
けられる。「検索実行」ボタンB1は一次検索文のみを
用いた文書検索の実行を指示する際に用い、「語句拡
張」ボタンB2は二次検索文の生成を指定する際に用
い、「リセット」ボタンB3はフィールドF1に書き込
んだ一次検索文を消去して新たな一次検索文の入力を指
示する際に用いる。
【0047】一次検索文入力手段14により端末2の画
面に提示されるフィールドF1の下方には、キーワード
の関連用語を表示するフィールドF2が設けられれ、フ
ィールドF2の右端部の上方および下方には、「二次検
索文で検索」と表記されたボタンB4が設けられる。さ
らに、フィールドF2の左端部の下方には、分野を指定
するためのフィールドF3が設けられる。さらに、フィ
ールドF3にはボタンB5が隣接して設けられる。ボタ
ンB5を操作すると(通常は、マウスのようなポインテ
ィングデバイスによりクリックすることを意味する)、
フィールドF3に対応するポップアップメニューが提示
され、ポップアップメニューに示された選択肢にカーソ
ルを合わせて選択すると(一般に、マウスのようなポイ
ンティングデバイスを用いるときにはカーソルを合わせ
てクリックすることを意味し、キーボードによる操作の
場合にはカーソルキーを用いてカーソルを合わせた後に
リターンキーを押下することを意味する)、フィールド
F3の内容が確定する。フィールドF3に対応する選択
肢は、文書データベースDB1に格納された文書に関連
する分野であって、本実施形態では、上述したように、
商品企画、商品開発、商品設計、製造技術、品質管理、
商品営業、トラブル記録の各分野が選択可能になってい
る。フィールドF1,F2が表示されている画面の右下
部には「ログアウト」と表記されたボタンB6が設けら
れ、このボタンB6は文書の検索処理を終了する際に操
作される。
【0048】いま、図4に示すように、「製品の電気特
性について」という一次検索部をフィールドF1に入力
すると、上述したように、検索文解析手段15におい
て、品詞データベースDB4を参照して形態素解析が行
われ、「製品」と「電気特性」とがキーワードとして抽
出される。ここで、「語句拡張」ボタンB2を操作する
と、検索文解析手段15では、キーワードを関連用語デ
ータベースDB5に照合し、関連用語データベースDB
5に関連用語の登録されているキーワードがあれば、当
該キーワードをフィールドF2の「拡張対象語句」欄に
表示するとともに、フィールドF2における「拡張実
行」欄に「語句検索」ボタンB13を表示する。このよ
うに、フィールドF2に「電気特性」が示されたことに
よって、「電気特性」には関連用語が登録されているこ
とが示される。
【0049】利用者が「電気特性」という語彙に関して
関連用語を知ろうとするときには、「語句拡張ボタン」
B2を操作すれば、図5に示すように、フィールドF3
において選択されている分野について、「電気特性」と
いう語彙の関連用語を一覧表示したフィールドF5が端
末2の画面に表示される。ここで、フィールドF5の上
方にはフィールドF5の中に示した関連用語が、どのよ
うな語彙に対する関連用語かを示すフィールドF4が設
けられる。図示例では、「商品設計」の分野における
「電気特性」の関連用語がフィールドF5に示されてい
る(表1の内容を想定している)。また、各関連用語に
は用語重要度が並記される。フィールドF5の右下方に
は「戻る」ボタンB7が設けられ、「戻る」ボタンB7
の操作によって1画面前の状態に戻ることができる。
【0050】図5のように関連用語がフィールドF5に
示された画面において、利用者は用語重要度を参照し
て、キーワードに用いる関連用語を選択することができ
る。つまり、図6に示すように、キーワードとして用い
ようとする関連用語を選択する(一般にはマウスカーソ
ルを関連用語付近でクリックする)と、各関連用語が反
転表示される(図における斜線部が反転表示された領
域)。図示例では、関連用語のうち「漏電」と「過電
流」とを選択した状態を示している。これは、商品設計
のような分野では「電気特性」のうち「電流」は重要な
語彙ではあるが、「品質管理」の分野ではあまり重要で
はなく、むしろ「漏電」「過電流」が重要になる。そこ
で、「品質管理」の分野で文書を検索しようとする利用
者は、「漏電」と「過電流」とを選択することになる。
「漏電」と「過電流」とを反転表示させた状態で「戻
る」ボタンB7を操作すると、図7に示すように、フィ
ールドF2における「拡張語句」欄に「漏電、過電流」
が表示される。つまり、端末2の画面には、フィールド
F1に一次検索文が表示され、一次検索文から抽出した
キーワードのうち利用者が関連用語データベースDB2
から選択した関連用語がフィールドF2に表示される。
なお、拡張語句を修正する必要があれば、「拡張語句」
欄を選択して他の語彙に修正することも可能である。
【0051】この状態で「二次検索文で検索」ボタンB
4を操作すると、二次検索文生成手段16によって自然
文である二次検索文が自動的に生成される。二次検索文
が生成されると、実行検索文選択手段17によって、図
8に示すように、新たに開いたウインドウW1内のフィ
ールドF6に二次検索文が表示される。ここでは関連用
語として「漏電」と「過電流」とが選択されているか
ら、「製品の漏電、過電流について」という二次検索文
が生成される。このウインドウW1の中では、生成した
二次検索文を用いて文書を検索するか否かが利用者に問
われ、利用者はウインドウW1内の「Yes」ボタンB
8と「No」ボタンB9とのいずれかを操作することに
なる。「Yes」ボタンB8を操作すればウインドウW
1が閉じて二次検索文を用いた検索が自動的に実行さ
れ、「No」ボタンB9を操作すればウインドウW1が
閉じて前画面に戻る。前画面では一次検索文がフィール
ドF1に表示されているから、「検索実行」ボタンB1
を操作すれば一次検索文による検索が可能になる。
【0052】一次検索文と二次検索文との一方を選択し
て検索の実行を指示すれば、検索処理手段12によって
文書データベースDB1が検索され、文書重要度データ
ベースDB2および参照頻度データベースDB3を参照
して条件に合った文書が抽出され、上述した評価ポイン
トEPを用いて、評価ポイントEPの高い順に抽出され
た文書の見出しが並べられる。つまり、図9に示すよう
に、フィールドF1には検索を実行した検索文(ここで
は、二次検索文)が示され、フィールドF1の下方に表
示されるフィールドF7には、評価尺度の種類および算
出方法が示される。図示例では評価尺度として評価ポイ
ントEPを用いているから、評価ポイントEPの演算式
が示される。フィールドF7の下方に表示されるフィー
ルドF8には、文書の所在(ファイル名)、評価ポイン
トEP、文書の見出しが一覧表示される。フィールドF
8には各文書に対応する「表示」ボタンB10が設けら
れ、「表示」ボタンB10の操作によって、見出しが示
された文書の本文が画面に表示される。
【0053】図9に示す画面内でフィールドF8の左下
方に設けたフィールドF11では、抽出した文書を並べ
るための評価尺度を利用者に選択させる。すなわち、フ
ィールドF11にはボタンB14が並設され、ボタンB
14を操作するとポップアップメニューが示され、この
ポップアップメニューには選択肢として「評価ポイン
ト」のほか、「出現頻度」「文書重要度」「参照頻度」
など異なる複数種類の評価尺度が用意されている。検索
処理手段12により抽出された文書は、ポップアップメ
ニューにより選択した評価尺度に従って並べ替えられ、
利用者は様々な評価尺度の順で文書の見出しを並べ替え
ることができ、検索意図に合う文書を探し出す方法を様
々に選択することが可能になる。なお、フィールドF1
1に表示された評価尺度はフィールドF7にも示され
る。
【0054】上述のような作業によって文書データベー
スDB1から検索意図に合致する文書を抽出した後に
は、図10に示すように、分野を示すフィールドF9
と、抽出した文書を示すフィールドF10とを備えた画
面が表示される。この画面には、抽出された文書に対し
て利用者の投票値を入力する欄が設けられ、「大変役に
立った」「役に立った」「あまり役に立たなかった」と
いう3段階で文書の利用価値を投票するようになってい
る。各段階の項目にはラジオボタンB12が付設され、
いずれかのラジオボタンB12を選択することによって
投票値が入力されるようにしてある。この画面で入力さ
れた投票値は、上述のように参照頻度データベースDB
3の参照頻度の演算に用いられる。つまり、「大変役に
立った」に対応する投票値に対しては参照頻度の加算値
を大きくし、「あまり役に立たなかった」に対応する投
票値に対しては参照頻度の加算値を小さくする。また、
投票値は文書重要度データベースDB2に格納された文
書重要度に対する補正値としても用いられる。つまり、
文書重要度データベースDB2には、投票値に基づいて
設定される補正値を各文書に対応付けて各分野ごとに格
納する領域があり、投票値に基づいて設定した補正値が
以後の検索において用いられることになる。この補正値
は、「大変役に立った」に対応する投票値に対しては文
書重要度を大きくするように設定され、「あまり役に立
たなかった」に対応する投票値に対しては文書重要度を
小さくするように設定される。
【0055】上述した本実施形態の処理手順の全体を図
11に示す。すなわち、文書データベースDB1から文
書を検索しようとするときには、まず利用者によって一
次検索文が入力される(S1)。入力された一次検索文
を品詞分解し(S2)、一次検索文から抽出したキーワ
ードに対する関連用語が関連用語データベースDB5に
登録されているときには(S3)、利用者によって関連
用語を用いるように指定されると二次検索文を自動的に
生成する(S4)。生成された二次検索文を利用者に提
示し、二次検索式を用いるか否かを選択させる(S
5)。ここに、関連用語がなければ一次検索文を用いて
検索することになる。検索式が決定されると検索を実行
し(S6)、検索結果として複数の文書が抽出されたと
きには(S7)、評価尺度の高い順に並べ替える(S
8)。また、抽出された文書が1つであればそのまま出
力される。このようにして抽出された文書の本文の閲覧
が利用者に要求されたときには文書が参照されたものと
みなし(S9)、参照回数を更新する(S10)。ま
た、参照されなければそのまま終了する。
【0056】
【発明の効果】請求項1の発明は、特定の複数分野の範
囲内で用いる複数の文書が格納された文書データベース
と、利用者に検索文を設定させるとともに検索範囲の分
野を指定させる検索文設定手段と、検索文設定手段によ
り設定された検索文の検索条件に合致する文書を文書デ
ータベースから抽出する検索処理手段と、検索処理手段
での検索結果を出力する検索結果出力手段とを備え、検
索処理手段は、文書データベースに登録された各文書ご
とに分野別に分類された評価データに基づいて各文書の
各分野における評価尺度を求める機能と、求め方の異な
る複数種類の評価尺度から所望の評価尺度を利用者に選
択させる機能と、抽出した各文書ごとに検索文設定手段
で指定された分野に関して利用者が選択した種類の評価
尺度を求めるとともに当該評価尺度の大小順に並べて検
索結果として検索結果出力手段に引き渡す機能とを有す
るものであり、各文書の利用価値を分野別に評価した評
価尺度を用いて検索結果を評価尺度の大小順に並べて出
力するから、利用者の検索意図にあった文書である可能
性が高い文書から優先して提示することができ、利用者
にとって不要なノイズである文書について考慮すること
なく目的の文書を抽出できる可能性が高くなる。しか
も、複数種類の評価尺度から利用者が所望の評価尺度を
選択するから、異なる評価尺度を用いることによって文
書の並び順を変えることができ、目的に応じた評価尺度
を選択することで目的の文書に到達できる可能性を高め
ることができる。
【0057】請求項2の発明は、請求項1の発明におい
て、前記検索文設定手段が、利用者にキーワードを含む
自然文である一次検索文を入力させる一次検索文入力手
段と、一次検索文からキーワードを抽出する検索文解析
手段と、キーワードとなる語彙に対する関連用語が前記
分野別に登録された関連用語データベースと、検索文解
析手段により抽出したキーワードを関連用語データベー
スに照合し検索文解析手段で抽出したキーワードに対す
る関連用語を用いた二次検索文を生成する機能を有した
二次検索文生成手段と、一次検索文と二次検索文とから
前記検索処理手段に与える検索文を利用者に選択させる
実行検索文選択手段とから成るものであり、キーワード
を拡張する関連用語が分野別に分類されているから、キ
ーワードを拡張して検索漏れを少なくしながらも、分野
を制限することによって不要なノイズが含まれる可能性
を低減することができる。
【0058】請求項3の発明は、請求項2の発明におい
て、前記関連用語データベースには、キーワードとなる
語彙の類義語に加えて各分野において特定の関連性を有
する語彙が関連用語として登録されるとともに、各関連
用語に各分野での利用価値の目安となる用語重要度が対
応付けられ、前記二次検索文生成手段では用語重要度を
関連用語とともに利用者に示して関連用語から利用者の
希望する関連用語を選択させるものであり、関連用語に
分野別の用語重要度を設定しているから、関連用語とし
て拡張する語彙の有効性の目安を用語重要度によって利
用者に与えることができ、キーワードの拡張範囲を利用
者に選択させることができるから、抽出された文書のう
ちで検索意図に合致しないノイズとなる文書数を低減さ
せることができる。つまり、利用者の検索意図に合致す
る文書を抽出できる可能性が高くなる。
【0059】請求項4の発明は、請求項1ないし請求項
3の発明において、前記文書データベースに登録された
各文書ごとの各分野での利用価値を前記評価データとな
る文書重要度として登録した文書重要度データベースを
備え、前記検索処理手段では、文書重要度が前記評価尺
度の選択肢の一つとして選択されると、前記検索条件に
より抽出した文書を文書重要度データベースに照合する
ことにより文書重要度を前記評価尺度に用いて文書を並
べるものであり、各分野での文書の利用価値を文書重要
度として設定しているから、文書重要度を登録者が設定
するようにすれば、目的の文書の各分野での利用価値を
人の意思に従って配列することができ、利用価値の高い
文書ほど高い順位で提示される可能性が高くなる。
【0060】請求項5の発明は、請求項1ないし請求項
3の発明において、前記文書データベースに登録された
各文書ごとの各分野別の参照頻度を前記評価データとし
て登録した参照頻度データベースを備え、前記検索処理
手段では、参照頻度が前記評価尺度の選択肢の一つとし
て選択されると、前記検索条件により抽出した文書を参
照頻度データベースに照合することにより参照頻度を前
記評価尺度に用いて文書を並べるものであり、参照頻度
の高い文書つまり利用実績の多い文書ほど高い順位で提
示されることになる。
【0061】請求項6の発明は、請求項2または請求項
3の発明において、前記文書データベースに登録された
各文書ごとの各分野での利用価値を前記評価データとな
る文書重要度として登録した文書重要度データベース
と、前記文書データベースに登録された各文書ごとの各
分野別の参照頻度を前記評価データとして登録した参照
頻度データベースとを備え、前記検索処理手段では、抽
出した各文書中でのキーワードの出現頻度と文書重要度
と参照頻度とを重み付け加算した評価ポイントが前記評
価尺度の選択肢の一つとして選択されると、前記検索条
件により抽出した文書を文書重要度データベースおよび
参照頻度データベースに照合するとともに抽出した各文
書中でのキーワードの出現頻度を求めることにより評価
ポイントを求め、この評価ポイントを前記評価尺度に用
いて文書を並べるものであり、出現頻度と文書重要度と
参照頻度とを総合的に考慮した順位で文書が提示される
ことになり、目的とする文書が高い順位で提示される確
率が高くなる。
【0062】請求項7の発明は、請求項5または請求項
6の発明において、前記検索処理手段では、前記文書デ
ータベースに登録された文書が参照されたときに、前記
参照頻度データベースに登録されている参照頻度が大き
いほど大きい値を参照頻度に加算するものであり、参照
頻度を重視した順位付けが可能になる。
【0063】請求項8の発明は、請求項5または請求項
6の発明において、前記検索処理手段では、前記文書デ
ータベースに登録された文書が参照されたときに利用者
に利用価値に相当する投票値を入力させ、投票値の合計
を参照頻度に用いるものであり、利用者による利用価値
の判断によって提示される順位が決まるから利用価値が
高いと認識される文書ほど上位で提示されることにな
る。
【0064】請求項9の発明は、請求項4または請求項
6の発明において、前記検索処理手段では、前記文書デ
ータベースに登録された文書が参照されたときに利用者
に利用価値に相当する投票値を入力させ、前記文書重要
度データベースに登録された当該文書の文書重要度を投
票値が大きいほど大きくするように補正するものであ
り、文書重要度が利用者による利用価値の判断によって
補正されるから、利用者の価値判断に対応した文書を抽
出しやすくなる。
【0065】請求項10の発明は、特定の複数分野の範
囲内で用いる複数の文書が格納された文書データベース
から目的の文書を検索する方法であって、利用者に検索
文を設定させるとともに検索範囲の分野を指定させた
後、設定された検索文の検索条件に合致する文書を文書
データベースから抽出し、さらに各文書ごとに分野別に
分類された評価データから求められる各文書の各分野で
の評価尺度を、求め方の異なる複数種類から利用者に選
択させ、次に抽出した各文書ごとに指定された分野に関
して選択された種類の評価尺度を求めるとともに抽出し
た文書を当該評価尺度の大小順に並べて検索結果として
出力することを特徴としており、各文書の利用価値を分
野別に評価した評価尺度を用いて、検索結果を評価尺度
の大小順に並べて出力するから、利用者の検索意図にあ
った文書である可能性が高い文書から優先して提示する
ことができ、利用者にとって不要なノイズである文書に
ついて考慮することなく目的の文書を抽出できる可能性
が高くなる。しかも、複数種類の評価尺度から利用者が
所望の評価尺度を選択するから、異なる評価尺度を用い
ることによって文書の並び順を変えることができ、目的
に応じた評価尺度を選択することで目的の文書に到達で
きる可能性を高めることができる。
【0066】請求項11の発明は、請求項10の発明に
おいて、利用者にキーワードを含む自然文である一次検
索文を入力させた後、一次検索文からキーワードを抽出
し、次にキーワードとなる語彙に対する関連用語が前記
分野別に登録された関連用語データベースに一次検索文
から抽出したキーワードを照合して関連用語を用いた二
次検索文を生成し、一次検索文と二次検索文とから利用
者に前記検索文を選択させることを特徴としており、キ
ーワードを拡張する関連用語が分野別に分類されている
から、キーワードを拡張して検索漏れを少なくしながら
も、分野を制限することによって不要なノイズが含まれ
る可能性を低減することができる。
【0067】請求項12の発明は、請求項10または請
求項11の発明において、前記文書データベースに登録
されている各文書ごとの各分野での利用価値である文書
重要度と、前記文書データベースに登録されている各文
書ごとの各分野別の参照頻度と、前記文書データベース
から検索条件により抽出した各文書中でのキーワードの
出現頻度とのうちの少なくとも1つを前記評価尺度に用
いて文書を並べることを特徴としており、文書重要度を
評価尺度に用いると文書重要度の設定者の意図に従った
順位で文書を抽出することができ、参照頻度を評価尺度
に用いると文書の利用実績に従った順位で文書を抽出す
ることができ、出現頻度を評価尺度に用いると文書自身
の客観的な評価尺度に従う順位で文書を抽出することが
できる。したがって、これらを総合した評価尺度を用い
ると目的の文書を上位に配置して提示できる可能性が高
くなる。
【0068】請求項13の発明は、請求項12の発明に
おいて、前記文書データベースに登録された文書が参照
されたときに利用者に利用価値に相当する投票値を入力
させ、投票値の合計を参照頻度に用いることを特徴とし
ており、利用者による利用価値の判断によって提示され
る順位が決まるから利用価値が高いと認識される文書ほ
ど上位で提示されることになる。
【0069】請求項14の発明は、請求項12の発明に
おいて、前記文書データベースに登録された文書が参照
されたときに利用者に利用価値に相当する投票値を入力
させ、当該文書の文書重要度を投票値が大きいほど大き
くするように補正することを特徴としており、文書重要
度が利用者による利用価値の判断によって補正されるか
ら、利用者の価値判断に対応した文書を抽出しやすくな
る。
【図面の簡単な説明】
【図1】本発明の実施形態を示すブロック図である。
【図2】同上に用いる検索処理手段の動作説明図であ
る。
【図3】同上の動作説明図である。
【図4】同上の動作説明図である。
【図5】同上の動作説明図である。
【図6】同上の動作説明図である。
【図7】同上の動作説明図である。
【図8】同上の動作説明図である。
【図9】同上の動作説明図である。
【図10】同上の動作説明図である。
【図11】同上の全体の処理手順を示す動作説明図であ
る。
【符号の説明】
1 サーバ 2 端末 11 検索文設定手段 12 検索処理手段 13 検索結果出力手段 14 一次検索文入力手段 15 検索文解析手段 16 二次検索文生成手段 DB1 文書データベース DB2 文書重要度データベース DB3 参照頻度データベース DB4 品詞データベース DB5 関連用語データベース
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成13年11月28日(2001.11.
28)
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】図9
【補正方法】変更
【補正内容】
【図9】

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 特定の複数分野の範囲内で用いる複数の
    文書が格納された文書データベースと、利用者に検索文
    を設定させるとともに検索範囲の分野を指定させる検索
    文設定手段と、検索文設定手段により設定された検索文
    の検索条件に合致する文書を文書データベースから抽出
    する検索処理手段と、検索処理手段での検索結果を出力
    する検索結果出力手段とを備え、検索処理手段は、文書
    データベースに登録された各文書ごとに分野別に分類さ
    れた評価データに基づいて各文書の各分野における評価
    尺度を求める機能と、求め方の異なる複数種類の評価尺
    度から所望の評価尺度を利用者に選択させる機能と、抽
    出した各文書ごとに検索文設定手段で指定された分野に
    関して利用者が選択した種類の評価尺度を求めるととも
    に当該評価尺度の大小順に並べて検索結果として検索結
    果出力手段に引き渡す機能とを有することを特徴とする
    文書検索システム。
  2. 【請求項2】 前記検索文設定手段が、利用者にキーワ
    ードを含む自然文である一次検索文を入力させる一次検
    索文入力手段と、一次検索文からキーワードを抽出する
    検索文解析手段と、キーワードとなる語彙に対する関連
    用語が前記分野別に登録された関連用語データベース
    と、検索文解析手段により抽出したキーワードを関連用
    語データベースに照合し検索文解析手段で抽出したキー
    ワードに対する関連用語を用いた二次検索文を生成する
    機能を有した二次検索文生成手段と、一次検索文と二次
    検索文とから前記検索処理手段に与える検索文を利用者
    に選択させる実行検索文選択手段とから成ることを特徴
    とする請求項1記載の文書検索システム。
  3. 【請求項3】 前記関連用語データベースには、キーワ
    ードとなる語彙の類義語に加えて各分野において特定の
    関連性を有する語彙が関連用語として登録されるととも
    に、各関連用語に各分野での利用価値の目安となる用語
    重要度が対応付けられ、前記二次検索文生成手段では用
    語重要度を関連用語とともに利用者に示して関連用語か
    ら利用者の希望する関連用語を選択させることを特徴と
    する請求項2記載の文書検索システム。
  4. 【請求項4】 前記文書データベースに登録された各文
    書ごとの各分野での利用価値を前記評価データとなる文
    書重要度として登録した文書重要度データベースを備
    え、前記検索処理手段では、文書重要度が前記評価尺度
    の選択肢の一つとして選択されると、前記検索条件によ
    り抽出した文書を文書重要度データベースに照合するこ
    とにより文書重要度を前記評価尺度に用いて文書を並べ
    ることを特徴とする請求項1ないし請求項3のいずれか
    1項に記載の文書検索システム。
  5. 【請求項5】 前記文書データベースに登録された各文
    書ごとの各分野別の参照頻度を前記評価データとして登
    録した参照頻度データベースを備え、前記検索処理手段
    では、参照頻度が前記評価尺度の選択肢の一つとして選
    択されると、前記検索条件により抽出した文書を参照頻
    度データベースに照合することにより参照頻度を前記評
    価尺度に用いて文書を並べることを特徴とする請求項1
    ないし請求項3のいずれか1項に記載の文書検索システ
    ム。
  6. 【請求項6】 前記文書データベースに登録された各文
    書ごとの各分野での利用価値を前記評価データとなる文
    書重要度として登録した文書重要度データベースと、前
    記文書データベースに登録された各文書ごとの各分野別
    の参照頻度を前記評価データとして登録した参照頻度デ
    ータベースとを備え、前記検索処理手段では、抽出した
    各文書中でのキーワードの出現頻度と文書重要度と参照
    頻度とを重み付け加算した評価ポイントが前記評価尺度
    の選択肢の一つとして選択されると、前記検索条件によ
    り抽出した文書を文書重要度データベースおよび参照頻
    度データベースに照合するとともに抽出した各文書中で
    のキーワードの出現頻度を求めることにより評価ポイン
    トを求め、この評価ポイントを前記評価尺度に用いて文
    書を並べることを特徴とする請求項2または請求項3記
    載の文書検索システム。
  7. 【請求項7】 前記検索処理手段では、前記文書データ
    ベースに登録された文書が参照されたときに、前記参照
    頻度データベースに登録されている参照頻度が大きいほ
    ど大きい値を参照頻度に加算することを特徴とする請求
    項5または請求項6記載の文書検索システム。
  8. 【請求項8】 前記検索処理手段では、前記文書データ
    ベースに登録された文書が参照されたときに利用者に利
    用価値に相当する投票値を入力させ、投票値の合計を参
    照頻度に用いることを特徴とする請求項5または請求項
    6記載の文書検索システム。
  9. 【請求項9】 前記検索処理手段では、前記文書データ
    ベースに登録された文書が参照されたときに利用者に利
    用価値に相当する投票値を入力させ、前記文書重要度デ
    ータベースに登録された当該文書の文書重要度を投票値
    が大きいほど大きくするように補正することを特徴とす
    る請求項4または請求項6記載の文書検索システム。
  10. 【請求項10】 特定の複数分野の範囲内で用いる複数
    の文書が格納された文書データベースから目的の文書を
    検索する方法であって、利用者に検索文を設定させると
    ともに検索範囲の分野を指定させた後、設定された検索
    文の検索条件に合致する文書を文書データベースから抽
    出し、さらに各文書ごとに分野別に分類された評価デー
    タから求められる各文書の各分野での評価尺度を、求め
    方の異なる複数種類から利用者に選択させ、次に抽出し
    た各文書ごとに指定された分野に関して選択された種類
    の評価尺度を求めるとともに抽出した文書を当該評価尺
    度の大小順に並べて検索結果として出力することを特徴
    とする文書検索方法。
  11. 【請求項11】 利用者にキーワードを含む自然文であ
    る一次検索文を入力させた後、一次検索文からキーワー
    ドを抽出し、次にキーワードとなる語彙に対する関連用
    語が前記分野別に登録された関連用語データベースに一
    次検索文から抽出したキーワードを照合して関連用語を
    用いた二次検索文を生成し、一次検索文と二次検索文と
    から利用者に前記検索文を選択させることを特徴とする
    請求項10記載の文書検索方法。
  12. 【請求項12】 前記文書データベースに登録されてい
    る各文書ごとの各分野での利用価値である文書重要度
    と、前記文書データベースに登録されている各文書ごと
    の各分野別の参照頻度と、前記文書データベースから検
    索条件により抽出した各文書中でのキーワードの出現頻
    度とのうちの少なくとも1つを前記評価尺度に用いて文
    書を並べることを特徴とする請求項10または請求項1
    1記載の文書検索方法。
  13. 【請求項13】 前記文書データベースに登録された文
    書が参照されたときに利用者に利用価値に相当する投票
    値を入力させ、投票値の合計を参照頻度に用いることを
    特徴とする請求項12記載の文書検索方法。
  14. 【請求項14】 前記文書データベースに登録された文
    書が参照されたときに利用者に利用価値に相当する投票
    値を入力させ、当該文書の文書重要度を投票値が大きい
    ほど大きくするように補正することを特徴とする請求項
    12記載の文書検索方法。
JP2001361625A 2001-11-27 2001-11-27 文書検索システム Expired - Fee Related JP3915488B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001361625A JP3915488B2 (ja) 2001-11-27 2001-11-27 文書検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001361625A JP3915488B2 (ja) 2001-11-27 2001-11-27 文書検索システム

Publications (2)

Publication Number Publication Date
JP2003162531A true JP2003162531A (ja) 2003-06-06
JP3915488B2 JP3915488B2 (ja) 2007-05-16

Family

ID=19172246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001361625A Expired - Fee Related JP3915488B2 (ja) 2001-11-27 2001-11-27 文書検索システム

Country Status (1)

Country Link
JP (1) JP3915488B2 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005234688A (ja) * 2004-02-17 2005-09-02 Ricoh Co Ltd 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
JP2006079365A (ja) * 2004-09-09 2006-03-23 Ricoh Co Ltd 情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体
JP2006099478A (ja) * 2004-09-29 2006-04-13 Toshiba Corp 文書分類装置および文書分類方法
JP2007500408A (ja) * 2003-06-13 2007-01-11 マイクロソフト コーポレーション データベースクエリユーザインターフェース
JP2008519332A (ja) * 2004-10-28 2008-06-05 ヤフー! インコーポレイテッド 信頼ネットワークを含むユーザ判断を一体化したサーチシステム及び方法
JP2008212248A (ja) * 2007-02-28 2008-09-18 Toshiba Corp 医用画像検索システム
JP2008276769A (ja) * 2007-04-26 2008-11-13 Nhn Corp キーワード提供範囲に基づいてキーワードを提供する方法およびそのシステム
WO2010087566A1 (en) * 2009-02-02 2010-08-05 Lg Electronics, Inc. Document analysis system
KR101078907B1 (ko) 2009-02-02 2011-11-01 엘지전자 주식회사 문서 평가 시스템
WO2016103409A1 (ja) * 2014-12-25 2016-06-30 株式会社日立製作所 検索システム
JP2016192142A (ja) * 2015-03-31 2016-11-10 株式会社図研プリサイト 検索制御装置、検索制御方法、および、検索制御プログラム
US9852187B2 (en) 2004-03-15 2017-12-26 Excalibur Ip, Llc Search system and methods with integration of user annotations from a trust network
JP2020021501A (ja) * 2019-10-04 2020-02-06 株式会社インタラクティブソリューションズ スライド検索装置、スライド検索システム、スライド検索方法及びスライド検索プログラム

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007500408A (ja) * 2003-06-13 2007-01-11 マイクロソフト コーポレーション データベースクエリユーザインターフェース
US8447775B2 (en) 2003-06-13 2013-05-21 Microsoft Corporation Database query user interface to assist in efficient and accurate query construction
JP2005234688A (ja) * 2004-02-17 2005-09-02 Ricoh Co Ltd 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
JP4574186B2 (ja) * 2004-02-17 2010-11-04 株式会社リコー 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
US9852187B2 (en) 2004-03-15 2017-12-26 Excalibur Ip, Llc Search system and methods with integration of user annotations from a trust network
US10726019B2 (en) 2004-03-15 2020-07-28 Slack Technologies, Inc. Search system and methods with integration of user annotations from a trust network
US11556544B2 (en) 2004-03-15 2023-01-17 Slack Technologies, Llc Search system and methods with integration of user annotations from a trust network
JP2006079365A (ja) * 2004-09-09 2006-03-23 Ricoh Co Ltd 情報検索システム、情報提供装置、情報検索方法、並びに、プログラムおよび記録媒体
JP2006099478A (ja) * 2004-09-29 2006-04-13 Toshiba Corp 文書分類装置および文書分類方法
JP2011170861A (ja) * 2004-10-28 2011-09-01 Yahoo Inc 信頼ネットワークを含むユーザ判断を一体化したサーチシステム及び方法
JP2014112407A (ja) * 2004-10-28 2014-06-19 Yahoo Inc 信頼ネットワークを含むユーザ判断を一体化したサーチシステム及び方法
JP2008519332A (ja) * 2004-10-28 2008-06-05 ヤフー! インコーポレイテッド 信頼ネットワークを含むユーザ判断を一体化したサーチシステム及び方法
US8306960B2 (en) 2007-02-28 2012-11-06 Kabushiki Kaisha Toshiba Medical image retrieval system
JP2008212248A (ja) * 2007-02-28 2008-09-18 Toshiba Corp 医用画像検索システム
JP2008276769A (ja) * 2007-04-26 2008-11-13 Nhn Corp キーワード提供範囲に基づいてキーワードを提供する方法およびそのシステム
KR101078907B1 (ko) 2009-02-02 2011-11-01 엘지전자 주식회사 문서 평가 시스템
WO2010087566A1 (en) * 2009-02-02 2010-08-05 Lg Electronics, Inc. Document analysis system
WO2016103409A1 (ja) * 2014-12-25 2016-06-30 株式会社日立製作所 検索システム
JP2016192142A (ja) * 2015-03-31 2016-11-10 株式会社図研プリサイト 検索制御装置、検索制御方法、および、検索制御プログラム
JP2020021501A (ja) * 2019-10-04 2020-02-06 株式会社インタラクティブソリューションズ スライド検索装置、スライド検索システム、スライド検索方法及びスライド検索プログラム
JP7126168B2 (ja) 2019-10-04 2022-08-26 株式会社インタラクティブソリューションズ スライド検索装置、スライド検索システム、スライド検索方法及びスライド検索プログラム

Also Published As

Publication number Publication date
JP3915488B2 (ja) 2007-05-16

Similar Documents

Publication Publication Date Title
US6442540B2 (en) Information retrieval apparatus and information retrieval method
US7890533B2 (en) Method and system for information extraction and modeling
JP3691844B2 (ja) 文書処理方法
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
US20100293162A1 (en) Automated Keyword Generation Method for Searching a Database
JP2004326216A (ja) 文書検索装置、方法、プログラム、及び記録媒体
JPH08255172A (ja) 文書検索システム
JP3915488B2 (ja) 文書検索システム
GB2528687A (en) Text auto-completion
US20120179709A1 (en) Apparatus, method and program product for searching document
JP2669601B2 (ja) 情報検索方法及びシステム
JP4967133B2 (ja) 情報取得装置、そのプログラム及び方法
JP5146108B2 (ja) 文書重要度算出システム、文書重要度算出方法およびプログラム
US7103591B2 (en) Method of describing business and technology information for utilization
Duke et al. Squirrel: An advanced semantic search and browse facility
Gretzel et al. Intelligent search support: Building search term associations for tourism-specific search engines
JP3743204B2 (ja) データ分析支援方法および装置
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP2002189744A (ja) Webページ検索システム
JP7238411B2 (ja) 情報処理装置及びプログラム
JP2003108584A (ja) 情報検索システム及びプログラム
JP2000067126A (ja) スケジュール情報処理装置および表示情報処理装置ならびにスケジュールおよび表示情報処理制御プログラムを記憶した媒体
US20080228725A1 (en) Problem/function-oriented searching method for a patent database system
JP2015125594A (ja) 情報処理装置、情報処理方法、プログラム
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060919

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070129

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140216

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees