JP2005173847A - 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体 - Google Patents
情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2005173847A JP2005173847A JP2003411145A JP2003411145A JP2005173847A JP 2005173847 A JP2005173847 A JP 2005173847A JP 2003411145 A JP2003411145 A JP 2003411145A JP 2003411145 A JP2003411145 A JP 2003411145A JP 2005173847 A JP2005173847 A JP 2005173847A
- Authority
- JP
- Japan
- Prior art keywords
- search
- keyword
- unit
- evaluation
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】検索キーワード生成部12と検索キーワードの有用度を評価する検索キーワード評価部13と検索対象文書の有用度を評価する検索対象文書評価部14と検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成部15と生成された検索条件式に基づいて検索を実行する検索部16と検索結果の有用度を評価する検索結果評価部とを有し検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返す機能を備えた。
【選択図】 図1
Description
以下に、情報検索装置の従来例を説明する。
以下、「キーワードならびに自然文による情報検索」の例を従来例1として説明する。
以下、「シソーラス技術を用いた情報検索」を従来例2として説明する。一般に利用されているシソーラス技術を用いた情報検索では、目的の情報に含まれると思われるキーワードならびにそのキーワードの記述表現を推測、その推測から検索文を指定、検索を実施する。ただしその際、検索文で指定されたキーワードは、シソーラス技術により類義語や同義語、類似記述表現が追加された上で、検索が実施される。
以下、「検索条件式緩和による段階情報検索」を従来例3として説明する。検索条件式緩和による段階情報検索では、検索キーワードや検索対象文書を評価せずに、検索結果のみの評価によって、検索条件を緩やかにしていくのが一般的である。
以下、特許文献1を従来例4として説明する。従来例4は、詳細に指定したために、かえって該当する情報が得られなかった場合でも、利用者が検索条件を再指定することなく、必要とする情報を含む期待数の検索結果をデータベースから抽出することを可能とする情報検索装置に関するものである。
以下、特許文献2を従来例5として説明する。従来例5は、検索結果をチェックしながら、検索条件を順次加えていったり、上位概念を用いて再試行するなどして段階的に検索を行う情報検索方式に関するものである。
以下、特許文献3を従来例6として説明する。従来例6は、論理構造の異なる複数の文書に対する検索においても、高い再現率で検索可能にする構造化文書検索装置に関するものである。この構造化文書検索装置では、検索式が入力されると、検索式生成手段が検索式に示された検索条件を段階的に緩やかな条件に書き換え条件緩和検索式を生成する。
(1) :前記従来例1では、目的の情報が見つかるまで、検索文の変更(キーワードの推測)、検索実施、検索結果の確認といった試行錯誤の繰り返しとなるのだが、検索文で指定されたキーワードの記述表現と目的の情報の記述表現が一致しない場合、目的の情報が検索されない。また、キーワードならびに自然文による情報検索では、検索者は目的の情報で使用されている記述表現を探し当てるための試行錯誤に手間がかかってしまう。
本発明は前記の目的を達成するため、次のように構成した。
図1は本発明の原理説明図である。以下、図1を参照しながら、前記構成の作用を説明する。
請求項1乃至5によれば次のような効果がある。
図2は情報検索装置の構成図である。以下、図2に基づいて情報検索装置の構成例を説明する。この情報検索装置は、情報検索装置本体1と、該情報検索装置1に接続されたデータ入力部2、表示装置3、外部記憶装置4等で構成されている。そして、前記情報検索装置本体1には、入力取得部11、検索キーワード生成部12、検索キーワード評価部13、検索対象文書評価部14、検索条件式生成部15、検索部16、検索結果評価部17、結果一覧評価部18、結果表示部19、ワークメモリ20等が設けてある。
表記品質によるスコア 指定されたキーワード>正式表現>言い換え>関連
品詞によるスコア 名詞>動詞>助詞
検索対象文書評価部14は、検索キーワード生成部12によって生成された検索キーワード並びに検索キーワード評価部13により付与された追加キーワードの検索対象文書中での組み合わせスコア(キーワードスコア、頻度、出現順、近接度など)を算出、組み合わせが複数ある場合には、それぞれの組み合わせのスコアを算出することで、検索対象文書の評価を行うものである。
図3は情報検索装置の詳細な構成と機能の説明図である。以下、図3に基づいて、図2に示した情報検索装置の各部の詳細な構成と機能を説明する。
図4は情報検索装置全体の処理フローチャートである。以下、図4に基づいて情報検索装置全体の処理を説明する。なお、S1〜S10は各処理ステップを示す。
以下、前記情報検索装置の各部について詳細に説明する。
図5のA図は検索キーワード評価部の処理説明図である。検索キーワード評価部13はキーワード評価プログラム34によりキーワードスコアデータベース35を検索しながら検索キーワード評価処理を行う。この場合、キーワードスコアデータベース35には図5のA図に示したようなキーワードスコア表が格納されており、このキーワードスコア表には、キーワード、表記品質、品詞、スコアの各項目が格納されている。
図5のB図は検索対象文書評価部の処理説明図である。検索対象文書評価部14は、文書評価プログラム36により文書データベース37の文書を検索しながら検索対象文書評価処理を行う。この場合、文書データベース37には図5のB図に示したような文書スコア表が格納されており、この文書スコア表には、キーワード、表記品質、品詞、スコアの各項目がある。
図6のA図は検索結果評価部の処理説明図である。検索結果評価部17は、結果評価プログラム41により検索結果評価処理を行う。この場合、検索結果評価部17は、検索結果の合計スコア(件数、文書個々のスコアなどの総計)を算出、特定の値を満たすまで条件式作成から条件式の変更を繰り返す。
図6のB図は結果一覧評価部の処理説明図である。前記のように、検索結果評価部17の結果評価プログラム41により検索結果評価処理を行い、評価OKとなったら、結果一覧評価部18の一覧評価プログラム42により一覧評価処理を行い、一覧作成プログラム43が一覧(一覧データ)を作成する。
(1) :切り出し辞書のデータ構造例
図7のA図は切り出し辞書のデータ構造例を示す図である。切り出し辞書33は、検索キーワード生成部12の語句切出プログラム32が検索キーワードの生成時に参照する辞書(図3参照)である。
図7のB図はキーワードスコアデータベースのデータ構造例を示す図である。キーワードスコアデータベース35(図3参照)は、検索キーワード評価部13が検索キーワードの評価を行う時に検索するデータベースである。
図8は文書データベースのデータ構造例を示す図である。文書データベース37は、検索対象文書評価部14の文書評価プログラム36が検索対象文書評価処理を行う時に検索するものである(図3参照)。
図9は具体的な装置例である。前記情報検索装置は、ワークステーション、パーソナルコンピュータ等の任意のコンピュータにより実現することができる。この装置は、コンピュータ本体51と、該コンピュータ本体51に接続された表示装置3、入力装置(キーボード/マウス等)52、リムーバブルディスクドライブ(「RDD」という)53、ハードディスク装置(「HDD」という)54等で構成されている。
前記の例では、本発明の情報検索装置を1台のコンピュータ(例えば、パーソナルコンピュータ、ワークステーション等)で構成したが、本発明はこのような例に限らず、次のようにしても実施可能である。
1 情報検索装置本体
2 データ入力部
3 表示装置
4 外部記憶装置
11 入力取得部
12 検索キーワード生成部
13 検索キーワード評価部
14 検索対象文書評価部
15 検索条件式生成部
16 検索部
17 検索結果評価部
18 結果一覧評価部18
19 結果表示部
20 ワークメモリ
51 コンピュータ本体
52 入力装置(キーボード/マウス等)
54 ハードディスク装置(HDD)
55 CPU
56 ROM
57 メモリ
58 I/F制御部
59 通信制御部
Claims (5)
- 入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成部と、
前記検索キーワード生成部で生成された検索キーワードの有用度を評価する検索キーワード評価部と、
検索対象文書の有用度を評価する検索対象文書評価部と、
前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成部と、
前記検索条件式生成部で生成された検索条件式に基づき検索を実行する検索部と、
前記検索部による検索結果の有用度を評価する検索結果評価部とを有し、
前記検索条件式生成部、検索部及び検索結果評価部とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得る機能を備えていることを特徴とする情報検索装置。 - 前記検索結果評価部の評価で特定のヒット率が得られたら、検索結果評価部で得られた結果一覧を評価する結果一覧評価部と、
前記結果一覧評価部により評価された結果一覧を、表示装置の画面に表示する結果表示部と、
を備えていることを特徴とする請求項1記載の情報検索装置。 - 入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成手順と、
前記検索キーワード生成手順で生成された検索キーワードの有用度を評価する検索キーワード評価手順と、
検索対象文書の有用度を評価する検索対象文書評価手順と、
前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成手順と、
前記検索条件式生成手順で生成された検索条件式に基づき検索を実行する検索手順と、 前記検索手順による検索結果の有用度を評価する検索結果評価手順とを有し、
前記検索条件式生成手順、検索手順及び検索結果評価手順とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得ることを特徴とする情報検索方法。 - コンピュータに、
入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成部と、
前記検索キーワード生成部で生成された検索キーワードの有用度を評価する検索キーワード評価部と、
検索対象文書の有用度を評価する検索対象文書評価部と、
前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成部と、
前記検索条件式生成部で生成された検索条件式に基づき検索を実行する検索部と、
前記検索部による検索結果の有用度を評価する検索結果評価部とを有し、
前記検索条件式生成部、検索部及び検索結果評価部とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得る機能を実現させるためのプログラム。 - コンピュータに、
入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成部と、
前記検索キーワード生成部で生成された検索キーワードの有用度を評価する検索キーワード評価部と、
検索対象文書の有用度を評価する検索対象文書評価部と、
前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成部と、
前記検索条件式生成部で生成された検索条件式に基づき検索を実行する検索部と、
前記検索部による検索結果の有用度を評価する検索結果評価部とを有し、
前記検索条件式生成部、検索部及び検索結果評価部とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得る機能を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003411145A JP2005173847A (ja) | 2003-12-10 | 2003-12-10 | 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003411145A JP2005173847A (ja) | 2003-12-10 | 2003-12-10 | 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005173847A true JP2005173847A (ja) | 2005-06-30 |
Family
ID=34731968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003411145A Pending JP2005173847A (ja) | 2003-12-10 | 2003-12-10 | 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005173847A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008032393A1 (en) * | 2006-09-15 | 2008-03-20 | Fujitsu Limited | Information processing method and device for work process analysis |
JP2011076264A (ja) * | 2009-09-29 | 2011-04-14 | Ntt Communications Kk | 検索制御装置、検索制御方法、及びプログラム |
WO2011118712A1 (ja) * | 2010-03-26 | 2011-09-29 | 楽天株式会社 | 検索システム、検索方法、検索プログラム及び記録媒体 |
US8713070B2 (en) | 2008-02-07 | 2014-04-29 | Fujitsu Limited | Business flow processing method and apparatus |
JP5639314B1 (ja) * | 2014-01-28 | 2014-12-10 | 楽天株式会社 | 検索装置、検索方法、記録媒体、および、プログラム |
CN105740223A (zh) * | 2014-12-08 | 2016-07-06 | 联想(北京)有限公司 | 信息处理设备和信息处理方法 |
JP2019074982A (ja) * | 2017-10-18 | 2019-05-16 | 三菱重工業株式会社 | 情報検索装置、検索処理方法、およびプログラム |
-
2003
- 2003-12-10 JP JP2003411145A patent/JP2005173847A/ja active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008032393A1 (en) * | 2006-09-15 | 2008-03-20 | Fujitsu Limited | Information processing method and device for work process analysis |
JP4832523B2 (ja) * | 2006-09-15 | 2011-12-07 | 富士通株式会社 | 業務プロセス分析のための情報処理方法及び装置 |
KR101125911B1 (ko) * | 2006-09-15 | 2012-03-26 | 후지쯔 가부시끼가이샤 | 업무 프로세스 분석을 위한 정보 처리 방법 및 장치 |
US8224762B2 (en) | 2006-09-15 | 2012-07-17 | Fujitsu Limited | Information processing method and apparatus for business process analysis |
US8713070B2 (en) | 2008-02-07 | 2014-04-29 | Fujitsu Limited | Business flow processing method and apparatus |
JP2011076264A (ja) * | 2009-09-29 | 2011-04-14 | Ntt Communications Kk | 検索制御装置、検索制御方法、及びプログラム |
US9542435B2 (en) | 2010-03-26 | 2017-01-10 | Rakuten, Inc. | Search system, search method, search program and storage medium for providing a stabilized number of output search results |
JP5174279B2 (ja) * | 2010-03-26 | 2013-04-03 | 楽天株式会社 | 検索システム、検索方法、検索プログラム及び記録媒体 |
WO2011118712A1 (ja) * | 2010-03-26 | 2011-09-29 | 楽天株式会社 | 検索システム、検索方法、検索プログラム及び記録媒体 |
JP5639314B1 (ja) * | 2014-01-28 | 2014-12-10 | 楽天株式会社 | 検索装置、検索方法、記録媒体、および、プログラム |
WO2015114731A1 (ja) * | 2014-01-28 | 2015-08-06 | 楽天株式会社 | 検索装置、検索方法、記録媒体、および、プログラム |
TWI503769B (zh) * | 2014-01-28 | 2015-10-11 | Rakuten Inc | A retrieval device, a retrieval method, a recording medium, and a program |
CN105740223A (zh) * | 2014-12-08 | 2016-07-06 | 联想(北京)有限公司 | 信息处理设备和信息处理方法 |
CN105740223B (zh) * | 2014-12-08 | 2019-04-26 | 联想(北京)有限公司 | 信息处理设备和信息处理方法 |
JP2019074982A (ja) * | 2017-10-18 | 2019-05-16 | 三菱重工業株式会社 | 情報検索装置、検索処理方法、およびプログラム |
JP7016237B2 (ja) | 2017-10-18 | 2022-02-04 | 三菱重工業株式会社 | 情報検索装置、検索処理方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5169816B2 (ja) | 質問回答装置、質問回答方法および質問回答用プログラム | |
JP6828335B2 (ja) | 検索プログラム、検索装置および検索方法 | |
US11573989B2 (en) | Corpus specific generative query completion assistant | |
JP2011118689A (ja) | 検索方法及びシステム | |
JP2010287020A (ja) | 同義語展開システム及び同義語展開方法 | |
US7698271B2 (en) | Conceptual network generating system, conceptual network generating method, and program product therefor | |
CN100437561C (zh) | 电子文档的处理方法和装置及其*** | |
JP2005038395A (ja) | データベース検索装置 | |
JP2005173847A (ja) | 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体 | |
JP2006178599A (ja) | 文書検索装置および方法 | |
JP2008117351A (ja) | 検索システム | |
JP2008152641A (ja) | 類似例文検索装置 | |
JP2009277099A (ja) | 類似文書検索装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP5189413B2 (ja) | 音声データ検索システム | |
JP4745417B2 (ja) | 情報検索装置およびプログラム | |
KR102519955B1 (ko) | 토픽 키워드의 추출 장치 및 방법 | |
Qin et al. | Mining term association rules for heuristic query construction | |
KR101835994B1 (ko) | 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치 | |
JP2020071678A (ja) | 情報処理装置、制御方法、プログラム | |
JP4301496B2 (ja) | データベース検索装置、データベース検索方法およびプログラム | |
Rahimtoroghi et al. | A structural rule-based stemmer for Persian | |
JP2007193500A (ja) | 文書または図面作成支援装置 | |
JP2010003266A (ja) | クエリ生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP4574186B2 (ja) | 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 | |
JP7305077B2 (ja) | 情報処理装置、要約文出力方法、及び要約文出力プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061006 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090813 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090813 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090813 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090929 |