JP4398992B2 - 情報検索装置、情報検索方法及び情報検索プログラム - Google Patents
情報検索装置、情報検索方法及び情報検索プログラム Download PDFInfo
- Publication number
- JP4398992B2 JP4398992B2 JP2007087384A JP2007087384A JP4398992B2 JP 4398992 B2 JP4398992 B2 JP 4398992B2 JP 2007087384 A JP2007087384 A JP 2007087384A JP 2007087384 A JP2007087384 A JP 2007087384A JP 4398992 B2 JP4398992 B2 JP 4398992B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- document
- unit
- search
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1に示すように、デスクトップ検索装置100は、文書蓄積部101と、共起語句蓄積部102と、条件記憶部103と、履歴格納部104と、意味属性蓄積部105と、文書表示部106と、入力受付部107と、特徴語抽出部108と、意味属性取得部109と、条件抽出部110と、語句抽出部111と、語句表示処理部112と、語句選択受付部113と、検索部114と、検索結果表示処理部115と、抽出条件生成部116と、文書入力処理部117と、意味属性解析部118と、共起語句登録部119と、文書登録部120と、文書属性抽出部121と、検索条件登録部122と、を備える。
また、上述した各実施の形態に限定されるものではなく、以下に例示するような種々の変形が可能である。
101 文書蓄積部
102 共起語句蓄積部
103 条件記憶部
104 履歴格納部
105 意味属性蓄積部
106 表示処理部
106 文書表示部
107 入力受付部
108 特徴語抽出部
109 意味属性取得部
110 条件抽出部
111 語句抽出部
112 語句表示処理部
113 語句選択受付部
114 検索部
115 検索結果表示処理部
116 抽出条件生成部
117 文書入力処理部
118 意味属性解析部
119 共起関係解析部
120 文書登録部
121 文書属性抽出部
122 検索条件登録部
2501 CPU
2502 ROM
2503 RAM
2504 外部記憶装置
2505 表示装置
2506 入力装置
2507 通信I/F
2508 バス
Claims (10)
- 文書を蓄積する文書蓄積部と、
前記文書蓄積部に蓄積された前記文書に含まれ、検索キーになりうる第1の文字列に対して、当該第1の文字列と同一の文書に含まれ、当該第1の文字列と共起関係がある第2の文字列を、当該第1の文字列と共に検索キーとして用いられる文字列として、当該第2の文字列を抽象化した意味属性別に対応付けて記憶する文字列蓄積部と、
前記第2の文字列を抽象化した前記意味属性と、前記第1の文字列を抽象化した意味属性である又は前記第1の文字列を含む前記同一の文書から抽出した特徴語である特定情報と、を予め対応付けて記憶する条件記憶部と、
第1の文字列の入力を受け付ける入力受付部と、
入力された前記第1の文字列を抽象化した意味属性を特定情報として取得し、又は当該第1の文字列を含む文書から特徴語を抽出することで特定情報を取得する特定情報取得部と、
前記条件記憶部から、取得した前記特定情報と対応付けられている、前記第2の文字列を抽象化した前記意味属性を抽出する抽出部と、
前記文字列蓄積部から、入力された前記第1の文字列と対応付けられ、抽出された前記意味属性にかかる前記第2の文字列を抽出する文字列抽出部と、
入力された前記第1の文字列と、抽出された前記第2の文字列と、を含む文書を前記文書蓄積部から検索する検索部と、
を備えることを特徴とする情報検索装置。 - 前記文字列抽出部により抽出された前記第2の文字列を、利用者に対して提示する文字列提示処理部と、
提示された前記第2の文字列から、検索キーとして用いられる第2の文字列の選択を受け付ける文字列選択受付部と、を備え、
前記検索部は、前記第1の文字列と、選択を受け付けた前記第2の文字列とを含む文書を、前記文書蓄積部から検索すること、
を特徴とする請求項1に記載の情報検索装置。 - 前記条件記憶部は、前記特定情報として、第1の文字列の意味属性を示す属性情報と、前記意味属性とを対応付けて記憶し、
前記特定情報取得部は、前記第1の文字列から、当該第1の文字列を示す属性情報を取得する属性取得部を有し、
前記条件抽出部は、前記条件記憶部に基づいて、取得した前記属性情報と対応付けられている前記意味属性を抽出すること、
を特徴とする請求項1又は2に記載の情報検索装置。 - 前記条件記憶部は、前記特定情報として、前記文書から抽出された抽出文字列と、前記意味属性とを対応付けて記憶し、
前記特定情報取得部は、前記第1の文字列を含む文書から第3の文字列を抽出する文字列抽出部を有し、
前記条件抽出部は、前記条件記憶部に基づいて、抽出された前記第3の文字列と一致する前記抽出文字列と対応付けられている前記意味属性を抽出すること、
を特徴とする請求項1又は2に記載の情報検索装置。 - 利用者により検索キーとして選択された第1の文字列と、前記第1の文字列又は前記第1の文字列を含む文書から特定される特定情報と、利用者により検索キーとして選択された前記第2の文字列から取得した意味属性と、を対応付けて格納する履歴格納部と、
前記履歴記憶部に格納された複数の特定情報が一致するか否か判断する履歴判断部と、
前記複数の特定情報が一致すると判断された場合に、当該特定情報と、当該特定情報と対応付けられている意味属性と、を対応付けて前記条件記憶部に登録する抽出条件生成部と、
をさらに備えることを特徴とする請求項1乃至4のいずれか一つに記載の情報検索装置。 - 文書を入力処理する文書入力処理部と、
入力処理した前記文書に含まれている第1の文字列と、前記文書に含まれている第2の文字列と、を対応付けて前記文字列蓄積部に格納する文字列登録部と、
入力処理した前記文書を、前記文書蓄積部に登録する文書登録部と、
をさらに備えることを特徴とする請求項1乃至5のいずれか一つに記載の情報検索装置。 - 前記検索部により検索された前記文書を、当該文書の意味属性毎に表示する検索結果表示処理部と、をさらに備えることを特徴とする請求項1乃至6のいずれか一つに記載の情報検索装置。
- 前記条件記憶部は、さらに文書を絞り込む絞込条件を対応付けて記憶し、
前記検索部は、さらに前記絞込条件を満足させる文書を検索すること、
を特徴とする請求項1乃至7のいずれか一つに記載の情報検索装置。 - 情報検索装置で実行される情報検索方法であって、
前記情報検索装置は、文書を蓄積する文書蓄積部と、
前記文書蓄積部に蓄積された前記文書に含まれ、検索キーになりうる第1の文字列に対して、当該第1の文字列と同一の文書に含まれ、当該第1の文字列と共起関係がある第2の文字列を、当該第1の文字列と共に検索キーとして用いられる文字列として、当該第2の文字列を抽象化した意味属性別に対応付けて記憶する文字列蓄積部と、
前記第2の文字列を抽象化した前記意味属性と、前記第1の文字列を抽象化した意味属性である又は前記第1の文字列を含む前記同一の文書から抽出した特徴語である特定情報と、を予め対応付けて記憶する条件記憶部と、を備え、
入力受付部が、第1の文字列の入力を受け付ける入力受付ステップと、
特定情報取得部が、入力された前記第1の文字列を抽象化した意味属性を特定情報として取得し、又は当該第1の文字列を含む文書から特徴語を抽出することで特定情報を取得する特定情報取得ステップと、
抽出部が、前記条件記憶部から、取得した前記特定情報と対応付けられている、前記第2の文字列を抽象化した前記意味属性を抽出する抽出ステップと、
文字列抽出部が、前記文字列蓄積部から、入力された前記第1の文字列と対応付けられ、抽出された前記意味属性にかかる前記第2の文字列を抽出する文字列抽出部と、
検索部が、入力された前記第1の文字列と、抽出された前記第2の文字列と、を含む文書を前記文書蓄積部から検索する検索ステップと、
を有することを特徴とする情報検索方法。 - 文書を検索するコンピュータで実行されるための情報検索プログラムであって、
文書を蓄積する文書蓄積部と、
前記文書蓄積部に蓄積された前記文書に含まれ、検索キーになりうる第1の文字列に対して、当該第1の文字列と同一の文書に含まれ、当該第1の文字列と共起関係がある第2の文字列を、当該第1の文字列と共に検索キーとして用いられる文字列として、当該第2の文字列を抽象化した意味属性別に対応付けて記憶する文字列蓄積部と、
前記第2の文字列を抽象化した前記意味属性と、前記第1の文字列を抽象化した意味属性である又は前記第1の文字列を含む前記同一の文書から抽出した特徴語である特定情報と、を予め対応付けて記憶する条件記憶部と、を備えたコンピュータで、
第1の文字列の入力を受け付ける入力受付ステップと、
入力された前記第1の文字列を抽象化した意味属性を特定情報として取得し、又は当該第1の文字列を含む文書から特徴語を抽出することで特定情報を取得する特定情報取得ステップと、
前記条件記憶部から、取得した前記特定情報と対応付けられている、前記第2の文字列を抽象化した前記意味属性を抽出する抽出ステップと、
前記文字列蓄積部から、入力された前記第1の文字列と対応付けられ、抽出された前記意味属性にかかる前記第2の文字列を抽出する文字列抽出ステップと、
入力された前記第1の文字列と、抽出された前記第2の文字列と、を含む文書を前記文書蓄積部から検索する検索ステップと、
を実行させるための情報検索プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007087384A JP4398992B2 (ja) | 2007-03-29 | 2007-03-29 | 情報検索装置、情報検索方法及び情報検索プログラム |
US12/043,232 US8117177B2 (en) | 2007-03-29 | 2008-03-06 | Apparatus and method for searching information based on character strings in documents |
CNA2008100874895A CN101276372A (zh) | 2007-03-29 | 2008-03-28 | 信息搜索装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007087384A JP4398992B2 (ja) | 2007-03-29 | 2007-03-29 | 情報検索装置、情報検索方法及び情報検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008250385A JP2008250385A (ja) | 2008-10-16 |
JP4398992B2 true JP4398992B2 (ja) | 2010-01-13 |
Family
ID=39796052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007087384A Expired - Fee Related JP4398992B2 (ja) | 2007-03-29 | 2007-03-29 | 情報検索装置、情報検索方法及び情報検索プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8117177B2 (ja) |
JP (1) | JP4398992B2 (ja) |
CN (1) | CN101276372A (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4810469B2 (ja) * | 2007-03-02 | 2011-11-09 | 株式会社東芝 | 検索支援装置、プログラム及び検索支援システム |
US20090271388A1 (en) * | 2008-04-23 | 2009-10-29 | Yahoo! Inc. | Annotations of third party content |
JP5448412B2 (ja) * | 2008-10-24 | 2014-03-19 | キヤノン株式会社 | 情報処理装置およびその方法、プログラム、記録媒体 |
US8666972B2 (en) * | 2009-02-12 | 2014-03-04 | International Business Machines Corporation | System and method for content management and determination of search conditions |
JP5127751B2 (ja) * | 2009-03-19 | 2013-01-23 | 株式会社東芝 | 情報検索装置及び方法 |
US8392973B2 (en) * | 2009-05-28 | 2013-03-05 | International Business Machines Corporation | Autonomous intelligent user identity manager with context recognition capabilities |
KR20110089012A (ko) * | 2010-01-29 | 2011-08-04 | 삼성전자주식회사 | 전자책 단말기 및 그의 멀티태스킹 히스토리 제공방법 |
JP5185402B2 (ja) * | 2011-01-11 | 2013-04-17 | 株式会社東芝 | 文書検索装置、文書検索方法、及び文書検索プログラム |
JP5703958B2 (ja) * | 2011-05-20 | 2015-04-22 | 日本電気株式会社 | 情報検索装置、情報検索方法および情報検索プログラム |
CN103827854A (zh) * | 2011-09-29 | 2014-05-28 | 富士通株式会社 | 检索方法以及信息管理装置 |
US9092428B1 (en) * | 2011-12-09 | 2015-07-28 | Guangsheng Zhang | System, methods and user interface for discovering and presenting information in text content |
US10984337B2 (en) * | 2012-02-29 | 2021-04-20 | Microsoft Technology Licensing, Llc | Context-based search query formation |
CN103365528A (zh) * | 2012-04-02 | 2013-10-23 | 鸿富锦精密工业(深圳)有限公司 | 专利核驳历程显示***及方法 |
JP2012216239A (ja) * | 2012-07-12 | 2012-11-08 | Toshiba Corp | 情報処理装置、プログラムおよび情報検索方法 |
WO2014025000A1 (ja) * | 2012-08-08 | 2014-02-13 | 株式会社キーソフト | 取引支援システム |
KR102083209B1 (ko) * | 2012-11-22 | 2020-03-02 | 삼성전자 주식회사 | 데이터 제공 방법 및 휴대 단말 |
CN103902280B (zh) * | 2012-12-24 | 2017-04-12 | 中国电信股份有限公司 | 事务处理方法及装置 |
CN103220412B (zh) * | 2013-03-20 | 2015-02-18 | 惠州Tcl移动通信有限公司 | 移动终端的日程表管理方法及*** |
CN104063400B (zh) * | 2013-03-22 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 数据搜索方法和装置 |
JP6028656B2 (ja) * | 2013-03-28 | 2016-11-16 | 富士通株式会社 | データ抽出方法、装置及びプログラム |
JP6365195B2 (ja) * | 2014-10-03 | 2018-08-01 | 富士通株式会社 | 命令履歴分析プログラム、命令履歴分析装置、および、命令履歴分析方法 |
CN104679848B (zh) * | 2015-02-13 | 2019-05-03 | 百度在线网络技术(北京)有限公司 | 搜索推荐方法和装置 |
US10582275B2 (en) * | 2015-11-11 | 2020-03-03 | The Syg Institute Co., Ltd. | Real-time digit string-based information distribution system using smart terminal and method thereof |
JP6613942B2 (ja) * | 2016-02-10 | 2019-12-04 | 富士通株式会社 | 情報出力システム、情報出力方法および情報出力プログラム |
CN107092616B (zh) * | 2016-11-02 | 2020-08-28 | 北京星选科技有限公司 | 一种对象排序方法及装置 |
JP2019095848A (ja) * | 2017-11-17 | 2019-06-20 | 富士ゼロックス株式会社 | 文書処理装置およびプログラム |
JP7452011B2 (ja) | 2019-12-27 | 2024-03-19 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及びコンピュータプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02301869A (ja) * | 1989-05-17 | 1990-12-13 | Hitachi Ltd | 自然言語処理システム保守支援方式 |
EP0610760B1 (en) * | 1993-01-28 | 2003-05-02 | Kabushiki Kaisha Toshiba | Document detection system with improved document detection efficiency |
JP3015223B2 (ja) * | 1993-05-14 | 2000-03-06 | シャープ株式会社 | 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置 |
JP3408291B2 (ja) * | 1993-09-20 | 2003-05-19 | 株式会社東芝 | 辞書作成支援装置 |
US6098034A (en) * | 1996-03-18 | 2000-08-01 | Expert Ease Development, Ltd. | Method for standardizing phrasing in a document |
US5960384A (en) * | 1997-09-03 | 1999-09-28 | Brash; Douglas E. | Method and device for parsing natural language sentences and other sequential symbolic expressions |
US6178416B1 (en) * | 1998-06-15 | 2001-01-23 | James U. Parker | Method and apparatus for knowledgebase searching |
JP4025443B2 (ja) * | 1998-12-04 | 2007-12-19 | 富士通株式会社 | 文書データ提供装置及び文書データ提供方法 |
JP2004139553A (ja) * | 2002-08-19 | 2004-05-13 | Matsushita Electric Ind Co Ltd | 文書検索システムおよび質問応答システム |
JP3784060B2 (ja) * | 2003-01-10 | 2006-06-07 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベース検索システム、その検索方法及びプログラム |
WO2005036412A1 (en) * | 2003-10-16 | 2005-04-21 | Nhn Corporation | A method of managing bulletin on internet and a system thereof |
KR100806862B1 (ko) | 2004-07-16 | 2008-02-26 | (주)이네스트커뮤니케이션 | 웹 사이트에서의 1차 키워드 검색에 대해 관련성 있는 2차키워드의 리스트를 제공하는 방법 및 장치 |
JP4081056B2 (ja) | 2004-08-30 | 2008-04-23 | 株式会社東芝 | 情報処理装置、情報処理方法及びプログラム |
US20060287919A1 (en) * | 2005-06-02 | 2006-12-21 | Blue Mustard Llc | Advertising search system and method |
US7836065B2 (en) * | 2005-11-01 | 2010-11-16 | Sap Ag | Searching multiple repositories in a digital information system |
JP4247284B2 (ja) | 2007-03-28 | 2009-04-02 | 株式会社東芝 | 情報検索装置、情報検索方法及び情報検索プログラム |
-
2007
- 2007-03-29 JP JP2007087384A patent/JP4398992B2/ja not_active Expired - Fee Related
-
2008
- 2008-03-06 US US12/043,232 patent/US8117177B2/en not_active Expired - Fee Related
- 2008-03-28 CN CNA2008100874895A patent/CN101276372A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2008250385A (ja) | 2008-10-16 |
US20080243791A1 (en) | 2008-10-02 |
CN101276372A (zh) | 2008-10-01 |
US8117177B2 (en) | 2012-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4398992B2 (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
US7860872B2 (en) | Automated media analysis and document management system | |
US9092417B2 (en) | Systems and methods for extracting data from a document in an electronic format | |
EP1396799B1 (en) | Content management system | |
US6353840B2 (en) | User-defined search template for extracting information from documents | |
US20070185859A1 (en) | Novel systems and methods for performing contextual information retrieval | |
US20070078814A1 (en) | Novel information retrieval systems and methods | |
US20070136280A1 (en) | Factoid-based searching | |
US9785707B2 (en) | Method and system for converting audio text files originating from audio files to searchable text and for processing the searchable text | |
JP2003173280A (ja) | データベース生成装置、データベース生成方法及びデータベース生成プログラム | |
JP2002278977A (ja) | 質問回答装置、質問回答方法及び質問回答プログラム | |
US20070185832A1 (en) | Managing tasks for multiple file types | |
JP2006323517A (ja) | テキスト分類装置およびプログラム | |
EP1850246A1 (en) | Data retrieval system, method and program | |
JP3425784B2 (ja) | 文献情報検索装置 | |
US20140156593A1 (en) | Information processing apparatus, information processing method, and program | |
JPH11184924A (ja) | スケジューリング装置 | |
JP3998201B2 (ja) | 文書検索方法 | |
JPS63175965A (ja) | 文書処理装置 | |
JP2008033386A (ja) | 情報処理提供システム | |
KR100963669B1 (ko) | 토픽정보를 이용한 질의어 자동 입력 시스템 및 그 방법과그 방법에 대한 컴퓨터 프로그램을 저장한 기록매체 | |
JP4493825B2 (ja) | 非テキスト入力に基づく概念検索装置およびコンピュータプログラムを記録した記録媒体 | |
JP4034503B2 (ja) | 文書検索システムおよび文書検索方法 | |
TWM529875U (zh) | 拆解資料欄位以分類專利之檢索系統 | |
JP3875510B2 (ja) | 情報検索装置、その方法、そのプログラム及びそのプログラムが記録された記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090326 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090929 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091023 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121030 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131030 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |