JP2013080405A - 文書検索装置及び方法及びプログラム - Google Patents
文書検索装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP2013080405A JP2013080405A JP2011220544A JP2011220544A JP2013080405A JP 2013080405 A JP2013080405 A JP 2013080405A JP 2011220544 A JP2011220544 A JP 2011220544A JP 2011220544 A JP2011220544 A JP 2011220544A JP 2013080405 A JP2013080405 A JP 2013080405A
- Authority
- JP
- Japan
- Prior art keywords
- place name
- name
- place
- hierarchy
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明は、入力された都道府県名から丁目番地までを含む正規地名に基づいて地名記憶手段を参照して、知名度を取得し、所定の閾値以下の地名度の地名を除き、該正規地名の上位の階層を省略しても一意であれば該上位の階層の地名部分を省略し、上位の階層の地名部分を省略した地名の知名度が、他の地名の知名度の和よりも大きければその地名を検索対象として抽出し、入力されたキーワードを含み、抽出された地名を少なくとも一つ含むような文書を検索する。
【選択図】 図1
Description
地名と広い地域ほど値が大きく狭い地域ほど値が小さくなるような該地名の知名度を示した地名知名度記憶手段と、
地名と該地名を構成する階層を格納した地名記憶手段と、
入力された都道府県名から丁目番地までを含む正規地名に基づいて前記地名記憶手段を参照して、該正式地名の階層表現を取得し、該階層表現の下位の地名の知名度を前記地名知名度記憶手段から取得し、所定の閾値以下の地名度の地名を除き、該正規地名の上位の階層を省略しても一意であれば該上位の階層の地名部分を省略し、上位の階層の地名部分を省略した地名の知名度が、他の地名の知名度の和よりも大きければその地名を検索対象として検索する地名抽出手段と、
入力されたキーワードを含み、前記地名抽出手段で抽出された地名を少なくとも一つ含むような文書を検索する検索手段と、を有する。
入力された座標または地理範囲から、対応する都道府県名から丁目番地までを含む正規地名を取得する正規地名取得手段と、
前記正規地名に基づいて前記地名記憶手段を参照し、該地名の階層を取得し、最下位の階層を除いた地名に基づいて前記地名知名度記憶手段を参照し、該地名に対応する知名度が所定の閾値未満であるかを判定する処理を、該地名に階層がなくなるまで、または、閾値以上になるまで繰り返し、その時点における地名を候補リストに追加する下位省略地名展開手段と、
前記地名記憶手段に、前記候補リストの地名の最上位の階層を除いた地名Aを含む地名がない場合は、該地名Aを該出力リストに加え、ある場合は、曖昧さがあると判断し、該地名Aについて最上位階層から記述した語の知名度aと、それ以外の語の知名度bを取得し、該知名度bの和が該知名度aより小さければ該地名Aを検索語として出力リストに追加する処理を、地名階層がなくなるまで、または、曖昧さがあり、該知名度bの和が該知名度a以上となるまで、該候補リストの地名全てに対して繰り返し、該出力リストを出力する上位省略地名展開手段と、を含む。
102 地名語辞書
110 正規地名取得部
120 下位省略地名展開部
130 上位省略地名展開部
140 検索部
Claims (5)
- 地名として適したものを検索するための文書検索装置であって、
地名と広い地域ほど値が大きく狭い地域ほど値が小さくなるような該地名の知名度を示した地名知名度記憶手段と、
地名と該地名を構成する階層を格納した地名記憶手段と、
入力された都道府県名から丁目番地までを含む正規地名に基づいて前記地名記憶手段を参照して、該正式地名の階層表現を取得し、該階層表現の下位の地名の知名度を前記地名知名度記憶手段から取得し、所定の閾値以下の地名度の地名を除き、該正規地名の上位の階層を省略しても一意であれば該上位の階層の地名部分を省略し、上位の階層の地名部分を省略した地名の知名度が、他の地名の知名度の和よりも大きければその地名を検索対象として抽出する地名抽出手段と、
入力されたキーワードを含み、前記地名抽出手段で抽出された地名を少なくとも一つ含むような文書を検索する検索手段と、
を有することを特徴とする文書検索装置。 - 前記地名抽出手段は、
入力された座標または地理範囲から、対応する都道府県名から丁目番地までを含む正規地名を取得する正規地名取得手段と、
前記正規地名に基づいて前記地名記憶手段を参照し、該地名の階層を取得し、最下位の階層を除いた地名に基づいて前記地名知名度記憶手段を参照し、該地名に対応する知名度が所定の閾値未満であるかを判定する処理を、該地名に階層がなくなるまで、または、閾値以上になるまで繰り返し、その時点における地名を候補リストに追加する下位省略地名展開手段と、
前記地名記憶手段に、前記候補リストの地名の最上位の階層を除いた地名Aを含む地名がない場合は、該地名Aを該出力リストに加え、ある場合は、曖昧さがあると判断し、該地名Aについて最上位階層から記述した語の知名度aと、それ以外の語の知名度bを取得し、該知名度bの和が該知名度aより小さければ該地名Aを検索語として出力リストに追加する処理を、地名階層がなくなるまで、または、曖昧さがあり、該知名度bの和が該知名度a以上となるまで、該候補リストの地名全てに対して繰り返し、該出力リストを出力する上位省略地名展開手段と、
を含む請求項1記載の文書検索装置。 - 地名として適したものを検索するための文書検索方法であって、
地名と広い地域ほど値が大きく狭い地域ほど値が小さくなるような該地名の知名度を示した地名知名度記憶手段と、
地名と該地名を構成する階層を格納した地名記憶手段と、を有する装置において、
地名抽出手段が、入力された都道府県名から丁目番地までを含む正規地名に基づいて前記地名記憶手段を参照して、該正式地名の階層表現を取得し、該階層表現の下位の地名の知名度を前記地名知名度記憶手段から取得し、所定の閾値以下の地名度の地名を除き、該正規地名の上位の階層を省略しても一意であれば該上位の階層の地名部分を省略し、上位の階層の地名部分を省略した地名の知名度が、他の地名の知名度の和よりも大きければその地名を検索対象として抽出する地名抽出ステップと、
検索手段が、入力されたキーワードを含み、前記地名抽出ステップで抽出された地名を少なくとも一つ含むような文書を検索する検索ステップと、
を行うことを特徴とする文書検索方法。 - 前記地名抽出ステップにおいて、
正規地名取得手段が、入力された座標または地理範囲から、対応する都道府県名から丁目番地までを含む正規地名を取得する正規地名取得ステップと、
下位省略地名展開手段が、前記正規地名に基づいて前記地名記憶手段を参照し、該地名の階層を取得し、最下位の階層を除いた地名に基づいて前記地名知名度記憶手段を参照し、該地名に対応する知名度が所定の閾値未満であるかを判定する処理を、該地名に階層がなくなるまで、または、閾値以上になるまで繰り返し、その時点における地名を候補リストに追加する下位省略地名展開ステップと、
上位省略地名展開手段が、前記地名記憶手段に、前記候補リストの地名の最上位の階層を除いた地名Aを含む地名がない場合は、該地名Aを該出力リストに加え、ある場合は、曖昧さがあると判断し、該地名Aについて最上位階層から記述した語の知名度aと、それ以外の語の知名度bを取得し、該知名度bの和が該知名度aより小さければ該地名Aを検索語として出力リストに追加する処理を、地名階層がなくなるまで、または、曖昧さがあり、該知名度bの和が該知名度a以上となるまで、該候補リストの地名全てに対して繰り返し、該出力リストを出力する上位省略地名展開ステップと、
を含む請求項3記載の文書検索方法。 - コンピュータを、
請求項1または2に記載の文書検索装置の各手段として機能させるための文書検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011220544A JP5620896B2 (ja) | 2011-10-04 | 2011-10-04 | 文書検索装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011220544A JP5620896B2 (ja) | 2011-10-04 | 2011-10-04 | 文書検索装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013080405A true JP2013080405A (ja) | 2013-05-02 |
JP5620896B2 JP5620896B2 (ja) | 2014-11-05 |
Family
ID=48526720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011220544A Expired - Fee Related JP5620896B2 (ja) | 2011-10-04 | 2011-10-04 | 文書検索装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5620896B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002334096A (ja) * | 2001-05-11 | 2002-11-22 | Hitachi Ltd | 携帯端末に対する情報提供システム |
JP2010146030A (ja) * | 2007-03-29 | 2010-07-01 | Access Co Ltd | 検索システム、携帯型情報機器、検索プログラム |
WO2011118712A1 (ja) * | 2010-03-26 | 2011-09-29 | 楽天株式会社 | 検索システム、検索方法、検索プログラム及び記録媒体 |
-
2011
- 2011-10-04 JP JP2011220544A patent/JP5620896B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002334096A (ja) * | 2001-05-11 | 2002-11-22 | Hitachi Ltd | 携帯端末に対する情報提供システム |
JP2010146030A (ja) * | 2007-03-29 | 2010-07-01 | Access Co Ltd | 検索システム、携帯型情報機器、検索プログラム |
WO2011118712A1 (ja) * | 2010-03-26 | 2011-09-29 | 楽天株式会社 | 検索システム、検索方法、検索プログラム及び記録媒体 |
Non-Patent Citations (2)
Title |
---|
CSNJ200810070043; 平野 徹: '地理的距離と有名度を用いた地名の曖昧性解消' 第70回(平成20年)全国大会講演論文集(2) 人工知能と認知科学 , 20080313, 2-85〜2-86ページ, 社団法人情報処理学会 * |
JPN6014025278; 平野 徹: '地理的距離と有名度を用いた地名の曖昧性解消' 第70回(平成20年)全国大会講演論文集(2) 人工知能と認知科学 , 20080313, 2-85〜2-86ページ, 社団法人情報処理学会 * |
Also Published As
Publication number | Publication date |
---|---|
JP5620896B2 (ja) | 2014-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | Robust entity linking via random walks | |
Jones et al. | The SPIRIT spatial search engine: Architecture, ontologies and spatial indexing | |
US7890493B2 (en) | Translating a search query into multiple languages | |
US8171029B2 (en) | Automatic generation of ontologies using word affinities | |
JP5746426B2 (ja) | インデックスドキュメントの発見 | |
KR100930455B1 (ko) | 쿼리별 검색 컬렉션 생성 방법 및 시스템 | |
KR100903961B1 (ko) | 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템 | |
JP2012533819A (ja) | 文書インデックス化およびデータクエリングのための方法およびシステム | |
Dai et al. | Learning to rank resources | |
JP2008198237A (ja) | 構造化文書管理システム | |
US20140280050A1 (en) | Term searching based on context | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5620896B2 (ja) | 文書検索装置及び方法及びプログラム | |
Manguinhas et al. | A geo-temporal web gazetteer integrating data from multiple sources | |
JP2011159100A (ja) | 逐次類似文書検索装置、逐次類似文書検索方法およびプログラム | |
JP6079207B2 (ja) | キーワード提示プログラム、キーワード提示方法及びキーワード提示装置 | |
Calazans Campelo et al. | Geographic scope modeling for web documents | |
CN107818091B (zh) | 文档处理方法及装置 | |
JP2010009237A (ja) | 多言語間類似文書検索装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
Yadav et al. | An approach for spatial search using SOLR | |
JP5491422B2 (ja) | 情報検索装置、情報検索方法、及び情報検索プログラム | |
JP2010003266A (ja) | クエリ生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
Ayed et al. | An Enhanced Lucene based System for Efficient Document/Information Retrieval | |
Ayed et al. | On the Relevance of Query Expansion Using Parallel Corpora and Word Embeddings to Boost Text Document Retrieval Precision | |
KR20170064676A (ko) | 엔트리 기반 지식자원 생성 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131004 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140611 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140916 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140919 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5620896 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |