JP5634209B2 - Search index creation system, document search system, index creation method, document search method and program - Google Patents

Search index creation system, document search system, index creation method, document search method and program Download PDF

Info

Publication number
JP5634209B2
JP5634209B2 JP2010232805A JP2010232805A JP5634209B2 JP 5634209 B2 JP5634209 B2 JP 5634209B2 JP 2010232805 A JP2010232805 A JP 2010232805A JP 2010232805 A JP2010232805 A JP 2010232805A JP 5634209 B2 JP5634209 B2 JP 5634209B2
Authority
JP
Japan
Prior art keywords
search
image
longitude
document
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010232805A
Other languages
Japanese (ja)
Other versions
JP2012088792A (en
Inventor
義昭 賀川
義昭 賀川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2010232805A priority Critical patent/JP5634209B2/en
Publication of JP2012088792A publication Critical patent/JP2012088792A/en
Application granted granted Critical
Publication of JP5634209B2 publication Critical patent/JP5634209B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書ファイルに貼り付けられた又は埋め込まれた地図又は写真(例えば衛星写真)を検索する技術に関するものである。   The present invention relates to a technique for searching a map or a photograph (for example, a satellite photograph) pasted or embedded in a document file.

近年、「ロケーションインテリジェンス」と呼ばれる技術が出現し、当該分野の拡大が見込まれている。ここで、「ロケーションインテリジェンス」とは、地理情報システム(GIS:Geographic Information System)を専門知識無しにビジネスに活用可能とする技術をいう。   In recent years, a technique called “location intelligence” has emerged, and the field is expected to expand. Here, “location intelligence” refers to a technology that enables a geographic information system (GIS) to be used for business without specialized knowledge.

この種の分野では、システムの使い易さが非常に重視される。そこで、昨今、PDF(Portable Document Format)ファイル上で地理空間情報を取り扱い可能にした製品が提案されている。例えばAdobe社からはGeospatial PDFが、TerraGo社からはGeoPDF(登録商標)が提案されている。しかし、PDFファイルのように汎用的な文書ファイルに埋め込まれた地図そのものを、位置情報を検索キーに用いて検索できる製品は今のところ知られていない。   In this type of field, the ease of use of the system is very important. Therefore, recently, a product that can handle geospatial information on a PDF (Portable Document Format) file has been proposed. For example, Geospatial PDF is proposed by Adobe, and GeoPDF (registered trademark) is proposed by TerraGo. However, a product that can search a map itself embedded in a general-purpose document file such as a PDF file by using position information as a search key is not known at present.

なお、文書の本文情報と地理空間情報を組み合わせた検索技術は、既に提案されている。例えば特許文献1には、データベースを利用して文書情報と地図情報をリンクさせるものが提案されている。また、特許文献2には、文書の本文中に現われる位置に関する記述を位置情報に変換し、当該変換後の位置情報を検索対象とするやり方が提案されている。   A search technique that combines text information of a document and geospatial information has already been proposed. For example, Patent Document 1 proposes a method for linking document information and map information using a database. Further, Patent Document 2 proposes a method in which a description related to a position appearing in the text of a document is converted into position information, and the converted position information is used as a search target.

特開2001−167112号公報JP 2001-167112 A 特開2010−128806号公報JP 2010-128806 A

ところが、特許文献1のように、データベースを利用して文書情報と地図情報をリンクさせる場合、検索システムは非常に複雑になってしまう。また、特許文献2のように、文書中の位置に関する記述を位置情報に変換する手法では、文書の曖昧性から間違った場所を特定してしまう可能性がある。例えば「東京都北部」のように言葉の示す範囲が曖昧である場合、位置情報の範囲の特定自体が困難である。このため、検索結果がユーザの意図せぬものになる可能性がある。   However, as in Patent Document 1, when the document information and the map information are linked using the database, the search system becomes very complicated. Further, as in Patent Document 2, in the method of converting a description related to a position in a document into position information, there is a possibility that an incorrect place is specified due to the ambiguity of the document. For example, when the range indicated by the words is ambiguous, such as “northern Tokyo”, it is difficult to specify the range of the position information itself. For this reason, the search result may be unintended by the user.

本発明は、かかる課題を考慮してなされたものであり、従来システムに比してシステム構成が簡便で済み、かつ、検索精度良く特定の位置情報を有する地図及び又は写真を検索可能とするシステムの提供を目的とする。   The present invention has been made in consideration of such problems, and the system configuration is simpler than that of a conventional system, and a system capable of searching for maps and / or photographs having specific position information with high search accuracy. The purpose is to provide.

そこで、本発明者は、以下に示すシステムを提案する。   Therefore, the present inventor proposes the following system.

まず、文書ファイルから検索インデックスを作成するシステム(検索インデックス作成システム)として、(1) 文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する手段と、(2) 経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報とを含む検索インデックスを作成する手段とを有するものを提案する。   First, as a system for creating a search index from a document file (search index creation system), (1) Extracting latitude and longitude information indicating the image range from one or more map images or photographic image data contained in the document file And (2) means for creating a search index including longitude / latitude information and identification information for identifying a map image or photo image corresponding to the longitude / latitude information.

また、文書検索システムとして、(1) 文書ファイルを格納するファイルサーバと、(2) 文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する手段と、(3) 経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報とを含む検索インデックスを作成する手段と、(4) 作成された検索インデックスを格納する検索インデックス格納部と、(5) 検索条件として、経度緯度の範囲の設定を、操作画面を通じて受付ける手段と、(6) 検索条件として受付けた経度緯度の範囲に経度緯度情報を含む前記検索インデックスを検索する手段と、(7) 検索結果を出力する手段とを有するものを提案する。   In addition, as a document search system, (1) a file server for storing document files, and (2) longitude and latitude information indicating the image range from one or more map images or photographic image attached data contained in the document files Means for generating (3) longitude and latitude information, means for creating a search index including identification information for identifying a map image or photo image corresponding to the longitude and latitude information, and (4) storing the created search index (5) means for accepting setting of a latitude / longitude range as a search condition through the operation screen; and (6) the search index including longitude / latitude information in the longitude / latitude range accepted as the search condition. And (7) a means for outputting a search result is proposed.

本発明によれば、文書に含まれる地図画像又は写真画像そのものの経度緯度情報を検索インデックスに含めることができる。このため、従来システムに比して簡易かつ正確に、検索条件に合致する地図画像及び又は写真画像を含む文書を検索することができる。   According to the present invention, longitude and latitude information of a map image or a photographic image itself included in a document can be included in a search index. Therefore, it is possible to search for a document including a map image and / or a photographic image that matches the search condition more easily and accurately than in the conventional system.

形態例に係る文書検索システムの構成例を説明する図。The figure explaining the structural example of the document search system which concerns on an example. 地図情報入り文書の例を説明する図。The figure explaining the example of a document containing map information. 検索インデックスの構成例を示す図。The figure which shows the structural example of a search index. 検索条件の入力に使用する操作画面例を示す図。The figure which shows the example of an operation screen used for the input of search conditions. 検索結果の表示に使用する操作画面例を示す図。The figure which shows the example of an operation screen used for the display of a search result. 検索結果の表示に使用する他の操作画面例を示す図。The figure which shows the other example of an operation screen used for the display of a search result. 検索インデックスの作成手順例を示すフローチャート。The flowchart which shows the example of a creation procedure of a search index. 文書の検索手順例を示すフローチャート。6 is a flowchart illustrating an example of a document search procedure.

以下、図面に基づいて、本発明に係る文書検索システム及び検索インデックス作成システムの形態例を説明する。なお、後述する形態例はいずれも一例であり、本発明には、本明細書に記載する任意の機能を組み合わせることで実現されるシステム、本明細書に記載する一部の構成や機能だけで実現されるシステムの他、一部の構成や機能だけを周知の技術で置換したシステムも含まれる。また、後述する形態例で実行される機能は、計算機(コンピュータ)上で実行されるプログラムとして実現されるものとして説明する。もっとも、プログラムの一部又は全部は、ハードウェアを通じて実現されても良い。   Hereinafter, an example of a document search system and a search index creation system according to the present invention will be described based on the drawings. Note that each of the embodiments described below is merely an example, and the present invention includes only a system realized by combining arbitrary functions described in this specification, and some configurations and functions described in this specification. In addition to the realized system, a system in which only a part of the configuration and functions is replaced by a known technique is also included. In addition, the function executed in the embodiment described later will be described as being realized as a program executed on a computer (computer). However, part or all of the program may be realized through hardware.

(全体システム)
図1に、文書検索システムの構成例を示す。なお、検索インデックスシステムは、文書検索システムの一部として実現される。
(Whole system)
FIG. 1 shows a configuration example of a document search system. The search index system is realized as a part of the document search system.

図1に示す文書検索システムは、検索ホストシステム100と、ネットワーク160を介して接続されたファイルサーバ150及び検索端末170とで構成される。   The document search system shown in FIG. 1 includes a search host system 100, a file server 150 and a search terminal 170 connected via a network 160.

検索ホストシステム100は、検索インデックスの作成と検索の実行とを分担するコンピュータである。検索ホストシステム100は、いわゆる検索サーバとして動作する。図1に示す検索ホストシステム100は、検索インデックス作成部110と、検索画面表示制御部120と、検索処理部130と、検索インデックス格納部140とで構成される。   The search host system 100 is a computer that shares search index creation and search execution. The search host system 100 operates as a so-called search server. The search host system 100 shown in FIG. 1 includes a search index creation unit 110, a search screen display control unit 120, a search processing unit 130, and a search index storage unit 140.

ここで、検索インデックス作成部110は、文書ファイルの本文から検索インデックスを作成するだけでなく、後述するように、文書ファイルに埋め込まれた又は貼り付けられた地図画像の付属データから位置情報(経度緯度情報)を抽出し、検索インデックスを作成する機能を実現する。   Here, the search index creation unit 110 not only creates a search index from the text of the document file, but also adds positional information (longitude) from the attached data of the map image embedded or pasted in the document file, as will be described later. (Latitude information) is extracted and a search index is created.

検索画面表示制御部120は、ネットワーク160を介して接続された検索端末170の操作画面上に検索条件の入力画面や検索結果の表示画面を表示する機能を提供する。   The search screen display control unit 120 provides a function of displaying a search condition input screen and a search result display screen on the operation screen of the search terminal 170 connected via the network 160.

検索処理部130は、検索端末170から入力された検索条件に基づいて検索インデックス格納部140を検索し、検索条件を満たす検索インデックスを検索する機能を提供する。   The search processing unit 130 provides a function of searching the search index storage unit 140 based on the search condition input from the search terminal 170 and searching for a search index that satisfies the search condition.

検索インデックス格納部140は、各文書ファイルについて作成された検索インデックスを格納する記憶装置である。この実施例の場合、記憶装置には、複数のハードディスク装置で構成されるストレージサーバを想定する。   The search index storage unit 140 is a storage device that stores a search index created for each document file. In the case of this embodiment, a storage server composed of a plurality of hard disk devices is assumed as the storage device.

ファイルサーバ150は、文書ファイルが格納される記憶装置である。この形態例の場合、少なくとも1つのファイルサーバ150が、少なくとも1つは地図画像入りの文書ファイルを格納しているものとする。ファイルサーバ150も、複数のハードディスク装置で構成されるストレージサーバを想定する。   The file server 150 is a storage device that stores document files. In the case of this embodiment, it is assumed that at least one file server 150 stores at least one document file containing a map image. The file server 150 is also assumed to be a storage server composed of a plurality of hard disk devices.

ネットワーク160は、インターネットでも、イントラネットでも、LAN(local area network)でも良い。   The network 160 may be the Internet, an intranet, or a local area network (LAN).

検索端末170は、文書ファイルの検索を実際に実行されるユーザ側のコンピュータ端末である。なお、検索端末170は、いわゆるコンピュータである必要はなく、ネットワーク通信機能を備える各種の機器、例えばテレビジョン受像機、ビデオレコーダでも良い。また、検索端末170は、携帯電話機や携帯情報端末その他の可搬型の端末装置でも良い。   The search terminal 170 is a computer terminal on the user side that actually executes a search for a document file. The search terminal 170 does not need to be a so-called computer, and may be various devices having a network communication function, such as a television receiver or a video recorder. Further, the search terminal 170 may be a mobile phone, a portable information terminal, or other portable terminal devices.

(地図情報入り文書)
図2に、本形態例において検索対象とする地図画像入り文書(以下「非構造化データ」ともいう。)の構造例を示す。地図画像入り文書は、基本的に、地図画像部200と本文210とで構成される。地図画像部200には、図中の「2ページ目」に示すように、文書を利用するユーザがアノテーション220又は230を追加的に記録することができる。アノテーション220は、地図上のある座標点に関する吹き出し形式でコメント(テキストデータ)を付加する場合に用いられる。アノテーション230は、地図上のある座標位置にランドマーク等を表す図形を付加する場合に用いられる。
(Document with map information)
FIG. 2 shows an example of the structure of a map image-containing document (hereinafter also referred to as “unstructured data”) to be searched in this embodiment. A map image-containing document basically includes a map image portion 200 and a text 210. As shown in “second page” in the drawing, the user who uses the document can additionally record the annotation 220 or 230 on the map image unit 200. The annotation 220 is used when a comment (text data) is added in a balloon format related to a certain coordinate point on the map. The annotation 230 is used when a figure representing a landmark or the like is added to a certain coordinate position on the map.

この形態例の場合、地図画像部200は矩形領域で与えられる。地図画像部200には、その画像範囲を経度緯度のような座標値によって特定する付属データが付されている。付属データには、例えば地図画像部200の左上隅と右下隅の2つの座標値が記録されている。なお、右上隅と左下隅の2つの座標値を記録しても良いし、4隅に対応する4つの座標値を記録しても良い。   In the case of this example, the map image part 200 is given by a rectangular area. The map image unit 200 is attached with attached data for specifying the image range by coordinate values such as longitude and latitude. In the attached data, for example, two coordinate values of the upper left corner and the lower right corner of the map image unit 200 are recorded. Two coordinate values of the upper right corner and the lower left corner may be recorded, or four coordinate values corresponding to the four corners may be recorded.

同じく、アノテーション220及び230の付属データには、その付着点又は付着範囲を経度緯度のような座標値によって特定する付属データが付されている。なお、アノテーションの座標値は、地図画像部200に対する付着時に、地図画像部200上における位置関係と地図画像部200の全体範囲を与える座標値とに基づいて算出される。なお、当該座標値の算出は、文書ファイルを操作するユーザのコンピュータ端末上で動作しているプログラムに基づいて実行される。   Similarly, the attached data of the annotations 220 and 230 is attached with attached data for specifying the attached point or attached range by coordinate values such as longitude and latitude. The coordinate value of the annotation is calculated based on the positional relationship on the map image unit 200 and the coordinate value that gives the entire range of the map image unit 200 when attached to the map image unit 200. The calculation of the coordinate value is executed based on a program operating on the computer terminal of the user who operates the document file.

ここで、地図画像部200は、いわゆるデジタル地図だけでなく衛星写真を含むものとする。いずれも、経度情報及び緯度情報を付属データに含むものとする。もっとも、付属データには、高度情報が含まれていても良い。   Here, the map image unit 200 includes not only a so-called digital map but also a satellite photograph. In either case, the longitude information and the latitude information are included in the attached data. However, the attached data may include altitude information.

(検索インデックスのデータ構造)
図3に、図2に示した地図情報入り文書について作成される検索インデックスのデータ構造例を示す。検索インデックスは、ファイルサーバ150をクローニングした検索インデックス作成部110により作成される。図3に示す検索インデックスは、3つの検索インデックスで構成される。すなわち、本文の検索インデックス300と、地図画像部範囲の検索インデックス310と、地図上アノテーションの検索インデックス320とから構成される。
(Search index data structure)
FIG. 3 shows an example of the data structure of the search index created for the map information containing document shown in FIG. The search index is created by the search index creation unit 110 that has cloned the file server 150. The search index shown in FIG. 3 is composed of three search indexes. That is, it is composed of a search index 300 for the body text, a search index 310 for the map image area range, and a search index 320 for the map annotation.

本文の検索インデックス300には、文書の本文210から抽出された検索対象ワードが格納される。図3の場合、「神奈川県」、「地図」、「マグニチュード4」等が抽出されて格納されている。   The text search index 300 stores search target words extracted from the text 210 of the document. In the case of FIG. 3, “Kanagawa Prefecture”, “Map”, “Magnitude 4” and the like are extracted and stored.

地図画像部範囲の検索インデックス310には、文書内に埋め込まれた地図画像部200の識別番号(ID番号)と共に、当該範囲の左上隅座標値UL(経度緯度)と、右下隅座標値LR(経度緯度)が格納される。   In the search index 310 of the map image part range, together with the identification number (ID number) of the map image part 200 embedded in the document, the upper left corner coordinate value UL (longitude / latitude) and the lower right corner coordinate value LR ( Longitude and latitude) are stored.

地図上アノテーションの検索インデックス320には、文書内の地図画像部200に付加されたアノテーションの識別番号(ID番号)と共に、追加されたテキスト情報(任意)と、アノテーションが付与された座標値(経度緯度)が格納される。   In the search index 320 of the annotation on the map, the added text information (arbitrary) and the coordinate value (longitude) of the annotation are added together with the identification number (ID number) of the annotation added to the map image part 200 in the document. Latitude) is stored.

(操作画面例)
図4〜図6に、検索端末170に表示される操作画面例を示す。これらの操作画面は、検索画面表示制御部120を通じて検索端末170に提供される。図4は、検索条件の入力に用いられる操作画面の一例である。図4に示す操作画面は、地図表示部400と、検索語入力部410と、検索結果のテキスト表示部440とで構成される。
(Operation screen example)
4 to 6 show examples of operation screens displayed on the search terminal 170. FIG. These operation screens are provided to the search terminal 170 through the search screen display control unit 120. FIG. 4 is an example of an operation screen used for inputting search conditions. The operation screen shown in FIG. 4 includes a map display unit 400, a search word input unit 410, and a search result text display unit 440.

このうち、地図表示部400は、検索範囲の入力及び検索結果の表示に用いられる。この形態例の場合、地図表示部400に表示されている地図又は写真には、表示範囲の位置情報が付属データとして埋め込まれている。この形態例の場合、ユーザは、不図示のマウス等を操作し、検索範囲450を地図表示部400上に直接入力する。例えばマウスの左ボタンを押したままマウスを動かすことにより、地図表示部400上に検索範囲450を入力する。   Among these, the map display unit 400 is used for inputting a search range and displaying a search result. In the case of this embodiment, the position information of the display range is embedded as attached data in the map or photo displayed on the map display unit 400. In the case of this example, the user operates a mouse (not shown) or the like to directly input the search range 450 on the map display unit 400. For example, the search range 450 is input on the map display unit 400 by moving the mouse while pressing the left button of the mouse.

検索語入力部410は、本文中やアノテーションに含まれる検索語を入力するための検索語入力欄420と、検索語の検索範囲をアノテーションとするか本文とするかを選択するためのチェックボックス430とで構成される。図4の場合、検索語入力欄420には、検索語として「建物倒壊」が入力されている。テキストの入力には、検索端末170の不図示のキーボードが用いられる。また、図4の場合、チェックボックス430のチェック記号は外れている。従って、図4の操作画面の場合には、地図画像又は写真画像の検索インデックス310と本文のインデックス300が検索対象となる。   The search word input unit 410 includes a search word input field 420 for inputting a search word included in the text or the annotation, and a check box 430 for selecting whether the search range of the search word is an annotation or a text. It consists of. In the case of FIG. 4, “building collapse” is entered as a search term in the search term input field 420. A keyboard (not shown) of the search terminal 170 is used for inputting text. In the case of FIG. 4, the check symbol in the check box 430 is removed. Therefore, in the case of the operation screen of FIG. 4, the search index 310 of the map image or the photographic image and the index 300 of the text are the search targets.

図5に、検索結果の表示例の一つを示す。図5に示す操作画面も、地図表示部400と、検索語入力部410と、検索結果のテキスト表示部440とで構成される。当該表示例は、チェックボックス430にチェック記号が入っていない場合に表示される。図5の場合、本文中に検索語を含む4件の文書ファイルが発見されたことがテキスト表示部440に表示される。この例の場合、1つ目の文書中には、検索条件を満たす地図画像が2つ以上存在することが分かる。一方、2つ目の文書には、検索条件を満たす地図画像又は写真画像が1つだけ存在することが分かる。また、検索条件を満たした地図画像の座標値も表示される。   FIG. 5 shows one example of display of search results. The operation screen shown in FIG. 5 also includes a map display unit 400, a search word input unit 410, and a search result text display unit 440. This display example is displayed when no check symbol is entered in the check box 430. In the case of FIG. 5, it is displayed on the text display unit 440 that four document files including the search word in the text are found. In this example, it can be seen that there are two or more map images that satisfy the search condition in the first document. On the other hand, it can be seen that there is only one map image or photographic image that satisfies the search condition in the second document. Also, the coordinate value of the map image that satisfies the search condition is displayed.

図6に、検索条件の入力画面において、チェックボックス430にチェック記号が入れられ、検索語の検索範囲がアノテーションに設定された場合の検索結果例を示す。この場合、検索条件を満たしたアノテーション460が、地図表示部400に表示されている地図上の付着位置に重畳するように表示される。この例の場合、検索語を含むアノテーション460が4つ発見されたことがテキスト表示部440と地図表示部400に表示される。図6の場合、検索結果を満たす4つのアノテーション460が、地図表示部400のうち対応する座標点に表示される。また、この場合、1つ目の文書中には、検索条件を満たすアノテーション460が2つ以上存在することが分かる。   FIG. 6 shows an example of a search result when a check symbol is entered in the check box 430 and the search term search range is set to annotation on the search condition input screen. In this case, the annotation 460 that satisfies the search condition is displayed so as to be superimposed on the attached position on the map displayed on the map display unit 400. In the case of this example, the fact that four annotations 460 including the search word are found is displayed on the text display unit 440 and the map display unit 400. In the case of FIG. 6, four annotations 460 that satisfy the search result are displayed at corresponding coordinate points in the map display unit 400. In this case, it can be seen that there are two or more annotations 460 that satisfy the search condition in the first document.

(検索インデックスの作成手順)
図7に、検索インデックス作成部110において実行される検索インデックスの作成プログラムの処理手順例を示す。なお、ステップ500からステップ540までの処理は、ファイルサーバ150からクローニングした各文書について実行される。
(Search index creation procedure)
FIG. 7 shows an example of a processing procedure of a search index creation program executed in the search index creation unit 110. The processing from step 500 to step 540 is executed for each document cloned from the file server 150.

まず、検索インデックス作成部110は、処理対象とする文書が地図画像付き文書ファイルか否かを判定する(ステップ500)。否定結果(No)の場合、検索インデックス作成部110は、後続するステップ510から540をスキップし、次の文書ファイルを処理対象に変更する。   First, the search index creation unit 110 determines whether or not the document to be processed is a map image-added document file (step 500). In the case of a negative result (No), the search index creation unit 110 skips subsequent steps 510 to 540 and changes the next document file to be processed.

一方、肯定結果(Yes)が得られた場合、検索インデックス作成部110は、文書内に含まれる全ての地図画像部200の範囲情報をインデックスに追加する(ステップ510)。すなわち、地図画像部範囲の検索インデックス310を生成する。   On the other hand, when a positive result (Yes) is obtained, the search index creation unit 110 adds the range information of all the map image units 200 included in the document to the index (step 510). That is, the search index 310 of the map image part range is generated.

次に、検索インデックス作成部110は、文書内の全ての地図画像上のアノテーション情報(テキスト情報と位置情報)をインデックスに追加する(ステップ520)。すなわち、地図上アノテーションの検索インデックスを生成する。   Next, the search index creation unit 110 adds annotation information (text information and position information) on all map images in the document to the index (step 520). That is, a search index for annotation on the map is generated.

次に、検索インデックス作成部110は、文書内の本文内のキーワードをインデックスに追加する(ステップ530)。すなわち、本文の検索インデックス300を生成する。   Next, the search index creation unit 110 adds keywords in the text in the document to the index (step 530). That is, a text search index 300 is generated.

この後、検索インデックス作成部110は、作成された各検索インデックス300、310及び320を検索インデックス格納部140に保存する(ステップ540)。   Thereafter, the search index creation unit 110 stores the created search indexes 300, 310, and 320 in the search index storage unit 140 (step 540).

(文書検索の実行手順)
図8に、検索処理部130において実行される文書検索プログラムの処理手順例を示す。図8に示すプログラムは、ユーザが検索端末170の画面上で検索条件を入力し、検索の実行を指示するボタンを操作した場合に実行される。
(Document search execution procedure)
FIG. 8 shows a processing procedure example of the document search program executed in the search processing unit 130. The program shown in FIG. 8 is executed when the user inputs search conditions on the screen of the search terminal 170 and operates a button for instructing execution of the search.

まず、検索処理部130は、地図表示部400に対してユーザが検索範囲450を指定入力しているか否かを判定する(ステップ600)。   First, the search processing unit 130 determines whether or not the user has designated and input the search range 450 to the map display unit 400 (step 600).

当該判定において肯定結果(Yes)が得られた場合、検索処理部130は、検索インデックス格納部140に格納されている各検索インデックスの地図画像部範囲の検索インデックス310と地図上アノテーションの検索インデックス320のそれぞれが、ステップ600で指定された検索範囲450に含まれるか否かを調べ、検索範囲450内に含まれる文書を抽出する(ステップ610)。   If a positive result (Yes) is obtained in the determination, the search processing unit 130 searches the map index portion search index 310 and the map annotation search index 320 of each search index stored in the search index storage unit 140. Are included in the search range 450 specified in step 600, and a document included in the search range 450 is extracted (step 610).

次に、検索処理部130は、検索語入力欄420に検索文字列が入力されているか否かを判定する(ステップ620)。なお、このステップ620は、ステップ600において否定結果が得られた場合にも実行される。   Next, the search processing unit 130 determines whether or not a search character string is input in the search word input field 420 (step 620). This step 620 is also executed when a negative result is obtained in step 600.

否定結果(No)が得られた場合、検索処理部130は、この時点で抽出済みの文書を検索結果としてテキスト表示部440に表示する。   When a negative result (No) is obtained, the search processing unit 130 displays the document already extracted at this time on the text display unit 440 as a search result.

一方、ステップ620で肯定結果(Yes)が得られた場合、検索処理部130は、アノテーション検索用のチェックボックス430にチェック記号が入っているか否かを判定する(ステップ630)。   On the other hand, when a positive result (Yes) is obtained in step 620, the search processing unit 130 determines whether or not a check symbol is included in the annotation search check box 430 (step 630).

否定結果(No)が得られた場合(すなわち、チェック記号がチェックボックス430に入っていない場合)、検索処理部130は、ステップ610で抽出済みの文書の中で本文中に検索語が含まれている文書を絞り込み、検索結果としてテキスト表示部440に表示する(ステップ640)。   When a negative result (No) is obtained (that is, when the check symbol is not in the check box 430), the search processing unit 130 includes the search word in the text in the document extracted in step 610. The selected documents are narrowed down and displayed on the text display unit 440 as search results (step 640).

一方、肯定結果(Yes)が得られた場合(すなわち、チェック記号がチェックボックス430に入っていた場合)、検索処理部130は、ステップ610で抽出済みの文書の中でアノテーション220のテキストに検索語が含まれている文書を絞り込み、検索結果としてテキスト表示部440に表示する(ステップ650)。   On the other hand, when a positive result (Yes) is obtained (that is, when the check symbol is in the check box 430), the search processing unit 130 searches the text of the annotation 220 in the document extracted in step 610. Documents containing words are narrowed down and displayed as search results on the text display unit 440 (step 650).

(まとめ)
以上説明したように、本形態例に係る文書検索システムの場合には、特許文献1のようにデータベースを利用して文書情報と地図画像をリンクさせる必要がなく、簡易なシステム構成による地図検索を実現できる。
(Summary)
As described above, in the case of the document search system according to this embodiment, there is no need to link the document information and the map image using the database as in Patent Document 1, and the map search with a simple system configuration is performed. realizable.

また、本形態例に係る文書検索システムの場合には、文書に貼り付けられた地図画像が有する位置情報を用いて検索インデックスを生成しているため、検索条件に正確に一致する地図画像を検索することができる。   In addition, in the case of the document search system according to this embodiment, the search index is generated using the position information of the map image pasted on the document, so that a map image that exactly matches the search condition is searched. can do.

また、本形態例に係る文書検索システムの場合には、文書に貼り付けられた地図画像だけでなく、当該地図画像上に貼り付けられたアノテーションの位置情報も含めて検索インデックスを作成するため、検索条件に関連する地図範囲とアノテーションを検索結果として出力することができる。   In addition, in the case of the document search system according to this embodiment, in order to create a search index including not only the map image pasted on the document but also the positional information of the annotation pasted on the map image, Map ranges and annotations related to search conditions can be output as search results.

また、本形態例に係る文書検索システムの場合には、地図検索の範囲を操作画面上に表示された地図画像上の範囲として直接指定できるため、座標範囲の簡易な入力が可能となる。   In the case of the document search system according to this embodiment, the map search range can be directly specified as the range on the map image displayed on the operation screen, so that the coordinate range can be easily input.

(他の形態例)
前述の形態例の場合には、図3に示すように、検索インデックスを、本文の検索インデックス300と、地図画像部範囲の検索インデックス310と、地図上アノテーションの検索インデックス320で構成した。しかし、検索インデックスは、本文の検索インデックス300と地図画像部範囲の検索インデックス310だけで構成しても良いし、いずれか1つだけで構成しても良い。
(Other examples)
In the case of the above-described embodiment, as shown in FIG. 3, the search index is composed of the search index 300 for the main text, the search index 310 for the map image area range, and the search index 320 for the map annotation. However, the search index may be composed of only the search index 300 of the text and the search index 310 of the map image part range, or may be composed of any one of them.

前述の形態例の場合には、地図検索の範囲を地図上の範囲として直接入力する場合について説明した。しかし、検索範囲はキーボード等を通じて数値として入力しても良い。   In the case of the above-described embodiment, a case has been described in which a map search range is directly input as a range on the map. However, the search range may be input as a numerical value through a keyboard or the like.

前述の形態例の場合には、検索結果の絞込みの際、本文中に検索語が含まれる文書を絞り込み条件(ステップ640)とするか、アノテーションに検索語が含まれる文書を絞り込み条件(ステップ650)としたが、本文とアノテーションのいずれか一方に検索語が含まれることを絞り込み条件に用いても良い。   In the case of the above-described embodiment, when narrowing down the search results, a document including the search word in the text is set as a narrowing condition (step 640), or a document including the search word in the annotation is narrowed down (step 650). However, it may be used as a narrowing-down condition that a search word is included in either the text or the annotation.

100:検索ホストシステム
110:検索インデックス作成部
120:検索画面表示制御部
130:検索処理部
140:検索インデックス格納部
150:ファイルサーバ
160:ネットワーク
170:検索端末
200:地図画像部
210:本文
220:アノテーション
230:アノテーション
300:本文の検索インデックス
310:地図画像部範囲の検索インデックス
320:地図上アノテーションの検索インデックス
400:検索範囲入力及び検索結果の地図表示部
410:検索語入力部
420:検索語入力欄
430:チェックボックス
440:検索結果のテキスト表示部
450:検索範囲
460:地図画像部やアノテーションの位置
100: Search host system 110: Search index creation unit 120: Search screen display control unit 130: Search processing unit 140: Search index storage unit 150: File server 160: Network 170: Search terminal 200: Map image unit 210: Body 220: Annotation 230: Annotation 300: Text search index 310: Map image part search index 320: Map annotation search index 400: Search range input and search result map display part 410: Search word input part 420: Search word input Column 430: Check box 440: Search result text display 450: Search range 460: Map image part and annotation position

Claims (14)

画像付き文書ファイルから検索インデックスを作成するシステムであって、
前記画像付き文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する手段と、
前記経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報と、前記画像付き文書ファイルの本文内のキーワードとを含む検索インデックスを作成する手段と
を有する検索インデックス作成システム。
A system for creating a search index from document files with images ,
Means for extracting longitude / latitude information indicating an image range from the attached data of one or more map images or photographic images included in the document file with images ;
Search index creation comprising: means for creating a search index that includes the longitude / latitude information, identification information that identifies a map image or photo image corresponding to the longitude / latitude information, and a keyword in the text of the document file with the image system.
請求項1に記載の検索インデックス作成システムは、
前記地図画像又は前記写真画像に貼り付けられたアノテーションの付属データから、当該アノテーションの前記地図画像又は前記写真画像上における貼り付け位置を特定する経度緯度情報を抽出する手段を更に有し、
前記検索インデックスを作成する手段は、前記検索インデックスとして、前記アノテーションの経度緯度情報を含める
ことを特徴とする検索インデックス作成システム。
The search index creation system according to claim 1 comprises:
Means for extracting, from the attached data of the annotation pasted on the map image or the photographic image, longitude / latitude information for specifying the pasting position of the annotation on the map image or the photographic image;
The search index creation system, wherein the search index creation means includes longitude / latitude information of the annotation as the search index.
画像付き文書検索システムにおいて、
画像付き文書ファイルを格納するファイルサーバと、
前記画像付き文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する手段と、
前記経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報と、前記画像付き文書ファイルの本文内のキーワードとを含む検索インデックスを作成する手段と、
作成された検索インデックスを格納する検索インデックス格納部と、
検索条件として、検索語と経度緯度の範囲の設定を、操作画面を通じて受付ける手段と、
検索条件として受付けた前記検索語と前記経度緯度範囲に経度緯度情報を含む前記検索インデックスを検索する手段と、
検索結果として画像付き文書ファイルを出力する手段と
を有する画像付き文書検索システム。
In the document retrieval system with images ,
A file server for storing document files with images ;
Means for extracting longitude / latitude information indicating an image range from the attached data of one or more map images or photographic images included in the document file with images ;
Means for creating a search index including the longitude / latitude information, identification information for identifying a map image or photo image corresponding to the longitude / latitude information, and a keyword in the text of the image-attached document file ;
A search index storage for storing the created search index;
As a search condition, means for accepting the setting of the search term and longitude / latitude range through the operation screen,
Means for searching the search index including longitude and latitude information in the range of the search term and the longitude and latitude received as a search condition;
An image-added document search system comprising: means for outputting an image-added document file as a search result.
請求項3に記載の画像付き文書検索システムにおいて、
検索条件としての経度緯度の範囲は、画面上に表示された前記地図画像又は写真画像に対する範囲指定を通じて特定される
ことを特徴とする画像付き文書検索システム。
The document- with-image search system according to claim 3,
Range of latitude and longitude as the search condition, the image-added document retrieval system, characterized in that it is identified through a range specified for the map image or a photographic image is displayed on the screen.
請求項3に記載の画像付き文書検索システムは、
前記地図画像又は前記写真画像に貼り付けられたアノテーションの付属データから、当該アノテーションの前記地図画像又は前記写真画像上における貼り付け位置を特定する経度緯度情報を抽出する手段を更に有し、
前記検索インデックスを作成する手段は、前記検索インデックスとして、前記アノテーションの経度緯度情報を含める
ことを特徴とする画像付き文書検索システム。
The document- with-image search system according to claim 3,
Means for extracting, from the attached data of the annotation pasted on the map image or the photographic image, longitude / latitude information for specifying the pasting position of the annotation on the map image or the photographic image;
It said means for creating a search index, as the search index, the image-added document retrieval system characterized by including the latitude and longitude information of the annotation.
請求項5に記載の画像付き文書検索システムにおいて、
前記検索インデックスを用いた検索に際し、前記アノテーションの経度緯度情報を検索対象に含めるか否かを選択する画面を操作画面に表示させる手段を更に有する
ことを特徴とする画像付き文書検索システム。
The document- with-image search system according to claim 5,
An image-added document search system further comprising means for displaying, on the operation screen, a screen for selecting whether or not to include longitude / latitude information of the annotation as a search target when performing a search using the search index.
請求項5に記載の画像付き文書検索システムにおいて、
検索結果を出力する手段は、検索条件を満たすアノテーションを、検索条件としての経度緯度の範囲を含む地図画像又は写真画像上の各対応位置に重ねて表示する検索結果画面を出力する
ことを特徴とする画像付き文書検索システム。
The document- with-image search system according to claim 5,
The means for outputting the search result is characterized by outputting a search result screen for displaying the annotation satisfying the search condition overlaid on each corresponding position on the map image or the photograph image including the range of longitude and latitude as the search condition. Document search system with images .
画像付き文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する機能と、
前記経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報と、前記画像付き文書ファイルの本文内のキーワードとを含む検索インデックスを作成する機能と
をコンピュータに実行させるプログラム。
A function of extracting longitude / latitude information indicating an image range from one or more map images or photographic image attached data included in a document file with an image ;
Causing the computer to execute the function of creating a search index including the longitude / latitude information, identification information for identifying a map image or a photographic image corresponding to the longitude / latitude information, and a keyword in the text of the document file with the image program.
請求項8に記載のプログラムは、
前記地図画像又は前記写真画像に貼り付けられたアノテーションの付属データから、当該アノテーションの前記地図画像又は前記写真画像上における貼り付け位置を特定する経度緯度情報を抽出する機能を更に有し、
前記検索インデックスを作成する機能は、前記検索インデックスとして、前記アノテーションの経度緯度情報を含める
ことを特徴とするプログラム。
The program according to claim 8 is:
From the attached data of the annotation pasted on the map image or the photographic image, it further has a function of extracting longitude / latitude information specifying the pasting position on the map image or the photographic image of the annotation,
The function for creating the search index includes longitude and latitude information of the annotation as the search index.
画像付き文書ファイルに含まれる1つ又は複数の地図画像又は写真画像の付属データから画像範囲を示す経度緯度情報を抽出する機能と、
前記経度緯度情報と、当該経度緯度情報に対応する地図画像又は写真画像を特定する識別情報と、前記画像付き文書ファイルの本文内のキーワードとを含む検索インデックスを作成する機能と、
検索条件として、検索語と経度緯度の範囲の設定を、操作画面を通じて受付ける機能と、
検索条件として受付けた前記検索語と前記経度緯度の範囲に経度緯度情報を含む前記検索インデックスを検索する機能と、
検索結果として画像付き文書ファイルを出力する機能と
をコンピュータに実行させるプログラム。
A function of extracting longitude / latitude information indicating an image range from one or more map images or photographic image attached data included in a document file with an image ;
A function for creating a search index including the longitude / latitude information, identification information for specifying a map image or a photo image corresponding to the longitude / latitude information, and a keyword in the text of the document file with the image ;
As a search condition, a function that accepts the setting of the search term and longitude / latitude range through the operation screen,
A function for searching the search index including longitude / latitude information in the range of the search term and the longitude / latitude received as a search condition;
A program that causes a computer to execute the function of outputting document files with images as search results.
請求項10に記載のプログラムにおいて、
検索条件としての経度緯度の範囲の設定を、画面上に表示された前記地図画像又は写真画像に対する範囲指定を通じて特定する
ことを特徴とするプログラム。
The program according to claim 10, wherein
A program characterized in that the setting of a range of longitude and latitude as a search condition is specified through specifying a range for the map image or photo image displayed on the screen.
請求項10に記載のプログラムにおいて
前記地図画像又は前記写真画像に貼り付けられたアノテーションの付属データから、当該アノテーションの前記地図画像又は前記写真画像上における貼り付け位置を特定する経度緯度情報を抽出する機能を更に有し、
前記検索インデックスを作成する機能が、前記検索インデックスとして、前記アノテーションの経度緯度情報を含める
ことを特徴とするプログラム。
The program according to claim 10,
From the attached data of the annotation pasted on the map image or the photographic image, it further has a function of extracting longitude / latitude information specifying the pasting position on the map image or the photographic image of the annotation,
The program for creating a search index includes longitude and latitude information of the annotation as the search index.
請求項12に記載のプログラムにおいて、
前記検索インデックスを用いた検索に際し、前記アノテーションの経度緯度情報を検索対象に含めるか否かを選択する画面を操作画面に表示させる機能を更に有する
ことを特徴とするプログラム。
The program according to claim 12,
In the search using the search index, the program further has a function of displaying on the operation screen a screen for selecting whether or not to include longitude / latitude information of the annotation as a search target.
請求項12に記載のプログラムにおいて、
検索結果を出力する機能は、検索条件を満たすアノテーションを、検索条件としての経度緯度の範囲を含む地図画像又は写真画像上の各対応位置に重ねて表示する検索結果画面を出力する
ことを特徴とするプログラム。
The program according to claim 12,
The search result output function is characterized by outputting a search result screen that displays annotations that satisfy the search conditions superimposed on each corresponding position on a map image or photo image that includes the range of longitude and latitude as the search conditions. Program to do.
JP2010232805A 2010-10-15 2010-10-15 Search index creation system, document search system, index creation method, document search method and program Expired - Fee Related JP5634209B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010232805A JP5634209B2 (en) 2010-10-15 2010-10-15 Search index creation system, document search system, index creation method, document search method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010232805A JP5634209B2 (en) 2010-10-15 2010-10-15 Search index creation system, document search system, index creation method, document search method and program

Publications (2)

Publication Number Publication Date
JP2012088792A JP2012088792A (en) 2012-05-10
JP5634209B2 true JP5634209B2 (en) 2014-12-03

Family

ID=46260379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010232805A Expired - Fee Related JP5634209B2 (en) 2010-10-15 2010-10-15 Search index creation system, document search system, index creation method, document search method and program

Country Status (1)

Country Link
JP (1) JP5634209B2 (en)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3111524B2 (en) * 1990-09-21 2000-11-27 株式会社日立製作所 Image information database search method
JP2000292196A (en) * 1999-04-02 2000-10-20 Nissan Motor Co Ltd Position-inputting device for vehicle
JP2002373168A (en) * 2001-06-15 2002-12-26 Teizou Osaku Method and system for retrieving picture based on position information
JP4574532B2 (en) * 2005-12-08 2010-11-04 日本電信電話株式会社 Geographic information control display method and apparatus, program, and computer-readable recording medium
JP4861078B2 (en) * 2006-06-30 2012-01-25 富士通株式会社 Index creation program, index creation device, and index creation method
WO2009066369A1 (en) * 2007-11-20 2009-05-28 Fujitsu Limited Information retrieval apparatus and information retrieval program
JP4623088B2 (en) * 2007-11-30 2011-02-02 ソニー株式会社 MAP DISPLAY DEVICE, MAP DISPLAY METHOD, AND IMAGING DEVICE
JP2010175896A (en) * 2009-01-30 2010-08-12 Nikon Corp Information processor, imaging device and program

Also Published As

Publication number Publication date
JP2012088792A (en) 2012-05-10

Similar Documents

Publication Publication Date Title
JP5371480B2 (en) Information processing apparatus, information processing method, and program
US9465802B2 (en) Content storage processing system, content storage processing method, and semiconductor integrated circuit
US20090293059A1 (en) Automatically connecting items of workflow in a computer program
JP2012221148A (en) Image processing method and image processing system
US10528678B2 (en) Digital content translation techniques and systems
JP2005107597A (en) Device and method for searching for similar sentence and program
US20140059079A1 (en) File search apparatus, file search method, image search apparatus, and non-transitory computer readable storage medium
US20120062590A1 (en) Information display device, information display system, and computer program product
US9824447B2 (en) Information processing apparatus, information processing system, and information processing method
CN111373724B (en) Electronic device and control method thereof
JP2017191357A (en) Word determination device
McAuliffe et al. Access to online historical aerial photography collections: Past practice, present state, and future opportunities
JP2008234078A (en) Information processor, information processing method, information processing program, and recording medium in which information processing program is recorded
JP5634209B2 (en) Search index creation system, document search system, index creation method, document search method and program
US20150169523A1 (en) Smart Scoring And Filtering of User-Annotated Geocoded Datasets
JP5384315B2 (en) SEARCH DEVICE, METHOD, AND PROGRAM
CN115129897A (en) Method, apparatus, device and medium for analyzing perceptual data using a knowledge graph
US20150286687A1 (en) Information processing apparatus, information processing method, and recording medium
JP2005275979A (en) Image retrieving program
JP2011170743A (en) Communication equipment, content retrieval method and program
JP2017037437A (en) Information processing system, information processor, information processing method and information processing program
JP2009199164A (en) Document management device, document management method and recording medium
JP6171807B2 (en) Document data processing system, document data processing program
JP5298484B2 (en) Document processing device
JP6160427B2 (en) Difference extraction system and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130724

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140328

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141014

LAPS Cancellation because of no payment of annual fees