JP2002197116A - Retrieval device - Google Patents

Retrieval device

Info

Publication number
JP2002197116A
JP2002197116A JP2000394254A JP2000394254A JP2002197116A JP 2002197116 A JP2002197116 A JP 2002197116A JP 2000394254 A JP2000394254 A JP 2000394254A JP 2000394254 A JP2000394254 A JP 2000394254A JP 2002197116 A JP2002197116 A JP 2002197116A
Authority
JP
Japan
Prior art keywords
search
match
item
entry
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000394254A
Other languages
Japanese (ja)
Inventor
Jun Ibuki
潤 伊吹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000394254A priority Critical patent/JP2002197116A/en
Publication of JP2002197116A publication Critical patent/JP2002197116A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To cope with a factor of discrepancy with a specified value in retrieval conditions concerning a retrieval device of things data corresponding to a retrieval request wherein a value about plural key items are specified, intended for a database wherein data constituted by plural items regarding specified things are registered as entries. SOLUTION: Regarding the respective items, references for coincidence determination are arranged in order of priority, and a coincidence determination reference table wherein a coincidence degree calculating method is set for each reference is provided. A ranking retrieving part is further provided. With respect to the input of the retrieval request, in the ranking retrieving part, the coincidence determination is conducted in accordance with the coincidence determination reference table about the item corresponding to each entry of the database about the each item. When coincident with the reference, the coincidence degree with respect to each of the entry is calculated based on the coincidence degree calculating method set for the item. Then, the data of the entry is outputted in order of points.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明はデータベースに登録
された人物や組織等の事物に関する情報を検索する事物
データの検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an object data search apparatus for searching for information on an object such as a person or an organization registered in a database.

【0002】近年,各種のデータベースが一般に広く利
用されるようになり,インターネット等での利用も日常
的に行われている。このようなデータベースについてキ
ーワードを入力して,これに一致する事物データを検索
するサービスも普通に行われているが,キーの指定だけ
では一意に一つの事物データを特定できない場合があ
り,本来は必要とするデータと一致がとれないことが多
く発生したり,データが経時変化すると一致がとれない
ということがあり,その改善が望まれている。
[0002] In recent years, various databases have been widely used in general, and use on the Internet and the like is also performed on a daily basis. A service is also commonly used to enter keywords for such a database and search for the corresponding item data. However, there is a case where one item data cannot be uniquely specified only by specifying the key. In many cases, the data does not match the required data, or when the data changes with time, the data does not match. Therefore, improvement is desired.

【0003】[0003]

【従来の技術】データベースに人物や,会社等のオブジ
ェクトを検索する場合,人物や組織体の名前,住所等の
事物に関する情報を高速で検索してユーザの意図する事
物に関する情報を得る場合,一般には名前(個人名や,
組織体名)だけでは同名の人物が存在する場合があるた
め,住所等の項目を付加して,複数の項目に渡る情報を
キーとして指定して,検索を行わなければならない。
2. Description of the Related Art When searching for an object such as a person or a company in a database, information about an object such as the name or address of a person or an organization is searched at high speed to obtain information about an object intended by a user. Is the name (personal name,
In some cases, a person with the same name exists only with the (organization name). Therefore, a search must be performed by adding items such as an address and designating information over a plurality of items as a key.

【0004】図15は従来の同名企業の検索の例を示
す。データベースの項目とし,組織体名,代表者,所在
地がある場合,検索する時の指定する項目として,企業
名だけ選択して「ABC電子」を指定すると,データベ
ースの検索結果として2つの同名企業が出力される。こ
のような結果を避けて,一つの組織体だけを検索させた
い場合は,企業名の項目だけでなく他の項目,例えば代
表者名(または所在地)を指定する。図15の例では,
企業名「ABC電子」と「鈴木〇〇」を指定すること
で,両項目で一致する一つのエントリを出力することが
できる。
FIG. 15 shows an example of a conventional search for companies of the same name. If there are an organization name, a representative, and a location as database items, select only the company name and specify "ABC Electronics" as the item to specify when searching. Is output. In order to avoid such a result and search only one organization, specify not only the item of the company name but also other items, for example, the name of the representative (or the location). In the example of FIG.
By specifying the company name "ABC Electronics" and "Suzuki @", one entry that matches both items can be output.

【0005】ところが,検索する際に指定する項目が増
えると,今度は項目毎に表記の揺れや,経時変化等によ
って本来同じオブジェクトを示す筈なのに検索用とデー
タベース中の値が一致しないという場合が増えて来る。
However, when the number of items to be specified at the time of retrieval increases, the value of the retrieval and the value in the database may not coincide with each other, although the same object is supposed to indicate the same object due to swaying of notation or temporal change of each item. Will increase.

【0006】ここで,表記の揺れとは,例えば,データ
ベースに「××カメラ」という企業名が登録されている
時に,検索時に指定された名称が「××キャメラ」,
「××キヤメラ」というように異なる表記をした場合に
は一致が得られないという結果となる。また,経時変化
の例としては,代表者が交代して名前が変わったり,組
織が移転して所在地が変わった場合等である。
Here, the fluctuation of the notation means that, for example, when a company name "xx camera" is registered in the database, the name specified at the time of retrieval is "xx camera",
If different notations such as "xx camera" are used, the result is that no match can be obtained. Further, examples of the change with time include a case where the name is changed due to the change of the representative, a case where the location is changed due to the relocation of the organization, and the like.

【0007】こうした問題に対して次の,のような
方法で対処している。
[0007] These problems are addressed by the following method.

【0008】不一致を生み出す個別の要因に対する対
処する方法。
[0008] how to deal with for the individual factors that produce a mismatch.

【0009】オブジェクト同士の同一性を柔軟に判断
し,不一致項目があってもうまくマッチするようにする
方法。
A method for flexibly judging the identity of objects so that even if there is an unmatched item, the objects are matched well.

【0010】図16は従来の対処方法の例である。FIG. 16 shows an example of a conventional coping method.

【0011】の方法としては,表記の揺れ等のある程
度範囲の決められた値のブレを扱うため,検索の際に指
定された値からまず同一の言葉の別表記を生成し,それ
らを全てのどれかという形で条件指定を行い,検索をす
るシステムが挙げられる。
According to the method of (1), in order to deal with a fluctuation of a fixed value within a certain range, such as a fluctuation of the notation, first, another notation of the same word is generated from a value designated at the time of retrieval, and these are all converted to all the notations. There is a system that performs a condition specification in any form and performs a search.

【0012】図16のA.は,の方法の例であり,
a.はデータベースに登録されるエントリで,組織体名
が「××カメラ」,代表者が「D氏」,所在地が「E
市」というデータについて,b.のようにキーの値とし
て組織体名を「××キャメラ」と指定して検索をして
も,一致がとれないため検索結果は0件となるが,指定
されたキーの値からc.のように組織体名の別表記(異
表記)を生成する方法を用いる。この場合,生成された
別表記は,「××キァメラ」,「××キアメラ」,「×
×キヤメラ」となる。このように別表記の複数の組織体
名を指定して検索を行うと,a.のエントリと一致する
ため検索出力が得られる。
FIG. Is an example of the method
a. Is an entry registered in the database, the organization name is "xx camera", the representative is "D", and the location is "E".
For the data "city", b. Even if a search is performed by designating the organization name as “xx camera” as the key value as in the above, no match is obtained and the search result is 0. A method of generating another notation (different notation) of the organization name as described above is used. In this case, the different notations generated are "xx kimera", "xx kimera", "x
× camera ”. Doing search thus specifying multiple organization name for a different notation, a. And the search output is obtained.

【0013】このの方法の利点としては,データベー
スの本体に対してはデータの修正や追加等を行う必要が
ないことが挙げられるが,一方で省略された要素の復活
など別表記の可能性が広い場合は検索速度の低下を招く
という問題があった。
An advantage of this method is that it is not necessary to modify or add data to the main body of the database, but on the other hand, there is a possibility of another notation such as restoration of omitted elements. If it is wide, there is a problem that the search speed is reduced.

【0014】次に上記の方法を図16のB.に示す。
図16のB.のa.はデータベースへ登録する際に表記
の揺れに関する差異を吸収した代表キーを設定する例で
あり,例1として,氏名を表す元の値が「齋藤 ○」の
場合,代表キーを「斉藤 ○」としてデータベースに登
録し,例2として,氏名を表す元の値が「斎藤 ○」の
場合,代表キーを「斉藤 ○」としてデータベースに登
録する。このようなデータベースのエントリに対し,検
索を行う際の処理はb.に示すように,指定される値が
「齋藤 ○」の場合,この氏名の表記を計算処理して,
元の値に対する代表値である「斉藤 ○」に変換し,こ
の変換された代表値を用いてデータベースを検索する
と,データベースには代表値が登録されているので検索
一致が得られる。
Next, the above method will be described with reference to FIG. Shown in
B in FIG. A. Is an example of setting a representative key that absorbs the difference in notation when registering in the database. As an example 1, if the original value representing the name is “Saito ○”, the representative key is “Saito ○” As a second example, when the original value representing the name is “Saito ○”, the representative key is registered as “Saito ○” in the database. Processing for performing a search for such a database entry is b. If the specified value is “Saito ○”, the notation of this name is calculated and
When the converted representative value is converted into a representative value “Saito ○” for the original value and the database is searched using the converted representative value, a search match is obtained because the representative value is registered in the database.

【0015】この方法は,検索時の値の指定は一つだけ
なので,速度の低下は検索部では起こらない。しかし,
代表値をどう設計するかに工夫が必要である点,データ
ベース中の全てのレコードに従来の値と違う値を設定す
る必要がある点の2つの原因により,初期設定作業やデ
ータ保守作業の増大を招くという問題があった。
In this method, since only one value is specified at the time of retrieval, a reduction in speed does not occur in the retrieval unit. However,
Increase in initial setting work and data maintenance work due to two reasons: it is necessary to devise how to design representative values, and it is necessary to set different values for all records in the database from the conventional values. There was a problem of inviting.

【0016】次に不一致を招く個別の要因を除くことよ
りも外乱がある場合にオブジェクト全体としての同一性
を判定して同一のものを検索する仕組みとしては,ラン
キング検索の仕組みが挙げられる。
Next, as a mechanism for judging the identity of the entire object and searching for the same object when there is a disturbance rather than removing individual factors that cause inconsistency, there is a ranking search mechanism.

【0017】このランキング検索は,インターネットに
おけるキーワード検索の際に利用されており,複数のキ
ーワードの指定による文書検索の際に,各キーワード毎
に対象とする文書とマッチするか(対象文書中にキーワ
ードが存在するか)をチェックした後に,検索要求中の
各キーワード毎にマッチング・スコアが集計される。こ
の場合,指定した複数の各キーワード毎に予め重みを付
与して,一致がとれたキーワードを含む文書について
は,マッチングスコアとしてキーワードに付与した重み
の点数を加算し,一致しないと0点とする。それらを総
合(一般的にキーワード毎の重みつきの加算)して対象
文書のマッチングスコアが計算される。ユーザには検索
結果としてマッチングスコアの上位から順にランキング
付けを行って順にテキストを提示することになる。
This ranking search is used at the time of a keyword search on the Internet. When a document is searched by specifying a plurality of keywords, whether each keyword matches the target document (the keyword Is checked), the matching score is totaled for each keyword in the search request. In this case, a weight is assigned in advance to each of a plurality of specified keywords, and for a document including a matched keyword, the score of the weight assigned to the keyword is added as a matching score, and if the two do not match, a score of 0 is given. . The matching score of the target document is calculated by integrating them (generally adding weights for each keyword). The text is presented to the user as a search result in order from the highest matching score and in order.

【0018】この仕組みを利用すれば,冗長な情報をも
つ検索要求による検索では,項目が全て一致しなくて
も,一致した項目の多いエントリから順に上位に提示さ
れるために誤りや表記の揺れ等での不一致項目を無視し
た検索ができる。
If this mechanism is used, in a search by a search request having redundant information, even if all items do not match, the entries are presented in order from the entry with the largest number of matching items, so that errors or fluctuations in notation are caused. Searches can be performed ignoring mismatched items such as.

【0019】[0019]

【発明が解決しようとする課題】上記した従来の検索の
方法では,人物,企業といった事物を検索する際には一
つのキーの値の指定によって一意に特定できる場合はむ
しろ少なく,複数のキーを同時に指定する必要がある。
ところが,実際には表記の揺れや経時変化等によってた
とえ同一の事物でも,全ての項目に対して検索要求で指
定した値とデータベース中のエントリの持つ値が一致し
ない場合が多く現れる。
According to the above-described conventional search method, when searching for an object such as a person or a company, it is rather rare that the key can be uniquely specified by specifying one key value. Must be specified at the same time.
However, in practice, the value specified in the search request does not match the value of the entry in the database with respect to all items even if the same thing is the same, due to the fluctuation of the notation or the change over time.

【0020】これに対処するため,上記したように不一
致の要因を表記の揺れ等の予測可能な範囲に絞る方式が
存在するが,誤りや経時変化等への対処は予測すべき範
囲が広く,また予測できない項目もあるため有効ではな
い。
To cope with this, as described above, there is a method of narrowing the cause of the mismatch to a predictable range such as a fluctuation of the notation. It is not effective because some items cannot be predicted.

【0021】一方,複数の項目での値の一致を総合的に
判断して条件に合致したか判断する仕組みとして,上記
したランキング検索の方法があるが,項目毎の一致を調
べる時に省略等によって指定値とデータベース中の値が
完全に一致しないことが多く,完全一致だけを条件とし
て項目毎のマッチングスコアを計算していては,検索ゴ
ミ(望まない検索結果)の割合が多くなるという問題が
あった。
On the other hand, there is the above-described ranking search method as a mechanism for judging whether values match in a plurality of items comprehensively to determine whether or not a condition is satisfied. In many cases, the specified value and the value in the database do not completely match, and if the matching score for each item is calculated on the condition of only an exact match, the ratio of search garbage (unwanted search results) increases. there were.

【0022】本発明は既存のデータベースの内容に大き
な変更を加えることなく,表記の揺れや,誤りや,経時
変化等のデータベース中の値と検索条件中の指定値との
不一致の要因に対処することが可能なデータベースの事
物データの検索装置を提供することを目的とする。
The present invention addresses the causes of inconsistencies between the values in the database, such as swaying of notation, errors, and changes over time, and the specified values in the search conditions without making significant changes to the contents of the existing database. It is an object of the present invention to provide an apparatus for searching object data of a database that can perform the search.

【0023】[0023]

【課題を解決するための手段】図1は本発明の第1の原
理構成を示す図である。図中,1は検索要求(1または
複数の項目についてのキーワード),2はデータベー
ス,3はランキング検索の機能を備えた順位付検索部,
4は本発明による一致判断基準表である。一致判断基準
表4には,一致とする基準として完全一致,前方一致,
後方一致等の項目毎の一致判断の基準を優先順に並べ,
各基準毎に一致度の計算方法(例えば,スコアの修正
値)が設定されている。
FIG. 1 is a diagram showing a first principle configuration of the present invention. In the figure, 1 is a search request (keyword for one or more items), 2 is a database, 3 is a ranking search unit having a ranking search function,
4 is a coincidence determination criterion table according to the present invention. In the match judgment criterion table 4, perfect match, prefix match,
Criteria of match judgment for each item such as backward match are arranged in priority order,
The calculation method of the degree of coincidence (for example, the score correction value) is set for each reference.

【0024】この図1の構成では,通常の順位付検索と
同様に各項目毎に検索要求1として指定値(キーワー
ド)を入力すると,順位付検索部3はデータベース2の
エントリと指定値との一致判定をするが,この時判断基
準として一致判断基準表4に記述された方法を順に試し
てゆき,成功した時点で表中の対応する場所に記載され
た一致度の計算方法を用いて各項目の一致度を計算す
る。この後,各項目毎の一致度は順位付検索部3におい
て集計され,エントリ全体の一致度が計算され,最終的
に各エントリは一致度の点数によって順序付けられて点
数の高いものから出力される。
In the configuration shown in FIG. 1, when a specified value (keyword) is input as a search request 1 for each item in the same manner as in a normal ranked search, the ranked search unit 3 compares the entry of the database 2 with the specified value. A match is determined. At this time, the methods described in the match determination table 4 are sequentially tried as a determination criterion. Calculate the degree of coincidence of items. Thereafter, the matching score of each item is totaled in the ranking search unit 3, the matching score of the entire entry is calculated, and finally each entry is ordered by the score of the matching score and is output from the one with the highest score. .

【0025】図2は本発明の第2の原理構成であり,図
中,1〜4の各符号は上記図1の同一符号の各部と同じ
であり説明を省略する。5は同一性判定部である。この
第2の原理構成では,上記図1と同様に順位付検索部3
で検索要求1に対して一致判断基準表4を判断の基準と
してデータベース2のエントリについて検索を行って,
エントリ全体の一致度の計算を行い,一致度の点数の高
いものを優先して候補集合が出力されるが,各候補につ
いて同一性判定部5で検索要求1と同じ(対応する)も
のであるかの判定(チェック)を行い,同一と判定され
たものだけを検索結果として出力する。これにより,一
部で一致したものであっても検索要求にマッチした結果
を抽出することができる。
FIG. 2 shows a second principle configuration of the present invention. In FIG. 2, reference numerals 1 to 4 are the same as those of the same reference numerals in FIG. Reference numeral 5 denotes an identity determination unit. In the second principle configuration, as in FIG.
The search request 1 is searched for an entry in the database 2 using the matching criterion table 4 as a criterion for determination,
The matching score of the entire entry is calculated, and a candidate set is output with priority given to the score with the highest matching score. Each candidate is the same (corresponding) to the search request 1 by the identity determination unit 5. Is determined, and only those determined to be the same are output as search results. As a result, it is possible to extract a result that matches the search request even if the result partially matches.

【0026】図3は本発明の第3の原理構成であり,図
中,1〜5の各符号は上記図2の同一符号の各部と同じ
であり説明を省略する。6は検索要求の項目とエントリ
との完全一致検索を行う基本検索部である。
FIG. 3 shows a third principle configuration of the present invention. In the drawing, reference numerals 1 to 5 are the same as those of the same reference numerals in FIG. 2 and will not be described. Reference numeral 6 denotes a basic search unit that performs a perfect match search between the item of the search request and the entry.

【0027】この第3の原理構成では,最初に基本検索
部6において,検索要求1のキー項目に対応する指定値
とデータベース2のエントリとの完全一致を条件とした
通常の検索を行う。これによって検索結果が得られると
それを最終的な出力とするが,完全一致検索に失敗する
と,上記図1,図2と同様の順位付検索部3において検
索要求1に対応してデータベース2のエントリについて
上記図2と同様の検索を行い,この検索結果についてさ
らに,図2と同様に同一性判定部5において検索要求と
同じかチェックする。
In the third principle configuration, first, the basic search unit 6 performs a normal search on the condition that a specified value corresponding to the key item of the search request 1 and an entry in the database 2 are completely matched. This is the search results obtained when it the final output, failure to exact search, FIG. 1, the database 2 corresponding to the search request 1 In the same ranking search unit 3 and FIG. 2 The entry is searched in the same manner as in FIG. 2 described above, and the search result is further checked in the identity determination unit 5 as in FIG.

【0028】図4は本発明の第4の原理構成であり,図
中,1〜5の各符号は上記図2の同一符号の各部と同じ
であり説明を省略する。7は不一致項目抽出部,8は別
表記判断部である。
FIG. 4 shows a fourth principle configuration of the present invention. In FIG. 4, reference numerals 1 to 5 are the same as those of the same reference numerals in FIG. Reference numeral 7 denotes a mismatched item extraction unit, and reference numeral 8 denotes a different notation determination unit.

【0029】この第4の原理項目では,上記図2と構成
と同様に順位付検索部3において一致判断基準表4を用
い,データベース2の各エントリについて順位付検索を
行い,一致度の点数の高いものを優先して候補集合が出
力されるが,各候補について同一性判定部5で検索要求
1に対応するものであるかの判定を行い,同一と判定さ
れたエントリだけを検索結果として出力するが,その検
索結果のエントリを不一致項目抽出部7へ入力し,ここ
で検索要求1と一致しない項目を抽出する。抽出された
不一致項目は別表記判断部8へ供給され,ここでは検索
要求1と一致しない項目は誤りであるのか,または誤り
ではなく検索要求1の項目を別表記したものに相当する
のか判断し,別表記の関係であると判断されると無視さ
れ(不一致でも正しい項目とする),別表記の関係がな
いと判断されると誤りとして出力される。
In the fourth principle item, in the same manner as in FIG. 2 described above, the ranking search unit 3 performs a ranking search for each entry of the database 2 using the coincidence determination criterion table 4 and obtains a score of the degree of coincidence. The candidate set is output with higher priority, but the identity determination unit 5 determines whether each candidate corresponds to the search request 1 and outputs only the entry determined to be the same as the search result. However, the entry of the search result is input to the non-matching item extracting unit 7, and an item that does not match the search request 1 is extracted. The extracted unmatched items are supplied to another notation judging section 8, where it is judged whether an item that does not match the search request 1 is an error or corresponds to a different notation of the item of the search request 1 instead of an error. If it is determined that there is a relationship with another notation, it is ignored (even if there is no match), it is output as an error if it is determined that there is no relationship with another notation.

【0030】図5は本発明の第5の原理構成であり,図
中,1〜6の各符号は上記図3に示す同一符号の各部と
同じであり説明を省略する。7は不一致項目抽出部,9
はデータベース登録部である。
FIG. 5 shows a fifth principle configuration of the present invention. In the drawing, reference numerals 1 to 6 are the same as those of the same reference numerals shown in FIG. 7 is a mismatched item extraction unit, 9
Is a database registration unit.

【0031】この第5の原理構成では,上記図3と構成
と同様に基本検索部6において検索要求1に含まれた内
容とデータベース2の各エントリとの完全一致検索を行
い,完全一致した場合は検索成功の出力を発生するが,
完全一致に失敗した場合は,順位付検索部3において一
致判断基準表4による順位付検索を行い,その結果とし
て得られた基準に合って順位付けられた候補集合(各エ
ントリ)は同一性判定部5において検索要求1と照合さ
れ同一と判定されたものを検索結果として出力するが,
エントリの中で不一致項目となる項目が不一致項目抽出
部7で抽出される。この構成では,検索要求1と異なる
不一致項目は正しいものとして扱い,その項目(別表
記)をインデックスとしてデータベース登録部9に供給
すると,データベース登録部9はデータベース2の該当
するエントリに抽出された不一致項目を別表記として登
録して更新が行われる。
In the fifth principle configuration, the basic search unit 6 performs a perfect match search between the contents included in the search request 1 and each entry of the database 2 in the same manner as the configuration shown in FIG. Produces a successful search output,
If the complete match fails, the ranking search unit 3 performs a ranking search according to the match criterion table 4, and the candidate set (each entry) ranked according to the resulting criteria is subjected to identity determination. The part 5 is compared with the search request 1 and the one determined to be the same is output as a search result.
Items that become mismatched items in the entry are extracted by the mismatched item extraction unit 7. In this configuration, an unmatched item different from the search request 1 is treated as a correct item, and the item (another notation) is supplied to the database registration unit 9 as an index. The item is registered as another notation and updated.

【0032】[0032]

【発明の実施の形態】図6は本発明が実施される構成例
である。図中,10はCPU100,メモリ101を含
む処理装置,11はハードディスク等を用いた事物デー
タのデータベース(DBで表示),12はディスプレイ
等の表示部とキーボードやマウス等の入力部を含む入出
力装置,13はプリンタ,14はCDROM等の外部記
憶装置である。処理装置10のメモリ101には,検索
のためのプログラム102や,データ103が格納さ
れ,一致判断基準表103aがデータ103の1部とし
て設けられ,その内容は検索を行う前に予め設定され
る。
FIG. 6 shows an example of a configuration in which the present invention is implemented. In the figure, 10 is a processing device including a CPU 100 and a memory 101, 11 is a database (displayed in DB) of object data using a hard disk or the like, and 12 is an input / output including a display unit such as a display and an input unit such as a keyboard and a mouse. A device 13 is a printer, and 14 is an external storage device such as a CDROM. A search program 102 and data 103 are stored in a memory 101 of the processing device 10, and a match criterion table 103a is provided as a part of the data 103, and the contents thereof are set in advance before the search is performed. .

【0033】事物データのデータベース11には,予め
組織体名,代表者,所在値等の各項目について多くのデ
ータが格納されており,処理装置10は入出力装置12
への検索要求の入力に対し,内部のメモリ101に格納
されたプログラム102により上記図1乃至図5に示す
各部の機能を実現する。メモリ101には順位付検索を
行うために予め,一致判断基準表103aに一致判断の
基準データが格納されている。
The object data database 11 previously stores a large amount of data for each item such as an organization name, a representative, a location value, and the like.
In response to the input of the search request, the functions of each unit shown in FIGS. 1 to 5 are realized by the program 102 stored in the internal memory 101. In the memory 101, reference data for matching determination is stored in advance in the matching determination criterion table 103a in order to perform ranking search.

【0034】本発明の第1乃至第5の各原理構成の主要
な構成要素である順位付検索部を実現する処理内容を図
7,図8を用いて説明する。
The contents of processing for realizing the ranking search unit, which is a main component of each of the first to fifth principles of the present invention, will be described with reference to FIGS.

【0035】図7は順位付検索の処理フロー,図8は一
致判断とスコア計算の処理フローである。
FIG. 7 is a processing flow of ranking search, and FIG. 8 is a processing flow of matching judgment and score calculation.

【0036】順位付検索の場合には,予め一致判断基準
表に一致判断の手法とそれに対応するスコア修正値及び
各項目に対する重み付けが設定され,後述する図10の
B.にその具体例を示す。その例では,検索要求のある
項目に対してエントリの対応する項目との比較におけ
る,一致の手法(形態)がに示すように指定され,そ
れぞれの手法の一致検出時のスコアの修正値(乗算され
る値)が設定されており,完全一致の場合は「1」が乗
算され,前方一致の場合は「0.8」,後方一致が
「0.6」,これら以外の部分一致(例えば,中間だけ
一致)では「0.4」である。各項目毎の重み(点数)
はに示すように指定され,この例では企業名(組織体
名)に対し「20」点,所在地に「10」点,代表者に
ついて「10」点が設定されている。
In the case of ranking search, a matching determination method, a score correction value corresponding thereto, and a weight for each item are set in advance in the matching determination criterion table. Shows a specific example. In this example, the matching method (morphology) in the comparison of the item with the search request with the corresponding item in the entry is specified as shown in (1), and the score correction value (multiplication value) at the time of matching detection for each method Are multiplied by “1” for perfect match, “0.8” for forward match, “0.6” for backward match, and partial matches other than these (for example, In the case of "coincidence only in the middle", it is "0.4". Weight (point) for each item
Is designated as shown in the following example. In this example, "20" points are set for the company name (organization body name), "10" points are set for the location, and "10" points are set for the representative.

【0037】図7の順位付検索の処理フローを説明する
と,検索要求が入力されると(図7のS1),データベ
ースから一つのエントリを取り出し,検索要求の項目毎
に一致判断基準表に基づいてマッチングを判断し,項目
の重みとスコアの修正を用いてマッチングスコアの計算
を各項目について行って加算する(同S2)。データベ
ースの全エントリについて検索を終了したか判別し(図
7のS3),終了しないと次のエントリを選択して(同
S4),上記S2の処理を実行し,終了した場合は各エ
ントリに関するマッチングスコアを集計してスコア順
(高得点の順)にソートする(同S5)。続いてソート
順にエントリのデータを出力する(図7のS6)。
The processing flow of the ranking search shown in FIG. 7 will be described. When a search request is input (S1 in FIG. 7), one entry is extracted from the database, and for each item of the search request, based on the match determination criterion table. Then, the matching score is calculated for each item by using the weight of the item and the correction of the score, and the result is added (S2). It is determined whether or not the search has been completed for all entries in the database (S3 in FIG. 7). If not, the next entry is selected (S4), and the process of S2 is executed. The scores are totaled and sorted in the order of the scores (in the order of the highest score) (S5). Subsequently, the entry data is output in the sort order (S6 in FIG. 7).

【0038】上記図7のS2で行っている処理の詳細を
図8により説明する。図8は一致判断とスコア計算の処
理フローであり,検索要求の項目に対応するエントリの
項目を取り出し(図8のS1),一致判断基準表に従っ
て,完全一致,前方一致,後方一致等の何れかの手法
(態様)で一致するか判断し(同S2),一致しない場
合はこのエントリの中の次の項目に移行し(同S3),
一致した場合は一致判断基準表に規定する当該項目の固
有の重みを取り出し,一致の手法(形態)に対応するス
コアの修正に基づいてスコアを計算し,このエントリに
関するそれまでのスコア全体に加算する(同S4)。続
いてこのエントリの全ての対象項目について検索を終了
したか判別し(図8のS5),終了してない場合は同じ
エントリの次の項目に移行し,終了した場合は上記図7
の処理(図7のS3)に続く。
The details of the processing performed in S2 of FIG. 7 will be described with reference to FIG. FIG. 8 is a processing flow of the match judgment and the score calculation. The item of the entry corresponding to the item of the search request is fetched (S1 in FIG. 8), and according to the match judgment criterion table, any of perfect match, forward match, backward match, etc. It is determined whether or not they match (S2), and if they do not match, the process proceeds to the next item in this entry (S3).
If there is a match, the unique weight of the item specified in the match criterion table is extracted, a score is calculated based on the correction of the score corresponding to the matching method (form), and the score is added to the entire score so far for this entry. (S4). Subsequently, it is determined whether the search has been completed for all target items of this entry (S5 in FIG. 8), and if not completed, the process proceeds to the next item of the same entry.
(S3 in FIG. 7).

【0039】次に本発明の第2〜第5の原理構成におい
て重要な機能を実行する同一性判定部を実現する同一性
判定の処理フローを図9に示す。このフローでは,事物
データのデータベースの項目として組織体の名称,所在
地,代表者等が含まれている時に,検索要求に対応する
検索結果を得た場合に検索結果のデータが検索要求と一
致するものか否かの判断を行うためである。最初に,名
称が一致するかまたは別表記であるかを判別する(図9
のS1)。この中の別表記とは,例えば,一方がアルフ
ァベットで表記されているのに対し,他方がそのアルフ
ァベットを片仮名で表記したものである場合は,同じも
のを別表記したものとして扱う場合である。名称が一致
せず,しかも別表記でもない場合は,同一でないと判定
し(図9のS5),名称が一致するか,または別表記で
あると判定されると,次に所在地が一致するか判別し
(同S2),これが一致することが分かると両者は同一
と判定する(同S3)。所在地が一致しない場合は,次
に代表者が一致するか判別し(図9のS4),一致する
場合は同一と判定し,一致しない場合は同一でないと判
定する。
Next, FIG. 9 shows a processing flow of the identity determination for realizing an identity determination unit that executes an important function in the second to fifth principle configurations of the present invention. In this flow, when the search result corresponding to the search request is obtained when the name, location, representative, and the like of the organization are included as the items of the database of the thing data, the data of the search result matches the search request. This is to determine whether or not the item is a product. First, it is determined whether the names match or are written differently (see FIG. 9).
S1). The different notation in this means, for example, a case where one is written in alphabets and the other is written in katakana, and the same is treated as another notation. If the names do not match and are not in another notation, it is determined that they are not the same (S5 in FIG. 9). It is determined (S2), and when it is found that they match, both are determined to be the same (S3). If the locations do not match, it is next determined whether or not the representatives match (S4 in FIG. 9). If they match, it is determined that they are the same, and if they do not match, it is determined that they are not the same.

【0040】本発明による検索の具体例を以下に説明す
る。
A specific example of the search according to the present invention will be described below.

【0041】図10,図11は本発明による第1の具体
例(その1),(その2)であり,本発明の上記第1の
原理構成(図1)に対応する。この具体例では,組織体
(企業等)に関するデータを検索する。
FIGS. 10 and 11 show first specific examples (No. 1) and (No. 2) according to the present invention, which correspond to the above-described first principle configuration (FIG. 1) of the present invention. In this specific example, data on an organization (eg, a company) is searched.

【0042】図10のA.に検索要求の例が示され,名
称が「ABCD」,所在地が「神奈川県川崎市」という
ものである。一致判断基準表の例は図10のB.に示さ
れ,上記図7,図8に関連して説明したようにには一
致判断の手法,スコアの修正値の設定例が示され,に
は各項目毎の点数(重み)の設定例が示されている。一
方,これらの検索要求に関係するデータのエントリとし
てデータベース中には図10のC.に示すような3つの
エントリが存在するものとする。
FIG. Shows an example of a search request, which has a name of "ABCD" and a location of "Kawasaki City, Kanagawa Prefecture". An example of the match criterion table is shown in FIG. As shown in FIG. 7 and FIG. 8, there is shown an example of a method of determining a match and a setting example of a correction value of a score, and a setting example of a score (weight) for each item. It is shown. On the other hand, as entries of data related to these search requests, C.C. It is assumed that there are three entries as shown in FIG.

【0043】図10のC.に示すようなエントリに対し
て通常のキーの完全一致による検索をした場合,なにも
検索できず検索失敗となってしまうが,順位付検索にお
いても項目毎の完全一致を行った場合は,マッチする項
目がないために順位に差がつかない。このため,本発明
による図10のB.に示す一致判断基準表による項目毎
に一致判断の手法を用いて一致判断を行うと,C.に示
すエントリの中の,について組織体名の前方一致が
検出され,エントリの,について所在地の「川崎
市」が検索要求の所在地と前方一致が検出される。これ
により,図10のB.に設定されたスコアの修正と項目
毎の重みに基づいてスコア計算を行うと,図11のD.
に示すように各エントリに対する点数が得られる。この
スコア計算の結果に基づいて,点数の高い順にソートし
て出力すると,図11のE.のような結果となる。な
お,スコア計算の結果で最も点数の高い1つのエントリ
だけ出力するようにしてもよい。
C. of FIG. If a search is performed for an entry such as that shown in (1) using an ordinary exact key match, no search can be performed, and the search will fail. There is no difference because there is no matching item. For this reason, according to FIG. When a match is determined using the match determination method for each item according to the match determination criterion table shown in FIG. In the entries shown in (1), the head match of the organization name is detected, and the entry "Kawasaki City" of the entry is detected to match the head of the search request. Thereby, B. of FIG. When the score calculation is performed based on the correction of the score set in, and the weight for each item, D. in FIG.
The score for each entry is obtained as shown in FIG. Based on the result of the score calculation, the data is sorted and output in descending order of the scores. The result is as follows. Note that only one entry with the highest score as a result of the score calculation may be output.

【0044】図12は本発明による第2の具体例であ
り,本発明の上記第2の原理構成(図2)に対応する。
この具体例でも,組織体(企業等)に関するデータを検
索する。
FIG. 12 shows a second specific example according to the present invention, and corresponds to the above-described second principle configuration (FIG. 2) of the present invention.
Also in this specific example, data on an organization (a company or the like) is searched.

【0045】図12のA.に検索要求の例が示され,組
織体の名称が「ABC」,所在地が「東京都港区」であ
る。この検索要求に関係するデータのエントリとしてデ
ータベース中には図12のB.に示す〜のような組
織体の名称,代表者名,所在地を持つ3つのエントリが
存在するものとする。なお,一致判断基準表には,上記
第1の具体例の場合と同じ内容(図10のB.参照)で
あり,図示省略した。この第2の具体例では,図12の
A.の検索要求に対して図12のB.に示すデータベー
スのエントリについて順位付検索が行われることによ
り,図12のB.ののエントリが「ABC」という
「名称」が完全一致するため,20点のスコアとなり,
,のエントリはいずれも「所在地」が完全一致する
ため10点のスコアとなり,図12のC.のように,
,(但し,とは同じ順位)検索結果が得られ
る。次にこの検索結果について同一性判定を行うと,上
記図10に示す同一性判定の処理により,のエントリ
は名称が一致しても所在地が異なる上に代表者も一致し
ないため同一でないと判定される。これに対し,のエ
ントリは,名称が,別表記(「日本」が付加されていて
も,アルファベットを片仮名による別表記に相当)とし
て判別され,所在地が一致するため,同一と判定され
る。またのエントリは,名称は別表記であっても所在
地が異なるため同一ではないと判定される。この結果,
図12のD.に示すような判定結果(同一は○,同一で
ないと×で表示)が得られ,図12のE.に示すような
最終的な検索結果が出力される。
FIG. Shows an example of a search request, in which the name of the organization is “ABC” and the location is “Minato-ku, Tokyo”. As an entry of data related to the search request, the data in the database shown in FIG. It is assumed that there are three entries having the name of the organization, the representative name, and the location as shown in (1). The content of the coincidence determination criterion table is the same as that in the first specific example (see B in FIG. 10), and is not shown. In the second specific example, A.P. In response to the search request of FIG. 12 is performed for the database entry shown in FIG. Since the entry of "ABC" exactly matches the "name", the score of 20 points is obtained.
, And all entries have the same 10-point score because their “locations” are completely matched. like,
, (However, the same rank as) search results are obtained. Next, when the identity determination is performed on the search result, the entry is determined to be not identical by the identity determination processing shown in FIG. You. On the other hand, the name of the entry is determined as a different notation (even if “Japan” is added, the alphabet is equivalent to another notation using katakana), and since the locations match, the entries are determined to be the same. In addition, the entries are determined to be not the same because the location is different even if the name is described differently. As a result,
D. of FIG. Are obtained (the same is indicated by 同一, and if not the same, indicated by ×). The final search result as shown in is output.

【0046】なお,図12の具体例は,本発明の第3の
原理構成(図3)において,最初の基本検索において完
全一致が得られない場合の,順位付検索と同一性判定を
行う検索の具体例となる。
In the specific example of FIG. 12, in the third principle configuration (FIG. 3) of the present invention, when a perfect match cannot be obtained in the first basic search, a search is performed in which the same search is performed as in the prioritized search. Is a specific example.

【0047】次に図13は本発明による第3の具体例で
あり,本発明の上記第4の原理構成(図4)に対応す
る。この具体例でも,組織体(企業等)に関するデータ
を検索する。
FIG. 13 shows a third specific example according to the present invention, which corresponds to the fourth principle configuration (FIG. 4) of the present invention. Also in this specific example, data on an organization (a company or the like) is searched.

【0048】図13のA.に検索要求の例が示され,組
織体の名称が「日本XY」,代表者が「中村○○」,所
在地が「東京都中央区×町1−1」である。この検索要
求に対して順位付検索を行って,データベース中で検索
された結果として得られたエントリが図13のB.に示
す内容であるものとする。この検索結果に対して検索要
求との同一性判定が行われるが,この例では同一と判定
されることがなく,その結果について不一致項目抽出の
処理が行われる。この結果,図13のC.に示す検索要
求との不一致項目が出力される。この例では,不一致項
目は「所在地」であり,データベース中の値と,検索要
求中の値がそれぞれ出力される。この不一致項目抽出に
より出力された不一致項目に対して別表記判断が行わ
れ,不一致となった項目が別表記(例えば,アルファベ
ット表記に対応する片仮名表記である場合等)に該当す
るか否かの判断が行われ,別表記に該当しないと誤りを
表す出力を発生する。
FIG. An example of a search request is shown in FIG. 1, where the name of the organization is "Japan XY", the representative is "Nakamura OO", and the location is "Chuo-ku, Tokyo x 1-1". A ranking search is performed for this search request, and an entry obtained as a result of the search in the database is indicated by B. in FIG. It is assumed that the content is as shown in FIG. The identity of the search result with the search request is determined. However, in this example, the search result is not determined to be the same, and the unmatched item extraction process is performed on the result. As a result, C.I. Are output. Items that do not match the search request are output. In this example, the unmatched item is “location”, and the value in the database and the value in the search request are output. A different notation is determined for the mismatched item output by the mismatched item extraction, and whether the mismatched item corresponds to another notation (for example, in the case of katakana notation corresponding to alphabetical notation) is determined. Judgment is made, and if it does not correspond to another notation, an output indicating an error is generated.

【0049】図14は本発明による第4の具体例であ
り,本発明の上記第5の原理構成(図5)に対応する。
また,この具体例でも組織体(企業等)に関するデータ
を検索する。
FIG. 14 shows a fourth specific example according to the present invention, which corresponds to the fifth principle configuration (FIG. 5) of the present invention.
Also in this specific example, data on an organization (eg, a company) is searched.

【0050】図14のA.に検索要求の例が示され,組
織体の名称が「ABC」,所在地が「東京都中央区」,
代表者が「田中○○」である。この検索要求に対して順
位付検索を行い,データベース中で検索された結果とし
て得られたエントリを図14のB.に示す。この検索結
果に対して検索要求との同一性判定が行われるが,この
エントリは検索要求と同一であるとは判定されず,その
結果について不一致項目抽出の処理が行われる。この場
合,所在地,代表者について完全一致するが,名称の表
記が一致しないと判定され,この不一致項目は別表記で
あるものとしてデータベース登録の処理を駆動する。こ
れによりデータベース内容の更新が行われ,図14の
C.に示すように,B.に示すデータベース中のエント
リの「名称」の項目について新たに「ABC」という表
記をこのエントリの名称の別表記として登録する。
FIG. Shows an example of a search request. The name of the organization is “ABC”, the location is “Chuo-ku, Tokyo”,
The representative is “Tanaka XX”. Performs ranking searched for the search request, B. in Figure 14 entries obtained as a result of being retrieved in the database Shown in Although the identity of the search result with the search request is determined, this entry is not determined to be the same as the search request, and the unmatched item extraction process is performed on the result. In this case, it is determined that the location and the representative completely match, but the notation of the name does not match, and the mismatched item is assumed to be another notation, and the database registration process is driven. Thus, the contents of the database are updated, and C. in FIG. As shown in FIG. A new notation "ABC" for the item of "name" of the entries in the database shown in the register as a different representation of the name of this entry.

【0051】(付記1)特定の事物に関して複数の項目
からなるデータをエントリとして多数登録したデータベ
ースに対して,複数のキー項目について値を指定した検
索要求に対応する事物データの検索を行うための検索装
置において,各項目について一致判断の基準を優先順に
並べ,各基準毎に一致度の計算方法を設定した一致判断
基準表を設け,検索要求の入力に対し各項目について前
記データベースの各エントリの対応する項目について前
記一致判断基準表に従って一致判断を行い,基準に合致
するとその項目に設定された一致度の計算方法に基づい
て各エントリに対する一致度の計算を行い,点数の高い
順にエントリのデータを出力する順位付検索部を備える
ことを特徴とする検索装置。
(Supplementary Note 1) A database for registering a large number of data of a plurality of items as entries with respect to a specific thing as an entry for searching for thing data corresponding to a search request specifying a value for a plurality of key items. The search device arranges the criteria of the match judgment for each item in the order of priority, provides a match judgment standard table in which the calculation method of the degree of match is set for each criterion, and sets the entry of the entry of the database for each item in response to the input of the search request. A match is determined for the corresponding item according to the match determination criteria table, and when the criteria are met, the match is calculated for each entry based on the calculation method of the match set for the item, and the data of the entry is sorted in descending order of the score. A search device comprising a ranking search unit for outputting a search result.

【0052】(付記2) 付記1において,前記一致判
断基準表に,一致判断の基準として完全一致,前方一
致,後方一致等の一致の手法とそれぞれのスコアの修正
値及び各項目毎の重みを設定し,一致の内容に従ってス
コアを算出することを特徴とする検索装置。
(Supplementary Note 2) In Supplementary Note 1, in the above-mentioned match determination criteria table, matching methods such as perfect match, forward match, and backward match, correction values of respective scores, and weights for each item are used as criteria for match determination. A search device characterized by setting and calculating a score according to the content of a match.

【0053】(付記3) 付記1において,前記順位付
検索部から出力された検索結果のエントリが入力される
同一性判定部を設け,前記同一性判定部は,検索結果の
エントリが検索要求と一致するか判定し,一致するもの
だけを最終的な検索結果として出力することを特徴とす
る検索装置。
(Supplementary note 3) In Supplementary note 1, there is provided an identity determination unit to which an entry of the search result output from the ranking search unit is input, and the identity determination unit determines whether the entry of the search result matches the search request. A search device characterized by determining whether or not a match is made, and outputting only the match as a final search result.

【0054】(付記4) 付記3において,前記順位付
検索部の前段に検索要求の入力に対して前記データベー
スのエントリとの完全一致を検出する基本検索部を設
け,検索要求が入力されると前記基本検索部において検
索を行って,検索が失敗した場合にだけ前記順位付検索
部を起動することを特徴とする検索装置。
(Supplementary Note 4) In Supplementary Note 3, a basic search unit for detecting a complete match with the entry of the database in response to the input of the search request is provided at the preceding stage of the ranking search unit. A search device wherein a search is performed in the basic search unit, and the ranking search unit is started only when the search fails.

【0055】(付記5) 付記3において,前記同一性
判定部から同一と判定された検索結果であるデータベー
スのエントリに対して,検索要求で指定された値と一致
しない項目を抽出する不一致項目抽出部と,前記抽出さ
れた不一致項目のデータベース値と検索要求値に対して
一方が他方の別表記になるかを判定して,別表記になる
場合にその出力を行う別表記判断部とを備えることを特
徴とする検索装置。
(Supplementary Note 5) In the supplementary note 3, a mismatched item extraction for extracting an item that does not match the value specified in the search request from the database entry that is the search result determined to be the same by the identity determination unit. And a separate notation determination unit that determines whether one of the extracted database value and the search request value of the mismatched item is another notation and outputs the other notation when the other notation is used. A search device characterized by the above-mentioned.

【0056】(付記6) 付記4において,前記同一性
判定部から同一と判定された検索結果であるデータベー
スのエントリに対して,検索要求で指定された値と一致
しない項目を抽出する不一致項目抽出部と,前記不一致
項目抽出部で抽出した不一致項目に対して検索要求の指
定値をデータベース中のエントリに対してインデックス
として追加登録するデータベース登録部とを備え,同一
検索要求による2度目以後の検索において基本検索部で
条件の完全一致による検索の可能性を高めることを特徴
とする検索装置。
(Supplementary Note 6) In the supplementary note 4, a mismatched item extraction for extracting an item that does not match the value specified in the search request from the database entry which is the search result determined to be the same by the identity determination unit. And a database registration unit for additionally registering, as an index, an entry in the database with a designated value of the search request for the mismatched item extracted by the mismatched item extraction unit, and a second or subsequent search by the same search request A search device that enhances the possibility of a search based on perfect matching of conditions in a basic search unit.

【0057】(付記7) 付記3において,前記同一性
判定部における各項目毎の同一性判定時に,検索時の指
定値とデータベース中のエントリの値の完全一致しない
項目については,指定値がデータベースの値の別表記と
なり得るかを判定し,予め定められた項目全ての不一致
部分が別表記であると判定される場合に2つのエントリ
が同一であるものとして処理することを特徴とする検索
装置。
(Supplementary Note 7) In Supplementary Note 3, when the identity determination unit determines the identity of each item, if the specified value at the time of retrieval does not completely match the value of the entry in the database, the specified value is not used in the database. another denoted becomes or is determined to obtain a search device, characterized in that two entries are treated as the same when a predetermined item all unmatched portion is determined to be another representation of the value .

【0058】(付記8) 付記3において,前記同一性
判定部における各項目毎の同一性判定時に,検索時の指
定値とデータベース中のエントリの値の完全一致しない
項目については,双方の値について構成する文字種を調
べ,一方の文字種が他方の文字種が表記の揺れにおいて
許容されるペアである場合に同一と判定することを特徴
とする検索装置。
(Supplementary Note 8) In Supplementary Note 3, when the identity determination unit determines the identity of each item, if the specified value at the time of retrieval does not completely match the value of the entry in the database, the values of both values are A retrieval apparatus characterized by examining constituent character types and determining that one of the character types is the same when the other character type is a pair permitted in the fluctuation of the notation.

【0059】(付記9) 付記3において,前記同一性
判定部が検索結果に検索要求の集合中の要素が一つある
と,検索結果が検索要求で指定したエントリと同一であ
ると判定することを特徴とする検索装置。
(Supplementary note 9) In Supplementary note 3, if the search result includes one element in the set of search requests, the identity determination unit determines that the search result is the same as the entry specified in the search request. A retrieval device characterized by the above-mentioned.

【0060】[0060]

【発明の効果】本発明によれば,事物データのデータベ
ースを検索する際に,データベースの内容に大きな変更
を加えることなく,誤り,経時変化,表記の揺れ等の外
乱によって起こる検索要求とデータベース中のエントリ
の間の項目毎の値の不一致に対処して,正確な検索結果
を得ることができる。また,その際にデータベースに対
して大規模な登録作業を予め行なう必要がない。
According to the present invention, a search request and a search request caused by a disturbance such as an error, a change over time, or a spelling of a notation can be made without greatly changing the contents of the database when searching the database of the object data. By coping with the inconsistency of the value of each item between the entries of the above, an accurate search result can be obtained. At this time, there is no need to perform a large-scale registration work on the database in advance.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の原理構成を示す図である。FIG. 1 is a diagram showing a first principle configuration of the present invention.

【図2】本発明の第2の原理構成を示す図である。FIG. 2 is a diagram showing a second principle configuration of the present invention.

【図3】本発明の第3の原理構成を示す図である。FIG. 3 is a diagram showing a third principle configuration of the present invention.

【図4】本発明の第4の原理構成を示す図である。FIG. 4 is a diagram showing a fourth principle configuration of the present invention.

【図5】本発明の第5の原理構成を示す図である。FIG. 5 is a diagram showing a fifth principle configuration of the present invention.

【図6】本発明が実施される構成例を示す図である。FIG. 6 is a diagram showing a configuration example in which the present invention is implemented.

【図7】順位付検索の処理フローを示す図である。FIG. 7 is a diagram showing a processing flow of ranking search.

【図8】一致判断とスコア計算の処理フローを示す図で
ある。
FIG. 8 is a diagram showing a processing flow of matching judgment and score calculation.

【図9】同一性判定の処理フローを示す図である。FIG. 9 is a diagram showing a processing flow of identity determination.

【図10】本発明による第1の具体例(その1)を示す
図である。
The first embodiment according to the invention; FIG is a diagram showing a (first).

【図11】本発明による第1の具体例(その2)を示す
図である。
FIG. 11 is a diagram showing a first specific example (part 2) according to the present invention.

【図12】本発明による第2の具体例を示す図である。FIG. 12 is a diagram showing a second specific example according to the present invention.

【図13】本発明による第3の具体例を示す図である。FIG. 13 is a diagram showing a third specific example according to the present invention.

【図14】本発明による第4の具体例を示す図である。FIG. 14 is a diagram showing a fourth specific example according to the present invention.

【図15】従来の同名企業の検索の例を示す図である。FIG. 15 is a diagram illustrating an example of a conventional search for a company with the same name.

【図16】従来の対処方法の例を示す図である。FIG. 16 is a diagram showing an example of a conventional coping method.

【符号の説明】[Explanation of symbols]

1 検索要求 2 データベース 3 順位付検索部 4 一致判断基準表 1 search request 2 database 3 ranking search section 4 match criteria table

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 特定の事物に関して複数の項目からなる
データをエントリとして多数登録したデータベースに対
して,複数のキー項目について値を指定した検索要求に
対応する事物データの検索を行うための検索装置におい
て,各項目について一致判断の基準を優先順に並べ,各
基準毎に一致度の計算方法を設定した一致判断基準表を
設け,検索要求の入力に対し各項目について前記データ
ベースの各エントリの対応する項目について前記一致判
断基準表に従って一致判断を行い,基準に合致するとそ
の項目に設定された一致度の計算方法に基づいて各エン
トリに対する一致度の計算を行い,点数の高い順にエン
トリのデータを出力する順位付検索部を備えることを特
徴とする検索装置。
1. A search apparatus for searching a database in which a large number of data of a plurality of items relating to a specific thing are registered as entries, corresponding to a search request specifying a value for a plurality of key items. , The criteria of the match judgment are arranged in order of priority for each item, and a match judgment criteria table is set in which the calculation method of the degree of coincidence is set for each criterion. A match is determined for an item in accordance with the match determination criteria table, and when the criteria are met, a match score is calculated for each entry based on the match score calculation method set for the item, and the entry data is output in descending order of the score. A search device comprising a ranking search unit for performing the search.
【請求項2】 請求項1において,前記順位付検索部か
ら出力された検索結果のエントリが入力される同一性判
定部を設け,前記同一性判定部は,検索結果のエントリ
が検索要求と一致するものか判定し,一致するものだけ
を最終的な検索結果として出力することを特徴とする検
索装置。
2. An apparatus according to claim 1, further comprising an identity determination unit to which an entry of the search result output from the ranking search unit is input, wherein the identity determination unit determines that the search result entry matches the search request. A search device for determining whether a search is performed and outputting only a match as a final search result.
【請求項3】 請求項2において,前記順位付検索部の
前段に検索要求の入力に対して前記データベースのエン
トリとの完全一致を検出する基本検索部を設け,検索要
求が入力されると前記基本検索部において検索を行っ
て,検索が失敗した場合にだけ前記順位付検索部を起動
することを特徴とする検索装置。
3. The system according to claim 2, further comprising: a basic search unit that detects a complete match of the search request input with an entry in the database in a stage preceding the ranking search unit. A search device wherein a search is performed in a basic search unit, and the ranking search unit is activated only when the search fails.
【請求項4】 請求項2において,前記同一性判定部か
ら同一と判定された検索結果であるデータベースのエン
トリに対して,検索要求で指定された値と一致しない項
目を抽出する不一致項目抽出部と,前記抽出された不一
致項目のデータベース値と検索要求値に対して一方が他
方の別表記になるかを判定して,別表記になる場合にそ
の出力を行う別表記判断部とを備えることを特徴とする
検索装置。
4. A non-matching item extracting unit according to claim 2, wherein an item that does not match a value specified in a search request is extracted from a database entry that is a search result determined to be the same by the identity determining unit. And a separate notation determining unit that determines whether one of the extracted database values and the search request value of the mismatched item is different from the other, and outputs the different notation when the different value is used. A retrieval device characterized by the above-mentioned.
【請求項5】 請求項3において,前記同一性判定部か
ら同一と判定された検索結果であるデータベースのエン
トリに対して,検索要求で指定された値と一致しない項
目を抽出する不一致項目抽出部と,前記不一致項目抽出
部で抽出した不一致項目に対して検索要求の指定値をデ
ータベース中のエントリに対してインデックスとして追
加登録するデータベース登録部とを備え,同一検索要求
による2度目以後の検索において基本検索部で条件の完
全一致による検索の可能性を高めることを特徴とする検
索装置。
5. A non-matching item extracting unit according to claim 3, wherein an item that does not match a value specified in a search request is extracted from a database entry that is a search result determined to be the same by the identity determining unit. And a database registration unit for additionally registering, as an index, an entry in the database with a designated value of the search request for the mismatched item extracted by the mismatched item extraction unit, and in the second and subsequent searches by the same search request. A search device characterized in that a basic search unit increases the possibility of a search based on perfect matching of conditions.
JP2000394254A 2000-12-26 2000-12-26 Retrieval device Pending JP2002197116A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000394254A JP2002197116A (en) 2000-12-26 2000-12-26 Retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000394254A JP2002197116A (en) 2000-12-26 2000-12-26 Retrieval device

Publications (1)

Publication Number Publication Date
JP2002197116A true JP2002197116A (en) 2002-07-12

Family

ID=18859908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000394254A Pending JP2002197116A (en) 2000-12-26 2000-12-26 Retrieval device

Country Status (1)

Country Link
JP (1) JP2002197116A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309453A (en) * 2005-04-27 2006-11-09 Toyota Motor Corp Retrieval method of data record and program therefor
WO2016147403A1 (en) * 2015-03-19 2016-09-22 三菱電機株式会社 Information processing device, information processing method, and information processing program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309453A (en) * 2005-04-27 2006-11-09 Toyota Motor Corp Retrieval method of data record and program therefor
JP4507972B2 (en) * 2005-04-27 2010-07-21 トヨタ自動車株式会社 Data record search method and program
WO2016147403A1 (en) * 2015-03-19 2016-09-22 三菱電機株式会社 Information processing device, information processing method, and information processing program

Similar Documents

Publication Publication Date Title
JP2832988B2 (en) Data retrieval system
US5404507A (en) Apparatus and method for finding records in a database by formulating a query using equivalent terms which correspond to terms in the input query
JP5002751B2 (en) Two-step data validation and mapping for database access
US6026398A (en) System and methods for searching and matching databases
US7392244B1 (en) Methods and apparatus for determining equivalent descriptions for an information need
JP3041268B2 (en) Chinese Error Checking (CEC) System
US20070136243A1 (en) System and method for data indexing and retrieval
JPH06215029A (en) Retrieval method of text
US9317608B2 (en) Systems and methods for parsing search queries
US20160203131A1 (en) Supplementing Search Results with Information of Interest
JPH06309362A (en) Information retrieving method
US6691103B1 (en) Method for searching a database, search engine system for searching a database, and method of providing a key table for use by a search engine for a database
US20120109994A1 (en) Robust auto-correction for data retrieval
JP4687089B2 (en) Duplicate record detection system and duplicate record detection program
US10565188B2 (en) System and method for performing a pattern matching search
US10216792B2 (en) Automated join detection
CN112748811A (en) English word input method and device
JPH0773197A (en) Supporting system for preparing different notation word dictionary
US11281736B1 (en) Search query mapping disambiguation based on user behavior
JPH10162008A (en) Method and device for information retrieval
JP2002197116A (en) Retrieval device
JP3007375B2 (en) Document information retrieval device
JP2002032394A (en) Device and method for preparing related term information, device and method for presenting related term, device and method for retrieving document and storage medium
EP1076305A1 (en) A phonetic method of retrieving and presenting electronic information from large information sources, an apparatus for performing the method, a computer-readable medium, and a computer program element
JP6361472B2 (en) Correspondence information generation program, correspondence information generation apparatus, and correspondence information generation method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061114

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070227

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070427

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070605