JP2002092033A - Information retrieving device - Google Patents

Information retrieving device

Info

Publication number
JP2002092033A
JP2002092033A JP2000276376A JP2000276376A JP2002092033A JP 2002092033 A JP2002092033 A JP 2002092033A JP 2000276376 A JP2000276376 A JP 2000276376A JP 2000276376 A JP2000276376 A JP 2000276376A JP 2002092033 A JP2002092033 A JP 2002092033A
Authority
JP
Japan
Prior art keywords
search
keyword
unit
information
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000276376A
Other languages
Japanese (ja)
Inventor
Akihiro Yamada
晃弘 山田
Taku Kokubo
卓 小久保
Masayuki Okamoto
昌之 岡本
Yasuhiko Kitamura
泰彦 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2000276376A priority Critical patent/JP2002092033A/en
Publication of JP2002092033A publication Critical patent/JP2002092033A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To overcome the problem such that it is difficult for an Internet user to retrieve information since it is impossible to ask the user for retrieval know-how equivalent to that of a data base search engineer. SOLUTION: An information retrieving device 10 is provided with a condition relaxing part 16 and a condition applying part 18. The condition relaxing part 16 erases any keyword imposing a condition which is more strict than necessary from among initial keywords inputted by a user, and the condition applying part 18 converts the subjective keyword of the user into an objective expression suitable for retrieval.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】この発明は、情報検索技術に関する。この
発明はとくに、情報を検索する際、キーワードを用いる
情報検索装置に関する。
[0001] The present invention relates to an information retrieval technique. The present invention particularly relates to an information search device that uses a keyword when searching for information.

【0002】[0002]

【従来の技術】インターネットと、そのひとつのアプリ
ケーションに過ぎないWWW(WorldWide Web)がとき
おり混同されるほど、WWWによる情報の発信と検索は
インターネットの主要な利用形態になっている。ウェブ
サイトの爆発的な増加に伴い、発信される情報の量も激
増し、その中から本当に必要な情報をいかに短時間で発
見するかが、WWW利用上のポイントである。
2. Description of the Related Art As the Internet and the WWW (World Wide Web), which is only one application, are sometimes confused, the transmission and retrieval of information by the WWW has become a main use form of the Internet. With the explosion of websites, the amount of transmitted information has also increased dramatically, and the key to using the WWW is how to find the necessary information in a short period of time.

【0003】最近では、主に検索系ポータルサイトが
「巡回ロボット」とよばれる仕組みを利用して多数のW
ebサイトのページからキーワードを自動抽出し、We
bサイトまたはそのページに対する検索の準備を効率化
する技術が知られている。従来、検索の対象として扱わ
れたいサイトの運用者は、自らキーワードを登録するこ
とが一般的であったが、運用者の中には、キーワードの
登録が必要なことを知らない者もあり、たとえ知ってい
ても登録作業が面倒に思われる場合があった。「巡回ロ
ボット」によれば、登録の煩瑣から運用者を解放するこ
とができる。
[0003] Recently, search-related portal sites mainly use a system called a “touring robot” to create a large number of W sites.
Automatically extract keywords from web site pages,
Techniques for improving the efficiency of the preparation for searching for the b site or its page are known. In the past, it was common for site operators who want to be treated as search targets to register keywords themselves, but some operators do not know that keyword registration is necessary, Even if I knew, the registration process seemed to be troublesome. According to the “touring robot”, the operator can be released from the complicated registration.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、巡回ロ
ボットによるキーワード登録では、ページの主題から外
れるようなキーワードが選ばれたり、不要なキーワード
が多数選ばれるなど、自動化に伴う精度の低さが指摘さ
れている。例えば、あるキーワードを入れて検索する
と、回答として数十万件、数百万件というヒットが報告
されるなど、いわゆるノイズが多すぎて検索の用をなさ
ない場合があった。その意味では、運用者によるキーワ
ードの登録は当を得たものになりやすいが、人手で限ら
れたキーワードを登録する性格上、検索に対するヒット
数が少なすぎたり、本来発見されるべきサイトが検索か
ら漏れるなどの問題があった。
However, in the keyword registration by the traveling robot, it is pointed out that the accuracy associated with the automation is low, such as selection of keywords that deviate from the subject of the page and selection of many unnecessary keywords. ing. For example, when a search is performed by entering a certain keyword, hundreds of thousands or millions of hits are reported as answers. In some cases, there is too much noise to use the search. In that sense, keyword registration by operators is likely to be reasonable, but due to the nature of registering limited keywords manually, the number of hits for search is too small or sites that should be discovered There was a problem such as leaking from.

【0005】本発明は、そうした課題に鑑みてなされた
ものであり、その目的は、ユーザが望む情報をより容易
に検索することの可能な情報検索技術の提供にある。
[0005] The present invention has been made in view of such a problem, and an object of the present invention is to provide an information search technique capable of more easily searching for information desired by a user.

【0006】本発明の別の目的は、例えば検索ロボット
によって機械的に登録された非常に多数の情報の中か
ら、ユーザが望む情報を効果的に見いだすことの可能な
情報検索技術の提供にある。
Another object of the present invention is to provide an information retrieval technique capable of effectively finding information desired by a user from a very large number of information mechanically registered by, for example, a retrieval robot. .

【0007】本発明のさらに別の目的は、検索の実務に
慣れていない多数の一般ユーザでも、自分が主観的に表
現した検索条件で比較的容易に所望の情報を見いだすこ
との可能な情報検索技術の提供にある。
[0007] Still another object of the present invention is to provide an information retrieval system which enables even a large number of general users who are not accustomed to the practice of retrieval to find desired information relatively easily under the retrieval conditions expressed by themselves. In providing technology.

【0008】[0008]

【課題を解決するための手段】本発明のある態様は情報
検索装置(以下単に「装置」または「本装置」ともい
う)に関する。この装置は、情報を検索する際にユーザ
が設定した表現を受け付ける入力部と、前記表現に含ま
れるキーワード(以下このキーワードを「初期キーワー
ド」ともいう)を抽出するキーワード抽出部と、前記初
期キーワードを前記情報の表現の実態に即して客観化
し、新たなキーワード(以下この新たなキーワードを
「客観キーワード」ともいう)を付与する条件付加部
と、前記初期キーワードおよび前記客観キーワードをも
とに検索のための条件式を設定する検索式設定部と、前
記設定された条件式を用いて前記情報を検索する検索部
とを含む。
One embodiment of the present invention relates to an information retrieval apparatus (hereinafter, also simply referred to as "apparatus" or "present apparatus"). The apparatus includes: an input unit that receives an expression set by a user when searching for information; a keyword extraction unit that extracts a keyword included in the expression (hereinafter, this keyword is also referred to as an “initial keyword”); Into a condition according to the actual state of the expression of the information, and a condition adding unit for giving a new keyword (hereinafter, this new keyword is also referred to as an “objective keyword”), based on the initial keyword and the objective keyword. A search formula setting unit for setting a conditional formula for a search, and a search unit for searching for the information using the set conditional formula are included.

【0009】「ユーザが設定した表現」は、単語単位の
ほか文章であってもよい。「前記情報の表現の実態に即
して客観化し」とは、その情報が検索可能な状態で格納
されているときに、どのような形式で、またはどのよう
な要素で、またはどのような要素がどのような形式、頻
度または組合せで表現されているかなどに応じて、とい
う意味であり、前記の「ユーザが設定した表現」がいわ
ば主観表現であることと対比される。客観化の方法とし
て、情報がどのように表現されているかを現実に調査し
てその経験則をデータベース化することがある。
The "expression set by the user" may be a sentence other than a word unit. "Objective according to the actual state of the expression of the information" means that when the information is stored in a searchable state, in what form, in what element, or in what element Is expressed according to what form, frequency or combination is used, and this is compared with the above-mentioned “expression set by the user” being a subjective expression. As a method of objectification, there is a method of actually investigating how information is expressed and making a database of empirical rules.

【0010】この構成によれば、まずユーザが自分の思
うとおりに検索のための表現を入力する。つづいて、そ
の表現から初期キーワードが抽出され、これをもとに客
観キーワードが付与される。つぎに、前記初期キーワー
ドおよび前記客観キーワードをもとに検索のための条件
式が設定され、この条件式を用いて前記情報が検索され
る。
According to this configuration, the user first inputs a search expression as he or she desires. Subsequently, an initial keyword is extracted from the expression, and an objective keyword is assigned based on the initial keyword. Next, a conditional expression for a search is set based on the initial keyword and the objective keyword, and the information is searched using the conditional expression.

【0011】この装置はさらに、前記初期キーワードか
ら不必要に厳しい検索条件を課するものを削除する条件
緩和部を含んでもよい。その場合、前記検索式設定部
は、前記抽出されたキーワードのうち前記条件緩和部に
よって削除されたキーワードを除いて前記条件式を設定
してもよい。この構成によれば、ユーザがさしたる意図
もなく設定したキーワードによって情報のヒット数が極
端に低くなって所望の情報が見つからないという事態が
回避しやすくなる。
[0011] The apparatus may further include a condition relaxing unit that deletes those that impose unnecessarily severe search conditions from the initial keywords. In this case, the search formula setting unit may set the conditional formula excluding the keywords deleted by the condition relaxing unit among the extracted keywords. According to this configuration, it is easy to avoid a situation where the number of hits of information becomes extremely low due to the keyword set without the user's intention and the desired information cannot be found.

【0012】前記条件付加部は、前記条件緩和部にて削
除されたキーワードを代替するよう前記新たなキーワー
ドを付与してもよい。ヒット数を極端に減らすようなキ
ーワードは、前述のごとく選択肢を極端に狭める危険性
と裏腹に、ユーザの意図を相当にうまく、ただし検索と
いう意味では不適切に表現している場合がある。したが
って、そうしたキーワードからユーザの意図をくみ取る
べく、そのキーワードを客観化し、情報検索の適正化を
図る。
[0012] The condition adding unit may add the new keyword so as to replace the keyword deleted by the condition relaxing unit. A keyword that significantly reduces the number of hits may express the user's intention considerably well, but inappropriately in terms of search, in spite of the risk of extremely narrowing the options as described above. Therefore, in order to extract the user's intention from such a keyword, the keyword is made objective and information retrieval is optimized.

【0013】この装置はさらに、前記検索の結果得られ
た情報を取得する検索情報取得部と、前記取得された情
報のフィードバックを受け、将来の検索の際に参照すべ
き検索条件を格納する参照テーブルとを含んでもよい。
例えば、条件緩和部による削除を逃れたキーワードが実
際には極端にヒット数を減らしたことが判明すれば、そ
のキーワードを記録しておき、以降は必ず削除する運用
が考えられる。また、条件付加部で付加した客観キーワ
ードのうちのあるものがユーザの満足に叶わない場合は
それを以降客観キーワードとして利用しない他、別の客
観キーワードがユーザの高い満足を得た場合その優先度
を上げて付与する場合が考えられる。
[0013] The apparatus further includes a search information acquisition unit for acquiring information obtained as a result of the search, and a reference for receiving feedback of the acquired information and storing search conditions to be referred to in a future search. And a table.
For example, if it is found that a keyword that escaped the deletion by the condition relaxing unit actually reduced the hit count extremely, it is conceivable to record the keyword and then always delete it. If some of the objective keywords added by the condition adding section do not satisfy the user's satisfaction, they are not used as objective keywords thereafter, and if another objective keyword obtains high user's satisfaction, the priority is given. May be increased.

【0014】本発明の別の態様も情報検索装置に関す
る。この装置は、ネットワークと通信する通信部と、前
記ネットワークを介してページ情報を検索する際、ユー
ザが設定した主観的な検索要求文を受け付ける入力部
と、前記検索要求文を形態素に分解してキーワード(以
下、このキーワードも初期キーワードとよぶ)を抽出す
るキーワード抽出部と、前記初期キーワードから、それ
を検索条件に加えた場合、検索でヒットするページの数
が大幅に減少するようなキーワードを削除する条件緩和
部と、前記ページ情報が含む確率が高い用語を新たなキ
ーワード(以下、このキーワードも客観キーワードとよ
ぶ)として特定する条件付加部と、前記初期キーワード
のうち前記条件緩和部によって削除されたキーワードを
除いたもの、および前記客観キーワードの論理積を検索
の条件式として設定する検索式設定部と、前記設定され
た条件式を用い、前記ページ情報を前記通信部を介して
検索する検索部と、前記検索の結果得られたページ情報
を前記通信部を介して取得する検索情報取得部と、前記
取得されたページ情報のフィードバックを受け、将来の
検索の際に参照すべき検索条件を格納する参照テーブル
とを含む。「ページ」とは、ひとかたまりの情報の単位
全般を指し、一例としてWWWで提供されるホームペー
ジその他のページがある。「ユーザが設定した検索要求
文」は、「おいしいパスタが食べたい」などのように、
ユーザが検索したい情報を間接または直接示唆する文章
をいう。
Another embodiment of the present invention also relates to an information search device. The apparatus includes a communication unit that communicates with a network, an input unit that receives a subjective search request sentence set by a user when searching for page information via the network, and decomposes the search request sentence into morphemes. A keyword extraction unit for extracting a keyword (hereinafter, also referred to as an initial keyword), and a keyword from the initial keyword that, when added to a search condition, significantly reduces the number of pages hit in a search. A condition relaxing unit to be deleted, a condition adding unit that identifies a term having a high probability of being included in the page information as a new keyword (hereinafter, also referred to as an objective keyword), and a condition relaxing unit among the initial keywords deleted by the condition relaxing unit And the logical product of the objective keywords and the objective keywords are set as conditional expressions for search. A search expression setting unit, a search unit that searches the page information via the communication unit using the set conditional expression, and a search that obtains the page information obtained as a result of the search via the communication unit An information acquisition unit includes a reference table that receives feedback of the acquired page information and stores a search condition to be referred to in a future search. The “page” refers to a whole unit of information and includes, for example, a homepage and other pages provided on the WWW. The "search request sentence set by the user" is, for example, "I want to eat delicious pasta."
A sentence that indirectly or directly suggests information that the user wants to search.

【0015】この構成では、まず検索要求文が入力され
る。つづいて初期キーワードが抽出される。ただし、初
期キーワードから一部のキーワードが除外される。それ
らは、検索でヒットするページ数が大幅に減少するよう
なキーワードである。除外されたキーワード以外の初期
キーワードを以下「選別された初期キーワード」ともい
う。
In this configuration, first, a search request sentence is input. Subsequently, initial keywords are extracted. However, some keywords are excluded from the initial keywords. These are keywords that significantly reduce the number of pages that are hit in a search. The initial keywords other than the excluded keywords are hereinafter also referred to as “selected initial keywords”.

【0016】つづいて、所望のページ情報が含んでいる
確率が高い用語が客観キーワードとして特定され、選別
された初期キーワードと客観キーワードの論理積を検索
の条件式とする検索が実施される。検索で得られたペー
ジ情報が取得される一方、そのページ情報がフィードバ
ックされ、参照テーブルに格納される。参照テーブル
は、将来の検索の際に参照される。
Subsequently, a term having a high probability of containing the desired page information is specified as an objective keyword, and a search is performed using the logical product of the selected initial keyword and the objective keyword as a conditional expression for the search. While the page information obtained by the search is obtained, the page information is fed back and stored in the reference table. The reference table is referred to in a future search.

【0017】[0017]

【発明の実施の形態】図1は、実施の形態に係る情報検
索装置10の構成を示す。この構成は、ハードウエアコ
ンポーネントでいえば、任意のコンピュータのCPU、
メモリ、その他の素子、およびソフトウエアとしてメモ
リのロードされた情報検索機能のあるプログラムなどに
よって実現されるが、ここではそれらの連携によって実
現される機能ブロックを描いている。したがって、これ
らの機能ブロックがハードウエアのみ、ソフトウエアの
み、またはそれらの組合せによっていろいろな形で実現
できることは、当業者には理解されるところである。と
くに、情報検索装置10のうちソフトウエアによる部分
は、例えばWebブラウザの機能を主体に、この実施の
形態に特徴的な客観キーワード付与型情報検索機能を組
み入れることで実現する。以下、ここではそうした態様
を前提とし、情報の検索をWWW上で行うものとする。
FIG. 1 shows the configuration of an information retrieval apparatus 10 according to an embodiment. This configuration is, in terms of hardware components, the CPU of any computer,
The functions are realized by a memory, other elements, a program having an information search function loaded into the memory as software, and the like. Here, functional blocks realized by their cooperation are illustrated. Therefore, it will be understood by those skilled in the art that these functional blocks can be realized in various forms by hardware only, software only, or a combination thereof. In particular, the software portion of the information retrieval apparatus 10 is realized by incorporating, for example, a Web browser function as a main feature and an objective keyword assignment type information retrieval function characteristic of this embodiment. Hereinafter, it is assumed that such a mode is assumed, and information retrieval is performed on the WWW.

【0018】入力部12は、キーボード、マウスその他
の外部機器を介してユーザから入力されたデータ、ここ
では検索要求文を取得する。検索要求文はキーワード抽
出部14へ送られ、形態素へ分解され、主に名詞が初期
キーワードとして抽出される。
The input unit 12 obtains data input by a user via a keyboard, a mouse or other external devices, in this case, a search request sentence. The search request sentence is sent to the keyword extracting unit 14 and is decomposed into morphemes, and mainly nouns are extracted as initial keywords.

【0019】初期キーワードは条件緩和部16へ送られ
る。条件緩和部16は、参照テーブル28を検索するこ
とにより、削除すべきキーワードを決定する。後述のご
とく参照テーブル28には、過去の検索における経験則
をもとに、検索の際、極端にヒット数を減らすようなキ
ーワードが削除すべきものとして記録されている。以
下、削除されたキーワードを「無効キーワード」ともい
う。条件緩和部16は、そうしたキーワードを削除して
残った、選定された初期キーワードを条件付加部18お
よび検索式設定部20へ送付する。条件付加部18には
さらに、無効キーワードが通知される。
The initial keyword is sent to the condition relaxing unit 16. The condition relaxing unit 16 determines a keyword to be deleted by searching the reference table 28. As will be described later, in the reference table 28, a keyword that extremely reduces the number of hits at the time of a search is recorded based on an empirical rule in a past search as to be deleted. Hereinafter, the deleted keyword is also referred to as “invalid keyword”. The condition relaxing unit 16 sends the selected initial keywords remaining after deleting such keywords to the condition adding unit 18 and the search formula setting unit 20. The condition adding unit 18 is further notified of the invalid keyword.

【0020】条件付加部18は、選定された初期キーワ
ードおよび無効キーワード、または例えば後者のみをも
とに、参照テーブル28を参照して客観キーワードを特
定し、これを検索式設定部20へ通知する。
The condition adding unit 18 specifies an objective keyword by referring to the reference table 28 based on only the selected initial keyword and invalid keyword or, for example, only the latter, and notifies the search formula setting unit 20 of this. .

【0021】検索式設定部20は、選定された初期キー
ワードと客観キーワードの論理積、つまりアンドをと
り、こうして得られる検索式を検索部22へ送付する。
検索部22は自身が検索エンジンであってもよいが、ポ
ータルサイトなどが有する検索エンジンに指示を出す制
御機能を有してもよいし、そうした複数の検索エンジン
を同時に検索するメタ検索エンジンに対応してもよい。
その場合、ユーザの手間が省かれるとともに、検索の偏
りが吸収できる。いずれにしても、通信部24を介し、
先の検索式を用いてWebサイトやそのページへの検索
が実行され、ヒットした情報が通信部24を介して検索
結果取得部26で取得され、これが表示装置30へ一覧
表示される。
The search formula setting unit 20 calculates a logical product of the selected initial keyword and the objective keyword, that is, an AND, and sends the obtained search formula to the search unit 22.
The search unit 22 itself may be a search engine, but may have a control function of issuing an instruction to a search engine of a portal site or the like, or may support a meta search engine that searches such a plurality of search engines simultaneously. May be.
In this case, the user's labor can be saved, and the search bias can be absorbed. In any case, via the communication unit 24,
A search for the Web site or its page is executed using the above search formula, and the hit information is obtained by the search result obtaining unit 26 via the communication unit 24, and this is displayed in a list on the display device 30.

【0022】検索結果取得部26でヒット件数が所定の
しきい値を越えた場合、その旨が条件付加部18へ通知
され、検索式に新たな客観キーワードが追加されてもよ
い。逆に、ヒット件数が所定のしきい値を下回った場
合、その旨が条件緩和部16へ通知され、無効キーワー
ドを増やしてもよい。
When the number of hits exceeds a predetermined threshold value in the search result obtaining unit 26, the condition is notified to the condition adding unit 18 and a new objective keyword may be added to the search formula. Conversely, if the number of hits falls below a predetermined threshold, the condition may be notified to the condition relaxing unit 16 and the number of invalid keywords may be increased.

【0023】図2は参照テーブル28の内部データの一
例を示す。参照テーブル28は、キーワード欄40、削
除欄42、および客観キーワード欄44が設けられてい
る。キーワード欄40には、初期キーワードが記録さ
れ、削除欄42はそれらのうち無効キーワードに「1」
のフラグが立っている。このフラグが「0」の場合、そ
れは選定されたキーワードとして検索式の中に残され
る。客観キーワード欄44は、各初期キーワードに対応
して過去の検索から経験則的に、またはオペレータが自
主的に設定した客観キーワードが優先順に記述されてい
る。
FIG. 2 shows an example of the internal data of the lookup table 28. The reference table 28 is provided with a keyword column 40, a deletion column 42, and an objective keyword column 44. The keyword column 40 records the initial keywords, and the deletion column 42 shows "1" as an invalid keyword among them.
Flag standing. If this flag is "0", it is left in the search formula as the selected keyword. In the objective keyword column 44, objective keywords set empirically from past searches or voluntarily set by the operator in accordance with each initial keyword are described in order of priority.

【0024】以上の構成による一連の検索処理は以下の
通りである。まずユーザが検索したい情報について検索
要求文を入力する。ここでユーザは、「牛肉を使った料
理のレシピが知りたい」と入力したとする。この検索に
ついて解析するために、汎用の検索サイトを用いた例を
紹介すれば、「牛肉」というキーワードで検索したとき
のヒット数は数万を越える。これはそのサイトが検索ロ
ボットを利用して非常に多数のキーワードを登録してい
るためであり、中には料理としての牛肉とほとんど無関
係のページが相当数を占めている。すなわち、ノイズが
多い状況にある。
A series of search processing according to the above configuration is as follows. First, a user inputs a search request sentence for information to be searched. Here, it is assumed that the user has input “I want to know a recipe for cooking using beef”. If we introduce an example using a general-purpose search site to analyze this search, the number of hits when searching with the keyword "beef" exceeds tens of thousands. This is because the site uses a search robot to register a very large number of keywords, and some of the pages have almost no relation to beef as a dish. That is, there is a lot of noise.

【0025】一方、「レシピ」をアンド条件として検索
をすると、さきほどの数十万に比べ、ヒット数が大きく
下がる。この状態では、ユーザの求めるレシピに関する
情報も相当数捨てられている。その理由は、レシピを記
述したページには、実は「レシピ」という単語が含まれ
ない場合も多いことによる。レシピは多くの場合、「作
り方」「材料」その他の表現で置き換わっているためで
ある。
On the other hand, when the search is performed using the “recipe” as an AND condition, the number of hits is greatly reduced as compared with the above hundreds of thousands. In this state, a considerable amount of information on the recipe desired by the user is also discarded. The reason is that the page describing the recipe often does not actually include the word “recipe”. This is because recipes are often replaced by expressions such as "how to make", "material", and the like.

【0026】そうした表現のうち、本発明者が実験をし
た結果効率的だったキーワードは、「塩」「こしょう」
である。すなわち、「牛肉」のほかに「塩」、またはさ
らに「こしょう」(漢字表記「胡椒」は説明上無視す
る)をアンド条件として検索すると、ヒットするページ
はほぼ完全にレシピが記載されたページとなる。
Among such expressions, the keywords that were effective as a result of the experiment performed by the inventor were "salt", "pepper"
It is. In other words, if you search for "beef", "salt", or even "kosho" (Kanji notation "pepper" is ignored for the sake of explanation) as an AND condition, the hit page will be almost completely the page where the recipe is described Become.

【0027】以上の状況をふまえ、参照テーブル28に
おいて初期キーワード「レシピ」は、削除すべきキーワ
ードとしてフラグが「1」にセットされ、それを代替す
る効果的な客観キーワードとして「塩」「こしょう」が
この順に記述されている。したがって、前述の「牛肉を
使ったレシピが知りたい」の要求については、これらの
客観キーワードが追加される。
In view of the above situation, in the reference table 28, the flag “1” is set as the keyword to be deleted in the initial keyword “recipe”, and “salt” and “pepper” as effective objective keywords in place of the flag are set. Are described in this order. Therefore, these objective keywords are added to the above-mentioned request of “I want to know a recipe using beef”.

【0028】図1の構成に即して説明する。キーワード
抽出部14は、検索要求文から形態素解析によって名詞
「牛肉」「レシピ」を抽出する。条件緩和部16はこれ
らのうち「レシピ」を無効キーワードとする。この情報
は条件付加部18へ伝えられ、ここで客観キーワードと
して「塩」と「こしょう」が追加され、これが検索式設
定部20へ伝えられる。
A description will be given with reference to the configuration of FIG. The keyword extracting unit 14 extracts the nouns “beef” and “recipe” from the search request sentence by morphological analysis. The condition relaxing unit 16 sets “recipe” among these as an invalid keyword. This information is transmitted to the condition adding unit 18, where “salt” and “pepper” are added as objective keywords, and this is transmitted to the search formula setting unit 20.

【0029】検索式設定部20は、検索式として以下の
設定をする。 牛肉 and (塩 and こしょう) この検索式は検索部22へ伝えられ、所望の検索が実施
される。その結果、ユーザが面倒な設定をすることな
く、また検索の実態を知らないユーザであっても容易に
望みのサイトやページの一覧を得ることができる。近年
のインターネット人口の急激な伸びにより、検索の経験
が薄いユーザが激増している状況にあって、この実施の
形態によるユーザサポートは非常に有益なツールとな
る。
The search formula setting unit 20 sets the following as a search formula. Beef and (salt and pepper) This search formula is transmitted to the search unit 22, and a desired search is performed. As a result, a list of desired sites and pages can be easily obtained without troublesome setting by the user and even by a user who does not know the actual condition of the search. With the rapid growth of the Internet population in recent years, the number of users with little search experience is rapidly increasing, and the user support according to this embodiment is a very useful tool.

【0030】図2にはさらに、例えばユーザが「和食」
のレシピその他について情報を得たい場合の客観キーワ
ードとして、「しょうゆ」「みりん」などが記録されて
いる。これらの客観キーワードによって和食のレシピを
相当程度網羅できることがわかっている。
FIG. 2 further shows that, for example, the user
"Soy sauce" and "Mirin" are recorded as objective keywords for obtaining information on recipes and the like. It has been found that these objective keywords can considerably cover Japanese food recipes.

【0031】検索結果取得部26の望ましい追加機能と
して、参照テーブル28の構築がある。そのために、検
索結果取得部26に、ニューラルネットワークその他に
よる人工知能の機能などを組み込み、検索が実行される
たびに、そのとき無効キーワードや客観キーワードの妥
当性を判定し、参照テーブル28の内容を最適化してい
ってもよい。例えば、「牛肉」と「塩」によってレシピ
に関連するページを検索したとき、それらのページ内を
さらに検索することにより、客観キーワードの候補をバ
ックグランドで追加していってもよい。そうした例とし
て、電子レンジによる加熱を示す「レンジ」などの調理
機器、「4人分」などの完成分量、「大さじ」や「少
々」などの材料の量などのことばを適宜アンドまたはオ
アで条件の候補とすることができる。
As a desirable additional function of the search result obtaining unit 26, there is a construction of a reference table 28. For this purpose, a function of artificial intelligence such as a neural network or the like is incorporated in the search result acquisition unit 26, and each time a search is executed, the validity of an invalid keyword or an objective keyword at that time is determined, and the content of the reference table 28 is determined. It may be optimized. For example, when a page related to a recipe is searched for by "beef" and "salt", a candidate for an objective keyword may be added in the background by further searching the page. Examples of such conditions include cooking appliances such as "microwave ovens" that indicate heating by a microwave oven, completed quantities such as "four servings", and quantities such as "tablespoons" and "slightly" in terms of materials such as "and" or "or" as appropriate. Can be candidates.

【0032】すでに検索されたページをベースとして参
照テーブル28の更新を図る以外に、検索式設定部20
や検索部22などに自動検索機能と人工知能的な機能を
持たせて、ユーザの作業の合間などに無効キーワードや
客観キーワードの充実化を図ってもよい。例えば、キー
ワード抽出部14で過去の初期キーワードが判明するた
め、それらの初期キーワードを所定の類義語辞典やシソ
ーラス辞典に照合し、将来ユーザが質問する可能性のあ
るキーワードについて予め検索をかけて参照テーブル2
8を最適化してもよい。
In addition to updating the reference table 28 based on the pages already searched, the search formula setting unit 20
The automatic search function and the artificial intelligence function may be provided to the search unit 22 or the search unit 22 to enhance the invalid keyword or the objective keyword between user operations. For example, since the past initial keywords are found by the keyword extracting unit 14, the initial keywords are checked against a predetermined synonym dictionary or a thesaurus, and a keyword that the user may ask in the future is searched in advance and the reference table is searched. 2
8 may be optimized.

【0033】さらに別の充実化として、ユーザの満足度
に基づく参照テーブル28の最適化がある。例えば、検
索結果取得部26が検索結果を表示装置30へタイトル
で一覧表示する際、各タイトルの横にマーク欄を設け、
「役に立った情報にマークしてください」など表示して
もよい。ユーザが役に立ったと答えたページを検索した
ときの客観キーワードの優先度を上げたり、そのページ
の内部をさらに解析して客観キーワードを追加するなど
の措置が考えられる。
As yet another enhancement, there is optimization of the reference table 28 based on user satisfaction. For example, when the search result acquisition unit 26 displays a list of search results by title on the display device 30, a mark column is provided next to each title,
"Mark useful information" may be displayed. Measures such as raising the priority of the objective keyword when the user finds a page that proved useful or adding an objective keyword by further analyzing the inside of the page can be considered.

【0034】以上、本発明をいくつかの実施の形態をも
とに説明した。これらの実施の形態は例示であり、それ
らの各構成要素や各処理プロセスの組合せにいろいろな
変形例が可能なこと、またそうした変形例も本発明の範
囲にあることは当業者に理解されるところである。
The present invention has been described based on several embodiments. These embodiments are exemplifications, and it is understood by those skilled in the art that various modifications can be made to the combination of each component and each processing process, and such modifications are also within the scope of the present invention. By the way.

【0035】そうした変形例として、本実施の形態では
情報検索装置10をユーザ側に存在するクライアント装
置として描いたが、これはサーバ側の装置であっても一
向に差し支えない。例えば、家庭内の機器を制御するホ
ームサーバ、OA/FA機器を制御するサーバをはじ
め、多数のクライアントに検索サービスを提供するWe
bサーバ側に設けることができる。例えばWebサーバ
が情報検索装置10を兼ねる場合、図1の入力部12は
インターネットを介してユーザから送信された検索要求
文を受け付け、以降、当該サーバ内で一連の処理をなせ
ばよい。
As a modified example, in the present embodiment, the information retrieval device 10 is illustrated as a client device existing on the user side, but this may be a server-side device. For example, a Web server that provides a search service to a large number of clients, including a home server that controls devices in a home, a server that controls OA / FA devices, and the like.
b It can be provided on the server side. For example, when the Web server also serves as the information search device 10, the input unit 12 in FIG. 1 may receive a search request sent from a user via the Internet, and thereafter perform a series of processes in the server.

【0036】さらに別の構成として、情報検索装置10
をクライアントおよびサーバの協働によって実現しても
よい。一例として、図1の入力部12とキーワード抽出
部14をクライアント側に設け、それら以外の機能ブロ
ックをサーバ側に置いてもよい。当然ながら、図1の構
成をこれ以外の部分で分割してクライアント側とサーバ
側に分配することができる。どのような分配がよいかに
ついては、クライアント側のユーザの利便性、サーバ側
の負荷、両者の通信量などの要素を考慮して定めること
ができる。
As still another configuration, the information retrieval device 10
May be realized by cooperation of the client and the server. As an example, the input unit 12 and the keyword extraction unit 14 of FIG. 1 may be provided on the client side, and other functional blocks may be provided on the server side. Naturally, the configuration in FIG. 1 can be divided into other parts and distributed to the client side and the server side. What kind of distribution is good can be determined in consideration of factors such as the convenience of the user on the client side, the load on the server side, and the traffic of both.

【0037】[0037]

【発明の効果】本発明の情報検索技術によれば、ユーザ
が望む情報をより容易に検索することができる。
According to the information search technique of the present invention, information desired by a user can be more easily searched.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 実施の形態に係る情報検索装置の構成図であ
る。
FIG. 1 is a configuration diagram of an information search device according to an embodiment.

【図2】 参照テーブルの内部データを示す図である。FIG. 2 is a diagram showing internal data of a reference table.

【符号の説明】[Explanation of symbols]

10 情報検索装置、 12 入力部、 14 キーワ
ード抽出部、 16条件緩和部、 18 条件付与部、
20 検索式設定部、 22 検索部、24 通信
部、 26 検索結果取得部、 28 参照テーブル。
10 information retrieval device, 12 input unit, 14 keyword extraction unit, 16 condition relaxation unit, 18 condition addition unit,
20 search formula setting unit, 22 search unit, 24 communication unit, 26 search result acquisition unit, 28 reference table.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 岡本 昌之 兵庫県神戸市須磨区中落合4丁目1番 456−402号 (72)発明者 北村 泰彦 大阪府箕面市桜井3丁目1番26号 Fターム(参考) 5B075 NK02 NK21 NK31 NR05 PP02 PP03 PP22 PQ02 PQ46  ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Masayuki Okamoto 4-456-402 Nakaochiai, Suma-ku, Kobe-shi, Hyogo (72) Inventor Yasuhiko Kitamura 3-1-26-1 Sakurai, Minoo-shi, Osaka F-term (Reference) 5B075 NK02 NK21 NK31 NR05 PP02 PP03 PP22 PQ02 PQ46

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 情報を検索する際にユーザが設定した表
現を受け付ける入力部と、 前記表現に含まれるキーワードを抽出するキーワード抽
出部と、 前記抽出されたキーワードを前記情報の表現の実態に即
して客観化し、新たなキーワードを付与する条件付加部
と、 前記抽出されたキーワードおよび前記新たなキーワード
をもとに検索のための条件式を設定する検索式設定部
と、 前記設定された条件式を用いて前記情報を検索する検索
部と、 を含むことを特徴とする情報検索装置。
An input unit configured to receive an expression set by a user when searching for information; a keyword extraction unit configured to extract a keyword included in the expression; A condition adding unit that makes a new keyword an objective and assigns a new keyword; a search expression setting unit that sets a conditional expression for a search based on the extracted keyword and the new keyword; and the set condition An information search device, comprising: a search unit that searches for the information using an expression.
【請求項2】 前記抽出されたキーワードから不必要に
厳しい検索条件を課するものを削除する条件緩和部をさ
らに含み、 前記検索式設定部は、前記抽出されたキーワードのうち
前記条件緩和部によって削除されたキーワードを除いて
前記条件式を設定することを特徴とする請求項1に記載
の情報検索装置。
2. The method according to claim 1, further comprising: a condition relaxing unit configured to delete a keyword that imposes an unnecessarily strict search condition from the extracted keywords. 2. The information retrieval apparatus according to claim 1, wherein the conditional expression is set except for a deleted keyword.
【請求項3】 前記条件付加部は、前記条件緩和部にて
削除されたキーワードを代替するよう前記新たなキーワ
ードを付与することを特徴とする請求項2に記載の情報
検索装置。
3. The information search apparatus according to claim 2, wherein the condition adding unit adds the new keyword so as to replace the keyword deleted by the condition relaxing unit.
【請求項4】 前記検索の結果得られた情報を取得する
検索情報取得部と、 前記取得された情報のフィードバックを受け、将来の検
索の際に参照すべき検索条件を格納する参照テーブル
と、 を含むことを特徴とする情報検索装置。
4. A search information acquisition unit that acquires information obtained as a result of the search, a reference table that receives feedback of the acquired information, and stores search conditions to be referred to in a future search. An information retrieval device comprising:
【請求項5】 ネットワークと通信する通信部と、 前記ネットワークを介してページ情報を検索する際、ユ
ーザが設定した検索要求文を受け付ける入力部と、 前記検索要求文を形態素に分解してキーワードを抽出す
るキーワード抽出部と、 前記抽出されたキーワードから、それを検索条件に加え
た場合、検索でヒットするページの数が大幅に減少する
ようなキーワードを削除する条件緩和部と、 前記ページ情報が含む確率が高い用語を新たなキーワー
ドとして特定する条件付加部と、 前記抽出されたキーワードのうち前記条件緩和部によっ
て削除されたキーワードを除いたもの、および前記新た
なキーワードの論理積を検索の条件式として設定する検
索式設定部と、 前記設定された条件式を用い、前記ページ情報を前記通
信部を介して検索する検索部と、 前記検索の結果得られたページ情報を前記通信部を介し
て取得する検索情報取得部と、 前記取得されたページ情報のフィードバックを受け、将
来の検索の際に参照すべき検索条件を格納する参照テー
ブルと、 を含むことを特徴とする情報検索装置。
5. A communication unit for communicating with a network, an input unit for receiving a search request sentence set by a user when searching for page information via the network, and a keyword for decomposing the search request sentence into morphemes. A keyword extraction unit to be extracted; a condition relaxation unit that deletes a keyword from the extracted keywords that, when added to a search condition, significantly reduces the number of pages hit in a search; A condition adding unit that specifies a term having a high probability of being included as a new keyword; and a condition that a logical product of the extracted keywords excluding the keyword deleted by the condition relaxing unit and the logical product of the new keywords is used as a search condition. A search formula setting unit for setting as an expression, and searching for the page information via the communication unit using the set conditional expression A search unit that obtains page information obtained as a result of the search via the communication unit; and a search that receives feedback of the obtained page information and that should be referred to in a future search. An information search device, comprising: a reference table for storing conditions.
JP2000276376A 2000-09-12 2000-09-12 Information retrieving device Pending JP2002092033A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000276376A JP2002092033A (en) 2000-09-12 2000-09-12 Information retrieving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000276376A JP2002092033A (en) 2000-09-12 2000-09-12 Information retrieving device

Publications (1)

Publication Number Publication Date
JP2002092033A true JP2002092033A (en) 2002-03-29

Family

ID=18761846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000276376A Pending JP2002092033A (en) 2000-09-12 2000-09-12 Information retrieving device

Country Status (1)

Country Link
JP (1) JP2002092033A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252380A (en) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd Question answering system, data retrieval method, and computer program
WO2011118712A1 (en) * 2010-03-26 2011-09-29 楽天株式会社 Search system, search method, search program and storage medium
US8159682B2 (en) 2007-11-12 2012-04-17 Intellectual Ventures Holding 67 Llc Lens system
JP2012515379A (en) * 2009-01-12 2012-07-05 アリババ・グループ・ホールディング・リミテッド Method and system for querying information
WO2013099328A1 (en) 2011-12-28 2013-07-04 楽天株式会社 Search device, search method, search program, and recording medium
WO2013099002A1 (en) 2011-12-28 2013-07-04 楽天株式会社 Search device, searching method, search program and recording medium
US8799306B2 (en) 2010-12-31 2014-08-05 Alibaba Group Holding Limited Recommendation of search keywords based on indication of user intention

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4645242B2 (en) * 2005-03-14 2011-03-09 富士ゼロックス株式会社 Question answering system, data retrieval method, and computer program
JP2006252380A (en) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd Question answering system, data retrieval method, and computer program
US8159682B2 (en) 2007-11-12 2012-04-17 Intellectual Ventures Holding 67 Llc Lens system
JP2012515379A (en) * 2009-01-12 2012-07-05 アリババ・グループ・ホールディング・リミテッド Method and system for querying information
US9430568B2 (en) 2009-01-12 2016-08-30 Alibaba Group Holding Limited Method and system for querying information
US8898180B2 (en) 2009-01-12 2014-11-25 Alibaba Group Holding Limited Method and system for querying information
WO2011118712A1 (en) * 2010-03-26 2011-09-29 楽天株式会社 Search system, search method, search program and storage medium
JP5174279B2 (en) * 2010-03-26 2013-04-03 楽天株式会社 SEARCH SYSTEM, SEARCH METHOD, SEARCH PROGRAM, AND RECORDING MEDIUM
US9542435B2 (en) 2010-03-26 2017-01-10 Rakuten, Inc. Search system, search method, search program and storage medium for providing a stabilized number of output search results
US9092549B2 (en) 2010-12-31 2015-07-28 Alibaba Group Holding Limited Recommendation of search keywords based on indication of user intention
US8799306B2 (en) 2010-12-31 2014-08-05 Alibaba Group Holding Limited Recommendation of search keywords based on indication of user intention
WO2013099328A1 (en) 2011-12-28 2013-07-04 楽天株式会社 Search device, search method, search program, and recording medium
KR20140102717A (en) 2011-12-28 2014-08-22 라쿠텐 인코포레이티드 Search device, searching method, search program and recording medium
WO2013099002A1 (en) 2011-12-28 2013-07-04 楽天株式会社 Search device, searching method, search program and recording medium
US10977318B2 (en) 2011-12-28 2021-04-13 Rakuten, Inc. Search apparatus, search method, search program, and recording medium

Similar Documents

Publication Publication Date Title
US8271546B2 (en) Method and system for URL autocompletion using ranked results
US8515954B2 (en) Displaying autocompletion of partial search query with predicted search results
US9081861B2 (en) Uniform resource locator canonicalization
US8316007B2 (en) Automatically finding acronyms and synonyms in a corpus
US7085761B2 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
US9092756B2 (en) Information-retrieval systems, methods and software with content relevancy enhancements
KR20060017765A (en) Concept network
CA2713932C (en) Automated boolean expression generation for computerized search and indexing
Patil et al. Search engine optimization technique importance
US20140280174A1 (en) Interactive user-controlled search direction for retrieved information in an information search system
Tang et al. Relevant feedback based accurate and intelligent retrieval on capturing user intention for personalized websites
JP4769822B2 (en) Information search service providing server, method and system using page group
JP2002092033A (en) Information retrieving device
JP2002230037A (en) Retrieval system, retrieval method and program
US20040210560A1 (en) Method and system for searching a wide area network
US7886217B1 (en) Identification of web sites that contain session identifiers
KR20000049333A (en) Engine for comparatively searching product of internet shopping mole with intelligence type
JP2011128737A (en) Dictionary generation processing method, program, and device
JP2003108584A (en) Information retrieving system and program
JP3586272B2 (en) Search engine, search system, and storage medium
CA2526796A1 (en) Method, system and computer program product for reference categorization and/or reference particulars mining
CN109710843A (en) A method of improving search matching degree in big quantity personnel resume
JP5525424B2 (en) Document search apparatus, document search method, and document search program
JP2002117043A (en) Device and method for document retrieval, and recording medium with recorded program for implementing the same method
Sabin et al. Integrating information retrieval techniques with traditional db methods in a web-based database browser