JPH03116376A - キーワード・マッチング装置 - Google Patents

キーワード・マッチング装置

Info

Publication number
JPH03116376A
JPH03116376A JP1254576A JP25457689A JPH03116376A JP H03116376 A JPH03116376 A JP H03116376A JP 1254576 A JP1254576 A JP 1254576A JP 25457689 A JP25457689 A JP 25457689A JP H03116376 A JPH03116376 A JP H03116376A
Authority
JP
Japan
Prior art keywords
matching
words
word
information
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1254576A
Other languages
English (en)
Inventor
Masako Bosu
雅子 望主
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1254576A priority Critical patent/JPH03116376A/ja
Publication of JPH03116376A publication Critical patent/JPH03116376A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、文書や画像などの情報を自由キーワードと対
応して蓄積しておき、自由キーワードを指定することに
よりそれらの情報を取出すような情報検索装置(例えば
、データベースシステムやファイリング装置など)にお
けるキーワード・マッチング装置に関する。
従来の技術 大量の情報から希望する情報を検索する場合、予め個々
の情報に対してキーワードを付与しておき、検索時にキ
ーワードを指定してそのキーワードと一致する語をキー
ワードとする情報を取出してくる方法が一般的である。
ここに、キーワード付与方式には、予めキーワードを指
定しておく統制キーワード方式と、キーワードを前もっ
て指定せずに登録したい情報に自由に付与する方式とが
ある。
後者の自由キーワード方式の場合、情報を引出す時に指
定するキーワードと情報に既に付いているキーワード(
或いは、情報を蓄積する際に登録するキーワード)との
マツチングが問題となる。
これは、キーワードが複合語である時に特に問題となる
例えば、「映画情報」というキーワードが文書に付いて
いた場合、検索時にほぼ同義語なる「映画Jと指定した
時、キーワード文字列の単純なマツチング方式(完全一
致方式)では一致しないので検索できない。同様に、「
事故防止対策」と付いていた場合、検索時に「事故防止
」と指定しても検索できない。
このようなことから、出現した複合語を単語にに分割し
てマツチングをとったり、単語を組合せて複合語を生成
し、検索漏れをなくす方法が提案されている(文献「日
本語文章からのキーワード自動抽出」 ;情報処理学会
第35口金国大会、1987年、又は、文献「情報の科
学と技術」 ;第39巻4号、p125〜131,19
89中の「自動索引」参照)。
発明が解決しようとする課題 ところが、単語分割方式にしても、単純な単語のマツチ
ングによるため、例えば、文書に「音楽情報」というキ
ーワードが付いている場合に、検索時に「情報処理」と
指定したとすると構成単語である「情報」が一致するた
め、マツチングすると判定され、内容的に全く関係ない
文書まで検索されてしまう。また、複合語生成方式でも
、例えば「最新音楽情報」と「最新映画情報」とから「
最新情報」という同じ複合語が生成されることから、両
者がマツチングすると判定され、関係の薄い文書まで検
索されてしまう。
結局、マツチング精度が低く、誤り検索(ノイズ)が多
発しやすいものである。
課題を解決するための手段 キーワードを単語分割して各単語の複合語内での位置と
機能とに基づき評価値を付与する複合語処理手段と、2
つのキーワードに付与された前記評価値に基づき一致度
を算出する一致度算出手段と、2つのキーワードの一致
度が予め設定された閾値を越えたときに一致すると判定
するマツチング判定手段とにより構成した。
作用 複合語によるキーワードにおいて、その構成要素をなす
各単語は全て同一の重要度を持つものではなく、接辞的
な意味、修飾的な意味などしか持たないような場合もあ
る。即ち、同一単語であっても複合語内での位置や機能
によってはその重要度が異なる。ここに、複合語処理手
段ではキーワードを単語分割するが、複合語内での位置
と機能とに基づく評価値が付与され、この評価値に基づ
きマツチング判定用の一致度が算出されるので、単純な
単語比較による欠点が解消され、同義語等についての検
索漏れがないとともに、ノイズとなるような無駄な検索
が減ることになる。
実施例 本発明の一実施例を図面に基づいて説明する。
本実施例は、第1図に示すように、複合語処理手段1と
一致度算出手段2とマツチング判定手段3とよりなる。
複合語処理手段1は名詞辞書4を用いて比較する2つの
キーワード(即ち、指定されたキーワードと文書に付い
ているキーワード)を各々単語に分割し、評価値を付与
するものである。ここに、名詞辞書4は例えば第2図に
示すように、「表記」欄と「評価値」欄とよりなる。評
価値は、その単語の複合語内での構成位置と機能とによ
り定められたものである。本実施例では、複合語内で最
後位置になった時(「後」欄)と、それ以外の位置とな
った時(「前」欄)とで評価値を変えている。例えば、
「情報」という単語は複合語の末になった場合、複合語
内でも接辞的な意味(機能)しか持たないのでキーワー
ドとして一致したときも複合語全体の意味からすれば、
致度が低いとしたほうがよい。そこで、名詞辞書4にあ
って、単語「情報」の評価値の後欄の項は「0」と設定
されている。一致度算出手段2は比較すべき2つのキー
ワードにつき、複合語処理手段1により各単語に付与さ
れた評価値から一致度を算出するものである。マツチン
グ判定手段3は一致度算出手段2による一致度を、予め
設定された閾値と比較し、この閾値を越えた場合に2つ
のキーワードが一致すると判定するものである。
このような構成において、まず、比較する一方のキーワ
ード(キーワードlとする)について名詞辞書4を用い
て単語分割するとともに、各単語について複合語の末位
置であれば、「評価値」欄中の「後J欄の値を、末位置
でなければ「評価値」欄中の「前J欄の値を付与する。
他方のキーワード(キーワード2とする)についても同
様に名詞辞書4を用いて単語分割し、各単語に評価値を
付与する。ついで、キーワード1とキーワード2の各単
語の評価値を基に一致度を算出する。この−致度が閾値
より大であれば一致すると判定し、そうでなければ一致
しないと判定し、処理を終了する。
ここに、一致度の算出は、第4図に示すように、キーワ
ード1とキーワード2の各単語の評価値を基に行われる
。まず、キーワード1とキーワード2の構成単語で同表
記語があるかどうかを調べる。
あれば、その評価値を演算する。ここでは、一致した単
語の評価値がともに「1」である場合に「l」とし、そ
うでない場合には「OJとする。
具体例により説明する。例えば、「音楽情報」と「映画
情報」との比較の場合を考える。「音楽情報」を単語分
割し評価値を付与すると「音楽」=「1」、[情報J 
= rQJとなる。同様に、「映画情報」を単語分割し
評価値を付与すると「映画J = rl」、「情報J 
= rQJとなる。両キーワードで一致単語は「情報」
であるが、評価値はともに「0」であるので、一致度は
rOJとなる。よって、閾値を「1」とすれば、両キー
ワードは一致しないと判定できる。「情報」は複合語の
末に位置するときは複合語内での重要度は低くなるので
一致しないと判断したほうが望ましいことに合致する。
また、「映画」と「映画情報」との比較の場合を考える
。「映画」を単語分割し評価値を付与すると「映画J 
= rlJとなり、「映画情報」を単語分割し評価値を
付与すると「映画」=[1」、[情報J = rOJと
なる。両キーワードで一致単語は「映画」であり、評価
値はともに「l」であるので、一致度はrlJとなる。
閾値を「1」とすれば両キーワードは一致すると判定で
きる。本例の場合、従来方式によるとマツチングしない
と判定されるものであるが、はぼ同義語であり、本実施
例のマツチングするという判定が適切といえる。これは
、「最新映画情報」と「映画」との比較のように、先頭
の語から違っている場合であっても、一致すると判定で
きる。
さらに、「最新音楽情報」と「最新映画情報」との比較
の場合を考える。「最新音楽情報」を単語分割し評価値
を付与すると「最新J = rQJ、「音楽J = r
lJ、「情報J = rQJとなる。
「最新映画情報」を単語分割し評価値を付与すると[最
新J = rQJ、「映画」=「1」、「情報J=「0
」となる。両キーワードで一致する単語は「最新」と「
情報」であるが、何れの単語の評価値もrQJとrQJ
であるので、一致度は「0」となる。閾値を「1」とす
れば、両キーワードは一致しないと判定できる。即ち、
一致する単語中「最新」は複合語内でも修飾的な機能を
持ち意味の中枢をなすものでなく、また、「情報」も接
辞的な語に過ぎず、複合語の中心の意味を担う「音楽」
や「映画」という単語が一致しなければ一致するとは判
定しないので、文書検索等において無駄な文書を検索す
ることがない。
発明の効果 本発明は、上述したように複合語処理手段による処理に
おいて、単語分割した後、各単語に複合語内での位置と
機能とに基づき評価値を付与し、この評価値を基に一致
度の算出、マツチング判定を行うようにしたので、単純
な単語一致方式のマツチング判定の場合に生ずる検索漏
れや誤り検索を極力なくすことができ、より正確な検索
が可能となる。
【図面の簡単な説明】
図面は本発明の一実施例を示すもので、第1図はブロッ
ク図、第2図は名詞辞書の構成図、第3図は全体の処理
を示すフローチャート、第4図は一致度算出処理を示す
フローチャートである。 1・・・複合語処理手段、2・・・−政変算出手段、3
・・・マツチング判定手段 出 願 人   株式会社   リ コー篤 」 図 JZ図 −沁3図

Claims (1)

    【特許請求の範囲】
  1. キーワードを単語分割して各単語の複合語内での位置と
    機能とに基づき評価値を付与する複合語処理手段と、2
    つのキーワードに付与された前記評価値に基づき一致度
    を算出する一致度算出手段と、2つのキーワードの一致
    度が予め設定された閾値を越えたときに一致すると判定
    するマッチング判定手段とよりなることを特徴とするキ
    ーワード・マッチング装置。
JP1254576A 1989-09-29 1989-09-29 キーワード・マッチング装置 Pending JPH03116376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1254576A JPH03116376A (ja) 1989-09-29 1989-09-29 キーワード・マッチング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1254576A JPH03116376A (ja) 1989-09-29 1989-09-29 キーワード・マッチング装置

Publications (1)

Publication Number Publication Date
JPH03116376A true JPH03116376A (ja) 1991-05-17

Family

ID=17266962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1254576A Pending JPH03116376A (ja) 1989-09-29 1989-09-29 キーワード・マッチング装置

Country Status (1)

Country Link
JP (1) JPH03116376A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309371A (ja) * 1993-04-27 1994-11-04 Fujitsu Sooshiaru Sci Raboratori:Kk コードデータ検索装置
US5539781A (en) * 1993-12-14 1996-07-23 Nec Corporation Combining diversity apparatus with squelch function
JPH1097545A (ja) * 1996-09-20 1998-04-14 Sharp Corp 情報処理装置
JP2006111400A (ja) * 2004-10-14 2006-04-27 Jfe Steel Kk 資材の運搬方法及び資材運搬用吊具

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309371A (ja) * 1993-04-27 1994-11-04 Fujitsu Sooshiaru Sci Raboratori:Kk コードデータ検索装置
US5539781A (en) * 1993-12-14 1996-07-23 Nec Corporation Combining diversity apparatus with squelch function
JPH1097545A (ja) * 1996-09-20 1998-04-14 Sharp Corp 情報処理装置
JP2006111400A (ja) * 2004-10-14 2006-04-27 Jfe Steel Kk 資材の運搬方法及び資材運搬用吊具

Similar Documents

Publication Publication Date Title
US9323738B2 (en) Classification of ambiguous geographic references
US5701469A (en) Method and system for generating accurate search results using a content-index
US6345253B1 (en) Method and apparatus for retrieving audio information using primary and supplemental indexes
US20070112838A1 (en) Method and system for classifying media content
US20070136243A1 (en) System and method for data indexing and retrieval
US20060106767A1 (en) System and method for identifying query-relevant keywords in documents with latent semantic analysis
JPH06131398A (ja) 複数の文書検索方法
US9251270B2 (en) Grouping search results into a profile page
WO2017020454A1 (zh) 检索方法和装置
JP2792293B2 (ja) 情報検索装置
US20070112839A1 (en) Method and system for expansion of structured keyword vocabulary
JPH09282331A (ja) 文書類似判定装置および文書類似判定方法
JPH03116376A (ja) キーワード・マッチング装置
JP2538736B2 (ja) 関連キ―ワ―ド自動生成装置
JPH03116377A (ja) 情報検索装置
JPH03286372A (ja) キーワード抽出装置
JP3007375B2 (ja) 文書情報検索装置
JPH02129756A (ja) 単語照合装置
CN110083679B (zh) 搜索请求的处理方法、装置、电子设备和存储介质
JP2935877B2 (ja) 文書検索装置
JP5633343B2 (ja) 検索支援装置、プログラム
JPH03127176A (ja) キーワード抽出装置
JPH09212523A (ja) 全文検索方法
JPH0981578A (ja) 観点に基づく類似検索方法
JPH10320403A (ja) 検索式作成方法、検索式作成装置、及び記録媒体