JPH10105578A - 点数を利用した類似単語検索方法 - Google Patents

点数を利用した類似単語検索方法

Info

Publication number
JPH10105578A
JPH10105578A JP9244280A JP24428097A JPH10105578A JP H10105578 A JPH10105578 A JP H10105578A JP 9244280 A JP9244280 A JP 9244280A JP 24428097 A JP24428097 A JP 24428097A JP H10105578 A JPH10105578 A JP H10105578A
Authority
JP
Japan
Prior art keywords
point
stage
input key
score
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9244280A
Other languages
English (en)
Inventor
Yokei Boku
容圭 朴
Kosho Zen
孝渉 全
Eikun Ri
永勲 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KOREA TELECOMMUN
Original Assignee
KOREA TELECOMMUN
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KOREA TELECOMMUN filed Critical KOREA TELECOMMUN
Publication of JPH10105578A publication Critical patent/JPH10105578A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 使用者が検索しようとする対象の正確な名称
を知らない場合、知っている情報のみで必要な情報にア
クセス可能にするアルゴリズムを提供する。 【解決手段】 本発明の点数を利用した類似単語検索方
法は、入力装置を利用して検索しようとする入力キーを
入力部(10)に入力する段階と、入力キーと貯蔵部
(13)に貯蔵された比較対象単語とを計算部(11)
でマッチングさせて比較対象単語の点数を計算する段階
と、前記計算段階で点数を計算された比較対象単語を計
算部(11)で点数順位別にソーティングする段階と、
ソーティングされた単語を出力部(12)で点数順位別
に表示する段階とよりなり、データベースの構築の際、
データのスペル単位、又は音節単位で点数を与え、最高
の点数を取得したデータ順に表示して正確な入力キーを
検索できるようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は類似単語検索方法に
関し、特に、データベースに点数を付与して入力キーに
対するデータベース内のデータの点数の高低により情報
を検索するための点数を利用した類似単語検索方法に関
するものである。
【0002】
【従来の技術】現在、全世界的に情報の重要性が認識さ
れるに伴い、殆ど全ての情報がデータベース化されてお
り、情報使用者はこれらデータベースにアクセスして必
要な情報を抽出している。また、これらデータベースに
貯蔵された多様な情報を効率的に抽出するために多様な
アルゴリズムが用いられている。
【0003】
【発明が解決しようとする課題】従来の情報データベー
ス検索方法はツリー構造を基本に採用している。この方
法は種々な段階を経て使用者が望む情報にアクセスし得
るようにしているため、情報のアクセスに多量の時間を
必要とし、またツリー上で使用者が望む情報の位置を正
確に知ることができないため情報のアクセスに種々の不
具合が生じる。
【0004】この不具合を補うため、“go KBS ”のよ
うなジャンプ機能を付加したツリー構造アクセス方法を
用いれば、速やかに必要な情報にアクセスすることがで
きる。しかし、この方法は、電話番号案内サービスに適
用した場合、使用者が着信地の名称を正確に知っていな
ければならない問題点を有している。即ち、電話番号案
内サービスでは、使用者が探そうとする人名を正確に知
っている場合には使用者が望む電話番号を探すことがで
きるが、次のように間違って知っている場合が非常に多
い。
【外1】
【0005】従って、本発明は、使用者が検索しようと
する対象の正確な名称を知らない場合であっても、知っ
ている情報のみで必要な情報にアクセスできるようにす
るアルゴリズムを提供することを目的とする。
【0006】
【課題を解決するための手段】前記目的を達成するた
め、本発明の点数を利用した類似単語検索方法は、入力
装置を利用して検索しようとする入力キーを入力する段
階と、入力キーと貯蔵部に貯蔵された比較対象単語とを
マッチングさせて比較対象単語の点数を計算する段階
と、前記計算段階で点数を計算された比較対象単語を点
数順位別にソーティングする段階と、ソーティングされ
た単語を点数順位別に表示する段階とよりなることを特
徴とするものである。
【0007】本発明方法によれば、データベースの構築
の際、データのスペル単位、又は音節単位に点数を与え
て一番高い点数を取得した順にデータを表示することに
より、正確な入力キーを検索できるようにすることがで
きる。
【0008】本発明は、情報検索で入力キーを用いる場
合に生じ得る誤った入力と、同一の物体や対象の略字を
多様に用いることにより発生する入力キーの問題点とを
解決するため提案された方法である。例えば、
【外2】
【0009】上述した目的及びその他の目的と特徴、長
所は添付の図面と関連して、次の詳細な説明を介して一
層明らかになるはずである。
【0010】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づき詳細に説明する。図1は、本発明に基づく類似単
語検索方法を実施するための装置のブロック図である。
図1に基づく装置は以下のように動作する。即ち、キー
ボード等の入力装置によりデータが入力部(10)に入
力された後、計算部(11)では、入力データの比較対
象単語の全ての可能な方法に対しマッチングを行って比
較対象単語の点数を計算した後、点数の高い順にソーテ
ィングして出力部(12)で表示する。計算部(11)
で用いる比較対象単語は貯蔵部(13)から持ってくる
ことになるが、貯蔵部(13)では、データベース内の
データが重要度に応じて既に点数が与えられた状態で貯
蔵されている。
【外3】
【0011】図2には、本発明に係る一実施形態が現わ
されている。図2は、構築されているデータベースが3
つの状態を有する場合の、点数を算出するための検索ア
ルゴリズム状態順序を表す図である。本実施形態では、
データベース構築の際には、各状態(S1,S2,S3)別に
点数を与える。この際、各状態の点数は状態の重要度に
応じてそれぞれ別途に与えることが可能である。このよ
うな状況で、この入力キーに対する点数は図2のように
左側から右側に入力キーとデータベースの状態とを比較
して、入力キーと異なる場合にはその状態をスキップ
し、同ーである場合には点数を合算して、最終的に出さ
れた種々な点数中の一番高い点数を有するものから順に
整列させる。
【外4】
【0012】図5は、本発明に係るさらに他の実施形態
として、英文“KOREA ”という単語を検索しようとする
場合の検索アルゴリズムの状態順序を示す図である。英
文の場合には英文アルファベット単位に点数を与えてデ
ータベースを構築する。検索者が入力キーを“COREA ”
と誤って入力した場合にも“KOREA ”というデータが4
0点を得て正確な入力キーとして表示される確率が高
い。
【0013】図6は、本発明に係るさらに他の実施形態
として、英文“International Business Machine ”を
検索しようとする場合の検索アルゴリズムの状態順序を
示す図である。一般に、前記英文は“IBM ”でさらに広
く知られており、その正確な名称を知っている者はあま
り多くないと推定される。この場合にも本発明の点数を
利用した類似単語検索方法によれば、入力キーで“IBM
”を選択した場合であっても、図6に示すように“Int
ernational Business Machine”をデータベースに構築
する際、“I”,“B”,“M”のような重要なアルフ
ァベットにはそれぞれ10点ずつを与え、残りにはそれ
より非常に小さい1点ずつを与えることにより、検索し
ようとする対象の正確な名称を知らなくても、その略称
のみを利用して正確な入力キーを検索することができ
る。
【0014】なお、本発明による点数を利用した類似単
語検索方法は、入力キーとデータベースマッチングに一
定の時間が要求されるが、技術の急激な発展によりコン
ピュータの性能もまた急激に向上しているため、このよ
うなマッチングに伴う速度の問題は解決することが可能
である。
【0015】本発明の好ましい実施形態は例示の目的を
開示したものであり、当業者であれば本発明の思想と範
囲内で多様な修正、変更、付加等が可能であり、このよ
うな修正変更等は上述した特許請求の範囲に属するもの
と見なすべきである。
【0016】
【発明の効果】前述したように本発明は、使用者自身が
知っている情報や用語のみを利用して必要な情報にアク
セスできるよう支援するため、全てのデータベース情報
検索時に、入力キーを用いる場合(情報提供データベー
ス、電話番号検索サービス等)や、コンピュータのワー
ドプロセッサで単語(文字群又は単語群)の誤謬を例え
ば綴字法により訂正する場合等、情報通信産業分野での
活用が可能である。
【図面の簡単な説明】
【図1】図1は、本発明に基づく類似単語検索方法を実
施するための装置のブロック図である。
【図2】図2は、本発明に基づく3個の文字の検索アル
ゴリズム状態順序を表わす図である。
【図3】図3は、本発明に基づくハングル8個の文字
(韓国電気通信公社)の検索アルゴリズム状態順序を表
わす図である。
【図4】図4は、図3の状態順序図に基づく
【外5】
【図5】図5は、本発明に基づく英文5個の文字(KORE
A )の検索アルゴリズムの状態順序を示す図である。
【図6】図6は、本発明に基づく英文“International
Business Machine”の検索アルゴリズムの状態順序を示
す図である。
【符号の説明】
10 入力部 11 計算部 12 出力部 13 貯蔵部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力装置を利用して検索しようとする入
    力キーを入力する段階と、 入力キーと貯蔵部に貯蔵された比較対象単語とをマッチ
    ングさせて比較対象単語の点数を計算する段階と、 前記計算段階で点数を計算された比較対象単語を点数順
    位別にソーティングする段階と、 ソーティングされた単語を点数順位別に表示する段階と
    よりなることを特徴とする点数を利用した類似単語検索
    方法。
JP9244280A 1996-09-09 1997-09-09 点数を利用した類似単語検索方法 Pending JPH10105578A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR96-38862 1996-09-09
KR1019960038862A KR19980020385A (ko) 1996-09-09 1996-09-09 점수를 이용한 유사 단어 검색 방법

Publications (1)

Publication Number Publication Date
JPH10105578A true JPH10105578A (ja) 1998-04-24

Family

ID=19473095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9244280A Pending JPH10105578A (ja) 1996-09-09 1997-09-09 点数を利用した類似単語検索方法

Country Status (2)

Country Link
JP (1) JPH10105578A (ja)
KR (1) KR19980020385A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007097531A1 (en) * 2006-02-21 2007-08-30 Dong Arm Kim Method and apparatus for providing search result using language chain
JP2010211256A (ja) * 2009-03-06 2010-09-24 Sky Co Ltd 正式名称判定システム及び正式名称判定プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100408965B1 (ko) * 2000-06-26 2003-12-06 주식회사쓰리소프트 검색조건을 추천하는 검색결과 제공방법 및 검색서버

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01193928A (ja) * 1988-01-28 1989-08-03 Chugoku Nippon Denki Software Kk 推論機構付き情報検索システム
JPH02232768A (ja) * 1989-03-07 1990-09-14 Yamaha Corp データ検索システム
JPH06325091A (ja) * 1993-05-13 1994-11-25 Nippon Telegr & Teleph Corp <Ntt> 類似度評価型データベース検索装置
JPH08166966A (ja) * 1994-12-15 1996-06-25 Sony Corp 辞書検索装置、データベース装置、文字認識装置、音声認識装置、および文章修正装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01193928A (ja) * 1988-01-28 1989-08-03 Chugoku Nippon Denki Software Kk 推論機構付き情報検索システム
JPH02232768A (ja) * 1989-03-07 1990-09-14 Yamaha Corp データ検索システム
JPH06325091A (ja) * 1993-05-13 1994-11-25 Nippon Telegr & Teleph Corp <Ntt> 類似度評価型データベース検索装置
JPH08166966A (ja) * 1994-12-15 1996-06-25 Sony Corp 辞書検索装置、データベース装置、文字認識装置、音声認識装置、および文章修正装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100819846B1 (ko) 2005-04-08 2008-04-07 김동암 인터넷 검색결과 정보를 언어고리로 구성하여 제공하는방법
US8131707B2 (en) 2005-04-08 2012-03-06 Dong Arm Kim Method and apparatus for providing search result using language chain
WO2007097531A1 (en) * 2006-02-21 2007-08-30 Dong Arm Kim Method and apparatus for providing search result using language chain
JP2010211256A (ja) * 2009-03-06 2010-09-24 Sky Co Ltd 正式名称判定システム及び正式名称判定プログラム

Also Published As

Publication number Publication date
KR19980020385A (ko) 1998-06-25

Similar Documents

Publication Publication Date Title
US6256630B1 (en) Word-containing database accessing system for responding to ambiguous queries, including a dictionary of database words, a dictionary searcher and a database searcher
US10402493B2 (en) System and method for inputting text into electronic devices
JP3041268B2 (ja) 中国語誤り検査(cec)システム
US7536297B2 (en) System and method for hybrid text mining for finding abbreviations and their definitions
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
CN102708095B (zh) 选择用于文本分割的语言的方法
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
CN101815996A (zh) 检测名称实体和新词
KR20010024309A (ko) 감소된 키보드 명확화 시스템
JP2001524717A (ja) 情報管理及び検索
JPH1145241A (ja) かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Lee et al. Deep learning-based context-sensitive spelling typing error correction
EP0775963B1 (en) Indexing a database by finite-state transducer
US20040186706A1 (en) Translation system, dictionary updating server, translation method, and program and recording medium for use therein
JPH0652221A (ja) 固有名詞の自動抽出方式
JPH10105578A (ja) 点数を利用した類似単語検索方法
JPH0778183A (ja) デ−タベ−ス検索システム
KR100376931B1 (ko) 정보 검색 기술을 이용한 한영번역 데이터베이스 시스템 구축 방법
JPH09319767A (ja) 類義語辞書登録方法
JPH07182333A (ja) 日本語処理装置
KR100452024B1 (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
JP2821213B2 (ja) データベースのマッチング方法
JPH05113964A (ja) 電子辞書
JP2006178865A (ja) 固有表現抽出装置、方法、プログラム及びそれを記録した記録媒体
JP3161660B2 (ja) キーワード検索方法